. Problématique and . .. De-nos-travaux, , vol.64

. .. Choix, 65 Approches en ligne/hors ligne/en logique différée, p.67

.. .. Rappels-sur-le-filtrage-de-kalman,

M. .. , MCMCDA : association de données par

. .. Mot, 71 Mouvements sur les trajectoires, p.79

. .. Vers-le-suivi, 81 4.3.1 Intégration des modèles d'apparence

. , Analyse qualitative avec ambigu¨?tésambigu¨?tés visuelles

, Dans les chapitres précédents, les tâches relativesàrelativesà l'apprentissage de signatures audiovisuelles ontétéontété traitées indépendammentindépendammentà chaque instant t et dans un contexte mono-cible

, En effet, hormis la soustraction de larrì ere-plan, tous les outils (détection visuelle, d'activité 1.1 Architecture traditionnelle des systèmes de reconnaissance de locuteurs

]. .. Mar+97, Exemple d'une courbe DET : en abscisses le taux de Fausses Acceptations et en ordonnées le taux de Faux Rejets. Figure extraite de, p.12

. , Synoptique d'un système de ré-identification traditionnel

. .. , Descripteur SDALF : (a) images brutes, (b) partition de la silhouette segmentée, (c) histogrammes HSV, (d) MSCR, et (e) RHCP [Far+10], p.17

G. ]. , 18 1.6 ´ Echantillons issus de la base de données VIPeR, Exemple d'une courbe CMC : taux de ré-identification vs. rang r, p.19

´. Echantillons-issus-de-la-base-de-données and E. .. , , p.19

. .. , ´ Echantillons issus de la base de données i-LIDS [Pro+10], p.20

. , image extraite de la caméra 1 (b), Configuration de notre plate-forme expérimentale (a)

.. .. Synoptique-de-notre-système-d'apprentissage-d'une-signature-audiovisuelle-de-personne,

, Cha??neCha??ne de traitement pour la génération d'une signature audio, p.28

. , Exemple de sortie d'un détecteur d'activité vocale sur un fichier audio de 14 secondes, contenant deux segments de parole. Le signal, ´ echantillonnéechantillonnéà 16 kHz, a ´ eté analysé par en utilisant des trames de 16 ms

, Processus de génération des MFCC, notés c(i), depuis une trame de signal x(i), p.32

. , Réponse fréquentielle d'une banque de 10 filtres suivant l'´ echelle perceptive Mel sur l'espace fréquentiel

, Cha??neCha??ne de traitement pour la génération d'une signature vidéo, p.36

. , Exemple de détection de personne sur notre corpus : extraction de la bo??tebo??te englobante contenant la cible

]. .. Far+10, 40 2.10 Paramètres extraits de SDALF : en (a) une paire d'imagettes du même individu, en (b) les axes de symétrie et d'antisymétrie extraits, en (c) les histogrammes HSV, en (d) les MSCR et en (e) les RHCP, Génération des axes de symétrie et d'antisymétrie, et exemples de partitions de plusieurs silhouettes, p.41

. , ETHZ2 (b) et ETHZ3 (c), Courbes CMC pour chaque composante séparée de SDALF sur les jeux de données ETHZ1 (a)

, Images correspondante aux signatures vidéo des 3 personnes cibles, 43 Table des figures

, En (a) l'extraction dans le plan image de la position des pieds de la cible détectée, et en (b) la projection dans le plan image de la grille du repère caméra obtenu par calibration, vol.8, p.49

. , 50 3.4 ´ Evolution du SRMR en fonction de la distance au microphone en vue 3D en (a) et zénithale en (b), SRMR sur un signal de parolé emisàemisà plusieurs distances, en synthèse (a) et en données réelles (b)

, Indice de Proximité Audio Vidéo calculé sur tout l'espace d'acquisition. Les maxima locaux correspondent aux positions voisines du microphone, p.52

, En (a) la classification apprise par le SVM pour th=0.4, en (b) l'erreur de classification en fonction de th pour les 3 locuteurs, p.52

, En jaune les positions observations classées saillantes, et en noir le contour de la zone de saillance, Classification des positionsàpositionsà chaque position pour les 3 locuteurs

. , en (a) les paramètres, en (b) leur transformée par ACC, ACC entre un vecteur de trois paramètres et l'inverse de la distance de la source sonore pour plusieurs positions

. , ´ energie + SRMR en (b), SRMR + logV en (c) eténergieeténergie + logV + SRMR en (d), Résultat du CCA sur les données de test pour 4 combinaisons de descripteurs : ´ energie + logV en (a)

, 59 3.11 Associations des observations audio et vidéo pour 3 niveaux de bruits en a), b) et c) lorsque th = 1 et taux d'observations associées en fonction du seuil th, p.60

. , Synoptique d'un traqueur visuel multi-cibles depuis un ensemble d'images successives (en hautàhautà gauche) aux trajectoires des cibles inférées dans le plan du sol

, Illustrations des mouvements de trajectoires. Les lignes et les formes géométriques colorées représentent respectivement les trajectoires et leurs observations. Les cercles noirs représentent les fausses alarmes. Figure extraite de, p.72

. , De haut-gauchè a bas-droit : scenarii de test comportant un nombre variable de K trajectoires

. , Types d'erreurs d'association : (a) fragmentation, (b) associationàassociationà une fausse alarme, (c) changement d'identité (ID Switch)

, Résultats de l'association de données en fonction du nombre de trajectoires et (a) du nombre estimé de trajectoires, (b) du critère ICAR et (c) du critère NCA, p.77

. , De haut-gauchè a bas-droit : scenarii de test comportant 10 trajectoires, générées aléatoirement, ` a plusieurs taux de fausses alarmes par temps et par volume : ? b V =

. , Résultats de l'association de données en termes de (a) nombre estimé de trajectoires, (b) critère ICAR et (c) critère NCA

, De haut-gauchè a bas-droit, scenarii de test comportant un taux variable de détection des observations, p.80

N. .. , 80 4.10 Estimation d'un modèle de distance d'une observationàobservationà la bonne cible (courbe bleue) et d'un modèle de distance d'une observationàobservationà une mauvaise cible (courbe rouge), Résultats de l'association de données en termes de (a) nombre estimé de trajectoires, (b) ICAR et (c)

, Comparaison des résultats de l'approche MCMCDA avec modèle dynamique seul (courbes bleues) et en ajoutant un modèle d'apparence visuel (courbes rouges), p.85

, Principe d'intégration des signatures audiovisuelles dans le suivi d'une trajectoire 87

. , Résultats d'associations audiovisuelles, en terme de précision et de rappel, avec/sans suivi

M. Critère, MCMCDA+signature visuelle avec/sans signature audio (configurationsàgurationsà 1 ou 2 microphones)

M. Critère, MCMCDA avec signature audio (configurationsàtionsà 1 et 2 microphones)

. , et deux propositions de partition, correcte en (b) et une incorrecte avec changement ID en (c), Scénario avec deux cibles induisant des observations ambiguës en (a)

, Liste des tableaux

. , 8 2.1 ´ Evaluations des méthodes de VAD sur le corpus, Illustration des tâches de vérification, d'identification et de structuration

, Performances de la reconnaissance du locuteuràlocuteurà trois niveaux de bruits, p.35

. .. Performances-des-détecteurs-de-personnes-de-l'´-etat, 38 2.4 Score nAUC (normalized Area Under the Curve) pour les 3 paramètres du SDALF, ainsi que le descripteur complet, sur les trois jeux de données ETHZ1

. , Outils pour l'apprentissage des signatures audio et vidéo

. , Fréquences de modulation centrales (f c ) et bandes passantes (BP ), en Hz, du banc de filtres

. , Corrélation de Pearson entre différentes combinaisons de paramètres et l'inverse de la distance

. , Erreur Quadratique Moyenne entre la référence et les 4 configurations des paramètres

. , Statistiques sur les erreurs d'estimation de la distance

, Spécificités des stratégies SOT/MOT en ligne vs. hors ligne vs. logique différée, p.66

, Notations et illustrations desélémentsdeséléments traités en suivi multi-cibles, p.72

.. .. Opérations-sur-les-trajectoires,

. , Synthèse des résultats sur les 3 jeux de données

. , Corpus utilisé pour la construction des modèles visuels

. , Synthèse des résultats sur les 3 jeux de données

. , Vraisemblance des partitions avec/sans ID Switch

. Bibliographie,

