Recherche


Dans les sous-menus vous trouverez l'ensemble de mes publications, scindé par catégorie si vous le souhaitez ; les projets auxquels je participe ; mes activités parallèles et collectives ; une liste de mots clefs, plus tout à fait à jour ; et une bibliographie préliminaire de mes travaux sur l'abduction.

Abduction floue

Je suis revenu à la recherche par un sujet théorique sur le raisonnement approximatif, une étude de l’extension d’un modèle d’abduction floue. Le raisonnement abductif est un processus explicatif par lequel les causes potentielles d’une observation sont découvertes. Dans sa version classique – non floue – la découverte de nouvelles connaissances est limitée par la nécessité d’observer exactement les conclusions des règles connues. Dans le cadre du raisonnement approximatif flou, l’abduction peut expliquer des observations ne correspondant pas exactement aux conclusions attendues. L’étude de légères modifications de ces dernières, à l’aide de modificateurs linguistiques, est donc essentielle à la découverte de combien les observations peut être modifiées et toujours expliquées, créant, par là même, de nouvelles connaissances. Ces travaux se fondent sur une expression formelle de l’abduction floue existante et en explorent les limites. Suite à la découverte et à l’explication d’incompatibilités entre ce modèle et son cadre théorique, nous avons proposé une méthode de sélection d’opérateurs d’implication floue à partir des données. Ces travaux ont donné lieu à trois publications : la première dans la conférence francophone de la communauté [ARA 06], la seconde dans une conférence internationale [ARA 07:a] et la dernière dans une revue internationale [ARA 09:a].
De nouveaux points de vue sur le raisonnement approximatif offrent de nouvelles perspectives. En effet, l’émergence et l’omniprésence de la notion de gradualité dans le raisonnement flou soulèvent de nouvelles questions sur les opérateurs d’implication. La catégorisation des opérateurs existants et la définition de nouveaux opérateurs sont essentielles à l’exploitation de ce domaine.

Cotation de l’information

Après ces premiers travaux, j’ai commencé ma thèse en collaboration avec le LIP6 et l’ONERA, EPIC sous tutelle du ministère de la défense. Le sujet de la thèse était la cotation de l’information, forme d’évaluation de la qualité d’une information dans le cadre du renseignement militaire. J’ai proposé d’aborder la cotation comme une évaluation de la confiance à porter à une information.
Si la confiance constitue un sujet de recherche très étudié, dans la plupart des cas sa mesure témoigne plus de la qualité de la production de l'information sur laquelle elle porte qu'elle ne révèle si l'on peut s'y fier. Comme on ne se satisfait pas du fait qu'une nouvelle émane d'une source sûre pour la croire, l'évaluation automatique de la confiance en une information nécessite un modèle plus riche, capable de décrire pour quelles raisons cette information est ou n'est pas crédible. C'est à cette problématique que je me suis attaché dans mes travaux.
À partir d’une étude préliminaire du formalisme de cotation utilisé jusqu’alors, j’ai été amené à proposer d'aborder séparément l’expression de la confiance et le processus gouvernant son établissement, à distinguer la cote de la cotation. J’ai proposé un principe de définition de la cote et en ai déduit les dimensions essentielles de sa construction. Je me suis également attaché à assurer la lisibilité des mesures de ces dimensions en proposant de les apprécier sur des échelles discrètes dont les degrés étaient explicités à l’aide d'étiquettes linguistiques.
Une fois cette sélection des dimensions effectuée, j’ai abordé la question de leur combinaison pour modéliser le processus d'établissement de la confiance, la cotation proprement dite. Pour ce faire, j’ai proposé une architecture à la cotation. J’ai également fourni à cette architecture une représentation sous la forme d'une chaîne de cotation, celle-ci mettant en avant l'ordre de prise en compte des dimensions et leur influence sur la hausse ou la baisse de la cote. J’ai, enfin, montré comment la souplesse du modèle permet de représenter différentes postures de crédulité de l'utilisateur, adaptabilité essentielle à la modélisation de principes subjectifs.
Par la suite, j’ai mis en pratique le modèle dans l'extraction et la cotation d'informations symboliques. Dans un premier temps j’ai transposé la cotation au problème de l'extraction de connaissances à partir de textes. J’ai détaillé successivement la cotation de l'extraction d'informations, puis celle de leur fusion, en examinant pour chacune la transposition des dimensions qui la constituent. J’ai, ensuite, implémenté un démonstrateur pour la mise en œuvre de ces propositions. Enfin, j’ai appliqué modèle et démonstrateur à un cas réel d'extraction et de cotation de réseau social.
J’ai poursuivi, en tant qu’ingénieur de recherche, mes travaux sur la cotation de l’information. Associé à un laboratoire commun créé entre la société Thales et l’UPMC, le laboratoire Clear (Centre for Learning and Retrieval), j’ai participé aux travaux sur la cotation qui figurait dans les sujets d’étude centraux de l’équipe. J’ai également collaboré au projet ANR Cahors, qui s’intéressait à d’autres modélisations de la cotation. En plus de mon mémoire de thèse [ARA 11], ces divers travaux sur la cotation ont donné lieu à des publications : deux articles dans des ateliers de conférences nationales [ARA 09:b, ARA 10], un article dans les actes d’une conférence internationale [JB 08] et deux chapitres d’un ouvrage qui sera publié en 2013 [ARA 13:a, ARA 13:b].
Des enrichissements pratiques et conceptuels du modèle de constitution de la confiance que j’ai proposé forment le deuxième sujet auquel je m’intéresse. La manifestation graphique de la cotation dans un réseau, comme son utilisation dans l’étude de graphes, est un premier volet pratique. Un autre pan est la validation des échelles discrètes utilisées et des représentations de profils offertes. L’approfondissement de certaines dimensions, comme la mise à jour dynamique de la confiance à la source, le raisonnement à partir des connaissances et la gradualité de la corrélation entre informations sont les riches évolutions naturelles de ces travaux.

Logiques multivaluée et modale

Suite aux définitions de dimensions et architecture de la cotation, j’en ai proposé une formalisation théorique ainsi que de la cote, son mode d'expression. En raison de son expressivité, j’ai choisi le formalisme de la logique multivaluée pour exprimer mes propositions. Parmi mes contributions essentielles, j’ai voulu préserver la nuance importante entre l'impossibilité de mesurer et la mesure neutre, et ai donc étendu ce formalisme en lui adjoignant un nouveau degré de vérité. Dans ce cadre de logique symbolique étendue, j’ai défini les opérateurs de combinaison permettant de représenter l'ensemble des propositions faites pour la cotation, puis ai formalisé la modélisation de la crédulité. Une partie de ces propositions a été publiée dans les actes d’une conférence européenne [ARA 07:b].
Mon intérêt pour les logiques non classiques et leur utilisation dans le cadre de la cotation m’ont amené à envisager d’autres cadres pour l’exprimer. Dans le prolongement de cet intérêt, j’ai participé à l’encadrement de deux étudiants de master recherche, sur le sujet de la logique modale pondérée. Le premier a travaillé, pendant son stage de M1, sur la pondération de la relation d’accessibilité entre mondes. Son travail a ouvert des perspectives intéressantes au-delà du simple cadre de la cotation. À sa suite, une stagiaire de M2 a commencé une étude bibliographique pour mieux délimiter ses contributions à venir.
Mes travaux sur la cotation offrent également des perspectives plus théoriques, déjà évoquées plus haut. En premier lieu, les opérateurs multivalués proposés pour modéliser la cotation sont des opérateurs paramétriques interprétables, dont l’utilité dans un cadre plus général serait importante. Par ailleurs, étendre la représentation de l’inconnu, l’impossibilité de mesure, aux autres formes de logique non classique lèvera certaines ambiguïtés du raisonnement approximatif et l’enrichira. Les travaux entamés sur d’autres formulations de la cotation, en particulier en logique modale et ses conséquences théoriques sont une voie que je souhaite explorer. Ce dernier point est peut-être le plus avancé, un deuxième stage long de recherche ayant été accepté.

Clustering

Depuis ma soutenance, j’ai eu l’occasion d’élargir mes thématiques de recherche grâce à mon activité d’ingénieur de recherche associé au laboratoire Clear. En effet, un autre axe de recherche du laboratoire traite d’apprentissage non supervisé, de clustering. Les travaux que j’ai menés en tant que responsable de cette tâche consistent à faciliter l’utilisation des méthodes du domaine. Dans ce but, nous cherchons à établir des critères décrivant les méthodes et permettant de les comparer. Trois binômes de projet ingénierie ont travaillé sur le sujet. Ma collaboration au projet E-Fraud Box traitait aussi de clustering. Dans le but d’identifier des profils de fraudeurs à la carte bancaire sur internet, nous avons proposé des méthodes favorisant la lisibilité, dans un premier temps, et passant à l’échelle par la suite. Ces travaux ont donné lieu à deux publications [MJL 12, MDF 12].
Enfin, grâce au projet E-Fraud Box, je me suis intéressé au traitement de grands volumes de données. La proposition de nouvelles méthodes permettant le passage à l’échelle ne doit pas se faire au prix de l’interprétabilité du résultat. Les optimisations matérielles, comme la parallélisation et l’utilisation de GPU, pourront être exploitées pour compenser le coût additionnel de la lisibilité.
LoFTI LIP6 dernière modification : 07/03/2013 UPMC Sorbonne Université