Section 07 Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues

V. Traitement automatique des langues et de la parole

Le traitement automatique des langues et de la parole (TALP) vise à développer des outils, méthodes et applications mettant en jeu le langage sous ses différentes formes (modalités orales, écrites, gestuelles), en prenant en compte la variété des langues, des locuteurs, des usages. Le TALP a par ailleurs également conduit à de nouvelles interactions, notamment vers le traitement de la musique.

A. Les grandes avancées actuelles et les thèmes émergents

Le TALP s'est structuré autour de problématiques et d'applications variées : traduction automatique, transcription automatique de parole, analyse de contenu, recherche d'information, traitements audionumériques, traitement automatique des langues des signes en sont des exemples. Parmi les avancées actuelles, notons le rapprochement des traitements de l'écrit et de l'oral. Ces travaux s'appuient sur le développement de ressources (lexiques, corpus, grammaires, etc.) et d'outils (transcription, segmentation, alignement, etc.) exploitant notamment les indices extra-linguistiques. Plusieurs nouvelles applications sont ainsi ouvertes, comme la traduction de parole, la recherche d'information multimédia, etc. De même, la question du multilinguisme constitue un enjeu décisif, avec des applications variées vers le résumé automatique ou la recherche d'information à partir de documents multilingues. Cette thématique est en lien étroit avec la réutilisation des ressources, ainsi que des perspectives pour le traitement des langues peu dotées (ne disposant pratiquement pas de ressources ou d'outils pour leur traitement automatique). De même, la prise en compte du langage en contexte naturel rend nécessaire le traitement de la multimodalité, intégrant les aspects verbaux et non verbaux de l'interaction (gestes, attitudes, etc.). Les applications sont nombreuses : traitement des données multimédias, agents conversationnels, etc. Proche des aspects non verbaux, le traitement de la musique repose sur des besoins spécifiques en termes de précision et de qualité dans les domaines du signal, du langage et de l'information (audiovisuel 3D, analyse des contenus, classification, etc.).

La dimension humaine occupe une position centrale dans ce domaine. Un axe de travail particulier concerne la prise en compte de la personnalité du locuteur dans les interactions situées (compétences et performances linguistiques, sociales, interactionnelles et émotionnelles). De même, les enjeux de la robotique cognitive, développementale, sociale, conduisent au développement de modèles de mécanismes interactifs (traitement sensoriel et perceptif, modèles biomécaniques, modèles de catégorisation, modèles de reconnaissance conjointe parole-geste, etc.). Les approches bio-inspirées sont largement utilisées dans ce domaine. Un nombre croissant de travaux aborde par ailleurs la modélisation des aspects physiologiques de la production et la perception du langage ainsi que ses bases cérébrales, y compris en contexte pathologique. Du point de vue méthodologique, la modélisation des réseaux neuronaux, des mécanismes d'oscillation collective, de codage multiplexe, de codage prédictif, de liage neuronal, sont ainsi des enjeux importants. De son côté, le domaine du « Big Data » pose de nouvelles questions, allant de l'infrastructure (entrepôts de données) à l'accès et la visualisation. Il s'agit de problèmes méthodologiques (parallélisation, traitement à grande échelle, etc.) qui se posent de façon spécifique en articulation avec l'émergence en apprentissage automatique de nouveaux paradigmes (réseaux neuro-mimétiques profonds, découverte de connaissances).

B. Interactions avec d'autres disciplines

Le TALP est un domaine fortement interdisciplinaire, alliant informatique et linguistique, psycholinguistique, médecine, physique, neurosciences ou arts. Le TALP connaît une évolution vers la prise en compte de données naturelles, éventuellement non standard (parole, tweets, SMS) et dans un contexte situé. Il convient pour cela de prendre en compte la variabilité des données, leur contexte social, physiologique, communicationnel. Pour cela, les données sont non seulement plus volumineuses, mais également plus riches, comportant des informations de haut niveau, reposant sur une expertise humaine provenant de l'ensemble des disciplines mentionnées.

C. Place de la France dans le contexte mondial

La France est historiquement très bien positionnée dans la communauté internationale du TALP. En traitement de la parole, nous occupons une position centrale grâce à notre participation à des organismes comme l'ISCA, ainsi que notre rôle actif dans la structuration de la recherche au niveau européen (laboratoires internationaux, création d'agences de diffusion de ressources, organisation de campagnes d'évaluation, etc.). Le traitement automatique de l'écrit est également fortement ancré au niveau international avec des responsabilités dans les associations internationales généralistes (ICCL, ACL, EACL) ainsi que dans des domaines de spécialité comme l'information biomédicale, la recherche d'information, la traduction automatique, etc.

D. Points forts/points faibles de la recherche en France

Au-delà des contributions méthodologiques autour des techniques d'apprentissage automatique ainsi que leurs applications (statistique textuelle, recherche d'information, traduction automatique, etc.), plusieurs points forts de la communauté TALP proviennent de l'intégration de différents niveaux d'information. La France est ainsi pionnière sur la question de l'intégration écrit/oral, avec un effort de développement de ressources communes. Nous sommes très bien positionnés vis-à-vis des enjeux actuels : traitement de données naturelles, boucle compréhension/production, multimodalité, variabilité, données physiologiques, etc. Par ailleurs, nos équipes sont très actives sur la question de l'interface entre le TALP et les autres disciplines : linguistique formelle et descriptive, neurosciences en particulier. Plusieurs projets d'envergure nationale et internationale abordent ces questions.

Une direction à renforcer porte sur la sémantique pour laquelle il n'existe toujours pas de modèle véritablement utilisable, permettant de passer d'une approche de niveau lexical à l'utilisation de représentations structurées. Il devient de plus nécessaire de compléter les paradigmes d'apprentissage par des explications sur les informations produites, en rapprochant les techniques à base de règles avec les méthodes d'apprentissage. Cette évolution repose notamment sur la capacité d'appliquer l'apprentissage à des processus ou structures plus complexe, à partir de sources d'information multiples. L'évolution vers des systèmes complexes rendant plus difficile la tâche d'évaluation et l'établissement d'une référence, il devient nécessaire de mettre en œuvre de nouveaux paradigmes, reposant par exemple sur des mécanismes de crowd-sourcing. Il convient également de prendre en compte la notion d'acceptabilité des utilisateurs.

E. Retombées sociales, économiques (valorisation), culturelles

Les applications du TALP sont nombreuses : traduction automatique, recherche d'information, systèmes conversationnels, traitement de la langue des signes, transcription de parole et de la musique, synthèse de parole, de musique et de gestes, aide aux handicapés, localisation de logiciels, etc. Les industriels sont ainsi devenus des acteurs importants du TALP, et sont en relation étroite avec nos laboratoires. Leur contribution réside en particulier dans la robustesse et le passage à l'échelle. Le TALP est ainsi désormais largement utilisé dans le cadre de l'analyse des réseaux sociaux (recommandations, dynamique des communautés, fouille d'opinion), en synergie avec le développement durable, la e-citoyenneté, ou la sécurité publique (cybercriminalité) et civile (gestion de catastrophe ou crise sanitaire). De nouvelles applications apparaissent dans des domaines variés : dialogue homme-machine, gestion de l'information, aide au diagnostic, suppléances sensorielles, réalités virtuelles et augmentées, aide à l'apprentissage, nouvelles interfaces, nouveaux instruments, etc.