Section 34 Sciences du langage

I. Linguistique fondamentale (∼ 31 %)

La linguistique fondamentale s'intéresse aux structures universelles du langage, à leurs caractéristiques formelles et à la contribution qu'elles font à la signification des énoncés. À ce titre, les disciplines qui constituent cette thématique contribuent à l'investigation des caractères fondamentaux de cette capacité spécifique à l'espèce humaine et constituent le cœur des sciences du langage.

A. Phonologie (∼ 6 %)

La thématique Phonologie se retrouve dans de nombreux laboratoires : LPL (UMR7309), SFL (UMR7023), CLLE (UMR5263), CRLAO (UMR8563), LLF (UMR7110), MoDyCo (UMR7114), LPP (UMR7018), LSCP (UMR8554), BCL (UMR 7320), DDL (UMR5596), STL (UMR8163), GIPSA (UMR5216).

La thématique Phonologie est consacrée à l'identification et à l'étude des sons pertinents du langage, ainsi que des principes qui régissent leurs distributions et fonctions. Par sa dimension symbolique, elle entretient naturellement des liens avec la morphologie (plus particulièrement dans le cadre du modèle CVCV), la syntaxe et la sémantique mais, parce qu'elle consiste en l'interprétation de données phonétiques, c'est avec la Phonétique que l'on observe une forte proximité, tout particulièrement depuis l'émergence du courant de la Phonologie de Laboratoire, auquel peuvent être associés la moitié des chercheurs de la thématique. Ce cadre d'analyse appuie les analyses phonologiques sur des analyses phonétiques précises relevées via l'expérimentation, la modélisation et, de plus en plus, par l'examen de corpus (de grande taille). La démarche expérimentale en phonologie est aussi fortement visible dans les travaux employant les méthodes de la psychologie expérimentale (voir § IV.A). Les recherches à l'interface de la phonologie et de la phonétique et/ou de la psycholinguistique visent à mieux comprendre et définir le lien entre l'aspect cognitif et abstrait de la parole humaine et son aspect physique et traitent principalement de questions liées à la nature des représentations phonologiques chez l'adulte et l'enfant. À l'inverse, plusieurs chercheurs tendent à dissocier forme et substance dans leurs analyses et modélisations, qu'ils inscrivent dans des cadres formels, génératifs ou post-génératifs le plus souvent. Au niveau théorique, c'est l'approche partagée du modèle CVCV qui fédère la plupart de ces travaux, qui jouissent d'une visibilité internationale indéniable. Certains chercheurs travaillent sur des langues non indo-européennes, et tout particulièrement sur les langues afro-asiatiques (berbère) et les langues sino-tibétaines (cf. § III).

B. Morphologie (∼ 4 %)

La thématique Morphologie est représentée au LLF (UMR7110), dans l'équipe Équipe de Recherche en Syntaxe et Sémantique du CLLE (UMR 5263), au SFL (UMR 7023) et au STL (UMR 8163).

La morphologie vise à étudier les corrélations régulières qu'entretiennent les lexèmes avec leurs mots-formes (on parle alors de morphologie flexionnelle) ou les lexèmes entre eux quand les uns présentent un degré de complexité structurelle et sémantique supérieur aux autres (il s'agit alors de morphologie constructionnelle).

Selon que l'accent est mis sur la forme, le sens, ou sur les conditions d'utilisation, d'émergence ou de mise en mémoire des lexèmes et de leurs mots-formes, les recherches s'inscriront également dans le champ de la morphophonologie, de la sémantique, de la syntaxe, de la pragmatique ou de la psycholingistique. La morphologie, qui se prête par ailleurs bien à la modélisation (largement utilisée dans cette thématique), donne également lieu à des travaux relevant du traitement automatique des langues et de la linguistique computationnelle.

Toutes ces orientations se retrouvent dans l'éventail des recherches actuellement menées en France, dans des cadres théoriques variés, qui vont de la morphologie lexématique à la morphologie dite distribuée. Les méthodologies sur lesquelles ces travaux s'appuient vont de l'étude de corpus à la linguistique expérimentale.

Les recherches en morphologie, outre le français ou les langues romanes, sont aussi conduites sur des langues non indo-européennes (notamment sur des langues afro-asiatiques, amérindiennes, sino-tibétaines et sur le basque).

C. Syntaxe (∼ 7 %)

On notera une très forte concentration des recherches en syntaxe dans des laboratoires parisiens : notamment SFL (UMR7023) et LLF (UMR7110) pour la syntaxe formelle, le CRLAO (UMR8563) pour la syntaxe des langues d'Asie Orientale, ou le LLACAN (UMR8135) pour la syntaxe des langues africaines. IKER (UMR5478) à Bayonne et le LLING (EA3827) à Nantes sont les seules équipes de province.

La syntaxe étudie la façon dont des unités de signification (morphèmes, mots) se combinent entre elles pour générer des unités de signification plus grandes (syntagmes, propositions, phrases). Elle cherche à déterminer les combinaisons possibles (et impossibles) d'unités et à découvrir les principes qui président à leur combinaison, et ce faisant à éclairer les mécanismes de leur interprétation. De par le principe de compositionalité du sens (qui dit que le sens d'une expression complexe est une fonction du sens des unités qui la composent et de leur mode de combinaison), une théorie adéquate de (la compositionalité de) la signification doit être articulée sur une théorie de la syntaxe.

La question de l'articulation entre syntaxe et sémantique est au cœur des controverses qui opposent les grands courants de syntaxe formelle. On peut (grossièrement) distinguer deux grands paradigmes théoriques. D'un côté, les approches lexicalistes et monostratales (Grammaires Catégorielles, Lexical Functional Grammar (LFG), Head-driven Phrase Structure Grammar (HPSG)) où le calcul sémantique s'opère sur des structures de « surface » (transparentes), et qui font appel à une sémantique puissante (enrichie) pour rendre compte de la (non-)correspondance entre syntaxe et sémantique. De l'autre, les modèles comme la Grammaire Générative où pour rendre compte de la (non-) correspondance entre structures syntaxiques et sémantiques, on fait appel à une composante syntaxique puissante (abstraite) qui génère des « Formes Logiques transparentes » pour le calcul sémantique.

Les recherches en syntaxe sont bien diversifiées, tant du point de vue des paradigmes scientifiques et méthodologiques représentés, qu'au niveau des aires culturelles couvertes. Ainsi, en ce qui concerne les cadres théoriques adoptés, le CNRS compte de très bons chercheurs en grammaire générative, en HPSG, ou en grammaire des contraintes, menant des recherches de pointe en syntaxe à l'interface avec d'autres niveaux d'analyse, notamment la sémantique et la morphologie, et plus rarement la phonologie ou la prosodie. La section compte aussi plusieurs membres qui combinent la syntaxe avec le TAL, la psycholinguistique, la typologie ou la sociolinguistique. Ces recherches se distinguent également par le recours à une méthodologie expérimentale pour collecter des données de compréhension ou de production et/ou mettre à l'épreuve des hypothèses théoriques, ainsi que par le recours à des méthodes d'analyse quantitative, ou par l'usage de corpus.

On soulignera, enfin, que des recrutements récents ont ouvert la porte à des paradigmes de recherche en syntaxe nouveaux au CNRS, et offrant des questionnements nouveaux, ou des perspectives renouvelées sur certaines questions classiques de la syntaxe : syntaxe et sémantique des langues signées, neuro-syntaxe (corrélats neuronaux des structures hiérarchiques), et biolinguistique explorant les bases biologiques du langage.

Pour ce qui est des langues étudiées, les recherches portent sur une belle palette de langues : langues romanes, germaniques ou slaves, mais également des langues typologiquement plus éloignées, notamment le basque, les langues d'Asie orientale, langues celtiques, ainsi que les créoles, les langues mandées, les langues tchadiques, ou la langue des signes.

Quoique le vivier de chercheurs en syntaxe au CNRS soit réduit, la qualité des chercheurs dans ce domaine est incontestable, et leurs recherches ont une audience internationale importante.

D. Sémantique (∼ 14 %)

La sémantique est pratiquée un peu partout sur le territoire, mais on citera notamment pour les approches formelles vériconditionnelles dites plus traditionnelles, Paris (avec l'IJN, UMR8129 ; SFL, UMR7023 ; LLF, UMR 7110 ; LATTICE, UMR8094 ; CRLAO, UMR8563), Bayonne (IKER, UMR5478) ou Nantes (LLING, EA3827). Pour la sémantique dynamique on note Toulouse (IRIT, UMR5505 ; CLLE, UMR5263), Nancy (LORIA, UMR7503) et Bordeaux (LABRI, UMR5800), pour les approches formelles alternatives Paris (LLF) et Toulouse (IRIT), pour la sémantique computationnelle, le LORIA, l'IRIT et pour des approches descriptives, la région parisienne (LACITO, UMR7107 ; LLACAN, UMR8135).

La sémantique a pour sujet le sens ou contenu d'un mot ou d'une construction dans une langue donnée. Elle traite aussi la composition de sens pour donner un contenu aux phrases, voire à des textes entiers. Son champ correspond essentiellement à l'étude (i) des catégories lexicales à pertinence grammaticale (sémantique des classes de noms, des classes de verbes et types de situations, des expressions gradables, vagues ou scalaires, etc.) et de l'ontologie qu'elles supposent, (ii) des items lexicaux appartenant aux catégories fonctionnelles qui constituent « l'appareil quantificationnel du langage » (déterminants, nombre grammatical, temps, aspect, modalité, etc.), (iii) des questions d'interface syntaxe-sémantique comme l'interprétation des pluriels, de l'ellipse et des anaphores, et de la relation entre la sémantique lexicale et la structure argumentale syntaxique, et (iv) de la part qui revient à l'intégration de diverses dimensions de sens dans le calcul du contenu d'un phrase ou d'un texte comme la présupposition, l'implicature, ou la dimension émotive ou évaluative. La sémantique suit une méthodologie largement formelle, bien que certaines approches restent descriptivistes.

Depuis plusieurs décennies, une grande partie des sémanticiens dans le monde modélise le sens en utilisant la théorie des modèles issue de la logique et de la sémantique des langages formels, comme celui de la logique des prédicats (langage du premier ordre) ou de logiques d'ordre supérieur. Dans cette modélisation, la valeur d'une phrase à un indice d'évaluation (qui peut inclure un moment temporel, une situation possible, un contexte déictique, un contexte discursif, inter alia) est une valeur de vérité, calculée récursivement à partir des dénotations assignées aux composantes de la phrase. C'est pourquoi cette approche sémantique s'appelle la sémantique vériconditionnelle.

La sémantique est actuellement dans une période de développement et de changement profonds vis à vis du paradigme dominant de la sémantique vériconditionnelle. Elle est en effet en train d'assimiler des méthodes et des concepts issus de disciplines comme l'informatique et la psychologie cognitive. On note ainsi un essor important de la sémantique computationnelle qui conduit, par exemple, à l'exploitation de théories de types riches, empruntées à la sémantique des langages de programmation, dans le cadre de la sémantique des langues naturelles, en France et en Europe. Cet axe de recherche a aussi renouvelé, en raison de l'étroite correspondance entre types et preuves, un intérêt pour la théorie de la preuve comme cadre théorique pour la modélisation du sens.

Un autre développement important est l'émergence de théories probabilistes de la sémantique, modélisant l'interprétation comme un processus de raisonnement sous incertitude via des méthodes fréquemment utilisées dans les sciences cognitives et l'intelligence artificielle pour traiter la perception, le raisonnement et la construction des concepts.

On observe aussi l'importance croissante du développement de modèles sémantiques issus de l'approche distributionnelle, qui essaient de caractériser le sens d'un mot et même de constructions plus complexes par des méthodes issues de l'algèbre linéaire. Le défi majeur est de produire une théorie de la composition du sens à partir de représentations issues de l'algèbre linéaire, ce qui constitue un domaine de recherche très actif dans la communauté mondiale.

On constate dans le paradigme formel des ouvertures importantes vers l'intégration (i) d'aspects discursifs et dialogiques, en général dans le cadre d'approches dynamiques du sens, avec un intérêt accru pour la modélisation du sens des phrases non-déclaratives en contexte, des actes de langage autres que l'assertion, et de marqueurs discursifs et dialogiques ; (ii) d'approches empiriques nouvelles, et ceci dans les deux domaines que constituent le travail sur les grands corpus et les expériences psycho-, voire neuro-linguistiques ; (iii) de données provenant de domaines nouveaux, en particulier les langues des signes, qui fournissent un terrain particulièrement propice à l'exploration des contraintes sémantiques universelles sur des phénomènes de déixis, d'attitudes propositionnelles et d'ellipse ou d'anaphore. On notera aussi une poussée au delà des textes vers une analyse sémantique et pragmatique du dialogue (cf. § II.D). Bien que le français, les langues romanes et l'anglais fournissent le gros des données analysées dans les approches formelles, il y a également une production soutenue d'analyses de qualité sur l'interface syntaxe-sémantique dans des langues typologiquement variées (basque, langues d'Asie Orientale, etc.). En revanche, le travail sur des langues peu étudiées ou en danger, qui a beaucoup contribué à faire découvrir ou reformuler certaines questions de recherche, n'en est qu'à ses débuts en France et reste souvent descriptif.

Le domaine de la sémantique en France comprend donc aussi des recherches en dehors du cadre de la sémantique formelle au sens large, à savoir de la sémantique descriptive qui s'inscrit dans des cadres généralement cognitivistes ou fonctionnalistes, mais qui reste néanmoins théoriquement assez hétérogène.

La communauté française en sémantique formelle s'inscrit avec succès dans le débat scientifique international.