Section 34 Sciences du langage

III. Universalité du langage, diversité des langues (∼ 26 %)

On compte environ 6500 langues différentes, qui présentent une grande diversité, tant formelle que systémique.

Étant donnés que de nombreuses langues du monde restent peu ou pas décrites, que beaucoup d'entre elles, essentielles pour notre compréhension de la diversité linguistique, sont en train de disparaître (la moitié des langues aujourd'hui pratiquées sont menacées à l'horizon 2100) et que, même pour les langues les plus décrites, seuls certains lectes (par exemple la langue écrite ou des variétés de prestige pratiquées par les groupes socioculturels dominants) sont connus en profondeur, la production, à partir de données recueillies sur le terrain (ou dans les documents écrits disponibles) de descriptions englobantes et fidèles (grammaires, dictionnaires, textes transcrits et annotés, études sociolinguistiques, atlas dialectologiques), d'ouvrages comparatifs et de reconstructions est une activité fondamentale et nécessaire au progrès de nos connaissances sur les langues dans leur diversité et au développement des Sciences du Langage.

Le CNRS a une longue tradition de recherche dans ce domaine (langues africaines, amérindiennes, sino-tibétaines et océaniennes) via des laboratoires principalement en région parisienne, comme le CRLAO (UMR8503), le LACITO (UMR7107), le LLACAN (UMR8135), le LPP (UMR7018) ou le SEDYL (UMR8202), mais aussi à Lyon (DDL, UMR5596), à Bayonne (IKER, UMR5478), à Aix en Provence (IREMAM, UMR7310.

A. Typologie et diversité des langues (∼ 12 %)

La typologie linguistique est l'étude des régularités attestées à travers les langues du monde, permettant de définir des universaux linguistiques, c'est-à-dire des propriétés véritablement partagées par toutes les langues du monde. À partir de ces universaux, la typologie linguistique vise à identifier plus généralement des types de langues dont la mise au jour permet de progresser dans la caractérisation des processus cognitifs sous-jacents à l'élaboration et au fonctionnement des systèmes linguistiques.

La typologie des langues peut s'appuyer sur tous les niveaux de description : phonétique, phonologique, morphologique, syntaxique, sémantique, etc. De nouveaux domaines sont désormais investis par cette discipline. Ainsi, la typologie linguistique s'est notamment intéressée récemment à la comparaison des langues en ce qui concerne leur mode d'expression de certaines catégories cognitivement centrales, comme l'espace et le temps. La méthodologie des cartes sémantiques, qui consiste à observer quelles valeurs sémantiques sont « codées ensemble » (c'est-à-dire au moyen d'un même signifiant : ainsi, l'instrumental et le comitatif sont souvent exprimés au moyen du même morphème – avec en français) dans les langues, est un autre domaine d'élargissement de la typologie linguistique. Ces deux exemples illustrent l'intérêt grandissant en typologie linguistique pour les catégories sémantiques (lexicales et grammaticales). Notons aussi la prise en compte croissante de la prosodie dans les études typologiques (caractérisation de l'intonation des séquences interrogatives et de celles marquant le topique ou le focus à partir de corpus oraux).

La recherche des universaux langagiers que propose la typologie s'appuie sur un effort de description de la diversité linguistique et a significativement contribué à renouveler ce champ d'activité. Ainsi, le besoin des typologues d'avoir des données à la fois comparables et fiables a été l'un des moteurs de la rationalisation et de la standardisation de certains aspects de la description – comme l'adoption de systèmes d'interlinéarisation communs, inspirés des Leipzig Glossing Rules.

Parmi ces renouvellements des pratiques, on peut également mentionner le développement de la linguistique documentaire, qui met l'accent sur le recueil et l'archivage pérenne de données riches, permettant de préserver un témoignage des langues menacées et permettant d'éventuelles descriptions futures.

L'effort de description et de documentation des langues du monde a permis récemment la constitution de vastes bases de données internationales recensant les propriétés d'un grand nombre de langues du monde (cf. le World Atlas of Language Structures). Le domaine de la typologie quantitative s'appuie sur ces vastes répertoires et s'inscrit dans un mouvement général de développement des méthodes quantitatives en linguistique. La typologie linguistique s'appuie également aujourd'hui sur des corpus textuels, en particulier grâce à la disponibilité de certains textes traduits dans un grand nombre de langues.

B. Linguistique diachronique et linguistique comparée (∼ 10 %)

L'étude de l'évolution des langues dans le temps et la reconstruction des protolangues dont les langues d'une même famille sont issues est l'un des domaines les plus anciens des Sciences du langage, puisque l'hypothèse d'une langue ancestrale indo-européenne (dont sont dérivées entre autres le grec, le latin et le sanskrit) a été formulée dès 1786 par Sir William Jones. La linguistique diachronique et comparée est donc un domaine cumulatif et ancien mais il reste producteur de renouvellements théoriques et méthodologiques.

L'investissement du CNRS est conséquent dans le domaine de la comparaison des langues entre elles et de leurs évolutions diachroniques. Les chercheurs de la section 34 jouent un rôle moteur au niveau mondial dans la classification et la reconstruction des stades anciens de divers groupes génétiques : langues austronésiennes, sino-tibétaines, Niger-Congo, méso-américaines... Des travaux sont aussi consacrés à la diachronie de familles de langues indo-européennes représentées sur le territoire français (roman et celtique notamment).

La théorie de la grammaticalisation continue à jouer un rôle important et structurant dans le domaine de la linguistique diachronique. Elle permet de décrire de façon plus rigoureuse les changements grammaticaux et sémantiques en observant des régularités et en les rapportant à des propriétés cognitives.

De nombreux renouvellements sont issus de la prise en compte des acquis de la typologie linguistique, qui permet d'identifier des régularités dans les processus de changement. Un autre renouvellement important est fourni par la sociolinguistique historique, qui s'attache à prendre en compte en diachronie les acquis de la sociolinguistique. Cette approche a conduit à l'exploitation de matériaux jusqu'alors peu étudiés – textes de locuteurs « peu lettrés » – mais fournissant des témoignages précieux sur la langue populaire de l'époque considérée.

Plusieurs apports méthodologiques ont renouvelé le champ des études comparatives et diachroniques. Il s'agit notamment de la numérisation à grande échelle du patrimoine écrit des langues documentées à date ancienne, qui a permis de réviser les dates de premières attestations de nombreuses formes linguistiques. Les méthodes statistiques jouent également un rôle de plus en plus important. Appliquées aux corpus numérisés, elles permettent d'étudier le caractère graduel du changement. Appliquées à des bases de données notant les innovations partagées entre langues apparentées, elles permettent de faire des hypothèses sur les états de langues anciens et de modéliser les échanges et les migrations ayant impliqué des communautés voisines.

Le CNRS dispose également d'un pôle d'expertise dans le domaine des langues anciennes (attestées essentiellement dans des documents écrits). Dans ce domaine, les travaux des membres du CNRS ont en particulier contribué à faire progresser de façon significative le déchiffrement de plusieurs de ces langues (chinois archaïque, méroïtique, tangoute) et à mettre à profit les apports de la linguistique contemporaine (typologie et linguistique générale) pour stimuler leurs champs de recherche respectifs.

Les spécialistes de ce domaine sont peu nombreux (un ou deux au maximum par langue) et généralement bien intégrés dans des réseaux de recherche internationaux (en particulier européens), seuls à même de permettre une bonne diffusion de leurs recherches.

C. Sociolinguistique, variation et contact de langues (∼ 4 %)

La sociolinguistique est la branche de la linguistique qui souligne la dimension sociale de l'usage du langage, révélant l'existence d'un important degré de variation interne au système. Ces variations (phonologiques, syntaxiques, prosodiques, etc.) obéissent à différents types de structuration : on peut ainsi identifier au sein d'une même langue des lectes (ou variétés) distingués par leur caractéristiques régionales, sociales ou contextuelles. L'étude de la variation s'est renforcée avec la disponibilité de corpus permettant de synthétiser les régularités de la parole à grande échelle. On a ainsi mis en évidence l'importance des « genres textuels », associés aux différentes sphères d'activité, dont on a montré qu'ils correspondaient parfois à des sous-systèmes d'une langue.

Les approches sociolinguistique et variationnelle (développées au CNRS à ICAR UMR5191 ; PRAXILING UMR5267 ; SEDYL UMR8202 ; BCL UMR7320 ; LIMSI UPR3251) ont largement contribué à remettre en cause le mythe de l'homogénéité linguistique.

La diversité des langues se retrouve donc aussi à l'intérieur de chaque langue et la prise en compte systématique de cette variation est fondamentale pour une compréhension en profondeur des mécanismes du langage humain. La sociolinguistique contribue ainsi à la mise au point de méthodes d'analyses plus rigoureuses des données recueillies et traitées par les linguistes descripteurs ou typologistes. Elle a permis d'améliorer les techniques de collecte (en particulier au niveau de la documentation linguistique) et d'établir des ponts interdisciplinaires avec des disciplines connexes telles que la sociologie, l'ethnologie et l'anthropologie. La sociolinguistique a aussi des applications sociales directes, en permettant de mieux prendre en compte l'inégalité des locuteurs (donc des citoyens) face à la norme (la variété prestigieuse prescrite dans le cadre scolaire ou administratif). Par ailleurs, le caractère multifactoriel (évoqué ci-dessus) des variations étudiées par les sociolinguistes a abouti à l'établissement de corpus spécifiques et à des développements stimulants dans le domaine de la modélisation de la variation.

Le contact de langues est un domaine particulièrement crucial pour les sociolinguistes, permettant de mieux comprendre et modéliser les influences qu'exercent les uns sur les autres les divers codes dont dispose une communauté ou un individu (notion de répertoire) et l'émergence de nouvelles variétés langagières (créoles, pidgins, variétés de contact), phénomène qui renvoie à la question fondamentale de la genèse et de l'origine du langage humain.