mercredi 11 septembre 2019

« Au commencement était le Verbe » : retour sur l’épopée de la voix humaine



RÉCIT Pour le nourrisson, elle est aussi vitale que les aliments qu’il ingère. Et pour l’humanité, elle fut une formidable source de progrès. Retour sur la prodigieuse évolution de la parole.

« C’était une voix grave et douce, une voix de jeune homme blond ou de jeune fille brune, d’un timbre frais et pénétrant, résonnant comme un chant de cigale altérée à travers la brume poudreuse d’Egypte… », raconte Gérard de Nerval (Voyage en Orient, 1851). Mystérieuse, envoûtante voix parlée. Elle nous convie à un vertigineux voyage dans le temps. Un double voyage, à court et très long terme. A l’âge des biberons, d’abord : pourquoi la voix humaine est-elle vitale pour le nourrisson ? A l’âge des cavernes, ensuite : quand et comment est apparue, chez un de nos lointains ancêtres, cette voix articulée, « alchimie entre la raison et l’émotion », comme la définit Jean Abitbol, chirurgien phoniatre et médecin ORL, dans Voix de femme (Odile Jacob, 256 p.) ?

« Au commencement était le Verbe », écrivait Jean l’évangéliste. Le verbe, au vrai, ne fut pas au commencement de tout. Mais il fut au commencement du genre humain, ce qui n’est pas rien. Aujourd’hui encore, il se tient au tout début de chaque vie humaine. Un miracle sans cesse rejoué, puisque la voix de la mère se grave dans la matière molle d’un cerveau à partir du sixième mois de vie utérine. Ce sceau indélébile servira d’empreinte à l’enfant – du latin infans, « celui qui ne parle pas » – pour apprendre sa langue maternelle. Nombreux sont les animaux qui vocalisent, mais seul parle l’homme. Ou presque : certains perroquets, perruches et mainates jactent toutefois. La faune des fameuses Fables (1668) aussi, où La Fontaine fait même articuler les poissons.

Pensée symbolique

Que serions-nous sans la parole ? Question absurde, en vérité, tant elle se fonde sur le langage pour être pensée et formulée. Tant le verbe a engendré notre espèce, tant il a coévolué avec notre cerveau. Que serions-nous sans mythes fondateurs, sans épopées à raconter au coin du feu ? Sans chants et sans prières, matière spirituelle à souder les tribus humaines ? Sans la chaleur, sans la caresse des mots chuchotés, matière affective à irriguer nos âmes ? Sans un langage élaboré, matière intellectuelle à coordonner nos activités sociales ?

« L’animal humain est d’abord un animal technique et social », souligne le neuroscientifique Alain Prochiantz, professeur au Collège de France. Etre chétif, l’homme ne pouvait guère compter sur ses moyens physiques pour combattre ou pour fuir. Pour survivre et prospérer, il a donc misé sur ses ressources cognitives et sociales, dopées par le langage. Nommer les choses – objets, sentiments et concepts – a stimulé son imagination, vivifié son inventivité, éveillé sa fibre artistique. Le langage a permis la pensée symbolique.

« Le verbe est une chose insignifiante en soi, un souffle infime, rien de plus. Toutefois, c’est dans et par le mot que nous prenons d’abord conscience de notre humanité », écrit André Brink

« A travers la langue que nous parlons résonnent les voix des peuples qui se sont éteints il y a des milliers d’années », observe Vassilis Alexakis (Le Premier Mot, Stock, 2010). Bien avant que n’apparaisse l’écriture, c’est sur la seule parole qu’ont reposé la transmission des savoirs et leur accumulation, au fil des générations. Un prodigieux avantage propre à notre espèce. L’expérience humaine à son tour a forgé de nouveaux mots : un cercle vertueux.

« Le verbe est une chose insignifiante en soi, un souffle infime, rien de plus. Toutefois, c’est dans et par le mot que nous prenons d’abord conscience de notre humanité », affirme André Brink (Mes bifurcations, Actes Sud, 2010). Pour le jeune enfant, la voix est une nourriture affective et mentale aussi vitale que la nourriture qu’il ingère. Une « expérience » inhumaine, au XIIIe siècle, montre à quel désastre conduit la privation de voix humaine dès la naissance. Frédéric II de Hohenstaufen, empereur du Saint Empire romain germanique de 1198 à 1250, imagina une épreuve diabolique, appliquée à six nouveau-nés. « Il ordonna aux nourrices d’allaiter les enfants [… ] avec la défense de leur parler, relate le moine Salimbene de Adam de Parme dans sa Chronique (1283-1285). Il voulait en effet savoir s’ils parleraient la langue hébraïque, qui fut la première, ou bien la grecque, ou la latine, ou l’arabe ; ou s’ils parleraient toujours la langue des parents dont ils étaient nés. Mais il se donna de la peine sans résultat, parce que les enfants ou les nouveau-nés mouraient tous. »

Enfants sauvages

La barbarie n’a pas de frontières. Akbar le Grand, qui régna sur l’Empire moghol de 1556 à 1605, aurait organisé une expérience similaire sur douze enfants. Ces infortunés développèrent des déficits cognitifs, affectifs et sociaux majeurs, largement irréversibles. On connaît aussi les cas de ces malheureux enfants sauvages, qui ont grandi hors de la société humaine. Mais comment démêler, ici, les parts respectives des carences langagière, affective et sociale ?

Aux antipodes de cette cruauté, une étude publiée en 2010 illustre le pouvoir bénéfique de la voix maternelle (Seltzer L. et al., Proc. Royal Soc.). Une anthropologue américaine a demandé à 61 fillettes, âgées de 7 à 12 ans, de résoudre en public des problèmes de maths. L’épreuve a fait grimper leur taux de cortisol, une hormone du stress. Après leur prestation, elles ont été réparties dans trois groupes. Les fillettes du premier groupe pouvaient voir, entendre et étreindre leur mère ; celles du deuxième, sans aucun contact avec leur mère, visionnaient un film ; celles du dernier pouvaient parler au téléphone avec leur mère. Résultat : les membres des premier et troisième groupes ont vu grimper leur taux d’ocytocine (une « hormone de l’amour ») et s’effondrer leur taux de cortisol. Un effet antistress aussi intense dans les deux groupes, signe que la voix maternelle était bien le facteur causal. Les fillettes du deuxième groupe, sans contact physique ni vocal avec leur mère, conservaient des taux élevés de cortisol – et de stress.

« Quand on parle à un jeune enfant, il ne faut pas limiter son vocabulaire, affirme la pédiatre Ghislaine Dehaene-Lambertz. Il saura capter ce qui importe pour apprendre sa langue maternelle »

« Avec la voix maternelle, la vie vous fait à l’aube une promesse… », aurait pu écrire Romain Gary. Même chez des bébés de quelques mois, les aires cérébrales du langage s’activent lorsqu’ils écoutent des voix parlées dans leur langue maternelle. C’est ce qu’a montré Ghislaine Dehaene-Lambertz, pédiatre et chercheuse au CEA (NeuroSpin, Paris-Saclay), en 2002 dans Science. Le réseau du langage parlé se met donc en place, dans l’hémisphère gauche, bien avant que l’enfant n’apprenne à lire. Dès la première année de vie, les bébés ont appris les propriétés essentielles de leur langue maternelle, et cela d’autant mieux qu’ils auront été stimulés par la voix de leurs proches. « Chez l’enfant comme chez l’adulte, les mêmes aires cérébrales s’activent pour écouter la parole et tenter de lui donner un sens. Quand on parle à un jeune enfant, il ne faut pas limiter son vocabulaire. Il saura capter ce qui importe pour apprendre sa langue maternelle », recommande la pédiatre.

On pourrait multiplier les exemples de l’importance de la voix de la mère. Tel ce travail, publié en 2015 dans les PNAS (Proceedings of the National Academy of Sciences, Lahav A. et al.), mené par une équipe de l’université de Harvard sur 40 grands prématurés. La moitié ont écouté chaque jour pendant trois heures un enregistrement de la voix de leur mère couplée aux battements de son cœur. Les vingt autres n’ont entendu que les bruits de la salle de réanimation néonatale. Résultat : dans le groupe « dopé » par la voix maternelle, le cortex auditif était plus épais après trente jours. Et l’apprentissage du langage ainsi que le développement cérébral étaient significativement meilleurs après douze à quinze mois.

Dépression interdite

Autre exemple, paru en 2016 dans les PNAS (Abrams D.A. et al.). Ici, vingt-quatre enfants âgés de 7 à 12 ans ont été soumis à l’écoute d’une voix féminine (leur mère ou une autre femme), dont les mots prononcés n’avaient aucun sens. Ils identifiaient la voix maternelle en moins d’une seconde. Quelle que soit l’identité de la voix, celle-ci activait les aires du langage. Mais seule la voix maternelle activait les nombreuses aires cérébrales liées aux émotions, à la récompense, à la connaissance de soi et à la reconnaissance faciale. « Nombre des processus sociaux, linguistiques et émotionnels que nous adoptons proviennent de l’écoute de la voix de notre propre mère, qui possède le niveau le plus élevé de confort social et d’aptitudes à la communication », conclut l’auteur. Revers de la médaille : quand la voix maternelle montre des symptômes de dépression, elle échoue à enclencher, chez des enfants de 4 mois, un apprentissage en réponse à un stimulus (Kaplan P. et al., Child Development, 1999).

Et la voix paternelle ? Les études sur le sujet… ne doivent pas décourager les pères investis. Ainsi, alors que les nouveau-nés présentent une préférence pour la voix maternelle vis-à-vis d’autres voix féminines (DeCasper A. et Fifer W., Science, 1980), ils n’en montrent aucune pour la voix paternelle vis-à-vis d’autres voix masculines (DeCasper A. et Prescott P., Developmental Psychobiology, 1984). Un résultat confirmé en 2014 dans Developmental Psychobiology (Lee G. & Kisilevsky B.). A l’âge de 4 mois, les bébés ne montrent pas plus de tropisme pour la voix de leur père (Ward C. et Cooper R., Developmental Psychobiology, 1999). Que les pères se rassurent : on imagine volontiers que, plus tard, leur voix pèsera favorablement sur le développement de leur enfant…

Le code cérébral de la parole

Comment la parole est-elle codée dans le cerveau ? Un des pionniers du domaine est le neurochirurgien Edward Chang, à l’université de Californie. A l’aide d’électrodes implantées dans le cerveau de volontaires (généralement des patients traités pour épilepsie), son équipe enregistre en temps réel l’activité des neurones qui analysent une phrase parlée. On a ainsi localisé des microrégions du cortex uniquement sensibles à certains phonèmes ! Situées dans le gyrus temporal supérieur, elles existent pour toutes les voyelles, les consonnes et les intonations de la parole (Yi H.G. et al., Neuron, juin 2019).

Ces microrégions se spécialiseraient très tôt chez le jeune enfant qui écoute la voix de ses proches. C’est ce que suggère une étude sur… le chant des passereaux, publiée le 12 août dans la revue Nature Neuroscience par l’équipe de Sarah Woolley, de l’université Columbia à New York. Deux espèces d’oiseaux chanteurs, le diamant mandarin (Taeniopygia guttata) et le diamant à longue queue (Poephila acuticauda), ont joué les cobayes. Leurs oisillons apprenaient le chant en écoutant soit leurs parents biologiques respectifs, soit des « parents d’adoption » d’une troisième espèce : le moineau du Japon (Lonchura striata domestica), au chant différent. Résultat : dans ce dernier cas, les jeunes oiseaux imitaient le chant de leurs parents d’adoption. Mieux : les neurones de leur cortex auditif réagissaient aux sons propres à ce chant d’adoption. Chez l’homme, « des processus similaires expliqueraient comment une exposition précoce aux sons propres de chaque langue parlée prédirait les capacités de l’adulte à percevoir la parole », estime l’auteure. Et pourquoi, passé nos jeunes années, il devient si ardu d’apprendre une langue étrangère.

Le larynx joue un rôle clé dans la parole. Dès le 8e jour après la naissance, il entame sa lente descente dans la gorge. Il atteindra sa position définitive vers le 18e mois de vie – quand l’acquisition du langage est en plein essor

Retour à l’âge des cavernes, maintenant. La parole marque un saut évolutif entre l’homme et les autres espèces animales. Chez les chimpanzés, on compte quelques dizaines de vocalisations distinctes seulement, « quand les humains peuvent utiliser plusieurs dizaines de milliers de mots différents », note Alain Prochiantz. Sans compter la diversité des quelque 7 000 langues parlées dans le monde (dialectes non compris).

A quoi tient le succès évolutif d’une espèce – un succès toujours en sursis ? Pour l’homme, il reposerait en partie sur un os minuscule : l’os hyoïde (du grec upsilon et eidos, « en forme de U »). C’est ce qu’a proposé l’Américain Philip Lieberman dans Science en 1969. Logé au-dessus du larynx, « cet os soutient les racines des puissants muscles de la langue qui permettent, en grande partie, la formation des voyelles », écrit Jean Abitbol. Chez le chimpanzé, l’os hyoïde est placé très haut. Mais chez l’homme, il est positionné assez bas : sa descente a permis au larynx de descendre, lui aussi, au niveau de la 5e vertèbre cervicale. Avec une exception notable : chez le nouveau-né, le larynx reste haut perché (au niveau de la première cervicale). « Cela lui permet de téter tout en respirant », explique Jean Abitbol. Dès le 8e jour après la naissance, le larynx entame sa lente descente dans la gorge. Il atteindra sa position définitive vers le 18e mois de vie – quand l’acquisition du langage est en plein essor.

Les vocalises des babouins

Cette descente du larynx aurait libéré un vaste espace, au-dessus des cordes vocales, pour faire caisse de résonance. Mais pourquoi la sélection naturelle aurait-elle favorisé un larynx plus bas ? « Cela aurait rendu la voix plus grave, chez nos ancêtres mâles… ce qui les aurait fait paraître plus grands. Un moyen de leurrer leurs ennemis et leurs partenaires sexuelles – un subterfuge utilisé par d’autres espèces comme le cerf », propose David Reby, de l’université de Saint-Etienne. En parallèle, chez nos ancêtres, la courbure des os de la base du crâne a évolué : cette configuration est devenue favorable à l’émission du langage articulé.

Mais cette hypothèse a été mise en doute. Car malgré un larynx haut placé, les babouins parviennent à produire au moins cinq vocalisations qui ressemblent à « nos » voyelles. C’est ce qu’a révélé une étude du CNRS publiée en 2017 par Louis-Jean Boë, de l’université de Grenoble, et Joël Fagot, de l’université d’Aix-Marseille (PLoS One). Peu auparavant, une équipe austro-américaine avait sondé aux rayons X l’appareil vocal de macaques en train de vocaliser, puis modélisé ses mouvements. Verdict : malgré un larynx haut perché, le tractus vocal de ce singe le rendrait apte à la parole (Fitch W.T. et al., Science Advances, 2016). Il fallait donc revoir la théorie de la « descente du larynx », ont affirmé ces chercheurs. Pas nécessairement, rétorquent d’autres. « Chez le macaque, la formation de mots articulés est bien éloignée de la nôtre », souligne Jean Abitbol.

De fait, la Terre n’est pas La Planète des singes ! Pour deux raisons. D’une part, les capacités d’articulation des primates non humains restent limitées. Mais surtout, il leur manque des pièces cruciales du puzzle : les câblages cérébraux de la parole. Car pour parler, il faut d’abord pouvoir orchestrer le jeu ultrasophistiqué des muscles qui actionnent notre instrument vocal : poumons, larynx, langue, mâchoires et lèvres !

Le gène « FOXP2 a une histoire évolutive ancienne, selon le scientifique Simon Fisher. Il est présent, sous des formes similaires, chez de nombreuses espèces éloignées qui n’ont pas de langage parlé »

C’est là qu’entre en scène un maestro : le gène FOXP2. Dans les années 1990, une équipe de l’université d’Oxford traquait, dans une famille anglaise, le gène responsable d’une maladie génétique rare engendrant des troubles du langage parlé et écrit. Le coupable a été débusqué : FOXP2, porté par le chromosome 7 (Lai C. et al., Nature, 2001). Par la suite, de nombreuses autres atteintes de ce gène ont été identifiées : « Elles perturbent de façon disproportionnée les capacités de parole et de langage, bien plus que toute autre aptitude cognitive », souligne le professeur Simon Fisher, directeur de l’Institut Max-Planck de psycholinguistique, aux Pays-Bas, coauteur de ces travaux.

La découverte a éveillé l’intérêt des anthropologues. Quelle était l’histoire évolutive de ce gène ? « Dans la seule lignée humaine, après sa séparation d’avec la lignée des chimpanzés, deux mutations se sont produites dans le gène FOXP2 », résume Simon Fisher (Enard W. et al., Nature, 2002). Deux petits pas pour un gène, un bond de géant pour l’humanité ? Ont-elles été le point de départ de la parole ? Pas si simple. « Les différences engendrées par ces deux mutations sont assez subtiles », précise le scientifique.

Simon Fisher explore, depuis près de vingt ans, les fonctions de ce gène. « FOXP2 a une histoire évolutive ancienne. Il est présent, sous des formes similaires, chez de nombreuses espèces éloignées qui n’ont pas de langage parlé. Chez ces espèces, il est actif dans des circuits cérébraux analogues. » Chez les oiseaux chanteurs, par exemple, il est important pour l’apprentissage du chant ; chez la souris, pour les vocalisations et l’apprentissage de certains mouvements (Fisher S., Current Biology, 2019). « Les contributions importantes de ce gène au langage humain sont sans doute liées à ces fonctions évolutives anciennes. » Pour autant, « FOXP2 n’est qu’une pièce d’un puzzle complexe », ajoute Simon Fisher. Son équipe a découvert des mutations rares dans de nombreux autres gènes régulateurs : elles aussi provoquent des troubles de développement du langage (Eising E. et al., Molecular Psychiatry, 2019).

Pour que nos ancêtres se mettent à parler, encore fallait-il qu’ils aient quelque chose à dire !

D’où vient, maintenant, la vertigineuse diversité des langues parlées à travers le monde ? Sans doute des effets croisés de facteurs sociaux, psychologiques, écologiques… mais aussi de contraintes biomécaniques et physiologiques. Une étude récente pointe le rôle de la forme du « palais osseux », cette voûte qui surplombe notre cavité buccale. Elle aurait façonné l’évolution des voyelles, suggère un travail publié le 19 août dans Nature Human Behaviour. Les auteurs ont scanné par IRM le tractus vocal de 107 individus, qui représentaient quatre grands groupes ethnolinguistiques : Europe, Amérique du Nord d’origine européenne, Inde du Nord, Inde du Sud et Chine. « La forme du palais présente des différences ténues entre individus, note Dan Dediu, de l’université Lyon-II, premier auteur. Nous observons aussi des combinaisons de très petites variations qui – ensemble – permettent d’affilier les participants dans leur groupe. »

Ensuite, les auteurs ont eu recours à un modèle informatique qui mime l’articulation, en reproduisant la géométrie du tractus vocal humain. Ils y ont intégré les différentes formes de palais révélées par l’IRM. Puis ils ont appris à ce modèle à prononcer cinq voyelles. « La forme du palais osseux a eu un impact ténu sur les erreurs d’apprentissage des voyelles », a conclu Dan Dediu. Toujours grâce à ce modèle, enfin, les chercheurs ont simulé la transmission de cet apprentissage sur plusieurs générations. Et là, surprise ! « Les petites différences initiales constatées dans l’apprentissage des voyelles – liées à la forme du palais – ont été amplifiées au fil des générations. »

L’art des syntagmes

Mais pour que nos ancêtres se mettent à parler, encore fallait-il qu’ils aient quelque chose à dire ! « Le langage humain reflète aussi l’extraordinaire évolution du cortex, de ses aires cognitives et linguistiques et des connexions cérébrales », relève Alain Prochiantz. La parole est le fruit d’une coévolution de notre cerveau et de notre instrument vocal. Et l’évolution de deux aires cérébrales – l’aire de Broca, pour la production des mots parlés, et l’aire de Wernicke, pour leur compréhension – a été cruciale.

Encore fallait-il, enfin, être capable de concevoir et de maîtriser des règles de grammaire ! Nos phrases, en effet, sont loin d’être des suites de mots linéaires : elles ressemblent plutôt à des arbres, avec de multiples branches ramifiées. Nous manions des groupes de mots enchâssés les uns dans les autres qui forment, au sein d’une phrase, des entités séparables : les « syntagmes ». Par exemple, dans la phrase « le singe qui vocalise sur l’arbre est un macaque », nous distinguons deux syntagmes : « le singe est un macaque » et « qui vocalise sur l’arbre ». Mais « l’arbre est un macaque » n’en est pas un ! Pour saisir le sens d’une phrase sans faire d’erreur, nous devons donc identifier ces syntagmes et déterminer leur hiérarchie.

Par contraste, le chimpanzé à qui l’on apprend à manier des lexigrammes ne sait pas les ordonner. Par exemple, il répète « banane, donner, donner, banane, donner ». « Notre espèce semble être la seule capable de combiner des objets en les enchâssant pour former de nouveaux arbres, que ce soit pour le langage, la musique ou les mathématiques », selon le neuroscientifique Stanislas Dehaene, professeur au Collège de France, qui dirige le centre NeuroSpin au CEA (Paris-Saclay).

« Par son importance unique pour notre espèce, la parole a pu avoir un impact notable sur l’organisation de notre cerveau auditif, qui diffère beaucoup de celle des autres animaux », commente le chercheur Sam Norman-Haigneré

Un acteur-clé est souvent oublié : c’est l’oreille. Son importance a récemment été confirmée. Grâce à l’IRM cérébrale, les auteurs ont comparé les réponses cérébrales de l’homme et du macaque à des sons divers, plus ou moins harmoniques. Verdict : les aires auditives des hommes ont fortement répondu aux sons harmoniques, mais pas celles des macaques. Dans une autre expérience, les humains ont montré une préférence plus marquée que les macaques pour les vocalisations naturelles de ces singes… mais seulement quand elles comportaient des harmoniques. « Par son importance unique pour notre espèce, la parole a pu avoir un impact notable sur l’organisation de notre cerveau auditif, qui diffère beaucoup de celle des autres animaux », commente Sam Norman-Haigneré, post-doctorant, premier auteur de cette étude associant l’université Columbia (New York), l’Ecole normale supérieure (Paris), le MIT et Harvard (Nature Neuroscience, juin 2019).

Ici comme ailleurs, la nature est économe : elle aime à recycler. « La parole, qui utilise des organes initialement prévus pour d’autres fonctions, aurait récupéré une partie des gestes de l’ingestion de liquide et de nourriture », observe Louis-Jean Boë dans la Revue de primatologie en 2011.

Une chaîne de questions

Peut-on dater l’apparition du langage parlé ? Certains l’ont tenté, en se fondant sur la position de l’os hyoïde, la courbure des os à la base du crâne et la séquence du gène FOXP2. « Sur ces bases limitées, on peut proposer que les bases anatomiques et génétiques du langage contemporain seraient apparues il y a environ 600 000 ans », avance Alain Prochiantz dans son livre Singe toi-même (Odile Jacob, 336 p.). Une date à comparer aux 300 000 ans du plus vieil Homo sapiens, découvert en 2017 au Maroc (Hublin J.-J. et al., Nature, 2017). Mais certaines capacités phonatoires auraient été présentes bien plus tôt. « Les langues parlées auraient pu évoluer à partir d’anciennes compétences articulatoires déjà présentes, chez notre dernier ancêtre commun avec le babouin, il y a environ 25 millions d’années », propose Joël Fagot.

D’où cette nouvelle interrogation : que s’est-il passé durant l’immense intervalle de temps qui s’étend entre − 25 millions d’années et − 600 000 ans ? Stanislas Dehaene propose une ébauche de scénario, fondée sur deux observations. La première : il y a 1,6 à 1,8 million d’années, nos ancêtres Homo façonnaient déjà des outils aux propriétés mathématiques recherchées (des bifaces, des pierres en forme de sphère…). Cette compétence suggère une pensée mathématique déjà présente. Second constat : voilà 50 000 à 100 000 ans, une explosion culturelle (art et technologies) s’est produite dans la lignée humaine. Cet essor suggère l’existence d’un langage déjà élaboré. En découle cette hypothèse : la capacité à se représenter des objets mentaux enchâssés les uns dans les autres serait apparue, dans la lignée Homo, bien avant la capacité à communiquer sur ces représentations, donc bien avant le langage. Vertigineux raccourci. De cette fabuleuse aventure, d’immenses chapitres restent à écrire.


Aucun commentaire:

Enregistrer un commentaire