Intravaia Verbo-Tonale
Méthode Verbo Tonale

Categories

Accueil > Formation > Fondements théoriques > Chapitre 4.2 Les étapes de la formation verbo-tonale.Les outils du (...)

12 novembre 2013
Pietro

Chapitre 4.2 Les étapes de la formation verbo-tonale.Les outils du diagnostic

Le diagnostic de l’erreur par la méthode verbo-tonale se fonde essentiellement sur des critères perceptuels et non articulatoires en raison du phénomène de surdité phonologique.

Dès lors, les descriptions articulatoires basées sur une analyse approfondie des mouvements des organes phonatoires et la définition affinée des points et des modes d’articulation ont certes une valeur édifiante pour l’enseignant en formation, mais elles s’avèrent d’un intérêt fort limité quand il s’agit de poser des diagnostics de l’erreur permettant d’agir sur la restructuration de la perception auditive et d’induire des habitudes respiratoires et corporelles nouvelles.

Puisque l’analyse de l’erreur consiste à apprécier l’écart entre celle-ci et le modèle, c’est-à-dire à évaluer non la manière dont le sujet articule les sons de la parole mais la façon dont il les perçoit, l’enseignant possédera avant toute chose la maîtrise de trois grands prérequis de base permettant de caractériser la langue-cible, en l’occurrence le français, sous l’angle de son phonétisme (vocalisme et consonantisme) et de ses spécificités rythmico-mélodiques.

1. Le trapèze vocalique du français d’après des critères acoustico-articulatoires

La caractérisation acoustico-articulatoire du vocalisme du français s’avère indispensable pour l’établissement d’un diagnostic de type perceptuel et l’application des procédures verbo-tonales à la correction des timbres vocaliques.

Que l’erreur se situe sur l’axe du point d’articulation et/ou de l’aperture ou qu’elle concerne la dénasalisation des voyelles orales, le diagnostic est toujours reconductible à une sur- ou sous-estimation de la composante claire du timbre vocalique (ou, ce qui revient à dire la même chose, à une sous- ou surestimation de sa composante sombre ( par exemple, la réalisation de /y/ comme [i] ou comme [u] chez la plupart des étrangers), associée la plupart du temps à une tendance à la réduction vocalique (par exemple, la production de /y/ comme un [i] centralisé(3), tendant vers le /ə/ caduc chez les arabophones) ou à la diphtongaison (par exemple, la réalisation de /y/ comme un [ju :] diphtongué chez les anglophones).

Pour établir un diagnostic de l’erreur vocalique en termes de trop clair ou trop sombre, il est donc indispensable de pouvoir situer l’erreur et le modèle sur le trapèze vocalique, pour ensuite agir sur la perception de l’apprenant, soit en modifiant l’équilibre des fréquences dans le sens opposé à la production erronée, soit en plaçant la voyelle concernée dans des positions rythmico-mélodiques ou combinatoires qui accentuent les éléments non perçus.

Un bref détour par les instruments de musique permettra d’introduire la notion de timbre sans qu’il soit nécessaire de mettre en place des notions d’acoustique trop éloignées de la pratique quotidienne de l’enseignant.

Si nous jouons le même sol sur deux instruments différents, par exemple la contrebasse et le pipeau, nous obtenons deux notes de même hauteur, de même intensité et de même durée, mais de timbres distincts. La différence de timbre dépend de l’effet amplificateur de la caisse de résonance qui, suivant la forme, le volume et l’aperture, va renforcer telle ou telle zone de fréquences correspondant à sa résonance propre, accentuant ainsi le caractère plus ou moins sombre de la note produite.

La caisse de résonance de la contrebasse est volumineuse en valeur absolue et l’orifice proportionnellement étroit : la note produite par cet instrument est sombre (à ne pas confondre avec grave qui sert à qualifier la hauteur du son émis).

Si nous passons de la contrebasse à la grosse caisse des fanfares de l’Entre-Sambre et Meuse, nous constatons que le volume du résonateur est assurément plus important et l’orifice situé sur la paroi latérale de l’instrument (sans orifice, pas de passage de l’air et, partant, pas de son) plus petit : le son émis par la grosse caisse est plus sombre encore que celui de la contrebasse.

On pourrait démontrer en recourant aux données de la phonétique acoustique que :

Une grande cavité et un petit orifice renforcent les fréquences graves et déterminent le caractère sombre d’un son.

Passons à présent à l’observation de la flûte de pan. Le volume du résonateur est infiniment plus petit que celui des deux instruments précédents. En valeur relative, la dimension de l’orifice par rapport au volume du résonateur est importante : le timbre du son est clair (à ne pas confondre avec aigu).

On conviendra volontiers qu’

une petite cavité et un grand orifice renforcent les fréquences aiguës et déterminent le caractère clair d’un son.

Concrètement, il est donc possible d’assombrir le timbre d’un son en augmentant le volume du résonateur et en diminuant l’aperture et de l’éclaircir en effectuant l’opération inverse.

C’est le principe même sur lequel se fonde la correction par la prononciation nuancée des timbres vocaliques.

Appliquons donc ces données aux timbres des voyelles.

Dans le mécanisme de la formation des voyelles, les vibrations des cordes vocales au niveau du larynx sont modulées par nos résonateurs naturels, c’est-à-dire les cavités buccale, pharyngale et nasale auxquelles il est possible d’ajouter la cavité labiale, quatrième résonateur formé par l’arrondissement et la projection des lèvres vers l’avant. La modification du volume et de l’aperture des cavités leur font jouer le rôle de filtres naturels, qui vont renforcer certaines fréquences (graves ou aiguës) contenues dans un son complexe, c’est-à-dire déterminer le caractère plus ou moins sombre ou clair des timbres vocaliques.

En ce qui concerne les voyelles principalement, certains groupes d’harmoniques (multiples entiers du fondamental) se trouvent renforcés par ces cavités. Les zones de fréquences renforcées qui caractérisent le timbre des voyelles sont appelés formants. Acoustiquement, les voyelles orales sont caractérisées dans leur fonction distinctive par les fréquences de leurs deux premiers formants, principaux responsables de leur reconnaissance.

Puisque le diagnostic de l’erreur vocalique s’effectue en termes de trop clair ou trop sombre, examinons les facteurs d’assombrissement des timbres vocaliques en nous reportant à la représentation schématique des résonateurs supraglottiques du tableau 1.

On peut assombrir un timbre vocalique par :

- accroissement de l’aperture, c’est-à-dire par écartement vertical des mâchoires accompagné de l’abaissement progressif de la langue jusqu’à sa position de repos.

Pour la voyelle fermée /i/, la cavité antérieure buccale est petite : le son produit est clair. Au fur et à mesure que l’on descend sur l’axe d’aperture, les maxillaires inférieurs et supérieurs s’écartent, les cavités buccale et pharyngale communiquent davantage pour se confondre totalement dans la production de la voyelle ouverte /a/. La cavité de résonance augmente de plus en plus : le son devient de plus en plus sombre.

- labialisation : la projection des lèvres vers l’avant ajoute au résonateur buccal une cavité labiale supplémentaire. Cette augmentation de volume des cavités s’accompagne également d’une diminution de l’aperture par arrondissement des lèvres, ce qui entraîne l’assombrissement de la résonance buccale et par conséquent l’assombrissement du timbre des voyelles labialisées /y/, /ø/, /œ/ qui, de ce fait, sont plus sombres que les voyelles antérieures correspondantes /i/, /e/, /ɛ/.

- postériorisation (et labialisation) : le retrait de la langue vers l’arrière dans la production des voyelles vélaires /u/, /o/, /ɔ/ s’accompagne également de l’arrondissement des lèvres, ce qui entraîne la concomitance de deux facteurs d’assombrissement des timbres vocaliques : augmentation du volume du résonateur et diminution de l’aperture : les voyelles vélaires /u/, /o/, /ɔ/ sont plus sombres que les voyelle antérieurs labialisées /y/, /ø/, /œ/.

Contrairement aux voyelles antérieures, l’assombrissement des voyelles postérieures augmente en remontant l’axe d’aperture parce que l’augmentation du volume de la cavité par postériorisation s’accompagne d’une fermeture de la voyelle. /i/ est la voyelle la plus claire, /u/ la voyelle la plus sombre des voyelles orales.

- nasalisation : l’effet résonateur de la cavité nasale est fixe puisque sa forme et son volume sont invariables. Si le voile du palais est entièrement baissé, les conduits oral et nasal communiquent, l’air passe par les fosses nasales, la voyelle est dite nasalisée. L’adjonction du résonateur nasal augmente le volume des cavités et entraîne l’assombrissement de la résonance supraglottique. Les voyelles /ɛ̃/, /œ̃/, /ɑ̃/, /ɔ̃/ sont plus sombres que les voyelles orales correspondantes.

Pour ceux que ne rebute pas un bref approfondissement acoustique, nous avons reporté sur une échelle logarithmique la zone de fréquences du formant bas (grave F1) en ordonnée et celle du formant haut (aigu F2) en abscisse et y avons inscrit les voyelles orales comme autant de points ayant en abscisse le point d’articulation et en ordonnée l’aperture, obtenant ainsi un diagramme acoustique qui rend compte simultanément des critères physiologiques et acoustiques.

La convergence des données acoustiques et physiologiques permet de lire le diagramme obtenu aussi bien en termes de hauteur qu’en termes articulatoires.

Schéma vocalique du français (d’après Delattre,1965)

Fig.2. Représentation biformantique des voyelles orales françaises.

Le triangle vocalique tel qu’il résulte des méthodes d’analyse spectrographique de P. Delattre rend compte de la courbe de réponse des résonateurs supraglottiques. Le formant bas (F1) dépend essentiellement de la cavité pharyngale, le formant haut (F2) de la cavité buccale antérieure, limitée à l’avant par les dents et les lèvres, à l’arrière par la langue. La lecture du triangle peut se faire simultanément suivant des critères acoustiques et articulatoires, étant donné que l’effet résonateur des cavités naturelles dépend du facteur articulatoire d’augmentation de volume par aperture et postériorisation des points d’articulation, labialisation par projection des lèvres vers l’avant et nasalisation.

La courbe de réponse des cavités de résonance est en raison inverse de leur augmentation de volume et de leur diminution d’aperture. Comme nous l’avons déjà etabli, plus la cavité est petite et grand l’orifice, plus le timbre s’éclaircit et vice-versa.

Ainsi, dans le cas de la série des voyelles antérieures palatales /i/, /e/, /ɛ/, /a/, la langue se trouve d’abord en position haute, sur le palais dur, et détermine la présence de deux cavités, la cavité buccale, petite, avec grand orifice, responsable du formant aigu (F2), et la cavité pharyngale, plus grande, responsable du formant grave (F1). C’est pourquoi /i/ occupe une position à l’extrême gauche du trapèze vocalique.

Si l’on glisse sur l’axe d’aperture, en passant du /i/ au /e/, /ɛ/, /a/, les résonateurs augmentent progressivement de volume par aperture : la cavité buccale s’agrandit, le formant haut descend ; la cavité pharyngale diminue, de sorte que le formant bas s’élève. Pour /a/, la langue reste presque plate dans la bouche, dans une position de repos : la fusion progressive des deux résonateurs produit le rapprochement des deux formants. On est passé d’une structure formantique de type diffus (pour le /i/) à une structure de type compact (pour /a/ et /ɑ/ et surtout /ɔ/, /o/, /u/).

Si nous observons sur le graphique la position de la série des voyelles labialisées /y/, /ø/, /oe/ par rapport à la série non labialisée correspondante /i/, /e/, /ɛ/, nous constatons que seul le formant haut est descendu. Son abaissement, imputable à l’allongement de la cavité buccale par la projection des lèvres vers l’avant et la diminution de l’aperture, provoque l’assombrissement du timbre de ces voyelles. Le formant grave (F1), par contre, reste identique parce que la cavité pharyngale circonscrite à l’avant par la langue et à l’arrière par le palais n’a pas changé de volume. Son effet résonateur est donc demeuré identique.

Le passage des voyelles intermédiaires labialisées aux voyelles vélaires postérieures /u/, /o/, /ɔ/ provoque une baisse du formant 2, qu’il faut inscrire au compte de l’accroissement du volume par postériorisation déterminé par le retrait du dos de la langue vers le voile du palais et la labialisation par projection des lèvres vers l’avant.

La connaissance des caractéristiques acoustico-articulatoires des voyelles s’avère indispensable pour l’application des procédés particuliers de correction phonétique par la méthode verbo-tonale.

2. Le tableau des consonnes d’après la tension décroissante

Si les erreurs vocaliques résultent essentiellement d’une perception erronée de la coloration claire ou sombre du timbre de la voyelle, de nombreuses erreurs consonantiques, quant à elles, sont imputables à un excès de tension ou de relâchement, c’est-à-dire à une pression excessive ou insuffisante des organes phonatoires et du corps tout entier, ayant pour conséquence une plus ou moins grande concentration de l’énergie respiratoire précédant le mouvement d’expiration et une force plus ou moins grande de l’air expiré. Les productions caractérisées par un excès de tension ou de relâchement consonantique sont celles qui se rencontrent le plus souvent chez les étrangers apprenant le français. C’est le cas, entre autres, de la confusion par les arabophones de l’occlusive sourde /p/ avec la sonore correspondante /b/ ; de l’occlusive /b/ et de la constrictive /v/ avec un [b] relâché (ß) ainsi que de la constrictive sonore /z/ avec la sourde /s/ par les hispanophones ; de la constrictive sonore /ʒ/ avec la mi-occlusive correspondante [dʒ] par les italophones, etc.

Le praticien sera donc amené à diagnostiquer la plupart des erreurs consonantiques survenant sur l’axe vertical en termes de trop tendu ou trop relâché, ce qui postule l’acquisition du système consonantique du français suivant la tension décroissante.

Physiologiquement, une occlusive est produite par une fermeture totale du canal vocal au lieu d’articulation (lèvres, dents, palais), accompagnée d’une tenue respiratoire suivie d’une brusque expiration de l’air provenant du thorax.

Par contre, l’articulation d’une constrictive se caractérise non par une obstruction, mais par une constriction, c’est-à-dire un resserrement au niveau du lieu d’articulation de la consonne suivi d’une expiration continue de l’air émis par la soufflerie supraglottique. De toute évidence, une occlusive est plus tendue qu’une constrictive. On ne peut mieux comprendre le phénomène qu’en référence à la pression du jet d’eau s’échappant d’un tuyau d’arrosage au moment de la brusque ouverture de la vanne, et celle du même liquide qui s’écoulerait du même tuyau dont on aurait comprimé l’extrémité par un pincement des doigts.

On peut d’ores et déjà établir que la tension consonantique décroît dès que l’on passe de la catégorie des occlusives à celle des constrictives.

À l’intérieur de la même catégorie, la tension consonantique des occlusives ou des constrictives diminue au fur et à mesure que l’on passe des sourdes aux sonores, puis aux nasales.

En effet, la consonne sourde est produite sans vibrations des cordes vocales. Toute l’énergie respiratoire est donc mobilisée au seul profit de l’expiration de la consonne.

Dans l’articulation de la consonne voisée, une partie de l’énergie respiratoire est absorbée par les vibrations de la glotte, l’autre par l’émission de la consonne. Cette dispersion de l’air dans deux directions provoque le relâchement de la consonne voisée : les consonnes voisées, occlusives comme constrictives, sont donc plus relâchées que les sourdes correspondantes.

Dans l’articulation des nasales, l’air se disperse dans trois directions : une partie est absorbée par les vibrations des cordes vocales, une autre résonne dans les cavités nasales et s’échappe par le nez durant l’occlusion buccale, le reste de l’énergie respiratoire réservée à l’articulation de la consonne est dès lors plus faible.

Poursuivant l’analogie avec le tuyau d’arrosage, on conviendra que la pression du liquide s’échappant par un seul orifice est nécessairement plus forte que celle enregistrée à la sortie du même tuyau percé à un ou à deux endroits.

Retenons également que, le passage de l’air entre la langue et le palais devenant de moins en moins étroit, la tension décroît dès que l’on passe des constrictives aux semi-voyelles et aux voyelles : /ʒ/ est plus tendu que /j/, lui-même plus tendu que /i/ ; /v/ est plus tendu que /w/ (oué) et que /ɥ / (ué), eux-mêmes plus tendus que /u/ et /y/.

Dans le tableau des consonnes suivant la tension décroissante, nous avons également placé les affriquées [tʃ] et [dʒ],qui n’existent pas comme phonèmes dans le système fonctionnel du français, mais que l’on retrouve dans des séquences comme la banlieue de Chalons [bãljøtʃalɔ̃] ou un paquet de gitanes [pakɛdʒitan], souvent reproduites par les apprenants avec un excès de relâchement articulatoire et corporel proches respectivement de /ʃ / et de /ʒ/, tantôt comme des réalisations trop tendues de / ʃ / et /ʒ/ dans la prononciation de nombreux étrangers, comme les italophones, les anglophones ou les japonais, par exemple.

Dans les deux cas, il est important de savoir que les affriquées sont plus tendues que les constrictives et plus relâchées que les occlusives.

On retiendra également que le français se sert des géminées (consonnes doubles) dans la prononciation affective ; mais il existe également quelques oppositions phonématiques entre consonnes simples et géminées, comme dans frappa/frappe pas, la dent/là d(e)dans, tu mens/tu m(e) mens, courait/courrait, l’a-t-il eu/l’a-t-il lu. Les géminées sont assurément plus tendues que les consonnes simples, et on se servira souvent de la gémination comme procédé de correction pour renforcer la tension de consonnes simples, reproduites de manière trop relâchée.

Si la tension varie de manière parfois très sensible d’une catégorie à l’autre, chaque phonème consonantique possède à son tour un champ de dispersion à l’intérieur duquel évoluent des réalisations plus ou moins tendues ou plus ou moins relâchées. Cette grande variabilité dans les différents degrés de tension à l’intérieur d’un même phonème dépend d’un certain nombre de lois positionnelles ou combinatoires que nous analyserons plus loin de manière détaillée.

Tableau II : Tension décroissante

L’établissement du diagnostic de l’erreur d’après le critère de tension consistera à apprécier le degré de tension ou de relâchement de la production erronée par rapport au modèle, c’est-à-dire, concrètement, à situer l’erreur sur l’axe vertical de la tension décroissante pour ensuite présenter à l’audition de l’apprenant l’allophone qui présente les caractéristiques audio-phonatoires inverses par rapport au modèle erroné.

L’erreur consonantique peut également relever d’une confusion sur l’axe du point d’articulation. C’est, par exemple, le cas des wolof-phones, qui confondent les constrictives palatales avec les dentales ou des Vietnamiens, qui commettent l’erreur inverse. Ces erreurs par antériorisation ou postériorisation du point d’articulation échappent à la correction par la tension ; elles sont surtout du ressort de la phonétique combinatoire. Cependant, étant donné que le point d’articulation d’une consonne est éminemment variable, conditionné qu’il est par l’environnement syllabique, nous ne retiendrons pour le diagnostic et la correction des erreurs relevant d’une articulation trop antérieure ou trop postérieure que trois zones articulatoires distinctes : labiale, dentale et palatale.

Nous évoquerons plus tard des cas d’erreurs consonantiques qui se situent à la fois à la jonction de l’axe de la tension décroissante (le mode d’articulation) et le point d’articulation. La réalisation du /ʁ/ dorso-vélaire français comme un [r] roulé ou le [ɹ] post-alvéolaire à l’anglaise constitue un bel exemple d’articulation trop antérieure, associée respectivement à une hyper ou une hypotension, dont la correction requiert un travail sur les deux axes à la fois.

3. Les spécificités rythmico-mélodiques du français

Le diagnostic des erreurs rythmico-mélodiques est autrement plus complexe que celui qui concerne les erreurs segmentales.

Les phonèmes segmentaux tels que les voyelles ou les consonnes sont des unités “discrètes”, catégorisées, nettement délimitées en nombre. Il est relativement aisé, par exemple, d’identifier une erreur vocalique et de la situer sur l’axe clair-sombre du point d’articulation ou de l’aperture, ou d’évaluer le degré de tension ou de relâchement d’une consonne, même si, comme nous le verrons plus loin, l’étiologie approfondie de l’erreur requiert la maîtrise de certaines lois de phonétique positionnelle ou combinatoire.

Il en va autrement des faits rythmico-mélodiques. Le diagnostic des systèmes d’erreurs rythmico-mélodiques requiert l’évaluation d’un certain nombre d’entités étroitement imbriquées, unies dans leur comportement fonctionnel par une étroite parenté et entretenant des rapports de solidarité non moins étroits quant à leur substance concrète : accent, rythme et intonation.

Les erreurs d’accentuation peuvent relever à la fois d’une appréciation inappropriée des paramètres de hauteur, d’intensité ou de durée syllabique qui coexistent dans l’accent de groupe rythmique ; l’armature rythmique de l’énoncé peut être mise à mal par des surcroîts d’intensité sur les syllabes non accentuées ou désaccentuées, ce qui entraîne des modifications du mouvement intonatif ; celui-ci peut subir des altérations diverses en ses différentes composantes : le registre, les niveaux des contours, la direction des courbes (ascendante, descendante, en plateau), la forme des pentes : concave ou convexe), les glissandos intonatifs intrasyllabiques… Et l’énumération n’est qu’exemplative.

Aux prises avec un éventail aussi diversifié de réalisations prosodiques, le praticien dans sa classe se trouve fort démuni pour faire face à l’établissement des diagnostics et, partant, à la remédiation des erreurs de ses élèves : soit qu’il ne perçoive pas à l’oreille les dissemblances entre les productions des apprenants et le modèle, soit que, percevant des différences qu’il est, au demeurant, souvent capable de reproduire par imitation, il soit bien en peine de se représenter mentalement la configuration des patrons mélodiques, si l’on en juge d’après la grande diversité des visualisations dans l’espace fournies par des enseignants pour un même schéma mélodique type, lors des exercices de discrimination auditive. Imitation d’un patron intonatif et appréhension intellectuelle de la position relative de ses constituants sont deux opérations bien distinctes, sans compter le problème terminologique que pose la description ultérieure des phénomènes. Incidemment, ceci nous amène à nous interroger sur l’intérêt, comme outil de remédiation, de la visualisation graphique des schémas intonatifs sur écran ou sur tout autre support.

Quant aux ouvrages théoriques de phonétique “ interne ”, ils fournissent, certes, une contribution précieuse pour une compréhension toujours plus affinée de l’organisation et du fonctionnement des faits prosodiques à valeur dénotative ou expressive, mais s’avèrent souvent d’une consultation malaisée en raison du manque d’uniformisation des systèmes de notation des profils mélodiques, et d’un intérêt pédagogique relatif, en raison de la difficulté pour le praticien de dégager de la somme de données théoriques les notions de base directement transposables dans la classe de langue.

C’est surtout la confrontation du français avec des langues présentant des caractéristiques rythmico-mélodiques diamétralement opposées, comme l’anglais, qui fait apparaître les spécificités de son prosodisme et qui fournit les outils diagnostiques et thérapeutiques les plus utiles pour l’enseignant.

Dans une étude sur les voyelles diphtonguées de l’anglais et les voyelles pures du français, Delattre (1964, 64) signalait qu’ “ elles (l’anglais et le français) occupent dans le tableau des langues du monde, les deux extrêmes phonétiques. Rythme à alternation de temps fort et faible en anglais, égalité des syllabes successives en français. Ici accentuation syllabique par surcroît d’intensité, là par surcroît de durée. Ici prédominance de l’intonation descendante, là de l’intonation montante. Ici tendance à la syllabation fermée, là à la syllabation ouverte. Ici des consonnes aspirées, palatalisées, postérieures, là des consonnes inaspirées, dures, antérieures …”.

Voilà déjà brossé le tableau des spécificités articulatoires et rythmico-mélodiques du français.

À vrai dire, l’observation du français à partir d’autres points de comparaison aboutirait à des descriptions similaires, car, dans ce domaine, c’est plutôt lui qui se différencie des autres langues et qui présente un système prosodique déterminé dans une large mesure par un certain nombre de tendances fondamentales qui en conditionnent le fonctionnement et que des phonéticiens comme Delattre et Faure placent sous la houlette de ce qu’ils dénomment respectivement, pour désigner une réalité identique, les modes tendu et croissant (le mode antérieur ne concernant pas notre propos) et la croissance progressive de la dynamique phonatoire et articulatoire. Nous reprenons, pour illustrer ces tendances, quelques extraits de ces éminents devanciers, qui constituent une référence canonique pour le praticien verbo-tonaliste confronté au diagnostic et à la correction des erreurs rythmico-mélodiques (voir encadrés 1 et 2).

Accent, rythme et intonation

[…] La croissance progressive de la dynamique phonatoire et articulatoire se manifeste au niveau de la syllabe, dont elle assure, dans notre langue, la parfaite netteté et la parfaite individualisation. Même dans la conversation courante et rapide, les syllabes se succèdent avec une parfaite limpidité, sans neutralisation vocalique, chaque syllabe, même en position atone, conservant sa plénitude et n’étant jamais réduite, comme en anglais, par exemple, à cette production sonore vague et à peine différenciée à laquelle on a donné le nom de /ə/ neutre […] En français “ une syllabe en vaut une autre ”, tant par la plénitude de son timbre vocalique qu’elle conserve en toute position que par la régularité de son débit en position atone.

[…] La segmentation syllabique de la phrase française s’explique aussi par le caractère soutenu et progressif de la dynamique phonatoire. Cette segmentation est, on le sait, ouverte, la coupe syllabique se situant toutes les fois que la chose est possible, après la voyelle, la consonne intervocalique se rattachant toujours à la voyelle qui la suit, comme, par exemple, dans elle a mal à la main
/ɛ/la/ma/la/la/mɛ̃.

[…] Dynamique croissante là encore, la voix prenant solidement appui sur le ferme tremplin de la consonne et s’épanouissant progressivement jusqu’à l’achèvement de l’émission vocale qui demeure
nette et précise jusqu’à la fermeture ou à la constriction qui donne le départ pour un nouvel essor vocalique ; ce qui pourrait être grossièrement figuré dans le schéma :
< < < < < <
/ ɛ / la /ma / la / la / mɛ̃ /
Cette progressivité de la dynamique rythmique se retrouve encore au niveau du mot isolé.
Et le schéma devient encore :

contrairement à ce qui se passerait, par exemple, en anglais, où ces mots deviendraient

Même dynamique croissante au niveau du groupe rythmique, au bénéfice duquel on sait que le mot, une fois intégré, perd son accent propre.
[…] Les tons infléchis sont infiniment plus rares dans notre langue que les tons statiques.
Cette prédominance des tons statiques est un autre effet - et non des moindres - du caractère tendu de notre langue, où la chute mélodique du medium au grave est à peu près le seul ton infléchi que l’on rencontre couramment, limité presque toujours à la dernière syllabe d’un énoncé déclaratif, alors
que l’anglais, par exemple, dispose d’au moins cinq types différents de tons infléchis [… ]
Faure, G., Le Français dans le Monde,
1968, 57,15-19
Encadré n°1

Les modes phonétiques du français

Le mode tendu

3. Il faut aussi expliquer par la tension le rythme si particulier de la chaîne parlée française, rythme produit par la presque égalité des syllabes qui se succèdent. Pas une syllabe notablement plus forte que l’autre, à moins d’accent d’insistance. C’est là peut-être que le
français s’oppose le plus radicalement à l’anglais, qui base son rythme sur l’inégalité de ses syllabes et sur le groupement de syllabes faibles autour de syllabes fortes. Comparons les in-si-nua-tions d’ l’au-teur / sont in-to-lé-rables à the author’s insinuations / are intolerable

.

4. On sait que l’accent français porte sur la dernière syllabe. Mais pour faire ressortir cette syllabe, ce n’est pas à un excès de force (intensité) que le français fait appel, mais à un excès de durée. Pour dominer ainsi l’intensité au cours de la chaîne parlée et pour allonger la dernière syllabe indépendamment de l’intensité, il faut en français un état de tension remarquable.

5. La tension permet enfin de donner aux syllabes françaises une intonation relativement “ plate ”. Nous voulons dire par là que le ton sur lequel une voyelle est lancée se maintient sans grand changement jusqu’au bout. Pas de glissement vers le grave ou l’aigu comparable à ceux de l’anglais. En français les écarts de tons se trouvent entre les voyelles plutôt que pendant les voyelles.

Le mode croissant

[…] Parler sur le mode croissant signifie que voyelles, consonnes, syllabes (et l’on pourrait même appliquer le terme à des groupes de syllabes) s’articulent dans un effort soutenu – un effort qui ne se déclare pas dans une syllabe, au début de la voyelle pour se relâcher aussitôt, mais qui commence sans brusquerie, augmente fermement et se maintient jusqu’au bout de la voyelle. Après l’ouverture buccale prolongée de la voyelle, le mouvement fermant qui suit est vif, il appartient plutôt à la transition syllabique (entre voyelle et consonne) qu’à la voyelle même. De la sorte, une consonne intervocalique tend fortement à se rattacher à la voyelle qui suit […] même si cette voyelle appartient à un autre mot. En parlant, un français ne ferait pas de différence entre too late et tool eight. Il les prononcerait tous deux comme too late. Demême il dirait a name pour an aim, a nice man pour an ice man. La transcription syllabique d’une phrase française telle que elle imite un autre accent serait donc : [ɛ-li-mi-tœ̃-no-tra-ksɑ̃].
C’est ce qu’on appelle la “ syllabation ouverte ” les syllabes se terminent sur la voyelle, c’est-à-dire la bouche ouverte.
Delattre, P., The French ReviewXXVII, 1,October,1953, 59-63.
Encadré n°2

On retiendra que, dans l’ensemble, le français maintient, pendant toute l’émission des groupes rythmiques, un effort articulatoire constant, lequel se manifeste

au niveau des habitudes rythmiques, par :

- un rythme isosyllabique. Toutes les syllabes non accentuées sont égales en durée et en intensité et sont toutes prononcées distinctement. Aucune mise en relief significative, en dehors de l’accent d’insistance à valeur expressive. En français, en gros, toutes les syllabes se valent ;

- une segmentation à syllabation ouverte. Les syllabes se terminent souvent par une voyelle et la consonne intervocalique a tendance à rejoindre la syllabe suivante, contrairement aux langues germaniques, dites à syllabation fermée, c’est-à-dire
se terminant par une consonne.

Ce type de segmentation renforce la stabilité syllabique et la netteté des timbres vocaliques sans jamais provoquer pour autant hachures ou ruptures intempestives du rythme, en dehors de certaines jonctures démarcatives à valeur impressive (du type : elle est absolument terrible), comparables à l’émission glottale de certaines langues. Toutes les syllabes s’enchaînent jusqu’à la fin du groupe rythmique, sans staccato.

Le respect de la syllabation ouverte est primordial pour la maîtrise, à la réception et à l’émission, des phénomènes si courants dans le langage spontané que sont les élisions et les enchaînements.

- une accentuation finale du groupe rythmique( oxitonique) : le groupe rythmique qui correspond à une unité de sens est porteur d’un accent final, appelé accent de groupe ou accent rythmique, à ne pas confondre avec l’accent d’insistance à valeur expressive, accent d’intensité qui tombe sur la première ou la deuxième syllabe du mot : Stupide ! Imbécile !

L’accent de groupe rythmique n’étant pas uniquement lié à l’intensité mais à la duréeDelattre, 1939), la mise en relief de la dernière syllabe ne diminue en rien la netteté articulatoire des voyelles non-accentuées.

Aux antipodes, le rythme de l’anglais repose sur l’alternance de temps forts et de temps faibles, c’est-à-dire qu’il organise les syllabes non-accentuées autour de noyaux d’intensité qui mobilisent sur eux l’énergie respiratoire, ce qui provoque un phénomène de relâchement et de glissement vers le centre du trapèze vocalique, siège du /ə/caduc.

au niveau deshabitudes intonatives, par :

-  une mélodie relativement plate, qui caractérise généralement les syllabes inaccentuées d’un groupe rythmique, accompagnée d’une montée ou d’une descente sur la syllabe accentuée. Le changement mélodique s’effectue de façon très progressive, sans écarts notables d’une syllabe à l’autre, avec cependant un détachement mélodique sur la dernière syllabe du groupe rythmique ;

-  une intonation syllabique stable pour les voyelles inaccentuées. Chaque syllabe prise séparément est produite sur une note soutenue. “ Le caractère tendu de notre phonétisme entraîne sur le plan intonatif une prédominance marquée des tons statiques sur les tons infléchis, tout au moins en ce qui concerne les syllabes atones. Le niveau tonal de chacune d’elle est atteint dès le début de l’émission syllabique et il se maintient dans les limites de fluctuations étroites, généralement non perçues, jusqu’à son terme. Les écarts de tons se situent entre les syllabes, dont chacune constitue un bref palier d’acuité d’où l’on saute au palier suivant ” (Faure, 1971, 11).

Donc, pas de glissement intonatif à l’intérieur de la syllabe ou en tout cas rien de comparable à l’abondance des fluctuations tonales de l’anglais, où la voix peut monter puis redescendre nettement (ton circonflexe de type oh !) ou, inversement, descendre puis remonter au cours de l’émission d’une tonique du type oh ! Signalons au passage que ce genre de modulation bi-directionnelle, voire tri-directionnelle, constitue un moule intonatif particulièrement favorable à la production de phonèmes relâchés, comme les diphtongues ou les triphtongues, pour la correction phonétique des francophones apprenant l’anglais ;

- un registre intonatif moyen, sorte de portée mélodique utilisant quatre niveaux établis arbitrairement, et à l’intérieur de laquelle évoluent les dix intonations de base du français (Delattre, 1966, 1-14), dont la continuité mineure (2-3), la continuité majeure (2-4),la finalité du typeil pleut (2-1), l’interrogation sans marque lexicale (2-4), avec marque lexicale, du type “ Qui est venu ? ” (4-3-2), le commandement (4-1), etc.

Le niveau 2 est celui où se situent en général les syllabes inaccentuées des phrases énonciatives (125 Hz). C’est la hauteur à laquelle on rit naturellement et où se place également le euh d’hésitation. Le niveau 4 se situe généralement à l’octave supérieure du 2 (+ 250 Hz). Pour plus de détails nous renvoyons le lecteur aux articles de Delattre (1966, 1967 et 1969). À ces quatre niveaux traditionnellement admis, Léon en ajoute un cinquième pour rendre compte des phénomènes expressifs de l’exclamation, du typeOn s’fout de nous !! (2-5). Ce dernier niveau rend compte de l’existence d’une zone d’expressivité intonative située dans la région suraiguë (au-delà de 250 Hz). Si le contour intonatif passe par le niveau 5, n’importe quel énoncé référentiel peut devenir exclamatif.

À l’intérieur de ce cadre évoluent des montées et des descentes en pentes douces et régulières qui couvrent l’ensemble de la gamme. Les variations entre les points extrêmes du contour mélodique peuvent être fortes, mais aucune différence tonale notoire n’est observable entre les syllabes, comme c’est le cas pour l’italien ou l’arabe, par exemple ; pas de brusque rupture tonale ou de montée en espalier comme en allemand, ni de forme en S renversé comme en anglais (pour plus de détails, voir Delattre, 1965, 23-28).

Cette absence de variations de hauteur marquées entre les syllabes et de modulations intonatives à l’intérieur de la syllabe d’une part, la régularité rythmique et le caractère récurrent de l’accent de groupe d’autre part, peuvent laisser chez l’étranger l’impression d’une langue peu “ chantante ” (the voiceless speech), contrairement à l’italien, qui jouit d’une réputation de langue musicale.

Ce que nous avons décrit vaut surtout pour la prosodie à valeur dénotative, non expressive. Néanmoins, même dans le langage spontané et affectif, ces tendances fondamentales restent toujours présentes, comme une sorte de structure minimale sous-jacente spécifique de la phrase française.

Ainsi, l’accent d’insistance à valeur expressive, avec ses paramètres de hauteur, de durée et d’intensité, n’affecte ni l’accent final du groupe ni les syllabes inaccentuées, qui gardent toute leur netteté. De même, selon les recherches de Léon (1971, 46), une marque expressive ne modifie que partiellement, aux points d’information, la courbe référentielle. C’est ainsi qu’à une courbe référentielle d’interrogation peut s’ajouter une certaine expressivité (la surprise, par exemple) sur la voyelle finale de la courbe, sans pour autant détruire le message linguistique de l’interrogation. Quant aux courbes intonatives modifiées radicalement sous le coup d’une forte émotion (la colère, par exemple) et pouvant aller, dans une expression violente, jusqu’à oblitérer totalement le message référentiel, on doute qu’elles puissent être raisonnablement proposées comme modèles pour sensibiliser les débutants aux caractéristiques rythmico-mélodiques du français !

Les caractéristiques rythmico-mélodiques que nous venons de décrire constituent la base nécessaire au praticien verbo-tonaliste pour effectuer non seulement le diagnostic et la correction d’erreurs suprasegmentales, mais aussi pour établir l’étiologie des systèmes d’erreurs phonétiques.

En effet, les tendances fondamentales du phonétisme d’une langue donnée influencent fortement les structures prosodiques, qui, à leur tour, conditionnent la réalisation des structures phonétiques. Comme nous le verrons, l’actualisation des caractéristiques phoniques d’une langue passe par la réalisation globale des éléments
suprasegmentaux.

L’étroite relation entre les habitudes rythmico-mélodiques et la netteté des timbres vocaliques constitue une première clé herméneutique du plus haut intérêt, car elle ramène tous les phénomènes de réduction vocalique, d’allongement et de diphtongaison excessifs des anglophones apprenant le français à une infraction à la structure rythmico-mélodique de cette langue et en dernière analyse aux habitudes articulatoires fondées sur le mode tendu et croissant.

4. Lois positionnelles et combinatoires

Trois autres clés fournissent l’explication de bon nombre d’erreurs vocaliques et consonantiques :

- la position de la voyelle dans la courbe intonative. Ainsi un timbre vocalique est perçu plus clair et plus tendu au sommet d’une courbe intonative ascendante et plus sombre et plus relâché en fin de courbe intonative descendante. Cette loi permet d’expliquer qu’un même phonème tel que /y/ par exemple, soit perçu et reproduit par un même sujet tantôt trop clair comme [i] tantôt trop sombre comme [u] ;

- la distribution de l’énergie respiratoire dans la chaîne parlée. Ainsi, une consonne est perçue plus tendue en début d’expiration, lorsque la rétention d’énergie respiratoire est maximale (à l’initiale d’un mot, d’un groupe rythmique, d’une phrase) et plus relâchée en fin d’expiration (en fin de mot, de groupe rythmique, de phrase). Par exemple, dans l’énoncé "Jeanne, passe-moi une orange", le premier [ʒ] sera perçu et reproduit plus tendu que le second.
Une consonne est perçue plus tendue en syllabe accentuée (sous l’accent d’insistance ou l’accent de groupe) qu’en syllabe inaccentuée.

- l’environnement syllabique conditionne la perception et la reproduction des caractéristiques acoustico-articulatoires des voyelles et des consonnes (antériorisation, postériorisation, labialisation, aperture, éclaircissement, assombrissement) et explique bien des cas d’assimilation régressive ou progressive (voisement, dévoisement, tension, relâchement, etc.).

Ainsi

- les voyelles /i, e, ɛ / entraînent l’antériorisation du point d’articulation des consonnes ;
- les voyelles vélaires /u, o, ɔ /, la postériorisation du point d’articulation des consonnes ;
- les consonnes labiales /b, ʒ / favorisent la labialisation des voyelles et vice-versa.
- les voyelles fermées ou la semi-voyelle /j/ contribuent à la fermeture des sons vocaliques, les voyelles ouvertes à l’aperture des sons vocaliques ;
- les consonnes nasales et les bilabiales sonores contribuent à assombrir les timbres vocaliques ; les consonnes alvéolaires, surtout les constrictives, à les éclaircir ;
- une consonne sonore agit par assimilation régressive sur le voisement, donc sur le relâchement de la consonne sourde qui précède : (cf. anecdote, prononcé [anɛgdɔt], iceberg prononcé [izbɛʁg] ;
- inversement, une consonne sourde agit par assimilation régressive sur l’assourdissement, donc sur la tension, de la consonne sonore qui précède (ex : absent prononcé [apsɑ̃], médecine prononcé [metsin] ;
- une consonne est perçue plus tendue si elle est précédée d’une autre consonne tendue (ex : le [t] de stupide est plus tendu que le [t] de tu ; le [ʒ] est plus tendu dans bonnes gens [bɔnʒɑ̃] que dans bonjour[bɔ̃ʒuʁ].

On imagine d’emblée les applications que la méthode verbo-tonale peut faire de ces lois positionnelles et combinatoires à des fins de remédiation .

Les règles mineures que nous développerons par la suite peuvent être facilement extrapolées par le praticien dans sa classe, car elles ne constituent que des variantes de ces quelques lois fondamentales.

L’explication des erreurs résiduelles, qui ne dépendent ni d’une infraction aux habitudes articulatoires et rythmico-mélodiques du français, ni de l’influence de la position des éléments segmentaux dans la courbe intonative, ni de la distribution de l’énergie respiratoire dans la chaîne parlée, ni de l’environnement syllabique, doit, en dernière analyse, être recherchée dans les caractéristiques distributionnelles du système phonologique de l’apprenant ou bien dans des blocages psychologiques collectifs ou individuels provoqués par les cribles autres que le phonologique et le rythmico-mélodique, auxquels nous avons consacré de longs développements au chapitre 2.


(3)Par souci de simplification, nous n’avons pas jugé nécessaire d’utiliser les nombreux signes diacritiques de l’alphabet phonétique international (API) pour rendre compte des différentes variations d’ordre phonétique des timbres vocaliques ou consonantiques tels que changement d’aperture vocalique, durée, centralisation, palatalisation, assimilation consonantique par voisement ou dévoisement, etc. Les réalisations erronées sont simplement transcrites entre [ ] et illustrées par des exemples sonores.

(4) Dans ce tableau figurent également, entre crochets, des réalisations comme la constrictive vélaire sourde [X] (esp. : Juan ; all. : ach) ou la constrictive vélaire sonore [γ] (esp. : agua) que l’on retrouve fréquemment dans les productions françaises de certaines communautés d’apprenants. Ainsi, par exemple, l’hispanophone ou le Vietnamien qui prononce le [g] de aigu comme [γ] produit une réalisation trop relâchée de /g/.

Enregistrer au format PDF Article en PDF