22/05/2026
Parler une langue, ce n’est pas seulement choisir des mots ou appliquer des règles grammaticales. C’est aussi se situer par rapport à des normes, des attentes et des représentations sociales de ce qui est perçu comme « correct », « élégant » ou « légitime ».
William Labov a notamment montré que certains groupes sociaux sont particulièrement sensibles aux normes de prestige. Cette insécurité peut conduire à une forte variation stylistique, à un effort conscient de correction, ou encore à des phénomènes d’hypercorrection.
Il y a hypercorrection lorsque, en cherchant à produire une forme perçue comme plus correcte ou plus prestigieuse, les locuteurs·rices adoptent un usage qui ne correspond pas exactement à la norme visée.
On observe aussi ce phénomène dans les emprunts linguistiques. En anglais, par exemple, certains mots d’origine espagnole comme empanada ou habanero sont parfois prononcés avec un son [nj], associé au ñ espagnol, alors que ce son n’est pas présent dans les mots espagnols d’origine. La prononciation produite reflète alors moins la forme exacte de la langue source qu’une représentation sociale de ce qui paraît « espagnol ».
L’insécurité linguistique rappelle ainsi que les usages ne relèvent pas seulement de règles abstraites, mais aussi de rapports aux normes, aux situations de parole et aux représentations sociales attachées aux langues. Même lorsqu’elle prend la forme d’une simple correction, elle révèle la manière dont les locuteur·rice·s interprètent les attentes linguistiques de leur environnement.
Pour en savoir plus :
BOYER, Henri. Introduction à la sociolinguistique-2e éd. Dunod, 2017.
Meyerhoff, M. (2018). Introducing sociolinguistics. Routledge.
https://dictionnaire.lerobert.com/dis-moi-robert/raconte-moi-robert/la-langue-en-debat/l-insecurite-linguistique.html
Post préparé par Noemi Blandino
06/05/2026
Certaines langues sont connues des linguistes pour une propriété qui semble, au premier abord, presque paradoxale. C’est le cas du rotokas, une langue papoue parlée dans la région centrale de Bougainville, en Papouasie-Nouvelle-Guinée, notamment célèbre pour son inventaire phonémique extrêmement réduit. Dans son dialecte central, il ne compterait en fait que onze phonèmes segmentaux : cinq voyelles et six consonnes.
L’intérêt du rotokas ne tient pas seulement à la petitesse de cet inventaire. Il tient aussi au fait que cette petitesse n’est pas également partagée par tous les dialectes. Le dialecte aita, par exemple, possède un inventaire légèrement plus étendu : quatorze phonèmes segmentaux, dont cinq voyelles et neuf consonnes.
Cette différence suggère que le rotokas n’est pas simplement une langue « naturellement minimale », mais le résultat d’une évolution phonologique particulière : selon Robinson, son petit inventaire pourrait s’expliquer par la disparition d’une opposition entre consonnes voisées et consonnes nasales.
Autrement dit, ce qui frappe dans le rotokas n’est pas seulement qu’une langue puisse fonctionner avec très peu de phonèmes. C’est aussi que cette propriété, souvent présentée comme une curiosité typologique, devient plus intéressante encore lorsqu’on la replace dans une histoire linguistique et dialectale précise.
Le cas du rotokas rappelle ainsi qu’une langue ne se réduit jamais à une liste de sons. Même lorsqu’un inventaire paraît exceptionnellement simple, il peut être le résultat d’une trajectoire complexe, faite de variations dialectales, de changements phonologiques et de comparaisons entre formes apparentées.
Pour en savoir plus :
Robinson, S. (2006). The phoneme inventory of the Aita dialect of Rotokas. Oceanic Linguistics, 45(1), 206–209.
Robinson, S. (2011). Split Intransitivity in Rotokas, a Papuan Language of Bougainville. PhD dissertation, Radboud University Nijmegen.
Post préparé par Noemi Blandino
15/04/2026
Tout le monde est amené à mentir
Soit la situation suivante : vous rencontrez une connaissance dans la rue et vous la saluez. Dans la grande majeure partie des cas, ces salutations seront suivies de la question « ça va ?», à laquelle vous répondez spontanément un simple « ça va et toi ? ». Problème : vous n’allez en réalité pas bien et souffrez de terribles maux de tête. En d’autres termes, vous mentez sur votre état de santé effectif.
Comment expliquer ce choix ? En laissant de côté pour l’instant l’hypothèse intuitive – et toute théorique – que cette séquence d’interaction relève d’un échange phatique, vide de sens, ou d’un rituel social obligatoire, on peut remarquer que le choix de répondre d’une telle manière a des conséquences importantes pour la suite de votre interaction. Si vous partagiez votre état de santé effectif – en l’occurrence que vous n’allez pas bien – votre interlocuteur serait amené à vous questionner à ce propos et vous-même à justifier votre réponse. Or, il est non seulement certain que vous ne souhaitiez pas engager une telle discussion sur votre état de santé avec certaines personnes (des personnes que vous connaissez mal, par exemple), mais il est également possible que, dans certaines situations (lorsque vous souffrez de maux de tête, par exemple), vous ne souhaitiez pas poursuivre la conversation au-delà des salutations initiales. Dans la mesure où il n’est donc pas possible d’exclure que vous vous trouviez dans une telle situation, l’on peut considérer que tout le monde est amené, d’une manière ou d’une autre, à « mentir ».
Ces considérations au sujet de la manière dont nous accomplissons ordinairement des salutations – et dont nous sommes amenés à « mentir » dans certaines circonstances – permettent de rendre compte d’un fait essentiel de l’organisation du langage : loin d’être régis par une nécessaire adéquation à la réalité du monde, à nos états psychologiques ou à des rites sociaux imposés, nos pratiques du langage sont le produit d’une analyse fine des situations sociales dans lesquelles nous nous trouvons et des conséquences séquentielles et interactionnelles que celles-ci rendent possible, ou non.
Pour en savoir plus :
Sacks, H. (1975). Everyone has to lie. In B. G. Blount & M. Sanches (Éds.), Sociocultural Dimensions of Language Use. Academic Press, p. 57-80.
Post préparé par Guillaume Stern
20/03/2026
Plusieurs langues de la Mésopotamie ancienne sont bien connues du grand public et bien comprises par les chercheur·euse·s. À côté de langues telles que le sumérien et le babylonien, il en existe d'autres moins connues, mais tout aussi fascinantes par leurs caractéristiques linguistiques. L'une d'entre elles est l'urartéen, parlé dans le royaume d'Urartu, dans l'est de l'Anatolie. À son apogée, ce royaume s'étendait du nord de la Syrie à l'Arménie et à l'ouest de l'Iran, avec pour centre le lac de Van. Pour les lecteurs modernes, l'Urartu est peut-être mieux connu sous le nom de royaume d'Ararat, où l'arche de Noé a accosté selon le Livre de la Genèse.
La plupart de nos données (environ 500 inscriptions trouvées en Turquie, en Iran et en Arménie) proviennent de textes commémorant des projets de construction royaux ou des campagnes militaires, datant du IXe au VIIe siècle avant notre ère. Pour les linguistes, l'urartéen est surtout connu pour trois particularités : de longs débats concernant sa relation avec l'arménien, dans lequel on trouve un très petit nombre d'emprunts (par exemple, arm. san « bouilloire » < urart. šani-) ; son statut encore plus controversé en tant que langue historique du Caucase du Nord-Est, selon une proposition d'Igor Diakonoff et Sergei Starostin, une famille à laquelle appartiennent des langues telles que le tchétchène, l'avar et le dargi. Plus particulièrement, l'urartéen est une langue agglutinante avec des formes verbales et nominales assez complexes, en partie à cause d'un phénomène appelé Suffixaufnahme (allemand pour « prise de suffixes »), case stacking ou cas double, où certains noms reçoivent deux marqueurs de cas. Afin d'exprimer la phrase la grandeur de Ḫaldi (l'un des principaux dieux urartéens), par exemple, ils devaient écrire ḫaldi-i-ni-ni alsuiši-ni : le génitif « de » est exprimé par -i-, mais les deux mots sont également marqués pour l'instrumental avec un -ni final ; la fonction du premier -ni- n'est pas tout à fait claire, car il apparaît à la fois entre deux marqueurs de cas et parfois comme article défini. Ce phénomène de Suffixaufnahme est typologiquement intéressant, car il se produit principalement dans la Mésopotamie historique et le Caucase, ainsi que dans certaines langues d'Australie.
Pour en savoir plus :
Sur l’urartéen : https://oracc.museum.upenn.edu/ecut/index.html
Sur le phénomène de Suffixaufnahme:https://unipub.uni-graz.at/download/pdf/8827996.pdf
Post préparé par Robin Meyer
06/03/2026
Vous organisez votre week-end et lancez avec enthousiasme à votre collègue : « nous allons au cinéma ce soir ! ». Votre collègue sourit et répond « super, à quelle heure on se rejoint ? ». Zut, vous vouliez dire « mes amis et moi », vous ne comptiez pas l'inviter elle ! Vous êtes victime de la langue française, qui, comme la majorité des langues indo-européennes, ne permet pas de trancher, par défaut, entre qui est inclus et qui est exclu dans ses pronoms pluriels.
Contrairement au français, certaines langues distinguent très clairement le « nous » inclusif (qui inclut l'interlocutrice ou l'interlocuteur) du « nous » exclusif (qui l'exclut). Le tamoul ou le fidjien font cette différence, mais le rembarrnga, langue indigène parlée en Australie, pousse la subtilité chirurgicale encore plus loin. En rembarrnga, si vous utilisez le pronom « yarrbbarrah », vous signifiez exactement : "je fais partie de ce groupe, quelqu'un d'autre en fait partie, mais tu n'en fais pas partie". Impossible pour l'interlocutrice ou l'interlocuteur de s'inviter par erreur au cinéma. Alors que si vous utilisez "yukku", vous impliquez que vous associez seulement votre interlocutrice ou votre interlocuteur, sans possibilité pour une tierce personne de s'incruster. Et si vous voulez vraiment signifier que la paire, ce "nous" inclusif que vous constituez avec votre interlocutrice ou interlocuteur est précieuse à vos yeux, qu'elle et vous, c'est quelque chose quand même, alors utilisez "ngakorru" plutôt qu'un simple "yukku".
La richesse linguistique dont témoignent des langues indigènes dont les locutrices et locuteurs ont été persécutés, comme c'est le cas pour le rembarrnga, doit nous rappeler que chaque langue constitue un bijou qui peut présenter des raffinements insoupçonnés aux yeux et aux oreilles des autres, et que les suprématies industrielles, technologiques ou militaires ne présentent aucun corrélât linguistique.
Pour aller plus loin :
Dixon, R. M. The Languages of Australia. Cambridge Language Surveys, 1980.
Cysouw, Michael. « Inclusive/Exclusive Distinction in Verbal Inflection (v2020.4) ». In The World Atlas of Language Structures Online, édité par Matthew S. Dryer et Martin Haspelmath. 2013. https://wals.info/chapter/40
Post préparé par Jérôme Jacquin. Image générée par Gemini.
20/02/2026
Lorsque l’on évoque la linguistique de corpus, on pense spontanément à de vastes bases de données numériques. Pourtant, l’idée d’analyser la langue à partir de textes attestés est bien antérieure à l’ère informatique.
La Pierre de Rosette constitue un exemple souvent mentionné : un même texte gravé en égyptien ancien et en grec ancien. C’est précisément cette mise en parallèle qui a permis à Champollion de déchiffrer les hiéroglyphes en 1822. On pourrait y voir une forme embryonnaire de corpus, dans la mesure où un ensemble de données linguistiques a servi à résoudre un problème d’interprétation.
Cependant, il ne s’agissait pas d’un corpus au sens contemporain du terme. Ces textes n’avaient pas été réunis dans le cadre d’un projet scientifique explicite visant à représenter un genre discursif, un registre ou une variété de langue. Il manquait les éléments constitutifs d’un corpus moderne : une sélection raisonnée, des critères définis et une finalité analytique clairement formulée.
La véritable transformation s’opère avec le développement de l’informatique à partir des années 1960. L’outil informatique modifie en profondeur les pratiques de recherche : il devient possible de constituer, structurer et interroger de grandes quantités de données textuelles. Le corpus acquiert alors une forme électronique et peut être exploité au moyen d’outils spécialisés.
Mais comment définir précisément un corpus ?
On peut le concevoir comme un ensemble de textes rassemblés selon des principes méthodologiques explicites — qu’ils soient thématiques, documentaires ou représentatifs — en vue d’une analyse linguistique. Pour John Sinclair, pionnier de la linguistique de corpus, il s’agit d’une collection de données sélectionnées et organisées selon des critères explicites afin de constituer un échantillon du langage.
Ainsi, un corpus ne saurait être réduit à une simple accumulation de textes. Il relève d’une construction scientifique : les objectifs sont définis en amont, les critères de sélection sont explicités et les données sont documentées.
Recourir à un corpus, c’est donc privilégier l’observation des usages attestés plutôt que l’intuition. La réflexion linguistique s’ancre alors dans les pratiques effectives de la langue — et c’est en cela que réside l’apport fondamental de la linguistique de corpus.
Pour en savoir plus :
https://www.fun-mooc.fr/fr/cours/introduction-a-la-linguistique-de-corpus/
O'Keeffe, A., & McCarthy, M. (Eds.). (2010). The Routledge handbook of corpus linguistics (Vol. 10). London: Routledge.
Post préparé par Noemi Blandino
05/02/2026
Est-ce que vous saviez qu’à partir du dernier trimestre de grossesse, les fœtus sont capables de différencier leur langue maternelle d’une langue inconnue ?
À mesure qu’ils approchent du terme, leur système auditif devient suffisamment affiné pour discriminer de subtiles variations acoustiques – l’intensité, la hauteur ou encore le spectre des sons – leur permettant de percevoir les contours mélodiques d’une langue.
Des recherches menées auprès de nouveau-nés ayant entendu in utero deux langues appartenant à des classes rythmiques différentes montrent que cette exposition prénatale au bilinguisme influence leurs préférences linguistiques dès les premiers jours de vie. Les travaux de Byers-Heinlein, Burns et Werker (2010) l’illustrent clairement : ils ont comparé les préférences linguistiques de 15 nouveau-nés issus d’un milieu monolingue anglophone et de 15 nouveau-nés nés de mères bilingues anglais–tagalog.
Les bébés monolingues manifestaient une forte préférence pour l’anglais. En revanche, les nourrissons de mères bilingues anglais–tagalog montraient un intérêt équivalent pour le tagalog et pour l’anglais, ce qui reflète fidèlement leur exposition prénatale aux deux langues et la manière dont celle-ci peut influencer leurs premières préférences linguistiques.
Pour en savoir plus :
Byers-Heinlein, K., Burns, T. C., & Werker, J. F. (2010). The roots of bilingualism in newborns. Psychological science, 21(3), 343-348.
Serratrice, L. (2018). Becoming bilingual in early childhood. In A. De Houwer & L. Ortega (Eds.), The Cambridge Handbook of Bilingualism (pp. 13–35). Cambridge, UK: Cambridge University Press.
Post préparé par Noemi Blandino
09/01/2026
🗣️ Début 2026, et avec plus de 1000 abonnés dans notre communauté, nous vous souhaitons une année pleine de curiosité linguistique ! ✨🎉
12/12/2025
La fatigue se fait sentir, vous lâchez un « non mais arrête de mal me répondre ». On vous répond « je fais ce que je veux d’abord » ou « Marie le fait tout le temps ». Vous soupirez, vous vous dites que c’est mal parti? Rassurez-vous, en fait vous avez gagné une manche grâce à votre usage subtil de la présupposition.
« Arrêter » présuppose en effet que ce dont il est question a lieu, se déroule. Il n’est pas possible d’arrêter quelque chose qui n’a pas été commencé. C’est un mécanisme automatique de décodage linguistique, ce qui en fait une ressource extrêmement puissante. En effet ce n’est pas en mettant en cause l’énoncé que l’on casse le contenu présupposé. Au contraire, on le renforce. Et ainsi, lorsque quelqu’un répond « c’est pas si grave » ou « je fais ce que je veux » à l’énoncé « arrête de mal me répondre », la personne contribue à entériner le présupposé que la personne vous répond mal. La seule manière, coûteuse et exigeant une certaine veille dans le feu de l’action, pour contester un présupposé, c’est de produire un énoncé niant le présupposé en question. Quelque chose comme « mais j’ai jamais commencé à mal te répondre en fait ».
Avec l’analyse de la présupposition (chez Oswald Ducrot) ou des implicatures conventionnelles (chez Paul Grice), la linguistique s’est donnée les moyens théoriques et méthodologiques d’analyser une part importante de l’implicite, du non-dit, en allant au delà du contenu littéral des énoncés. Et cela de manière non pas sauvage et intuitive, mais avec un outillage dont il est bien utile de disposer dans nos vies privées, professionnelles, sociales et politiques.
Pour aller plus loin :
Biglari A. & M. Bonhomme, La Présupposition entre théorisation et mise en discours, Paris : Classiques Garnier
Post préparé par Jérôme Jacquin. Image générée par Gemini.
01/12/2025
Écrire « étudiants » ou « étudiants et étudiantes » ?
L’écriture inclusive fait aujourd’hui l’objet de vifs débats en linguistique. En visant une égalité des représentations entre femmes et hommes, elle interroge l’efficacité des différentes alternatives au masculin dit générique et la manière dont ces formes représentent les différents genres de la façon la plus équilibrée et la plus neutre possible.
Le 4 décembre 2025, Benjamin Storme, professeur à l’Université de Leiden, présentera les résultats d’études expérimentales comparant diverses stratégies d’écriture inclusive en français.
Voici les détails pour ne pas manquer cette conférence :
« Toutes les écritures inclusives ne se valent pas : du sens lexical au sens social »
📅 4 décembre 2025, 14h15
📍 Anthropole 4078, Université de Lausanne