<p>Article</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif"><b>Introduction&nbsp; </b></span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="text-indent:36pt; margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Dans cet article le but est de proposer un &eacute;tat de l&rsquo;art de la variation en sciences du langage dans la perspective du TAL. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Si la d&eacute;finition de ce qu&rsquo;est la norme pose d&eacute;j&agrave; nombre de probl&egrave;mes en linguistique (Siouffi &amp; Steuckardt, 2007), dans le domaine du TAL le d&eacute;fi d&rsquo;&eacute;tablir un contour pr&eacute;cis de norme et &ndash; par la suite &ndash; de ce qui est &agrave; consid&eacute;rer comme variation autour de ladite norme assume des formes diff&eacute;rentes qui s&rsquo;expriment sur d&rsquo;autres niveaux d&rsquo;analyse.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Dans cet article il n&rsquo;est pas sujet de retracer l&rsquo;histoire des d&eacute;finitions du concept de &laquo;&nbsp;norme&nbsp;&raquo; en linguistique, toutefois il est pertinent de noter comment les d&eacute;bats autour de la norme (ainsi qu&rsquo;autour de ses variations) pivotent souvent autour du noyau &eacute;pist&eacute;mologique qui suit&nbsp;:</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">&laquo;&nbsp;Devra-t-on d&eacute;crire la langue &agrave; partir de faits linguistiques observables, c&#39;est-&agrave;-dire les performances diverses et vari&eacute;es auxquelles on est expos&eacute;s dans la vie quotidienne ou bien penser la langue &agrave; partir de<br /> comp&eacute;tences id&eacute;alis&eacute;es ?&nbsp;&raquo; (Barge, 2009)</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Que l&rsquo;on veuille rendre compte des diversit&eacute;s dialectales, diachroniques, sociolinguistiques ou pas ; que l&rsquo;on milite en faveur d&rsquo;un usage pr&eacute;scriptif et &eacute;valuatif de la langue ou bien que l&rsquo;on accepte tout type de variation linguistique - pourvu qu&rsquo;elle puisse toujours garantir la transmission du sens ainsi que sa compr&eacute;hension mutuelle sans d&eacute;faillance - la richesse de la langue fran&ccedil;aise pose d&eacute;j&agrave; une quantit&eacute; de &laquo;&nbsp;variations norm&eacute;es&nbsp;&raquo; non n&eacute;gligeables. Par cette expression l&rsquo;auteur de cet article voudrait d&eacute;finir tout ph&eacute;nom&egrave;ne linguistique qui &ndash; &agrave; l&rsquo;oral comme dans sa forme &eacute;crite &ndash; ne suit pas la r&egrave;gle, c&rsquo;est-&agrave;-dire ce qui est usuellement pr&eacute;vu pour le m&ecirc;me &eacute;l&eacute;ment dans le m&ecirc;me contexte. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Parmi ces &laquo;&nbsp;variations norm&eacute;es&nbsp;&raquo; &agrave; l&rsquo;oral on trouve entre autres le hiatus, les diff&eacute;rentes formes de liaisons, les verbes irr&eacute;guliers. Alors qu&rsquo;&agrave; l&rsquo;&eacute;crit ces variations se multiplient&nbsp;: l&rsquo;orthographe du fran&ccedil;ais &eacute;tant opaque, le nombre d&rsquo;homographes/homophones ou bien d&rsquo;homophones non homographes (ou bien encore son inverse) ne sont que la pointe de l&rsquo;iceberg d&rsquo;une multitude de &laquo;&nbsp;variations norm&eacute;es&nbsp;&raquo;.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Mais alors, qu&rsquo;est-ce qu&rsquo;est la norme&nbsp;?&nbsp; Est-ce qu&rsquo;il s&rsquo;agit exclusivement d&rsquo;un usage non conforme qui diff&egrave;re en fonction du dialecte, du temps, de la classe sociale ou de l&rsquo;etnie&nbsp;? Ou peut-on consid&eacute;rer la variation comme toute deviation d&rsquo;un ensemble de crit&egrave;res logiques sur lesquels une langue naturelle devrait se baser&nbsp;? </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Effectivement, si l&rsquo;on adopte la d&eacute;finition suivante de norme &laquo; Tout ce qui est d&#39;usage commun et courant dans une communaut&eacute; linguistique ; la norme correspond alors &agrave; l&#39;institution sociale que constitue la langue. &raquo; (Dubois et al., 1973, p 342) on pourrait r&eacute;pondre &agrave; la premi&egrave;re question pos&eacute;e dans le paragraphe ci-dessus. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">La r&eacute;ponse &agrave; la deuxi&egrave;me question est bien plus difficile, et la formulation m&ecirc;me de cette question ouvre la voie &agrave; plusieurs niveaux d&rsquo;analyse. Tout d&rsquo;abord, l&rsquo;orthographe du fran&ccedil;ais est tout sauf logique (Hoedt &amp; Piron, 2016)&nbsp;: par exemple, si l&rsquo;on prend un nouveau mot qui n&rsquo;existe pas mais qui respecte les r&egrave;gles phonotactiques du fran&ccedil;ais, <i>i.e</i> le mot / kʁefisjɔ̃ / (Hoedt &amp; Piron, 2016), comment pourrait-on le transcrire de mani&egrave;re &agrave; respecter les normes de l&rsquo;orthographe du fran&ccedil;ais&nbsp;?</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">&laquo;&nbsp;Krefision&nbsp;&raquo; ou &laquo;&nbsp; krefisiont&nbsp;&raquo;&nbsp;? Certes, mais aussi &laquo;&nbsp;crephission&nbsp;&raquo; ou bien &laquo;&nbsp;crefition&nbsp;&raquo; ou &laquo;&nbsp;chraisfiscion&nbsp;&raquo; devraient &ecirc;tre consid&eacute;r&eacute;s comme des candidats conformes.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Toutes ces formes sont possibles selon l&rsquo;orthographe du fran&ccedil;ais, aucune ne pourrait &ecirc;tre jug&eacute;e comme &eacute;tant hors-norme ou atypique. <a name="_Hlk120872744">Un algorithme programm&eacute; &agrave; cet effet &ndash; gr&acirc;ce &agrave; un calcul combinatoire qui tient en compte toutes les lettres et/ou syllabes homophones non homographes &ndash; a produit comme output le nombre total de transcription possible du mot invent&eacute; </a>/ kʁefisjɔ̃ /&nbsp;: elles sont 240&nbsp;(Hoedt &amp; Piron, 2016). Il est clair qu&rsquo;il est difficile parler de norme et de variation quand la norme orthographique ne derive &ndash; au moins dans un bon nombre de cas &ndash; que d&rsquo;une association majoritairement arbitraire qui relie un phon&egrave;me et son/ses graph&egrave;me(s) correspondant(s).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Les auteurs de cet ouvrage se demandent pourquoi &laquo;&nbsp;l&rsquo;esprit critique s&rsquo;arr&ecirc;te aux seuils de l&rsquo;orthographe&nbsp;&raquo; (Hoedt &amp; Piron, 2016). Le manque d&rsquo;univocit&eacute; dans la relation entre graph&egrave;me et phon&egrave;me donne &agrave; l&rsquo;orthographe du fran&ccedil;ais un caract&egrave;re particulier, qui est commun &agrave; d&rsquo;autres langues (par exemple l&rsquo;anglais ou l&rsquo;allemand). Les langues qui ont une orthographe totalement claire sont relativement peu, comme l&rsquo;espagnol ou le turc par exemple (&agrave; noter que l&rsquo;alphabet latin &agrave; &eacute;t&eacute; introduit dans le XX&egrave;me si&egrave;cle en Turquie, et qui a fait l&rsquo;objet d&rsquo;une adaptation de haut en bas&nbsp;: l&rsquo;usage s&rsquo;est d&eacute;fini une fois que la norme avait &eacute;t&eacute; d&eacute;j&agrave; &eacute;tablie par la nouvelle forme &eacute;tatique).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Apr&egrave;s cette petite digr&eacute;ssion, il faut noter que pour l&rsquo;ordinateur les variations sont toujours les m&ecirc;mes puisqu&rsquo;elles posent constamment le m&ecirc;me probl&egrave;me&nbsp;: l&rsquo;ambig&uuml;it&eacute; (Kraif &amp; Ponton, 2007&nbsp;; Jusoh, 2018).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Tout ce qui sort du cadre d&rsquo;une logique d&eacute;terminable et pr&eacute;visible devient difficile pour un ordinateur&nbsp;: calculer le type/token ratio de l&rsquo;int&eacute;gralit&eacute; de l&rsquo;Encyclop&eacute;die de Diderot et d&rsquo;Alembert est une t&acirc;che simple, alors que mettre sur le m&ecirc;me niveau ces deux expressions &laquo;&nbsp;je ne peux pas&nbsp;&raquo;, &laquo;&nbsp;je peux pas&nbsp;&raquo; devient compliqu&eacute;. Le pourquoi - on le sait bien &ndash; se trouve dans la d&eacute;ductibilit&eacute; des r&egrave;gles &agrave; appliquer et les exceptions &agrave; accorder &agrave; ces r&egrave;gles&nbsp;: si on a appris &agrave; un programme &agrave; reconna&icirc;tre la n&eacute;gation avec cette structure (sujet + ne + verbe + pas) il sera compliqu&eacute; de lui faire d&eacute;tecter la m&ecirc;me entit&eacute; dans un contexte o&ugrave; un &eacute;l&eacute;ment manque. Il sera encore plus difficile de le rendre capable de reconna&icirc;tre que dans certains contextes sociaux la premi&egrave;re forme est obligatoire alors que dans d&rsquo;autres contextes sociaux les deux formes sont acceptables.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Ces probl&egrave;mes de multiplicit&eacute; de transcriptions, d&rsquo;alignement, de d&eacute;sambigu&iuml;sation en fonction du contexte sont pr&eacute;sents dans toutes les branches de la linguistique qui utilisent le TAL pour automatiser des t&acirc;ches r&eacute;p&eacute;titives, pour v&eacute;rifier des hypoth&egrave;ses ou bien pour proposer des repr&eacute;sentations des grandes bases de donn&eacute;es.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Dans les deux parties de cet article deux &eacute;tudes de cas seront propos&eacute;es&nbsp;: la premi&egrave;re porte sur un calcul de frequ&eacute;nce d&rsquo;occurrence de mots et montrera comment la variation lexicale de l&rsquo;enfant a &eacute;t&eacute; mod&eacute;lis&eacute;e pour faciliter l&rsquo;automatisation d&rsquo;une t&acirc;che. Dans la deuxi&egrave;me &eacute;tude de cas plusieurs outils et escamotages seront pr&eacute;sent&eacute;s dans le cadre d&rsquo;un essai visant &agrave; uniformiser le traitement des variations phon&eacute;tico/phonologiques chez l&rsquo;enfant, dans le but ultime de d&eacute;gager son parcours d&rsquo;acquisition des phon&egrave;mes. Ces exemples montrent comment le TAL soit devenu un outil incontournable dans le domaine de la linguistique gr&acirc;ce &agrave; sa puissance de calcul et &agrave; sa rapidit&eacute; d&rsquo;ex&eacute;cution. Cependant, son utilisation peut se r&eacute;v&eacute;ler insidieuse puisque la nature intrinsiquement ambig&uuml;e et polys&eacute;mique du langage implique un nombre non n&eacute;glig&eacute;able de biais et d&rsquo;exceptions aux r&egrave;gles. Comme il sera d&eacute;taill&eacute; dans les deux parties, le TAL nous am&egrave;ne &agrave; des d&eacute;cisions importantes, souvent dans la forme d&rsquo;un compromis ou d&rsquo;une balance qu&rsquo;il faut calibrer soigneusement&nbsp;: par exemple&nbsp;: est-il mieux de privil&eacute;gier l&rsquo;efficience en d&eacute;pit de la pr&eacute;cision, ou bien est-il mieux de chosir un biais dans le codage initial afin d&rsquo;&eacute;viter des probl&egrave;mes de traitement de cat&eacute;goriers par la suite, ou &agrave; l&rsquo;inverse est-il mieux de rendre compte de toute variation lors du codage, pour ensuite avoir des cat&eacute;gories ayant des contours flous&nbsp;? </span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif"><b><span lang="FR" style="font-size:12.0pt"><span style="line-height:107%">Premi&egrave;re &eacute;tude de cas&nbsp;: estimer l&rsquo;&eacute;volution de la distribution de Zipf chez l&rsquo;enfant.</span></span></b></span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="text-indent:36pt; margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Le corpus CoLaJE (Morgenstern &amp; Parisse, 2012) est la base de cette &eacute;tude sur l&rsquo;acquisition du francais L1. Il est compos&eacute; par sept suivis longitudinaux d&rsquo;enfants qui ont ete enregistr&eacute;s une heure par mois, tous les mois, d&egrave;s l&rsquo;&acirc;ge d&rsquo;un an jusqu&rsquo;&agrave; cinq ans environ. Le corpus respecte les standards de repr&eacute;sentativit&eacute; statistique demand&eacute;s dans ce domaine (Tomasello &amp; Stahl, 2004&nbsp;; Yamaguchi, 2018).&nbsp; </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Pour chaque enfant il y a environ 8&rsquo;000 &eacute;nonc&eacute;s et 20&rsquo;000 mots avec une longueur moyenne d&#39;&eacute;nonc&eacute; (Mean Length of Utterance, Mac Whinney, 2000) de trois mots. Le langage adress&eacute; &agrave; l&#39;enfant a &eacute;galement &eacute;t&eacute; enregistr&eacute; et il est transcrit en utilisant les lignes FAT et MOT. Chaque transcription est soumise &agrave; une relecture par un paire, afin que les interpr&eacute;tations des expressions ambig&uuml;es des enfants soient concord&eacute;es par plusieurs chercheur.ses</span></span></span></p> <p style="margin-bottom: 11px; text-align: center;"><img height="266" src="https://www.numerev.com/img/ck_2808_28_image-20221206185740-1.png" width="545" /></p> <p align="center" style="text-align:center; margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Figure 1. Extrait de CoLaJE. ADRIEN-33-4_02_15</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">L&rsquo;&eacute;tude en question porte sur le d&eacute;veloppement de la distribution de la fr&eacute;quence des mots chez les enfants du corpus CoLaJE visant &agrave; &eacute;valuer comment leur production lexicale soit li&eacute;e &agrave; une distribution standard de la fr&eacute;quence des mots : la loi de Zipf, qui est pr&eacute;sente dans toutes les langues connues (Zipf, 1949&nbsp;; Piantedosi, 2014). Dans le d&eacute;tail, cette &eacute;tude prend comme exemple des travaux pr&eacute;c&eacute;dents sur l&rsquo;&eacute;volution de cette distribution de frequ&eacute;nce de mots qui avaient d&eacute;j&agrave; &eacute;t&eacute; effectu&eacute;s sur plusieurs langues (Baixeries et al., 2013) en l&rsquo;appliquant pour la premi&egrave;re fois sur la langue fran&ccedil;aise (Briglia et al., 2022). </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">La distribution de Zipf est consid&eacute;r&eacute;e comme un standard d&rsquo;efficience dans la communication humaine&nbsp;(Lestrade, 2017) : une langue doit pouvoir v&eacute;hiculer le sens de mani&egrave;re pr&eacute;cise tout en &eacute;vitant de rendre cette t&acirc;che trop co&ucirc;teuse pour les locuteurs. Le principe du moindre effort (Zipf, 1949) &oelig;uvre pour faire en sorte que la proportion entre <i>types</i> et <i>tokens</i> dans un corpus donn&eacute; suffise pour atteindre le but communicatif&nbsp;: si par exemple un auteur d&rsquo;un article peut s&rsquo;assurer de se faire comprendre en utilisant une gamme de 70 mots diff&eacute;rent, il n&rsquo;y aura aucune raison pour qu&rsquo;il en utilise plus puisque la valeur communicative des mots qui exc&egrave;dent par rapport &agrave; la constante de Zipf ne vaut pas plus que le co&ucirc;t cognitif de les traiter. La constante de la loi de Zipf est consid&eacute;r&eacute;e selon certains auteurs (Lestrade, 2017) comme un compromis implicite entre les locuteurs qui s&rsquo;articule au niveau s&eacute;mantique et syntaxique. Cette loi s&rsquo;applique &agrave; l&rsquo;oral tout comme dans le texte, avec des variations n&eacute;gligeables entre les deux formes (Piantedosi, 2014)</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">L&rsquo;int&eacute;r&ecirc;t de v&eacute;rifier comment cette constante se d&eacute;veloppe au cours de l&rsquo;acquisition de la langue maternelle&nbsp;est donc celui de comprendre comment le langage de l&rsquo;enfant en &eacute;volution se rapproche d&rsquo;une norme adulte d&rsquo;efficience dans la communication. Pour prouver cette hypoth&egrave;se, il a fallu op&eacute;rer un choix m&eacute;thodologique commun au sein du TAL. La production langagi&egrave;re des enfants du corpus CoLaJE qui ont &eacute;t&eacute; pris en examen se compose par trois lignes&nbsp;(voir exemple en Figure 1) : <i>pho </i>repr&eacute;sente ce que l&rsquo;enfant dit en API (Alphabet Phon&eacute;tique International), <i>mod </i>repr&eacute;sente ce que l&rsquo;enfant aurait d&ucirc; prononcer selon la norme adulte en API, et CHI repr&eacute;sente ce l&rsquo;enfant aurait d&ucirc; prononcer selon la norme adulte en orthographe standard. Avant de calculer la distribution de frequ&eacute;nce de mots dans un enregistrement, il faut d&rsquo;abord comprendre ce qu&rsquo;un mot est pour un enfant (Vihman &amp; McCune, 1994). Par exemple, pour le mot cible &laquo;&nbsp;comprendre&nbsp;&raquo;, Adrien<a href="#_ftn1" name="_ftnref1" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span lang="FR" style="font-size:11.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[1]</span></span></span></span></span></a> &agrave; l&rsquo;&acirc;ge de 4 ans et 3 mois (4_03_26) prononce les variations suivantes&nbsp;:</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/ pʁopʁɑ̃d / et / kɔ̃pʁɑ̃d /. &nbsp;</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Etant donn&eacute; que le contexte est le suivant&nbsp; &lt;je vais je vais comprendre les lettres moi&nbsp;!&gt; et que le papa voulait lui faire faire des exercices de lecture de lettres, il est clair que les deux formes vari&eacute;es ci-dessus se r&eacute;f&egrave;rent &agrave; la m&ecirc;me entit&eacute; (<i>e.g</i> le verbe &lsquo;comprendre&rsquo;). Il y a de nombreux cas analogues &agrave; celui-ci (par exemple le mot &lsquo;tracteur&rsquo; ou &lsquo;pourquoi&rsquo;) qui conduisent &agrave; un choix oblig&eacute;&nbsp;: si l&rsquo;on garde un compte chaque variation phon&eacute;tico/phonologiques de l&rsquo;enfant, on ne pourra jamais &eacute;tudier le d&eacute;veloppement de la constante de Zipf dans ce corpus puisque le fait de consid&eacute;rer toute variation va entra&icirc;ner un nombre d&rsquo;occurrence tr&egrave;s &eacute;lev&eacute; alors que le r&eacute;f&eacute;rent est toujours le m&ecirc;me. En d&rsquo;autres termes, il y aura plusieurs <i>types</i> diff&eacute;rents alors qu&rsquo;il n&rsquo;y a &ndash; selon une certaine perspective &ndash; que plusieurs tokens diff&eacute;rents qui se r&eacute;f&egrave;rent au m&ecirc;me <i>type.</i></span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">En outre, un mot donn&eacute; peut &ecirc;tre prononc&eacute; de plusieurs mani&egrave;res diff&eacute;rentes avec des degr&eacute;s de variations diff&eacute;rents, ce qui rend les calculs complexes : il est difficile d&#39;&eacute;tablir avec certitude si un enfant donne &agrave; un mot le m&ecirc;me sens qu&rsquo;un adulte lui attribue, par exemple de diff&eacute;rences dues &agrave; des erreurs de sous-extensions ou de sur-extension par les enfants (Thomson &amp; Chapman, 1977) peuvent &ecirc;tre &agrave; l&rsquo;&oelig;uvre sans que l&rsquo;on puisse en &ecirc;tre conscients. Il est difficile d&#39;&eacute;tablir quand un mot signifie ce qu&#39;il &eacute;tait cens&eacute; signifier pour un enfant, et dans quelle mesure diff&eacute;rentes formes vari&eacute;es se r&eacute;f&egrave;rent &agrave; la m&ecirc;me entit&eacute;, notamment au cours des premiers &acirc;ges (Vihman, 1994).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Il a donc &eacute;t&eacute; d&eacute;cid&eacute; &ndash; dans le but d&rsquo;homog&eacute;n&eacute;iser le corpus et rendre les comparaisons <i>inter</i>-enfants possibles &ndash; de baser la mod&eacute;lisation TAL sur le r&eacute;f&eacute;rent sans tenir compte des diff&eacute;rentes images acoustiques qui indiquaient ce dernier. Ce choix a impliqu&eacute; l&rsquo;acceptation de biais potentiels li&eacute;s au choix des transcripteurs qui pour premiers avaient interpret&eacute; la parole de l&rsquo;enfant, ces biais sont difficiles &agrave; estimer &eacute;tant donn&eacute; la taille du corpus.&nbsp; Au niveau du TAL, il s&rsquo;agit de rassembler un ensemble de variations sous une cat&eacute;gorie unique li&eacute;e au r&eacute;f&eacute;rent. Cela a permis de pouvoir traiter de mani&egrave;re automatique une grande quantit&eacute; de donn&eacute;es issus des enfants de CoLaJE afin de d&eacute;gager l&rsquo;&eacute;volution de la constante de la loi de Zipf au cours du temps (Briglia et al., 2022, p6-7). Il pourrait &ecirc;tre r&eacute;sum&eacute; que le fait de renoncer &agrave; une variation &agrave; un niveau d&rsquo;analyse (celui du mot) a permis de pouvoir analyser le r&ocirc;le de la variation &agrave; un niveau sup&eacute;rieur (celui du lexique) selon une perspective temporelle qui met en relief les diff&eacute;rences<i> inter</i>-enfants.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">La constante estim&eacute;e est le param&egrave;tre exponentiel de la distribution de la fr&eacute;quence des mots (<i>alpha</i>) pour chaque enfant, ainsi que pour le langage des parents. Nous montrons comment les valeurs de <i>alpha</i> tendent &agrave; converger vers la valeur de 1 au cours du d&eacute;veloppement, ce qui est coh&eacute;rent avec l&rsquo;&eacute;tat de l&rsquo;art (Baixieries et al., 2013). Le choix entre variation et norme expliqu&eacute; ci-dessus a permis aussi de rapprocher le langage de l&rsquo;enfant &agrave; celui de l&rsquo;adulte, en &eacute;tablissant ainsi les bases pour une comparaison entre l&rsquo;exposant <i>alpha</i> du langage des enfants et l&rsquo;exposant <i>alpha</i> des adultes&nbsp;: le <i>rho</i> de Spearman montre une corr&eacute;lation positive (p-value &lt; 0.05) entre l&#39;<i>alpha</i> de l&#39;enfant et l&#39;<i>alpha</i> des parents au cours de tous les &acirc;ges, qui augmente &agrave; un &acirc;ge plus avanc&eacute; (Briglia et al., 2022, p184). Cela indique clairement que l&rsquo;input parental joue un r&ocirc;le de plus en plus important dans la structuration de l&rsquo;output de l&rsquo;enfant (Goodman et al., 2008).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Les trois graphes ci-dessous montrent la variation de l&rsquo;exposant alpha au cours du temps. On pourrait consid&eacute;rer alpha = 1 comme &eacute;tant la norme puisqu&rsquo;il a &eacute;t&eacute; d&eacute;montr&eacute; que cette valeur pour cet exposant donne le nombre optimal qui d&eacute;crit combien de mots diff&eacute;rents un extrait (&eacute;crit ou oral) d&rsquo;une taille donn&eacute;e a en moyenne &agrave; l&rsquo;issue d&rsquo;un compromis implicite atteint par les locuteurs (Zipf, 1949&nbsp;; Piantadosi, 2014). Si l&rsquo;on compare les trois graphes on peut remarquer que les trois courbes ne sont pas isomorphes, et pourtant elles semblent graviter en dessous ou au dessus de la valeur 1 au cours du temps (c&rsquo;est-&agrave;-dire au cours du d&eacute;veloppement), ce qui expliquerait une tendance implicite du langage humain &agrave; atteindre l&rsquo;&eacute;quilbre d&eacute;crit par la formule de Zipf au cours du dernier si&egrave;cle (Zipf, 1949).</span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom: 11px; text-align: center;"><img height="270" src="https://www.numerev.com/img/ck_2808_28_image-20221206185958-3.png" width="460" /></p> <p align="center" style="text-align:center; margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Figure 2. Evolution de l&rsquo;exposant <i>alpha</i> pour Adrien</span></span></span></p> <p align="center" style="text-align:center; margin-bottom:11px">&nbsp;</p> <p align="center" style="text-align:center; margin-bottom:11px"><img height="267" src="https://www.numerev.com/img/ck_2808_28_image-20221206190058-4.png" width="453" /></p> <p align="center" style="text-align:center; margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Figure 3. Evolution de l&rsquo;exposant <i>alpha</i> pour Madeleine</span></span></span></p> <p align="center" style="text-align:center; margin-bottom:11px">&nbsp;</p> <p align="center" style="text-align:center; margin-bottom:11px"><img height="264" src="https://www.numerev.com/img/ck_2808_28_image-20221206190140-5.png" width="451" /></p> <p style="margin-bottom: 11px; text-align: center;"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Figure 4. Evolution de l&rsquo;exposant <i>alpha</i> pour Julie</span></span></span></p> <p style="margin-bottom: 11px; text-align: center;">&nbsp;</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif"><b><span lang="FR" style="font-size:12.0pt"><span style="line-height:107%">Le statut de la norme et de la variation phon&eacute;tico/phonologique.</span></span></b></span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="text-indent:36pt; margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">La variation est au c&oelig;ur de l&rsquo;acquisition du langage chez l&rsquo;enfant (Hickmann et al., 2018), elle influence toutes les &eacute;tapes de ce processus, tant sur le plan de la perception que sur le plan de la production, ainsi que sur les diff&eacute;rents niveaux d&rsquo;analyse (en allant de la phon&eacute;tique jusqu&rsquo;&agrave; la pragmatique). On pourrait dire que le seul d&eacute;nominateur commun de l&rsquo;acquisition de la langue maternelle est la variation, puisqu&rsquo;elle est pr&eacute;sente tant au niveau <i>inter</i>-individuel qu&rsquo;au nivea <i>intra</i>-individuel. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Comme il est soulign&eacute; par Bates&nbsp;: &laquo;&nbsp;il est toutefois n&eacute;cessaire de relativiser cette apparente uniformit&eacute; en soulignant la tr&egrave;s grande variabilit&eacute; intra et inter- individuelle qui caract&eacute;rise cette acquisition (Bates et al., 1995). </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">L&rsquo;importance de la variation chez les enfants du corpus CoLaJE est bien repr&eacute;sent&eacute;e par les graphes qui montrent l&rsquo;&eacute;volution de plusieurs indices linguistiques propos&eacute;s par les chercheurs qui ont r&eacute;alis&eacute; le corpus CoLaJE (Morgenstern &amp; Parisse, 2012).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Avant d&rsquo;atteindre la ma&icirc;trise de leur langue maternelle et de pouvoir parler comme un adulte, c&rsquo;est-&agrave;-dire avant d&rsquo;&ecirc;tre capable au niveau perceptif et articulatoire de prononcer la forme cible (<i>i.e</i> la norme sociale) d&rsquo;un mot, les enfants passent &agrave; travers plusieurs &eacute;tapes. La premi&egrave;re est la reconnaissance du niveau suprasegmentale, qui joue &laquo;&nbsp;un r&ocirc;le important dans la mise en place des premi&egrave;res constructions grammaticales, notamment au moment de l&rsquo;apparition des premiers mots et des premi&egrave;res combinaisons de mots, dans la p&eacute;riode qui suit la p&eacute;riode du mot isol&eacute; (stade holophrastique)&nbsp;&raquo; (Martel &amp; Dodane, 2012, p13). La prosodie n&rsquo;a pas &eacute;t&eacute; consid&eacute;r&eacute;e dans cette &eacute;tude pour des raisons de faisabilit&eacute;, le focus &eacute;tant sur lexique d&rsquo;une part et la phon&eacute;tique d&rsquo;autre part. Cependant, les enfants basent leur acquisition sur la prosodie afin de d&eacute;tecter les pauses, les intonations et les accentuations qui les aident &agrave; visualiser la fronti&egrave;re entre mots ainsi que les r&eacute;lations de d&eacute;pendance syntaxique. En fait &laquo;&nbsp;il semble bien que les caract&eacute;ristiques prosodiques soient utilis&eacute;es par l&rsquo;enfant pour poser les fondements des futures constructions grammaticales, mais que celles-ci se manifestent diff&eacute;remment au moment des premiers mots (gabarit temporel des proto-mots et des premiers mots) et des premi&egrave;res combinaisons de mots (contours unitaires qui permettent d&rsquo;assurer la coh&eacute;sion des diff&eacute;rentes unit&eacute;s au sein d&rsquo;une unit&eacute; plus grande)&nbsp;&raquo; (Martel &amp; Dodane, 2012, p32-33).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Le but de l&rsquo;exemple ici propos&eacute; est celui de mod&eacute;liser la structuration des variations phon&eacute;tico/phonologiques au cours du temps ainsi que d&rsquo;estimer le d&eacute;gr&eacute; de variabilite <i>intra</i>-enfant et <i>inter</i>-enfants. Des &eacute;tudes pr&eacute;c&eacute;dentes (Dos Santos, 2007 ; Yamaguchi, 2012 ; Morgenstern &amp; Parisse, 2012) ont montr&eacute; qu&rsquo;il n&rsquo;y a pas un parcours &laquo;&nbsp;typique&nbsp;&raquo; dans l&rsquo;acquisition, mais plut&ocirc;t des contraintes d&rsquo;ordre phon&eacute;tique et phonologique qui d&eacute;finissent les contours possibles du cheminement vers la norme adulte. Chaque variation semblerait &ecirc;tre influenc&eacute;e par la variation pr&eacute;c&eacute;dente et, a son tour, exercer une influence sur la variation suivante (Sauvage, 2015). Dans d&rsquo;autres termes, les variations ne seraient pas dues au hasard, mais elles seraient contraintes par plusieurs facteurs comme le lieu d&rsquo;articulation, le mode d&rsquo;articulation, ainsi que la fr&eacute;quence d&rsquo;occurrence d&rsquo;une cible dans l&rsquo;input parentale (Ambridge et al., 2015).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Il y a essentiellement deux th&eacute;ories qui pourraient &ecirc;tre adopt&eacute;es afin de rendre compte des parcours d&rsquo;acquisition&nbsp;: la th&eacute;orie de l&rsquo;optimalit&eacute; (connue sous les termes anglaises de <i>optimality theory</i>, Prince &amp; Smolensky, 2004) et la th&eacute;orie des traits phonologique (Clements, 1985). Ces th&eacute;ories font &ndash; respectivement &ndash; partie du courant inn&eacute;iste et constructiviste. Dans le cadre de cette &eacute;tude, la th&eacute;orie de Clements a &eacute;t&eacute; adopt&eacute;e&nbsp;pour diff&eacute;rentes raisons&nbsp;: l&rsquo;auteur de l&rsquo;article est convaincu que cette th&eacute;orie a un pouvoir explicatif plus profond et exhaustif de la th&eacute;orie concurrente ; en plus, la majorit&eacute; des r&eacute;f&eacute;rences bibliographiques cit&eacute;es dans cet article adoptent le constructivisme (ou <i>usage-based theory</i> en anglais) comme point de d&eacute;part des analyses. Cependant, le focus n&rsquo;est pas sur la capacit&eacute; de cette th&eacute;orie de rendre compte de toutes les variations possibles dans les parcours d&rsquo;acquisition des consonnes et des voyelles du fran&ccedil;ais. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">La contribution vise &agrave; comprendre comment un algorithme de reconnaissance de motifs s&eacute;quentiels (connu sous l&rsquo;expression anglaise de <i>pattern mining</i>) puisse nous aider &agrave; fouiller une grande base de suivis longitudinaux qui serait autrement impossible de traiter manuellement. La rapidit&eacute; et la modulabilit&eacute; de cet algorithme pourrait fournir les bases pour comprendre quels sont les facteurs les plus importants dans l&rsquo;acquisition des phon&egrave;mes parmi le lieu d&rsquo;articulation, le mode d&rsquo;articulation et la fr&eacute;quence d&rsquo;occurrence d&rsquo;une cible dans l&rsquo;input parental. Il est en fait difficile de pouvoir quantifier pr&eacute;cisement quelle est la proportion entre ces facteurs.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Le corpus CoLaJE &ndash; via la plateforme num&eacute;rique Ortolang &ndash; offre d&eacute;j&agrave; un outil de requ&ecirc;te pr&eacute;cieux qui aide &agrave; cibler des mots pr&eacute;cis, ainsi que donner la possibilit&eacute; de saisir des expressions r&eacute;guli&egrave;res<a href="#_ftn1" name="_ftnref1" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span lang="FR" style="font-size:11.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[1]</span></span></span></span></span></a>. Les r&eacute;sultats propos&eacute;s par cette <i>query </i>ont &eacute;t&eacute; le point de d&eacute;part, ensuite une analyse plus d&eacute;taill&eacute;e a &eacute;t&eacute; m&eacute;n&eacute;e en utilisant la librairie &laquo;&nbsp;pylangacq&nbsp;&raquo; en langage Python<a href="#_ftn2" name="_ftnref2" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span lang="FR" style="font-size:11.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[2]</span></span></span></span></span></a> (Lee et al., 2016) ainsi que l&rsquo;ensemble d&rsquo;algorithmes pr&eacute;sents dans une autre librairie Python, appel&eacute;e &laquo;&nbsp;pymining&nbsp;&raquo;<a href="#_ftn3" name="_ftnref3" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span lang="FR" style="font-size:11.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[3]</span></span></span></span></span></a>.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Les exemples ci-dessous ont &eacute;t&eacute; choisis pour leur repr&eacute;sentativit&eacute; en fonction de plusieurs crit&egrave;res&nbsp;: la pr&eacute;sence de plusieurs suites consonantiques, le fait d&rsquo;avoir au moins deux syllabes, la pr&eacute;sence de consonnes qui sont acquises relativement tard (le /ʁ/ par exemple), leur fr&eacute;quence &eacute;lev&eacute;e dans le corpus en question (c&rsquo;est-&agrave;-dire, plusieurs occurrences diff&eacute;rentes &agrave; des &acirc;ges diff&eacute;rentes pour plusieurs enfants diff&eacute;rents, ce qui permettrait de poser les bases pour une &eacute;ventuelle g&eacute;n&eacute;ralisation d&rsquo;un parcours typique).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Voici deux exemples d&rsquo;application&nbsp;:</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif"><i>Premier exemple</i> : pour le mot cible &lsquo;tracteur&rsquo;, /tʁaktoeʁ/, qui a une structure syllabique du type CCVCCVC, on liste toutes les variation phonetico/phonologiques observ&eacute;es dans les transcriptions des enfants du projet CoLaJE:&nbsp; (le nombre expriment ann&eacute;e/mois/jour)</span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁikt&oelig;ʁ/ Antoine 2_02_27&nbsp; </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁat&oelig;ʁ/ Antoine 2_02_27 </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁat&oelig;ʁ/ Antoine 2_03_05</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁak&oelig;ʁ/ Antoine 2_04_03</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/tatoʁ/ Th&eacute;ophile 2_10_28</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/taktɔ/ Adrien 3_09_09</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/toktɔʁ/ Adrien 4_00_15</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/taktɔʁ/ Adrien 4_00_15</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/takt&oelig;ʁ/ Adrien 4_02_15</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/takt&oelig;ʁ/ Adrien 4_02_15</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/sakt&oelig;ʁ/ Julie 1_06_04 (BRO)</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/ʁakt&oelig;ʁ/ Julie 1_07_26</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/tat&oslash;/ Julie 1_07_26</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/tʁakt&oelig;ʁ/ Julie 2_09_24</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/tʁakt&oelig;ʁ/ Julie 2_09_24</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">On observe que les variations autour de la norme (ou cible phon&eacute;tico/phonologique) /tʁakt&oelig;ʁ/ varient en fonction de l&rsquo;&acirc;ge et de l&rsquo;enfant.</span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Deuxi&egrave;me exemple : mot cible crayon / kʁɛjɔ̃/ , structure syllabique CCVCV</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛjɔ̃/ Antoine 2_06_24</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁejɔ̃/ Antoine 2_06_24</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁejɔ̃/ Antoine 2_06_24</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/tʁɛjɔ̃/ Antoine 2_06_24</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kɛʁejɔ̃/ Th&eacute;ophile 3_02_00</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/crejɔ̃ː/ Th&eacute;ophile 3_04_10</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛjɔ̃/ Th&eacute;ophile 3_05_11</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛjɔ̃/ Th&eacute;ophile 3_07_08</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛjɔ̃/ Th&eacute;ophile 4_03_29</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛjɔ̃/ Th&eacute;ophile 4_09_07</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kijo / Adrien 4_01_12</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛjɔ̃/ Julie 2_03_08</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛjɔ̃/ Julie 2_11_01</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛjɔ̃/ Julie 3_04_21</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛʒjɔ̃/ Julie 3_04_21</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁɛjɔ̃/ Julie 3_04_21</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kejɔ̃/ Anae 2_00_26</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/tejɔ̃/ Anae 2_00_26</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/tijɔ̃/ Anae 2_00_26</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/tijɔ̃/ Anae 2_00_26</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁejɔ̃/ Anae 2_06_27</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/jʁajɔ̃/ Anae 2_08_24</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁejɔ̃/ Anae 5_10_30</span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Le d&eacute;nominateur commun entre Ana&euml; et Julie est qu&rsquo;elles semblent &ndash; autour de l&rsquo;age 2 ans et demi/trois ans &ndash; avoir appris une fois pour toutes la forme correcte du mot cible, puisqu&rsquo;elles arrivent &agrave; bien l&rsquo;articuler &agrave; des intervals de temps successifs. Cependant, elles produisent une variation qu&rsquo;elles n&rsquo;avaient jamais produit auparavant au cours des &acirc;ges plus avanc&eacute;s (pour &ecirc;tre plus pr&eacute;cis, il faut remarquer qu&rsquo;il pourrait s&rsquo;agir &eacute;galement d&rsquo;une variation qui n&rsquo;avait pas &eacute;t&eacute; collect&eacute;e par la densit&eacute; d&rsquo;&eacute;chantillonnage de 1heure par mois pr&eacute;vu par le projet ColaJE, voir (Yamaguchi, 2018)). Ce ph&eacute;nom&egrave;ne, bien qu&rsquo;il soit contre-intuitif &ndash; il est assez commun en acquisition L1 (Sauvage, 2015, p125, en particulier le concept de &lsquo;r&eacute;gression&rsquo;).</span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">La proc&eacute;dure pour rep&eacute;rer et analyser les variations est la suivante&nbsp;: </span></span></span></p> <p style="text-indent:-36pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">i) chercher le mot d&eacute;sir&eacute; via la <i>query </i>du projet Ortolang</span></span></span></p> <p style="text-indent:-36pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">ii) avoir acc&egrave;s aux transcriptions des enfants CoLaJE par le biais de la librairie &lsquo;pylangacq&rsquo;</span></span></span></p> <p style="text-indent:-36pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">iii) mettre en place un algorithme du type &lsquo;if-then&rsquo;, v&eacute;rifier si le mot prononc&eacute; est diff&eacute;rent du mot cible ou pas.</span></span></span></p> <p style="text-indent:-36pt; margin-bottom:11px; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">iv) Si oui, d&eacute;tecter sa structure syllabique via &lsquo;pymining&rsquo;. Si non, la ligne du code se termine ainsi.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">La partie la plus difficile consiste en la d&eacute;finition de la variation, c&rsquo;est-&agrave;-dire qu&rsquo;une fois que la variation a &eacute;t&eacute; d&eacute;tect&eacute;e, il faudrait apprendre &agrave; la machine &agrave; la classer dans une des cat&eacute;gories ci-dessous, qui &agrave; leur tour se basent sur plusieurs crit&egrave;res (lieu et mode d&rsquo;articulation, voisement, ordre des syllabes) : </span></span></span></p> <p style="text-indent:-18pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">1) Omission</span></span></span></p> <p style="text-indent:-18pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">2) &nbsp;Substition</span></span></span></p> <p style="text-indent:-18pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">3) Assimilation</span></span></span></p> <p style="text-indent:-18pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">4) R&eacute;duction</span></span></span></p> <p style="text-indent:-18pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">5) Duplication</span></span></span></p> <p style="text-indent:-18pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">6) Epenth&egrave;se</span></span></span></p> <p style="text-indent:-18pt; margin-bottom:11px; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">7) M&eacute;tath&egrave;se</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Le point d&rsquo;arr&ecirc;t de cet essai a &eacute;t&eacute; la structure syllabique puisqu&rsquo;il a &eacute;t&eacute; difficile de programmer la partie concernante les 7 variations phonologiques possibles&nbsp;: trop de variables et trop d&rsquo;&eacute;tapes cons&eacute;quentielles &eacute;taient pr&eacute;sentes. Par exemple, une fois avoir d&eacute;tect&eacute; une substitution, il aurait fallu aussi trouver un moyen de classer cette substituion en fonction du phon&egrave;me remplac&eacute;&nbsp;: une substitution de fricatives par des occlusives n&rsquo;est pas &eacute;quivalente &agrave; une substitution de liquides par des semi-voyelles. Un autre exemple encore plus complexe&nbsp;: dans l&rsquo;assimilation deux sons deviennent semblables au niveau du lieu d&rsquo;articulation, du mode d&rsquo;articulation ou du voisement, mais l&rsquo;on voit bien qu&rsquo;il ne serait pas rigoureux de mettre sur le m&ecirc;me plan ces trois crit&egrave;res, il aurait peut-&ecirc;tre fallu concevoir une hi&eacute;rarchie, mais laquelle&nbsp;?&nbsp; </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Un dernier exemple&nbsp;: pour le cas des m&eacute;tath&egrave;ses, l&rsquo;&eacute;cueil principal a &eacute;t&eacute; le nombre et la vari&eacute;t&eacute; de ces derni&egrave;res&nbsp;: a&eacute;roport &rarr;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; [aʁeopɔʁ]&nbsp; n&rsquo;est pas identique au cas suivant toboggan &rarr; [togobɑ̃]</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Dans le premier cas il s&rsquo;agit d&rsquo;une m&eacute;tath&egrave;se entre une consonne et une voyelle, dans le deuxi&egrave;me cas d&rsquo;une m&eacute;tath&egrave;se entre deux consonnes.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">On pourrait ajouter &eacute;galement une autre difficult&eacute;&nbsp;: les variations li&eacute;es au processus phonologiques &eacute;numer&eacute;es ci-dessus peuvent avoir lieu en d&eacute;but d&rsquo;un mot, au milieu ou &agrave; la fin, et elles peuvent concerner une seule consonne ou voyelle ou bien une syllabe.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Pendant la r&eacute;flexion autour de la multiplicit&eacute; de ces variations, des questions ont &eacute;t&eacute; r&eacute;currentes&nbsp;: puisqu&rsquo;il y a des variations de nature diff&eacute;rente, est-ce qu&rsquo;il faut attribuer un poids diff&eacute;rent selon la nature de la variation&nbsp;? Quels crit&egrave;res pourrait-t-on adopter afin d&rsquo; attribuer ce poids ?</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Malheuresement, il n&rsquo;a pas &eacute;t&eacute; possible de prendre en compte toutes ces possibles variations, trop de facteurs concurrents sont en jeu et les comp&eacute;tences de l&rsquo;auteur ne sont pas &agrave; l&rsquo;hauteur d&rsquo;une t&acirc;che si complexe. N&eacute;anmoins, certains travaux ont conduit &agrave; un travail analogue, par exemple le r&eacute;seau neurones qui prend en compte &agrave; la fois l&rsquo;aspect phon&eacute;tique et phonologique propos&eacute; par l&rsquo;inventeur du logiciel PRAAT, Paul Broesma (Boersma et al., 2020) propose des pistes qui pourraient r&eacute;pondre aux questionnements ci-dessus.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Il est clair qu&rsquo;il est difficile de d&eacute;gager un parcours typique &agrave; partir de ces variations&nbsp;: le nombre et la nature des variations est relativement trop grand. Le premier obstacle est d&rsquo;ordre purement statistique, il s&rsquo;agit de la relation entre &eacute;chantillon et population&nbsp;: malheuresement, il n&rsquo;y avait pas moyen d&rsquo;avoir une occurrence de chaque mot pour chaque enregistrement mensuel et pour chaque enfant du corpus CoLaJE&nbsp;: m&ecirc;me les mots les plus fr&eacute;quents peuvent parfois manquer, notamment aux plus jeunes &acirc;ges lorsque les enfants parlent relativement peu. Le deuxi&egrave;me obstacle est de comprendre pourquoi une variation s&rsquo;est elle produite &agrave; la place d&rsquo;une autre. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Par exemple, pourquoi /toktɔʁ/ Adrien 4_00_15 et /taktɔʁ/ Adrien 4_00_15 ? Il serait difficile de croire que l&rsquo;enfant &agrave; 4 ans ne soit pas capable de percevoir et articuler la diff&eacute;rence entre les voyelles /o/ et /a/.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Ensuite, le troisi&egrave;me obstacle est l&rsquo;int&eacute;rpretation de la cause de la variation, c&rsquo;est -&agrave;-dire les motivations qui ont port&eacute; un enfant &agrave; prononcer telle variation ou une autre, par exemple une strat&eacute;gie d&rsquo;&eacute;vitement qui porte les enfants &agrave; omettre ou &agrave; r&eacute;duire une consonne cible qui demande trop d&rsquo;effort, comme dans le cas suivant&nbsp;:</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/tatoʁ/ Th&eacute;ophile 2_10_28</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">ou bien une assimilation, qui porte un enfant &agrave; pr&eacute;f&eacute;rer les suites syllabiques qui ont un point d&rsquo;articulation en commun, comme dans le cas ci-dessous</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">/kʁak&oelig;ʁ/ Antoine 2_04_03.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Apr&egrave;s avoir essay&eacute; plusieurs combinaisons d&rsquo;algorithmes pour plusieurs mots diff&eacute;rents, les limites de l&rsquo;approche informatis&eacute;e ont pris forme. Il n&rsquo;est possible que de confirmer les tendances d&rsquo;acquisition qui ont d&eacute;j&agrave; &eacute;t&eacute; confirm&eacute;es par la litt&eacute;rature existante (Dos Santos, 2007&nbsp;; Yamaguchi, 2012), par exemple l&rsquo;ordre d&rsquo;acquisition de voyelle ou de consonnes, ainsi que les variations les plus fr&eacute;quentes et celles moins fr&eacute;quentes. Mais pour ce qui concerne la pr&eacute;diction avec un d&eacute;gr&eacute; de pr&eacute;cision acceptable, il a &eacute;t&eacute; difficile d&rsquo;envisager la compr&eacute;hension des suites des variations au cours du temps&nbsp;: quelle variation suivra en fonction des deux variations pr&eacute;c&eacute;dentes&nbsp;? Cette question reste en qu&ecirc;te d&rsquo;une r&eacute;ponse.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">La combinaison d&rsquo;algorithmes s&rsquo;est r&eacute;v&eacute;l&eacute;e une m&eacute;thode infructueuse, la variabilit&eacute; <i>intra</i>-enfant et <i>inter</i>-enfants &eacute;tant trop grande. Une autre piste possible pourrait &ecirc;tre celle de se focaliser sur un sujet plus restreint, par exemple explorer les variations syllabiques analogues comme les occlusives-liquides. On pourrait commencer en dressant une liste suffisamment repr&eacute;sentative de mots qui contiennent ce type de syllabe et proc&eacute;der &eacute;tape par &eacute;tape (Cfr aux 4 &eacute;tapes list&eacute;es ci-dessus). Ce focus devrait permettre de r&eacute;duire consid&eacute;rablement le nombre de variations possible et rendre par la suite la t&acirc;che de programmation plus simple. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Pour conclure, ces r&eacute;sultats montrent comment il est apriori b&eacute;n&eacute;fique de mod&eacute;liser les multiples variations phon&eacute;tico/phonologiques &agrave; l&rsquo;aide d&rsquo;outils TAL&nbsp;: on s&rsquo;aper&ccedil;oit que &ndash; malgr&eacute; la nature des variations soit multiforme et leur nombre &eacute;lev&eacute; &ndash; elles peuvent &ecirc;tre inclues dans un seul mod&egrave;le qui pourrait rendre compte des r&egrave;gles qui r&eacute;gissent les parcours possibles de leur &eacute;volution. Comme il a d&eacute;j&agrave; &eacute;t&eacute; dit, les r&eacute;sultats pr&eacute;sent&eacute;s dans cette &eacute;tude n&rsquo;ont qu&rsquo;une valeur anedoctiques&nbsp;: ils s&rsquo;accordent de manipre globale &agrave; des &eacute;tudes de cas qui ont &eacute;t&eacute; m&eacute;n&eacute;es sur le m&ecirc;me corpus (Yamaguchi, 2012) ou sur d&rsquo;autres enfants francophones collect&eacute;s avec des m&eacute;thodes comparables (Dos Santos, 2007).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Ce paragraphe contient une partie de nombreux travaux de fouille et mod&eacute;lisation du corpus CoLaJE qui ont &eacute;t&eacute; produits lors d&rsquo;une collaboration entre linguistes et informaticiens de l&rsquo;Universit&eacute; &laquo;&nbsp;Paul Val&eacute;ry&nbsp;&raquo; Montpellier (pour la pr&eacute;cision les <i>data scientists</i> du master MIASHS guid&eacute;s par S. Bringay) pendant l&rsquo;ann&eacute;e acad&eacute;mique 2019-2020. Pour un aper&ccedil;u des ces travaux, veuillez suivre le lien en bas de page<a href="#_ftn4" name="_ftnref4" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span lang="FR" style="font-size:11.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[4]</span></span></span></span></span></a>.</span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif"><b>Conclusions</b></span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Le but de cet article &eacute;tait celui de mener une r&eacute;fl&eacute;xion autour de l&rsquo;utilisation de mod&egrave;les et techniques TAL pour mettre en relief la relation entre norme et variation dans le cadre de l&rsquo;acquisition du fran&ccedil;ais langue premi&egrave;re. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Deux cas d&rsquo;&eacute;tude ont &eacute;t&eacute; propos&eacute;s&nbsp;: dans le premier la variation avait une double articulation au niveau lexical et au niveau du vocabulaire de l&rsquo;enfant. Les r&eacute;sultats d&rsquo;une &eacute;tude pr&eacute;c&eacute;dente (Briglia et al., 2022) ont montr&eacute; comment la cr&eacute;ation d&rsquo;un mod&egrave;le unifi&eacute; de la cat&eacute;gorie de mot (con&ccedil;u comme une unit&eacute; compos&eacute;e par trois constituants&nbsp;: signifiant- signifi&eacute; - r&eacute;f&eacute;rent) permet de rassembler plusieurs variations phon&eacute;tico/phonologiques sous une m&ecirc;me cat&eacute;gorie afin de faciliter l&rsquo;analyse d&rsquo;un autre type de variation, celle de l&rsquo;exposant <i>alpha, </i>un index qui repr&eacute;sente comment la distribution de fr&eacute;quence des mots dans le vocabulaire de l&rsquo;enfant varie </span></span></span></p> <p style="text-indent:-36pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">i) au cours du temps (intra-enfant) </span></span></span></p> <p style="text-indent:-36pt; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">ii) entre les enfants (inter-enfants)</span></span></span></p> <p style="text-indent:-36pt; margin-bottom:11px; margin-left:48px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">iii) entre les enfants et leur respectifs parents respectifs (corr&eacute;lation de Spearman). </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Pour cette derni&egrave;re analyse, le codage des transcriptions CHI- FAT-MOT, la mise au point de crit&egrave;res pour unifier les variations sous un seul ensemble ainsi que le calcul des fr&eacute;quences d&rsquo;occurrence et des corr&eacute;lations a &eacute;t&eacute; fait automatiquement en langage Python.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Dans le deuxi&egrave;me exemple on a pu appr&eacute;cier la rapidit&eacute; des algorithmes de reconnaissance de motifs s&eacute;quentiels et comprendre comment la prise en compte de toutes les variations phon&eacute;tico-phonologiques autour de la norme adulte est th&eacute;oriquement faisable, m&ecirc;me si dans la pratique il est difficile d&rsquo;attribuer la bonne place et le juste poids aux diff&eacute;rents crit&egrave;res qui d&eacute;finissent les variations. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">L&rsquo;application de mod&egrave;les, de techniques et de r&eacute;f&eacute;rentiels issus de l&rsquo;informatique dans le domaine de la linguistique est croissant et permet la v&eacute;rification d&rsquo;hypotheses de mani&egrave;re fiable, r&eacute;productible et rapide. En plus, la plupart des logiciels pour l&rsquo;analyse des corpus (Antconc, TXM, Iramuteq), de la parole (PRAAT, PHON) ou de la gestualit&eacute; (ELAN) sont en libre acc&egrave;s et <i>open source, </i>ce qui repr&eacute;sente un v&eacute;ritable avantage. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Malgr&eacute; ces avantages, l&rsquo;adoption des techniques TAL ne doit pas &ecirc;tre interpr&eacute;t&eacute;e comme un passepartout qui se fait apriori d&rsquo;une connaissance approfondie de la langue elle-m&ecirc;me ou du ph&eacute;nom&egrave;ne linguistique (l&rsquo;acquisition L1 par exemple). La rapidit&eacute; et la puissance de calcul doivent &ecirc;tre dirig&eacute;es par des assomptions, des hypoth&egrave;ses, des cadres th&eacute;oriques que &ndash; &agrave; l&rsquo;heure d&rsquo;aujourd&rsquo;hui &ndash; seuls les intelligences humaines peuvent ma&icirc;triser.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">D&rsquo;autres outils TAL d&eacute;velopp&eacute;s au sein de la communaut&eacute; francophone qui pourraient &ecirc;tre utilis&eacute;s afin d&rsquo;&eacute;valuer l&rsquo;acquisition du fran&ccedil;ais langue premi&egrave;re chez l&rsquo;enfant sont l&rsquo;iPhocomp (Lee et al., 2014) et l&rsquo;ISC (Index de complexit&eacute; syntaxique, Szmrecsanyi, 2004). En effet, lorqu&rsquo;on poss&egrave;de de suivis longitudinaux disponibles sous plusieurs formats diff&eacute;rents comme pour le corpus CoLaJE, on a par cons&eacute;quent l&rsquo;opportunit&eacute; d&rsquo;obtenir un score pour chaque mot et/ou &eacute;nonc&eacute; prononc&eacute; par l&rsquo;enfant en automatisant &ndash; par le biais d&rsquo;un langage de programmation comme Python - la t&acirc;che de calcul de ces scores pour chaque ligne de code - qu&rsquo;elle soit la ligne CHI, pho ou mod et quelque soit son format (csv, CHAT ou TEI pour ne citer que les formats pr&eacute;sents sur CoLaJE-Ortolang). Une &eacute;tude r&eacute;cente a montr&eacute; la validit&eacute; de l&rsquo;emploi de ces deux scores pour la pr&eacute;diction de l&rsquo;acquisition de certaines cat&eacute;gories grammaticales sur une &eacute;tude de cas tir&eacute; du corpus CoLaJE (Briglia et al., 2022).</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Au cours de ces derni&egrave;res ann&eacute;es, la technologie TAL qui semblerait &ecirc;tre la plus compl&egrave;te et exhaustive, le BERT (acronyme pour Bidirectional Encoder Representations from Transformes) a &eacute;t&eacute; am&eacute;lior&eacute;e (en termes de performance pour la langue fran&ccedil;aise) gr&acirc;ce &agrave; la prise en compte des particularit&eacute;s de la langue vis&eacute;e. C&rsquo;est ainsi que CamemBERT (Martin et al., 2020) a pu voir le jour.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">On pourrait craindre que cette augmentation constante de la pr&eacute;sence de l&rsquo;informatique dans le champ d&rsquo;investigation qui a traditionellement fait partie de la linguistique causera &ndash; dans un avenir proche ou lointain &ndash; un d&eacute;classement de cette derni&egrave;re. Ces craintes sont vraisemblables, pourtant il est &agrave; noter que tout syst&egrave;me d&rsquo;annotation automatique en parties du discours (POS tagging en anglais), classification de texte, plongement de mots en allant jusqu&rsquo;aux derni&egrave;res technologies d&rsquo;apprentissage machine (BERT ou, plus g&eacute;n&eacute;ralement, les r&eacute;seau neurones, qu&rsquo;ils soient supervis&eacute;s ou pas), ne peut pas &ecirc;tre con&ccedil;u sans une connaissance linguistique pr&eacute;alable. &nbsp;En plus, bien que l&rsquo;intelligence artificielle soit toujours plus raffin&eacute;e dans ses pr&eacute;dictions et ses inf&eacute;rences sur le langage, elle pr&eacute;sente des probl&egrave;mes r&eacute;currents au niveau de la coarticulation (les technologies <i>speech-to-text</i> et <i>text-to-speech</i>), la synonimie et la polys&eacute;mie, ainsi que pour ce qui concerne la signification en contexte (<i>i.e</i> le niveau pragmatique). En d&rsquo;autres mots, tout ce qui rel&egrave;ve de la compr&eacute;hension des diff&eacute;rents accents ou des diff&eacute;rentes acceptions, du style, de la nuance, de variation en fonction du contexte, d&rsquo;ambigu&iuml;t&eacute;s ou bien de sous-entendus reste particuli&egrave;rement accident&eacute; pour les machines. La souplesse, ainsi que la cr&eacute;ativit&eacute;, sembleraient devoir rester des comp&eacute;tences mieux ma&icirc;tris&eacute;es par les intelligences humaines.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Ces diff&eacute;rences nous montrent comme une synergie entre linguistes et informaticiens pourrait constituer le noyau d&rsquo;une bonne partie des futures recherches dans le domaine du langage.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif"><b>Bibliographie</b></span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Ambridge, B., Kidd, E., Rowland, C. F., &amp; Theakston, A. L. (2015). The ubiquity of frequency effects in first language acquisition. <i>Journal of child language</i>, <i>42</i>(2), 239-273</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Baixeries J., Elvevag B. and Ferrer-i-Cancho R. (2013). The Evolution of the Exponent of Zipf&rsquo;s Law in<br /> Language Ontogeny. PLoS ONE 8(3): e53227</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Bates, E., Dale, P. S., &amp; Thal, D. (1995). <i>Individual differences and their implications for theories of language development</i>. The handbook of child language, 30, 96-151</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Boersma, P., Benders, T., &amp; Seinhorst, K. (2020). Neural network models for phonology and phonetics. <i>Journal of Language Modelling Vol</i>, <i>8</i>(1), 103-177</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Briglia A. &ldquo;Statistical and computational approaches to first language acquisition. Mining a set of French longitudinal corpora (CoLaJE&rdquo;). Th&egrave;se Universit&eacute; Paul Val&eacute;ry Montpellier 3; Universit&agrave; di Messina. 2021. <a href="https://hal.archives-ouvertes.fr/tel-03319126" style="color:blue; text-decoration:underline" target="_blank"><span style="font-family:&quot;Cambria Math&quot;,serif">&lang;</span>tel-03319126<span style="font-family:&quot;Cambria Math&quot;,serif">&rang;</span></a></span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Briglia A., Mucciardi M., Pirrotta G. (2022). &ldquo;A statistical model for predicting child language acquisition: unfolding qualitative grammatical development by using logistic regression model&rdquo;. In Salvati N., Perna C., Marchetti S., Chambers R. &ldquo;Studies in Theoretical and Applied Statistics&rdquo;. Springer Proceedings in Mathematics &amp; Statistics. PROMS, volume 406. SIS 2021, Pisa.&nbsp; <i>in press</i></span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Briglia A., Mucciardi M., Pirrotta G. &ldquo;The development of word frequency distribution in first language acquisition. An analysis on a spoken language corpus of French children&rdquo;. Vadistat Press. <i>Proceedings of the 16th International Conference on Statistical Analysis of Textual Data (JADT)</i>, 1 (16)</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Clements, G. N. (1985). The geometry of phonological features. <i>Phonology yearbook</i> 2.225-252</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Dos Santos C. (2007).&nbsp; Developpement phonologique en francais langue maternelle : une etude de cas&rdquo;. Phd thesis Universite Lumi&egrave;re Lyon2</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Dubois, J., Marcellesi, J-B., M&eacute;yel, J-P. &amp; Giascamo, M. (1973). <i>Dictionnaire de linguistique</i>. Paris : Larousse</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Goodman J., Dale P. and Li P. (2008). <i>Does frequency count? Parental input and the acquisition of vocabulary</i>. Journal of Child Language, 35(03), 515&ndash;531</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Hickmann M.; Veneziano E.; Harriett J. (Eds) (2018). Sources of Variation in First Language Acquisition. Languages, contexts and learners.&nbsp; John Benjamins</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif"><a name="_Hlk120873323">Hoedt, A., &amp; Piron, J. (2016). </a><i>La faute de l&rsquo;orthographe. </i>Paris<i>, Textuel</i></span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Jamila Sebbar Barge. Pour une nouvelle conception de la &quot;norme&quot; linguistique dans l&#39;enseignement des langues. <a href="https://hal.archives-ouvertes.fr/hal-00385090v2" style="color:blue; text-decoration:underline" target="_blank"><span style="font-family:&quot;Cambria Math&quot;,serif">&lang;</span>hal-00385090v2<span style="font-family:&quot;Cambria Math&quot;,serif">&rang;</span></a></span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Jusoh, S. (2018). A study on NLP applications and ambiguity. <i>Journal of Theoretical &amp; Applied Information Technology</i>, <i>96</i>(6)</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Kraif O., Ponton C. (2007). Du bruit, du silence et des ambigu&iuml;t&eacute;s : que faire du TAL pour l&rsquo;apprentissage des langues ? In <i>Actes de la 14&egrave;me conf&eacute;rence sur le Traitement Automatique des Langues Naturelles</i>. Posters, pages 143&ndash;152, Toulouse, France. ATALA</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Lee, H., Gambette, P., Barkat-Defradas, M. (2014). iPhocomp: calcul automatique de l&rsquo;indice de complexit&eacute; phon&eacute;tique de Jakielski. <i>JEP 2014, XXX&egrave; &eacute;dition des Journ&eacute;es d&#39;Etudes sur la Parole</i>, Le Mans, France. pp.622-630, 2014, Actes de la XXXe &eacute;dition des Journ&eacute;es d&#39;Etudes sur la Parole. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Lee, Jackson L., Ross Burkholder, Gallagher B. Flinn, and Emily R. Coppess. (2016). Working with CHAT transcripts in Python. <i>Technical report TR-2016-02</i>, Department of Computer Science, University of Chicago.</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Lestrade S. (2017). Unzipping Zipf&rsquo;s law. <i>PlosOne</i></span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">MacWhinney, B. (2000). The Childes Project: Tools for Analyzing Talk, Volume II: the Database (3rd ed.). <i>Psychology Press</i></span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Martel, K., &amp; Dodane, C. (2012). Le r&ocirc;le de la prosodie dans les premi&egrave;res constructions grammaticales : &eacute;tude de cas d&#39;un enfant fran&ccedil;ais monolingue. <i>Journal of French Language Studies</i>, <i>22</i>(1), 13-35</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Martin, L., Muller, B., Su&aacute;rez, P. J. O., Dupont, Y., Romary, L., de la Clergerie, &Eacute;. V., Sagot, B. (2020). CamemBERT: a Tasty French Language Model. In <i>ACL 2020-58th Annual Meeting of the Association for Computational Linguistics</i></span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Morgenstern A. ; Parisse C. (2012). The Paris Corpus. <i>French language studies</i> <i>22</i>. 7-12. Cambridge University Press. Special Issue</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Mucciardi M., Pirrotta G., Briglia A., Sallaberry A. (2021). Visualizing cluster of words: a graphical approach to grammar acquisition. In Giovanni C. Porzio; Carla Rampichini; Chiara Bocci (Eds). <i>CLADAG 2021 BOOK OF SHORT PAPERS. </i><i>13th Scientific Meeting of the Classification and Data Analysis Group - </i>Firenze University Press, pp.392-395</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Piantadosi S. (2014). Zipf&rsquo;s word frequency law in natural language: A critical review and future<br /> directions. <i>Psychon Bull Rev</i>.; 21(5): 1112&ndash;1130</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Prince, A., Smolensky P. (2004): Optimality Theory: Constraint Interaction in Generative Grammar. <i>Blackwell Publishers</i></span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Sauvage J. (2015). &nbsp;L&rsquo;acquisition du langage : un systeme complexe. <i>L&rsquo;Harmattan</i>, Louvain</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Siouffi, G., &amp; Steuckardt, A. (&eacute;ds). (2007). <i>Les linguistes et la norme</i>. Berne : Peter Lang</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Srikant R., Agrawal R. (1996). Mining Sequential Patterns: Generalizations and Per-formance Improvements. <i>Proceedings of the 5th International Conference on Extending Database Technology (EDBT&rsquo;96)</i>. Avignon. France. p. 3-1</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Szmrecsanyi, B. (2004). On operationalizing syntactic complexity, in: Purnelle, G&eacute;rard, C&eacute;drick Fairon and Anne Dister (eds.), Le poids des mots. <i>Proceedings of the 7th International Conference on Textual Data Statistical Analysis. </i><i>Vol. 2</i>. Louvain-la-Neuve, Presses Universitaires de Louvain. </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Thomson, J. R., &amp; Chapman, R. S. (1977). Who is daddy revisited: The status of two-year-olds&#39; over-extended words in use and comprehension. <i>Journal of Child Language, 4</i>(3), 359&ndash;375</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Tomasello, M., &amp; Stahl, D. (2004). Sampling children&#39;s spontaneous speech: How much is enough?. <i>Journal of child language</i>, <i>31</i>(1), 101-121</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Vihman, M. M. and McCune L. (1994). When is a word a word? <i>Journal of Child Language</i>, 21(3),<br /> 517&ndash;542</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Yamaguchi N. (2012).&nbsp; Parcours d&rsquo;acquisition des sons du langage chez deux enfants francophones. Phd thesis, Sorbonne Nouvelle University (Paris 3). </span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Yamaguchi N. (2018). What is a representative language sample for word and sound acquisition? <i>Revue canadienne de linguistique</i>. University of Toronto Press. 63 (04), pp.667-685</span></span></span></p> <p style="margin-bottom:11px"><span style="font-size:11pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;, sans-serif">Zipf G.K. (1949). Human behaviour and the principle of least effort. <i>Addison-Wesley.</i> Cambridge (MA), USA</span></span></span></p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <div>&nbsp; <hr align="left" size="1" width="33%" /> <div id="ftn1"> <p class="MsoFootnoteText"><span style="font-size:10pt"><span style="font-family:&quot;Calibri&quot;, sans-serif"><a href="#_ftnref1" name="_ftn1" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span style="font-size:10.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[1]</span></span></span></span></span></a> <a href="https://ct3xq.ortolang.fr/ct3xq/interro" style="color:blue; text-decoration:underline">https://ct3xq.ortolang.fr/ct3xq/interro</a> </span></span></p> </div> <div id="ftn2"> <p class="MsoFootnoteText"><span style="font-size:10pt"><span style="font-family:&quot;Calibri&quot;, sans-serif"><a href="#_ftnref2" name="_ftn2" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span style="font-size:10.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[2]</span></span></span></span></span></a> <a href="https://pylangacq.org/" style="color:blue; text-decoration:underline">https://pylangacq.org/</a> </span></span></p> </div> <div id="ftn3"> <p class="MsoFootnoteText"><span style="font-size:10pt"><span style="font-family:&quot;Calibri&quot;, sans-serif"><a href="#_ftnref3" name="_ftn3" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span style="font-size:10.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[3]</span></span></span></span></span></a> <a href="https://github.com/bartdag/pymining" style="color:blue; text-decoration:underline">https://github.com/bartdag/pymining</a> </span></span></p> </div> <div id="ftn4"> <p class="MsoFootnoteText"><span style="font-size:10pt"><span style="font-family:&quot;Calibri&quot;, sans-serif"><a href="#_ftnref4" name="_ftn4" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span style="font-size:10.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[4]</span></span></span></span></span></a> <a href="https://marine27.github.io/TER/index.html" style="color:blue; text-decoration:underline">https://marine27.github.io/TER/index.html</a> </span></span></p> </div> </div> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <p style="margin-bottom:11px">&nbsp;</p> <div>&nbsp; <hr align="left" size="1" width="33%" /> <div id="ftn1"> <p class="MsoFootnoteText"><span style="font-size:10pt"><span style="font-family:&quot;Calibri&quot;, sans-serif"><a href="#_ftnref1" name="_ftn1" style="color:blue; text-decoration:underline" title=""><span class="MsoFootnoteReference" style="vertical-align:super"><span class="MsoFootnoteReference" style="vertical-align:super"><span style="font-size:10.0pt"><span style="line-height:107%"><span style="font-family:&quot;Calibri&quot;,sans-serif">[1]</span></span></span></span></span></a> Lien pour le point pr&eacute;cis de l&rsquo;enregistrement o&ugrave; se trouve le mot cible (utiliser la query pour trouver d&rsquo;autres mots)&nbsp;: <a href="https://ct3.ortolang.fr/tools/trjsbrowser/trjs.html?f=/data/colaje/adrien/ADRIEN-34-4_03_26/ADRIEN-34-4_03_26.tei_corpo.xml&amp;m=/data/colaje/adrien/ADRIEN-34-4_03_26/ADRIEN-34-4_03_26-480p.mp4&amp;time=1380.0&amp;nowave" style="color:blue; text-decoration:underline">https://ct3.ortolang.fr/tools/trjsbrowser/trjs.html?f=/data/colaje/adrien/ADRIEN-34-4_03_26/ADRIEN-34-4_03_26.tei_corpo.xml&amp;m=/data/colaje/adrien/ADRIEN-34-4_03_26/ADRIEN-34-4_03_26-480p.mp4&amp;time=1380.0&amp;nowave</a> </span></span></p> </div> </div> <p style="margin-bottom: 11px; text-align: center;">&nbsp;</p>