<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><b>1. Introduction et contexte</b></font></font></font></span></span></span></span></p>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><a name="Introduction"></a> <font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Le domaine de la linguistique computationnelle connait un essor depuis les années 2000 grâce à l’évolution des logiciels de traitement automatique de langue (TAL) qui sont utilisés tant dans la recherche en linguistique de corpus que dans la didactique des langues. La liste non- exhaustive d’applications des outils TAL inclut la transcription, l’étiquetage, les recherches ciblées des collocations et d’usage des mots en contexte, les analyses morpho-syntaxiques, lexiques ou sémantiques, reconnaissance vocale, parmi plusieurs autres (voir Tutin et coll., s.d; Rohlfing et coll., 2006). <span style="background:#ffffff">En fonction de l’aspect envisagé du travail avec une langue, il est possible de parler de « ‘l’ingénierie linguistique’, quand l’accent est mis sur les aspects pratiques et opérationnels, ou de ‘linguistique informatique’, quand c’est la linguistique qui tient un rôle important dans les recherches »</span><span style="background:#ffffff"><a class="sdfootnoteanc" href="#sdfootnote1sym" name="sdfootnote1anc"><sup>1</sup></a></span><span style="background:#ffffff">. </span></font></font></font></span></span></span></span></p>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Dans la première partie de cette contribution, nous présentons l’application des logiciels TAL dans la recherche en donnant quelques définitions saillantes propres au champ disciplinaire étudié. L’article poursuit avec le traitement des données multimodales (écrites et orales) issues des productions des apprenants à l’aide d'</font><font color="#000000"><i>AntConc</i></font><font color="#000000">, dans le cadre de l’application des logiciels TAL dans la recherche. Notamment, nous mettons en lumière quelques fonctions saillantes de calcul relatives à l’analyse lexicale de l’interlangue</font><font color="#000000"><a class="sdfootnoteanc" href="#sdfootnote2sym" name="sdfootnote2anc"><sup>2</sup></a></font><font color="#000000"> des apprenants afin d’établir leur profil langagier.</font> <font color="#000000">De nombreuses exemples tirés de l’étude de cas corroborent cette présentation. L’article se termine avec le bilan concernant </font><font color="#000000">des fo</font><font color="#000000"> tout en soulignant le rôle des outils TAL dans l’analyse des données multimodales.</font></font></font></font></span></span></span></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Hlk154579144"></a> <font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">L’article se situe dans le cadre plus large d’un projet d’observation d’une classe CORINE-SEHEA<a class="sdfootnoteanc" href="#sdfootnote3sym" name="sdfootnote3anc"><sup>3</sup></a> sur un an dans un contexte secondaire français. 16 heures de cours (classe de Terminale SELO<font color="#000000"><a class="sdfootnoteanc" href="#sdfootnote4sym" name="sdfootnote4anc"><sup>4</sup></a></font>, histoire-géographie enseignée en L2 anglais ; L1 français) sont enregistrées, des productions écrites des apprenants (brouillons<font color="#000000"><a class="sdfootnoteanc" href="#sdfootnote5sym" name="sdfootnote5anc"><sup>5</sup></a></font>, notes des cours, fiches hybrides<font color="#000000"><a class="sdfootnoteanc" href="#sdfootnote6sym" name="sdfootnote6anc"><sup>6</sup></a></font>, évaluations du vocabulaire) récoltées<font color="#000000"><a class="sdfootnoteanc" href="#sdfootnote7sym" name="sdfootnote7anc"><sup>7</sup></a></font>. Les données obtenues sont ensuite transcrites, le corpus multimodal (écrit et oral) de 119 000 mots constitué et analysé. L'analyse du corpus explore l'interlangue des élèves par le biais de cinquante mesures à l'aide des logiciels TAL : <i>Exmaralda, CLAN,</i> <i>AntConc, SketchEngine, UAM Corpus Tool, et Hyperbase</i>. Le travail de recherche étudie dans quelle mesure un statut particulier de la langue en cours immersifs EMILE (à la fois un objet et un outil d'apprentissage) modifie les conditions et les résultats de l'apprentissage. Les analyses ouvrent des pistes de réflexion sur l'enjeu principal d'EMILE : donner une place à la langue étrangère en tant qu'outil d'accès aux connaissances de la DNL<a class="sdfootnoteanc" href="#sdfootnote8sym" name="sdfootnote8anc"><sup>8</sup></a> pour le plus grand nombre d'élèves possible. </font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><b>2. L’application des logiciels TAL dans la recherche</b></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">Dans la recherche de la linguistique du corpus un double type d’exploration de données est possible à l’aide des outils TAL : l’approche montante (</span><i><span style="font-weight:normal">corpus-based research</span></i><span style="font-weight:normal">) et l’approche descendante (</span><i><span style="font-weight:normal">corpus-driven research</span></i><span style="font-weight:normal">) (deux termes de Tognini-Bonelli, 2001). En effet, nous essayons d’effectuer une exploration de plusieurs phénomènes, notamment ceux relatifs à l’utilisation de la langue par les élèves en cours CORINE, dans une technique de complémentarité, sorte de « chassé-croisé » : </span></font></font></font></span></p>
<ul>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">L’approche ascendante (</span></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i><span style="font-weight:normal">corpus-based</span></i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">) est susceptible d’apporter des réponses concernant certai</span></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">ns aspects du concept CORINE à partir des questions préalablement posées sur les </font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">phénomènes</font></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> que nous voudrions étudier. Par exemple, n</font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">ous avons exploré dans quelle mesure </span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i><span style="font-weight:normal">l’input</span></i></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal"> des professeurs impacte </span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i><span style="font-weight:normal">l’output</span></i></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal"> des élèves, c’est-à-dire, tout ce que les élèves ont retenu et utilisé dans leurs productions – la réception et la restitution des concepts clés en classe européenne</span></font></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">.</span></font></font></font></span></span></span></span></span></p>
</li>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">L’approche descendante (inductive ou corpus-driven) permet d’observer les phénomènes récurrents et d’étudier les caractéristiques linguistiques qui émanent du corpus CORINE sans qu’une question précise soit posée à l’avance. C’est à partir de ces phénomènes observés dans le corpus que nous formulons une série de questions pour étudier un élément souhaité, faisant ainsi du corpus le déclencheur des connaissances. Par exemple, nous avons constaté que l’utilisation du mot </font><font color="#000000"><i>government</i></font><font color="#000000"> par des élèves varie selon la discipline et le type de production (écrite ou orale). Cela soulève des questions concernant les défis potentiels dans l’appropriation de </font><font color="#000000"><i>government</i></font><font color="#000000">, notamment en ce qui concerne les collocations </font><font color="#000000">(NN)</font><font color="#000000"> du mot dans l’</font><font color="#000000"><i>input</i></font><font color="#000000"> des enseignants et dans les productions des élèves. </font></font></font></font></span></span></span></span></p>
</li>
</ul>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Comment explorer le corpus et quelles données est-il possible d’obtenir à l’aide des logiciels TAL ? Les productions sont susceptibles de faire émerger des informations utiles afin de comprendre l’utilisation de la langue par les apprenants. Ces données peuvent renseigner au sujet de la qualité des productions des élèves, des mots et des expressions les plus fréquents, mais aussi permettent d’observer le taux de mots erronés et leur fréquence, les types d’erreurs et leur évolution dans les élocutions des apprenants. Par exemple, nous nous sommes servis du logiciel <i>AntConc</i> dans l’optique de faire émerger les phénomènes les plus fréquents et les plus spécifiques du corpus CORINE.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#2b1e1b">L’annotation et le codage des erreurs imposent certaines contraintes dans le calcul du nombre de mots dans le corpus des apprenants.</font> <font color="#2b1e1b">Le calcul s’avère différent en fonction du logiciel utilisé. </font><font color="#2b1e1b"><i>AntConc</i></font><font color="#2b1e1b"> compte le nombre des mots, </font><font color="#2b1e1b">tandis que d’autres logiciels (comme </font><font color="#2b1e1b"><i>SketchEngine</i></font><font color="#2b1e1b">) calcule les lemmes</font><font color="#2b1e1b">. </font><font color="#2b1e1b">Par ailleurs,</font><font color="#2b1e1b"> le traitement des erreurs dans le corpus oral </font><font color="#2b1e1b">devient plus efficace grâce à </font><font color="#2b1e1b"><i>AntConc</i></font><font color="#2b1e1b">, puisque ce logiciel est configurable pour ignorer les erreurs mises entre les balises (< >). </font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Dans l</font><font color="#000000">a</font><font color="#000000"> section suivante nous présentons quelques fonctionnalités d</font><font color="#000000">u</font><font color="#000000"> logiciel </font><font color="#000000"><i>AntConc, </i></font><font color="#000000"><span style="font-style:normal">un des</span></font><font color="#000000"> plus connus dans le domaine de la linguistique du corpus </font><font color="#000000"><span style="font-style:normal">de par de ces fonctionnalités permettant</span></font><font color="#000000"> </font><font color="#000000">explorer un</font><font color="#000000"> corpus multimodal d’apprenants. </font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><b>3</b><b>. Logiciel AntConc</b></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Le logiciel <i>AntConc</i><a class="sdfootnoteanc" href="#sdfootnote9sym" name="sdfootnote9anc"><sup>9</sup></a> a été développé par L.Anthony en 2002, depuis cet outil ne cesse pas de gagner de plus en plus le terrain dans la linguistique computationnelle, grâce notamment à son interface intuitive et à son aspect pratique dans la recherche. Si la toute première version 1.0<a class="sdfootnoteanc" href="#sdfootnote10sym" name="sdfootnote10anc"><sup>10</sup></a> était un concordancier permettant de faire des requêtes de base (générer des lignes de concordance) dans un texte ou dans un groupe de textes, la dernière version (<i>AntConc</i> 4.2.4, sortie en septembre 2023) est complète et sophistiquée. Développé en langage <i>Python </i>et <i>Qte</i>, le programme est compatible avec des systèmes <i>Windows, Linux</i> et <i>MacOS</i>, décrit par l’auteur comme « a multiplatform tool for carrying out corpus linguistics research, introducing corpus methods, and doing data-driven language learning”.<a class="sdfootnoteanc" href="#sdfootnote11sym" name="sdfootnote11anc"><sup>11</sup></a></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Citons quelques fonctionnalités de AntConc et leurs applications dans le traitement du corpus.</font></font></font></span></p>
<p align="justify" style="display:block;margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">1) Chercher un mot (requête simple) dans un texte.</font></font></font></span></span></span></span></span></p>
<p align="justify" style="display:block;margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">a. Compléter des requêtes simples afin d’effectuer des recherches plus avancées en utilisant la fonction <i>wordcard/joker</i> :</font></font></font></span></span></span></span></p>
<ul>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">le joker « * » est utile pour la recherche des formes de verbes (p.ex. <i>help*</i> <i>= helping, helped)</i>; </font></font></font></span></span></span></span></span></p>
</li>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">le joker « + » permet de chercher zéro ou un signe après le joker (p.ex. <i>government+</i> = <i>government agreed)</i>; </font></font></font></span></span></span></span></p>
</li>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">le joker « @ » fait des recherches qui portent sur un mot entier : (p.ex. <i>the @ government = the British government, the new government</i>…) </font></font></font></span></span></span></span></p>
</li>
</ul>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">b. Utiliser les expressions régulières : </font></font></font></span></p>
<ul>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">chercher tous les mots qui commencent par une séquence souhaitée : p.ex. <b>b</b>gov = <i>government</i>; </font></font></font></span></span></span></span></span></p>
</li>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">chercher tous les mots qui se terminent par une séquence souhaitée : p.ex. ent<b>b = </b><font color="#000000"><i>government, contentment</i></font><font color="#000000">, </font><font color="#000000"><i>document</i></font> ;</font></font></font></span></span></span></span></p>
</li>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">chercher des mots qui contiennent des séquences souhaitées, p.ex. tous les mots qui commencent par « n » et accessoirement qui contiennent « a » et/ou « t », et/ou « s » (p.ex. <b>b</b>n[ats]= <i>nationality, names, name, nature, nationhood</i>) ;</font></font></font></span></span></span></span> <span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">le motif [ ] va chercher (tous, ou un des) caractères qui se trouvent entre les crochets, p.ex. [cha]).</font></font></font></span></span></span></span></p>
</li>
</ul>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">c. Utiliser des mots ciblés pour des recherches avancées dans un texte avec la fonction <i>Use search term from list below</i>, ou encore <i>Use context words and horizons</i> (cliquer sur le champ <i>Advanced</i> , saisir le mot recherché, cliquer sur <i>Apply</i> pour valider le choix; <i>AntConc</i> va chercher les mots indiqués cinq caractères à gauche et/ou à droite à côté des mots choisis dans la première fonction). </font></font></font></span></span></span></span></p>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#111111">2) </font><font color="#111111">C</font><font color="#111111">herche</font><font color="#111111">r</font><font color="#111111"> des mots les plus fréquemment utilisés dans le corpus.</font></font></font></font></span></span></span></span></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">La figure 1 fait émerger des items très variés : des substantifs, des verbes, des pronoms, des adjectifs, des mots grammaticaux, des conjonctions, des chiffres, qui relèvent des thématiques abordés en cours</span></font></font></font></font><b><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> </font></font></font></font></b><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">de la section européenne</span></font></font></font></font><b><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">. </font></font></font></font></b><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Cependant, les caractéristiques langagières diffèrent considérablement selon que le corpus est général ou spécialisé. Il est logique de supposer que le corpus spécialisé dans un domaine précis aurait une tendance à avoir une charge lexicale plus importante dans ce champ concerné qu’un corpus général aux thématiques plus variés.</font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><img height="634" src="https://www.numerev.com/img/ck_3376_32_image-20240719210615-1.png" width="1089" /></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc139300491"></a><b><span style="font-variant:small-caps"><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Figure</font></font></font></font></span><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> 1. Cent dix mots les plus fréquents du corpus </font></font></font></font></b><b><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">CORINE</font></font></font></font></b><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">.</span></font></font></font></font></span></p>
<p align="justify" style="display:block;margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">3) C</span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">herche</span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">r</span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal"> des mots académiques, fonction </span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i><span style="font-weight:normal">Use specific list below</span></i></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> </font></font></font></font></span></span></span></span></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">Afin de déterminer le </span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">type</span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal"> du vocabulaire </span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">(général, académique ou spécialisé) </span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-weight:normal">utilisé par des apprenants dans leurs discours, nous avons comparé</span></font></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> le corpus CORINE avec la liste des mots académiques (</font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i>AWL</i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">)</font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><a class="sdfootnoteanc" href="#sdfootnote12sym" name="sdfootnote12anc"><sup>12</sup></a></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> utilisée en tant que liste de référence dans </font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i>AntConc</i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><a class="sdfootnoteanc" href="#sdfootnote13sym" name="sdfootnote13anc"><sup>13</sup></a></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> pour voir si les mots académiques les plus fréquents apparaîssent dans notre corpus d’étude. </font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><img height="640" src="https://www.numerev.com/img/ck_3376_32_image-20240719210802-2.png" width="1058" /></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc139300456"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-variant:small-caps"><font color="#000000"><b>Figure </b></font></span><font color="#000000"><b>2. </b></font><font color="#000000"><span style="font-style:normal"><b>Quatre-vingt mots académiques les plus fréquents du corpus CORINE</b></span></font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000"><i>AntConc</i></font><font color="#000000"> a relevé trois cent vingt-sept types de mots et 4 001 occurrences de mots académiques (</font><font color="#000000"><i>word tokens</i></font><font color="#000000">) dans le corpus CORINE. La </font>figure<font color="#000000"> 2 présente les premiers quatre-vingt d’entre eux. Les résultats affichés mettent en avant plusieurs choses. Premièrement, une grande majorité des mots académiques sont des substantifs du champ sémantique socio-economique : </font><font color="#000000"><i>labour, policy, culture, welfare, economy, community, job, currency, income, decline, infrastructure</i></font><font color="#000000">, etc. Ensuite, le champ sémantique à connotation politique et militaire est aussi représenté par des substantifs et des adjectifs comme : </font><font color="#000000"><i>nuclear, conflict, military, revolution, ideology. </i></font><font color="#000000">Les verbes académiques les plus fréquents sont : </font><font color="#000000"><i>created, consume, contribute, remove, invest. </i></font><font color="#000000">Les mots comme</font><font color="#000000"><i> process, debate et access </i></font><font color="#000000">nécessitent une vérification au cas par cas, car ils peuvent comprendre plusieurs parties de discours (les verbes et les substantifs) en même temps. </font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Outre ces mots qui relèvent du contenu des cours, nous trouvons aussi les mots propres à la didactique, comme </font><font color="#000000"><i>debate, document</i></font><font color="#000000"><a class="sdfootnoteanc" href="#sdfootnote14sym" name="sdfootnote14anc"><sup>14</sup></a></font><font color="#000000"> : </font></font></font></font></span></p>
<ul>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">des consignes comprises dans les titres des supports : </font><font color="#000000"><i>Reading comprehension, oral debate</i></font><font color="#000000"><b> ; </b></font><font color="#000000"> </font></font></font></font></span></span></span></span></span></p>
</li>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">des consignes des professeures à l’oral : </font><font color="#000000"><i>Make a debate with your neigbour ; You just look at the document and try to answer the question ; And now focus on the document entitled…;</i></font></font></font></font></span></span></span></span></p>
</li>
<li>
<p align="justify" style="margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">la méthodologie de l’analyse des supports appliquée par des élèves lors des productions</font><font color="#000000"><b> </b></font><font color="#000000"><i>: The second document describes a man who works...</i></font></font></font></font></span></span></span></span></p>
</li>
</ul>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Globalement nous constatons que les mots académiques dont la fréquence est importante sont très peu nombreux. Au-delà de l’adjectif </font><font color="#000000"><i>major</i></font><font color="#000000"> à la dix-septième position dans le corpus la fréquence de toutes les unités descend en dessous de cinquante occurrences. Ceci laisse penser que le nombre de mots académiques du corpus CORINE est relativement bas, ce qui indique à son tour que le vocabulaire des cours observés est probablement hautement spécifique.</font></font></font></font></span></p>
<p align="justify" style="display:block;margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">4) </font><font color="#000000">C</font><font color="#000000">herche</font><font color="#000000">r</font><font color="#000000"> des substantifs fréquents repris par des apprenants dans leurs productions, fonctionnalité </font><font color="#000000"><i>plot.</i></font></font></font></font></span></span></span></span></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Dans quelle mesure les mots communément employés par les professeures dans leurs cours (LV et DNL) sont-ils répétés dans les productions des élèves ? Nous avons observé si les élèves utilisent plus souvent dans leurs productions le lexique donné par la professeure de langue ou par la professeure d’histoire-géographie. L’analyse est effectuée en traçant l’origine du mot grâce à la fonction de </font><font color="#000000"><i>AntConc</i></font><font color="#000000"> « visualisation topologique » (</font><font color="#000000"><i>plot</i></font><font color="#000000">) ainsi qu’en observant les collocations du mot (fonction </font><font color="#000000"><i>Collocations</i></font><font color="#000000">) et des tâches pédagogiques dans les cours où les deux enseignantes aborde le même thème. </font><font color="#000000">Cela permet de voir si le contexte d’utilisation du mot change de </font><font color="#000000"><i>l’input </i></font><font color="#000000">à </font><font color="#000000"><i>l’output,</i></font><font color="#000000"> ce qui contribuera à notre réflexion sur les conditions spécifiques de l’apprentissage et sur la complexité du dispositif EMILE.</font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Analyse d’un cas particulier : </font><font color="#000000"><i>government.</i></font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Le mot fréquent <i>government</i> figure dans <i>l’output</i> des élèves est communément employé par les deux professeures. Comment ce mot est-il employé dans les productions des apprenants ? Le substantif est employé 64 fois dans les productions des élèves (Fig. 3). </font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><img height="235" src="https://www.numerev.com/img/ck_3376_32_image-20240719210843-3.png" width="1047" /><br />
<span style="line-height:100%"><a name="_Toc139300493"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-variant:small-caps"><span style="font-style:normal"><b>Figure</b></span></span><span style="font-style:normal"><b> 3</b></span>. <span style="font-style:normal"><b>Distribution du mot fréquent </b></span><b>government </b><span style="font-style:normal"><b>dans le corpus des élèves</b></span><span style="font-style:normal"><b> </b></span></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">D’après la figure 3 ce substantif est le plus souvent utilisé par des élèves à l’oral en cours d’histoire-géographie (</font><font color="#000000">26</font><font color="#000000"> occurrences), suivi dans l’ordre décroissant de fréquence par le sous-corpus écrit, également en cours de DNL (</font><font color="#000000">15</font> <font color="#000000">occurrences</font><font color="#000000">), puis en cours de langue à l’écrit (</font><font color="#000000">13</font><font color="#000000"> occurrences) et à l’oral (</font><font color="#000000">10</font><font color="#000000"> occurrences). </font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Même si les élèves ont recours au mot </font><font color="#000000"><i>government</i></font><font color="#000000"> communément utilisé dans les deux disciplines, sa fréquence totale en DNL reste supérieure après relativisation : 25,6 occurrences dans les productions en DNL versus 16,7 en LV pour 10 000 mots (soit 21 % d’écart entre deux disciplines)</font><font color="#000000"><a class="sdfootnoteanc" href="#sdfootnote15sym" name="sdfootnote15anc"><sup>15</sup></a></font><font color="#000000">. Par ailleurs, l’utilisation de ce mot est presque deux fois plus fréquente à l’écrit que à l’oral quelle que soit la discipline. </font><font color="#000000">Une analyse plus approfondie</font><font color="#000000"> montre que le substantif </font><font color="#000000"><i>government</i></font><font color="#000000"> est repris par des élèves dans les deux disciplines mais </font><font color="#000000"><i>l’output </i></font><font color="#000000">se fait dans un degré variable selon la discipline et le type de production dans les sous-corpus : écrit ou oral. </font>La question se pose, par conséquent, par rapport à un autre défi possible dans l’appropriation de <i>government</i> : les collocations du mot (<font color="#000000">NN)</font> dans<i> l’input</i> des professeures et dans les productions des élèves.</font></font></font></span></p>
<p align="justify" style="display:block;margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">5) </font><font color="#000000">Che</font><font color="#000000">rche</font><font color="#000000">r</font><font color="#000000"> des collocations avec</font><font color="#000000"><b> </b></font><font color="#000000"><i>government (NN),</i></font><font color="#000000"><i><b> </b></i></font><font color="#000000">fonction</font><font color="#000000"><i> Collocations.</i></font></font></font></font></span></span></span></span></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">En anglais il est souvent employé dans des compositions nominales NN (</font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i>government policy,</i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> etc.). Y a-t-il des modèles de cet usage dans l'</font></font></font><em><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">input</font></font></font></em><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">, le modèle est-il repris par les élèves ? </font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Nous avons observé quatre types collocations dans les</font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i> inputs </i></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">donnés par les professeures : </font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i>government intervention, government polic*</i></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> (</font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i>policy/policies</i></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">), </font></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i>inter-government organisation, government ministers.</i></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Dans les productions<i> (outputs)</i> des élèves, une seule collocation autour de <i>government </i>(NN) a été trouvée : <i>government policies</i> (dans l’énoncé : "<i>There are many factors attracting TNCs to a country, <err> cheap raw materials, cheap labour supply, good transport, access to markets where the goods are sold, friendly government policies</i><i><b>"</b></i><i>, </i>Fig.4<i>),</i> la production est faite en cours de DNL dans l'exercice du groupe suite à l'étude du support « Globalisation and TNCs ».</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">La recherche dans <i>AntConc</i> concernant le parcours du mot <i>government </i>dans les productions<i> </i>des élèves montre que les apprenants ne reprennent pas ce mot systématiquement dans le même contexte que celui des professeures, ils ont une tendance à créer de nouveaux blocks (Biber 2006), parfois remplacent le mot par d’autres termes.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><img height="698" src="https://www.numerev.com/img/ck_3376_32_image-20240719210932-4.png" width="1554" /></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc139300457"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-variant:small-caps"><font color="#111111"><b>Figure</b></font></span><font color="#111111"><b> 4. </b></font><font color="#111111"><span style="font-style:normal"><b>Collocation de type NN dans les productions des élèves.</b></span></font></font></font></font></span></p>
<p align="justify" style="display:block;margin-bottom:2px"><span style="background:transparent"><span style="line-height:100%"><span style="orphans:2"><span style="widows:2"><span style="page-break-before:auto"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#111111">6) </font><font color="#111111">C</font><font color="#111111">herche</font><font color="#111111">r</font><font color="#111111"> des mots spécifiques, fonction </font><font color="#111111"><i>key words</i></font></font></font></font></span></span></span></span></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Les mots spécifiques qui émergent dans le corpus CORINE par rapport au corpus de référence </font><font color="#000000"><i>LOCNESS </i></font><font color="#000000">(Fig.5) renvoient aux contextes particuliers de leurs emplois. Au travers des mots clés qui apparaîssent dans cette analyse nous pouvons accéder au champ didactique et tracer les thèmes spécifiques abordés en cours, comme </font><font color="#000000"><i>The Welfare State, Trade Unions and miners’ strikes, The nationalisation of industries, Political party, Economic crisis, wages and employment</i></font><font color="#000000">, etc. Dans un sens plus large ce lexique est le reflet des programmes d’enseignement propres aux sections européennes dans le secondaire en France. Par ailleurs, la présence très faible des mots académiques laisse suggérer que la place la plus importante est occupée par un vocabulaire plus ciblé, hypothèse qui sera confirmée par des analyses supplémentaires du corpus.</font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><img height="666" src="https://www.numerev.com/img/ck_3376_32_image-20240719211001-5.png" width="1057" /></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc1393005001"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-variant:small-caps"><font color="#111111"><b>Figure </b></font></span><font color="#111111"><b>5.</b></font> <font color="#000000"><span style="font-style:normal"><b>Cinquante mots spécifiques relevés dans le corpus écrit des élèves CORINE (corpus de référence LOCNESS)</b></span></font><font color="#000000"><b><a class="sdfootnoteanc" href="#sdfootnote16sym" name="sdfootnote16anc"><sup>16</sup></a></b></font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000"><span style="font-style:normal"><span style="font-weight:normal">7)</span></span></font><font color="#000000"><span style="font-style:normal"><b> </b></span></font><span style="font-style:normal"><span style="font-weight:normal">Chercher des s</span></span><span style="font-style:normal"><span style="font-weight:normal">équences des mots/N-grams. </span></span></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Un N-gr est une série d’unités (bigram = 2 unités, trigram = 3 unités, N-gram = n unités)<a class="sdfootnoteanc" href="#sdfootnote17sym" name="sdfootnote17anc"><sup>17</sup></a>. </font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">La recherche de N-grams est une fonction intégrée dans la plupart des concordanciers comme <i>AntConc</i> ou <i>SketchEngine</i>. Cependant, d’un logiciel à l’autre il existe des différences sensibles quant au calcul du nombre d’occurrences des N-grams. Ceci peut être expliqué par la façon dont chaque logiciel prend en compte les expressions/combinaisons des mots du corpus. Selon que les combinaisons des mots sont considérées en tant qu’une variation de la même expression ou comme une expression à part (donc un nouveau N-gram) leur nombre peut varier considérablement. </font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Nous avons utilisé la fonction de N-grams</font><font color="#000000"> (</font><font color="#000000"><i>clusters</i></font><font color="#000000">) de </font><font color="#000000"><i>AntConc </i></font><font color="#000000">afin de </font><font color="#000000">relever les éléments propres au discours oral dans des productions des apprenants (Fig.6). Les mots et les expressions les plus fréquemment utilisés sont représentatifs des cours dans le contexte d’EMILE, afin de répondre à une tâche pédagogique demandée.</font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Les éléments liés au contenu des cours émergent : de nombreuses dates (</font><font color="#000000"><i>in nineteen seventy, nineteen forty-five</i></font><font color="#000000">), les noms des endroits géographiques qui apparaîssent en fonction des sujets étudiés en section européenne ; la description et l’analyse d’une image (</font><font color="#000000"><i>we can see</i></font><font color="#000000">) ; les contraintes méthodologiques à respecter : présenter la nature du document (</font><font color="#000000"><i>document is a ; is a caricature</i></font><font color="#000000">), structurer le discours (</font><font color="#000000"><i>the first document ; the second document</i></font><font color="#000000">). </font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#000000">Par ailleurs, la structure syntaxique du discours peut être tracée grâce aux mots fréquents. Par exemple, le mot </font><font color="#000000"><i>that</i></font><font color="#000000"> (en tant que pronom relatif ou conjonction de subordination) indique l’utilisation d’énoncés complexes par les élèves (</font><font color="#000000"><i>that the Cold [war] ; that globalization is, that globalization can</i></font><font color="#000000">), ou encore la présence des propositions principales connectées avec les conjonctions de coordination </font><font color="#000000"><i>and (and we can</i></font><font color="#000000">) et de subordination </font><font color="#000000"><i>because</i></font><font color="#000000">, ce dernier introduisant des propositions subordonnées de cause (</font><font color="#000000"><i>because of the, because it’s</i></font><font color="#000000">).</font></font></font></font></span><br />
</p>
<p align="justify" style="margin-bottom:2px"><img height="471" src="https://www.numerev.com/img/ck_3376_32_image-20240719211018-6.png" width="843" /></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc139300500"></a> <font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-variant:small-caps"><span style="font-style:normal"><b>Figure 6.</b></span></span><span style="font-style:normal"><b> </b></span><span style="font-style:normal"><b>3-grams les plus fréquents dans les productions des élèves</b></span></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><b>4. Conclusion.</b></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc139300460"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><font color="#111111">Nous avons montré dans la présente </font><font color="#111111">contribution</font><font color="#111111"> comment grâce à des certaines fonctionnalités de </font><font color="#111111"><i>AntConc </i></font><font color="#111111">il est possible d’explorer le corpus des apprenants en section européenne dans le but d’étudier l’évolution de l’interlangue et d’établir leur profil lexical. Notamment, nous avons observé la façon dont les élèves approprient les items lexicaux, </font><font color="#111111">ainsi que </font><font color="#111111">la fréquence et le </font><font color="#111111">type du </font><font color="#111111">vocabulaire employé; nous avons </font><font color="#111111">également </font><font color="#111111">tracé les origines du mot afin de comprendre dans quelle mesure les apprenants se servent du modèle linguistique donné par les professeurs. Par ailleurs, comme nous avons vu, </font><font color="#111111"><i>AntConc </i></font><font color="#111111">permet de visualiser la distribution du mot (</font><font color="#111111"><i>plotting</i></font><font color="#111111">) dans les productions orales et écrites, de comparer la fréquence et type de lexique utilisé dans le corpus d’étude et dans les corpus de référence, de générer des lignes de concordance à l’aide de la liste prédéfinie, de rechercher des groupes nominaux et des </font><font color="#111111"><i>clusters</i></font><font color="#111111"> dans le contexte ciblé, ou encore de </font>vérifier le contexte originel d’un mot (collocations)<font color="#111111">. Enfin, </font><font color="#111111"><i>AntConc</i></font><font color="#111111"> est très utile lors de traitement des erreurs dans le corpus, car l’information que l’on ne souhaite pas afficher (par ex. les mots non-normés, marqueurs d’hésitations, etc.) peut être mise entre les balises, ainsi ces informations ne seront pas prises en compte par </font><font color="#111111"><i>AntConc</i></font><font color="#111111"> lors d’un calcul des mots ou de génération des lignes de concordance. </font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Cependant, <i>AntConc </i>a des désavantages : le texte, pour être analysé par le logiciel, doit adopter le format TXT (texte brut), sinon <font color="#000000">aux formats HTML ou XML</font>. Ces derniers, cependant, sont exploitables de façon limitée, car les balises contenues dans les titres, par exemple <font color="#000000"><H1> à <H6>,</font> ne sont pas prises en compte. Le<font color="#000000"> coloriage thématique n’est pas non plus disponible. Enfin, le fait de doubler les entrées textuelles (mettre les informations non-souhaitées (erreurs) entre les balises toute en proposant la version corrigée juste après) influe sur la taille du corpus et peut éventuellement fausser la comptabilisation des données du corpus traité par d’autres logiciels. </font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Nous espérons par notre travail participer activement à une réflexion nécessaire concernant l’utilisation du corpus des apprenants dans le but d’étudier le fonctionnement de la langue, ainsi que pour la formation possible des professeurs qui travaillent avec la textométrie. Le champ de recherche en lien avec notre corpus d’étude reste ouvert, pour contribuer à une réflexion sur les usages des corpus de linguistique en France, mais aussi sur l’avenir du dispositif EMILE, tout en prenant en compte sa spécificité et son atout majeur – la langue comme un moyen d’accès aux connaissances de la DNL. </font></font></font><a name="_Toc139300488"></a></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc139300512"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><b>Annexe 1.</b></font></font></font></span></p>
<table width="537">
<colgroup>
<col width="67" />
<col width="113" />
<col width="164" />
<col width="159" />
</colgroup>
<tbody>
<tr>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:67px; height:36px">
<p align="justify"> </p>
</td>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:113px">
<p align="justify"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Source d’informations initiales</font></font></font></p>
</td>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:164px">
<p align="justify"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Type de données recueilli </font></font></font></p>
</td>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:159px">
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Données obtenues </font></font></font></p>
<p align="justify"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">(output des élèves)</font></font></font></p>
</td>
</tr>
<tr>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:67px; height:53px">
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Échantillon </font></font></font></p>
<p align="justify"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">(19 élèves)</font></font></font></p>
</td>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:113px">
<p align="justify"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">enregistrements vidéos </font></font></font></p>
</td>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:164px">
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">-trace écrite au tableau ;</font></font></font></p>
<p align="justify"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">-discours des élèves en classe : cours et évaluations (réponses, débats, discussions, monologues)</font></font></font></p>
</td>
<td rowspan="3" style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:159px">
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">productions écrites : 95</font></font></font></p>
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Productions orales : </font></font></font></p>
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">16 heures de cours + </font></font></font></p>
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">11 fichiers d’auto-enregistrement </font></font></font></p>
<p align="justify"> </p>
</td>
</tr>
<tr>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:67px; height:98px">
<p align="justify"> </p>
</td>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:113px">
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">photographies </font></font></font></p>
<p align="justify"> </p>
</td>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:164px">
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">-notes de cours (trace écrites) faites en classe ;</font></font></font></p>
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">-brouillons de préparation des tâches pédagogiques ;</font></font></font></p>
<p align="justify" style="margin-bottom:2px"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">-fiches de travail « hybride » ;</font></font></font></p>
<p align="justify"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">-évaluations écrites (fiches de vocabulaire ; affiches).</font></font></font></p>
</td>
</tr>
<tr>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:67px; height:21px">
<p align="justify"> </p>
</td>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:113px">
<p align="justify"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">enregistrements sonores </font></font></font></p>
</td>
<td style="border-bottom:1px solid #000000; padding:0.1cm; border-top:1px solid #000000; border-right:1px solid #000000; border-left:1px solid #000000; width:164px">
<p align="justify"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">-évaluations orales (auto-enregistrements hors classe)</font></font></font></p>
</td>
</tr>
</tbody>
</table>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="Bibliographie"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="font-variant:small-caps"><b>Tableau</b></span><b> 1. Sources d’informations initiales, type et quantité de données obtenues</b></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="Les_renvois_à_des_références_bibliograph"></a> <font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="letter-spacing:-0.1pt">5</span><span style="letter-spacing:-0.1pt">.Bibliographie</span></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc94102573"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Anthony, L. AntConc (Version 4.0.0) [Computer Software]. Tokyo, Japan: Waseda University, 2021.URL: https://www.laurenceanthony.net/software.html</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc94102937"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Benabbes, S. </font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="background:#ffffff">« Du brouillon au texte final : accompagner les élèves du secondaire pour une amélioration de la pratique scripturale en FLE ». </span></font></font></font></font><em><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="background:#ffffff">Les Cahiers de Didactique des Lettres</span></font></font></font></em><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="background:#ffffff"> [En ligne], s.d.</span></font></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc94104063"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Biber, D. <i>University language: A corpus – based study of spoken and written registers.</i> Benjamin, 2006.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc94104548"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Conseil de l’Europe. « Cadre européen commun de référence—Apprendre, enseigner, évaluer ». Les Éditions Didier, 2001.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc96072852"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><span style="background:#ffffff">Corder, S. P. </span><i><span style="background:#ffffff">Error analysis and interlanguage.</span></i><span style="background:#ffffff"> Oxford University Press, 1981.</span></font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc94104957"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Dostie, G. et Lefeuvre, F. (éds), (2017), <i>Lexique, grammaire, discours. Les marqueurs discursifs.</i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> Paris, Honoré</font></font></font><font face="Times New Roman, serif"> </font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Champion.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc94105106"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Galatanu, O. « Les marqueurs illocutionnaires holophrastiques du désaccord : sémantisme et<font face="Times New Roman, serif"> </font>polyphonie fonctionnelle d'une classe de phraséologismes pragmatiques ».</font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i> Lexique,</i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> </font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">n</font></font></font><sup><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">o</font></font></font></sup><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> 29, p.75-95, 2021.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc96096117"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Granger, S., Gilquin, G., et Meunier, F. (dir.). <i>The Cambridge handbook of learner corpus research</i> (1 ed.). Cambridge University Press, 2015.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Hlk106266247"></a> <font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Johns, T. “Should you be persuaded. Two samples of data-driven learning materials”. Dans T. Johns et P. King (dir.). <i>Classroom concordancing. English Language Research Journal</i>. n<sup>o</sup> 4, p.1–16, 1991.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc138411233"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Rohlfing, K., Loehr, D., Duncan, S., Brown, A., Franklin, A., Kimbara, I., Milde, J.-T., Parrill, F., Rose, T., Schmidt, T., Sloetjes, H., Thies, A. et Wellinghoff, S. “Comparison of multimodal annotation tools”. <i>Gersprachsforschung, </i>n<sup>o</sup><i> 7</i>, p.99-123, 2006.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="__RefHeading___Toc200981_3172837573"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Selinker, L. “Interlanguage”. <i>International Review of Applied Linguistics</i>. 10 (3), p.219-31, 1972.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Hlk106266292"></a> <font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Steuckardt, A. (2018). Les marqueurs de reformulation formés sur dire : exploration outillée. </font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"><i>Langages</i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">, (4), 17-34.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc139300458"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Tognini-Bonelli, E. “Corpus linguistics at work”<i>. Studies in corpus linguistics</i>. John Benjamins Publishing, n<sup>o</sup> 6, 2001.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Hlk1062662471"></a> <font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Tutin, A., Jaques, M-P., Kraif, O. et Hartwell, L. <i>Introduction à la linguistique de corpus.</i> [Cours en ligne de l'UGA], s.d.URL : https://www.fun-mooc.fr/fr/cours/introduction-a-la-linguistique-de-corpus/.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"><span style="line-height:100%"><a name="_Toc139300459"></a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt">Quivy, M., et Garnier-Tardieu, C. <i>Glossaire de didactique de l’anglais</i> (2e éd.). Ellipses, 2002.</font></font></font></span></p>
<p align="justify" style="margin-bottom:2px"> </p>
<div id="sdfootnote1">
<p class="sdfootnote"><a class="sdfootnotesym" href="#sdfootnote1anc" name="sdfootnote1sym">1</a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> </font></font></font><font color="#000080"><u><a href="https://www.universalis.fr/encyclopedie/traitement-automatique-des-langues/"><font color="#0000ff"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">https://www.universalis.fr/encyclopedie/traitement-automatique-des-langues/</font></font></font></font></a></u></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> </font></font></font></p>
</div>
<div id="sdfootnote2">
<p align="justify" class="sdfootnote"><a name="_Hlk98856140"></a><a name="_Hlk98856156"></a> <a class="sdfootnotesym" href="#sdfootnote2anc" name="sdfootnote2sym">2</a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> Terme introduit pour la première fois par Selinker (1972), dont la définition est donnée ensuite par </font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">Quivy et Tardieu</font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">-</font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">Garnier</font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> (2002, p.188) : « Langue intermédiaire que l’apprenant constitue à partir de tous les matériaux à sa disposition – verbaux ou non verbaux – issus de la langue de départ ou de la langue-cible. Il les intègre dans un système provisoire d’hypothèses sujettes à révision, système qui lui est personnel et manifeste l’état ponctuel de sa connaissance du monde. »</font></font></font></font></p>
</div>
<div id="sdfootnote3">
<p align="justify" class="sdfootnote"><a class="sdfootnotesym" href="#sdfootnote3anc" name="sdfootnote3sym">3</a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">CORpus des INteractions à l’Ecole : Section Européenne Histoire Enseignée en Anglais. Pour la simplicité d’usage, nous avons conservé dans cette note de recherche la première partie uniquement : CORINE.</font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> </font></font></font></p>
</div>
<div id="sdfootnote4">
<p align="justify" class="sdfootnote" lang="fr-FR"><font face="Times New Roman, serif"><font size="2"><a class="sdfootnotesym" href="#sdfootnote4anc" name="sdfootnote4sym">4</a>Section Européenne et Langues Orientales. A noter que l’appellation SELO est officiellement abandonnée au profit de celle de l’CORINE à partir de la rentrée 2019 suite à la reforme du lycée de 2018. </font></font></p>
</div>
<div id="sdfootnote5">
<p align="justify" class="sdfootnote"><a class="sdfootnotesym" href="#sdfootnote5anc" name="sdfootnote5sym">5</a><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"><span style="background:#ffffff">Brouillon (production écrite d’un élève) est considéré comme « un écrit intermédiaire, entre un premier écrit et le suivant, entre un élève et les autres, entre un oral, une lecture et un nouvel écrit, entre une expérience et sa mise à distance » </span></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">(Benabbes, S., s.d.).</font></font></font></font></p>
</div>
<div id="sdfootnote6">
<p align="justify" class="sdfootnote" lang="fr-FR"><font face="Times New Roman, serif"><font size="2"><a class="sdfootnotesym" href="#sdfootnote6anc" name="sdfootnote6sym">6</a>Les fiches de travail conçus par des professeurs expressément pour des cours CORINE et qui contiennent des espaces dédiés à la prise de notes, aux réflexions personnelles, aux réponses des élèves.</font></font></p>
</div>
<div id="sdfootnote7">
<p class="sdfootnote" lang="fr-FR"><font face="Times New Roman, serif"><font size="2"><a class="sdfootnotesym" href="#sdfootnote7anc" name="sdfootnote7sym">7</a> Voir les détails dans l’Annexe 1 </font></font></p>
</div>
<div id="sdfootnote8">
<p class="sdfootnote" lang="fr-FR"><font face="Times New Roman, serif"><font size="2"><a class="sdfootnotesym" href="#sdfootnote8anc" name="sdfootnote8sym">8</a> La Discipline Non Linguistique</font></font></p>
</div>
<div id="sdfootnote9">
<p class="sdfootnote"><a class="sdfootnotesym" href="#sdfootnote9anc" name="sdfootnote9sym">9</a><font color="#000080"><u><a href="https://www.laurenceanthony.net/software/antconc/"><font color="#0000ff"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">https://www.laurenceanthony.net/software/antconc/</font></font></font></font></a></u></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> </font></font></font></p>
</div>
<div id="sdfootnote10">
<p class="sdfootnote"><a class="sdfootnotesym" href="#sdfootnote10anc" name="sdfootnote10sym">10</a><font color="#000080"><u><a href="https://www.laurenceanthony.net/software/antconc/releases/AntConc100/help.pdf"><font color="#0000ff"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">https://www.laurenceanthony.net/software/antconc/releases/AntConc100/help.pdf</font></font></font></font></a></u></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> </font></font></font></p>
</div>
<div id="sdfootnote11">
<p class="sdfootnote" lang="fr-FR"><font face="Times New Roman, serif"><font size="2"><a class="sdfootnotesym" href="#sdfootnote11anc" name="sdfootnote11sym">11</a> https://www.laurenceanthony.net/software/antconc/releases/AntConc424/help.pdf</font></font></p>
</div>
<div id="sdfootnote12">
<p class="sdfootnote"><a class="sdfootnotesym" href="#sdfootnote12anc" name="sdfootnote12sym">12</a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> </font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"><i>Academic Word List</i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">; liste de mots académiques, établie par Coxhead (2002).</font></font></font></p>
</div>
<div id="sdfootnote13">
<p class="sdfootnote"><a class="sdfootnotesym" href="#sdfootnote13anc" name="sdfootnote13sym">13</a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> Démarche</font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">: </font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"><i>Tool Preferences → Word list → Use specific list below.</i></font></font></font></p>
</div>
<div id="sdfootnote14">
<p class="sdfootnote"><a class="sdfootnotesym" href="#sdfootnote14anc" name="sdfootnote14sym">14</a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> </font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">Le substantif </font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"><i>image</i></font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> après la vérification est écarté puisqu’il relève du contenu des cours, aucun emploi de ce mot pour des raisons méthodologiques n’est observé.</font></font></font></font></p>
</div>
<div id="sdfootnote15">
<p class="sdfootnote" lang="fr-FR"><font face="Times New Roman, serif"><font size="2"><a class="sdfootnotesym" href="#sdfootnote15anc" name="sdfootnote15sym">15</a> Calcul : 8,9 ÷ (25,6 +16,7) x 100</font></font></p>
</div>
<div id="sdfootnote16">
<p align="justify" style="margin-right:1px"><span style="line-height:100%"><span style="orphans:0"><span style="widows:0"><font face="Liberation Serif, serif"><font size="2"><a class="sdfootnotesym" href="#sdfootnote16anc" name="sdfootnote16sym">16</a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">Le corpus LOCNESS contient 35 787 mots reconnus par le logiciel </font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"><i>AntConc</i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">. Bien que le corpus LOCNESS </font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">contienne environ 324 000 mots (source : https://www.learnercorpusassociation.org/resources/tools/locness-corpus/), nous avons sélectionné seulement les productions écrites des apprenants britanniques de </font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"><i>A level</i></font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> (ce qui correspond au niveau de Terminale en France), puisque la comparaison doit se faire entre des corpus ayant des caractéristiques semblables.</font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> Les apprenants dont les productions servent du contenu pour le corpus LOCNESS ont l’âge et le statut social similaire aux élèves français. Même si les discours des apprenants du corpus LOCNESS traitent des sujets variés, le corpus LOCNESS correspond dans les grands traits à nos besoins et </font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">sert</font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> de corpus de référence</font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> pour des productions écrites des élèves du corpus CORINE</font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> qui contient 9</font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"> </font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">560 mots reconnus par le logiciel </font></font></font></font><font color="#000000"><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt"><i>AntConc.</i></font></font></font></font></font></font></span></span></span></p>
</div>
<div id="sdfootnote17">
<p align="justify" style="margin-right:1px; margin-top:8px"><span style="line-height:0.04cm"><span style="orphans:0"><span style="widows:0"><a class="sdfootnotesym" href="#sdfootnote17anc" name="sdfootnote17sym">17</a><font face="Times New Roman, serif"><font size="2"><font style="font-size: 10pt">La création d’une liste des N-grams les plus fréquents du corpus permet d’identifier un phénomène linguistique qui aurait pu sinon rester invisible. Dans les recherches plus spécialisées les N-grams peuvent aider à observer les marqueurs discursifs ou les phraséologismes (expressions fixes propres au contexte étudié).</font></font></font><font face="Times New Roman, serif"><font size="2"><font style="font-size: 11pt"> </font></font></font></span></span></span></p>
<p class="sdfootnote"> </p>
</div>