Linguistiques de corpus et mathématiques du continu

S Girault , Bernard Victorri

pp. 147-170

Les nouvelles technologies ont transformé radicalement les rapports des linguistes avec leur objet d’étude. On peut disposer aujourd’hui très facilement d’une impressionnante masse de données sur la langue, qui couvre la plupart de ses usages (du moins dans le domaine de l’écrit), sans aucune commune mesure avec ce qui était accessible il y a à peine dix ans. De plus, on commence à disposer de ressources linguistiques (comme les dictionnaires électroniques) de plus en plus exhaustives, et d’outils de traitement (analyseurs syntaxiques, etc.) de plus en plus fiables. Cet ensemble représente en fait un nouvel «instrument » qui permet de «voir » les phénomènes langagiers comme on n’avait jamais pu le faire auparavant, un peu comme la lunette de Galilée a permis de voir des phénomènes astronomiques (les ombres sur la Lune, les satellites de Jupiter, etc.) inaccessibles jusqu’alors. Il est donc assez normal que ce nouveau dispositif d’observation transforme assez radicalement les méthodes et les attendus de la modélisation informatique en linguistique et de ses applications en traitement automatique des langues.

Publication details

Full citation:

Girault, S. , Victorri, B. (2009). Linguistiques de corpus et mathématiques du continu. Histoire Épistémologie Langage 31 (1), pp. 147-170.

This document is available at an external location. Please follow the link below. Hold the CTRL button to open the link in a new window.