Linguistique statistique: je ne parle pas là de la bonne vieille linguistique de corpus, déjà ancienne: la recherche en linguistique de corpus demande juste de bons outils (concordanciers et outils statistiques) et de bonnes ressources (corpus annotés...), et (c'est le plus délicat) une bonne méthodologie.
Je parle des travaux inspirés par l'article de Joan Bresnan de 2007, devenu une référence. L'article s'intéresse à l'alternance dative en anglais (on peut dire I gave him my money ou I gave my money to him) et propose un modèle prédictif de l'alternance, basé sur la technique de la régression linéaire, qui permet de mesurer l'influence respective des facteurs explicatifs qui font l'objet de disputes parmi les linguistes depuis très longtemps (contraintes lexicales, contraintes de poids syntaxique, contraintes informationnelles, discursives...). La problématique est purement linguistique, mais la méthode est statistique, très proche de ce qui se fait en TAL aujourd'hui. Depuis ces travaux-là, des questions variées comme l'étude statistique de la diachronie, ou des contacts entre langues, ou la dimension statistique de la compétence grammaticale, et d'autres encore qui touchent en particulier à une meilleure qualité des données empiriques sur lesquelles les linguistes basent leurs raisonnement, ont été abordées dans le laboratoire de syntaxe parlée. Ces travaux ont été une grande source d'inspiration pour la linguistique actuelle, y compris dans le laboratoire Alpage, où des recherches sur la place de l'adjectif en français ont été engagées dans le même esprit.
Cette approche de la langue a inspiré aussi de façon directe le projet experimental grammar from a cross-linguistic perspective récemment engagé (pour 10 ans...) dans le laboratoire d'excellence "Empirical Foundations of Linguistics".
Aucun commentaire:
Enregistrer un commentaire