jeudi 28 novembre 2013

Offre de stage M2 linguistique/lexicographie

Une offre de stage sur laquelle nous aimerions attirer de nouveau l'attention des étudiants en TAL:


INTRODUCTION
Dans le cadre de la thèse de Quentin Pradet, sous la direction du Pr. Laurence 
Danlos et du Dr. Gaël de Chalendar, le CEA LIST et l'INRIA ALPAGE ont entamé
l'adaptation au français de la ressource lexico-syntaxique VerbNet. Le présent
stage vise à contribuer à cette traduction.

CONTEXTE
VerbNet est une ressource lexicale pour les verbes anglais organisée autour de
classes sémantiques et de sous-classes syntaxiques. Cette ressource est très
utilisée, notamment pour l'annotation en rôles sémantiques. Il paraît donc
nécessaire d'avoir une ressource équivalente pour le français. Les seuls
efforts qui ont été faits pour l'instant se limitent à des constructions
automatiques bruitées dont l'évaluation se limite à quelques verbes. De plus
ces efforts font abstraction des ressources lexicales qui existent pour le
français, or celles-ci existent et sont de qualité. Pour les verbes, nous
pensons en particulier à LVF+1, au Lexique-Grammaire et à Dicovalence. Nous
avons donc l'objectif de réaliser un VerbeNet du français semi-automatiquement
en nous appuyant sur ces ressources, en particulier sur LVF+1 et LG, la
première plus centrée sur les informations sémantiques, la seconde sur les
informations syntaxiques. Ce VerbeNet garde la hiérarchie des classes
sémantiques du VerbNet anglais, ce qui permet de garder à l'identique les
informations sémantiques, entre autres les rôles thématiques.

OBJECTIFS
La partie automatique exploitant les liens disponibles entre ressources et un
réseau lexico-syntaxique est terminée. Le but de ce stage est de participer en
collaboration étroite avec Laurence Danlos et Quentin Pradet à la correction
manuelle de la ressource à l'aide d'une interface Web développée en interne.
Pour chaque classe ou sous-classe VerbNet, on dispose des constructions
syntaxiques possibles en anglais, des liens obtenus automatiquement avec les
classes LVF+1 et LG correspondantes et d'une liste de verbes pouvant
appartenir à cette classe. Le travail consiste en l'édition des frames lexico-
syntactico-sémantiques en réorganisant si nécessaire la hiérarchie de
classes, en acceptant ou refusant les verbes proposés, en modifiant les 
constructions syntaxiques et en traduisant les exemples.

CANDIDAT ET DEROULEMENT
Nous recherchons pour ce stage un étudiant en linguistique avec si possible 
des notions de lexicographie.

Le stage se déroulera au laboratoire LVIC du CEA LIST, dans les locaux de Nano 
Innov à Palaiseau, en étroite collaboration avec Laurence Danlos à Paris. La 
rémunération est autour de 700€ pour un étudiant de M2, plus une éventuelle 
prime de fin de stage.


CONTACT
Gaël de Chalendar
gael.de-chalendar@cea.fr

Aucun commentaire:

Enregistrer un commentaire