INTRODUCTION Dans le cadre de la thèse de Quentin Pradet, sous la direction du Pr. Laurence Danlos et du Dr. Gaël de Chalendar, le CEA LIST et l'INRIA ALPAGE ont entamé l'adaptation au français de la ressource lexico-syntaxique VerbNet. Le présent stage vise à contribuer à cette traduction. CONTEXTE VerbNet est une ressource lexicale pour les verbes anglais organisée autour de classes sémantiques et de sous-classes syntaxiques. Cette ressource est très utilisée, notamment pour l'annotation en rôles sémantiques. Il paraît donc nécessaire d'avoir une ressource équivalente pour le français. Les seuls efforts qui ont été faits pour l'instant se limitent à des constructions automatiques bruitées dont l'évaluation se limite à quelques verbes. De plus ces efforts font abstraction des ressources lexicales qui existent pour le français, or celles-ci existent et sont de qualité. Pour les verbes, nous pensons en particulier à LVF+1, au Lexique-Grammaire et à Dicovalence. Nous avons donc l'objectif de réaliser un VerbeNet du français semi-automatiquement en nous appuyant sur ces ressources, en particulier sur LVF+1 et LG, la première plus centrée sur les informations sémantiques, la seconde sur les informations syntaxiques. Ce VerbeNet garde la hiérarchie des classes sémantiques du VerbNet anglais, ce qui permet de garder à l'identique les informations sémantiques, entre autres les rôles thématiques. OBJECTIFS La partie automatique exploitant les liens disponibles entre ressources et un réseau lexico-syntaxique est terminée. Le but de ce stage est de participer en collaboration étroite avec Laurence Danlos et Quentin Pradet à la correction manuelle de la ressource à l'aide d'une interface Web développée en interne. Pour chaque classe ou sous-classe VerbNet, on dispose des constructions syntaxiques possibles en anglais, des liens obtenus automatiquement avec les classes LVF+1 et LG correspondantes et d'une liste de verbes pouvant appartenir à cette classe. Le travail consiste en l'édition des frames lexico- syntactico-sémantiques en réorganisant si nécessaire la hiérarchie de classes, en acceptant ou refusant les verbes proposés, en modifiant les constructions syntaxiques et en traduisant les exemples. CANDIDAT ET DEROULEMENT Nous recherchons pour ce stage un étudiant en linguistique avec si possible des notions de lexicographie. Le stage se déroulera au laboratoire LVIC du CEA LIST, dans les locaux de Nano Innov à Palaiseau, en étroite collaboration avec Laurence Danlos à Paris. La rémunération est autour de 700€ pour un étudiant de M2, plus une éventuelle prime de fin de stage. CONTACT Gaël de Chalendar gael.de-chalendar@cea.fr |
Actualités et discussions autour du cursus de Linguistique Informatique de l'université Paris Diderot
jeudi 28 novembre 2013
Offre de stage M2 linguistique/lexicographie
Une offre de stage sur laquelle nous aimerions attirer de nouveau l'attention des étudiants en TAL:
mardi 19 novembre 2013
Offre de stage en linguistique informatique
Offre de Stage
en Linguistique-Informatique (extraction automatique d’informations pertinentes et création de thésaurus) dans la société AERIAL.
Plus de détails
Plus de détails
Inscription à :
Articles (Atom)