mercredi 1 février 2012

Stage de Master 1 au LIMSI

L'offre de stage suivante est parue sur la liste ln (et je ne projette pas de mettre ici les annonces de la liste ln, il y en a trop, et il suffit de s'inscrire ). Mais je voudrais attirer l'attention sur cette offre particulière: 

Offre de stage de Master 1 à Orsay (91), au LIMSI
Sélection automatique de passage représentatif d'un événement


Mots-clés
/traitement automatique de la langue, analyse temporelle, événements/
Contexte
Entre autres objectifs, le projet ANR ChronoLines a pour but de créer de façon semi-automatique des chronologies à partir de dépêches d'agences.Étant donnés un thème fourni par l'utilisateur et un ensemble de textes, il s'agit de retrouver dans les documents les événements les plus importants concernant ce thème, puis de les ordonner et de les présenter à l'utilisateur pour validation. Par exemple, pour une demande sur un nom de personne, le système devra retracer les événements marquants de sa vie. Pour les négociations de paix au Moyen-Orient, les principales dates importantes s'y rattachant.Parmi les étapes nécessaires pour atteindre ce résultat, une phase consiste à sélectionner, parmi les événements détectés, ceux qui semblent les plus marquants, ou les plus centraux, par rapport au thèmede la requête. Pour chacun de ces événements, il faut ensuite choisir un texte caractéristique, expliquant de façon claire et concise de quoi il s'agit. Ce passage de texte est à choisir parmi un ensemble de nombreuses phrases décrivant l'événement.
Travail à réaliser
Durant ce stage, on partira d'un système existant. Ce système sélectionne les phrases qui correspondent, de façon plus ou moins précise, à chaque événement à insérer dans la chronologie. L'objectif du stage est de :

  • Parcourir la littérature scientifique sur le sujet (sélection de texte, résumé automatique, agrégation de résultats, etc.) pour identifier les techniques existantes susceptibles d'être adapter à notre problème.
  • Réaliser un outil permettant de choisir (ou éventuellement de générer) une phrase explicative d'un événement, à partir d'un ensemble de courts textes à son sujet.Le stagiaire devra avoir de bonnes compétences en informatique et un intérêt pour les problématiques du traitement de la langue.
  • Durée : environ 2 mois
  • Niveau : Master 1

Contacts :
Veronique.Moriceau[at]limsi.fr
Xavier.Tannier[at]limsi.fr

Aucun commentaire:

Enregistrer un commentaire