Domaine de formation recherché
Linguistique, linguistique informatique.Mission
Participer au développement d’outils de traitement automatique du langage, qui devront permettre l’analyse et la classification automatique de documents textes aux formats HTML et PDF. Vous travaillerez en collaboration directe avec un développeur informatique.Déroulement du stage
- Etat de l’art autour de la thématique de la fouille de texte et de l’extraction des descripteurs linguistiques d’un corpus de documents,
- Evaluation des solutions techniques proposées par les outils existants tels que Solr,
- Développement d’ontologies et d’un outil de classification automatique de documents,
- Programmation en Java et JavaScript,
- Participation aux développements de bases de données.
Résultats attendus
Une synthèse exhaustive des méthodologies existantes de classification. Et le développement d’un d’outil simple permettant de présenter, à termes, un prototype fonctionnel.Profil recherché
- Master 2 en Linguistique/Informatique
- Compétences en:
- Analyse sémantique et syntaxique
- Statistique
- Algorithmique
- Connaissance de XML, OWL, RDF et SKOS
- Bon niveau d’anglais,
- Maitrise des outils de bureautique
- Connaissance en développement informatique (Java ou C++, base de données, JavaScript)
- Encadrant : Sébastien Albouze, Ingénieur Civil des Mines – fondateur de TrackSens
Divers
- Date : à partir du 1er février 2017 (date exacte à définir selon convenance),
- Stage de 6 mois rémunéré (800 € brut/mois)
- Lieu : Metz, au sein du tiers-lieu de création et d’innovation de Metz-Blida (lien),
- Stage proposé dans l’objectif d’une embauche.
Contact
CV + lettre de motivation à envoyer à :Sébastien Albouze
TrackSens SAS
E-mail : sebastien.albouze@orange.fr