Pour les recherches bibliographiques en TAL, il y avait déjà l'ACL Anthology, extrêment précieuse, qui est LA source la plus importante, et dont la taille a tellement crû qu'elle sert maintenant de corpus pour la mise en oeuvre d'applications en TAL ou en IA (voir ICI le réseau généré à partir du corpus).
Il y a maintenant taln_archives, qui regroupe toutes les publications des conférences TALN et RECITAL (jeunes chercheurs en TAL), depuis 1997, et si on ajoute les numéros en ligne de la revue TAL (au moins depuis quelques année), alors on a un réservoir à explorer soigneusement !
Actualités et discussions autour du cursus de Linguistique Informatique de l'université Paris Diderot
vendredi 4 juillet 2014
lundi 30 juin 2014
Pré-requis ou pas pré-requis ?
Le cursus de Linguistique Informatique de Paris Diderot, lorsqu'il a été créé il y a 30 ans, proposait une formation en 3 ans : une licence (en 1 an, sans pré-requis), une maîtrise, et un DEA (un DESS a été ajouté au début des années 2000).
Lors du passage au système normalisé LMD, nous avons transformé la combinaison maîtrise-DEA/DESS en un master, mais la question des conditions d'accès s'est posée. Ne pas poser de pré-requis, et accepter en 1e année des étudiants ayant simplement une licence de linguistique ou d'informatique posait plusieurs types de problèmes :
Pour entrer dans ce master, il y a donc trois grandes voies :
Lors du passage au système normalisé LMD, nous avons transformé la combinaison maîtrise-DEA/DESS en un master, mais la question des conditions d'accès s'est posée. Ne pas poser de pré-requis, et accepter en 1e année des étudiants ayant simplement une licence de linguistique ou d'informatique posait plusieurs types de problèmes :
- la formation en TAL se trouvait réduite à 2 années,
- la promotion de master aurait formé un groupe peu homogène,
- il était nécessaire de consacrer une partie importante des cours de M1 à de l'initiation (à l'informatique dans la plupart des cas, ou à la linguistique, plus rarement),
- la découverte d'un nouveau domaine aurait pu conduire un certain nombre d'étudiants à des difficultés, le domaine ne correspondant pas à leurs attentes,
- et enfin, les étudiants venant de formations pluri-disciplinaires, ayant déjà un double bagage linguistique informatique, auraient pu être déçus de se retrouver avec des débutants.
Pour entrer dans ce master, il y a donc trois grandes voies :
- venir d'une licence pluri-disciplinaire exigeante:
- MIASHS option Math Informatique Linguistique (offerte à Paris Diderot). Voir quelques détails sur ce post.
- bi-licence sciences/humanités ou science/lettres
- licence de sciences cognitives
- CPGE B/L
- licence math ou info avec option linguistique
- combinaison majeure/mineure sciences lettres/langues
- etc.
- venir d'un parcours mono-disciplinaire en linguistique ou en informatique/mathématiques et faire une préparation personnelle dans l'autre discipline. Les étudiants dans cette situation seront invités à passer un examen d'entrée. Les chances de réussite sont d'autant plus grandes que cette préparation se fait de façon précoce. Notre équipe pédagogique est habituée à aider les étudiants dans cette situation, il faut contacter le plus tôt possible linguistique.informatique@linguist.univ-paris-diderot.fr. Des indications précises sur la préparation personnelle se trouvent ici et ici.
- passer par la troisième année de Licence Linguistique Informatique de Paris Diderot, que nous considérons aujourd'hui comme une "prépa-master", sans aucun pré-requis (débutants en linguistique ou en informatique acceptés), mais avec une sélection à l'entrée, et qui constitue l'une des meilleures préparations possibles pour le Master LI puisqu'elle est proposée dans le même établissement avec la même équipe pédagogique.
samedi 7 juin 2014
Jeu : identification d'accent
Ci-joint un quiz d'identification d'accents en français. Il s'agit d'un jeu mis au point par la Cité des sciences et de l'industrie de La Villette, en collaboration avec le LIMSI-CNRS, en grande partie grâce au projet "Phonologie du Français Contemporain" (PFC). Y participer ne prend que quelques minutes, puisque à chaque partie 10 échantillons d'une douzaine de secondes parmi 20 sont joués aléatoirement : il faut localiser les accents correspondants sur un planisphère (le plus rapidement possible ou non). De l'Europe à l'Afrique, de l'Amérique à l'Océan Indien, cela permet aussi de voyager dans la francophonie. Le site web est accessible à l'adresse suivante:
http://www.cite-sciences.fr/fr/a-visiter/expositions-temporaires/la-voix/exposition-la-voix-jeux.php#view
N'hésitez pas à y prendre part ni à transférer ce lien, qui permet une
expérience à grande échelle dont les résultats nous intéressent pour la recherche.
http://www.cite-sciences.fr/fr/a-visiter/expositions-temporaires/la-voix/exposition-la-voix-jeux.php#view
N'hésitez pas à y prendre part ni à transférer ce lien, qui permet une
expérience à grande échelle dont les résultats nous intéressent pour la recherche.
jeudi 22 mai 2014
Expérience en ligne: complétion de phrases
Pour se détendre entre les examens, voici une petite expérience idéale: elle prend une vingtaine de minutes, et il s'agit de compléter des phrases incomplètes, en faisant appel à votre imagination.
N'hésitez pas à diffuser le lien autour de vous !
http://spellout.net/ibexexps/chevaleret/French_3/experiment.html
N'hésitez pas à diffuser le lien autour de vous !
http://spellout.net/ibexexps/chevaleret/French_3/experiment.html
vendredi 16 mai 2014
Rentrée 2014/15
Ce post est destiné à rendre publiques au fur et à mesure toutes les informations pertinentes pour la rentrée 2014/15, pour toutes les années du cursus de Linguistique Informatique.
Pour mémoire la page de la rentrée dernière.
Pour mémoire la page de la rentrée dernière.
- Master 2 LI, calendrier:
- les cours commencent le lundi 15 Septembre,
- il y aura une semaine de coupure entre le 26 Octobre et le 2 Novembre,
- la première session de cours s'étale donc sur les six semaines comprises entre le 15 Septembre et le 26 Octobre,
- la seconde session de cours s'étale sur les six semaines comprise entre le 3 Novembre et le 12 Décembre,
- la semaine du 15 au 19 Décembre peut servir pour des examens éventuels.
- Réunion d'information pour les Master 2e année : jeudi 11 septembre, 16h, salle 533, bâtiment Olympe de Gouges.
- Réunion d'information pour le Master 1 et la licence 3: vendredi 12 septembre, 15:00-17:00, salle 310 OdG.
- Calendrier: il va être mis en ligne bientôt, voici les éléments essentiels:
- Premier semestre :
- Début des cours : lu 15 septembre
- Fin des cours : ve 19 décembre
- Deuxième semestre :
- Début des cours : lu 19 janvier 2015
- Fin des cours mercredi 13 mai 2015
- Nouvelles maquettes. Un certain nombre de changements dans les listes de cours offerts. Des détails bientôt.
- L'examen spécial d'entrée en M1 sera organisé
soit le vendredi 5, soitle vendredi 12 septembre 2014de 14h à 18hde 9h à 13h. Il aura lieu en salle 310 (3e étage, bâtiment Olympe de Gouges). Pour ceux qui ne passent qu'une épreuve, elle commencera à149h (et se terminera à1611h). Pour ceux qui passent deux épreuves, on commencera par l'informatique à 9h. Rappel: il est nécessaire d'avoir été officiellement convoqué pour passer cet examen d'entrée. Préparation de l'examen: consignes, indications préparées par l'association d'étudiants.
jeudi 17 avril 2014
Stage chez Mysoft (dictionnaire médical)
L'entreprise Mysoft, qui apprécie les stagiaires venant de notre formation, nous propose cette année encore un stage cet été sur le lexique médical qui accompagne le correcteur orthographique Antidote.
Plus de détails.
Plus de détails.
vendredi 11 avril 2014
Bourse doctorale en pragmatique expérimentale, Tübingen
Une offre de bourse doctorale dans un groupe de recherche pluridisciplinaire de renommée internationale, sur un sujet de pragmatique expérimentale ou de psycholinguistique computationnelle. Les meilleurs étudiants du cursus LI ont un profil pertinent. Date limite 21 avril.
Applications are invited for a paid PhD student position at the University of Tübingen. The principal activity of the applicants will be to pursue a PhD thesis project in an international research cluster on experimental pragmatics and computational psycholinguistics and to actively engage in national and international cooperation with like-minded researchers.
Applicants should have a strong interest in the study of language and a solid background in a relevant field with a documented expertise in at least one, ideally several of the following:
- formal semantics / pragmatics
- experimental semantics / pragmatics
- computational cognitive modeling of language processing (e.g., Bayesian / probabilistic modeling)
The position is limited to a term of 3 years, starting July 1, 2014 or soon after. Payment is offered according to TV-L (Tarifvertrag für den Öffentlichen Dienst der Länder) and includes all usual supplementary services. Candidates will be officially employed by the administration of the University of Tübingen. As the University of Tübingen intends to increase the proportion of female employees in science, women are particularly encouraged to apply. In case of equal qualification and experience physically challenged applicants are given preference.
Applications should include CV, an outline of research experience and academic interests (no more than 2 pages), as well as names and addresses of up to three references and a short writing sample. Please send applications by email to mchfranke@gmail.com. Applications received by April 21, 2014 will receive full consideration, although interviews may start at any time and will continue until the position has been filled.
For further information please contact: mchfranke@gmail.com
Applications are invited for a paid PhD student position at the University of Tübingen. The principal activity of the applicants will be to pursue a PhD thesis project in an international research cluster on experimental pragmatics and computational psycholinguistics and to actively engage in national and international cooperation with like-minded researchers.
Applicants should have a strong interest in the study of language and a solid background in a relevant field with a documented expertise in at least one, ideally several of the following:
- formal semantics / pragmatics
- experimental semantics / pragmatics
- computational cognitive modeling of language processing (e.g., Bayesian / probabilistic modeling)
The position is limited to a term of 3 years, starting July 1, 2014 or soon after. Payment is offered according to TV-L (Tarifvertrag für den Öffentlichen Dienst der Länder) and includes all usual supplementary services. Candidates will be officially employed by the administration of the University of Tübingen. As the University of Tübingen intends to increase the proportion of female employees in science, women are particularly encouraged to apply. In case of equal qualification and experience physically challenged applicants are given preference.
Applications should include CV, an outline of research experience and academic interests (no more than 2 pages), as well as names and addresses of up to three references and a short writing sample. Please send applications by email to mchfranke@gmail.com. Applications received by April 21, 2014 will receive full consideration, although interviews may start at any time and will continue until the position has been filled.
For further information please contact: mchfranke@gmail.com
mardi 8 avril 2014
Les métiers du TAL
On nous demande souvent quels sont les métiers du TAL, quels sont les postes accessibles avec une formation en linguistique informatique ?
Voici une façon de répondre à cette question: ci dessous, en vrac, la liste des postes occupés par la centaine d'anciens diplômés du cursus LI qui sont actuellement inscrits dans le groupe LinkedIn des anciens.
Voilà la liste, telle qu'elle a été compilée en avril 2014, avec un petit tagcloud juste pour le plaisr...
Linguiste informaticien(ne), ingénieur linguiste, computational linguist (17)
Doctorant/PhD Candidate (6)
Lead Data Analyst
Coordonnateur de tests
Senior Learning Content Developer
Research & development
Senior Research Scientist
Linguist (3)
Textmining Engineer (2)
DBA SQL Server
Software engineer (3)
Product Manager
Postdoctoral Researcher (2)
Project Manager
Natural Language Processing Specialist
Research Engineer
Localization Project Leader
Analyste développeur (2)
Chef de Projet MOA
Secretaire de projet
Ingénieur d'étude
Chercheur (public/privé) (7)
Assistant Professor/Maître de Conférences/Professeur (4)
Chef de Projet adjoint
Web Developer
Head of Reference and Terminology Unit
Journaliste
CSO
Consultant Senior
Traducteur terminologue
Ingénieur en gestion des connaissances
Work package manager
Software Design Engineer
Développeur JEE
Ingénieur réalisateur
Web Master
Project manager
Language technologist
Chef de projet J2EE
Voici une façon de répondre à cette question: ci dessous, en vrac, la liste des postes occupés par la centaine d'anciens diplômés du cursus LI qui sont actuellement inscrits dans le groupe LinkedIn des anciens.
Voilà la liste, telle qu'elle a été compilée en avril 2014, avec un petit tagcloud juste pour le plaisr...
Linguiste informaticien(ne), ingénieur linguiste, computational linguist (17)
Doctorant/PhD Candidate (6)
Lead Data Analyst
Coordonnateur de tests
Senior Learning Content Developer
Research & development
Senior Research Scientist
Linguist (3)
Textmining Engineer (2)
DBA SQL Server
Software engineer (3)
Product Manager
Postdoctoral Researcher (2)
Project Manager
Natural Language Processing Specialist
Research Engineer
Localization Project Leader
Analyste développeur (2)
Chef de Projet MOA
Secretaire de projet
Ingénieur d'étude
Chercheur (public/privé) (7)
Assistant Professor/Maître de Conférences/Professeur (4)
Chef de Projet adjoint
Web Developer
Head of Reference and Terminology Unit
Journaliste
CSO
Consultant Senior
Traducteur terminologue
Ingénieur en gestion des connaissances
Work package manager
Software Design Engineer
Développeur JEE
Ingénieur réalisateur
Web Master
Project manager
Language technologist
Chef de projet J2EE
lundi 7 avril 2014
MT180: ma thèse en 180 secondes
Qu'est-ce qu'on peut bien faire quand on passe 3 ans (au moins) dans un labo à faire une thèse de doctorat ? Pour s'en faire une idée, on peut suivre les concurrents du concours organisé par le CNRS et la conférence des Présidents d'Université, intitulé "ma thèse en 180 secondes".
Le concours est en cours, mais on peut déjà voir quelques-un(e)s des finalistes sur cette page.
Le concours est en cours, mais on peut déjà voir quelques-un(e)s des finalistes sur cette page.
dimanche 6 avril 2014
CDD de 6 mois : ingénieur spécialiste de linguistique de corpus
Une offre de CDD de 6 mois à mi-temps en linguistique de corpus dans le laboratoire Modyco, qui peut débuter dès le 1er mai 2014.
Offre d’emploi d’ingénieur pour le support dans ORTOLANG
Informations générales
Lieu : Nanterre (94) (Laboratoire Modyco UMR 7114) dans le cadre de l’Equipex ORTOLANG
Date de publication : lundi 5 avril 2014
Date limite de candidature : 15/04/2013
Type de contrat : CDD
Durée du contrat : 6 mois
Date d'embauche prévue : 1 mai 2014
Quotité de travail : Temps partiel à 50 %
Niveau d'études souhaité : Bac+5
Expérience souhaitée : expérience souhaitée en linguistique de corpus
Rémunération : Barème IE CNRS selon expérience
Missions : 6 mois à mi-temps
Dans le cadre du projet d'Equipex ORTOLANG (www.ortolang.fr) et intégré à l’équipe du laboratoire MoDyCo, l’ingénieur sera chargé de l'intégration des données des projets Corpus de Modyco dans ORTOLANG.
o Etat des fichiers : codages, métadonnées
o Gestion des transcriptions et des médias
o Utilisation d’outils de conversion, d’annotation automatique
o Anonymisation
o Corrections et nettoyage
Activités
L’ingénieur travaillera en collaboration avec les développeurs informatiques pour la création de scripts et d’outils permettant l’exploitation en ligne de ces ressources.
Il utilisera ces scripts pour réaliser les anonymisations de corpus et fera le contrôle manuel nécessaire de cette opération.
Il apportera sa compétence en linguistique de corpus pour mener à bien les missions qui lui seront confiées.
Il recevra des formations pour l’acquisition de nouvelles compétences dans les domaines techniques liés à son activité.
Compétences
Bonne connaissance des formats de transcription et des techniques d’annotation des corpus ;
Contexte de travail
Dans le cadre de la mise en place de l'Equipex ORTOLANG (www.ortolang.fr), cet emploi s'insérera dans le Laboratoire MoDyCo (http://www.modyco.fr), Unité Mixte de Recherche du CNRS et de l’Université de Paris Ouest Nanterre la Défense et partenaire d'ORTOLANG.
Informations complémentaires
Toute candidature (CV détaillé et lettre de motivation) devra être adressée à:
Christophe Parisse <cparisse **at** u-paris10.fr>
Offre d’emploi d’ingénieur pour le support dans ORTOLANG
Informations générales
Lieu : Nanterre (94) (Laboratoire Modyco UMR 7114) dans le cadre de l’Equipex ORTOLANG
Date de publication : lundi 5 avril 2014
Date limite de candidature : 15/04/2013
Type de contrat : CDD
Durée du contrat : 6 mois
Date d'embauche prévue : 1 mai 2014
Quotité de travail : Temps partiel à 50 %
Niveau d'études souhaité : Bac+5
Expérience souhaitée : expérience souhaitée en linguistique de corpus
Rémunération : Barème IE CNRS selon expérience
Missions : 6 mois à mi-temps
Dans le cadre du projet d'Equipex ORTOLANG (www.ortolang.fr) et intégré à l’équipe du laboratoire MoDyCo, l’ingénieur sera chargé de l'intégration des données des projets Corpus de Modyco dans ORTOLANG.
o Etat des fichiers : codages, métadonnées
o Gestion des transcriptions et des médias
o Utilisation d’outils de conversion, d’annotation automatique
o Anonymisation
o Corrections et nettoyage
Activités
L’ingénieur travaillera en collaboration avec les développeurs informatiques pour la création de scripts et d’outils permettant l’exploitation en ligne de ces ressources.
Il utilisera ces scripts pour réaliser les anonymisations de corpus et fera le contrôle manuel nécessaire de cette opération.
Il apportera sa compétence en linguistique de corpus pour mener à bien les missions qui lui seront confiées.
Il recevra des formations pour l’acquisition de nouvelles compétences dans les domaines techniques liés à son activité.
Compétences
Bonne connaissance des formats de transcription et des techniques d’annotation des corpus ;
Contexte de travail
Dans le cadre de la mise en place de l'Equipex ORTOLANG (www.ortolang.fr), cet emploi s'insérera dans le Laboratoire MoDyCo (http://www.modyco.fr), Unité Mixte de Recherche du CNRS et de l’Université de Paris Ouest Nanterre la Défense et partenaire d'ORTOLANG.
Informations complémentaires
Toute candidature (CV détaillé et lettre de motivation) devra être adressée à:
Christophe Parisse <cparisse **at** u-paris10.fr>
dimanche 30 mars 2014
JALI: Journée des Anciens du cursus LI
Vous avez envie de savoir ce qu'on devient après un cursus de Linguistique Informatique ? Vous voulez savoir ce que sont devenus vos camarades ?
Il faut venir assister à la première Journée des Anciens du cursus de Linguistique Informatique, organisée par la nouvelle association d'étudiants du cursus, et qui aura lieu Samedi 5 avril 2014, de 10h à 18h, dans nos locaux habituels, 8 pl. Paul Ricoeur, salle 153.
Le programme:
Il faut venir assister à la première Journée des Anciens du cursus de Linguistique Informatique, organisée par la nouvelle association d'étudiants du cursus, et qui aura lieu Samedi 5 avril 2014, de 10h à 18h, dans nos locaux habituels, 8 pl. Paul Ricoeur, salle 153.
La journée est ouverte à toute personne intéressée.
Le programme:
- 10:00 Accueil
- 10:20 Ouverture de la journée (ELIPS)
- 10:30-11:15 Exposé invité: Patrick Paroubek, président de l'ATALA
- pause
- 11:30-12:30 Série d'exposés d'anciens du cursus
- pause déjeuner
- 14:00-15:30 Série d'exposés de professionnels
- pause
- 16:00-17:15 Encore des exposés, d'anciens et/ou de professionnels
- Pot amical
samedi 29 mars 2014
Stage de traduction assistée par ordinateur
Stage de 6 mois dans la société General Electric Healthcare, à Buc (78). Mission: gestion informatisée de traductions multilingues.
Unique en son genre par son expertise de l'imagerie médicale & de la médecine moléculaire, GE Healthcare accélère le futur de la médecine et révolutionne la prise en charge du patient. Nous allons aider les professionnels de la Santé à prévoir les pathologies potentielles avant même qu'elles ne se déclarent.
La combinaison de nos technologies d'imagerie (IRM, scanner, imagerie fonctionnelle, radiologie conventionnelle et numérique, système de navigation...) et de nos compétences en technologie génétique va répondre rapidement à des besoins encore non satisfaits dans de nombreux domaines de la Santé : recherche et traitement du cancer, de la maladie d'Alzheimer ou des dysfonctionnements cardio-vasculaires...
GE Healthcare aide les chercheurs à repérer la maladie, à mieux la comprendre et les médecins à mieux la diagnostiquer puis à ajuster individuellement et au jour le jour le traitement du patient.
GE Healthcare a une seule et même vision : Prédire, diagnostiquer,
traiter et informer.
En étroite collaboration avec les équipes service après-vente, le(la) stagiaire participera à l'optimisation des cycles et des coûts de traduction des rapports d'intervention rédigés par les ingénieurs de maintenance, en utilisant des outils de traitement de fichiers multilingues, des langages de programmation, ainsi que des outils d'aide à la traduction, notamment SDL Translation Management.
Lieu : Buc (78) -- bus d'entreprise à partir de la gare Versailles-Chantiers
informatique, traitement automatique de langues, industrie de la langue
ou traduction
Connaissances techniques : MS Excel indispensable, y compris VB, et
expérience dans la manipulation de gros fichiers de données texte. Une
connaissance des outils de Traduction Assistée par Ordinateur (TAO) et
d'extraction et analyse de corpus est fortement souhaitée.
Caractéristiques de personnalité: Le stagiaire devra faire preuve de
dynamisme, esprit d'équipe, curiosité et autonomie. Un grand sens de la
responsabilité et du service client sont également indispensables,
notamment pour la communication directe avec notre sous-traitant.
Langues : Maitrise du français et de l'anglais indispensable.
Connaissance d'une autre langue européenne appréciée
Mobilité géographique : non requise
Merci de postuler via
http://www.recrutdiploma.com/consult.php?offre=4bsb9pyf3lmjpx4512&ref=358 sous
la référence 1934538
Mission :
General Electric (185 milliards de dollars de chiffre d'affaires, plus de 320 000 salariés) est l'un des premiers groupes mondiaux, aux activités diversifiées dans le domaine de l'industrie, de la technologie et des services.Unique en son genre par son expertise de l'imagerie médicale & de la médecine moléculaire, GE Healthcare accélère le futur de la médecine et révolutionne la prise en charge du patient. Nous allons aider les professionnels de la Santé à prévoir les pathologies potentielles avant même qu'elles ne se déclarent.
La combinaison de nos technologies d'imagerie (IRM, scanner, imagerie fonctionnelle, radiologie conventionnelle et numérique, système de navigation...) et de nos compétences en technologie génétique va répondre rapidement à des besoins encore non satisfaits dans de nombreux domaines de la Santé : recherche et traitement du cancer, de la maladie d'Alzheimer ou des dysfonctionnements cardio-vasculaires...
GE Healthcare aide les chercheurs à repérer la maladie, à mieux la comprendre et les médecins à mieux la diagnostiquer puis à ajuster individuellement et au jour le jour le traitement du patient.
GE Healthcare a une seule et même vision : Prédire, diagnostiquer,
traiter et informer.
Role Summary/Purpose:
Au siège européen de GE Healthcare, vous intégrez l'équipe Traduction.En étroite collaboration avec les équipes service après-vente, le(la) stagiaire participera à l'optimisation des cycles et des coûts de traduction des rapports d'intervention rédigés par les ingénieurs de maintenance, en utilisant des outils de traitement de fichiers multilingues, des langages de programmation, ainsi que des outils d'aide à la traduction, notamment SDL Translation Management.
Essential Responsibilities:
Ce stage couvrira plusieurs axes :- Optimisation de l'extraction et traitement des rapports d'intervention générés dans nos systèmes de gestion de services
- Création des macros ou des scripts qui permettront de préparer les fichiers pour une traduction optimisée
- Optimisation de l'utilisation de l'outil TMS (abréviations, concaténation de phrases, création de glossaires...). Création de rapports d'utilisation et de tendances
- Proposition d'améliorations de nos outils/plateformes IT
- Interface avec notre sous-traitant gérant les traductions (leader mondial dans la spécialité, fournissant des services linguistiques aux plus grandes entreprises du monde entier)
- Coordination entre les équipes traduction internes, le sous-traitant et les équipes opérationnelles
- Etude statistique post-mortem -- data management
- Rédaction de guides de bonnes pratiques à l'usage des ingénieurs
- Nettoyage des mémoires de traduction
Desired Characteristics:
Durée du stage : 6 moisLieu : Buc (78) -- bus d'entreprise à partir de la gare Versailles-Chantiers
Qualifications/Requirements:
Diplôme: à dominante informatique, avec option en linguistiqueinformatique, traitement automatique de langues, industrie de la langue
ou traduction
Connaissances techniques : MS Excel indispensable, y compris VB, et
expérience dans la manipulation de gros fichiers de données texte. Une
connaissance des outils de Traduction Assistée par Ordinateur (TAO) et
d'extraction et analyse de corpus est fortement souhaitée.
Caractéristiques de personnalité: Le stagiaire devra faire preuve de
dynamisme, esprit d'équipe, curiosité et autonomie. Un grand sens de la
responsabilité et du service client sont également indispensables,
notamment pour la communication directe avec notre sous-traitant.
Langues : Maitrise du français et de l'anglais indispensable.
Connaissance d'une autre langue européenne appréciée
Mobilité géographique : non requise
Merci de postuler via
http://www.recrutdiploma.com/consult.php?offre=4bsb9pyf3lmjpx4512&ref=358 sous
la référence 1934538
jeudi 27 mars 2014
Post doctorat, Syntaxe et Sémantique, Olso
Deux bourses de recherche post-doctorale sont ouvertes à l'Université d'Olso, sur le projet "Syntax and Semantics (SynSem)". Date limite: 28 avril 2014.
Applicants must submit a project description of approximately 5 pages,
including a schedule of activities, clarifying how the applicant intends
to approach the post-doctoral project theme theoretically and
methodically.
Plus de détails
Plus de précision sur l'équipe de recherche
Applicants must submit a project description of approximately 5 pages,
including a schedule of activities, clarifying how the applicant intends
to approach the post-doctoral project theme theoretically and
methodically.
Plus de détails
Plus de précision sur l'équipe de recherche
mercredi 26 mars 2014
MASS est mort, vive MIASHS!
Il existait depuis longtemps à Paris Diderot une formation MASS option linguistique et informatique, une des meilleures préparations au Master de Linguistique Informatique.
Le ministère a décidé de normaliser les nomenclatures des diplômes, et il s'en est suivi un certain flottement, mais je suis heureux d'annoncer l'ouverture dès l'année prochaine 2014-15(sauf non validation par le ministère) d'une licence MIASHS option MIL (en clair « licence de mathématiques et informatique appliquées aux sciences humaines et sociales, option mathématiques-informatique-linguistique »), qui sera la meilleure préparation possible pour le Master de Linguistique, avec un équilibre presque parfait entre mathématiques, informatique, linguistique.
L'option MIL n'était pas offerte sur APB, mais elle est accessible aux étudiants ayant postulé pour la licence MIASHS, et en 2e et 3e année sous conditions. Pour tout renseignement, envoyer un mail à linguistique.informatique@linguist.univ-paris-diderot.fr.
[edit 28/03: la licence est validée par le ministère]
Mathématiques :
Le ministère a décidé de normaliser les nomenclatures des diplômes, et il s'en est suivi un certain flottement, mais je suis heureux d'annoncer l'ouverture dès l'année prochaine 2014-15
L'option MIL n'était pas offerte sur APB, mais elle est accessible aux étudiants ayant postulé pour la licence MIASHS, et en 2e et 3e année sous conditions. Pour tout renseignement, envoyer un mail à linguistique.informatique@linguist.univ-paris-diderot.fr.
[edit 28/03: la licence est validée par le ministère]
Mathématiques :
- Algèbre
- Analyse,
- Probabilités
- Statistiques (descriptives et inférentielles)
- Logique
- Programmation (Python, Java)
- Systèmes d'exploitation
- Concepts informatiques
- Algorithmique
- Interfaces graphiques
- Programmation orientée objets
- Langages et automates
- Langage et logique
- Description linguistique
- Les langues dans le monde
- Langage et cognition
- Morphologie
- Phonétique et phonologie
- Grammaire du français
- Syntaxe
- Sémantique
- Théories et formalismes syntaxiques
mardi 25 mars 2014
Post-doc en sémantique computationnelle à Londres
The School of Electronic Engineering and Computer Science at Queen Mary
University of London has an opening for a post-doctoral researcher on a
EU FP7 project (ConCreTe) focusing on concept creation technology. The
position would suit someone with an interest in computational semantics
(particularly distributional/vector space models) and/or natural
language generation (deadline: 7th April):
http://www.jobs.qmul.ac.uk/4597
(a relevant excerpt: "The successful applicant should have a background
in computational linguistics and cognitive science. He/she must be a
competent programmer and willing to learn new programming languages if
necessary. The successful candidate should have adequate mathematical
skills to understand Shannon Information Theory, statistical modelling
as applied in language processing and advanced geometrical methods for
semantic representation")
University of London has an opening for a post-doctoral researcher on a
EU FP7 project (ConCreTe) focusing on concept creation technology. The
position would suit someone with an interest in computational semantics
(particularly distributional/vector space models) and/or natural
language generation (deadline: 7th April):
http://www.jobs.qmul.ac.uk/4597
(a relevant excerpt: "The successful applicant should have a background
in computational linguistics and cognitive science. He/she must be a
competent programmer and willing to learn new programming languages if
necessary. The successful candidate should have adequate mathematical
skills to understand Shannon Information Theory, statistical modelling
as applied in language processing and advanced geometrical methods for
semantic representation")
mercredi 19 mars 2014
Post-doctorat en extraction de terminologie à Nancy
Dasn le cadre du projet TERMITH (TERMinologie et Indexation de Textes en sciences Humaines), est offert un contrat postdoctoral d'un an à partie de septembre 2014 à l'TILF Nancy, portant sur la construction (automatisée) d'une onto-terminologie. Date limite de candidature: 14 mai 2014.
Plus de détails.
Plus de détails.
mardi 18 mars 2014
Forum des Sciences Cognitives: on y sera
Comme ces dernières années, le cursus de Linguistique Informatique aura cette année un stand au prochain Forum des Sciences Cognitives, organisé samedi 22 mars 2014, dès 9h30, au Réfectoire des Cordeliers à Paris 6e.
Comme chaque année, il y aura au forum des conférences grand public, des conférences plus spécialisées, des démonstrations de toutes sortes, et même la possibilité de participer à des expériences en direct.
Nous partageons beaucoup de choses avec la communauté des sciences cognitives d'aujourd'hui: la linguistique fait partie du "noyau dur" des sciences cognitives (avec la psychologie, les neurosciences, la philosophie, etc), et l'informatique joue un rôle de plus en plus important. Nous avons aussi en commun la pluridisciplinarité, et nous partageons aussi de plus en plus de méthodes, en particulier du côté des statistiques (descriptives et inférentielles)...
C'est pour cette raison que le Master Recherche en Sciences Cognitives (Cogmaster, EHESS/ENS/Paris 5) et le Master de Linguistique Informatique de Paris Diderot ont établi depuis plusieurs années une convention pédagogique (en cours de renouvellement), qui permet aux étudiants du cogmaster intéressés par la linguistique computationnelle de choisir des enseignements de TAL du Master LI, et inversement aux étudiants du Master LI de prendre comme option des cours du cogmaster (que ce soit en linguistique ou dans d'autres disciplines). Il faut noter qu'il y a des pré-requis à respecter dans les deux cas.
Comme chaque année, il y aura au forum des conférences grand public, des conférences plus spécialisées, des démonstrations de toutes sortes, et même la possibilité de participer à des expériences en direct.
Nous partageons beaucoup de choses avec la communauté des sciences cognitives d'aujourd'hui: la linguistique fait partie du "noyau dur" des sciences cognitives (avec la psychologie, les neurosciences, la philosophie, etc), et l'informatique joue un rôle de plus en plus important. Nous avons aussi en commun la pluridisciplinarité, et nous partageons aussi de plus en plus de méthodes, en particulier du côté des statistiques (descriptives et inférentielles)...
C'est pour cette raison que le Master Recherche en Sciences Cognitives (Cogmaster, EHESS/ENS/Paris 5) et le Master de Linguistique Informatique de Paris Diderot ont établi depuis plusieurs années une convention pédagogique (en cours de renouvellement), qui permet aux étudiants du cogmaster intéressés par la linguistique computationnelle de choisir des enseignements de TAL du Master LI, et inversement aux étudiants du Master LI de prendre comme option des cours du cogmaster (que ce soit en linguistique ou dans d'autres disciplines). Il faut noter qu'il y a des pré-requis à respecter dans les deux cas.
mardi 11 mars 2014
ALGOPOL: enquête sociologique, informatique, linguistique
Nous
faisons appel à vous pour participer et diffuser l’enquête Facebook du
projet de recherche ALGOPOL de l’ANR (CAMS/CNRS, Orange Lab, LIAFA/Paris
Diderot, Linkfluence).
Ce projet, qui réunit sociologues, informaticiens et linguistes a développé une application disponible sur ordinateur, pour permettre aux utilisateurs de Facebook de visualiser et de naviguer dans leur réseau égocentré Facebook. L'application Algopol propose des outils permettant aux participants de détecter des communautés, de qualifier leurs amis, de visualiser les sexes et les âges, de faire évoluer leur graphe en fonction de l’historique de leur compte et de naviguer dans leurs statuts en identifiant les publics qu’ils ont mobilisés sous forme de like et de commentaires…
Les données rassemblées par le projet feront l’objet d’une analyse par les sociologues, les informaticiens et les linguistes du projet. La confidentialité est garantie par un ensemble de procédures rigoureuses qui ont été établies en étroite coopération avec la CNIL.
L'application est ouverte depuis décembre 2013 et compte déjà 10.000 participants, mais pour poursuivre la diffusion nous avons besoin de faire connaître l’application et de la promouvoir auprès des étudiants et des publics avec lesquels vous pouvez être en contact.
Merci pour votre aide. Merci aussi de nous faire des retours, des critiques, des propositions de déploiement vers des publics spécifiques.
(L'équipe Algopol)
Plus d'infos :
- L’application de l’enquête : http://app.algopol.fr/
- Un texte qui explique (en longueur) notre questionnement, nos incertitudes et nos choix: http://www.internetactu.net/2013/12/13/travail-et-travailleurs-de-la-donnee/
- Une tribune publiée dans Le Monde : « Les sciences sociales et les données indiscrètes du web »: http://www.lemonde.fr/sciences/article/2013/12/16/les-sciences-sociales-et-les-donnees-indiscretes-du-web_4335257_1650684.html- Un article du Monde sur l’enquête : http://www.lemonde.fr/sciences/article/2013/12/12/quand-la-recherche-like-facebook_4332566_1650684.html
- Le site web du projet Algopol : http://algopol.fr
mercredi 5 mars 2014
Exclusif : Stage à Graphinium en TAL et Machine Learning
Graphinium est une jeune startup créée en 2012. Elle est l'éditeur d’une solution logicielle SaaS, qui aide les marques à mieux connaître leurs clients et rendre leur marketing plus performant grâce aux données issues des réseaux sociaux. Graphinium collecte et analyse ce volume considérable de données, afin de leur apporter des recommandations en temps réel, et enrichir leur CRM.
Aujourd'hui Graphinium recherche un stagiaire pour 6 mois à temps plein avec des compétences en traitement automatiques des langues, en machine learning et bien sûr en informatique, afin d'améliorer leur moteur de recommandations.
Pour plus d'informations, vous pouvez consulter l'offre d'emploi à cette adresse et/ou contacter Marie Albaret (etudiant AT talented-minds POINT fr), chargée de recrutement.
Aujourd'hui Graphinium recherche un stagiaire pour 6 mois à temps plein avec des compétences en traitement automatiques des langues, en machine learning et bien sûr en informatique, afin d'améliorer leur moteur de recommandations.
Pour plus d'informations, vous pouvez consulter l'offre d'emploi à cette adresse et/ou contacter Marie Albaret (etudiant AT talented-minds POINT fr), chargée de recrutement.
Stagiaires recherchés, fondation UNDL (Genève)
La Fondation UNDL, une organisation internationale à but non-lucratif et une ONG basée à Genève, recherche actuellement huit stagiaires pour travailler sur un projet linguistique nommé FRIDA (Français Rumantsch Italiano Deutsch Analysis), visant à créer une base de données lexicale de chacune des quatre langues officielles suisses, qui seront ensuite intégrées au Système UNL (Universal Networking Language), une langue informatique que nous développons.
L'UNL est un système de traitement du langage naturel qui permet entre autres, la traduction automatique, la recherche et extraction d'informations, ou encore le résumé automatique de textes. Les résultats du projets FRIDA seront donc intégré à l'UNL et les langues ainsi liés à toutes les langues déjà représentées dans le système.
Le stage consiste à encoder des listes de mots (mots universels) en UNL par le biais de notre plateforme de travail collaborative, l'UNLweb (www.unlweb.net). L'offre est accessible à tous les étudiants ayant pour langue natale une des quatre langues suisses, de plus qu'une bonne maîtrise de l'anglais. Une connaissance basique en Linguistique est un atout.
Le stage peut s'effectuer à distance (en ligne), ou dans les locaux de la fondation, à Petit-Lancy. Plus de détail peuvent être trouvés ICI.
L'UNL est un système de traitement du langage naturel qui permet entre autres, la traduction automatique, la recherche et extraction d'informations, ou encore le résumé automatique de textes. Les résultats du projets FRIDA seront donc intégré à l'UNL et les langues ainsi liés à toutes les langues déjà représentées dans le système.
Le stage consiste à encoder des listes de mots (mots universels) en UNL par le biais de notre plateforme de travail collaborative, l'UNLweb (www.unlweb.net). L'offre est accessible à tous les étudiants ayant pour langue natale une des quatre langues suisses, de plus qu'une bonne maîtrise de l'anglais. Une connaissance basique en Linguistique est un atout.
Le stage peut s'effectuer à distance (en ligne), ou dans les locaux de la fondation, à Petit-Lancy. Plus de détail peuvent être trouvés ICI.
lundi 17 février 2014
PhD research grants, Bielefeld
Le Centre d'excellence "Cognitive Interaction Technology", à l'Université de Bielefeld (Allemagne) annonce l'ouverture de 16 bourses de doctorat (3 ans) dans des domaines en relation avec la technologie d'interaction cognitive. Certaines offres peuvent être transformées en bourses post-doctorales.
Les étudiants ou chercheurs post-doctoraux intéressés par les domaines du traitement automatique du dialogue (oral), de la communication située, de l'interaction parlée homme/robot sont invités à prendre contact avec Prof. David Schlangen par email pour évoquer des sujets de recherche possibles.
firstname.lastname@uni-bielefeld.de
Date limite: 31 mars.
Site du groupe de recherche
Les étudiants ou chercheurs post-doctoraux intéressés par les domaines du traitement automatique du dialogue (oral), de la communication située, de l'interaction parlée homme/robot sont invités à prendre contact avec Prof. David Schlangen par email pour évoquer des sujets de recherche possibles.
firstname.lastname@uni-bielefeld.de
Date limite: 31 mars.
Site du groupe de recherche
Ingénieur linguiste recherché
La société Labsense connaît un forte croissance : elle travaille notamment pour un grand portail internet français ainsi que pour des acteurs majeurs du e-travel et du e-commerce.
Dans le cadre de nouveaux projets 2014 et pour renforcer l'équipe existante, elle recherche un profil d'ingénieur linguiste pour prendre part à cette belle aventure et intégrer l'équipe de développement produit.
Plus de détail.
Dans le cadre de nouveaux projets 2014 et pour renforcer l'équipe existante, elle recherche un profil d'ingénieur linguiste pour prendre part à cette belle aventure et intégrer l'équipe de développement produit.
Plus de détail.
mardi 4 février 2014
Expérience en ligne sur l'accent régional
Avez-vous 15mn pour répondre à une expérience en ligne sur l'accent régional ?
C'est facile et rapide.
http://phonogenre.labguistic.com/modules/soundquiz/quiz.php?quiz_id=4
N'hésitez pas à passer le lien autour de vous (il faut être francophone de langue maternelle).
C'est facile et rapide.
http://phonogenre.labguistic.com/modules/soundquiz/quiz.php?quiz_id=4
N'hésitez pas à passer le lien autour de vous (il faut être francophone de langue maternelle).
mercredi 29 janvier 2014
Stages chez Adobe en Californie
Bien sûr, c'est un peu loin pour un stage de 12 semaines, mais on ne sait jamais... Adobe (la société qui a inventé PDF) cherche des stagiaires pour travailler sur la "gestion de dialogue statistique":
We are looking for interns to work on statistical dialog management for digital media and digital marketing applications. The internship will be at the System Technology Lab (STL) at Adobe Research (http://www.adobe.com/technology.html) located in San Jose, California. It is 12 weeks long and can start any time from March 1, 2014. Beyond Adobe's traditional strengths in media technologies, this lab is focused on research opportunities in areas related to digital marketing and media optimization (e.g., Adobe?s Digital Marketing Cloud). Adobe provides digital marketing solutions to its customers including bank hotels, online retails, and insurance and entertainment companies. Requirements: The applicant should be either at the final stage of a Master's or in a Ph.D. program in Computer Science, Statistics, Operations Research, or related fields, with a strong background in natural language processing, machine learning and good programming skills. Knowledge of dialog management and reinforcement learning will be considered as a plus. Application Submission: We encourage the applicants to apply as soon as possible, but the screening of candidates will continue until the positions are filled. The application should include a brief description of the applicants research interests and past experience, plus a CV that contains her/his degrees, GPAs, relevant publications, name and contact information of up to two references, and other relevant documents. Please send your application to Trong Bui. |
samedi 11 janvier 2014
Bourse doctorale de mobilité (sortante)
Le Label Empirical Foundations of Linguistics offre 5 bourses de 4000 € pour soutenir la mobilité de doctorants en linguistique, qui désirent faire un séjour à l'étranger dans le cadre de leurs travaux de recherche.
Date limite de dépôt du dossier: 15 janvier.
Plus de détails
Date limite de dépôt du dossier: 15 janvier.
Plus de détails
Inscription à :
Articles (Atom)