From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 20:46:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 21:46:46 +0100 Subject: Appel: LATA 2013, submission deadline extended Message-ID: Date: Sun, 4 Nov 2012 14:55:44 +0100 From: "GRLMC" Message-ID: X-url: http://grammars.grlmc.com/LATA2013/ ------------------------------------------------------------------------ SUBMISSION DEADLINE EXTENDED: November 15 !!! ------------------------------------------------------------------------ 7th INTERNATIONAL CONFERENCE ON LANGUAGE AND AUTOMATA THEORY AND APPLICATIONS LATA 2013 Bilbao, Spain April 2-5, 2013 Organized by: Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/LATA2013/ AIMS: LATA is a yearly conference in theoretical computer science and its applications. Following the tradition of the International Schools in Formal Languages and Applications developed at Rovira i Virgili University in Tarragona since 2002, LATA 2013 will reserve significant room for young scholars at the beginning of their career. It will aim at attracting contributions from both classical theory fields and application areas (bioinformatics, systems biology, language technology, artificial intelligence, etc.). VENUE: LATA 2013 will take place in Bilbao, at the Basque Country in Northern Spain. The venue will be the Basque Center for Applied Mathematics (BCAM). SCOPE: Topics of either theoretical or applied interest include, but are not limited to: ‐ algebraic language theory ‐ algorithms for semi‐structured data mining ‐ algorithms on automata and words ‐ automata and logic ‐ automata for system analysis and programme verification ‐ automata, concurrency and Petri nets ‐ automatic structures ‐ cellular automata ‐ combinatorics on words ‐ computability ‐ computational complexity ‐ computational linguistics ‐ data and image compression ‐ decidability questions on words and languages ‐ descriptional complexity ‐ DNA and other models of bio‐inspired computing ‐ document engineering ‐ foundations of finite state technology ‐ foundations of XML ‐ fuzzy and rough languages ‐ grammars (Chomsky hierarchy, contextual, multidimensional, unification, categorial, etc.) ‐ grammars and automata architectures ‐ grammatical inference and algorithmic learning ‐ graphs and graph transformation ‐ language varieties and semigroups ‐ language‐based cryptography ‐ language‐theoretic foundations of artificial intelligence and artificial life ‐ parallel and regulated rewriting ‐ parsing ‐ pattern recognition ‐ patterns and codes ‐ power series ‐ quantum, chemical and optical computing ‐ semantics ‐ string and combinatorial issues in computational biology and bioinformatics ‐ string processing algorithms ‐ symbolic dynamics ‐ symbolic neural networks ‐ term rewriting ‐ transducers ‐ trees, tree languages and tree automata ‐ weighted automata STRUCTURE: LATA 2013 will consist of: ‐ invited talks ‐ invited tutorials ‐ peer‐reviewed contributions INVITED SPEAKERS: Jin-Yi Cai (Madison), Complexity Dichotomy for Counting Problems Kousha Etessami (Edinburgh), Algorithms for Analyzing Infinite-state Recursive Probabilistic Systems Luke Ong (Oxford), tutorial Languages and Automata for Higher-order Model Checking Joël Ouaknine (Oxford), tutorial Discrete Linear Dynamical Systems Thomas Schwentick (Dortmund), Applications of Automata in Database Theory -- Challenges to Automata Theory from Databases Andrei Voronkov (Manchester), The Lazy Reviewer Assignment Problem in EasyChair PROGRAMME COMMITTEE: Parosh Aziz Abdulla (Uppsala) Franz Baader (Dresden) Jos Baeten (CWI, Amsterdam) Christel Baier (Dresden) Gerth Stølting Brodal (Aarhus) John Case (Delaware) Marek Chrobak (Riverside) Mariangiola Dezani (Torino) Rod Downey (Wellington) Ding-Zhu Du (Dallas) Ivo Düntsch (Brock) E. Allen Emerson (Austin) Javier Esparza (Technical University Munich) Michael R. Fellows (Darwin) Alain Finkel (ENS Cachan) Dov M. Gabbay (King’s, London) Jürgen Giesl (Aachen) Rob van Glabbeek (NICTA, Sydney) Georg Gottlob (Oxford) Annegret Habel (Oldenburg) Reiko Heckel (Leicester) Sanjay Jain (Singapore) Charanjit S. Jutla (IBM Thomas J. Watson) Ming-Yang Kao (Northwestern) Deepak Kapur (Albuquerque) Joost-Pieter Katoen (Aachen) S. Rao Kosaraju (Johns Hopkins) Evangelos Kranakis (Carleton) Hans-Jörg Kreowski (Bremen) Tak-Wah Lam (Hong Kong) Gad M. Landau (Haifa) Kim G. Larsen (Aalborg) Richard Lipton (Georgia Tech) Jack Lutz (Iowa State) Ian Mackie (École Polytechnique, Palaiseau) Rupak Majumdar (Max Planck, Kaiserslautern) Carlos Martín-Vide (Tarragona, chair) Paliath Narendran (Albany) Tobias Nipkow (Technical University Munich) David A. Plaisted (Chapel Hill) Jean-François Raskin (Brussels) Wolfgang Reisig (Humboldt Berlin) Michaël Rusinowitch (LORIA, Nancy) Davide Sangiorgi (Bologna) Bernhard Steffen (Dortmund) Colin Stirling (Edinburgh) Alfonso Valencia (CNIO, Madrid) Helmut Veith (Vienna Tech) Heribert Vollmer (Hannover) Osamu Watanabe (Tokyo Tech) Pierre Wolper (Liège) Louxin Zhang (Singapore) ORGANIZING COMMITTEE: Adrian Horia Dediu (Tarragona) Peter Leupold (Tarragona) Carlos Martín‐Vide (Tarragona, co-chair) Magaly Roldán (Bilbao) Bianca Truthe (Magdeburg) Florentina Lilica Voicu (Tarragona) Enrique Zuazua (Bilbao, co-chair) SUBMISSIONS: Authors are invited to submit papers presenting original and unpublished research. Papers should not exceed 12 single‐spaced pages (including eventual appendices) and should be formatted according to the standard format for Springer Verlag's LNCS series (see http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0). Submissions have to be uploaded to: https://www.easychair.org/conferences/?conf=lata2013 PUBLICATIONS: A volume of proceedings published by Springer in the LNCS series will be available by the time of the conference. A special issue of a major journal will be later published containing peer‐reviewed extended versions of some of the papers contributed to the conference. Submissions to it will be by invitation. REGISTRATION: The period for registration is open from August 6, 2012 to April 2, 2013. The registration form can be found at the website of the conference: http://grammars.grlmc.com/LATA2013/ FEES: Early registration fees: 500 Euro Early registration fees (PhD students): 400 Euro Late registration fees: 540 Euro Late registration fees (PhD students): 440 Euro On‐site registration fees: 580 Euro On‐site registration fees (PhD students): 480 Euro At least one author per paper should register. Papers that do not have a registered author who paid the fees by January 2, 2013 will be excluded from the proceedings. One registration gives the right to present only one paper. Fees comprise access to all sessions, one copy of the proceedings volume, coffee breaks and lunches. PAYMENT: Early (resp. late) registration fees must be paid by bank transfer before January 2, 2013 (resp. March 23, 2013) to the conference bank account: Uno-e Bank bank’s address: Julian Camarillo 4 C, 28037 Madrid, Spain IBAN: ES3902270001820201823142 BIC/SWIFT: UNOEESM1 account holder: C. Martin – GRLMC account holder’s address: Av. Catalunya 35, 43002 Tarragona, Spain Please mention LATA 2013 and your name in the subject. A receipt will be provided on site. Remarks: - Bank transfers should not involve any expense for the conference. - People claiming early registration will be requested to prove that the bank transfer order was carried out by the deadline. - PhD students will need to provide evidence of their status on site. People registering on site must pay in cash. For the sake of local organization, however, it is much recommended to do it earlier. DEADLINES: Paper submission: November 15, 2012 (23:59h, CET) – EXTENDED - Notification of paper acceptance or rejection: December 16, 2012 Final version of the paper for the LNCS proceedings: December 25, 2012 Early registration: January 2, 2013 Late registration: March 23, 2013 Starting of the conference: April 2, 2013 End of the conference: April 5, 2013 Submission to the post‐conference journal special issue: July 5, 2013 QUESTIONS AND FURTHER INFORMATION: florentinalilica.voicu at urv.cat POSTAL ADDRESS: LATA 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34‐977‐559543 Fax: +34‐977‐558386 ACKNOWLEDGEMENTS: Basque Center for Applied Mathematics Diputació de Tarragona Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 20:57:45 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 21:57:45 +0100 Subject: Ressource: New release of DGT-TM (parallel corpus in 23 languages) Message-ID: Date: Mon, 05 Nov 2012 17:04:04 +0100 From: Ralf Steinberger Message-id: <009f01cdbb6f$2dca2980$895e7c80$@jrc.ec.europa.eu> X-url: http://langtech.jrc.ec.europa.eu/DGT-TM.html DGT-TM is an extraction of the translation memory of the European Institutions for all official EU languages, produced by the European Commission’s Directorate General for Translation (DGT) and distributed by the Joint Research Centre (JRC). Translation memories are sentences and their manually produced translations. The new release is called DGT-TM-2012. It follows the previous releases, DGT-TM (2007) and DGT-TM-2011. DGT-TM-2012 adds over six million translation units to the previous 57 million translation units, resulting in almost 3.3 million sentences for most languages, 63 million translation units in total. New features of DGT-TM-2012 are: · Small amounts of Irish data is now included for the first time; · Significantly more data for the Bulgarian, Maltese and Romanian languages; · Mostly about 285K new translation units per language. Languages: All 253 language pairs involving the following 23 languages: Bulgarian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Irish, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish and Swedish. URL: http://langtech.jrc.ec.europa.eu/DGT-TM.html Creator: European Commission - Directorate General for Translation (DGT, http://ec.europa.eu/dgs/translation/index_en.htm) WHAT IS DGT-TM The ‘Acquis Communautaire’ (http://europa.eu/abc/eurojargon/index_en.htm) is the entire body of European legislation, comprising all the treaties, regulations and directives adopted by the European Union (EU). Since each new country joining the EU is required to accept the whole Acquis Communautaire, this body of legislation has been translated into 22 official languages. For the 23rd official EU language, Irish, the Acquis has not been translated on a regular basis; which is why DGT-TM includes only little data in Irish. The Acquis Communautaire was split into sentences and aligned automatically at sentence level, resulting in the DGT translation memory, DGT-TM. The text data is accompanied by software that allows to extract all sentences and their translations for any of the 253 possible language pair combinations. MOTIVATION FOR THIS RELEASE The public data release is in line with the general effort of the European Commission to support multilingualism, language diversity and the re-use of Commission information. It follows the release of the JRC-Acquis parallel corpus in 2006 (over 1 billion words in 22 languages), of the DGT-TM Translation Memory in 2007, the multilingual named entity resource JRC-Names in 2011, the multilingual multi-label classification tool (and accompanying text data) JRC EuroVoc Indexer (JEX) (22 languages), and further smaller multilingual resources. See http://langtech.jrc.ec.europa.eu/JRC_Resources.html for more information on these resources. WHAT DGT-TM CAN BE USED FOR DGT-TM can be fed into translation memory software to support human translators in their work. As it is a large parallel corpus in electronic form, it can furthermore be used by specialists in computational linguistics to train statistical machine translation software, to generate multilingual dictionaries, to train and test multilingual information extraction software, and more. MORE INFORMATION ON DGT-TM At http://langtech.jrc.ec.europa.eu/JRC_Publications.html , you find detailed publications on the JRC’s multilingual language technology activity. For details on DGT-TM, you can read: Steinberger Ralf, Andreas Eisele, Szymon Klocek, Spyridon Pilos & Patrick Schlüter (2012). http://langtech.jrc.ec.europa.eu/Documents/2012_LREC_DGT-TM_Final.pdf DGT-TM: A freely Available Translation Memory in 22 Languages. Proceedings of the 8th international conference on Language Resources and Evaluation (LREC'2012), Istanbul, 21-27 May 2012. http://langtech.jrc.ec.europa.eu/Documents/2012_LREC_DGT-TM_Final.pdf WHAT NEXT? The JRC and collaborating services of the European Commission are currently finalising the release of further large-scale linguistic resources. Ralf Steinberger http://langtech.jrc.ec.europa.eu/RS.html European Commission - Joint Research Centre (JRC) 21027 Ispra (VA), Italy URL – Applications: http://emm.newsbrief.eu/overview.html URL – Resources: http://ipsc.jrc.ec.europa.eu/index.php?id=61 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:00:36 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:00:36 +0100 Subject: These: Damien Nouvel, Reconnaissance des entites nommees par exploration de regles d'annotation Message-ID: Date: Tue, 6 Nov 2012 10:00:46 +0100 From: Damien Nouvel Message-ID: Bonjour, J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée "Reconnaissance des entités nommées par exploration de règles d'annotation", qui aura lieu le mardi 20 novembre, à 14h15, à l'antenne universitaire de Blois (amphi 1). La soutenance sera suivie d'un pot auquel vous êtes chaleureusement conviés. Cordialement, Damien Nouvel -- Thèse : Reconnaissance des entités nommées par exploration de règles d'annotation - Interpréter les marqueurs d’annotation comme instructions de structuration locale Date et lieu : * mardi 20 novembre à 14h15 * antenne universitaire de Blois (3 place Jean-Jaurès, Blois), amphi 1 (sous-sol) Résumé : Ces dernières décennies, le développement considérable des technologies de l'information et de la communication a modifié en profondeur la manière dont nous avons accès aux connaissances. Face à l'afflux de données et à leur diversité, il est nécessaire de mettre au point des technologies performantes et robustes pour y rechercher des informations. A cet effet, les entités nommées (personnes, lieux, organisations, dates, expressions numériques, marques, fonctions, etc.) sont sollicitées dans l'objectif de catégoriser, d'indexer, ou, plus généralement, de manipuler des contenus. L'identification de ces éléments est souvent réalisée à l'aide de procédures dites d'annotation. Notre travail porte sur la reconnaissance et l'annotation des entités nommées au sein de transcriptions d'émissions radiodiffusées ou télévisuelles. A cet effet, nous explorons des données dans lesquelles sont relevées les entités nommées, pour extraire des règles d'annotation (qui s'appuient sur des instructions locales) afin d'élaborer un système de reconnaissance automatique des entités nommées. En première partie, nous abordons la problématique du traitement automatique du langage et des entités nommées en particulier. Nous revenons sur la relation qu'entretien l'automate avec le langage et décrivons les analyses généralement conduites pour traiter le langage naturel. Nous abordons ensuite la problématique des entités nommées (rétrospective des notions recouvertes, typologies, évaluation et annotation) et proposons une caractérisation de leur nature linguistique. Nous concluons cette partie par un positionnement à l'égard des approches état de l'art du domaine et par notre proposition, centrée sur les marqueurs (balises) de début ou de fin d'annotation. En seconde partie, nous exposons le formalisme d'exploration de données que nous adoptons. Nous commençons par le situer au sein des méthodes de fouille de texte. Puis nous nous dotons d'un cadre formel pour explorer les motifs, en particulier ceux qui sont corrélés aux marqueurs d'annotation, que nous nommons règles d'annotation. Enfin, nous présentons les modèles que nous utilisons lorsqu'il s'agit d'exploiter ces règles extraites afin de réaliser l'annotation d'un texte donné. La dernière partie décrit le système implémenté, mXS, et les résultats obtenus. Nous détaillons en premier lieu les modules de traitements, ressources lexicales et corpus à notre disposition pour mener les expériences. Nous présentons ensuite la mise en oeuvre et les résultats pour l'exploration des données et pour l'extraction des règles d'annotation. Enfin, nous fournissons des résultats chiffrés relatifs aux performances obtenues par mXS, ainsi que des indicateurs supplémentaires quant au comportement du système à divers point de vue et dans diverses configurations. Ils montrent que l'approche que nous proposons est compétitive et qu'elle ouvre des perspectives dans le cadre du traitement du langage et de l'annotation automatique. Composition du jury : * M. Jean-Yves Antoine, Professeur des universités, Université François Rabelais de Tours (directeur) * M. Frédéric Béchet, Professeur des universités, Aix Marseille Université (examinateur) * M. Bruno Crémilleux, Professeur des universités, Université de Caen (rapporteur) * Mme Nathalie Friburger, Maître de conférences, Université François Rabelais de Tours (encadrante) * Mme Sophie Rosset, Directrice de recherche, LIMSI-CNRS (rapporteure) * M. Arnaud Soulet, Maître de conférences, Université François Rabelais de Tours (encadrant) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:11:55 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:11:55 +0100 Subject: Seminaire: Conference de Jean-Francois Demonet, 23 novembre 2012, Marseille Message-ID: Date: Tue, 6 Nov 2012 11:59:04 +0100 From: Nadéra Bureau Message-ID: <006801cdbc0d$bc999170$35ccb450$@bureau at lpl-aix.fr> Brain & Language Research Institute Vendredi 23 novembre 2012 16h Salle des Voûtes Fédération de Recherche 3 C (Comportement, Cerveau, Cognition) 3 place Victor Hugo, Marseille (Labex BLRI) Jean-François DEMONET Cartographie des fonctions du Langage par stimulation électrique corticale ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:21:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:21:26 +0100 Subject: These: Charles Teissedre, Analyse semantique automatique des adverbiaux de localisation temporelle Message-ID: Date: Wed, 7 Nov 2012 12:14:20 +0100 From: Charles Teissedre Message-ID: Bonjour, J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée : Analyse sémantique automatique des adverbiaux de localisation temporelle : application à la recherche d’information et à l’acquisition de connaissances La soutenance se déroulera à 15h, le jeudi 22 novembre, à l'Université Paris Ouest Nanterre La Défense - salle de Visio-Conférences - Bât E 404. Le jury sera composé de : - Mme Nathalie Aussenac-Gilles, Directrice de recherche, IRIT (CNRS) - rapporteur - Mme Adeline Nazarenko, Professeur des Universités, Université Paris Nord - rapporteur - M. Maarten de Rijke, Professeur des Universités, Universiteit van Amsterdam - examinateur - M. Guy Lapalme, Professeur des Universités, Université de Montréal - examinateur - Mme Florence Amardeilh, Directrice du département recherche de Mondeca - examinateur - M. Jean-Luc Minel, Professeur des Universités, Paris-Ouest Nanterre La Défense - directeur - Mme Delphine Battistelli, Maître de conférences (HDR), Université Paris Sorbonne - co-directrice Résumé Cette thèse aborde la question de l'accès aux textes numériques, en particulier de l'accès à leur « contenu informationnel », vu sous l'angle de leur ancrage dans le temps. La visée de ces travaux est double : il s'agit de concilier une approche linguistique et une approche applicative, afin de contribuer à l'élaboration de nouveaux outils pour la fouille de textes, la recherche d'information et la gestion des connaissances - nouveaux outils en mesure de tirer parti de la sémantique d'un certain nombre d'informations temporelles exprimées dans les textes. Il s'agit ainsi à la fois de mettre en œuvre des systèmes d'interaction avec les utilisateurs et de parvenir à modéliser la sémantique des unités textuelles qui contribuent de façon saillante à l'ancrage dans le temps des situations décrites dans les textes : les adverbiaux de localisation temporelle. L'étude linguistique vise ici à montrer que l'ingénierie des langues peut gagner à envisager d'une façon renouvelée les phénomènes de localisation temporelle, en cherchant à reconnaître et à mettre au jour les différentes opérations à l'œuvre dans les adverbiaux de localisation temporelle. En faisant émerger les valeurs sémantiques de ces opérations, nous montrons qu'il devient possible d'élaborer de nouveaux systèmes de recherche d'information, susceptibles de traiter des requêtes associant un critère calendaire avec un ensemble de mots-clés, telles que « les universités au début du XIIe siècle », par exemple. S'appuyant sur les outils développés en ce sens, on montre qu'il devient également possible d'interagir avec des données structurées décrivant des informations temporelles, à la fois pour les interroger et pour les enrichir de façon semi-automatique. Vous êtes bien sûr chaleureusement conviés au pot qui suivra. Bien cordialement, Charles Teissèdre ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:46:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:46:59 +0100 Subject: Seminaire: INFOLINGU, Rojo Ranaivo, LIGM, Universite Paris-Est Marne-la-Vallee, 12 novembre 2012 Message-ID: Date: Thu, 8 Nov 2012 17:31:46 +0100 From: Myriam RAKHO Message-ID: X-url: http://infolingu.univ-mlv.fr/ ************************************************************************ INFOLINGU Le séminaire de l'équipe Informatique Linguistique du Laboratoire d'Informatique Gaspard Monge (LIGM) Université Paris-Est Marne-la-Vallée Date : Le Lundi 12 novembre 2012 à 10h30 Lieu : Université Paris-Est Marne-la-Vallée Bâtiment Copernic, 4ème étage, salle de séminaires 4B08R Toute personne intéressée est la bienvenue. ************************************************************************ * Intervenant : Rojo Ranaivo, LIGM, Université Paris-Est Marne-la-Vallée * Titre de la présentation : Construction d'un dictionnaire électronique des verbes du malgache * Résumé de la présentation : *Nous nous proposons de faire une présentation générale de notre travail de thèse intitulé* *« la formalisation de la morpho-syntaxe du malgache ». Il a pour objectif de construire* *un dictionnaire électronique des verbes de cette langue. D’un point de vue linguistique,* *la description du système de conjugaison est la principale innovation de cette thèse.* *En effet, la langue malgache jusqu’à ce jour n’a aucun manuel de conjugaison,* *et il a été nécessaire d’en faire un pour la construction du dictionnaire électronique.* *Quant à la réalisation technique du travail, la codification des données (catégories* *grammaticales et traits flexionnels, variations morphologiques des radicaux verbaux,* *combinaison des affixes avec les radicaux) a nécessité des discussions sur le modèle* *formel à retenir, et une organisation assez rigoureuse, tout comme en coréen ou dans* *les autres langues agglutinantes, car les données à manipuler sont relativement* *nombreuses. Des solutions ont été adoptées tant sur le plan de la linguistique que sur* *le plan de la réalisation technique qui ont débouché sur des résultats encourageants :* *un système de conjugaison a été adopté et des principes sur la codification des données* *ont rendu le travail de description formelle réalisable. Ainsi, un petit dictionnaire électronique* *des verbes du malgache a été construit permettant plus tard par diverses applications* *le traitement automatique de cette langue (traitement de texte, vérificateur orthographique, filtrage, et autres).* http://infolingu.univ-mlv.fr/ Anthony SIGOGNE, Myriam RAKHO ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:49:41 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:49:41 +0100 Subject: Ecole: CLARA Thematic training course on evaluation of Human Language Technologies Message-ID: Date: Thu, 08 Nov 2012 18:50:42 +0100 From: ELRA ELDA Information Message-ID: <509BF0F2.9050002 at elda.org> [Apologies for cross-postings] ******************** CALL FOR PARTICIPATION CLARA Thematic training course on evaluation of Human Language Technologies www.elda.org/clara/ 26-29 November 2012, Paris, France As part of the CLARA Marie Curie Initial Training Network, ELDA and University of Copenhagen organize a four-day thematic training course on evaluation of Human Language Technologies in Paris. ******************** Goal and Focus For any HLT research effort to be successful, it is essential that it be assessed through rigorous evaluations of the developed technologies. This allows performance benchmarking and a better understanding of possible limitations and challenging conditions. The CLARA Thematic training course on evaluation of HLT aims at providing both ESRs (Early Stage Researchers) and ERs (Experienced Researchers) the background and skills to use and implement state-of-the–art evaluation tools and techniques for speech technologies, grammars and parsing, machine translation and speech-to- speech translation, information retrieval/filtering, multimodal interfaces, etc.). The CLARA Thematic training course on evaluation of HLT will introduce and describe some evaluation concepts (comparative evaluation versus competition, technology evaluation versus usage/usability evaluation). It will also describe the different types of evaluation and how to ensure that evaluation does not kill innovative not-yet-mature approaches. Additionally, The CLARA Thematic training course on evaluation of HLT will elaborate on the role of evaluation on the research progress, on the need for a truly European infrastructure for HLT evaluation, on the main reasons to promote an international dimension of the evaluation, insisting on the multilingual issues. Given the interdisciplinary nature of the workshop, the workshop will be relevant for any ESRs/ERs who are involved in the development of algorithms and systems for speech technologies, machine translation, parsers, information retrieval, multimodal interfaces, etc. ******************** Invited Speakers * Khalid Choukri, ELDA, France * Bente Maegaard, University of Copenhagen, Denmark * Joseph Mariani, IMMI, France (to be confirmed) * Patrick Paroubek, LIMSI, France * Anders Søgaard, University of Copenhagen, Denmark ******************* There is no participation fee for the CLARA thematic training course on evaluation of Human Language Technologies but online registration is mandatory. Please register at: http://survey.elda.org/index.php?sid=67327&lang=en by November 23. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:54:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:54:08 +0100 Subject: Seminaire: Alpage, Khalil Sima'an, 16 novembre 2012 Message-ID: Date: Fri, 9 Nov 2012 16:16:01 +0100 From: Marie Candito Message-ID: ************** Séminaire Alpage ******************* Séminaire de l'école doctorale de Paris Diderot : Il s'agit du séminaire de recherche en linguistique informatique organisé par l'équipe Alpage, équipe mixte INRIA - Paris Diderot, spécialisée en analyse syntaxique automatique et en traitement du discours. Le prochain séminaire se tiendra : * vendredi 16 novembre de 11h à 12h30 * en salle 3E91 à l'UFRL, 16, rue de Clisson, 75013 Paris (3e étage gauche) Toute personne intéressée est la bienvenue. ****************************** Title: On the Role of Syntactic Trees in Machine Translation Abstract: Over the past years, major effort was spent on incorporating monolingual syntax into statistical machine translation with mixed results. One difficulty in doing so often seems that translation equivalence does not necessarily conform to monolingual syntactic constituency structure, as assumed by traditional compositional semantics. In this talk I will reflect on syntactic structure aiming to show that the information represented in a syntactic tree can be represented in alternative ways. By representing this information in terms of translation equivalence, syntactic information can be brought into statistical MT models effectively. In the talk I will give a bird's-eye view of three recent models developed together with my co-workers and touch upon some relevant aspects of the interplay between syntax and SMT. Subsequently, I will give a brief overview of the problem of how to represent the translation mapping hierarchically in order to capture the relations of translation equivalence adequately. I will also briefly discuss how to use this new hierarchical representation to pave the way for learning compositional statistical synchronous grammars from word-aligned parallel corpora. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:56:33 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:56:33 +0100 Subject: Info: (Re-)adhesion AFIA en 2012 Message-ID: Date: Fri, 02 Nov 2012 18:50:27 +0100 From: "Thomas Guyet (Tresorier AFIA)" Message-ID: <1351878627.2839.44.camel at portable-tg.irisa.fr> X-url: http://www.afia.asso.fr Bonjour, [désolé pour les inévitables réceptions multiples] L'objectif de l'AFIA est de promouvoir l'Intelligence Artificielle (IA) sous ses différentes formes, de regrouper et de développer la communauté française en IA, et d'en assurer sa visibilité aux niveaux national et international. Grâce au soutien de ses adhérents, l'AFIA assure : * le maintien d'un site web regroupant les informations majeures en IA (http://www.afia.asso.fr) * la parution trimestrielle d'un Bulletin de l'IA, * la diffusion mensuelle de Brèves à propos des actualités en cours en IA, * la remise annuelle d'un Prix de Thèse de Doctorat en IA, * la réponse aux consultations à propos d'IA (ANR, CNRS, ... ) * un lien entre adhérents sur LinkedIn et Facebook L'AFIA anime la communauté par l'organisation de grands rendez-vous annuels : en alternance, la « Plate-forme de l'IA » qui se tiendra en 2013 à Lille et, en collaboration avec l'AFRIF, le Congrès Reconnaissance des Formes et IA (RFIA 2012 à Lyon). L'AFIA organise des rencontres thématiques bimestrielles, avec le soutien d'autres Associations Savantes (RobIA 2012 avec le Gdr Robotique, TLIA 2012 avec ATALA , ROIA 2011 avec ROADEF, ISIA 2011 avec l'AFIS, ainsi que d'autres journées en préparation … ) L'AFIA a parrainé en 2012 de nombreuses manifestations thématiques, nationales ou internationales, dont CAp, IC, JFSMA, WACAI, PAAMS, TIA et, en tant que membre français de l'ECCAI (http://www.eccai.org/), l'association a également patronné l'accueil de la conférence ECAI 2012 à Montpellier (http://www2.lirmm.fr/ecai2012/). L'AFIA contribue à la participation financière de ses membres aux événements soutenus par l'association. Ainsi, les membres de l'AFIA inscrits aux conférences 2012 RFIA, IC, CAp, JFSMA ont bénéficié d'une réduction équivalente à deux fois le coût de leur adhésion. De plus, tous les membres de l'AFIA ont bénéficié d'une réduction de 100€ sur les tarifs d'inscription à la conférence ECAI 2012. L'ensemble de ces activités ainsi que les grands événements à venir ont été présentés lors de l'AG de l'association en octobre 2012. Le diaporama de présentation est disponible sur le site de l'association. Pour que l'AFIA puisse continuer ces activités en 2013 et vous soutenir dans l'organisation de vos événements en lien avec l'IA, nous vous invitons à adhérer à l'AFIA. Votre adhésion participera au développement de la communauté française en IA et vous fera bénéficier des avantages réservés par l'AFIA à ses adhérents. Pour adhérer, vous pouvez utiliser le bulletin en pièce jointe ou accéder directement au formulaire en ligne sur le site de l'AFIA : http://www.afia.asso.fr/proxy_adhesion.php?page=index Nous vous rappelons que l'adhésion à l'association peut être individuelle ou au titre d'une institution, laboratoire ou entreprise (personne morale). T. Guyet Trésorier de l'AFIA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:41:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:41:28 +0100 Subject: Revue: Diachroniques, numero 2 Message-ID: Date: Mon, 29 Oct 2012 15:44:14 +0100 From: Jalouneix Catherine Message-ID: <508E963E.5070209 at paris-sorbonne.fr> X-url: http://pups.paris-sorbonne.fr/pages/aff_livre.php?Id=1015 Monsieur, Je me permets d'attirer votre attention sur la publication récente du numéro 2 de la revue de linguistique française : /Diachroniques./ //L'objectif de ce numéro est de proposer une vue d'ensemble sur une question trop souvent négligée : /Le sentiment de la langue/. Cette question est abordée à travers deux axes : un premier rassemble des réflexions théoriques issues des différents courants dans lesquels le point de vue du locuteur, ses attitudes, ses discours, ses représentations, sont pris en compte dans l'analyse d'un « état de langue » ou d'un « état d'usages » ; un second rassemble des enquêtes empiriques couvrant les trois grandes périodes de l'histoire du français. Pour plus de précisions : http://pups.paris-sorbonne.fr/pages/aff_livre.php?Id=1015 En espérant que cet ouvrage retienne votre attention. Je vous adresse, Monsieur, mes meilleures salutations. Catherine Jalouneix, chargée de communication aux PUPS 01 53 10 57 63 catherine.jalouneix at paris-sorbonne.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:43:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:43:26 +0100 Subject: Job: Stage M2, Extraction automatique d'information de contenus textuels Message-ID: Date: Sat, 10 Nov 2012 18:28:17 +0100 From: Alexandre Pauchet Message-ID: <509E8EB1.7070705 at insa-rouen.fr> X-url: http://asi.insa-rouen.fr/enseignants/~apauchet/ ** Stage de M2 Recherche : Extraction automatique d'information de contenus textuels ** Mots-clefs : Extraction de connaissances, analyse de dialogue/conversation, traitement automatique de la langue. ** Contexte : Plixee est une startup fondée par trois ingénieurs de l'INSA de Rouen. Elle développe une solution à destination du grand public, associations et TPE visant à faciliter la communication et l'organisation de projets. L'offre comble un manque constaté d'outils simples pour s'organiser de manière dématérialisée. Elle permet d'éviter les discussions par emails ou le panachage de plusieurs services dispersant l'information. Elle se différencie des solutions existantes en ne fournissant que des outils simples et ne se substitue pas aux logiciels avancés de gestion de projets. Une des grandes forces de Plixee est d'accompagner l'utilisateur dans le processus créatif. En créant un espace dédié à leur projet, les utilisateurs disposent d'un espace de discussion au sein duquel ils peuvent échanger autour de leurs idées. Au fur et à mesure de leurs discussions, les idées vont germer et amener à prendre des décisions. Celles-ci se matérialisent par des éléments de projet que les utilisateurs peuvent extraire directement depuis les messages (questions, tâches, etc.). Ces éléments construisent alors petit à petit le projet qui sera achevé au terme de leur consultation/réalisation. ** Objectif du stage : Le processus d'extraction d'éléments au sein des discussions est pour le moment réalisé manuellement par les utilisateurs. L'objectif de ce stage est de faciliter ce processus en proposant des algorithmes et outils suggérant ou extrayant automatiquement les éléments adéquats grâce à une analyse du contenu de la discussion. On peut ainsi imaginer que dans une conversation portant sur le choix d'une date de départ en vacances, le système suggère automatiquement une question reprenant les différentes possibilités évoquées dans des messages précédents. Pour répondre à cette problématique, nous envisageons donc de recourir à des systèmes d'analyse de contenu. Trois approches sont envisagées : Une approche symbolique à l'aide de patrons linguistiques, qu'ils soient construits manuellement ou automatiquement (voir [1] comme exemple appliqué à la détection d'événements). Une approche numérique permettant d'apprendre automatiquement les informations à extraire (voir [2] pour une approche entièrement automatique). Une approche hybride, combinant les deux approches précédentes. Par ailleurs, la structure dialogique pourra également être exploitée afin de faciliter l'extraction des éléments en question. [3], par exemple, propose une méthodologie d'analyse de dialogues dont l'approche hybride pourrait servir à détecter des structures courant sur plusieurs messages. ** Travail à effectuer : - Modélisation formelle du problème - Étude bibliographique des solutions existantes - Méthode(s) d'extraction automatique de connaissances - Implantation et évaluation des résultats Comme base de travail seront fournis : un corpus annoté et un prototype simplifié issu d'un développement réalisé par deux étudiants en projet. ** Encadrement : Vincent Durmont (Plixee) : vincent at plixee.com Alexandre Pauchet (MIU at LITIS - INSA de Rouen) : pauchet at insa-rouen.fr Quentin Suire (Plixee) : quentin at plixee.com ** Équipe d'accueil et déroulement du stage Le stagiaire sera intégré dans la société Plixee et dans l'équipe "Modélisation Interaction et Usages" (MIU) du LITIS (EA 4108) à l'INSA de Rouen. De façon générale, l'équipe MIU adopte une approche pluridisciplinaire de sciences cognitives. Elle s'intéresse notamment à la relation entre l'homme et les systèmes d'information et de sa modélisation, posant comme axiome que les interactions sont représentatives de l'usage. Le défi scientifique est de comprendre comment modéliser les interactions entre l'homme et la machine ou entre l'homme et l'homme avec la machine comme interface. Le stage se déroulerait de février 2013 à juin 2013. L'étudiant serait hébergé dans les locaux du laboratoire LITIS qui lui fournirait le matériel nécessaire à son travail. La rémunération de l'étudiant serait assurée par la société Plixee au tarif légal en vigueur (436,05EUR par mois). ** Références bibliographiques [1] L. Serrano, T. Charnois, S. Brunessaux, B. Grilhères, M. Bouzid. Combinaison d'approches pour l'extraction automatique d'événements. JEP-TALN-RECITAL'2012 - Grenoble, France. [2] R. Collobert, J. Weston, L. Bottou, M. Karlen, K. Kavukcuoglu and P. Kuksa. Natural Language Processing (Almost) from Scratch. Journal of Machine Learning Research, 12:2493-2537, 2011. [3] Z. Alès, G. Dubuisson Duplessis, O. Serban, A. Pauchet, A Methodology to Design Human-Like Embodied Conversational Agents based on Dialogue Analysis, Workshop HAIDM at AAMAS, Valencia, Spain, pp.34-49, 2012. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:47:01 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:47:01 +0100 Subject: Sujet de these: Two salaried PhD positions in NLP (51062 euro/yr) at University of Sheffield - Marie Curie Message-ID: Date: Sun, 11 Nov 2012 22:03:32 +0100 From: Leon Derczynski Message-ID: X-url: http://clg.wlv.ac.uk/projects/EXPERT/ X-url: http://www.shef.ac.uk/jobs Applications are invited for two 3-year Early Stage Researcher PhD positions in corpus-based approaches to machine translation. The positions have been awarded as part of the new EU FP7 Marie-Curie Initial raining Network EXPERT (http://clg.wlv.ac.uk/projects/EXPERT/), concerned with the exploitation of empirical approaches to machine translation, including statistical machine translation and example-based machine translation. The EXPERT project puts together researchers from six European universities (The University of Sheffield, Universidad de Malaga, Universitaet des Saarlandes, Dublin City University, Universiteit van Amesterdam, and University of Wolverhampton) and five translation services and technology providers (Pangeanic, Hermes and Translated, Celer Soluciones and WordFast). The two projects allocated to the University of Sheffield are (i) learning from human feedback, which is concerned about methods to collect and incorporate human feedback into translation systems to improve the quality of translations; and (ii) estimating the quality and confidence of corpus-based approaches to machine translation and the quality of translated texts. The work in both projects will focus on statistical and machine learning techniques to address the problems, but it will also involve aspects of human translation studies, based on a strong interaction with some of the partners in EXPERT. The research will be conducted as part of the Natural Language Processing research group in Sheffield, with opportunities for collaborative work with several of the leading universities and industrial partners in EXPERT, and with the expectation of a 6-month secondment to 2-3 partners in this project. Further information about the research group can be found at: http://nlp.dcs.shef.ac.uk. The successful individual will be employed as a salaried researcher at the University of Sheffield, while studying towards his/her PhD. Salary rates and additional mobility and training allowances are as per the Marie Curie programme (see Annex 3 of this document http://ec.europa.eu/research/participants/portal/download?docId=31562, page 69). For employment in the UK, the reference figure for *gross salary is 51,062 euros/year, plus additional contribution towards mobility and training*. Please check Section III.3 of the following link for further information on the Marie Curie scheme regarding eligibility criteria: ftp://ftp.cordis.europa.eu/pub/fp7/docs/fp7-mga-annex3intramulti_en.pdf. In particular, *candidates cannot have lived in the UK for more than 12 months in the 3 years immediately prior to their appointment*. Applicants should hold a good honours degree in a relevant field of study (e.g. computer science, engineering, mathematics) and have experience in natural language processing, machine translation or related area. They should also have a solid background in mathematics/statistics and excellent programming skills (C/C++, Java, Python/Perl, etc.). See the job specification for more details on the expected profile: http://www.dcs.shef.ac.uk/~lucia/resources/EXPERT_Marie_Curie_Early_Stage_Researcher.pdf The post is fixed term for three years with a start date of January 2013 or soon after. Closing Date: *10th December 2012* For applications: http://www.shef.ac.uk/jobs, Search and apply for jobs, job reference number: *UOS005598* In addition to submitting applications to the University of Sheffield, candidates should apply via the website provided by project coordinator: http://clg.wlv.ac.uk/projects/EXPERT/. For informal enquiries about this job and department, contact: Dr Lucia Specia on l.specia at sheffield.ac.uk. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:53:01 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:53:01 +0100 Subject: Appel: Campagne d'etiquetage en sentiments de tweets et blogs Message-ID: Date: Mon, 12 Nov 2012 07:29:44 +0000 From: Message-ID: <2921_1352705385_50A0A569_2921_12920_1_50BA83905E9CAC4489EFDA167756E5DA01C3E8 at PEXCVZYM12.corporate.adroot.infra.ftgroup> X-url: http:// Bonjour à tous, J'aimerais vous demander votre aide pour une expérience d'analyse de sentiments en discours, réalisée dans le cadre du projet coopératif DIFAC. Il s'agit d'évaluer l'image de différentes marques sur des plateformes sociales (messages issus de blogs et de Twitter). L'évaluation se fait à partir d'une interface, à l'adresse suivante : https://imago-difac-sql.orange-labs.fr/tweet/. Chaque message à évaluer apparaît successivement. Vous disposez d'une grille d'évaluation à compléter, puis vous validez. Il n'y a pas de contrainte quantitative : vous pouvez réaliser autant d'évaluations que vous le souhaitez. L'objectif est de faire le lien entre des macro-caractéristiques de messages (propriétés linguistiques ou structurelles) et le réseau lexical de traits descriptifs de l'opinion. L'idée est d'appliquer des traitements linguistiques et des méthodes d'apprentissage, ce qui demande de disposer d'un nombre important d'annotations. La campagne d'étiquetage est ouverte jusqu'à début décembre. Vous pouvez vous connecter plusieurs fois si vous le souhaitez. N'hésitez pas à me contacter si vous souhaitez des précisions complémentaires. Merci d'avance pour votre aide. Cordialement, Coralie Reutenauer coralie.reutenauer at orange.com 02 96 05 36 86 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:56:58 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:56:58 +0100 Subject: Stage: Master / Ingenieur - aide au handicap : IHM et TALN Message-ID: Date: Mon, 12 Nov 2012 10:25:08 +0100 From: Jean-Yves Antoine Message-ID: <50A0C074.3050205 at univ-tours.fr> X-url: http://www.info.univ-tours.fr/~antoine/documents_enseignement/2013_Proposition_stage_Sibylle.pdf X-url: http://www.info.univ-tours.fr/~antoine/SIBYLLE/Sibylle_fr/index.html X-url: http://www.kerpape.mutualite56.fr/ ================================ Proposition de stage de fin d'études "Optimisation ergonomique d'un système d'aide à la communication pour des personnes lourdement handicapées" Résumé ------------ Proposition de stage de recherche ou de fin d'études en informatique et Interaction Homme-Machine pour l'aide au handicap d'une durée de 4 mois minimum. Version PDF : http://www.info.univ-tours.fr/~antoine/documents_enseignement/2013_Proposition_stage_Sibylle.pdf Contexte scientifique ------------------------------- En collaboration avec le Laboratoire d'Informatique de l'Université de Tours, le laboratoire d'informatique du Centre Mutualiste de Rééducation de Kerpape (56- Morbihan) propose un sujet de stage dans le cadre du projet de recherche TMH (Télécommunications, Mobilité et Handicap) financé par la société BAMSOO. Une des actions envisagées dans le cadre du projet TMH est le développement de solutions intégrées pour l'aide à la personne. Plus précisément, nous nous intéressons à la mise en place de systèmes d'aide à la communication pour des personnes souffrant de handicaps moteurs très sévères (Infirmité Motrice Cérébrale, Scléroses Latérales Amyotrophiques, syndrome d'enfermement...) se traduisant par une tétraplégie ou une athétose accompagnée d'une perte de l'usage de la parole. La communication est alors privée de son support oral habituel, de même que les capacités très limitées de contrôle physique de l'environnement par la personne handicapée empêchent toute saisie directe de message sur un clavier d'ordinateur. L'aide à la personne recherchée vise donc un objectif principal : pouvoir échanger avec autrui par l'intermédiaire d'un système de suppléance informatique. Ce système repose sur l'écriture de phrases à l'aide d'un clavier virtuel affiché à l'écran. Un curseur se déplace automatiquement caractère par caractère, le long du clavier virtuel. L'intervention de la personne handicapée se limite à la désignation des symboles lorsque le curseur est sur la touche ou le caractère désiré. Cette sélection est réalisée à l'aide d'un dispositif physique qui remplace le périphérique d'entrée de l'ordinateur (bouton pressoir, détecteur de souffle, suivi du regard...). L'utilisation d'un module de prédiction de lettres et de mots permet d'accélérer la saisie en évitant à l'utilisateur de saisir tous les caractères du message. Le laboratoire LI a déjà développé un tel système (Sibylle) qui repose sur une prédiction de mots très efficace et est utilisé en routine dans plusieurs centres de rééducation et laboratoires de recherche. Dans le cadre de ce stage, la personne recrutée travaillera avec le centre de rééducation fonctionnelle de Kerpare. Dans le cadre d'un projet (VOLTAIRE) financé par la Fondation Motrice, une nouvelle interface de l'application Sibylle a été développée précisément avec le centre de rééducation de Kerpape, sans que cette dernière ne soit intégrée au moteur de prédiction. L'objectif de ce stage est d'élaborer une interface homme-machine ergonomique qui facilite l'utilisation du système et permette de bénéficier d'une manière optimale de la prédiction de mots. Cette interface fera l'objet d'expérimentations réelles auprès de patients des centres de Kerpape Travail à réaliser ------------------------ La personne recrutée sera en charge à la fois de la conception et des aspects développement logiciel mis en jeu au cours du stage, ainsi que de la validation par tests utilisateurs réalisés à Kerpape. Le projet se déroulera en trois phases successives : Phase 1 - Réingénierie (1 mois ½) -- Reprise en main du code de l'interface développée au cours du projet VOLTAIRE et interfaçage avec le moteur de prédiction, documentation du code. Il s'agit d'un travail de réingénierie qui servira avant tout au stagiaire à prendre la mesure du projet proposé. Elle consistera à achever le travail d'intégration en cours sur le système SIBYLLE seul. Phase 2 - Ergonomie (2 mois ½) -- Evaluation d'une première maquette du logiciel développé et analyse de ses faiblesse ergonomiques. Proposition d'amélioration de l'interface pour optimiser le recours à la prédiction. Plusieurs pistes d'améliorations peuvent déjà être citées : - Renforcement des possibilités de configuration du système pour adaptation à l'utilisateur - Étude du positionnement de la liste de prédiction, intégration éventuelle dans le clavier de lettres - Renforcement de l'adaptation de l'interface au handicap et à l'utilisateur considéré - Étude de l'adaptation de messages préenregistrés suivant le contexte d'utilisation. Ces phrases, composées à l'avance, servent le plus souvent pour la rédaction rapide de messages d'alertes ou de demandes pressantes. En modifiant la liste des messages suivant le contexte d'utilisation courant du logiciel, on augmente les possibilités de communication rapide Phase 3 -- Dispositifs d'entrée intégrés ou mobile (1 à 2 mois suivant la durée du stage) -- Cette phase est optionnelle. Elle dépendra de l'avancée du travail et de la durée du stage. Elle consisterait soit, à étudier l'usage du système de communication directement à partir d'un dispositif de commande comme, par exemple, le joystick de commande du fauteuil roulant autonome du patient, soit à travailler plus en avant sur la portabilité du système sur des systèmes mobiles de type smartphone ou tablet PC. Profil recherché ----------------------- La personne recrutée sera en cycle terminal d'études en informatique, de niveau Bac+5 (Master informatique professionnel, recherche ou indifférencié, école d'ingénieur). Des compétences en Interaction Homme-Machine seront appréciées. Dans le cas d'un(e) étudiant(e) en Master Recherche, le sujet de stage pourra être adapté aux attentes de l'étudiant. Le cas échéant, une adaptation du sujet pourra être envisagé pour des étudiants de Licence ou DUT informatique de très bon niveau (mention Bien appréciée) : prévoir dans ce cas une prolongation de la convention de stage. Rémunération -------------------- Rémunération maximale prévue par la règlementation à savoir 436,05 EUR par mois durant les 4 premiers mois de stage. En cas de stage donnant satisfaction, et/ou si l'étudiant doit/veut faire un stage d'une durée supplémentaire, une prolongation de stage peut-être envisagée avec rémunération au niveau du SMIC. Cette rémunération sera assurée dans le cadre d'un projet industriel financé par la société BAMSOO. Lieu d'exercice ----------------------- La personne recrutée travaillera près de Lorient, au sein du Centre de Rééducation Fonctionnelle de Kerpape. Il s'intégrera dans une équipe projet composée de Jean-Paul Departe et Willy Allègre (Laboratoire d'informatique du Centre de Rééducation Fonctionnelle de Kerpape) et de Jean-Yves Antoine (Université François Rabelais de Tours). Contact -- Dépôt des candidatures ------------------------------------------------- Contact : Jean-Yves.Antoine at univ-tours.fr Dépôt des candidatures : auprès de Jean-Yves Antoine. Merci de déposer un CV détaillé de vos activités passées, accompagné d'une lettre de motivation et de relevés de notes concernant vos deux dernières années d'études. Renseignements supplémentaires -------------------------------------------------- Système Sibylle : http://www.info.univ-tours.fr/~antoine/SIBYLLE/Sibylle_fr/index.html Centre de rééducation de Kerpape : http://www.kerpape.mutualite56.fr/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:03:09 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:03:09 +0100 Subject: Stage: Master 2, Amelioration du systeme de paraphrasage d'un systeme de Questions / Reponses Message-ID: Date: Mon, 12 Nov 2012 11:17:02 +0100 From: Manon Quintana Message-ID: X-url: http://www.inbenta.com/fr X-url: http://www.inbenta.com/images/france/offre-stage-tal.pdf *Société* inbenta (http://www.inbenta.com/fr) est une société d'origine catalane pionnière dans le Traitement Automatique du Langage Naturel (TALN) et la recherche sémantique. Basée sur ces concepts novateurs, inbenta développe depuis 2005 des outils web pour les sites internet de Grands Comptes. Depuis 2009 et fort de son succès, inbenta étend ses activités sur le territoire Français et a ouvert début 2012 une filiale sur Toulouse. *Description de l'offre* inbenta développe différents outils web qui permettent de répondre automatiquement aux questions des internautes en puisant les réponses dans une base de connaissances/FAQ constamment mise à jour. Notre système de réponse repose sur un lexique basé sur la Lexicologie Explicative et Combinatoire qui s'encadre dans la Théorie Sens-Texte. Grâce à ce lexique et à ses fonctions lexicales, nous pouvons générer des paraphrases. Notre algorithme va donc anticiper les différentes formulations employées par les internautes pour exprimer une même idée : *J'ai perdu ma CB* *je ne retrouve plus ma carte !! * *perte carte bleue* L'objet du stage sera de participer à l'amélioration de notre système de paraphrasage de notre système de Question / Réponse. Le stagiaire devra comprendre et analyser la solution développée par inbenta. Il devra s'imprégner de l'existant afin de faire évoluer l'algorithme à travers notamment des cas clients concrets. *Profil recherché* Vous terminez vos études en Traitement Automatique du Langage Naturel (Master 2) et souhaitez intégrer une structure innovante où vous pourrez faire vos preuves et exprimer vos ambitions. Passionné(e) par la linguistique informatique, vous avez bien entendu une excellente maîtrise de la langue française et disposez d'un niveau suffisamment bon en espagnol, anglais ou catalan afin de pouvoir aisément communiquer avec les équipes de Barcelone. Bonus : - Maîtrise d'au moins un langage de programmation (PHP de préférence) - Maitrise des expressions régulières et du SQL *Modalités du poste* - Stage de fin d'études conventionné de 6 mois (avec possibilité d'embauche en CDI) - Rémunération prévue: conventionnelle + prime - Début : à partir de Février / Mars 2013 - Lieu : Toulouse Merci d'adresser CV et lettre de motivation par e-mail à l'adresse suivante : *rh at inbenta.com* Plus de détails sur cette offre de stage ici : http://www.inbenta.com/images/france/offre-stage-tal.pdf *Manon Quintana* Computational linguist *IN**B**ENTA* +33 (0)5 31 54 94 97 www.inbenta.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:06:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:06:26 +0100 Subject: Conf: Colloque international interdisciplinaire MIC Sorbonne 2012, 15-16 novembre 2012, Paris Message-ID: Date: Mon, 12 Nov 2012 12:51:57 +0100 From: CELTA Sorbonne Message-Id: <252D47C0-B2A5-45A6-9207-C4E00FE36D53 at paris-sorbonne.fr> X-url: http://www.celta.paris-sorbonne.fr/CELTA-colloques/MIC-Sorbonne-2012/MIC2012-Programme.pdf X-url: http://www.celta.paris-sorbonne.fr/forum/index.php Chers Collègues et chers Étudiants, Nous avons le plaisir d'annoncer le 3e Colloque international et interdisciplinaire "MIC Sorbonne 2012" (Paris,.15-16, novembre, 2012) qui, cette fois, sera consacré au thème suivant: "Nouveaux Standards pour les Sciences du Langage" Le pdf du programme se trouve ici: http://www.celta.paris-sorbonne.fr/CELTA-colloques/MIC-Sorbonne-2012/MIC2012-Programme.pdf Vous trouverez beaucoup d'informations préliminaires dans notre Forum de Discussion: http://www.celta.paris-sorbonne.fr/forum/index.php Venez nombreux. Ce n'est pas cher. Les frais d'inscription ne sont que: 20€ pour les étudiants et 40€ pour les autres. Bien cordialement, A. Wlodarczyk ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:08:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:08:50 +0100 Subject: Appel: CIAA 2013 Message-ID: Date: Mon, 12 Nov 2012 13:12:04 +0100 (CET) From: Denis Maurel Message-ID: <1846595488.10120183.1352722324742.JavaMail.root at mail10> X-url: http://cs.smu.ca/~ciaa2013/ X-url: http://tln.li.univ-tours.fr/ciaa/) CIAA 2013: First Call for Papers 18th International Conference on Implementation and Application of Automata Halifax, Nova Scotia, Canada July 16-19, 2013 http://cs.smu.ca/~ciaa2013/ ------------------- AIM AND SCOPE CIAA is the premier annual conference for researchers, application developers and users of automata-based systems. The applications of the theory of automata, a foundational area of computer science, have spread to almost all areas of computer science and many other disciplines. The CIAA series has published significant papers describing the applications of finite automata in parsing and compilers, logic, natural language processing, pattern matching, database management, and bioinformatics. The conference also accepts papers that advance the state of the art in the theoretical study of finite automata, regular expressions, grammars and related formal models. Another goal of the conference is to provide additions and enhancements to existing software systems that manipulate automata, regular expressions, grammars, and related structures; examples of such systems include AGL, AMoRE, ASTL, Automate, FADELA, FAdo, FinITE, FIRE Station, FSM, Grail+, I-LaSer, INR, Intex, JFLAP, MERLin, MONA, TESTAS, Turing's World, Vaucanson, WFSC and Whale Calf. TOPICS CIAA invites papers on all aspects of implementation, application, and theory of automata and related structures, including but not limited to: Algorithms on automata Automata and logic Bioinformatics Complexity of automata operations Compilers Computer-aided verification Concurrency Data structure design for automata Data and image compression Design and architecture of automata software Digital libraries DNA/molecular/membrane computing Document engineering Editors, environments Experimental studies and practical experience Implementation of verification methods and model checking Industrial applications Natural language and speech processing Networking New algorithms for manipulating automata Object-oriented modeling Pattern-matching Pushdown automata and context-free grammars Quantum computing Structured and semi-structured documents Symbolic manipulation environments for automata Transducers and multi-tape automata Techniques for graphical display of automata VLSI Viruses, related phenomena World-wide web PREVIOUS EDITIONS Seventeen previous CIAA conferences took place in: Porto (2012), Blois (2011), Winnipeg (2010), Sydney (2009), San Francisco (2008), Prague (2007), Taipei (2006), Nice (2005), Kingston (2004), Santa Barbara (2003), Tours (2002), Pretoria (2001), London Ontario (2000), Potsdam (WIA'99), Rouen (WIA'98), London Ontario (WIA'97), London Ontario (WIA'96). See the conference site (http://tln.li.univ-tours.fr/ciaa/) for archives on these previous editions. IMPORTANT DATES Submission Deadline: March 10, 2013 Notification: April 21, 2013 Final Version: TBA, 2013 Conference Dates: July 16-19, 2013 SUBMISSIONS Papers will be submitted in PDF, using the EasyChair system at: http://www.easychair.org/conferences/?conf=ciaa2013 Authors must use the LNCS-style LaTeX2e available at: http://www.springer.de/comp/lncs/authors.html) Research papers are sought on all aspects of implementation, application, and theory of automata and related structures. Researchers are invited to submit unpublished original research. Simultaneous submissions to other venues is not allowed. Papers must be written in English and provide sufficient details to allow the program committee to assess their merits. If the authors believe that more details are necessary to substantiate the claims of the paper, they may include a clearly marked appendix to be read at the discretion of the committee. Proceedings will be published by Springer in Lecture Notes in Computer Science (LNCS) and will be available at the conference. Extended versions of selected proceedings papers will appear in a special issue of TBA. DEMOS We encourage the submission of software demos. Developers wishing to demonstrate their software should submit a two-page description outlining the design of their system and its application area(s). More information about how to submit a demo will be available at the conference website. VENUE CIAA 2013 will take place in Halifax, Nova Scotia, the largest city in Atlantic Canada (east of Montreal), located at the east coast of Canada. The venue will be Saint Mary's University, located in the city centre. RELATED EVENT CIAA 2013 will be held just before DCFS 2013, which will take place in London, Ontario. INVITED SPEAKERS Cezar Campeanu (U. of Prince Edward Island, Canada) Helmut Jurgensen (U. of Western Ontario, Canada) Margus Veanes (Microsoft Research, USA) TBA () PROGRAM COMMITTEE Brzozowski, Janusz - Waterloo, Canada; Campeanu, Cezar - Charlottetown, Canada; Caron, Pascal - LITIS Rouen, France; Champarnaud, Jean-Marc - Rouen, France; Domaratzki, Michael - Manitoba, Canada; Drewes, Frank - Umea, Sweden; Han, Yo-Sub - Seoul, Korea; Holub, Jan - Prague, Czech Republic; Holzer, Markus - Giessen, Germany; Ibarra, Oscar - Santa Barbara, USA; Ito, Masami - Kyoto, Japan; Jurgensen, Helmut - London, Canada; Kari, Lila - London, Canada; Konstantinidis, Stavros - Halifax, Canada (Chair); Lombardy, Sylvain - LABRI, Bordeaux, France; Maletti, Andreas - Stuttgart, Germany; Maneth, Sebastian - New South Wales, Australia; Maurel, Denis - Tours, France; McQuillan, Ian - Saskatoon, Canada; Moreira, Nelma - Porto, Portugal; Okhotin, Alexander - Turku, Finland; Pighizzini, Giovanni - Milano, Italy; Ravikumar, Bala - Rohnert Park CA, USA; Reidenbach, Daniel - Loughborough University, UK; Reis, Rogerio - Porto, Portugal; Salomaa, Kai - Kingston, Canada; Tommasi, Marc - INRIA Lille, France; Volkov, Mikhail - Ekaterinburg, Russian Federation; Watson, Bruce - University of Pretoria; Stellenbosch University, South Africa; Yen, Hsu-Chun - Taipei, Taiwan. STEERING COMMITTEE Jean-Marc Champarnaud - France Markus Holzer - Germany Oscar Ibarra - USA Denis Maurel - France Kai T. Salomaa - Canada (Chair) Hsu-Chun Yen - Taiwan ORGANIZING COMMITTEE Rose Daurie (Saint Mary's University) Stavros Konstantinidis (Saint Mary's University) Casey Meijer (Saint Mary's University) TBA CONTACT Email: ciaa13 at cs.smu.ca Postal address: CIAA 2013 Department of Mathematics and Computing Science Saint Mary's University Halifax, Nova Scotia B3H 3C3, CANADA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:11:53 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:11:53 +0100 Subject: Revue: Texto ! Textes et cultures Message-ID: Date: Mon, 12 Nov 2012 21:56:17 +0100 From: Carine Duteil-Mougel Message-Id: <0C56FE5C-EC23-4AC7-A30B-A5A934DFADCF at ensil.unilim.fr> X-url: http://www.revue-texto.net/ Bonjour, La revue "Texto ! Textes et Cultures" publie son nouveau numéro coordonné par Audrey MOUTAT. Vous trouverez ci-après le sommaire du numéro (cliquable). L'intégralité des documents (articles et fichiers sonores - Colloque de Cerisy) est consultable sur : www.revue-texto.net Bonne lecture et bonne écoute ! Bien cordialement, Carine Duteil-Mougel ///// Volume XVII - n°4 (2012). Coordonné par Audrey MOUTAT ABLALI D., BADIR S., DUCARD D., RASTIER F. Documents, Textes, Oeuvres Introduction au Colloque de Cerisy (6 au 13 juillet 2012) Parutions et trésors ALI BELGHANEM Sémantique du discours scientifique de Pierre Bourdieu Construction et classification d'un corpus de travail Dits et inédits SIMON BOUQUET Un éclairage néosaussurien de la notion de « sens ouvert » D’un poème d’Yves Bonnefoy à un koan du bouddhisme Tch’an Dits et inédits CHRISTOPHE CUSIMANO Figement de séquences défigées Un commerce devenu inéquitable Repères pour l'étude EDOUARD JOLLY Mythe et technique. Autour de Cassirer La Lettre et l'interprète > LES CLASSIQUES TERESA OROZCO Présentation générale du livre Platonische Gewalt de Teresa Orozco. Le philosophe en sa caverne. Parutions et trésors FRANÇOIS RASTIER Vattimo et les mains sales de Heidegger Dialogues et débats FRANÇOIS RASTIER Des documents aux oeuvres Colloque de Cerisy (6 au 13 juillet 2012) Parutions et trésors FRANÇOIS RASTIER Clôture du colloque Colloque de Cerisy (6 au 13 juillet 2012) Parutions et trésors MATTHIEU REMY L'après-guerre formaliste du roman réactionnaire: les débuts littéraires d'Alain Robbe-Grillet Arts du langage PASCAL VAILLANT Sémiotique Support de cours Repères pour l'étude ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:14:24 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:14:24 +0100 Subject: Appel: Numero non-thematique TAL 54-1 Message-ID: Date: Tue, 13 Nov 2012 08:29:36 +0900 From: Yves Lepage Message-Id: X-url: http://www.atala.org/Numero-non-thematique,612 Deuxième appel à communications pour le numéro non thématique Volume 54, Numéro 1, 2013 de la revue Traitement automatique des langues (TAL) http://www.atala.org/Numero-non-thematique,612 [English version below the French version] Direction : Éric de la Clergerie, Béatrice Daille, Yves Lepage et Jean-Luc Minel. Date limite de soumission : 10/12/2012 THÈMES La revue Traitement automatique des langues lance un appel à contributions ouvert. Des propositions de soumissions sont encouragées sur tous les aspects du traitement automatique des langues, y compris (mais non exclusivement) : - pragmatique, discours, sémantique, syntaxe et lexique ; - phonétique, phonologie et morphologie ; - analyse et génération du langage parlé et écrit ; - modèles logiques, symboliques et statistiques du langage ; - extraction d’information et fouille de données textuelles ; - traitement multilingue, traduction automatique et aides à la traduction ; - interfaces en langue naturelle et systèmes de dialogue ; - interfaces multi-modales à composantes linguistiques ; - outils et ressources linguistiques ; - évaluation de systèmes ; - terminologie, acquisition de connaissances à partir de textes ; - recherche documentaire ; - linguistique de corpus ; - utilisation d’outils de TAL pour la modélisation linguistique ; - enseignement assisté, enseignement des langues ; - applications du TAL. Il est bien sûr important, quel que soit le thème, que les aspects liés au traitement automatique des langues soient mis en valeur. LANGUE Les articles sont écrits en français ou en anglais. Les soumissions en anglais ne sont acceptées que pour les auteurs non francophones. LA REVUE La revue TAL (Traitement Automatique des Langues) est une revue internationale éditée depuis 1960 par l’ATALA (Association pour le Traitement Automatique des Langues) avec le concours du CNRS. Elle est maintenant publiée en format électronique, avec accès gratuit immédiat aux articles publiés, et impression annuelle à la demande. Cela ne change aucunement son processus de relecture et de sélection. DATES IMPORTANTES 01/12/2012 Date limite pour les résumés 10/12/2012 Date limite de soumission 15/02/2013 Décision du comité 31/03/2013 Version révisée Automne 2013 Publication FORMAT Les chercheurs ayant l’intention de soumettre une contribution sont invités à prendre contact avec : Yves Lepage [yves.lepage à waseda.jp] (IPS, Université Waseda, Japon) Les articles (25 pages environ, format PDF) doivent être déposés sur la plateforme [http://tal-54-1.sciencesconf.org/] Les feuilles de style sont disponibles en ligne sur le site de la revue. ---------------------------------------------------------------------------------------------------------- Regular issue 2012 Volume 54 Number 1. http://www.atala.org/Regular-issue,613 Direction : Éric de la Clergerie, Béatrice Daille, Yves Lepage et Jean-Luc Minel. Deadline : December 10th 2012 THEMES The TAL journal launches a call for papers for an open issue of the journal. We invite papers in any field of natural language processing, including: - lexicon, syntax, semantics, discourse and pragmatics; - morphology, phonology and phonetics; - spoken and written language analysis and generation; - logical, symbolic and statistical models of language; - information extraction and text mining; - multilingual processing, machine translation and translation tools; - natural language interfaces and dialogue systems; - multimodal interfaces with language components; - language tools and resources; - system evaluation; - terminology, knowledge acquisition from texts; - information retrieval; - corpus linguistics; - use of NLP tools for linguistic modeling; - computer assisted language learning; - applications of natural language processing. Whatever the topic, papers must stress the natural language processing aspects. LANGUAGE Manuscripts may be submitted in English or French. French-speaking authors are requested to submit in French. THE JOURNAL TAL (Traitement Automatique des Langues / Natural Language Processing) is a forty year old international journal published by ATALA (French Association for Natural Language Processing) with the support of CNRS (National Centre for Scientific Research). It has moved to an electronic mode of publication, with printing on demand. This affects in no way its reviewing and selection process. IMPORTANT DATES 01/12/2012 Deadline for summary 10/12/2012 Deadline for submission 15/02/2013 Notification to authors 15/03/2013 Deadline for submission of revised version Fall 2013 Publication PAPER SUBMISSION Authors who intend to submit a paper are encouraged to contact the chief editors of the journal: Yves Lepage [yves.lepage at waseda.jp] (IPS, Waseda university, Japon) Papers (approximately 25 pages, PDF format) should be uploaded at [http://tal-54-1.sciencesconf.org/] Style sheets are available for download on the Web site of the journal [http://www.atala.org/Regular-issue,613]. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:19:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:19:18 +0100 Subject: Conf: Consortium Corpus Ecrits, 23 et 24 novembre 2012, Paris Message-ID: Date: Tue, 13 Nov 2012 16:48:42 +0100 From: Véronique Brisset-Fontana Message-ID: <50A26BDA.1060907 at ling.cnrs.fr> Chères Collègues, ChersCollègues, Le consortium « Corpus écrits » (Corpus-IR) organise sa réunion plénière annuelle _*le vendredi 23 novembre 2012*_, de 9h30 à 18h,au Campus des Cordeliers (15,rue de l'Ecole de Médecine, 75006, Paris). Cette réunion sera consacrée à la *présentation des activités des différents groupes de travail du consortium* : 1. Usage des corpus et droits d'auteurs ou d'éditeurs (aspects juridiques) 2. Corpus d'états anciens de la langue (numérisation, codage) 3. Numérisation (OCR, saisie), correction 4. Pluralité de systèmes d'écriture 5. Corpus multilingues (parallèles, comparables...) 6. Description de corpus collaborative - métadonnées 7. Corpus d'écrits modernes et prise en compte de nouveaux modes de communication (SMS, mail, blog, etc.) 8. Annotation de plus haut niveau : syntaxe, sémantique, référence (annotations collaboratives) 9. Annotation de surface : segmentation lexicale, description morphosyntaxique, chunking, lemmatisation, entités nommées, etc. 10. Exploration de corpus (méthodes, outils) 11. Qualité scientifique et accessibilité des corpus (place des corpus dans l'évaluation de la production scientifique des UR) Chaque présentation sera suivie d'une discussion d'une vingtaine de minutes. Cette journée, très importante pour l'avancée de la réflexion commune sur les corpus écrits, sera suivie, le lendemain, _*samedi 24 novembre*_, d'une *journée d'information et d'échanges sur les aspects juridiques de la propriété et de l'archivage des corpus*, dont le programme sera communiqué très prochainement. *La participation de toutes les personnes intéressées par ces journées est vivement encouragée par le comité de pilotage**, **qu'elles soient ou non inscrites à un groupe de travail. * Si la participation à ces journées est libre, *l'inscription est obligatoire*. Vous trouverez en pièce jointe le *formulaire d'inscription *à retourner *au plus tard le 21 novembre 2012* au secrétariat de l'Institut de Linguistique Française, institution gestionnaire du Consortium, qui, le cas échéant, prendra contact avec vouspour organiser votre mission. Le consortium contribuera au financement des missions des participants actifs des groupes de travail.** Au plaisir devous accueillir nombreux les *23 et 24 novembre prochains*. *Pour le comité de pilotage du Consortium « Corpus écrits » * *Franck Neveu, Directeurde l'ILF* *Le comité depilotage duConsortium« Corpus écrits » : * ** *Franck Neveu *pour l'ILF,FR 2393 --*Porteur du consortium* *Sylvie Archaimbault* (suppléant *BernardColombat*) pour HTL - UMR7597 - Université Denis Diderot - Paris 7 *Benoit Sagot *pour ALPAGE -- INRIA-Université Denis Diderot - Paris 7 *SergeHeiden *pour ICAR- UMR 5191 - Université Lumière Lyon 2 *Damon Mayaffre* (Suppléante *Mahé Ben Hamed* )pour BCL - UMR6039 - Université Nice Sophia Antipolis *Jean-MariePierrel* pour l'ATILF - UMR 7118 -- Nancy - Université *Clément Plancq* (suppléant *Olivier Bonami*) pour le LLF - UMR7110 - Université Denis Diderot- Paris 7 *Céline Poudat *pour le LDI - UMR 7187-- Université de Paris 13 *Catherine Schnedecker* (suppléante *Amalia Todirascu*) pour LILPA - EA1339 - Université de Strasbourg *Agnès Tutin* (suppléante *Marie-Paule Jacques*) pour le LIDILEM - EA 609 -- Université Grenoble 3 Véronique BRISSET-FONTANA Secrétaire générale Fédérations de Linguistique FR 2559 - www.typologie.cnrs.fr FR 2393 - www.ilf.cnrs.fr Tél. 01 43 13 56 45 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:22:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:22:16 +0100 Subject: These: Anthony Sigogne, Integration de ressources lexicales riches dans un analyseur syntaxique (dans le cadre du Seminaire INFOLINGU, Universite Paris-Est) Message-ID: Date: Wed, 14 Nov 2012 09:33:14 +0100 From: Myriam RAKHO Message-ID: ************************************************************************ INFOLINGU Le séminaire de l'équipe Informatique Linguistique du Laboratoire d'Informatique de l'Institut Gaspard Monge (LIGM) Université Paris-Est Marne-la-Vallée Date :* Le lundi 3 décembre 2012 à 11h* Lieu : Université Paris-Est Marne-la-Vallée Bâtiment Copernic, 4ème étage, salle de séminaires 4B08R Toute personne intéressée est la bienvenue ************************************************************************ *** INTERVENANT *** *Anthony SIGOGNE, Université Paris-Est Marne-la-Vallée* *** TITRE *** Intégration de ressources lexicales riches dans un analyseur syntaxique (soutenance de thèse) *** JURY *** Directeur de thèse : Éric Laporte, Professeur, Université Marne-la-Vallée Rapporteur : Alexis Nasr, Professeur, Université Aix-Marseille 2 Rapporteur : Thierry Poibeau, Directeur de Recherche, ENS Paris Examinateur : Matthieu Constant, Maître de Conférences, Université Marne-la-Vallée Examinateur : Djamé Seddah, Maâtre de Conférences, Université Paris 4 Examinateur : Isabelle Tellier, Professeur, Université Paris 3 *** RÉSUMÉ *** Cette thèse porte sur l'intégration de ressources lexicales et syntaxiques du français dans deux tâches fondamentales du Traitement Automatique des Langues (TAL) que sont l'étiquetage morpho-syntaxique probabiliste et l'analyse syntaxique probabiliste. Dans le cadre du français, nous disposons d'une multitude de données lexicales et syntaxiques créées par des processus automatiques ou par des linguistes. De plus, un certain nombre d'expériences ont montré l'intérêt d'utiliser de telles ressources dans les processus probabilistes comme l'étiquetage ou l'analyse, car elles sont capables d'améliorer significativement les performances des systèmes. Dans ce mémoire, nous utilisons ces ressources afin de donner une réponse à deux problématiques que nous décrivons succintement ci-dessous : la dispersion des données et la segmentation automatique des textes. Grâce à des algorithmes d'analyse syntaxique de plus en plus évolués, les performances actuelles des analyseurs sont de plus en plus élevées, et ce pour de nombreuses langues dont le français. Cependant, il existe plusieurs problèmes inhérents aux formalismes mathématiques permettant de modéliser statistiquement cette tâche (grammaire, modèles discriminants, ...). La dispersion des données est l'un de ces problèmes, et est causée principalement par la faible taille des corpus annotés disponibles pour la langue. La dispersion représente la difficulté d'estimer la probabilité de phénomènes syntaxiques apparaissant dans les textes à analyser mais qui sont rares ou absents du corpus ayant servi à l'apprentissage des analyseurs. De plus, il est prouvé que la dispersion est en partie un problème lexical, car plus la flexion d'une langue est importante, moins les phénomènes lexicaux sont représentés dans les corpus annotés. Notre première problématique repose donc sur l'aténuation de l'effet négatif de la dispersion lexicale des données sur les performances des analyseurs. Dans cette optique, nous nous sommes intéressé à uen méthhode appelée regroupement lexical, et qui consiste à regrouper les mots du corpus et des textes en classes. Ces classes réduisent le nombre de mots inconnus et donc le nombre de phénomènes syntaxiques rares ou inconnus, liés au lexique, des textes à analyser. Notre objectif est donc de proposer des regroupements lexicaux à partir d'informations tirées des lexiques syntaxiques du français, et d'observer leur impact sur les performances d'analyseurs syntaxiques. ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:32:31 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:32:31 +0100 Subject: Conf: III Symposium International multilinguisme / cyberespace, 21-23 Novembre/er 2012, Paris Message-ID: Date: Wed, 14 Nov 2012 12:02:57 +0100 From: Joseph Mariani Message-ID: <50A37A61.8090603 at limsi.fr> X-url: http://www.maaya.org Veuillez nous excuser si vous recevez ce message plus d'une fois / We apologize if you receive this message more than once / Disculpe si recibe este mensaje más de una vez III Symposium international sur le multilinguisme dans le cyberespace - III SIMC III ISMC - III International Symposium on multilingualism on cyberspace Program Maaya - Réseau mondial pour la diversité linguistique - World Network for Linguistic Diversity Programme 21-23 Novembre/er 2012 CNRS - 3, rue Michel-Ange - Paris 16e - France Formulaire de pré-enregistrement - Pre-registration form Contact - http://www.maaya.org Organisé par le Réseau mondial pour la diversité linguistique - Maaya Organized by World Network for Linguistic Diversity - MAAYA Avec l'appui de / With the support of Délégation générale à la langue française et aux langues de France (DGLFLF) Centre national de la recherche scientifique (CNRS) Institut des sciences de la communication du CNRS (ISCC) Institut des technologies multilingues et multimédias de l'information (IMMI) Wikimédia France Organisation internationale de la Francophonie Thématiques Le multilinguisme, le cyberespace et: - la gouvernance et coopération internationale - l’éducation virtuelle - les technologies de la langue - le marché du travail Themes Multilingualism, cyberspace and: - International governance and co-operation - Virtual education - Languages technologies - Labour market Tables rondes spéciales - DILINET (mesurer la diversité linguistique) - Net.lang: réussir le cyberespace multilingue - Vers un Sommet mondial sur le Multilinguisme - Contenus multilingues et participation collective: le cas de Wikipédia Special round tables - DILINET (measuring linguistic diversity in cyberspace) - Net.lang: towards a multilingual cyberspace - Towards a World Summit - Multilingual content and collective participation: the case of Wikipedia En coordination avec la Conférence internationale : Communication et mondialisation. Les limites du tout-anglais. In coordination with the International Conference : Communication and Globalization : the Limits of an English-Only Policy * Maaya +33 (0)9 77 19 54 94 http://wwww.maaya.org contact at maayajo.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:34:53 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:34:53 +0100 Subject: Livre: Analyser les discours institutionnels Message-ID: Date: Wed, 14 Nov 2012 12:54:17 +0100 From: Alice Krieg-Planque Message-ID: <50A38669.5040907 at club-internet.fr> X-url: http://www.armand-colin.com/livre/426753/analyser-les-discours-institutionnels.php - - - parution - - - parution - - - parution - - - parution - - - auteur : Alice KRIEG-PLANQUE titre : Analyser les discours institutionnels éditions Armand Colin 238 pages 17,60 euros parution : 31 octobre 2012 ISBN : 978-2200278625 http://www.armand-colin.com/livre/426753/analyser-les-discours-institutionnels.php Quatrième de couverture : Analyser des discours émanant de partis politiques, d'associations, d'organisations publiques ou privées demande des compétences, des concepts et des méthodes précises et solides. Dans cet ouvrage, l'auteure expose les catégories d'analyse utiles qu'elle illustre à l'aide de nombreux exemples, éclairant les enjeux politiques et sociaux contemporains des déclarations politiques, textes journalistiques, documents administratifs, prises de parole publiques, supports de communication... Au fil des chapitres, l'étudiant apprend ainsi à poser un regard spécifique sur les textes et les énoncés pour repérer différents types d'implicites (présupposés, sous-entendus...), identifier les équivoques d'un discours (phénomènes de flou et d'ambiguïté), ou encore saisir les stéréotypes langagiers (slogans, formules, phraséologie...). Ce livre s'adresse en particulier aux étudiants des différentes sciences humaines et sociales qui ont besoin d'appréhender la dimension discursive des objets sur lesquels ils travaillent. Alice KRIEG-PLANQUE est docteure en sciences du langage, maîtresse de conférences en sciences de l'information et de la communication à l'Université Paris-Est Créteil (UPEC), et membre du Céditec (EA 3119). Elle a publié plusieurs ouvrages dans le domaine de l'analyse des discours politiques, médiatiques et institutionnels. - - - parution - - - parution - - - parution - - - parution - - - ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:36:20 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:36:20 +0100 Subject: Job: CDD Ingenieur TAL, CEA LIST Message-ID: Date: Wed, 14 Nov 2012 16:36:18 +0100 From: Romaric Besançon Message-ID: <50A3BA72.8000408 at cea.fr> Proposition de CDD au CEA LIST Sujet: Classification et clustering de textes Type de poste: CDD 8 à 12 mois Lieu de travail: CEA LIST Nano-Innov, Palaiseau (91) Contexte Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ingénierie des Contenus) travaille sur l'analyse de contenus multimédias (analyse de textes, images et vidéos, perception 3D). Dans le domaine de l'analyse de texte, le CEA LIST recherche un CDD ingénieur ou docteur pour travailler sur des techniques de classification et clustering de textes dans un cadre multilingue. Objectifs A partir de document textuels provenant de plusieurs sources (par exemple des dépêches d'actualité), pouvant être de langues différentes, l'application visée a pour but de regrouper automatiquement les dépêches traitant des mêmes sujets. Ce regroupement sera dans un premier temps fondé sur des mesures standard de similarité textuelle (représentation vectorielle s'appuyant sur une analyse linguistique des textes), mais des mesures de similarités plus sémantiques, s'appuyant en particulier sur la notion de sémantique distributionnelle, seront également testées. Pour le clustering proprement dit, plusieurs algorithmes seront envisagés (clustering hiérarchique, Shared Nearest Neighbors, Markov Clustering...), mais les algorithmes développés devront être suffisamment robustes pour travailler à large échelle. La tâche du CDD consistera donc en particulier à : - étudier et tester les algorithmes de clustering de documents sur des corpus de différentes langues ; - travailler sur la mise au point d'un espace de représentation des documents commun pour des documents de langues différentes, fondé sur un alignement des lexiques bilingues pour construire des clusters mutlilingues ; - évaluer les différentes solutions sur des corpus de référence ; Profil recherché: - Compétences en traitement automatique des langues / recherche d'information / mesures de similarité textuelle - Connaissances des techniques de clustering / classification - Compétences informatiques: C/C++, scripts (perl,python...) Rémunération selon formation. Les candidats intéressés doivent envoyer un email de candidature à romaric.besancon at cea.fr avec un CV détaillé (pdf) et une lettre de motivation. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:42:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:42:39 +0100 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Wed, 14 Nov 2012 19:29:12 +0100 From: ELRA ELDA Information Message-ID: <50A3E2F8.80702 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1177 Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** ELRA is happy to announce that 1 new Speech Desktop/Microphone Resource is now available in its catalogue. *ELRA-S0347 GlobalPhone Hausa* The GlobalPhone Hausa corpus contains 7,895 utterances spoken by 33 male and 69 female speakers in the age range of 16 to 60 years. Native speakers of Hausa were asked to read prompted sentences of newspaper articles. The entire collection took place in 5 different locations in Cameroon. The speech data contains a variety of accents: Maroua, Douala, Yaoundé, Bafoussam, Ngaoundéré, and Nigeria. For more information, see: http://catalog.elra.info/product_info.php?products_id=1177 The GlobalPhone corpus developed in collaboration with the Karlsruhe Institute of Technology (KIT) was designed to provide read speech data for the development and evaluation of large continuous speech recognition systems in the most widespread languages of the world, and to provide a uniform, multilingual speech and text database for language independent and language adaptive speech recognition as well as for language identification tasks. The corpus now consists of 20 languages: Arabic (ELRA-S0192), Bulgarian (ELRA-S0319), Chinese-Mandarin (ELRA-S0193), Chinese-Shanghai (ELRA-S0194), Croatian (ELRA-S0195), Czech (ELRA-S0196), French (ELRA-S0197), German (ELRA-S0198), Hausa (ELRA-S0347), Japanese (ELRA-S0199), Korean (ELRA-S0200), Polish (ELRA-S0320), Portuguese (Brazilian) (ELRA-S0201), Russian (ELRA-S0202), Spanish (Latin America) (ELRA-S0203), Swedish (ELRA-S0204), Tamil (ELRA-S0205), Thai (ELRA-S0321), Turkish (ELRA-S0206), Vietnamese (ELRA-S0322). Until 31 December 2012, the complete set of 20 languages is available under the same conditions as the previous set of 19 languages. For more information on the catalogue, please contact Valérie Mapelli mapelli at elda.org Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 19:54:22 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 20:54:22 +0100 Subject: Journee: Aspects juridiques lies aux corpus, 24 novembre 2012, Paris Message-ID: Date: Thu, 15 Nov 2012 11:49:24 +0100 From: Secretariat General Message-ID: <50A4C8B4.4020306 at ling.cnrs.fr> X-url: http://www.ilf.cnrs.fr/spip.php%3Frubrique97.html Co-organisée par les consortia Corpus écrits, IRCOM et CAHIER ** *Journée d'information et d'échanges * *sur les aspects juridiques * *liés à la constitution et à la diffusion des corpus*** ** *24 novembre 2012* ** *Campus des Cordeliers* 15, rue de l'Ecole de Médecine 75006 Paris Métro Odéon Programme ** ** *10 h -- 11 h 30*Droits de l'auteur scientifique vs droits de l'éditeur commercial Présentation : Sylvie Archaimbault (Corpus écrits) Répondant : Marie Cornu, CECOJI. *11 h 30- 13 h*L'utilisation de documents dans la constitution de corpus diffusés Présentation : Denise Pierrot (CAHIER) Répondant : Marie Cornu, CECOJI. *Déjeuner sur place* *14 h 30 -- 16 h*Les droits de la personne filmée ou enregistrée Présentation : Gabriel Bergounioux (IRCOM) Répondant : Nathalie Mallet-Poujol, UMR Dynamique du droit. Cette journée d'information et d'échanges part d'un constat : de nombreuses difficultés, d'ordre juridique,sefont jour dans l'élaboration et la mise à disposition de la communauté des corpus auxquels participent les chercheurs. Celles-ci peuvent, dans certains cas de blocage, aboutir à une interdiction de communication à un public large de corpus constitués dans un cadre de recherche. Les problèmes auxquels nous sommes confrontés sont variés, ils peuvent concerner l'édition de travaux appuyés sur des résultats d'utilisation de corpus, la mise en ligne d'articles déjà publiés chez un éditeur, par l'auteur lui-même, ou en republication par un autre éditeur, des retranscriptions d'expériences impliquant des relationsconfidentielles,l'enregistrement de personnes physiques... Face à ces difficultés, les chercheurs sont bien souvent démunis et ne trouvent pas l'aide dont ils auraient besoin pour sortir des situations de blocage. Cette journée se donne pour objectif de travailler sur quelques cas représentatifs de ces difficultés d'ordre juridique, de faire converger des retours d'expérience et de faire émerger des solutions qui pourront être partagées. Si vous souhaitez évoquer une situation particulière à laquelle vous avez été ou vous êtes confrontés, vous êtes invités à l'indiquer dès maintenant. Des interventions de 5 minutes seront ménagées au titre de retour d'expérience, ce pour chacun des points évoqués. Envoyer à : archaimb at linguist.jussieu.fr Denise.Pierrot at ens-lyon.fr ________________________________________________________________________ Par ailleurs, nous vous rappelons que la participation à cette journée est libre, mais que *la pré-inscription est obligatoire*. Merci de vous inscrire avec le formulaire joint ou disponible sur le site : http://www.ilf.cnrs.fr/spip.php%3Frubrique97.html Votre formulaire d'inscription doit être adressé à : * secretariat.ilf at ling.cnrs.fr * ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:22:38 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:22:38 +0100 Subject: Job: offre de mission de traduction fran=?ISO-8859-1?Q?=E7ais_?=> anglais, Red-on-line Message-ID: Date: Thu, 15 Nov 2012 15:39:58 +0000 From: Veronique Duong Message-ID: <9085291F556D1F40ABB44EFFA0E3B559647ACDA3 at ad-mail.info.local> X-url: http://www.red-on-line.net/ Actuellement, notre société Red-on-line, spécialisée en veille réglementaire et évaluation de conformité HSE, recherche un ou une étudiante pour effectuer la traduction d’une fiche juridique / technique du français vers l’anglais. La fiche fait 45 pages, et est à traduire pour le lundi 26 novembre 2012. Requis : Niveau anglais : courant / bilingue / langue maternelle Gratification : 400€ - 500€ Véronique Duong Ingénieure linguiste chargée de veille réglementaire HSE www.red-on-line.net Immeuble Antony Parc 2 - 10, Place du Général de Gaulle BP 20156 / 92 186 ANTONY Cedex Tel : +33 (0)1 77 92 94 52 | Fax : +33 (0)1 77 92 98 59 Email : vduong at red-on-line.net ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:31:06 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:31:06 +0100 Subject: Job: Postdoc en informatique linguistique (TALN), Homme ou Femme Message-ID: Date: Thu, 15 Nov 2012 18:08:57 +0100 From: Stéphane Le Roy Message-ID: <01ed01cdc353$e78caaf0$b6a600d0$@gmail.com> X-url: http://www.affinity-engine.fr/ L’entreprise aAffinity Engine (http://www.affinity-engine.fr/) développe et commercialise des moteurs de recommandation basés sur le langage naturel. Dans le cadre de son programme de recherche et développement programmé sur plusieurs années, nous recrutons en CDI un/une jeune docteur en Traitement Automatique du Langage Naturel (TALN). Missions Poursuivant des travaux déjà initiés, sa mission consistera à faire évoluer l’existant mais aussi à concevoir et réaliser de nouveaux modules du moteur de recommandation multilingue. L’environnement technique est basé sur le langage Java et différentes technologies open source cloud ready. Dans une première phase, il prendra en charge la réalisation d’une chaine de traitement du langage naturel mettant notamment en œuvre l'extraction d’entités nommées, la détection de la tonalité (sentiment analysis), la recherche de synonymes et la traduction. La deuxième phase s’attachera au perfectionnement des différents composants de la chaine afin d’améliorer sa pertinence globale. La troisième phase consistera en l’ouverture de la chaine de traitement à des documents ne contenant pas d’information textuelle. La personne recrutée sera accueillie au sein de notre société et encadrée directement par le directeur technique (ingénieur en développement informatique + MBA) qui a conçu la première architecture, et de manière secondaire par le directeur général (ingénieur + MBA) avec une expérience dans l'utilisation du datamining. Elle sera également en contact régulier avec un cabinet spécialisé dans l'analyse du langage naturel. Profil Titulaire d’un doctorat en traitement du langage ; la/le candidat devra justifié : - de son souhait de travailler pour une jeune entreprise privée, - de sa capacité à encadrer de futurs collaborateurs, - de sa bonne maîtrise de la programmation Java. Le poste est à pourvoir à Vannes (56) autant que possible mais aussi possiblement en région parisienne. Salaire à négocier. Postuler Merci d’envoyer votre candidature par email à stephane at affinity-engine.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:36:02 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:36:02 +0100 Subject: These: Emeline Lecuit, Les tribulations d'un nom propre en traduction Message-ID: Date: Thu, 15 Nov 2012 18:13:06 +0100 (CET) From: Emeline Lecuit Message-ID: <1058190665.11145129.1352999586686.JavaMail.root at mail10> Bonjour, J'ai le plaisir de vous inviter à ma soutenance de thèse, qui aura lieu le vendredi 30 novembre à partir de 9h dans la salle des actes (salle 203), au deuxième étage du bâtiment Tanneurs de l'Université François Rabelais de Tours (au 3 rue des Tanneurs). A l'issue de la soutenance se tiendra un pot, auquel vous êtes bien sûr convié. Le sujet de ma thèse est: "Les tribulations d'un nom propre en traduction. Etude contrastive du nom propre et de sa traduction à partir d'un corpus aligné de dix langues européennes." Résumé: Les noms propres sont omniprésents et intéressent, depuis des siècles, philosophes et linguistes. Le travail réalisé ici est une étude contrastive des noms propres en traduction, divisée en quatre parties. Les deux premières parties sont théoriques. La première partie traite de la notion de nom propre en linguistique anglaise et en linguistique française. La deuxième partie présente les différents procédés de traduction, illustrés par des exemples sur les noms propres. Les deux parties suivantes sont expérimentales. La troisième partie détaille les différentes étapes de la constitution de notre corpus multilingue parallèle aligné et annoté, composé de onze versions du roman de Jules Verne, Le Tour du Monde en quatre-vingts jours, en dix langues européennes. La quatrième partie expose les résultats obtenus suite à l’observation du comportement des noms propres en traduction. Cette étude contredit souvent l’hypothèse largement répandue de leur intraduisibilité. Mots-clés : noms propres, traduction, corpus multilingue parallèle aligné, annotation, alignement Mon jury sera composé de: M. Jean-Michel Fournier, Professeur des universités, Université François-Rabelais de Tours (examinateur) M. Christopher Gledhill, Professeur des universités, Université Paris Diderot (rapporteur) M. Denis Jamet, Professeur des universités, Université Jean Moulin Lyon 3 (examinateur) M. Denis Maurel, Professeur des universités, Université François-Rabelais de Tours (co-directeur) M. Dusko Vitas, Professeur des universités, Université de Belgrade (Serbie) (co-directeur) M. Geoffrey Williams, Professeur des universités, Université Bretagne-Sud (rapporteur) Cordialement, Emeline LECUIT Laboratoire Ligérien de Linguistique UMR CNRS 7270 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:40:23 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:40:23 +0100 Subject: Appel: Atelier SOS'2013, Sources Ouvertes et Services, EGC'2013 Message-ID: Date: Fri, 16 Nov 2012 09:43:17 +0100 From: Laurie Serrano Message-ID: X-url: http://weblab-project.org/workshop/sos2013 *Merci de diffuser cet appel à communications le plus largement possible. Toutes nos excuses pour d'éventuelles réceptions multiples.* *Quatrième édition de l’atelier "Sources Ouvertes et Services"* *SOS’2013 (en association avec EGC’2013)* *29 janvier 2013 - Toulouse, France* http://weblab-project.org/workshop/sos2013 *Présentation de l'atelier :* Pour sa quatrième édition, l'atelier SOS'2013 propose de poursuivre une réflexion commune autour des diverses problématiques liées au traitement de données disponibles en sources ouvertes (SO). Les SO désignent l'ensemble des médias accessibles librement, de façon gratuite ou payante, tels qu'Internet, les bases de données publiques, les journaux, les CD-ROM, les chaînes de télévision et de radio, etc., par opposition aux sources fermées dont la consultation nécessite de disposer d'autorisations spécifiques. Ces SO fournissent d’importants volumes de données multimédia hétérogènes (image, texte, audio, vidéo, etc.) qui nécessitent des traitements adaptés en vue de leur exploitation. Cet atelier est dédié à toutes ces étapes, partant de la phase de découverte des sources d’information, en passant par la collecte et l'analyse des données collectées jusqu’à la phase de capitalisation et d’exploitation des connaissances. Un intérêt particulier sera porté aux choix architecturaux retenus pour la réalisation d’applications exploitant les SO. En effet, ces applications tentent généralement de faire cohabiter plusieurs briques logicielles (COTS, logiciels open source, développements ad-hoc, etc.) en vue de la réalisation d'une tâche particulière. Cela représente un défi scientifique et technique auquel les recherches sur l’enchaînement des traitements algorithmiques capables d'exploiter ces données peuvent contribuer. L’accent sera mis sur les architectures orientées services (SOA) et sur l’utilisation des technologies du Web Sémantique. Pour cette nouvelle édition, l'atelier SOS souhaite s'intéresser également au traitement des grandes masses de données ("Big data"). L'explosion récente des données disponibles sur le Web a fait émerger de nouvelles problématiques visant à adapter et optimiser toute la chaine de traitement de l'information face aux nouveaux volumes à traiter. Cet atelier souhaite rassembler des chercheurs issus à la fois des mondes académique et industriel afin d'obtenir un panel représentatif d'acteurs et de leurs travaux sur les thèmes présentés ci-après. *Thèmes de l'atelier :* Les auteurs sont invités à envoyer des propositions ayant une portée théorique, méthodologique ou pratique, sur l’un des thèmes suivants (liste non exhaustive) : * Identification et découverte automatique de sources d’information, * Accès et collecte d’information à partir de sources ouvertes (Web, réseaux sociaux, flux RSS et autres), * Classification, filtrage des informations d'intérêt, * Extraction d’information à partir de textes non structurés et/ou utilisant des vocabulaires spécifiques (blogs, langage sms, forums), * Extraction d’information à partir de gros volumes de données multimédia (texte, image, vidéo, audio), * Analyse des sentiments/opinions dans les médias sociaux (réseaux sociaux, blogs, forums), * Modélisation et capitalisation des connaissances extraites à partir de sources ouvertes (ontologies, annotations sémantiques), * Exploitation des connaissances extraites à partir de sources ouvertes : raisonnement, aide à la décision, visualisation, * Détection de signaux faibles, * Evaluation et qualification des sources d’information, * Evaluation et qualification des informations extraites à partir de sources ouvertes, * Inférence, fouille et validation de liens entre données, * Plate-formes d’intégration de services de traitement hétérogènes : interopérabilité des services, orchestration sémantique, * Applications de veille stratégique ou économique à partir de sources ouvertes, * Applications de renseignement d’origine sources ouvertes (ROSO), * Applications de traitement de l'information orientées "Big data". *Comité de programme :* Florence Amardeilh (Mondeca) Gaël de Chalendar (CEA LIST) Olivier Corby (INRIA, Sophia Antipolis) Valentina Dragos (ONERA) Adil El Ghali (IBM) Christian Fluhr (GEOL Semantics) Bruno Grilheres (Cassidian) Dafni Stampouli (Cassidian) Nicolas Hernandez (Université de Nantes) Alexandre Pauchet (LITIS, Rouen) Haïfa Zargayouna (LIPN, Université de Paris 13) Maroua Bouzid (GREYC, Université de Caen) Cassia Trojahn (IRIT, Toulouse) Klaus Atzenbeck (IISYS, Hof University, Germany) Sinan Yurtsever (Atos, Turkey) Nizar Ghoula (Université de Genève, Switzerland) *Dates importantes :* * Date limite de soumission : *30 Novembre 2012* * Notification aux auteurs : 21 Décembre 2012 * Version finale : 2 Janvier 2013 * Date de l'atelier : 29 Janvier 2013 *Soumission :* Cet atelier invite les auteurs à soumettre leurs articles en français ou en anglais (résumé en anglais souhaité dans les deux cas). Les articles soumis ne devront pas dépasser 12 pages (annexes comprises). Nous vous demandons de respecter les instructions des organisateurs de EGC'2013 et d'utiliser la dernière version du format RNTI disponible à l'adresse suivante : http://www.antsearch.univ-tours.fr/rnti Chaque proposition sera évaluée par au moins deux membres du comité de programme. Les communications retenues feront l’objet d’une présentation orale par l'un des auteurs (en français ou en anglais à leur convenance). La journée commencera par une présentation d’un conférencier invité sur l'un des thèmes de l’atelier et s’achèvera par une table ronde autour des problématiques liées à l’exploitation des sources ouvertes. *Les articles doivent être envoyés à l'adresse suivante : sos2013 at weblab-project.org* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:52:42 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:52:42 +0100 Subject: Appel: Coria 2013 et RJCRI 2013 Message-ID: Date: Fri, 16 Nov 2012 15:20:05 +0100 From: Catherine Berrut Message-Id: <2DF5586E-5335-4D1A-9303-1805C2EEA9CA at imag.fr> X-url: http://coria.unine.ch X-url: http://coria.unine.ch/rjcri.htm CORIA 2013, Neuchâtel (Suisse), du 3 au 5 Avril 2013 CORIA 2013 (http://coria.unine.ch) est la dixième édition de la COnférence en Recherche d'Information et Applications. Organisée avec le support de l'ARIA (Association francophone de Recherche d'Information et Applications, http://www.asso-aria.org), elle est la principale manifestation francophone dans ce domaine. CORIA a pour but de rassembler les équipes et les chercheurs menant des travaux scientifiques dans le domaine de la recherche d'informations : recherche d'information sur le web, extraction d'information au sein de documents multimédia, analyse d'opinion ou de réseaux sociaux, contextes monolingue ou multilingue, recherche de documents numériques et d'images, apprentissage et classification automatiques, interfaces homme-machine pour l'accès à l'information, etc. CORIA se veut largement ouverte à l'ensemble de la communauté scientifique concernée par la Recherche d'Information. Après s'être tenue à Toulouse, Grenoble, Lyon, Saint-Étienne, Lannion, Toulon, Sousse (Tunisie, en partenariat avec CIFED), Avignon, Bordeaux (en partenariat avec CIFED), CORIA aura lieu cette année du 3 avril au 5 avril 2013 à Neuchâtel (Suisse). L'activité scientifique en recherche d'information connaît une évolution forte depuis la généralisation du web et, plus récemment, le développement de l'informatique nomade. Les limites du domaine sont elles-mêmes en mutation et favorisent les synergies avec les travaux en apprentissage automatique, traitement automatique des langues, traitement de l'image, traitement de la parole, communication écrite et documents, systèmes d'information et bases de données, représentation et gestion des connaissances... Les domaines d'application sont vastes et peuvent être appliqués au web dans sa globalité ou restreints par exemple à des bibliothèques numériques ou des réseaux sociaux. Le public visé par CORIA 2013 est celui des universitaires et chercheurs - confirmés ou non -, des industriels et des spécialistes du domaine et des étudiants en Master se dirigeant vers les métiers de la Recherche. Les soumissions peuvent être faites en anglais ou en français. Les contributions peuvent concerner des travaux académiques ou des applications industrielles. Le programme prévoit deux conférences invitées, l'une de Jamie Callan (CMU), la seconde de Donna Harman (NIST). Ces deux conférenciers feront par ailleurs un cours dédiés aux doctorants lors d'un séminaire du CUSO, le mardi 2 avril 2013 (le jour précédant la conférence). Pendant la conférence CORIA 2013 seront également organisées les 8e Rencontres Jeunes Chercheurs en Recherche d'Information (RJCRI). Elles ont pour objectif de permettre à tous les doctorants de présenter leur problématique de recherche, d'établir des contacts avec des équipes travaillant sur des domaines similaires ou connexes, et d'offrir à l'ensemble de la communauté un aperçu des axes de recherche actuels. Les travaux sélectionnés pour les RJCRI donneront lieu à une présentation orale et sous forme de poster. Cette année, les soumissions conjointes RJCRI et CORIA sont autorisées (voir modalités dans RJCRI http://coria.unine.ch/rjcri.htm ) Thématiques (liste non exhaustive) - Théorie et modèles formels pour la RI : modèle logique, modèles de langages - Multilinguisme : Recherche d'information multilingue, traduction automatique - Multimédia (images, audio, vidéos, son, musique) : indexation, navigation, accès, interactions avec le texte - Passage à l'échelle : indexation, performances, architectures - Classification automatique, clustering, ranking, apprentissage automatique - Filtrage, routage, détection de nouveautés - Modélisation du contexte, personalisation - Traitement Automatique de la Langue Naturelle pour la recherche d'information - Systèmes de Questions Réponses - Extraction d'informations : ontologies, ressources et recherche d'informations, détection d'entités nommées - Web : grands graphes, utilisation de la topologie du web, lois de puissances, citations, analyse de liens - RI et documents structurés : RI et XML, RI précise et recherche de passages - Réseaux sociaux : analyse de blogs et de sites communautaires, suivi de conversations, analyse de rumeurs, analyse de sentiments, détection d'opinion - Recherche collaborative : filtrage, systèmes de recommandation - Interaction utilisateur : interrogation flexible, interfaces, visualisation, modélisation de l'utilisateur, accessibilité, indexation collaborative - Traitement et représentation des connaissances : logique floue, méta-données, ontologies, web sémantique, ingénierie des connaissances - Bibliothèques numériques : RI sur des livres numérisés, robustesse, OCR et indexabilité - Systèmes de recherche d'information dédiés : recherche d'information génomique, géographique - RI distribuée : recherche d'information mobile, située, P2P - Outils pour la recherche d'information : évaluation, bancs d'essais, métriques, expérimentations qualitatives des systèmes Dates importantes La soumission des articles se fera en deux étapes : d'abord la soumission d'un résumé et ensuite la soumission de l'article. Le calendrier de soumission est le même pour CORIA et les RJCRI : - Date limite de soumission des résumés : 01/12/2012 - Date limite de soumission des articles : 07/12/2012 - Réponse aux auteurs : 01/02/2013 - Date limite de soumission de la version finale : 22/02/2013 Site de dépôt des articles de Coria : https://www.easychair.org/conferences/?conf=coria2013 Site de dépôt des articles de RJCRI : https://www.easychair.org/conferences/?conf=rjcri2013 Format des articles - Les soumissions peuvent être faites en anglais ou en français. - Les contributions peuvent concerner des travaux académiques ou des applications industrielles. - Les textes de communications doivent comporter 16 pages maximum au format des revues Hermes. Ils doivent être précédés d'une page de garde comportant le titre, les noms et coordonnées précises des auteurs, une liste de mots clé en français et en anglais, un résumé d'une vingtaine de lignes au maximum. La mention « article soumis à CORIA et RJCRI » doit être portée sur la page de garde le cas échéant. - Les articles peuvent être écrits en Word ou en LaTeX. - Le format des articles Word et LaTeX peut être téléchargé sur le site Hermes. - Les articles déposés doivent être au format PDF exclusivement. Modalités RJCRI : voir http://coria.unine.ch/rjcri.htm Catherine Berrut, Professeur Université Joseph Fourier Laboratoire LIG et Polytech Grenoble BP 53 - 38041 Grenoble cedex 9 tel : 04 76 51 42 63 mail : catherine.berrut at imag.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 21:25:22 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 22:25:22 +0100 Subject: Appel: WIMS'13 Message-ID: Date: Fri, 16 Nov 2012 18:26:53 +0100 From: Plantié Michel Message-ID: <50A6775D.4070704 at mines-ales.fr> X-url: http://aida.ii.uam.es/wims13/ (Apologies for cross-posting!) CALL FOR PAPERS International Conference on Web Intelligence, Mining and Semantics (WIMS'13) June 12-14, 2013 Madrid, Spain http://aida.ii.uam.es/wims13/ About WIMS'13: The 3rd International Conference on Web Intelligence, Mining and Semantics (WIMS'13) will be organised under the auspices of Autonomous University of Madrid, Spain. The WIMS series of conferences concerned with intelligent approaches to transform the World Wide Web into a global reasoning and semantics-driven computing machine. The conference will provide an excellent international forum for sharing knowledge and results in theory, methodology and applications of Web intelligence, Web mining and Web semantics. The purpose of the WIMS'13 is: - To provide a forum for established researchers and practitioners to present past and current research contributing to the state of the art of Web technology research and applications. - To give doctoral students an opportunity to present their research to a friendly and knowledgeable audience and receive valuable feedback. - To provide an informal social event where Web technology researchers and practitioners can meet. Conference Venue: The conference will be hosted by Autonomous University of Madrid. Confirmed Keynote Speakers: - Prof. Amit Sheth (Physical Cyber Social Computing: An early 21st century approach to - Computing for Human Experience), - Dr. Jason J. Jung (Contextual Synchronization on Social Collaboration) - Prof. Asunción Gómez-Pérez (TBA). Call for Papers/Tutorials/Posters/Industrial Track/Workshop proposals: http://aida.ii.uam.es/wims13/cfp.php Publication: Accepted papers/tutorials/posters will be published by ACM and disseminated through the ACM Digital Library. Selected extended papers will be invited to appear in a special issues of reputed journals in the field and also in a book published by Elsevier. Important Dates Tutorial and Workshop proposals due: November 30, 2012 Notification of workshop acceptance: December 8, 2013 Electronic submission of research papers: December 23, 2012 Electronic submission of poster papers: December 23, 2012 Notifications of tutorial acceptance: January 10, 2013 Notification of paper/poster acceptance: February 17, 2013 Registration opens: February 18, 2013 Camera-ready of accepted papers/tutorials: March 4, 2013 Deadline for paper submissions for workshops: February 7, 2013 Acceptance of papers for workshops: March 10, 2013 Camera ready workshop papers: March 30, 2013 Author registration deadline: March 30, 2013 Conference: 12-14 June,2013 Contact: David Camacho Escuela Politécnica Superior Universidad Autónoma de Madrid Francisco Tomás y Valiente, 11 , 28049, Madrid , Spain Tel/Fax: +34 91 497 51 00 E-mail:wims13 at uam.es ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:34:34 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:34:34 +0100 Subject: Job: postes d'annotateurs en francais, anglais, arabe a pourvoir (Val de Reuil / Paris), ELDA Message-ID: Date: Mon, 19 Nov 2012 12:43:56 +0100 From: ELRA ELDA Information Message-ID: <50AA1B7C.4070904 at elda.org> X-url: http://www.elda.org/rubrique284.html X-url: http://www.elda.org/rubrique287.html X-url: http://www.elda.org/rubrique286.html X-url: http://www.elda.org/rubrique103.html ELDA (www.elda.org) (Evaluation and Language resources Distribution Agency, www.elda.org) a pour activités principales la distribution et la production de ressources linguistiques, ainsi que l'évaluation de technologies de la langue. Dans le cadre de ses activités de production, ELDA offre plusieurs postes d'annotateur (H/F) à mi-temps, à Paris et à Val de Reuil, dans le cadre d'un projet d'analyse automatique de documents écrits. Ces documents doivent être annotés en langue française, anglaise et arabe. Veuillez consulter les 3 annonces ci-dessous pour déterminer le poste auquel vous souhaitez postuler : - Postes d'annotateur en langue française/anglaise/arabe (H/F) à Val de Rueil (27) (http://www.elda.org/rubrique284.html) - Postes d'annotateur en langue arabe (H/F) à Val de Rueil (27) (http://www.elda.org/rubrique287.html) - Postes d'annotateur en langue française/anglaise/arabe (H/F) à Paris (75013) (http://www.elda.org/rubrique286.html) Toutes les candidatures sont à adresser à Maÿlis Bodin (bodin at elda.org) avec Matthieu Carré (carre at elda.org) en cc:. *Jobs @ ELDA (http://www.elda.org/rubrique103.html)* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:37:13 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:37:13 +0100 Subject: Revue: TAL, Varia TAL 53-1 Message-ID: Date: Mon, 19 Nov 2012 16:53:11 +0100 From: Jean-Luc Minel Message-ID: <50AA55E7.50302 at u-paris10.fr> X-url: http://www.atala.org/-Volume-53- Nous avons le plaisir de vous annoncer la mise en ligne du numéro 53-1 de la revue TAL à l'adresse : http://www.atala.org/-Volume-53- En vous souhaitant une bonne lecture. Le comité de rédaction de la revue TAL ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:41:53 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:41:53 +0100 Subject: Job: Stage conventionn=?ISO-8859-1?Q?=E9_?=R&D TAL - RI - fouille de donnees Message-ID: Date: Tue, 20 Nov 2012 15:27:47 +0100 From: Estelle Delpech Message-ID: <50AB9363.8090408 at nomao.com> X-url: http://www.nomao.com *Stage conventionné R&D M2* /Mots-clés : Web, recherche d'information, fouille de données, traitement automatique des langues, apprentissage automatique/ *Objet du stage* Nomao est une start-up web innovante basée à Toulouse qui conçoit et développe une application mobile et un site web permettant aux gens de trouver, garder et échanger des bonnes adresses entre amis (restaurants, bars, shopping, médecin...). Dans le cadre de son développement, Nomao recherche des stagiaires R&D de niveau M2 Informatique ou Sciences du Language avec une spécialisation en Traitement Automatique des Langues. Les sujets de stage à pourvoir touchent des domaines variés tels que : recherche d'information géolocalisée, data mining, systèmes de recommandation, traitement automatique des langues. *Profil recherché* L'étudiant/e devra avoir des compétences en développement logiciel et un intérêt pour le Web, la fouille de données ou traitement automatique des langues. La connaissance de Python et d'une langue étrangère sera un plus. *Déroulement du stage* La personne recrutée sera accueillie dans les locaux de Nomao à Toulouse et sera intégrée à l'équipe R&D. Le stage est conventionné et sera indemnisé selon le profil (à partir de 436,05EUR/mois + tickets restaurants). *Contact* Merci d'envoyer CV et lettre de motivation àEstelle Delpech, estelle at nomao.com (responsable R&D) *Estelle DELPECH* - LinkedIn (http://fr.linkedin.com/in/edelpech) - Viadeo (http://www.viadeo.com/invitation/e.d1) Responsable R&D et contenu estelle at nomao.com skype:edlingua +33 562 483 390 Nomao's website: Nomao (http://www.nomao.com) 1 Avenue Jean Rieux 31500 Toulouse France ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:43:54 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:43:54 +0100 Subject: Habilitation: Matthieu Constant, Mettre les expressions multi-mots au coeur du TAL Message-ID: Date: Tue, 20 Nov 2012 16:17:12 +0100 From: Matthieu Constant Message-ID: <50AB9EF8.5010907 at univ-mlv.fr> Chers collègues, J'ai le plaisir de vous inviter à ma soutenance d'HDR le 3 décembre prochain, à 14h30, à l'Université Paris-Est Marne-la-Vallée. Elle se déroulera au Laboratoire d'Informatique Gaspard-Monge (LIGM), dans la salle 4B08R, 4e étage, batiment Copernic. Pour accéder au LIGM, vous pouvez suivre le lien suivant: http://igm.univ-mlv.fr/LIGM/address_and_access/ Bien cordialement, Matthieu Constant Université Paris-Est Marne-la-Vallée ****************************************************** Titre: Mettre les expressions multi-mots au coeur du Traitement Automatique des Langues - sur l'exploitation de ressources lexicales Résumé: Durant cette soutenance, nous nous attacherons à retracer les différents travaux de recherche que nous avons menés depuis plus de 10 ans. L'un de nos objectifs principaux a été d'améliorer la finesse linguistique de différentes tâches du TAL en prenant en compte les expressions multi-mots. En particulier, notre idée directrice a été d'exploiter des ressources lexicales riches et de les coupler à différents modèles probabilistes ou différentes procédures hybrides. Nos travaux peuvent se découper en trois axes. Le premier axe porte sur l'étiquetage morphosyntaxique et l'analyse syntaxique. L'intégration de la reconnaissance des expressions multi-mots dans telles tâches a essentiellement consisté à adapter divers modèles probabilistes dédiés à ces tâches. Comme ces expressions sont, par définition, difficilement prédictibles, l'exploitation de ressources lexicales est primordiale pour leur reconnaissance. Nous avons donc été amené à trouver des stratégies d'intégration de ressources symboliques externes dans nos modèles. Le deuxième axe consiste à intégrer la reconnaissance d'expressions multi-mots dans des applications. Nous avons, en particulier, développé des applications liées au monde privé (extraction d'informations, classification) ou liées au monde académique (aide à la construction de lexiques bilingues ou à des études linguistiques). Dans tous les cas, nous nous sommes basé sur des prétraitements fins alimentés par des ressources lexicales riches. Le troisième axe concerne la construction de ressources linguistiques. En effet, le développement des outils décrits ci-dessus n'est possible que grâce à l'existence de ressources (corpus annotés ou lexiques). Or, les ressources autour des expressions multi-mots manquent cruellement ou sont incomplètes. Pour toutes les ressources développées, nous avons mené des études linguistiques fines et systématiques. Nous avons également mis en place un outillage informatique pour les gérer et les appliquer à des textes. Jury: Prof. Béatrice Daille (Université de Nantes) [examinatrice] Prof. Laurence Danlos (Université Paris 7) [examinatrice] Prof. Cédrick Fairon (Université catholique de Louvain) [examinateur] Prof. Eric Laporte (Universidade Federal do Espírito Santo) [examinateur] Prof. Alexis Nasr (Université Aix-Marseille) [rapporteur] Prof. Eric Wehrli (Université de Genève) [rapporteur] Prof. François Yvon (Université Paris-Sud) [rapporteur] ************************************************************* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:57:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:57:08 +0100 Subject: Appel: TOTh 2013 Message-ID: Date: Tue, 20 Nov 2012 16:23:03 +0100 From: Luc Damas Message-ID: X-url: http://www.porphyre.org/toth/toth-2013/appel-a-communications X-url: http://www.porphyre.org/toth/toth-2013-en/call-for-papers TOTh 2013 : APPEL A COMMUNICATIONS Terminologie & Ontologie : Théories et applications Chambéry – France Conférence : 6 et 7 juin 2013 Formation : 4 et 5 juin 2013 http://www.porphyre.org/toth/ http://www.porphyre.org/toth/toth-2013/appel-a-communications http://www.porphyre.org/toth/files/TOTh-2013-appel-a-communications.pdf Dates importantes : ------------------------- 14 janvier 2013 : Date limite de soumission 4 mars 2013 : Notification d’acceptation 6 mai 2013 : Version définitive Soumission par EasyChair : ----------------------------------- Les soumissions d'articles (articles complets) se font exclusivement par EasyChair : http://www.easychair.org/conferences/?conf=toth2013 Présentation : ------------------ En rapprochant terminologie et ontologie, les conférences TOTh mettent l’accent sur les apports mutuels de ces deux disciplines et sur de nouvelles perspectives de développement tant théoriques que pratiques. La terminologie s’intéresse aux dénominations des concepts et des objets dans un domaine précis, mais aussi aux unités telles que les collocations, les combinaisons lexicales ou les phraséologies en usage, qui font partie des vocabulaires, des discours et des langues de spécialité. D’un point de vue méthodologique, le terminologue développe des pratiques qui visent la conception et la création de ressources terminologiques utiles à toute fin langagière : traduction, aménagement, lexicographie, enseignement des langues à des fins spécifiques, etc. La qualité et la rigueur des discours de spécialité étant directement dépendantes de la relation entre l’organisation lexicale et l’organisation des connaissances, une réflexion conjointe entre les terminologues, traducteurs, lexicographes, ingénieurs des connaissances et informaticiens s’impose. La terminologie et l’ontologie partagent des objectifs similaires dans leur compréhension et la description de la réalité. Les ontologies issues de l’ingénierie des connaissances constituent aujourd’hui une des voies les plus prometteuses pour la modélisation du système conceptuel des terminologies. Au cœur de nombreuses applications du monde numérique, les ontologies permettent l’opérationnalisation des terminologies et leur utilisation à différentes fins : aide à la traduction, gestion et traitement de l’information, gestion des connaissances et de contenus multilingues, web sémantique, etc. Par nature transdisciplinaires, la terminologie et l’ontologie mobilisent des pratiques et des théories qui relèvent de nombreuses disciplines dont principalement la linguistique, les langues de spécialité, l’épistémologie, l’ingénierie des connaissances et les sciences de l’information. Publics & Disciplines : ---------------------------- Les conférences TOTh visent à rassembler chercheurs, enseignants, formateurs, utilisateurs et industriels dont les préoccupations relèvent à la fois de la terminologie et de l’ontologie, et de façon plus générale de la langue et de l’ingénierie des connaissances. Elles se veulent un lieu d’échange et de partage où sont exposés problèmes, solutions et retours d’expériences tant sur le plan théorique qu’applicatif ainsi que les nouvelles tendances et perspectives des disciplines associées : terminologie, langues de spécialité, linguistique, intelligence artificielle, ingénierie des connaissances, systèmes d’information, ingénierie collaborative, sciences de l’information, documentation, etc. Prix « Jeune chercheur » : -------------------------------- Depuis 2011 un prix « Jeune chercheur » est décerné par le comité de programme lors de la conférence. Thèmes de la Conférence (liste non exhaustive) : -------------------------------------------------------------- Approches linguistiques : - langues de spécialité, traduction, lexicographie de spécialité, aménagement linguistique et terminologique, communication de spécialité, - multilinguisme, traduction, - théories du texte et des discours, sémantique lexicale, - usages, variations, collocations terminologiques, phraséologie, - produits terminologiques, lexiques, dictionnaires, thésaurus, - traitement de corpus : extraction de termes, extraction de connaissances, constitution et alignement de corpus, - construction et maintenance de ressources terminologiques, harmonisation des termes, harmonisation des concepts, normalisation, importance et limite des corpus, - validation de la qualité des données, rôle des experts. Modélisation des connaissances : - principes terminologiques pour la construction des systèmes notionnels et conceptuels, - représentation et gestion des connaissances : acquisition, modélisation des concepts, - ontologies : construction, évaluation (qualité), maintenance, alignement, fusion, - thesaurus mono- et multilingues, gestion documentaire, - apport de l’intelligence artificielle, de la linguistique, de l’épistémologie, des systèmes formels (logique des descriptions par exemple), - normes, formats d’échanges. Applications : - environnements logiciels : construction et maintenance de terminologies, thésaurus, dictionnaires, ontologies, - les applications informatiques à base de connaissances et de ressources terminologiques : aide à la traduction, gestion de contenus mono- et multilingues, web sémantique, recherche d’information, classification, gestion des connaissances, systèmes d’information, etc. - partage de données (linked data, open data), - bibliothèques numériques, - évaluation des outils d’acquisition et de manipulation, évolution des normes et standards dans le domaine des ressources linguistiques et ontologiques, terminométrie. http://www.porphyre.org/toth/ http://www.porphyre.org/toth/toth-2013/appel-a-communications http://www.porphyre.org/toth/files/TOTh-2013-appel-a-communications.pdf ------------------------------------------------------------------------ TOTh 2013: CALL FOR PAPERS Terminology & Ontology: Theories and applications Chambéry – France Conference: 6 and 7 June 2013 Training: 4 and 5 June 2013 http://www.porphyre.org/toth/ http://www.porphyre.org/toth/toth-2013-en/call-for-papers http://www.porphyre.org/toth/files/TOTh-2013-Call-for-papers.pdf DEADLINES: ------------------------------- 14 January 2013: Deadline for submitting 4 March March 2013: Notification of acceptance 6 May 2013: Final version Paper submission via Easychair: ----------------------------------------- http://www.easychair.org/conferences/?conf=toth2013 Presentation: ------------------ The TOTh conferences aim to bridge the gap between terminology and ontology by highlighting the contributions that one makes to the other and by opening up new perspectives for both theoretical and practical developments. Terminology is about names for concepts and objects in a given subject area, but it is also concerned with other units such as collocations, lexical combinations or phraseologies in actual use, all of which are part of specialized languages and discourse. The terminologist’s job is to design and produce terminological resources which can be used for a variety of language-based activities : translation, corpus language planning, teaching language for special purposes, etc. The quality and the precision of specialised discourse is directly linked to the relation between the way lexical items are ordered and the way knowledge is organised: sufficient encouragement in itself for active collaboration between terminologists, translators, lexicographers, knowledge engineers and IT specialists. Terminology and ontology share similar objectives in the way they approach and describe reality. Ontologies, which come from knowledge engineering, are now one of the most promising ways to model conceptual systems for terminologies. Of the numerous applications to be found in the digital world, ontologies are particularly useful to make terminologies operational and ensure their applications in various roles : as translation tools, for information and knowledge management, the semantic web, etc. Terminology and ontology are both basically transdisciplinary in approach, and both reach out to take on board practices and theories from many different subject fields, in particular from linguistics, language for special purposes, epistemology, artificial intelligence, information sciences. Target audience & Disciplines: --------------------------------------- The TOTh conferences aim to bring together all those involved in LSP, terminology and knowledge engineering and, more generally, all persons interested in issues related to language and knowledge. They are designed to be platforms of exchange and sharing where problems are outlined and solutions and feedback provided, for both theoretical and applied perspectives as well as for the new trends and perspectives of associated disciplines: terminology, languages for special purposes, linguistics, artificial intelligence, knowledge engineering, information systems, collaborative engineering, information sciences, documentation, etc. Young Researcher Prize: -------------------------------- Since 2011, a Young Researcher Prize is awarded by the Program committee and bestowed on the winner during the Conference. Conference topics (non exhaustive list): -------------------------------------------------- Linguistic approaches: - language for special purposes, translation, language and terminology planning, specialized multilingual communication, - usage, variation, term collocations, lexical combination, - terminological products: glossaries, dictionaries, thesauri, - corpus processing and natural language processing: text mining, extracting terms, extracting knowledge, corpus building, corpus aligning, - creating and maintaining terminological resources, harmonizing terms and concepts, importance and limitations of corpora, - theories of meaning, semantics, - validating the quality of data, the role of experts. Knowledge representation: - terminological principles for building conceptual systems, - ontology and knowledge representation: representation, building, maintaining, aligning, merging, - classification theory, - information retrieval, - mono- and multilingual thesauri, library science, records management, - input from artificial intelligence, linguistics, epistemology, formal systems (description logic for example). Applications: - software environments; building and maintaining terminologies, thesauri, dictionaries, ontologies, - IT applications based on knowledge and terminology resources: semantic web, computer aided translation, mono and multilingual content management systems, specialized digital libraries, information retrieval, classification, knowledge management, information systems, - assessing acquisition and manipulation tools, standards in the field of language and ontology resources. http://www.porphyre.org/toth/ http://www.porphyre.org/toth/toth-2013-en/call-for-papers <%22> http://www.porphyre.org/toth/files/TOTh-2013-Call-for-papers.pdf <%22> ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:59:53 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:59:53 +0100 Subject: Appel: FSMNLP 2013 Message-ID: Date: Tue, 20 Nov 2012 15:49:07 +0000 From: Mark-Jan Nederhof Message-ID: X-url: http://fsmnlp2013.cs.st-andrews.ac.uk/ First CALL FOR PAPERS Finite-State Methods and Natural Language Processing - FSMNLP 2013 11th International Conference University of St Andrews, Scotland (UK) July 15-17, 2013 http://fsmnlp2013.cs.st-andrews.ac.uk/ INTRODUCTION The international conference series Finite-State Methods and Natural Language Processing (FSMNLP) is the premier forum of the ACL Special Interest Group on Finite-State Methods (SIGFSM). It serves researchers and practitioners working on: * natural language processing (NLP) applications or language resources, * theoretical and implementational aspects, or * their combinations that have obvious relevance or an explicit relation to finite-state methods. KEYNOTE SPEAKER * Bill Byrne (University of Cambridge) TOPICS The conference invites papers related to themes including but not limited to: * NLP applications and linguistic aspects of finite-state methods * Finite-state models of language * Practices for building morphological models for the world's languages using finite-state technology * Machine learning of finite-state models of natural language * Finite-state manipulation software and tools with relevance to NLP IMPORTANT DATES * April 12, paper submission deadline * May 21, notification * June 15, camera-ready version SUBMISSIONS Papers should present original, unpublished research and implementation results. Simultaneous submission to other venues with published proceedings is prohibited. FSMNLP accepts two kinds of submissions: * long papers (8 pages including references) reporting completed, significant research, * short papers (4 pages including references) reporting ongoing work and partial results, implementations, grammars, practical tools, interactive software demos, etc. Short papers are expected to be presented as system demos in demo sessions, posters and/or short presentations, while long papers are presented in longer presentations. All submissions are electronic and in PDF format via a web-based submission server. Authors are strongly encouraged to use the latest ACL style (available for LaTeX and Word) in producing the PDF document. Awaiting availability of the 2013 style, the 2012 templates are available at: http://acl2012.org/call/sub01.asp Information about the author(s) and other identifying information such as obvious self-references (e.g., "We showed in [12] ...") and financial or personal acknowledgements should be omitted in the submitted papers whenever feasible. Papers will be submitted electronically in PDF using the EasyChair system. A paper may contain a clearly marked appendix and data files to support its claims. This material will not be published. While reviewers are urged to consult this extra material for better comprehension, it is at their discretion whether they do so. Such extra material should also be anonymized to the extent feasible. Use the following link for submission: https://www.easychair.org/conferences/?conf=fsmnlp2013 All accepted papers will be published in FSMNLP 2013 proceedings and archived in the ACL Anthology. The publication of selected, revised versions of accepted papers in a special journal issue is planned. PROGRAM COMMITTEE * Iñaki Alegria (University of the Basque Country) * Jan Daciuk (Gdańsk University of Technology, Poland) * Frank Drewes (Umeå University, Sweden) * Dale Gerdemann (University of Tübingen, Germany) * Mike Hammond (University of Arizona, USA) * Colin de la Higuera (University of Nantes, France) * Mans Hulden (Ikerbasque, Basque Country) * André Kempe (Cadege Technologies & Consulting, France) * Marco Kuhlmann (Uppsala University, Sweden) * Andreas Maletti (Universität Stuttgart, Germany) * Mark-Jan Nederhof (University of St Andrews, Scotland) * Kemal Oflazer (Sabanci University, Turkey) * Maite Oronoz Anchordoqui (University of the Basque Country) * Laurette Pretorius (University of South Africa) * Strahil Ristov (Rudjer Boskovic institute, Croatia) * Frederique Segond (Viseo Innovation, France) * Max Silberztein (Université de Franche-Comté, France) * Richard Sproat (Oregon Health & Science University, USA) * Heiko Vogler (Technical University Dresden, Germany) * Anssi Yli-Jyrä (University of Helsinki, Finland) * Menno Van Zaanen (Tilburg University, Netherlands) * Lynette Van Zijl (Stellenbosch University, South Africa) ORGANIZING COMMITTEE * Per Ola Kristensson (University of St Andrews) * Mark-Jan Nederhof (University of St Andrews) * Vinodh Rajan Sampath (University of St Andrews) Further information about the conference is available at the website: http://fsmnlp2013.cs.st-andrews.ac.uk/ fsmnlp2013 at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 21:00:51 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 22:00:51 +0100 Subject: Carnet: Deces de Emanuele Pianta Message-ID: Date: Tue, 20 Nov 2012 21:13:26 +0100 From: Thierry Hamon Message-ID: <87d2z86nix.fsf at smtp.univ-paris13.fr> Dear All, we are deeply saddened to inform you that Emanuele Pianta, head of CELCT and senior researcher at FBK, passed away yesterday, as a consequence of a serious car accident. Graduated in linguistics at the University of Padua, in 1993 Emanuele arrived at Fondazione Bruno Kessler and soon became one of the most brilliant and respected researchers in the field of language processing. Emanuele had the unique ability to combine his great expertise in the field of linguistics with the sensitivity to develop technologies applicable in real contexts of use. We remember him particularly for having started and coordinated the construction of MultiWordNet, the lexical database for the Italian language, and for coordinating the development of TextPro, the software for automatic analysis of written Italian. Since 2009 he had been the scientific director of CELCT, the Center for the Evaluation of Language and Communication Technologies, an office that he was still holding with success and passion. We also remember his love for teaching (at the University of Trento and Bolzano) and the many national and international collaborations which over the years he was able to build with passion and far-sightedness. A man of interdisciplinary culture, Emanuele was about to enthusiastically undertake a new scientific challenge in the field of Digital Humanities, where he was to lead a new research group. He leaves a wealth of knowledge and experience to CELCT, FBK and the whole scientific community, but also a great sense of void among those who have had the privilege to work with him. For all of us the loss of Emanuele is cause of immense grief and sadness beyond words. We’ll try to carry on his work, to pay tribute to Emanuele and all what he has achieved in his life. Our thoughts and prayers go to his family, colleagues and friends. Rachele Sprugnoli on behalf of CELCT and FBK ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 21 12:11:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 21 Nov 2012 13:11:25 +0100 Subject: Conf: Consortium Corpus Ecrits - Programme - 23 et 24 novembre 2012, Paris Message-ID: Date: Wed, 21 Nov 2012 12:27:07 +0100 From: Véronique Brisset-Fontana Message-ID: <50ACBA8B.9030104 at ling.cnrs.fr> X-url: http://www.ilf.cnrs.fr/spip.php%3Frubrique97.html ------------------------------------------------------------------------ Consortium Corpus Ecrits */REUNION PLÉNIÈRE ANNUELLE/* *Vendredi 23 novembre 2012 de 9h00 à 18h00* *Campus des Cordeliers - PARIS VI^e - Amphithéâtre FARABEUF* */_09h00 - 09h30_/**//**/- Accueil-café (Salle Marie Curie)/* _09h30 - 09h45_- Introduction de Franck Neveu -- Directeur de la fédération ILF _09h45 - 10h20_- Présentation du groupe 1 /Usage des corpus et droits d'auteurs ou d'éditeurs (Aspects juridiques...)/ _10h20 - 10h55_- Présentation du groupe 2 /Corpus d'état anciens de la langue (Numérisation, codage...)/ */_10h55 - 11h10_/**//**/- Pause __/* _11h10 - 11h45_- Présentation du groupe 8 __ /Annotation du plus haut niveau : syntaxe, sémantique, référence (Annotations collaboratives...)/ _11h45 - 12h20 - _Présentation des groupes 3-4 /Numérisation (OCR, saisies, corrections...) et pluralité de systèmes d'écriture/ _12h20 - 12h55_- Présentation du groupe 5 /Corpus multilingues (Parallèles, comparables ...)/ //*/_13h00 - 14h00_/**//**/- Déjeuner -- Buffet offert/* _14h00 - 14h35_- Présentation du groupe 6 /Description de corpus collaborative -- Métadonnées/ _14h35 - 15h10_- Présentation du groupe 7 /Corpus d'écrits modernes et prise en compte de nouveaux modes de communication (SMS,blog, courriel...)/ _15h10 - 15h45_- Présentation du groupe 9 __ /Annotation de surface (Segmentation lexicale, description morphosyntaxique, chunking, lemmatisation, entités nommées...) / */_15h45 - 16h00_/**//**/- Pause __/* _16h00 - 16h45 - _Présentation du groupe 10 /Exploration de corpus (Méthodes, outils...)/ _16h45 - 17h20 - _Présentation du groupe 11 /Qualité scientifique et accessibilité des corpus (Place des corpus dans l'évaluation de la production scientifique des UR)/ _17h20 - 18h00 - _Débats et clôture *----------------------------------------------------------------------* *Journée d'information et d'échanges sur les aspects juridiques * *liés à la constitution et à la diffusion des corpus*** *Co-organisée par les consortia Corpus écrits, IRCOM et CAHIER* *Samedi 24 novembre 2012* *Campus des Cordeliers* 15, rue de l'Ecole de Médecine 75006 Paris Métro Odéon Programme ** *10 h -- 11 h 30* Droits de l'auteur scientifique vs droits de l'éditeur commercial Présentation : Sylvie Archaimbault (Corpus écrits) Répondant : Marie Cornu, CECOJI. *11 h 30- 13 h* L'utilisation de documents dans la constitution de corpus diffusés Présentation : Denise Pierrot (CAHIER) Répondant : Marie Cornu, CECOJI. *Déjeuner sur place* *14 h 30 -- 16 h* Les droits de la personne filmée ou enregistrée Présentation : Gabriel Bergounioux (IRCOM) Répondant : Nathalie Mallet-Poujol, UMR Dynamique du droit. Cette journée d'information et d'échanges part d'un constat : de nombreuses difficultés, d'ordre juridique,sefont jour dans l'élaboration et la mise à disposition de la communauté des corpus auxquels participent les chercheurs. Celles-ci peuvent, dans certains cas de blocage, aboutir à une interdiction de communication à un public large de corpus constitués dans un cadre de recherche. Les problèmes auxquels nous sommes confrontés sont variés, ils peuvent concerner l'édition de travaux appuyés sur des résultats d'utilisation de corpus, la mise en ligne d'articles déjà publiés chez un éditeur, par l'auteur lui-même, ou en republication par un autre éditeur, des retranscriptions d'expériences impliquant des relationsconfidentielles,l'enregistrement de personnes physiques... Face à ces difficultés, les chercheurs sont bien souvent démunis et ne trouvent pas l'aide dont ils auraient besoin pour sortir des situations de blocage. Cette journée se donne pour objectif de travailler sur quelques cas représentatifs de ces difficultés d'ordre juridique, de faire converger des retours d'expérience et de faire émerger des solutions qui pourront être partagées. Si vous souhaitez évoquer une situation particulière à laquelle vous avez été ou vous êtes confrontés, vous êtes invités à l'indiquer dès maintenant. Des interventions de 5 minutes seront ménagées au titre de retour d'expérience, ce pour chacun des points évoqués. Envoyer à : archaimb at linguist.jussieu.fr Denise.Pierrot at ens-lyon.fr Par ailleurs, nous vous rappelons que la participation à cette journée est libre, mais que *la pré-inscription est obligatoire*. Merci de vous inscrire avec le formulaire joint ou disponible sur le site : http://www.ilf.cnrs.fr/spip.php%3Frubrique97.html Votre formulaire d'inscription doit être adressé à : *_secretariat.ilf at ling.cnrs.fr_* ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From zilles at CS.UREGINA.CA Wed Nov 21 16:56:44 2012 From: zilles at CS.UREGINA.CA (Sandra Zilles) Date: Wed, 21 Nov 2012 10:56:44 -0600 Subject: Call For Papers - Canadian AI Conference 2013 Message-ID: ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Apologies for cross-posting. Please distribute widely. ======================= Preliminary Call for Papers =========================== AI 2013: The 26th Canadian Conference on Artificial Intelligence May 28th to May 31st, 2013 Regina, Saskatchewan, Canada ================================================================================== IMPORTANT DATES --------------- Full paper submission deadline: January 21st, 2013 Notification of acceptance: February 25th, 2013 Final papers due: March 6th, 2013 Conference: May 28th to May 31st, 2013 CALL FOR PAPERS --------------- AI'2013, the twenty-sixth Canadian Conference on Artificial Intelligence, invites papers that present original work in all areas of Artificial intelligence, either theoretical or applied. Topics of interest include, but are not limited to: • Agent Systems AI Applications Automated Reasoning Bioinformatics and BioNLP • Case-based Reasoning • Cognitive Models • Constraint Satisfaction • Data Mining • E-Commerce • Evolutionary Computation • Games • Information Retrieval • Knowledge Representation • Machine Learning • Multi-media Processing • Natural Language Processing • Neural Nets • Planning • Robotics • Search • Smart Graphics • Uncertainty • User Modeling • Web Applications Each paper will be reviewed by at least three Program Committee members according to its originality, technical merit and clarity of presentation. Accepted papers will be allocated either a maximum of 12 pages (long papers) or a maximum of 7 pages (short papers) in the proceedings. As in previous years, we plan to publish all accepted papers for which one of the authors will have registered and is present at the conference in the conference proceedings as Lecture Notes in Artificial Intelligence by Springer. The papers will have to be formatted accordingly. Papers submitted to AI'2013 must not have been accepted for publication elsewhere or be under review for another conference. BEST PAPER AWARD ---------------- The Best Paper Award will be presented at the conference to the authors of the best paper. SUBMISSIONS ----------- Authors are invited to submit electronically, by January 21st, 2013. Submissions must be uploaded on Easychair. Paper format: • Papers must be written in English. • Papers must be up to 12 pages in length. - Papers must be in PDF format. • Papers must be formatted according to Springer LNCS style. The use of the LaTeX2e style file available from Springer is strongly encouraged. ORGANIZERS ---------- AI'2013 is collocated with two cognate conferences: the Canadian Graphical Interface Conference and the Canadian Conference on Computer and Robot Vision. General Co-chairs AI/GI/CRV: Cory Butz (University of Regina) Atefeh Farzindar (NLP Technologies Inc.) Program Co-chairs: Osmar Zaiane (University of Alberta) Sandra Zilles (University of Regina) Local Arrangement Chair: Orland Hoeber (University of Regina) Please mark the dates in your calendar. We hope to receive your submissions and see you at the conference. ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:15:30 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:15:30 +0100 Subject: Info: Questionnaire concernant les doctorants en CIFRE Message-ID: Date: Tue, 20 Nov 2012 22:46:51 +0100 From: AFTAL AFTAL Message-ID: X-url: http://tal.univ-paris3.fr/aftal X-url: https://docs.google.com/spreadsheet/viewform?formkey=dGNUc3RpTXBydW9CbkYzMTliN0gzZ2c6MQ L'AFTAL (http://tal.univ-paris3.fr/aftal), l'association des anciens des formations TAL de l'Université de Paris 3, organisera une session CIFRE pour les étudiants de Master 2 de la formation PluriTAL (Paris 3, Paris 10 et INaLCO). Nous aurions besoin de témoignages d’étudiants actuellement/ayant fait leur thèse en CIFRE. Pourriez-vous diffuser le questionnaire se trouvant au lien ci-dessous auprès de vos étudiants ? https://docs.google.com/spreadsheet/viewform?formkey=dGNUc3RpTXBydW9CbkYzMTliN0gzZ2c6MQ Merci beaucoup par avance pour votre aide et n’hésitez pas à nous contacter ! Bien cordialement, L'équipe AFTAL Web : http://tal.univ-paris3.fr/aftal/ Follow us on Twitter : http://twitter.com/AssoForTAL Fan-Page Facebook : http://www.facebook.com/AssoForTAL ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:23:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:23:25 +0100 Subject: Job: CORRECTION - postes d'annotateurs en francais, anglais, arabe a pourvoir (Val de Reuil / Paris), ELDA Message-ID: Date: Wed, 21 Nov 2012 10:00:00 +0100 From: ELRA ELDA Information Message-ID: <50AC9810.40802 at elda.org> X-url: http://www.elda.org/article284.html X-url: http://www.elda.org/article287.html X-url: http://www.elda.org/article286.html X-url: http://www.elda.org/rubrique103.html [suite à erreur dans les liens html dans la versions précédente] ELDA (www.elda.org) (Evaluation and Language resources Distribution Agency,www.elda.org) a pour activités principales la distribution et la production de ressources linguistiques, ainsi que l'évaluation de technologies de la langue. Dans le cadre de ses activités de production, ELDA offre plusieurs postes d'annotateur (H/F) à mi-temps, à Paris et à Val de Reuil, dans le cadre d'un projet d'analyse automatique de documents écrits. Ces documents doivent être annotés en langue française, anglaise et arabe. Veuillez consulter les 3 annonces ci-dessous pour déterminer le poste auquel vous souhaitez postuler : - Postes d'annotateur en langue française/anglaise/arabe (H/F) à Val de Rueil (27) (http://www.elda.org/article284.html) - Postes d'annotateur en langue arabe (H/F) à Val de Rueil (27) (http://www.elda.org/article287.html) - Postes d'annotateur en langue française/anglaise/arabe (H/F) à Paris (75013) (http://www.elda.org/article286.html) Toutes les candidatures sont à adresser à Maÿlis Bodin (bodin at elda.org) avec Matthieu Carré (carre at elda.org) en cc:. *Jobs @ ELDA (http://www.elda.org/rubrique103.html)* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:29:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:29:50 +0100 Subject: Journee: Journee d'etude sur l'annotation syntaxique de corpus oraux, 7 decembre 2012, Paris Message-ID: Date: Wed, 21 Nov 2012 11:04:46 +0100 From: Christophe Benzitoun Message-ID: <50ACA73E.6090508 at univ-nancy2.fr> *Annotation syntaxique de corpus oraux* *Projets récents et perspectives* Journée d'étude Conscila (ENS Paris), Vendredi 7 décembre 2012 Programme /Session 1 -- Président de séance : Sylvain Kahane (Modyco & Paris X)/ ** *9h30 Le dédoublement du sujet dans le français parlé : Une étude de corpus avec la base de données sgs* Aria Adli (Université de Strasbourg) *10h Analyse syntaxique en chunks nominaux d'un corpus oral à l'aide de SEM, étiqueteur syntaxique du français* Yoann Dupont, Iris Eshkol-Taravella, Isabelle Tellier & Ilaine Wang (Lattice / LLL) *10h30 DisMo: A morphosyntactic annotator for spoken French* George Christodoulides & Iulia Grosman (UCLouvain, Institut Langage & Communication, Centre VALIBEL) /Pause / /Session 2 -- Présidente de séance : Florence Lefeuvre (Syled & Paris 3)/ ** *11h20 Un corpus arboré pour le français parlé: premiers résultats* Anne Abeillé (U. Paris Diderot, LLF, IUF), Benoît Crabbé (U. Paris Diderot, Alpage) *11h50 Analyse Syntaxique du Français Parlé * Christophe Cerisara, Mathilde Dargnat & Claire Gardent (LORIA UMR 7503) /Déjeuner/ /Session 3 -- Présidente de séance : Jeanne-Marie Debaisieux (Lattice & Paris 3)/ ** *14h15 Vers une redéfinition de la notion de périphérie gauche à partir d'une annotation syntaxique et prosodique d'un corpus oral multigenres* Anne Catherine Simon, Liesbeth Degand, Noalig Tanguy & Thomas Van Damme (UCLouvain, Institut Langage & Communication, Centre VALIBEL) *14h45 Asymétrie et aspects dynamiques des structures (macro)syntaxique et prosodique de l'énoncé* Philippe Martin (EA3967 Clillac-Arp / UFRL, Université Paris Diderot) *15h15 Syntactic properties of spontaneous speech in the LAcT framework. **The IPIC Data Base.* Emanuela Cresti & Massimo Moneglia LABLITA (Università di Firenze) /Pause/ /Session 4 -- Présidente de séance : Paola Pietrandrea (Lattice & Roma 3)/ ** *16h15 L'annotation syntaxique est-elle pertinente pour améliorer la reconnaissance automatique de la parole ?* Carole Lailler, Daniel Luzzati & Paul Deléglise (LIUM, Le Mans) *16h45 Rhapsodie : annotation micro- et macro-syntaxique d'un corpus de français parlé* Christophe Benzitoun, Anne Dister, Sylvain Kahane, Paola Pietrandrea & Noalig Tanguy (Atilf / Saint-Louis / Modyco / Lattice & Roma Tre / Lattice & Valibel) *17h15 Table ronde (fin : 18h)* ** *Organisation* Christophe Benzitoun -- ATILF CNRS & Université de Lorraine Noalig Tanguy -- Lattice UMR 8094 ENS/Paris 3 & Valibel / Université Catholique de Louvain *//* *Comité scientifique* Frédéric Béchet (Aix-Marseille Université / LIF UMR 7279) Marie-José Béguelin (Université de Neuchâtel) Alain Berrendonner (Université de Fribourg) Mireille Bilger (Université de Perpignan) Sandrine Caddéo (Aix-Marseille Université / Laboratoire Parole et Langage UMR 7309) Paul Cappeau (Université de Poitiers) Christophe Cerisara (Loria UMR 7503) Jeanne-Marie Debaisieux (Université Paris 3 Sorbonne Nouvelle / Lattice UMR 8094) Liesbeth Degand (Université catholique de Louvain / Valibel) José Deulofeu (Aix-Marseille Université / LIF UMR 7279) Anne Dister (Facultés universitaires Saint-Louis, Bruxelles) Iris Eshkol (Université d'Orléans / Laboratoire Ligérien Linguistique UMR 7270) Françoise Gadet (Université Paris Ouest Nanterre La Défense / Modyco UMR 7114) Kim Gerdes (Université Paris 3 Sorbonne Nouvelle / LPP / Institut d'Automation / Académie de Sciences Chinoise) Eva Havu (Université de Helsinki) Sylvain Kahane (Université Paris Ouest Nanterre La Défense / Modyco UMR 7114) Anne Lacheret (Université Paris Ouest Nanterre La Défense / Modyco UMR 7114) Florence Lefeuvre (Université Paris 3 Sorbonne Nouvelle / Clesthia) Michel Pierrard (Université Libre de Bruxelles) Paola Pietrandrea (Université Roma Tre / Lattice UMR 8094) Thierry Poibeau (Lattice UMR 8094 ENS/Paris 3) Sophie Prévost (Lattice UMR 8094 ENS/Paris 3) Nathalie Rossi-Gensane (Université Toulouse 2 / CLLE ERSS UMR 5263) Frédéric Sabio (Aix-Marseille Université / Laboratoire Parole et Langage UMR 7309) Catherine Schnedecker (Université de Strasbourg / Lilpa) Anne-Catherine Simon (Université catholique de Louvain / Valibel) Sandra Teston-Bonnard (Université de Lyon 2 / ICAR UMR 5191) Véronique Traverso (ICAR UMR 5191) Dan Van Raemdonck (Université Libre de Bruxelles) Dominique Willems (Université de Gand) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:42:56 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:42:56 +0100 Subject: Job: Stage linguiste / terminologue / traducteur, Reverso Softissimo Message-ID: Date: Wed, 21 Nov 2012 12:43:20 +0100 From: "Juliette Mornet" Message-ID: <004001cdc7dd$6c7eedd0$457cc970$@softissimo.com> X-url: http://www.reverso.softissimo.com/ X-url: http://www.reverso.net/ Bonjour, Suite aux précédentes offres de stage diffusées sur la liste LN, nous cherchons à nouveau un ou plusieurs stagiaires du même profil. Stage linguiste / terminologue / traducteur Type de contrat : Stage de césure ou de fin d’études (minimum 4 mois) Lieu : Neuilly-sur-Seine Indemnité de stage : Selon durée et expérience Début : Dès que possible Avantages : Tickets restaurant et 50% transport ENTREPRISE Editeur de logiciels à rayonnement international, Reverso-Softissimo est l’un des leaders mondiaux des solutions Intranet et Internet de traduction instantanée et de dictionnaires électroniques. Son portail grand public dédié aux langues www.reverso.net génère un très fort trafic avec 200 millions de pages vues par mois et plus de 6 millions de visiteurs uniques. Reverso-Softissimo recherche un(e) linguiste pour participer aux travaux de production et de recherche de notre équipe linguistique dans un contexte professionnel motivant : haute technologie, forte croissance et développement international. Vous êtes intéressé(e) par notre domaine ? C’est le moment de rejoindre notre équipe ! MISSION Sous la direction du chef de projet linguistique, le stagiaire effectuera les missions suivantes : - création, mise à jour, validation de dictionnaires bilingues ; - tests de la qualité de traduction et rédaction de rapports d'analyse ; - recherche, évaluation et analyse de ressources terminologiques ; - animation et développement de la communauté d’utilisateurs du dictionnaire collaboratif. Cette liste n’est pas exhaustive et pourra être amenée à évoluer en fonction de l’implication du/de la stagiaire. PROFIL Étudiant(e) en dernière année d’une école ou d’une université en TAL, langues étrangères, linguistique, ingénierie linguistique ou traduction, vous maîtrisez parfaitement l’anglais et le français à l’oral comme à l’écrit, et idéalement une troisième langue. Vous avez des qualités rédactionnelles ainsi qu’une grande rigueur, une bonne méthodologie, un esprit logique et des capacités d’analyse et de synthèse ; votre sens de l’initiative, votre dynamisme et votre autonomie seront également des qualités appréciées dans le cadre de ce stage. Contact : Juliette MORNET 01.41.43.10.31 jmornet at reverso.com ------------------------------------------------------------------------ Internship for a linguist / terminologist / translator Contract: Year-off or end-of-course internship (4 months minimum) Place: Paris, France Traineeship allowance: Following duration and experience Beginning: As soon as possible Benefits: Meal tickets and 50% transport card THE COMPANY As an internationally recognized software publisher, Reverso-Softissimo is one of the world leaders in Intranet and Internet solutions for instant translation and electronic dictionaries. Reverso.net, its consumer portal dedicated to languages, drives a lot of traffic: 200 million page views a month and more than 6 million unique visitors! Reverso-Softissimo is looking for a linguist who would be involved in our linguistic team’s production and research work, in a very motivating professional environment; high technology, strong growth and international development. You are interested in our domain? It’s time for you to join our team! THE MISSION Under the direction of the linguistic project manager, the trainee will have the following missions: - creating, updating, validating bilingual dictionaries; - testing the quality of translations and writing analytical reports; - searching, assessing and analyzing terminological resources; - stimulating and developing the user community of the collaborative dictionary. The above list is not exhaustive and could evolve according to the trainee’s involvement. THE PROFILE You are a final-year student in a college or university specialized in NLP, foreign languages, linguistics, language engineering or translation; you have fluency in English and French both orally and in writing, and, ideally, in a third language too. You have a logical mind and good writing and analytical skills; you are also very rigorous and methodical. Your sense of initiative, dynamism and autonomy will be much appreciated during this traineeship. Contact: Juliette MORNET +33 (0)1 41 43 10 31 jmornet at reverso.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:45:52 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:45:52 +0100 Subject: Sujet de these: Two Salaried PhD Positions in Machine Translation at Dublin City University Message-ID: Date: Wed, 21 Nov 2012 17:20:34 +0000 From: Declan Groves Message-ID: X-url: http://expert-itn.eu X-url: http://www.nclt.dcu.ie/mt/ X-url: http://www.cngl.ie X-url: http://expert-itn.eu ------ Apologies for cross-posting. Please circulate to any potentially interested parties ------ TWO SALARIED PHD POSITIONS IN MACHINE TRANSLATION AT DUBLIN CITY UNIVERSITY - Marie Curie ITN project EXPERT ------ Applications are invited for two salaried 3-year Early Stage Researcher PhD positions in corpus-based approaches to machine translation. The positions have been awarded as part of the new EU FP7 Marie-Curie Initial raining Network EXPERT (http://expert-itn.eu), concerned with the exploitation of empirical approaches to machine translation, including statistical machine translation and example-based machine translation. The EXPERT project puts together researchers from six European universities (The University of Sheffield, Universidad de Malaga, Universitaet des Saarlandes, Dublin City University, Universiteit van Amesterdam, and University of Wolverhampton) and five translation services and technology providers (Pangeanic, Hermes and Translated, Celer Soluciones and WordFast). The two projects allocated to Dublin City University are: (i) the investigation of how individual corpus-based translation approaches (TM, EBMT and SMT) can benefit from each other; and (ii) investigation of the ideal infra-structure for a computer-aided translation: a pipeline with NLP tools for pre/post-processing, SMT, EBMT and TM techniques which can form the basis of a hybrid CAT tool. The work in both projects will focus on truly hybrid data-driven approaches to MT, in order to ultimately help facilitate the work of human translators. The research will be conducted as part of the MT group at the National Centre for Language Technology (NCLT) (http://www.nclt.dcu.ie/mt/) and the Centre for Next Generation Localisation (CNGL) (http://www.cngl.ie) in Dublin City University, with opportunities for collaborative work with several of the leading universities and industrial partners in EXPERT, and with the expectation of a 6-month secondment to 2-3 partners in this project. The team’s location at DCU, just minutes from Dublin city centre, offers a conducive environment to research, collaboration and innovation with a wealth of amenities on campus, including restaurants, the state-of-the-art University Sports Complex and swimming pool and the Helix, one of Ireland’s most impressive arts venues with three separate auditoria. SALARY DETAILS ----------------------- The successful individual will be employed as a salaried researcher at Dublin City University, while studying towards his/her PhD. Salary rates and additional mobility and training allowances are as per the Marie Curie programme. For employment in the Ireland, the reference figure for gross salary is *41,458* euros/year (before both employer and employee contributions to tax/pension/national insurance etc. subject to the regulations of the host country), plus additional contribution towards mobility and training. The post is fixed term for three years with a start date of 14 January 2013 or soon after. REQUIREMENTS & ELIGIBILITY ------------------------------------------ Applicants should hold, at the very minimum, a primary honours degree in a relevant field of study (e.g. Computer Science, Software Engineering, Computational Linguistics, Mathematics) and should have experience in natural language processing, machine translation or a related area. Please check Section III.3 of the following link for further information on the Marie Curie scheme regarding eligibility criteria: ftp://ftp.cordis.europa.eu/pub/fp7/docs/fp7-mga-annex3intramulti_en.pdf. In particular, candidates cannot have lived in Ireland for more than 12 months in the 3 years immediately prior to their appointment. More details on eligibility can also be found on the project website (http://expert-itn.eu) APPLICATION DETAILS ---------------------------------- For further details, including details of how to apply , please see: www4.dcu.ie/sites/default/files/graduate_research/pdfs/PhD%20opportunities%20EXPERT_DCU_Nov%202012.pdf Closing date for applications: 21st December 2012 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:47:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:47:48 +0100 Subject: Livre: Piotrowski, Natural Language Processing for Historical Texts Message-ID: Date: Fri, 23 Nov 2012 15:56:21 -0500 From: Graeme Hirst Message-Id: X-url: http://www.morganclaypool.com/doi/pdf/10.2200/S00436ED1V01Y201207HLT017 X-url: http://www.morganclaypool.com/page/licensed NEW BOOK Natural Language Processing for Historical Texts by Michael Piotrowski, Leibniz Institute of European History, Germany Synthesis Lectures on Human Language Technologies #17 (Morgan & Claypool Publishers), 2012, 157 pages Abstract More and more historical texts are becoming available in digital form. Digitization of paper documents is motivated by the aim of preserving cultural heritage and making it more accessible, both to laypeople and scholars. As digital images cannot be searched for text, digitization projects increasingly strive to create digital text, which can be searched and otherwise automatically processed, in addition to facsimiles. Indeed, the emerging field of digital humanities heavily relies on the availability of digital text for its studies. Together with the increasing availability of historical texts in digital form, there is a growing interest in applying natural language processing (NLP) methods and tools to historical texts. However, the specific linguistic properties of historical texts -- the lack of standardized orthography, in particular -- pose special challenges for NLP. This book aims to give an introduction to NLP for historical texts and an overview of the state of the art in this field. The book starts with an overview of methods for the acquisition of historical texts (scanning and OCR), discusses text encoding and annotation schemes, and presents examples of corpora of historical texts in a variety of languages. The book then discusses specific methods, such as creating part-of-speech taggers for historical languages or handling spelling variation. A final chapter analyzes the relationship between NLP and the digital humanities. Certain recently emerging textual genres, such as SMS, social media, and chat messages, or newsgroup and forum postings share a number of properties with historical texts, for example, nonstandard orthography and grammar, and profuse use of abbreviations. The methods and techniques required for the effective processing of historical texts are thus also of interest for research in other domains. Table of Contents: Introduction / NLP and Digital Humanities / Spelling in Historical Texts / Acquiring Historical Texts / Text Encoding and Annotation Schemes / Handling Spelling Variation / NLP Tools for Historical Languages / Historical Corpora / Conclusion / Bibliography http://www.morganclaypool.com/doi/pdf/10.2200/S00436ED1V01Y201207HLT017 This title is available online without charge to members of institutions that have licensed the Synthesis Digital Library of Engineering and Computer Science. Members of licensing institutions have unlimited access to download, save, and print the PDF without restriction; use of the book as a course text is encouraged. To find out whether your institution is a subscriber, visit (http://www.morganclaypool.com/page/licensed), or just click on the book's URL above from an institutional IP address and attempt to download the PDF. Others may purchase the book from this URL as a PDF download for US$30 or in print for US$40. Printed copies are also available from Amazon and from booksellers worldwide at approximately US$45 or local currency equivalent. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:21:35 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:21:35 +0100 Subject: Appel: Ecritures anciennes et typographie numerique Message-ID: Date: Sat, 24 Nov 2012 11:00:09 +0100 From: Yannis Haralambous Message-Id: <12CF6930-DCF3-4C79-8513-7B3BB6A5DDBD at telecom-bretagne.eu> X-url: http://gieca.sciencesconf.org/resource/page/id/1 Bonjour à tous, En partenariat avec l'Institut de Recherche sur les Archéomatériaux (IRAMAT, Orléans), l'équipe des Bibliothèques Virtuelles Humanistes du Centre d'études supérieures de la Renaissance organise, les 21 et 22 mai 2013, un colloque consacré à la gestion informatisée des écritures anciennes (imprimé, manuscrit, épigraphie, numismatique, etc.). Les problématiques de codage, de balisage, d'affichage des caractères spéciaux seront au coeur des discussions. Le sujet peut intéresser aussi bien les chercheurs en littérature ou en sciences historiques, que les catalogueurs d'imprimés et de manuscrits anciens, les informaticiens ou les éditeurs de textes. Nous espérons que les bibliothécaires et archivistes seront nombreux à assister ou à proposer des communications. L'appel à contribution sera clôt le 10 janvier 2013. Vous trouverez l'argumentaire et le texte de l'appel à l'URL suivante : http://gieca.sciencesconf.org/resource/page/id/1 N'hésitez pas à relayer cette information à vos éventuels partenaires intéressés, Bien cordialement, Rémi Jimenes, Doctorant, Ingénieur d'étude contractuel (Bibliothèques Virtuelles Humanistes), Centre d'études supérieures de la Renaissance. Tél. 02 47 36 77 65 S'inscrire à la Lettre des BVH : http://www.bvh.univ-tours.fr/newsletter.asp ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:22:47 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:22:47 +0100 Subject: These: Karen Fort, Vers une methodologie de l'annotation manuelle de corpus Message-ID: Date: Sun, 25 Nov 2012 12:25:48 +0100 (CET) From: Karen Fort Message-ID: <1473845698.7970074.1353842747963.JavaMail.root at loria.fr> Bonjour, J'ai le plaisir de vous inviter à ma soutenance de thèse, intitulée : "Les ressources annotées, un enjeu pour l'analyse de contenu : vers une méthodologie de l'annotation manuelle de corpus" La soutenance se déroulera le vendredi 7 décembre, à 14h, à l'Université Paris 13, Villetaneuse, salle B107 du LIPN (voir : http://lipn.univ-paris13.fr/fr/contact). Elle sera suivie d'un pot auquel vous êtes bien sûr chaleureusement conviés. Composition du jury : - Frédéric Béchet, Professeur, Université de la Méditerranée (rapporteur) - Claire François, Ingénieure de Recherche, INIST-CNRS, Nancy - Benoît Habert, Professeur, ENS de Lyon (rapporteur) - Lori Lamel, Directrice de Recherche, LIMSI-CNRS, Orsay - François Lévy, Professeur émérite, Université Paris 13 - Adeline Nazarenko, Professeure, Université Paris 13 (directrice) - Eric Villemonte de la Clergerie Chargé de Recherche, INRIA, Rocquencourt Résumé : L’annotation manuelle de corpus est devenue un enjeu fondamental pour le Traitement Automatique des Langues (TAL). En effet, les corpus annotés sont utilisés aussi bien pour créer que pour évaluer des outils de TAL. Or, le processus d’annotation manuelle est encore mal connu et les outils proposés pour supporter ce processus souvent mal utilisés, ce qui ne permet pas de garantir le niveau de qualité de ces annotations. Nous proposons dans cette thèse une vision unifiée de l’annotation manuelle de corpus pour le TAL. Ce travail est le fruit de diverses expériences de gestion et de participation à des campagnes d’annotation, mais également de collaborations avec différents chercheur(e)s. Nous proposons dans un premier temps une méthodologie globale pour la gestion de campagnes d’annotation manuelle de corpus qui repose sur deux piliers majeurs : une organisation des campagnes d’annotation qui met l’évaluation au cœur du processus et une grille d’analyse des dimensions de complexité d’une campagne d’annotation. Un second volet de notre travail a concerné les outils du gestionnaire de campagne. Nous avons pu évaluer l’influence exacte de la pré-annotation automatique sur la qualité et la rapidité de correction humaine, grâce à une série d’expériences menée sur l’annotation morpho-syntaxique de l’anglais. Nous avons également apporté des solutions pratiques concernant l’évaluation de l’annotation manuelle, en donnant au gestionnaire les moyens de sélectionner les mesures les plus appropriées. Enfin, nous avons mis au jour les processus en œuvre et les outils nécessaires pour une campagne d’annotation et instancié ainsi la méthodologie que nous avons décrite. Bien cordialement, Karën Fort Doctorante LIPN / ATER ENSMN Loria, équipe Sémagramme Bureau C303 03 54 95 86 54 http://lipn.univ-paris13.fr/~fort/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:24:07 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:24:07 +0100 Subject: Job: Post Doc Position on Conversational Feedback (18 months, Aix-en-Provence, France) Message-ID: Date: Sun, 25 Nov 2012 22:09:26 +0100 From: Laurent Prévot Message-ID: Postdoc on "Conversational Feedback: Multidimensional analyses and modeling" (CoFee), Laboratoire Parole et Langage (Aix-En-Provence) (UMR 7309) Applications are invited for an 18 months postdoctoral position on linguistic feedback modeling. The aim of the project is to study the interfaces between linguistic domains (lexicon, prosody, kinesic) in the context of linguistic feedback behaviors. Only candidates with experience with at least two of the points below will be considered: - speech and prosody - dialogue / conversation / interaction analysis and modeling - kinesics (especially facial expression and head movements) - natural language processing Concerning the kind of approaches considered both corpus/quantitative and formal backgrounds are welcomed. The position is planned to start around February 1st but we can discuss about late starting period. The salary will be determined according to the French university standards (about 1950 euros / month after tax and health insurance coverage for a young researcher). Funding for presenting relevant research results into conferences comes with the position. Speaking French will be a plus for everyday life in Aix-en-Provence, but fluency in English is the minimal requirement. The research lab is located in the center of Aix-en-Provence (http://www.aixenprovencetourism.com/). Aix is a sunny middle-sized city of South East France, nested in the Provence countryside, 30 minutes from the Mediterranean and 1h30 from the Alps. The "Laboratoire Parole et Langage" is a very active lab currently involved in several large scale projects (Labex "Brain and Language Research Institute" : www.blri.fr ; EQUIPEX Open Resources and Tools for LANGuage (ORTOLANG) : www.ortolang.fr ; and Erasmus Mundus "Multilingualism and Multiculturalism": www.em-multi.eu ) offering a stimulating research environment and large and diverse opportunities of collaborations. A curriculum vitae and a list of publications should be sent to Laurent Prévot (laurent.prevot at lpl-aix.fr) by December 31st but please contact us asap if you are interested by the position for deepening mutual knowledge before formal application. For more information, please visit the following web pages: CoFee: cofee.hypotheses.org Laboratoire Parole et Langage: lpl-aix.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:28:13 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:28:13 +0100 Subject: These: Anne-Lyse Minard, Extraction de relations en domaine de specialite Message-ID: Date: Mon, 26 Nov 2012 13:17:07 +0100 From: minard Message-ID: <8045d94010a412ce5eaa9bb54fc3278d at limsi.fr> Message-ID: <8045d94010a412ce5eaa9bb54fc3278d at limsi.fr> X-Sender: minard at limsi.fr User-Agent: LIMSI Webmail Bonjour, J’ai le plaisir de vous inviter à la soutenance de ma thèse intitulée "Extraction de relations en domaine de spécialité". La soutenance aura lieu vendredi 7 décembre 2012 à 10h00 en salle de conférences du LIMSI-CNRS (Bât 508, Université Paris Sud, Orsay ; http://www.limsi.fr). Vous êtes également conviés au traditionnel pot de thèse qui suivra la soutenance. Bien cordialement, Anne-Lyse Minard ----------------- Le jury de soutenance sera composé de : * Directrices de thèse Brigitte Grau -- LIMSI-CNRS - ENSIIE Anne-Laure Ligozat -- LIMSI-CNRS - ENSIIE * Rapporteurs Emmanuel Morin -- LINA - Université de Nantes Horacio Saggion -- Université Pompeu Fabra, Barcelone * Examinateurs Juliette Dibie-Barthélemy -- INRA-AgroParisTech Chantal Reynaud -- LRI - Université Paris-Sud Yannick Toussaint -- LORIA-INRIA * Invité Stephen Randall Thomas -- IGR, IR4M-CNRS Résumé de la thèse : La quantité d'information disponible dans le domaine biomédical ne cesse d'augmenter. Pour que cette information soit facilement utilisable par les experts d'un domaine, il est nécessaire de l'extraire et de la structurer. Pour avoir des données structurées, il convient de détecter les relations existantes entre les entités dans les textes. Nos recherches se sont focalisées sur la question de l'extraction de relations complexes représentant des résultats expérimentaux, et sur la détection et la catégorisation de relations binaires entre des entités biomédicales. Nous nous sommes intéressée aux résultats expérimentaux présentés dans les articles scientifiques. Nous appelons résultat expérimental, un résultat quantitatif obtenu suite à une expérience et mis en relation avec les informations permettant de décrire cette expérience. Ces résultats sont importants pour les experts en biologie, par exemple pour faire de la modélisation. Dans le domaine de la physiologie rénale, une base de données a été créée pour centraliser ces résultats d'expérimentation, mais l'alimentation de la base est manuelle et de ce fait longue. Nous proposons une solution pour extraire automatiquement des articles scientifiques les connaissances pertinentes pour la base de données, c'est-à-dire des résultats expérimentaux que nous représentons par une relation n-aire. La méthode procède en deux étapes : extraction automatique des documents et proposition de celles-ci pour validation ou modification par l'expert via une interface. Nous avons également proposé une méthode à base d'apprentissage automatique pour l'extraction et la classification de relations binaires en domaine de spécialité. Nous nous sommes intéressée aux caractéristiques et variétés d'expressions des relations, et à la prise en compte de ces caractéristiques dans un système à base d'apprentissage. Nous avons étudié la prise en compte de la structure syntaxique de la phrase et la simplification de phrases dirigée pour la tâche d'extraction de relations. Nous avons en particulier développé une méthode de simplification à base d'apprentissage automatique, qui utilise en cascade plusieurs classifieurs. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:29:56 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:29:56 +0100 Subject: Ecole: Methodology for Terminology Work (Online Workshop), January 16th - March 12th 2013 Message-ID: Date: Mon, 26 Nov 2012 15:19:05 +0100 From: "iula at online" Message-ID: <0AE2BC0C622341A2B0049DA8DE2BAE80 at ws076671> X-url: http://www.iula.upf.edu/teronlform0uk.htm Dear colleagues, We are pleased to announce that the online workshop Methodology for Terminology Work (second edition in English) will start on January 16th 2013. This workshop is offered by IULATERM, the leading Research Group in Terminology under the direction of M. Teresa Cabré, in the framework of the online Master in Terminology. The online workshop Methodology for Terminology Work deals with the foundations of terminological practice within the framework of M. Teresa Cabré's Communicative Theory of Terminology, and its main objective is the elaboration of a terminological product (a glossary or vocabulary) following the main phases of terminology work: definition of the work, writing the work plan, creation and examination of the extraction corpus, database creation and revision, and work editing. The online workshop Methodology for Terminology Work is based on TERMINUS 2.0©, an application for terminology and corpus management developed by IULATERM Research Group. TERMINUS 2.0© is an integrated web application which provides tools for the complete terminographic workflow: document search, corpus compilation and exploration, automatic term extraction, dictionary and project management, database creation and maintenance, and dictionary edition (in digital or print format). Please note that the number of places for the workshop is limited; thus early registration is strongly recommended. Please see below for further details, and do not hesitate to write to us should you need any additional information. Workshop dates: January 16th - March 12th 2013 ECTS Credits: 10 Fee: ? 600 Registration: http://www.iula.upf.edu/teronlform0uk.htm (Please follow the instructions indicated under Registration procedure) Further information and contact: iulaonline at upf.edu Best regards, M. Teresa Cabré Director Master in Terminology ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:32:21 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:32:21 +0100 Subject: Appel: Ateliers TALN'2013 Message-ID: Date: Mon, 26 Nov 2012 18:06:50 +0100 (CET) From: "Emmanuel MORIN" Message-ID: <1e466c6bdc01c1de214c16cb8791bcca.squirrel at webmail.univ-nantes.fr> PREMIER APPEL À ATELIERS ------------------------ TALN'2013 20e conférence sur le Traitement Automatique des Langues Naturelles Centre de Congrès Les Atlantes aux Sables d'Olonne du 17 au 21 juin 2013 CALENDRIER ---------- - Date limite de soumission : 25 janvier 2013 - Réponse du comité de programme : 8 février 2013 - Version finale des articles : 3 mai 2013 - Date des ateliers : 21 juin 2013 Organisée par l'équipe TALN du LINA (Laboratoire d’Informatique de Nantes Atlantiques) et l’équipe LST du LIUM (Laboratoire d'Informatique de l'Université du Maine), la 20e conférence sur le Traitement Automatique des Langues Naturelles (TALN) se tiendra du 17 au 21 juin 2013 au Centre de Congrès Les Atlantes aux Sables d'Olonne. La conférence TALN’2013, qui est organisée sous l’égide de l’ATALA, se tiendra conjointement avec la 15e édition des Rencontres des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL'2013). OBJECTIFS --------- Un atelier porte sur une thématique particulière de TALN afin de rassembler quelques exposés plus ciblés. Il a son propre président et son propre comité de programme. Le responsable d'un atelier est chargé de l'appel à candidatures et de la coordination de son comité de programme. Les organisateurs de TALN s'occuperont de la partie logistique (gestion des salles, pauses café et diffusion des articles). Les ateliers auront lieu en parallèle sur une journée ou une demi-journée (2 à 4 sessions de 1h30). MODALITÉS DE PROPOSITION ------------------------ Les propositions d'ateliers seront envoyées sous forme électronique à emmanuel.morin at univ-nantes.fr et yannick.esteve at lium.univ-lemans.fr. Les propositions d'ateliers comprendront une description synthétique (1 page) de la thématique de la conférence ainsi que son comité de programme et de la durée souhaitée. Le comité de programme de TALN choisira parmi toutes les propositions. FORMAT ------ Les conférences auront lieu en français (ou en anglais pour les non-francophones). Les articles devront suivre le format de TALN et comprendront 12 à 14 pages. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:31:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:31:28 +0100 Subject: Appel: Atelier SOS'2013 "Sources Ouvertes et Services" - EGC'2013 Message-ID: Date: Mon, 26 Nov 2012 17:16:03 +0100 From: Laurie Serrano Message-ID: X-url: http://weblab-project.org/workshop/sos2013 *Merci de diffuser cet appel à communications le plus largement possible. Toutes nos excuses pour d'éventuelles réceptions multiples.* *Quatrième édition de l’atelier "Sources Ouvertes et Services"* *SOS’2013 (en association avec EGC’2013)* *29 janvier 2013 - Toulouse, France* http://weblab-project.org/workshop/sos2013 *Présentation de l'atelier :* Pour sa quatrième édition, l'atelier SOS'2013 propose de poursuivre une réflexion commune autour des diverses problématiques liées au traitement de données disponibles en sources ouvertes (SO). Les SO désignent l'ensemble des médias accessibles librement, de façon gratuite ou payante, tels qu'Internet, les bases de données publiques, les journaux, les CD-ROM, les chaînes de télévision et de radio, etc., par opposition aux sources fermées dont la consultation nécessite de disposer d'autorisations spécifiques. Ces SO fournissent d’importants volumes de données multimédia hétérogènes (image, texte, audio, vidéo, etc.) qui nécessitent des traitements adaptés en vue de leur exploitation. Cet atelier est dédié à toutes ces étapes, partant de la phase de découverte des sources d’information, en passant par la collecte et l'analyse des données collectées jusqu’à la phase de capitalisation et d’exploitation des connaissances. Un intérêt particulier sera porté aux choix architecturaux retenus pour la réalisation d’applications exploitant les SO. En effet, ces applications tentent généralement de faire cohabiter plusieurs briques logicielles (COTS, logiciels open source, développements ad-hoc, etc.) en vue de la réalisation d'une tâche particulière. Cela représente un défi scientifique et technique auquel les recherches sur l’enchaînement des traitements algorithmiques capables d'exploiter ces données peuvent contribuer. L’accent sera mis sur les architectures orientées services (SOA) et sur l’utilisation des technologies du Web Sémantique. Pour cette nouvelle édition, l'atelier SOS souhaite s'intéresser également au traitement des grandes masses de données ("Big data"). L'explosion récente des données disponibles sur le Web a fait émerger de nouvelles problématiques visant à adapter et optimiser toute la chaine de traitement de l'information face aux nouveaux volumes à traiter. Cet atelier souhaite rassembler des chercheurs issus à la fois des mondes académique et industriel afin d'obtenir un panel représentatif d'acteurs et de leurs travaux sur les thèmes présentés ci-après. *Thèmes de l'atelier :* Les auteurs sont invités à envoyer des propositions ayant une portée théorique, méthodologique ou pratique, sur l’un des thèmes suivants (liste non exhaustive) : * Identification et découverte automatique de sources d’information, * Accès et collecte d’information à partir de sources ouvertes (Web, réseaux sociaux, flux RSS et autres), * Classification, filtrage des informations d'intérêt, * Extraction d’information à partir de textes non structurés et/ou utilisant des vocabulaires spécifiques (blogs, langage sms, forums), * Extraction d’information à partir de gros volumes de données multimédia (texte, image, vidéo, audio), * Analyse des sentiments/opinions dans les médias sociaux (réseaux sociaux, blogs, forums), * Modélisation et capitalisation des connaissances extraites à partir de sources ouvertes (ontologies, annotations sémantiques), * Exploitation des connaissances extraites à partir de sources ouvertes : raisonnement, aide à la décision, visualisation, * Détection de signaux faibles, * Evaluation et qualification des sources d’information, * Evaluation et qualification des informations extraites à partir de sources ouvertes, * Inférence, fouille et validation de liens entre données, * Plate-formes d’intégration de services de traitement hétérogènes : interopérabilité des services, orchestration sémantique, * Applications de veille stratégique ou économique à partir de sources ouvertes, * Applications de renseignement d’origine sources ouvertes (ROSO), * Applications de traitement de l'information orientées "Big data". *Comité de programme :* Florence Amardeilh (Mondeca) Gaël de Chalendar (CEA LIST) Olivier Corby (INRIA, Sophia Antipolis) Valentina Dragos (ONERA) Adil El Ghali (IBM) Christian Fluhr (GEOL Semantics) Bruno Grilheres (Cassidian) Dafni Stampouli (Cassidian) Nicolas Hernandez (Université de Nantes) Alexandre Pauchet (LITIS, Rouen) Haïfa Zargayouna (LIPN, Université de Paris 13) Maroua Bouzid (GREYC, Université de Caen) Cassia Trojahn (IRIT, Toulouse) Klaus Atzenbeck (IISYS, Hof University, Germany) Sinan Yurtsever (Atos, Turkey) Nizar Ghoula (Université de Genève, Switzerland) *Dates importantes :* * Date limite de soumission : *30 Novembre 2012* * Notification aux auteurs : 21 Décembre 2012 * Version finale : 2 Janvier 2013 * Date de l'atelier : 29 Janvier 2013 *Soumission :* Cet atelier invite les auteurs à soumettre leurs articles en français ou en anglais (résumé en anglais souhaité dans les deux cas). Les articles soumis ne devront pas dépasser 12 pages (annexes comprises). Nous vous demandons de respecter les instructions des organisateurs de EGC'2013 et d'utiliser la dernière version du format RNTI disponible à l'adresse suivante : http://www.antsearch.univ-tours.fr/rnti Chaque proposition sera évaluée par au moins deux membres du comité de programme. Les communications retenues feront l’objet d’une présentation orale par l'un des auteurs (en français ou en anglais à leur convenance). La journée commencera par une présentation d’un conférencier invité sur l'un des thèmes de l’atelier et s’achèvera par une table ronde autour des problématiques liées à l’exploitation des sources ouvertes. *Les articles doivent être envoyés à l'adresse suivante : sos2013 at weblab-project.org* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 20:46:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 21:46:46 +0100 Subject: Appel: LATA 2013, submission deadline extended Message-ID: Date: Sun, 4 Nov 2012 14:55:44 +0100 From: "GRLMC" Message-ID: X-url: http://grammars.grlmc.com/LATA2013/ ------------------------------------------------------------------------ SUBMISSION DEADLINE EXTENDED: November 15 !!! ------------------------------------------------------------------------ 7th INTERNATIONAL CONFERENCE ON LANGUAGE AND AUTOMATA THEORY AND APPLICATIONS LATA 2013 Bilbao, Spain April 2-5, 2013 Organized by: Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/LATA2013/ AIMS: LATA is a yearly conference in theoretical computer science and its applications. Following the tradition of the International Schools in Formal Languages and Applications developed at Rovira i Virgili University in Tarragona since 2002, LATA 2013 will reserve significant room for young scholars at the beginning of their career. It will aim at attracting contributions from both classical theory fields and application areas (bioinformatics, systems biology, language technology, artificial intelligence, etc.). VENUE: LATA 2013 will take place in Bilbao, at the Basque Country in Northern Spain. The venue will be the Basque Center for Applied Mathematics (BCAM). SCOPE: Topics of either theoretical or applied interest include, but are not limited to: ? algebraic language theory ? algorithms for semi?structured data mining ? algorithms on automata and words ? automata and logic ? automata for system analysis and programme verification ? automata, concurrency and Petri nets ? automatic structures ? cellular automata ? combinatorics on words ? computability ? computational complexity ? computational linguistics ? data and image compression ? decidability questions on words and languages ? descriptional complexity ? DNA and other models of bio?inspired computing ? document engineering ? foundations of finite state technology ? foundations of XML ? fuzzy and rough languages ? grammars (Chomsky hierarchy, contextual, multidimensional, unification, categorial, etc.) ? grammars and automata architectures ? grammatical inference and algorithmic learning ? graphs and graph transformation ? language varieties and semigroups ? language?based cryptography ? language?theoretic foundations of artificial intelligence and artificial life ? parallel and regulated rewriting ? parsing ? pattern recognition ? patterns and codes ? power series ? quantum, chemical and optical computing ? semantics ? string and combinatorial issues in computational biology and bioinformatics ? string processing algorithms ? symbolic dynamics ? symbolic neural networks ? term rewriting ? transducers ? trees, tree languages and tree automata ? weighted automata STRUCTURE: LATA 2013 will consist of: ? invited talks ? invited tutorials ? peer?reviewed contributions INVITED SPEAKERS: Jin-Yi Cai (Madison), Complexity Dichotomy for Counting Problems Kousha Etessami (Edinburgh), Algorithms for Analyzing Infinite-state Recursive Probabilistic Systems Luke Ong (Oxford), tutorial Languages and Automata for Higher-order Model Checking Jo?l Ouaknine (Oxford), tutorial Discrete Linear Dynamical Systems Thomas Schwentick (Dortmund), Applications of Automata in Database Theory -- Challenges to Automata Theory from Databases Andrei Voronkov (Manchester), The Lazy Reviewer Assignment Problem in EasyChair PROGRAMME COMMITTEE: Parosh Aziz Abdulla (Uppsala) Franz Baader (Dresden) Jos Baeten (CWI, Amsterdam) Christel Baier (Dresden) Gerth St?lting Brodal (Aarhus) John Case (Delaware) Marek Chrobak (Riverside) Mariangiola Dezani (Torino) Rod Downey (Wellington) Ding-Zhu Du (Dallas) Ivo D?ntsch (Brock) E. Allen Emerson (Austin) Javier Esparza (Technical University Munich) Michael R. Fellows (Darwin) Alain Finkel (ENS Cachan) Dov M. Gabbay (King?s, London) J?rgen Giesl (Aachen) Rob van Glabbeek (NICTA, Sydney) Georg Gottlob (Oxford) Annegret Habel (Oldenburg) Reiko Heckel (Leicester) Sanjay Jain (Singapore) Charanjit S. Jutla (IBM Thomas J. Watson) Ming-Yang Kao (Northwestern) Deepak Kapur (Albuquerque) Joost-Pieter Katoen (Aachen) S. Rao Kosaraju (Johns Hopkins) Evangelos Kranakis (Carleton) Hans-J?rg Kreowski (Bremen) Tak-Wah Lam (Hong Kong) Gad M. Landau (Haifa) Kim G. Larsen (Aalborg) Richard Lipton (Georgia Tech) Jack Lutz (Iowa State) Ian Mackie (?cole Polytechnique, Palaiseau) Rupak Majumdar (Max Planck, Kaiserslautern) Carlos Mart?n-Vide (Tarragona, chair) Paliath Narendran (Albany) Tobias Nipkow (Technical University Munich) David A. Plaisted (Chapel Hill) Jean-Fran?ois Raskin (Brussels) Wolfgang Reisig (Humboldt Berlin) Micha?l Rusinowitch (LORIA, Nancy) Davide Sangiorgi (Bologna) Bernhard Steffen (Dortmund) Colin Stirling (Edinburgh) Alfonso Valencia (CNIO, Madrid) Helmut Veith (Vienna Tech) Heribert Vollmer (Hannover) Osamu Watanabe (Tokyo Tech) Pierre Wolper (Li?ge) Louxin Zhang (Singapore) ORGANIZING COMMITTEE: Adrian Horia Dediu (Tarragona) Peter Leupold (Tarragona) Carlos Mart?n?Vide (Tarragona, co-chair) Magaly Rold?n (Bilbao) Bianca Truthe (Magdeburg) Florentina Lilica Voicu (Tarragona) Enrique Zuazua (Bilbao, co-chair) SUBMISSIONS: Authors are invited to submit papers presenting original and unpublished research. Papers should not exceed 12 single?spaced pages (including eventual appendices) and should be formatted according to the standard format for Springer Verlag's LNCS series (see http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0). Submissions have to be uploaded to: https://www.easychair.org/conferences/?conf=lata2013 PUBLICATIONS: A volume of proceedings published by Springer in the LNCS series will be available by the time of the conference. A special issue of a major journal will be later published containing peer?reviewed extended versions of some of the papers contributed to the conference. Submissions to it will be by invitation. REGISTRATION: The period for registration is open from August 6, 2012 to April 2, 2013. The registration form can be found at the website of the conference: http://grammars.grlmc.com/LATA2013/ FEES: Early registration fees: 500 Euro Early registration fees (PhD students): 400 Euro Late registration fees: 540 Euro Late registration fees (PhD students): 440 Euro On?site registration fees: 580 Euro On?site registration fees (PhD students): 480 Euro At least one author per paper should register. Papers that do not have a registered author who paid the fees by January 2, 2013 will be excluded from the proceedings. One registration gives the right to present only one paper. Fees comprise access to all sessions, one copy of the proceedings volume, coffee breaks and lunches. PAYMENT: Early (resp. late) registration fees must be paid by bank transfer before January 2, 2013 (resp. March 23, 2013) to the conference bank account: Uno-e Bank bank?s address: Julian Camarillo 4 C, 28037 Madrid, Spain IBAN: ES3902270001820201823142 BIC/SWIFT: UNOEESM1 account holder: C. Martin ? GRLMC account holder?s address: Av. Catalunya 35, 43002 Tarragona, Spain Please mention LATA 2013 and your name in the subject. A receipt will be provided on site. Remarks: - Bank transfers should not involve any expense for the conference. - People claiming early registration will be requested to prove that the bank transfer order was carried out by the deadline. - PhD students will need to provide evidence of their status on site. People registering on site must pay in cash. For the sake of local organization, however, it is much recommended to do it earlier. DEADLINES: Paper submission: November 15, 2012 (23:59h, CET) ? EXTENDED - Notification of paper acceptance or rejection: December 16, 2012 Final version of the paper for the LNCS proceedings: December 25, 2012 Early registration: January 2, 2013 Late registration: March 23, 2013 Starting of the conference: April 2, 2013 End of the conference: April 5, 2013 Submission to the post?conference journal special issue: July 5, 2013 QUESTIONS AND FURTHER INFORMATION: florentinalilica.voicu at urv.cat POSTAL ADDRESS: LATA 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34?977?559543 Fax: +34?977?558386 ACKNOWLEDGEMENTS: Basque Center for Applied Mathematics Diputaci? de Tarragona Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 20:57:45 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 21:57:45 +0100 Subject: Ressource: New release of DGT-TM (parallel corpus in 23 languages) Message-ID: Date: Mon, 05 Nov 2012 17:04:04 +0100 From: Ralf Steinberger Message-id: <009f01cdbb6f$2dca2980$895e7c80$@jrc.ec.europa.eu> X-url: http://langtech.jrc.ec.europa.eu/DGT-TM.html DGT-TM is an extraction of the translation memory of the European Institutions for all official EU languages, produced by the European Commission?s Directorate General for Translation (DGT) and distributed by the Joint Research Centre (JRC). Translation memories are sentences and their manually produced translations. The new release is called DGT-TM-2012. It follows the previous releases, DGT-TM (2007) and DGT-TM-2011. DGT-TM-2012 adds over six million translation units to the previous 57 million translation units, resulting in almost 3.3 million sentences for most languages, 63 million translation units in total. New features of DGT-TM-2012 are: ? Small amounts of Irish data is now included for the first time; ? Significantly more data for the Bulgarian, Maltese and Romanian languages; ? Mostly about 285K new translation units per language. Languages: All 253 language pairs involving the following 23 languages: Bulgarian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Irish, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish and Swedish. URL: http://langtech.jrc.ec.europa.eu/DGT-TM.html Creator: European Commission - Directorate General for Translation (DGT, http://ec.europa.eu/dgs/translation/index_en.htm) WHAT IS DGT-TM The ?Acquis Communautaire? (http://europa.eu/abc/eurojargon/index_en.htm) is the entire body of European legislation, comprising all the treaties, regulations and directives adopted by the European Union (EU). Since each new country joining the EU is required to accept the whole Acquis Communautaire, this body of legislation has been translated into 22 official languages. For the 23rd official EU language, Irish, the Acquis has not been translated on a regular basis; which is why DGT-TM includes only little data in Irish. The Acquis Communautaire was split into sentences and aligned automatically at sentence level, resulting in the DGT translation memory, DGT-TM. The text data is accompanied by software that allows to extract all sentences and their translations for any of the 253 possible language pair combinations. MOTIVATION FOR THIS RELEASE The public data release is in line with the general effort of the European Commission to support multilingualism, language diversity and the re-use of Commission information. It follows the release of the JRC-Acquis parallel corpus in 2006 (over 1 billion words in 22 languages), of the DGT-TM Translation Memory in 2007, the multilingual named entity resource JRC-Names in 2011, the multilingual multi-label classification tool (and accompanying text data) JRC EuroVoc Indexer (JEX) (22 languages), and further smaller multilingual resources. See http://langtech.jrc.ec.europa.eu/JRC_Resources.html for more information on these resources. WHAT DGT-TM CAN BE USED FOR DGT-TM can be fed into translation memory software to support human translators in their work. As it is a large parallel corpus in electronic form, it can furthermore be used by specialists in computational linguistics to train statistical machine translation software, to generate multilingual dictionaries, to train and test multilingual information extraction software, and more. MORE INFORMATION ON DGT-TM At http://langtech.jrc.ec.europa.eu/JRC_Publications.html , you find detailed publications on the JRC?s multilingual language technology activity. For details on DGT-TM, you can read: Steinberger Ralf, Andreas Eisele, Szymon Klocek, Spyridon Pilos & Patrick Schl?ter (2012). http://langtech.jrc.ec.europa.eu/Documents/2012_LREC_DGT-TM_Final.pdf DGT-TM: A freely Available Translation Memory in 22 Languages. Proceedings of the 8th international conference on Language Resources and Evaluation (LREC'2012), Istanbul, 21-27 May 2012. http://langtech.jrc.ec.europa.eu/Documents/2012_LREC_DGT-TM_Final.pdf WHAT NEXT? The JRC and collaborating services of the European Commission are currently finalising the release of further large-scale linguistic resources. Ralf Steinberger http://langtech.jrc.ec.europa.eu/RS.html European Commission - Joint Research Centre (JRC) 21027 Ispra (VA), Italy URL ? Applications: http://emm.newsbrief.eu/overview.html URL ? Resources: http://ipsc.jrc.ec.europa.eu/index.php?id=61 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:00:36 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:00:36 +0100 Subject: These: Damien Nouvel, Reconnaissance des entites nommees par exploration de regles d'annotation Message-ID: Date: Tue, 6 Nov 2012 10:00:46 +0100 From: Damien Nouvel Message-ID: Bonjour, J'ai le plaisir de vous inviter ? ma soutenance de th?se intitul?e "Reconnaissance des entit?s nomm?es par exploration de r?gles d'annotation", qui aura lieu le mardi 20 novembre, ? 14h15, ? l'antenne universitaire de Blois (amphi 1). La soutenance sera suivie d'un pot auquel vous ?tes chaleureusement convi?s. Cordialement, Damien Nouvel -- Th?se : Reconnaissance des entit?s nomm?es par exploration de r?gles d'annotation - Interpr?ter les marqueurs d?annotation comme instructions de structuration locale Date et lieu : * mardi 20 novembre ? 14h15 * antenne universitaire de Blois (3 place Jean-Jaur?s, Blois), amphi 1 (sous-sol) R?sum? : Ces derni?res d?cennies, le d?veloppement consid?rable des technologies de l'information et de la communication a modifi? en profondeur la mani?re dont nous avons acc?s aux connaissances. Face ? l'afflux de donn?es et ? leur diversit?, il est n?cessaire de mettre au point des technologies performantes et robustes pour y rechercher des informations. A cet effet, les entit?s nomm?es (personnes, lieux, organisations, dates, expressions num?riques, marques, fonctions, etc.) sont sollicit?es dans l'objectif de cat?goriser, d'indexer, ou, plus g?n?ralement, de manipuler des contenus. L'identification de ces ?l?ments est souvent r?alis?e ? l'aide de proc?dures dites d'annotation. Notre travail porte sur la reconnaissance et l'annotation des entit?s nomm?es au sein de transcriptions d'?missions radiodiffus?es ou t?l?visuelles. A cet effet, nous explorons des donn?es dans lesquelles sont relev?es les entit?s nomm?es, pour extraire des r?gles d'annotation (qui s'appuient sur des instructions locales) afin d'?laborer un syst?me de reconnaissance automatique des entit?s nomm?es. En premi?re partie, nous abordons la probl?matique du traitement automatique du langage et des entit?s nomm?es en particulier. Nous revenons sur la relation qu'entretien l'automate avec le langage et d?crivons les analyses g?n?ralement conduites pour traiter le langage naturel. Nous abordons ensuite la probl?matique des entit?s nomm?es (r?trospective des notions recouvertes, typologies, ?valuation et annotation) et proposons une caract?risation de leur nature linguistique. Nous concluons cette partie par un positionnement ? l'?gard des approches ?tat de l'art du domaine et par notre proposition, centr?e sur les marqueurs (balises) de d?but ou de fin d'annotation. En seconde partie, nous exposons le formalisme d'exploration de donn?es que nous adoptons. Nous commen?ons par le situer au sein des m?thodes de fouille de texte. Puis nous nous dotons d'un cadre formel pour explorer les motifs, en particulier ceux qui sont corr?l?s aux marqueurs d'annotation, que nous nommons r?gles d'annotation. Enfin, nous pr?sentons les mod?les que nous utilisons lorsqu'il s'agit d'exploiter ces r?gles extraites afin de r?aliser l'annotation d'un texte donn?. La derni?re partie d?crit le syst?me impl?ment?, mXS, et les r?sultats obtenus. Nous d?taillons en premier lieu les modules de traitements, ressources lexicales et corpus ? notre disposition pour mener les exp?riences. Nous pr?sentons ensuite la mise en oeuvre et les r?sultats pour l'exploration des donn?es et pour l'extraction des r?gles d'annotation. Enfin, nous fournissons des r?sultats chiffr?s relatifs aux performances obtenues par mXS, ainsi que des indicateurs suppl?mentaires quant au comportement du syst?me ? divers point de vue et dans diverses configurations. Ils montrent que l'approche que nous proposons est comp?titive et qu'elle ouvre des perspectives dans le cadre du traitement du langage et de l'annotation automatique. Composition du jury : * M. Jean-Yves Antoine, Professeur des universit?s, Universit? Fran?ois Rabelais de Tours (directeur) * M. Fr?d?ric B?chet, Professeur des universit?s, Aix Marseille Universit? (examinateur) * M. Bruno Cr?milleux, Professeur des universit?s, Universit? de Caen (rapporteur) * Mme Nathalie Friburger, Ma?tre de conf?rences, Universit? Fran?ois Rabelais de Tours (encadrante) * Mme Sophie Rosset, Directrice de recherche, LIMSI-CNRS (rapporteure) * M. Arnaud Soulet, Ma?tre de conf?rences, Universit? Fran?ois Rabelais de Tours (encadrant) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:11:55 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:11:55 +0100 Subject: Seminaire: Conference de Jean-Francois Demonet, 23 novembre 2012, Marseille Message-ID: Date: Tue, 6 Nov 2012 11:59:04 +0100 From: Nad?ra Bureau Message-ID: <006801cdbc0d$bc999170$35ccb450$@bureau at lpl-aix.fr> Brain & Language Research Institute Vendredi 23 novembre 2012 16h Salle des Vo?tes F?d?ration de Recherche 3 C (Comportement, Cerveau, Cognition) 3 place Victor Hugo, Marseille (Labex BLRI) Jean-Fran?ois DEMONET Cartographie des fonctions du Langage par stimulation ?lectrique corticale ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:21:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:21:26 +0100 Subject: These: Charles Teissedre, Analyse semantique automatique des adverbiaux de localisation temporelle Message-ID: Date: Wed, 7 Nov 2012 12:14:20 +0100 From: Charles Teissedre Message-ID: Bonjour, J'ai le plaisir de vous inviter ? ma soutenance de th?se intitul?e : Analyse s?mantique automatique des adverbiaux de localisation temporelle : application ? la recherche d?information et ? l?acquisition de connaissances La soutenance se d?roulera ? 15h, le jeudi 22 novembre, ? l'Universit? Paris Ouest Nanterre La D?fense - salle de Visio-Conf?rences - B?t E 404. Le jury sera compos? de : - Mme Nathalie Aussenac-Gilles, Directrice de recherche, IRIT (CNRS) - rapporteur - Mme Adeline Nazarenko, Professeur des Universit?s, Universit? Paris Nord - rapporteur - M. Maarten de Rijke, Professeur des Universit?s, Universiteit van Amsterdam - examinateur - M. Guy Lapalme, Professeur des Universit?s, Universit? de Montr?al - examinateur - Mme Florence Amardeilh, Directrice du d?partement recherche de Mondeca - examinateur - M. Jean-Luc Minel, Professeur des Universit?s, Paris-Ouest Nanterre La D?fense - directeur - Mme Delphine Battistelli, Ma?tre de conf?rences (HDR), Universit? Paris Sorbonne - co-directrice R?sum? Cette th?se aborde la question de l'acc?s aux textes num?riques, en particulier de l'acc?s ? leur ? contenu informationnel ?, vu sous l'angle de leur ancrage dans le temps. La vis?e de ces travaux est double : il s'agit de concilier une approche linguistique et une approche applicative, afin de contribuer ? l'?laboration de nouveaux outils pour la fouille de textes, la recherche d'information et la gestion des connaissances - nouveaux outils en mesure de tirer parti de la s?mantique d'un certain nombre d'informations temporelles exprim?es dans les textes. Il s'agit ainsi ? la fois de mettre en ?uvre des syst?mes d'interaction avec les utilisateurs et de parvenir ? mod?liser la s?mantique des unit?s textuelles qui contribuent de fa?on saillante ? l'ancrage dans le temps des situations d?crites dans les textes : les adverbiaux de localisation temporelle. L'?tude linguistique vise ici ? montrer que l'ing?nierie des langues peut gagner ? envisager d'une fa?on renouvel?e les ph?nom?nes de localisation temporelle, en cherchant ? reconna?tre et ? mettre au jour les diff?rentes op?rations ? l'?uvre dans les adverbiaux de localisation temporelle. En faisant ?merger les valeurs s?mantiques de ces op?rations, nous montrons qu'il devient possible d'?laborer de nouveaux syst?mes de recherche d'information, susceptibles de traiter des requ?tes associant un crit?re calendaire avec un ensemble de mots-cl?s, telles que ? les universit?s au d?but du XIIe si?cle ?, par exemple. S'appuyant sur les outils d?velopp?s en ce sens, on montre qu'il devient ?galement possible d'interagir avec des donn?es structur?es d?crivant des informations temporelles, ? la fois pour les interroger et pour les enrichir de fa?on semi-automatique. Vous ?tes bien s?r chaleureusement convi?s au pot qui suivra. Bien cordialement, Charles Teiss?dre ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:46:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:46:59 +0100 Subject: Seminaire: INFOLINGU, Rojo Ranaivo, LIGM, Universite Paris-Est Marne-la-Vallee, 12 novembre 2012 Message-ID: Date: Thu, 8 Nov 2012 17:31:46 +0100 From: Myriam RAKHO Message-ID: X-url: http://infolingu.univ-mlv.fr/ ************************************************************************ INFOLINGU Le s?minaire de l'?quipe Informatique Linguistique du Laboratoire d'Informatique Gaspard Monge (LIGM) Universit? Paris-Est Marne-la-Vall?e Date : Le Lundi 12 novembre 2012 ? 10h30 Lieu : Universit? Paris-Est Marne-la-Vall?e B?timent Copernic, 4?me ?tage, salle de s?minaires 4B08R Toute personne int?ress?e est la bienvenue. ************************************************************************ * Intervenant : Rojo Ranaivo, LIGM, Universit? Paris-Est Marne-la-Vall?e * Titre de la pr?sentation : Construction d'un dictionnaire ?lectronique des verbes du malgache * R?sum? de la pr?sentation : *Nous nous proposons de faire une pr?sentation g?n?rale de notre travail de th?se intitul?* *? la formalisation de la morpho-syntaxe du malgache ?. Il a pour objectif de construire* *un dictionnaire ?lectronique des verbes de cette langue. D?un point de vue linguistique,* *la description du syst?me de conjugaison est la principale innovation de cette th?se.* *En effet, la langue malgache jusqu?? ce jour n?a aucun manuel de conjugaison,* *et il a ?t? n?cessaire d?en faire un pour la construction du dictionnaire ?lectronique.* *Quant ? la r?alisation technique du travail, la codification des donn?es (cat?gories* *grammaticales et traits flexionnels, variations morphologiques des radicaux verbaux,* *combinaison des affixes avec les radicaux) a n?cessit? des discussions sur le mod?le* *formel ? retenir, et une organisation assez rigoureuse, tout comme en cor?en ou dans* *les autres langues agglutinantes, car les donn?es ? manipuler sont relativement* *nombreuses. Des solutions ont ?t? adopt?es tant sur le plan de la linguistique que sur* *le plan de la r?alisation technique qui ont d?bouch? sur des r?sultats encourageants :* *un syst?me de conjugaison a ?t? adopt? et des principes sur la codification des donn?es* *ont rendu le travail de description formelle r?alisable. Ainsi, un petit dictionnaire ?lectronique* *des verbes du malgache a ?t? construit permettant plus tard par diverses applications* *le traitement automatique de cette langue (traitement de texte, v?rificateur orthographique, filtrage, et autres).* http://infolingu.univ-mlv.fr/ Anthony SIGOGNE, Myriam RAKHO ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:49:41 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:49:41 +0100 Subject: Ecole: CLARA Thematic training course on evaluation of Human Language Technologies Message-ID: Date: Thu, 08 Nov 2012 18:50:42 +0100 From: ELRA ELDA Information Message-ID: <509BF0F2.9050002 at elda.org> [Apologies for cross-postings] ******************** CALL FOR PARTICIPATION CLARA Thematic training course on evaluation of Human Language Technologies www.elda.org/clara/ 26-29 November 2012, Paris, France As part of the CLARA Marie Curie Initial Training Network, ELDA and University of Copenhagen organize a four-day thematic training course on evaluation of Human Language Technologies in Paris. ******************** Goal and Focus For any HLT research effort to be successful, it is essential that it be assessed through rigorous evaluations of the developed technologies. This allows performance benchmarking and a better understanding of possible limitations and challenging conditions. The CLARA Thematic training course on evaluation of HLT aims at providing both ESRs (Early Stage Researchers) and ERs (Experienced Researchers) the background and skills to use and implement state-of-the?art evaluation tools and techniques for speech technologies, grammars and parsing, machine translation and speech-to- speech translation, information retrieval/filtering, multimodal interfaces, etc.). The CLARA Thematic training course on evaluation of HLT will introduce and describe some evaluation concepts (comparative evaluation versus competition, technology evaluation versus usage/usability evaluation). It will also describe the different types of evaluation and how to ensure that evaluation does not kill innovative not-yet-mature approaches. Additionally, The CLARA Thematic training course on evaluation of HLT will elaborate on the role of evaluation on the research progress, on the need for a truly European infrastructure for HLT evaluation, on the main reasons to promote an international dimension of the evaluation, insisting on the multilingual issues. Given the interdisciplinary nature of the workshop, the workshop will be relevant for any ESRs/ERs who are involved in the development of algorithms and systems for speech technologies, machine translation, parsers, information retrieval, multimodal interfaces, etc. ******************** Invited Speakers * Khalid Choukri, ELDA, France * Bente Maegaard, University of Copenhagen, Denmark * Joseph Mariani, IMMI, France (to be confirmed) * Patrick Paroubek, LIMSI, France * Anders S?gaard, University of Copenhagen, Denmark ******************* There is no participation fee for the CLARA thematic training course on evaluation of Human Language Technologies but online registration is mandatory. Please register at: http://survey.elda.org/index.php?sid=67327&lang=en by November 23. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:54:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:54:08 +0100 Subject: Seminaire: Alpage, Khalil Sima'an, 16 novembre 2012 Message-ID: Date: Fri, 9 Nov 2012 16:16:01 +0100 From: Marie Candito Message-ID: ************** S?minaire Alpage ******************* S?minaire de l'?cole doctorale de Paris Diderot : Il s'agit du s?minaire de recherche en linguistique informatique organis? par l'?quipe Alpage, ?quipe mixte INRIA - Paris Diderot, sp?cialis?e en analyse syntaxique automatique et en traitement du discours. Le prochain s?minaire se tiendra : * vendredi 16 novembre de 11h ? 12h30 * en salle 3E91 ? l'UFRL, 16, rue de Clisson, 75013 Paris (3e ?tage gauche) Toute personne int?ress?e est la bienvenue. ****************************** Title: On the Role of Syntactic Trees in Machine Translation Abstract: Over the past years, major effort was spent on incorporating monolingual syntax into statistical machine translation with mixed results. One difficulty in doing so often seems that translation equivalence does not necessarily conform to monolingual syntactic constituency structure, as assumed by traditional compositional semantics. In this talk I will reflect on syntactic structure aiming to show that the information represented in a syntactic tree can be represented in alternative ways. By representing this information in terms of translation equivalence, syntactic information can be brought into statistical MT models effectively. In the talk I will give a bird's-eye view of three recent models developed together with my co-workers and touch upon some relevant aspects of the interplay between syntax and SMT. Subsequently, I will give a brief overview of the problem of how to represent the translation mapping hierarchically in order to capture the relations of translation equivalence adequately. I will also briefly discuss how to use this new hierarchical representation to pave the way for learning compositional statistical synchronous grammars from word-aligned parallel corpora. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 9 21:56:33 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 9 Nov 2012 22:56:33 +0100 Subject: Info: (Re-)adhesion AFIA en 2012 Message-ID: Date: Fri, 02 Nov 2012 18:50:27 +0100 From: "Thomas Guyet (Tresorier AFIA)" Message-ID: <1351878627.2839.44.camel at portable-tg.irisa.fr> X-url: http://www.afia.asso.fr Bonjour, [d?sol? pour les in?vitables r?ceptions multiples] L'objectif de l'AFIA est de promouvoir l'Intelligence Artificielle (IA) sous ses diff?rentes formes, de regrouper et de d?velopper la communaut? fran?aise en IA, et d'en assurer sa visibilit? aux niveaux national et international. Gr?ce au soutien de ses adh?rents, l'AFIA assure : * le maintien d'un site web regroupant les informations majeures en IA (http://www.afia.asso.fr) * la parution trimestrielle d'un Bulletin de l'IA, * la diffusion mensuelle de Br?ves ? propos des actualit?s en cours en IA, * la remise annuelle d'un Prix de Th?se de Doctorat en IA, * la r?ponse aux consultations ? propos d'IA (ANR, CNRS, ... ) * un lien entre adh?rents sur LinkedIn et Facebook L'AFIA anime la communaut? par l'organisation de grands rendez-vous annuels : en alternance, la ? Plate-forme de l'IA ? qui se tiendra en 2013 ? Lille et, en collaboration avec l'AFRIF, le Congr?s Reconnaissance des Formes et IA (RFIA 2012 ? Lyon). L'AFIA organise des rencontres th?matiques bimestrielles, avec le soutien d'autres Associations Savantes (RobIA 2012 avec le Gdr Robotique, TLIA 2012 avec ATALA , ROIA 2011 avec ROADEF, ISIA 2011 avec l'AFIS, ainsi que d'autres journ?es en pr?paration ? ) L'AFIA a parrain? en 2012 de nombreuses manifestations th?matiques, nationales ou internationales, dont CAp, IC, JFSMA, WACAI, PAAMS, TIA et, en tant que membre fran?ais de l'ECCAI (http://www.eccai.org/), l'association a ?galement patronn? l'accueil de la conf?rence ECAI 2012 ? Montpellier (http://www2.lirmm.fr/ecai2012/). L'AFIA contribue ? la participation financi?re de ses membres aux ?v?nements soutenus par l'association. Ainsi, les membres de l'AFIA inscrits aux conf?rences 2012 RFIA, IC, CAp, JFSMA ont b?n?fici? d'une r?duction ?quivalente ? deux fois le co?t de leur adh?sion. De plus, tous les membres de l'AFIA ont b?n?fici? d'une r?duction de 100? sur les tarifs d'inscription ? la conf?rence ECAI 2012. L'ensemble de ces activit?s ainsi que les grands ?v?nements ? venir ont ?t? pr?sent?s lors de l'AG de l'association en octobre 2012. Le diaporama de pr?sentation est disponible sur le site de l'association. Pour que l'AFIA puisse continuer ces activit?s en 2013 et vous soutenir dans l'organisation de vos ?v?nements en lien avec l'IA, nous vous invitons ? adh?rer ? l'AFIA. Votre adh?sion participera au d?veloppement de la communaut? fran?aise en IA et vous fera b?n?ficier des avantages r?serv?s par l'AFIA ? ses adh?rents. Pour adh?rer, vous pouvez utiliser le bulletin en pi?ce jointe ou acc?der directement au formulaire en ligne sur le site de l'AFIA : http://www.afia.asso.fr/proxy_adhesion.php?page=index Nous vous rappelons que l'adh?sion ? l'association peut ?tre individuelle ou au titre d'une institution, laboratoire ou entreprise (personne morale). T. Guyet Tr?sorier de l'AFIA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:41:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:41:28 +0100 Subject: Revue: Diachroniques, numero 2 Message-ID: Date: Mon, 29 Oct 2012 15:44:14 +0100 From: Jalouneix Catherine Message-ID: <508E963E.5070209 at paris-sorbonne.fr> X-url: http://pups.paris-sorbonne.fr/pages/aff_livre.php?Id=1015 Monsieur, Je me permets d'attirer votre attention sur la publication r?cente du num?ro 2 de la revue de linguistique fran?aise : /Diachroniques./ //L'objectif de ce num?ro est de proposer une vue d'ensemble sur une question trop souvent n?glig?e : /Le sentiment de la langue/. Cette question est abord?e ? travers deux axes : un premier rassemble des r?flexions th?oriques issues des diff?rents courants dans lesquels le point de vue du locuteur, ses attitudes, ses discours, ses repr?sentations, sont pris en compte dans l'analyse d'un ? ?tat de langue ? ou d'un ? ?tat d'usages ? ; un second rassemble des enqu?tes empiriques couvrant les trois grandes p?riodes de l'histoire du fran?ais. Pour plus de pr?cisions : http://pups.paris-sorbonne.fr/pages/aff_livre.php?Id=1015 En esp?rant que cet ouvrage retienne votre attention. Je vous adresse, Monsieur, mes meilleures salutations. Catherine Jalouneix, charg?e de communication aux PUPS 01 53 10 57 63 catherine.jalouneix at paris-sorbonne.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:43:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:43:26 +0100 Subject: Job: Stage M2, Extraction automatique d'information de contenus textuels Message-ID: Date: Sat, 10 Nov 2012 18:28:17 +0100 From: Alexandre Pauchet Message-ID: <509E8EB1.7070705 at insa-rouen.fr> X-url: http://asi.insa-rouen.fr/enseignants/~apauchet/ ** Stage de M2 Recherche : Extraction automatique d'information de contenus textuels ** Mots-clefs : Extraction de connaissances, analyse de dialogue/conversation, traitement automatique de la langue. ** Contexte : Plixee est une startup fond?e par trois ing?nieurs de l'INSA de Rouen. Elle d?veloppe une solution ? destination du grand public, associations et TPE visant ? faciliter la communication et l'organisation de projets. L'offre comble un manque constat? d'outils simples pour s'organiser de mani?re d?mat?rialis?e. Elle permet d'?viter les discussions par emails ou le panachage de plusieurs services dispersant l'information. Elle se diff?rencie des solutions existantes en ne fournissant que des outils simples et ne se substitue pas aux logiciels avanc?s de gestion de projets. Une des grandes forces de Plixee est d'accompagner l'utilisateur dans le processus cr?atif. En cr?ant un espace d?di? ? leur projet, les utilisateurs disposent d'un espace de discussion au sein duquel ils peuvent ?changer autour de leurs id?es. Au fur et ? mesure de leurs discussions, les id?es vont germer et amener ? prendre des d?cisions. Celles-ci se mat?rialisent par des ?l?ments de projet que les utilisateurs peuvent extraire directement depuis les messages (questions, t?ches, etc.). Ces ?l?ments construisent alors petit ? petit le projet qui sera achev? au terme de leur consultation/r?alisation. ** Objectif du stage : Le processus d'extraction d'?l?ments au sein des discussions est pour le moment r?alis? manuellement par les utilisateurs. L'objectif de ce stage est de faciliter ce processus en proposant des algorithmes et outils sugg?rant ou extrayant automatiquement les ?l?ments ad?quats gr?ce ? une analyse du contenu de la discussion. On peut ainsi imaginer que dans une conversation portant sur le choix d'une date de d?part en vacances, le syst?me sugg?re automatiquement une question reprenant les diff?rentes possibilit?s ?voqu?es dans des messages pr?c?dents. Pour r?pondre ? cette probl?matique, nous envisageons donc de recourir ? des syst?mes d'analyse de contenu. Trois approches sont envisag?es : Une approche symbolique ? l'aide de patrons linguistiques, qu'ils soient construits manuellement ou automatiquement (voir [1] comme exemple appliqu? ? la d?tection d'?v?nements). Une approche num?rique permettant d'apprendre automatiquement les informations ? extraire (voir [2] pour une approche enti?rement automatique). Une approche hybride, combinant les deux approches pr?c?dentes. Par ailleurs, la structure dialogique pourra ?galement ?tre exploit?e afin de faciliter l'extraction des ?l?ments en question. [3], par exemple, propose une m?thodologie d'analyse de dialogues dont l'approche hybride pourrait servir ? d?tecter des structures courant sur plusieurs messages. ** Travail ? effectuer : - Mod?lisation formelle du probl?me - ?tude bibliographique des solutions existantes - M?thode(s) d'extraction automatique de connaissances - Implantation et ?valuation des r?sultats Comme base de travail seront fournis : un corpus annot? et un prototype simplifi? issu d'un d?veloppement r?alis? par deux ?tudiants en projet. ** Encadrement : Vincent Durmont (Plixee) : vincent at plixee.com Alexandre Pauchet (MIU at LITIS - INSA de Rouen) : pauchet at insa-rouen.fr Quentin Suire (Plixee) : quentin at plixee.com ** ?quipe d'accueil et d?roulement du stage Le stagiaire sera int?gr? dans la soci?t? Plixee et dans l'?quipe "Mod?lisation Interaction et Usages" (MIU) du LITIS (EA 4108) ? l'INSA de Rouen. De fa?on g?n?rale, l'?quipe MIU adopte une approche pluridisciplinaire de sciences cognitives. Elle s'int?resse notamment ? la relation entre l'homme et les syst?mes d'information et de sa mod?lisation, posant comme axiome que les interactions sont repr?sentatives de l'usage. Le d?fi scientifique est de comprendre comment mod?liser les interactions entre l'homme et la machine ou entre l'homme et l'homme avec la machine comme interface. Le stage se d?roulerait de f?vrier 2013 ? juin 2013. L'?tudiant serait h?berg? dans les locaux du laboratoire LITIS qui lui fournirait le mat?riel n?cessaire ? son travail. La r?mun?ration de l'?tudiant serait assur?e par la soci?t? Plixee au tarif l?gal en vigueur (436,05EUR par mois). ** R?f?rences bibliographiques [1] L. Serrano, T. Charnois, S. Brunessaux, B. Grilh?res, M. Bouzid. Combinaison d'approches pour l'extraction automatique d'?v?nements. JEP-TALN-RECITAL'2012 - Grenoble, France. [2] R. Collobert, J. Weston, L. Bottou, M. Karlen, K. Kavukcuoglu and P. Kuksa. Natural Language Processing (Almost) from Scratch. Journal of Machine Learning Research, 12:2493-2537, 2011. [3] Z. Al?s, G. Dubuisson Duplessis, O. Serban, A. Pauchet, A Methodology to Design Human-Like Embodied Conversational Agents based on Dialogue Analysis, Workshop HAIDM at AAMAS, Valencia, Spain, pp.34-49, 2012. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:47:01 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:47:01 +0100 Subject: Sujet de these: Two salaried PhD positions in NLP (51062 euro/yr) at University of Sheffield - Marie Curie Message-ID: Date: Sun, 11 Nov 2012 22:03:32 +0100 From: Leon Derczynski Message-ID: X-url: http://clg.wlv.ac.uk/projects/EXPERT/ X-url: http://www.shef.ac.uk/jobs Applications are invited for two 3-year Early Stage Researcher PhD positions in corpus-based approaches to machine translation. The positions have been awarded as part of the new EU FP7 Marie-Curie Initial raining Network EXPERT (http://clg.wlv.ac.uk/projects/EXPERT/), concerned with the exploitation of empirical approaches to machine translation, including statistical machine translation and example-based machine translation. The EXPERT project puts together researchers from six European universities (The University of Sheffield, Universidad de Malaga, Universitaet des Saarlandes, Dublin City University, Universiteit van Amesterdam, and University of Wolverhampton) and five translation services and technology providers (Pangeanic, Hermes and Translated, Celer Soluciones and WordFast). The two projects allocated to the University of Sheffield are (i) learning from human feedback, which is concerned about methods to collect and incorporate human feedback into translation systems to improve the quality of translations; and (ii) estimating the quality and confidence of corpus-based approaches to machine translation and the quality of translated texts. The work in both projects will focus on statistical and machine learning techniques to address the problems, but it will also involve aspects of human translation studies, based on a strong interaction with some of the partners in EXPERT. The research will be conducted as part of the Natural Language Processing research group in Sheffield, with opportunities for collaborative work with several of the leading universities and industrial partners in EXPERT, and with the expectation of a 6-month secondment to 2-3 partners in this project. Further information about the research group can be found at: http://nlp.dcs.shef.ac.uk. The successful individual will be employed as a salaried researcher at the University of Sheffield, while studying towards his/her PhD. Salary rates and additional mobility and training allowances are as per the Marie Curie programme (see Annex 3 of this document http://ec.europa.eu/research/participants/portal/download?docId=31562, page 69). For employment in the UK, the reference figure for *gross salary is 51,062 euros/year, plus additional contribution towards mobility and training*. Please check Section III.3 of the following link for further information on the Marie Curie scheme regarding eligibility criteria: ftp://ftp.cordis.europa.eu/pub/fp7/docs/fp7-mga-annex3intramulti_en.pdf. In particular, *candidates cannot have lived in the UK for more than 12 months in the 3 years immediately prior to their appointment*. Applicants should hold a good honours degree in a relevant field of study (e.g. computer science, engineering, mathematics) and have experience in natural language processing, machine translation or related area. They should also have a solid background in mathematics/statistics and excellent programming skills (C/C++, Java, Python/Perl, etc.). See the job specification for more details on the expected profile: http://www.dcs.shef.ac.uk/~lucia/resources/EXPERT_Marie_Curie_Early_Stage_Researcher.pdf The post is fixed term for three years with a start date of January 2013 or soon after. Closing Date: *10th December 2012* For applications: http://www.shef.ac.uk/jobs, Search and apply for jobs, job reference number: *UOS005598* In addition to submitting applications to the University of Sheffield, candidates should apply via the website provided by project coordinator: http://clg.wlv.ac.uk/projects/EXPERT/. For informal enquiries about this job and department, contact: Dr Lucia Specia on l.specia at sheffield.ac.uk. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:53:01 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:53:01 +0100 Subject: Appel: Campagne d'etiquetage en sentiments de tweets et blogs Message-ID: Date: Mon, 12 Nov 2012 07:29:44 +0000 From: Message-ID: <2921_1352705385_50A0A569_2921_12920_1_50BA83905E9CAC4489EFDA167756E5DA01C3E8 at PEXCVZYM12.corporate.adroot.infra.ftgroup> X-url: http:// Bonjour ? tous, J'aimerais vous demander votre aide pour une exp?rience d'analyse de sentiments en discours, r?alis?e dans le cadre du projet coop?ratif DIFAC. Il s'agit d'?valuer l'image de diff?rentes marques sur des plateformes sociales (messages issus de blogs et de Twitter). L'?valuation se fait ? partir d'une interface, ? l'adresse suivante : https://imago-difac-sql.orange-labs.fr/tweet/. Chaque message ? ?valuer appara?t successivement. Vous disposez d'une grille d'?valuation ? compl?ter, puis vous validez. Il n'y a pas de contrainte quantitative : vous pouvez r?aliser autant d'?valuations que vous le souhaitez. L'objectif est de faire le lien entre des macro-caract?ristiques de messages (propri?t?s linguistiques ou structurelles) et le r?seau lexical de traits descriptifs de l'opinion. L'id?e est d'appliquer des traitements linguistiques et des m?thodes d'apprentissage, ce qui demande de disposer d'un nombre important d'annotations. La campagne d'?tiquetage est ouverte jusqu'? d?but d?cembre. Vous pouvez vous connecter plusieurs fois si vous le souhaitez. N'h?sitez pas ? me contacter si vous souhaitez des pr?cisions compl?mentaires. Merci d'avance pour votre aide. Cordialement, Coralie Reutenauer coralie.reutenauer at orange.com 02 96 05 36 86 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 17:56:58 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 18:56:58 +0100 Subject: Stage: Master / Ingenieur - aide au handicap : IHM et TALN Message-ID: Date: Mon, 12 Nov 2012 10:25:08 +0100 From: Jean-Yves Antoine Message-ID: <50A0C074.3050205 at univ-tours.fr> X-url: http://www.info.univ-tours.fr/~antoine/documents_enseignement/2013_Proposition_stage_Sibylle.pdf X-url: http://www.info.univ-tours.fr/~antoine/SIBYLLE/Sibylle_fr/index.html X-url: http://www.kerpape.mutualite56.fr/ ================================ Proposition de stage de fin d'?tudes "Optimisation ergonomique d'un syst?me d'aide ? la communication pour des personnes lourdement handicap?es" R?sum? ------------ Proposition de stage de recherche ou de fin d'?tudes en informatique et Interaction Homme-Machine pour l'aide au handicap d'une dur?e de 4 mois minimum. Version PDF : http://www.info.univ-tours.fr/~antoine/documents_enseignement/2013_Proposition_stage_Sibylle.pdf Contexte scientifique ------------------------------- En collaboration avec le Laboratoire d'Informatique de l'Universit? de Tours, le laboratoire d'informatique du Centre Mutualiste de R??ducation de Kerpape (56- Morbihan) propose un sujet de stage dans le cadre du projet de recherche TMH (T?l?communications, Mobilit? et Handicap) financ? par la soci?t? BAMSOO. Une des actions envisag?es dans le cadre du projet TMH est le d?veloppement de solutions int?gr?es pour l'aide ? la personne. Plus pr?cis?ment, nous nous int?ressons ? la mise en place de syst?mes d'aide ? la communication pour des personnes souffrant de handicaps moteurs tr?s s?v?res (Infirmit? Motrice C?r?brale, Scl?roses Lat?rales Amyotrophiques, syndrome d'enfermement...) se traduisant par une t?trapl?gie ou une ath?tose accompagn?e d'une perte de l'usage de la parole. La communication est alors priv?e de son support oral habituel, de m?me que les capacit?s tr?s limit?es de contr?le physique de l'environnement par la personne handicap?e emp?chent toute saisie directe de message sur un clavier d'ordinateur. L'aide ? la personne recherch?e vise donc un objectif principal : pouvoir ?changer avec autrui par l'interm?diaire d'un syst?me de suppl?ance informatique. Ce syst?me repose sur l'?criture de phrases ? l'aide d'un clavier virtuel affich? ? l'?cran. Un curseur se d?place automatiquement caract?re par caract?re, le long du clavier virtuel. L'intervention de la personne handicap?e se limite ? la d?signation des symboles lorsque le curseur est sur la touche ou le caract?re d?sir?. Cette s?lection est r?alis?e ? l'aide d'un dispositif physique qui remplace le p?riph?rique d'entr?e de l'ordinateur (bouton pressoir, d?tecteur de souffle, suivi du regard...). L'utilisation d'un module de pr?diction de lettres et de mots permet d'acc?l?rer la saisie en ?vitant ? l'utilisateur de saisir tous les caract?res du message. Le laboratoire LI a d?j? d?velopp? un tel syst?me (Sibylle) qui repose sur une pr?diction de mots tr?s efficace et est utilis? en routine dans plusieurs centres de r??ducation et laboratoires de recherche. Dans le cadre de ce stage, la personne recrut?e travaillera avec le centre de r??ducation fonctionnelle de Kerpare. Dans le cadre d'un projet (VOLTAIRE) financ? par la Fondation Motrice, une nouvelle interface de l'application Sibylle a ?t? d?velopp?e pr?cis?ment avec le centre de r??ducation de Kerpape, sans que cette derni?re ne soit int?gr?e au moteur de pr?diction. L'objectif de ce stage est d'?laborer une interface homme-machine ergonomique qui facilite l'utilisation du syst?me et permette de b?n?ficier d'une mani?re optimale de la pr?diction de mots. Cette interface fera l'objet d'exp?rimentations r?elles aupr?s de patients des centres de Kerpape Travail ? r?aliser ------------------------ La personne recrut?e sera en charge ? la fois de la conception et des aspects d?veloppement logiciel mis en jeu au cours du stage, ainsi que de la validation par tests utilisateurs r?alis?s ? Kerpape. Le projet se d?roulera en trois phases successives : Phase 1 - R?ing?nierie (1 mois ?) -- Reprise en main du code de l'interface d?velopp?e au cours du projet VOLTAIRE et interfa?age avec le moteur de pr?diction, documentation du code. Il s'agit d'un travail de r?ing?nierie qui servira avant tout au stagiaire ? prendre la mesure du projet propos?. Elle consistera ? achever le travail d'int?gration en cours sur le syst?me SIBYLLE seul. Phase 2 - Ergonomie (2 mois ?) -- Evaluation d'une premi?re maquette du logiciel d?velopp? et analyse de ses faiblesse ergonomiques. Proposition d'am?lioration de l'interface pour optimiser le recours ? la pr?diction. Plusieurs pistes d'am?liorations peuvent d?j? ?tre cit?es : - Renforcement des possibilit?s de configuration du syst?me pour adaptation ? l'utilisateur - ?tude du positionnement de la liste de pr?diction, int?gration ?ventuelle dans le clavier de lettres - Renforcement de l'adaptation de l'interface au handicap et ? l'utilisateur consid?r? - ?tude de l'adaptation de messages pr?enregistr?s suivant le contexte d'utilisation. Ces phrases, compos?es ? l'avance, servent le plus souvent pour la r?daction rapide de messages d'alertes ou de demandes pressantes. En modifiant la liste des messages suivant le contexte d'utilisation courant du logiciel, on augmente les possibilit?s de communication rapide Phase 3 -- Dispositifs d'entr?e int?gr?s ou mobile (1 ? 2 mois suivant la dur?e du stage) -- Cette phase est optionnelle. Elle d?pendra de l'avanc?e du travail et de la dur?e du stage. Elle consisterait soit, ? ?tudier l'usage du syst?me de communication directement ? partir d'un dispositif de commande comme, par exemple, le joystick de commande du fauteuil roulant autonome du patient, soit ? travailler plus en avant sur la portabilit? du syst?me sur des syst?mes mobiles de type smartphone ou tablet PC. Profil recherch? ----------------------- La personne recrut?e sera en cycle terminal d'?tudes en informatique, de niveau Bac+5 (Master informatique professionnel, recherche ou indiff?renci?, ?cole d'ing?nieur). Des comp?tences en Interaction Homme-Machine seront appr?ci?es. Dans le cas d'un(e) ?tudiant(e) en Master Recherche, le sujet de stage pourra ?tre adapt? aux attentes de l'?tudiant. Le cas ?ch?ant, une adaptation du sujet pourra ?tre envisag? pour des ?tudiants de Licence ou DUT informatique de tr?s bon niveau (mention Bien appr?ci?e) : pr?voir dans ce cas une prolongation de la convention de stage. R?mun?ration -------------------- R?mun?ration maximale pr?vue par la r?glementation ? savoir 436,05 EUR par mois durant les 4 premiers mois de stage. En cas de stage donnant satisfaction, et/ou si l'?tudiant doit/veut faire un stage d'une dur?e suppl?mentaire, une prolongation de stage peut-?tre envisag?e avec r?mun?ration au niveau du SMIC. Cette r?mun?ration sera assur?e dans le cadre d'un projet industriel financ? par la soci?t? BAMSOO. Lieu d'exercice ----------------------- La personne recrut?e travaillera pr?s de Lorient, au sein du Centre de R??ducation Fonctionnelle de Kerpape. Il s'int?grera dans une ?quipe projet compos?e de Jean-Paul Departe et Willy All?gre (Laboratoire d'informatique du Centre de R??ducation Fonctionnelle de Kerpape) et de Jean-Yves Antoine (Universit? Fran?ois Rabelais de Tours). Contact -- D?p?t des candidatures ------------------------------------------------- Contact : Jean-Yves.Antoine at univ-tours.fr D?p?t des candidatures : aupr?s de Jean-Yves Antoine. Merci de d?poser un CV d?taill? de vos activit?s pass?es, accompagn? d'une lettre de motivation et de relev?s de notes concernant vos deux derni?res ann?es d'?tudes. Renseignements suppl?mentaires -------------------------------------------------- Syst?me Sibylle : http://www.info.univ-tours.fr/~antoine/SIBYLLE/Sibylle_fr/index.html Centre de r??ducation de Kerpape : http://www.kerpape.mutualite56.fr/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:03:09 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:03:09 +0100 Subject: Stage: Master 2, Amelioration du systeme de paraphrasage d'un systeme de Questions / Reponses Message-ID: Date: Mon, 12 Nov 2012 11:17:02 +0100 From: Manon Quintana Message-ID: X-url: http://www.inbenta.com/fr X-url: http://www.inbenta.com/images/france/offre-stage-tal.pdf *Soci?t?* inbenta (http://www.inbenta.com/fr) est une soci?t? d'origine catalane pionni?re dans le Traitement Automatique du Langage Naturel (TALN) et la recherche s?mantique. Bas?e sur ces concepts novateurs, inbenta d?veloppe depuis 2005 des outils web pour les sites internet de Grands Comptes. Depuis 2009 et fort de son succ?s, inbenta ?tend ses activit?s sur le territoire Fran?ais et a ouvert d?but 2012 une filiale sur Toulouse. *Description de l'offre* inbenta d?veloppe diff?rents outils web qui permettent de r?pondre automatiquement aux questions des internautes en puisant les r?ponses dans une base de connaissances/FAQ constamment mise ? jour. Notre syst?me de r?ponse repose sur un lexique bas? sur la Lexicologie Explicative et Combinatoire qui s'encadre dans la Th?orie Sens-Texte. Gr?ce ? ce lexique et ? ses fonctions lexicales, nous pouvons g?n?rer des paraphrases. Notre algorithme va donc anticiper les diff?rentes formulations employ?es par les internautes pour exprimer une m?me id?e : *J'ai perdu ma CB* *je ne retrouve plus ma carte !! * *perte carte bleue* L'objet du stage sera de participer ? l'am?lioration de notre syst?me de paraphrasage de notre syst?me de Question / R?ponse. Le stagiaire devra comprendre et analyser la solution d?velopp?e par inbenta. Il devra s'impr?gner de l'existant afin de faire ?voluer l'algorithme ? travers notamment des cas clients concrets. *Profil recherch?* Vous terminez vos ?tudes en Traitement Automatique du Langage Naturel (Master 2) et souhaitez int?grer une structure innovante o? vous pourrez faire vos preuves et exprimer vos ambitions. Passionn?(e) par la linguistique informatique, vous avez bien entendu une excellente ma?trise de la langue fran?aise et disposez d'un niveau suffisamment bon en espagnol, anglais ou catalan afin de pouvoir ais?ment communiquer avec les ?quipes de Barcelone. Bonus : - Ma?trise d'au moins un langage de programmation (PHP de pr?f?rence) - Maitrise des expressions r?guli?res et du SQL *Modalit?s du poste* - Stage de fin d'?tudes conventionn? de 6 mois (avec possibilit? d'embauche en CDI) - R?mun?ration pr?vue: conventionnelle + prime - D?but : ? partir de F?vrier / Mars 2013 - Lieu : Toulouse Merci d'adresser CV et lettre de motivation par e-mail ? l'adresse suivante : *rh at inbenta.com* Plus de d?tails sur cette offre de stage ici : http://www.inbenta.com/images/france/offre-stage-tal.pdf *Manon Quintana* Computational linguist *IN**B**ENTA* +33 (0)5 31 54 94 97 www.inbenta.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:06:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:06:26 +0100 Subject: Conf: Colloque international interdisciplinaire MIC Sorbonne 2012, 15-16 novembre 2012, Paris Message-ID: Date: Mon, 12 Nov 2012 12:51:57 +0100 From: CELTA Sorbonne Message-Id: <252D47C0-B2A5-45A6-9207-C4E00FE36D53 at paris-sorbonne.fr> X-url: http://www.celta.paris-sorbonne.fr/CELTA-colloques/MIC-Sorbonne-2012/MIC2012-Programme.pdf X-url: http://www.celta.paris-sorbonne.fr/forum/index.php Chers Coll?gues et chers ?tudiants, Nous avons le plaisir d'annoncer le 3e Colloque international et interdisciplinaire "MIC Sorbonne 2012" (Paris,.15-16, novembre, 2012) qui, cette fois, sera consacr? au th?me suivant: "Nouveaux Standards pour les Sciences du Langage" Le pdf du programme se trouve ici: http://www.celta.paris-sorbonne.fr/CELTA-colloques/MIC-Sorbonne-2012/MIC2012-Programme.pdf Vous trouverez beaucoup d'informations pr?liminaires dans notre Forum de Discussion: http://www.celta.paris-sorbonne.fr/forum/index.php Venez nombreux. Ce n'est pas cher. Les frais d'inscription ne sont que: 20? pour les ?tudiants et 40? pour les autres. Bien cordialement, A. Wlodarczyk ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:08:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:08:50 +0100 Subject: Appel: CIAA 2013 Message-ID: Date: Mon, 12 Nov 2012 13:12:04 +0100 (CET) From: Denis Maurel Message-ID: <1846595488.10120183.1352722324742.JavaMail.root at mail10> X-url: http://cs.smu.ca/~ciaa2013/ X-url: http://tln.li.univ-tours.fr/ciaa/) CIAA 2013: First Call for Papers 18th International Conference on Implementation and Application of Automata Halifax, Nova Scotia, Canada July 16-19, 2013 http://cs.smu.ca/~ciaa2013/ ------------------- AIM AND SCOPE CIAA is the premier annual conference for researchers, application developers and users of automata-based systems. The applications of the theory of automata, a foundational area of computer science, have spread to almost all areas of computer science and many other disciplines. The CIAA series has published significant papers describing the applications of finite automata in parsing and compilers, logic, natural language processing, pattern matching, database management, and bioinformatics. The conference also accepts papers that advance the state of the art in the theoretical study of finite automata, regular expressions, grammars and related formal models. Another goal of the conference is to provide additions and enhancements to existing software systems that manipulate automata, regular expressions, grammars, and related structures; examples of such systems include AGL, AMoRE, ASTL, Automate, FADELA, FAdo, FinITE, FIRE Station, FSM, Grail+, I-LaSer, INR, Intex, JFLAP, MERLin, MONA, TESTAS, Turing's World, Vaucanson, WFSC and Whale Calf. TOPICS CIAA invites papers on all aspects of implementation, application, and theory of automata and related structures, including but not limited to: Algorithms on automata Automata and logic Bioinformatics Complexity of automata operations Compilers Computer-aided verification Concurrency Data structure design for automata Data and image compression Design and architecture of automata software Digital libraries DNA/molecular/membrane computing Document engineering Editors, environments Experimental studies and practical experience Implementation of verification methods and model checking Industrial applications Natural language and speech processing Networking New algorithms for manipulating automata Object-oriented modeling Pattern-matching Pushdown automata and context-free grammars Quantum computing Structured and semi-structured documents Symbolic manipulation environments for automata Transducers and multi-tape automata Techniques for graphical display of automata VLSI Viruses, related phenomena World-wide web PREVIOUS EDITIONS Seventeen previous CIAA conferences took place in: Porto (2012), Blois (2011), Winnipeg (2010), Sydney (2009), San Francisco (2008), Prague (2007), Taipei (2006), Nice (2005), Kingston (2004), Santa Barbara (2003), Tours (2002), Pretoria (2001), London Ontario (2000), Potsdam (WIA'99), Rouen (WIA'98), London Ontario (WIA'97), London Ontario (WIA'96). See the conference site (http://tln.li.univ-tours.fr/ciaa/) for archives on these previous editions. IMPORTANT DATES Submission Deadline: March 10, 2013 Notification: April 21, 2013 Final Version: TBA, 2013 Conference Dates: July 16-19, 2013 SUBMISSIONS Papers will be submitted in PDF, using the EasyChair system at: http://www.easychair.org/conferences/?conf=ciaa2013 Authors must use the LNCS-style LaTeX2e available at: http://www.springer.de/comp/lncs/authors.html) Research papers are sought on all aspects of implementation, application, and theory of automata and related structures. Researchers are invited to submit unpublished original research. Simultaneous submissions to other venues is not allowed. Papers must be written in English and provide sufficient details to allow the program committee to assess their merits. If the authors believe that more details are necessary to substantiate the claims of the paper, they may include a clearly marked appendix to be read at the discretion of the committee. Proceedings will be published by Springer in Lecture Notes in Computer Science (LNCS) and will be available at the conference. Extended versions of selected proceedings papers will appear in a special issue of TBA. DEMOS We encourage the submission of software demos. Developers wishing to demonstrate their software should submit a two-page description outlining the design of their system and its application area(s). More information about how to submit a demo will be available at the conference website. VENUE CIAA 2013 will take place in Halifax, Nova Scotia, the largest city in Atlantic Canada (east of Montreal), located at the east coast of Canada. The venue will be Saint Mary's University, located in the city centre. RELATED EVENT CIAA 2013 will be held just before DCFS 2013, which will take place in London, Ontario. INVITED SPEAKERS Cezar Campeanu (U. of Prince Edward Island, Canada) Helmut Jurgensen (U. of Western Ontario, Canada) Margus Veanes (Microsoft Research, USA) TBA () PROGRAM COMMITTEE Brzozowski, Janusz - Waterloo, Canada; Campeanu, Cezar - Charlottetown, Canada; Caron, Pascal - LITIS Rouen, France; Champarnaud, Jean-Marc - Rouen, France; Domaratzki, Michael - Manitoba, Canada; Drewes, Frank - Umea, Sweden; Han, Yo-Sub - Seoul, Korea; Holub, Jan - Prague, Czech Republic; Holzer, Markus - Giessen, Germany; Ibarra, Oscar - Santa Barbara, USA; Ito, Masami - Kyoto, Japan; Jurgensen, Helmut - London, Canada; Kari, Lila - London, Canada; Konstantinidis, Stavros - Halifax, Canada (Chair); Lombardy, Sylvain - LABRI, Bordeaux, France; Maletti, Andreas - Stuttgart, Germany; Maneth, Sebastian - New South Wales, Australia; Maurel, Denis - Tours, France; McQuillan, Ian - Saskatoon, Canada; Moreira, Nelma - Porto, Portugal; Okhotin, Alexander - Turku, Finland; Pighizzini, Giovanni - Milano, Italy; Ravikumar, Bala - Rohnert Park CA, USA; Reidenbach, Daniel - Loughborough University, UK; Reis, Rogerio - Porto, Portugal; Salomaa, Kai - Kingston, Canada; Tommasi, Marc - INRIA Lille, France; Volkov, Mikhail - Ekaterinburg, Russian Federation; Watson, Bruce - University of Pretoria; Stellenbosch University, South Africa; Yen, Hsu-Chun - Taipei, Taiwan. STEERING COMMITTEE Jean-Marc Champarnaud - France Markus Holzer - Germany Oscar Ibarra - USA Denis Maurel - France Kai T. Salomaa - Canada (Chair) Hsu-Chun Yen - Taiwan ORGANIZING COMMITTEE Rose Daurie (Saint Mary's University) Stavros Konstantinidis (Saint Mary's University) Casey Meijer (Saint Mary's University) TBA CONTACT Email: ciaa13 at cs.smu.ca Postal address: CIAA 2013 Department of Mathematics and Computing Science Saint Mary's University Halifax, Nova Scotia B3H 3C3, CANADA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:11:53 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:11:53 +0100 Subject: Revue: Texto ! Textes et cultures Message-ID: Date: Mon, 12 Nov 2012 21:56:17 +0100 From: Carine Duteil-Mougel Message-Id: <0C56FE5C-EC23-4AC7-A30B-A5A934DFADCF at ensil.unilim.fr> X-url: http://www.revue-texto.net/ Bonjour, La revue "Texto ! Textes et Cultures" publie son nouveau num?ro coordonn? par Audrey MOUTAT. Vous trouverez ci-apr?s le sommaire du num?ro (cliquable). L'int?gralit? des documents (articles et fichiers sonores - Colloque de Cerisy) est consultable sur : www.revue-texto.net Bonne lecture et bonne ?coute ! Bien cordialement, Carine Duteil-Mougel ///// Volume XVII - n?4 (2012). Coordonn? par Audrey MOUTAT ABLALI D., BADIR S., DUCARD D., RASTIER F. Documents, Textes, Oeuvres Introduction au Colloque de Cerisy (6 au 13 juillet 2012) Parutions et tr?sors ALI BELGHANEM S?mantique du discours scientifique de Pierre Bourdieu Construction et classification d'un corpus de travail Dits et in?dits SIMON BOUQUET Un ?clairage n?osaussurien de la notion de ? sens ouvert ? D?un po?me d?Yves Bonnefoy ? un koan du bouddhisme Tch?an Dits et in?dits CHRISTOPHE CUSIMANO Figement de s?quences d?fig?es Un commerce devenu in?quitable Rep?res pour l'?tude EDOUARD JOLLY Mythe et technique. Autour de Cassirer La Lettre et l'interpr?te > LES CLASSIQUES TERESA OROZCO Pr?sentation g?n?rale du livre Platonische Gewalt de Teresa Orozco. Le philosophe en sa caverne. Parutions et tr?sors FRAN?OIS RASTIER Vattimo et les mains sales de Heidegger Dialogues et d?bats FRAN?OIS RASTIER Des documents aux oeuvres Colloque de Cerisy (6 au 13 juillet 2012) Parutions et tr?sors FRAN?OIS RASTIER Cl?ture du colloque Colloque de Cerisy (6 au 13 juillet 2012) Parutions et tr?sors MATTHIEU REMY L'apr?s-guerre formaliste du roman r?actionnaire: les d?buts litt?raires d'Alain Robbe-Grillet Arts du langage PASCAL VAILLANT S?miotique Support de cours Rep?res pour l'?tude ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:14:24 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:14:24 +0100 Subject: Appel: Numero non-thematique TAL 54-1 Message-ID: Date: Tue, 13 Nov 2012 08:29:36 +0900 From: Yves Lepage Message-Id: X-url: http://www.atala.org/Numero-non-thematique,612 Deuxi?me appel ? communications pour le num?ro non th?matique Volume 54, Num?ro 1, 2013 de la revue Traitement automatique des langues (TAL) http://www.atala.org/Numero-non-thematique,612 [English version below the French version] Direction : ?ric de la Clergerie, B?atrice Daille, Yves Lepage et Jean-Luc Minel. Date limite de soumission : 10/12/2012 TH?MES La revue Traitement automatique des langues lance un appel ? contributions ouvert. Des propositions de soumissions sont encourag?es sur tous les aspects du traitement automatique des langues, y compris (mais non exclusivement) : - pragmatique, discours, s?mantique, syntaxe et lexique ; - phon?tique, phonologie et morphologie ; - analyse et g?n?ration du langage parl? et ?crit ; - mod?les logiques, symboliques et statistiques du langage ; - extraction d?information et fouille de donn?es textuelles ; - traitement multilingue, traduction automatique et aides ? la traduction ; - interfaces en langue naturelle et syst?mes de dialogue ; - interfaces multi-modales ? composantes linguistiques ; - outils et ressources linguistiques ; - ?valuation de syst?mes ; - terminologie, acquisition de connaissances ? partir de textes ; - recherche documentaire ; - linguistique de corpus ; - utilisation d?outils de TAL pour la mod?lisation linguistique ; - enseignement assist?, enseignement des langues ; - applications du TAL. Il est bien s?r important, quel que soit le th?me, que les aspects li?s au traitement automatique des langues soient mis en valeur. LANGUE Les articles sont ?crits en fran?ais ou en anglais. Les soumissions en anglais ne sont accept?es que pour les auteurs non francophones. LA REVUE La revue TAL (Traitement Automatique des Langues) est une revue internationale ?dit?e depuis 1960 par l?ATALA (Association pour le Traitement Automatique des Langues) avec le concours du CNRS. Elle est maintenant publi?e en format ?lectronique, avec acc?s gratuit imm?diat aux articles publi?s, et impression annuelle ? la demande. Cela ne change aucunement son processus de relecture et de s?lection. DATES IMPORTANTES 01/12/2012 Date limite pour les r?sum?s 10/12/2012 Date limite de soumission 15/02/2013 D?cision du comit? 31/03/2013 Version r?vis?e Automne 2013 Publication FORMAT Les chercheurs ayant l?intention de soumettre une contribution sont invit?s ? prendre contact avec : Yves Lepage [yves.lepage ? waseda.jp] (IPS, Universit? Waseda, Japon) Les articles (25 pages environ, format PDF) doivent ?tre d?pos?s sur la plateforme [http://tal-54-1.sciencesconf.org/] Les feuilles de style sont disponibles en ligne sur le site de la revue. ---------------------------------------------------------------------------------------------------------- Regular issue 2012 Volume 54 Number 1. http://www.atala.org/Regular-issue,613 Direction : ?ric de la Clergerie, B?atrice Daille, Yves Lepage et Jean-Luc Minel. Deadline : December 10th 2012 THEMES The TAL journal launches a call for papers for an open issue of the journal. We invite papers in any field of natural language processing, including: - lexicon, syntax, semantics, discourse and pragmatics; - morphology, phonology and phonetics; - spoken and written language analysis and generation; - logical, symbolic and statistical models of language; - information extraction and text mining; - multilingual processing, machine translation and translation tools; - natural language interfaces and dialogue systems; - multimodal interfaces with language components; - language tools and resources; - system evaluation; - terminology, knowledge acquisition from texts; - information retrieval; - corpus linguistics; - use of NLP tools for linguistic modeling; - computer assisted language learning; - applications of natural language processing. Whatever the topic, papers must stress the natural language processing aspects. LANGUAGE Manuscripts may be submitted in English or French. French-speaking authors are requested to submit in French. THE JOURNAL TAL (Traitement Automatique des Langues / Natural Language Processing) is a forty year old international journal published by ATALA (French Association for Natural Language Processing) with the support of CNRS (National Centre for Scientific Research). It has moved to an electronic mode of publication, with printing on demand. This affects in no way its reviewing and selection process. IMPORTANT DATES 01/12/2012 Deadline for summary 10/12/2012 Deadline for submission 15/02/2013 Notification to authors 15/03/2013 Deadline for submission of revised version Fall 2013 Publication PAPER SUBMISSION Authors who intend to submit a paper are encouraged to contact the chief editors of the journal: Yves Lepage [yves.lepage at waseda.jp] (IPS, Waseda university, Japon) Papers (approximately 25 pages, PDF format) should be uploaded at [http://tal-54-1.sciencesconf.org/] Style sheets are available for download on the Web site of the journal [http://www.atala.org/Regular-issue,613]. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:19:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:19:18 +0100 Subject: Conf: Consortium Corpus Ecrits, 23 et 24 novembre 2012, Paris Message-ID: Date: Tue, 13 Nov 2012 16:48:42 +0100 From: V?ronique Brisset-Fontana Message-ID: <50A26BDA.1060907 at ling.cnrs.fr> Ch?res Coll?gues, ChersColl?gues, Le consortium ? Corpus ?crits ? (Corpus-IR) organise sa r?union pl?ni?re annuelle _*le vendredi 23 novembre 2012*_, de 9h30 ? 18h,au Campus des Cordeliers (15,rue de l'Ecole de M?decine, 75006, Paris). Cette r?union sera consacr?e ? la *pr?sentation des activit?s des diff?rents groupes de travail du consortium* : 1. Usage des corpus et droits d'auteurs ou d'?diteurs (aspects juridiques) 2. Corpus d'?tats anciens de la langue (num?risation, codage) 3. Num?risation (OCR, saisie), correction 4. Pluralit? de syst?mes d'?criture 5. Corpus multilingues (parall?les, comparables...) 6. Description de corpus collaborative - m?tadonn?es 7. Corpus d'?crits modernes et prise en compte de nouveaux modes de communication (SMS, mail, blog, etc.) 8. Annotation de plus haut niveau : syntaxe, s?mantique, r?f?rence (annotations collaboratives) 9. Annotation de surface : segmentation lexicale, description morphosyntaxique, chunking, lemmatisation, entit?s nomm?es, etc. 10. Exploration de corpus (m?thodes, outils) 11. Qualit? scientifique et accessibilit? des corpus (place des corpus dans l'?valuation de la production scientifique des UR) Chaque pr?sentation sera suivie d'une discussion d'une vingtaine de minutes. Cette journ?e, tr?s importante pour l'avanc?e de la r?flexion commune sur les corpus ?crits, sera suivie, le lendemain, _*samedi 24 novembre*_, d'une *journ?e d'information et d'?changes sur les aspects juridiques de la propri?t? et de l'archivage des corpus*, dont le programme sera communiqu? tr?s prochainement. *La participation de toutes les personnes int?ress?es par ces journ?es est vivement encourag?e par le comit? de pilotage**, **qu'elles soient ou non inscrites ? un groupe de travail. * Si la participation ? ces journ?es est libre, *l'inscription est obligatoire*. Vous trouverez en pi?ce jointe le *formulaire d'inscription *? retourner *au plus tard le 21 novembre 2012* au secr?tariat de l'Institut de Linguistique Fran?aise, institution gestionnaire du Consortium, qui, le cas ?ch?ant, prendra contact avec vouspour organiser votre mission. Le consortium contribuera au financement des missions des participants actifs des groupes de travail.** Au plaisir devous accueillir nombreux les *23 et 24 novembre prochains*. *Pour le comit? de pilotage du Consortium ? Corpus ?crits ? * *Franck Neveu, Directeurde l'ILF* *Le comit? depilotage duConsortium? Corpus ?crits ? : * ** *Franck Neveu *pour l'ILF,FR 2393 --*Porteur du consortium* *Sylvie Archaimbault* (suppl?ant *BernardColombat*) pour HTL - UMR7597 - Universit? Denis Diderot - Paris 7 *Benoit Sagot *pour ALPAGE -- INRIA-Universit? Denis Diderot - Paris 7 *SergeHeiden *pour ICAR- UMR 5191 - Universit? Lumi?re Lyon 2 *Damon Mayaffre* (Suppl?ante *Mah? Ben Hamed* )pour BCL - UMR6039 - Universit? Nice Sophia Antipolis *Jean-MariePierrel* pour l'ATILF - UMR 7118 -- Nancy - Universit? *Cl?ment Plancq* (suppl?ant *Olivier Bonami*) pour le LLF - UMR7110 - Universit? Denis Diderot- Paris 7 *C?line Poudat *pour le LDI - UMR 7187-- Universit? de Paris 13 *Catherine Schnedecker* (suppl?ante *Amalia Todirascu*) pour LILPA - EA1339 - Universit? de Strasbourg *Agn?s Tutin* (suppl?ante *Marie-Paule Jacques*) pour le LIDILEM - EA 609 -- Universit? Grenoble 3 V?ronique BRISSET-FONTANA Secr?taire g?n?rale F?d?rations de Linguistique FR 2559 - www.typologie.cnrs.fr FR 2393 - www.ilf.cnrs.fr T?l. 01 43 13 56 45 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:22:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:22:16 +0100 Subject: These: Anthony Sigogne, Integration de ressources lexicales riches dans un analyseur syntaxique (dans le cadre du Seminaire INFOLINGU, Universite Paris-Est) Message-ID: Date: Wed, 14 Nov 2012 09:33:14 +0100 From: Myriam RAKHO Message-ID: ************************************************************************ INFOLINGU Le s?minaire de l'?quipe Informatique Linguistique du Laboratoire d'Informatique de l'Institut Gaspard Monge (LIGM) Universit? Paris-Est Marne-la-Vall?e Date :* Le lundi 3 d?cembre 2012 ? 11h* Lieu : Universit? Paris-Est Marne-la-Vall?e B?timent Copernic, 4?me ?tage, salle de s?minaires 4B08R Toute personne int?ress?e est la bienvenue ************************************************************************ *** INTERVENANT *** *Anthony SIGOGNE, Universit? Paris-Est Marne-la-Vall?e* *** TITRE *** Int?gration de ressources lexicales riches dans un analyseur syntaxique (soutenance de th?se) *** JURY *** Directeur de th?se : ?ric Laporte, Professeur, Universit? Marne-la-Vall?e Rapporteur : Alexis Nasr, Professeur, Universit? Aix-Marseille 2 Rapporteur : Thierry Poibeau, Directeur de Recherche, ENS Paris Examinateur : Matthieu Constant, Ma?tre de Conf?rences, Universit? Marne-la-Vall?e Examinateur : Djam? Seddah, Ma?tre de Conf?rences, Universit? Paris 4 Examinateur : Isabelle Tellier, Professeur, Universit? Paris 3 *** R?SUM? *** Cette th?se porte sur l'int?gration de ressources lexicales et syntaxiques du fran?ais dans deux t?ches fondamentales du Traitement Automatique des Langues (TAL) que sont l'?tiquetage morpho-syntaxique probabiliste et l'analyse syntaxique probabiliste. Dans le cadre du fran?ais, nous disposons d'une multitude de donn?es lexicales et syntaxiques cr??es par des processus automatiques ou par des linguistes. De plus, un certain nombre d'exp?riences ont montr? l'int?r?t d'utiliser de telles ressources dans les processus probabilistes comme l'?tiquetage ou l'analyse, car elles sont capables d'am?liorer significativement les performances des syst?mes. Dans ce m?moire, nous utilisons ces ressources afin de donner une r?ponse ? deux probl?matiques que nous d?crivons succintement ci-dessous : la dispersion des donn?es et la segmentation automatique des textes. Gr?ce ? des algorithmes d'analyse syntaxique de plus en plus ?volu?s, les performances actuelles des analyseurs sont de plus en plus ?lev?es, et ce pour de nombreuses langues dont le fran?ais. Cependant, il existe plusieurs probl?mes inh?rents aux formalismes math?matiques permettant de mod?liser statistiquement cette t?che (grammaire, mod?les discriminants, ...). La dispersion des donn?es est l'un de ces probl?mes, et est caus?e principalement par la faible taille des corpus annot?s disponibles pour la langue. La dispersion repr?sente la difficult? d'estimer la probabilit? de ph?nom?nes syntaxiques apparaissant dans les textes ? analyser mais qui sont rares ou absents du corpus ayant servi ? l'apprentissage des analyseurs. De plus, il est prouv? que la dispersion est en partie un probl?me lexical, car plus la flexion d'une langue est importante, moins les ph?nom?nes lexicaux sont repr?sent?s dans les corpus annot?s. Notre premi?re probl?matique repose donc sur l'at?nuation de l'effet n?gatif de la dispersion lexicale des donn?es sur les performances des analyseurs. Dans cette optique, nous nous sommes int?ress? ? uen m?thhode appel?e regroupement lexical, et qui consiste ? regrouper les mots du corpus et des textes en classes. Ces classes r?duisent le nombre de mots inconnus et donc le nombre de ph?nom?nes syntaxiques rares ou inconnus, li?s au lexique, des textes ? analyser. Notre objectif est donc de proposer des regroupements lexicaux ? partir d'informations tir?es des lexiques syntaxiques du fran?ais, et d'observer leur impact sur les performances d'analyseurs syntaxiques. ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:32:31 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:32:31 +0100 Subject: Conf: III Symposium International multilinguisme / cyberespace, 21-23 Novembre/er 2012, Paris Message-ID: Date: Wed, 14 Nov 2012 12:02:57 +0100 From: Joseph Mariani Message-ID: <50A37A61.8090603 at limsi.fr> X-url: http://www.maaya.org Veuillez nous excuser si vous recevez ce message plus d'une fois / We apologize if you receive this message more than once / Disculpe si recibe este mensaje m?s de una vez III Symposium international sur le multilinguisme dans le cyberespace - III SIMC III ISMC - III International Symposium on multilingualism on cyberspace Program Maaya - R?seau mondial pour la diversit? linguistique - World Network for Linguistic Diversity Programme 21-23 Novembre/er 2012 CNRS - 3, rue Michel-Ange - Paris 16e - France Formulaire de pr?-enregistrement - Pre-registration form Contact - http://www.maaya.org Organis? par le R?seau mondial pour la diversit? linguistique - Maaya Organized by World Network for Linguistic Diversity - MAAYA Avec l'appui de / With the support of D?l?gation g?n?rale ? la langue fran?aise et aux langues de France (DGLFLF) Centre national de la recherche scientifique (CNRS) Institut des sciences de la communication du CNRS (ISCC) Institut des technologies multilingues et multim?dias de l'information (IMMI) Wikim?dia France Organisation internationale de la Francophonie Th?matiques Le multilinguisme, le cyberespace et: - la gouvernance et coop?ration internationale - l??ducation virtuelle - les technologies de la langue - le march? du travail Themes Multilingualism, cyberspace and: - International governance and co-operation - Virtual education - Languages technologies - Labour market Tables rondes sp?ciales - DILINET (mesurer la diversit? linguistique) - Net.lang: r?ussir le cyberespace multilingue - Vers un Sommet mondial sur le Multilinguisme - Contenus multilingues et participation collective: le cas de Wikip?dia Special round tables - DILINET (measuring linguistic diversity in cyberspace) - Net.lang: towards a multilingual cyberspace - Towards a World Summit - Multilingual content and collective participation: the case of Wikipedia En coordination avec la Conf?rence internationale : Communication et mondialisation. Les limites du tout-anglais. In coordination with the International Conference : Communication and Globalization : the Limits of an English-Only Policy * Maaya +33 (0)9 77 19 54 94 http://wwww.maaya.org contact at maayajo.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:34:53 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:34:53 +0100 Subject: Livre: Analyser les discours institutionnels Message-ID: Date: Wed, 14 Nov 2012 12:54:17 +0100 From: Alice Krieg-Planque Message-ID: <50A38669.5040907 at club-internet.fr> X-url: http://www.armand-colin.com/livre/426753/analyser-les-discours-institutionnels.php - - - parution - - - parution - - - parution - - - parution - - - auteur : Alice KRIEG-PLANQUE titre : Analyser les discours institutionnels ?ditions Armand Colin 238 pages 17,60 euros parution : 31 octobre 2012 ISBN : 978-2200278625 http://www.armand-colin.com/livre/426753/analyser-les-discours-institutionnels.php Quatri?me de couverture : Analyser des discours ?manant de partis politiques, d'associations, d'organisations publiques ou priv?es demande des comp?tences, des concepts et des m?thodes pr?cises et solides. Dans cet ouvrage, l'auteure expose les cat?gories d'analyse utiles qu'elle illustre ? l'aide de nombreux exemples, ?clairant les enjeux politiques et sociaux contemporains des d?clarations politiques, textes journalistiques, documents administratifs, prises de parole publiques, supports de communication... Au fil des chapitres, l'?tudiant apprend ainsi ? poser un regard sp?cifique sur les textes et les ?nonc?s pour rep?rer diff?rents types d'implicites (pr?suppos?s, sous-entendus...), identifier les ?quivoques d'un discours (ph?nom?nes de flou et d'ambigu?t?), ou encore saisir les st?r?otypes langagiers (slogans, formules, phras?ologie...). Ce livre s'adresse en particulier aux ?tudiants des diff?rentes sciences humaines et sociales qui ont besoin d'appr?hender la dimension discursive des objets sur lesquels ils travaillent. Alice KRIEG-PLANQUE est docteure en sciences du langage, ma?tresse de conf?rences en sciences de l'information et de la communication ? l'Universit? Paris-Est Cr?teil (UPEC), et membre du C?ditec (EA 3119). Elle a publi? plusieurs ouvrages dans le domaine de l'analyse des discours politiques, m?diatiques et institutionnels. - - - parution - - - parution - - - parution - - - parution - - - ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:36:20 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:36:20 +0100 Subject: Job: CDD Ingenieur TAL, CEA LIST Message-ID: Date: Wed, 14 Nov 2012 16:36:18 +0100 From: Romaric Besan?on Message-ID: <50A3BA72.8000408 at cea.fr> Proposition de CDD au CEA LIST Sujet: Classification et clustering de textes Type de poste: CDD 8 ? 12 mois Lieu de travail: CEA LIST Nano-Innov, Palaiseau (91) Contexte Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ing?nierie des Contenus) travaille sur l'analyse de contenus multim?dias (analyse de textes, images et vid?os, perception 3D). Dans le domaine de l'analyse de texte, le CEA LIST recherche un CDD ing?nieur ou docteur pour travailler sur des techniques de classification et clustering de textes dans un cadre multilingue. Objectifs A partir de document textuels provenant de plusieurs sources (par exemple des d?p?ches d'actualit?), pouvant ?tre de langues diff?rentes, l'application vis?e a pour but de regrouper automatiquement les d?p?ches traitant des m?mes sujets. Ce regroupement sera dans un premier temps fond? sur des mesures standard de similarit? textuelle (repr?sentation vectorielle s'appuyant sur une analyse linguistique des textes), mais des mesures de similarit?s plus s?mantiques, s'appuyant en particulier sur la notion de s?mantique distributionnelle, seront ?galement test?es. Pour le clustering proprement dit, plusieurs algorithmes seront envisag?s (clustering hi?rarchique, Shared Nearest Neighbors, Markov Clustering...), mais les algorithmes d?velopp?s devront ?tre suffisamment robustes pour travailler ? large ?chelle. La t?che du CDD consistera donc en particulier ? : - ?tudier et tester les algorithmes de clustering de documents sur des corpus de diff?rentes langues ; - travailler sur la mise au point d'un espace de repr?sentation des documents commun pour des documents de langues diff?rentes, fond? sur un alignement des lexiques bilingues pour construire des clusters mutlilingues ; - ?valuer les diff?rentes solutions sur des corpus de r?f?rence ; Profil recherch?: - Comp?tences en traitement automatique des langues / recherche d'information / mesures de similarit? textuelle - Connaissances des techniques de clustering / classification - Comp?tences informatiques: C/C++, scripts (perl,python...) R?mun?ration selon formation. Les candidats int?ress?s doivent envoyer un email de candidature ? romaric.besancon at cea.fr avec un CV d?taill? (pdf) et une lettre de motivation. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 14 18:42:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 14 Nov 2012 19:42:39 +0100 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Wed, 14 Nov 2012 19:29:12 +0100 From: ELRA ELDA Information Message-ID: <50A3E2F8.80702 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1177 Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** ELRA is happy to announce that 1 new Speech Desktop/Microphone Resource is now available in its catalogue. *ELRA-S0347 GlobalPhone Hausa* The GlobalPhone Hausa corpus contains 7,895 utterances spoken by 33 male and 69 female speakers in the age range of 16 to 60 years. Native speakers of Hausa were asked to read prompted sentences of newspaper articles. The entire collection took place in 5 different locations in Cameroon. The speech data contains a variety of accents: Maroua, Douala, Yaound?, Bafoussam, Ngaound?r?, and Nigeria. For more information, see: http://catalog.elra.info/product_info.php?products_id=1177 The GlobalPhone corpus developed in collaboration with the Karlsruhe Institute of Technology (KIT) was designed to provide read speech data for the development and evaluation of large continuous speech recognition systems in the most widespread languages of the world, and to provide a uniform, multilingual speech and text database for language independent and language adaptive speech recognition as well as for language identification tasks. The corpus now consists of 20 languages: Arabic (ELRA-S0192), Bulgarian (ELRA-S0319), Chinese-Mandarin (ELRA-S0193), Chinese-Shanghai (ELRA-S0194), Croatian (ELRA-S0195), Czech (ELRA-S0196), French (ELRA-S0197), German (ELRA-S0198), Hausa (ELRA-S0347), Japanese (ELRA-S0199), Korean (ELRA-S0200), Polish (ELRA-S0320), Portuguese (Brazilian) (ELRA-S0201), Russian (ELRA-S0202), Spanish (Latin America) (ELRA-S0203), Swedish (ELRA-S0204), Tamil (ELRA-S0205), Thai (ELRA-S0321), Turkish (ELRA-S0206), Vietnamese (ELRA-S0322). Until 31 December 2012, the complete set of 20 languages is available under the same conditions as the previous set of 19 languages. For more information on the catalogue, please contact Val?rie Mapelli mapelli at elda.org Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 19:54:22 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 20:54:22 +0100 Subject: Journee: Aspects juridiques lies aux corpus, 24 novembre 2012, Paris Message-ID: Date: Thu, 15 Nov 2012 11:49:24 +0100 From: Secretariat General Message-ID: <50A4C8B4.4020306 at ling.cnrs.fr> X-url: http://www.ilf.cnrs.fr/spip.php%3Frubrique97.html Co-organis?e par les consortia Corpus ?crits, IRCOM et CAHIER ** *Journ?e d'information et d'?changes * *sur les aspects juridiques * *li?s ? la constitution et ? la diffusion des corpus*** ** *24 novembre 2012* ** *Campus des Cordeliers* 15, rue de l'Ecole de M?decine 75006 Paris M?tro Od?on Programme ** ** *10 h -- 11 h 30*Droits de l'auteur scientifique vs droits de l'?diteur commercial Pr?sentation : Sylvie Archaimbault (Corpus ?crits) R?pondant : Marie Cornu, CECOJI. *11 h 30- 13 h*L'utilisation de documents dans la constitution de corpus diffus?s Pr?sentation : Denise Pierrot (CAHIER) R?pondant : Marie Cornu, CECOJI. *D?jeuner sur place* *14 h 30 -- 16 h*Les droits de la personne film?e ou enregistr?e Pr?sentation : Gabriel Bergounioux (IRCOM) R?pondant : Nathalie Mallet-Poujol, UMR Dynamique du droit. Cette journ?e d'information et d'?changes part d'un constat : de nombreuses difficult?s, d'ordre juridique,sefont jour dans l'?laboration et la mise ? disposition de la communaut? des corpus auxquels participent les chercheurs. Celles-ci peuvent, dans certains cas de blocage, aboutir ? une interdiction de communication ? un public large de corpus constitu?s dans un cadre de recherche. Les probl?mes auxquels nous sommes confront?s sont vari?s, ils peuvent concerner l'?dition de travaux appuy?s sur des r?sultats d'utilisation de corpus, la mise en ligne d'articles d?j? publi?s chez un ?diteur, par l'auteur lui-m?me, ou en republication par un autre ?diteur, des retranscriptions d'exp?riences impliquant des relationsconfidentielles,l'enregistrement de personnes physiques... Face ? ces difficult?s, les chercheurs sont bien souvent d?munis et ne trouvent pas l'aide dont ils auraient besoin pour sortir des situations de blocage. Cette journ?e se donne pour objectif de travailler sur quelques cas repr?sentatifs de ces difficult?s d'ordre juridique, de faire converger des retours d'exp?rience et de faire ?merger des solutions qui pourront ?tre partag?es. Si vous souhaitez ?voquer une situation particuli?re ? laquelle vous avez ?t? ou vous ?tes confront?s, vous ?tes invit?s ? l'indiquer d?s maintenant. Des interventions de 5 minutes seront m?nag?es au titre de retour d'exp?rience, ce pour chacun des points ?voqu?s. Envoyer ? : archaimb at linguist.jussieu.fr Denise.Pierrot at ens-lyon.fr ________________________________________________________________________ Par ailleurs, nous vous rappelons que la participation ? cette journ?e est libre, mais que *la pr?-inscription est obligatoire*. Merci de vous inscrire avec le formulaire joint ou disponible sur le site : http://www.ilf.cnrs.fr/spip.php%3Frubrique97.html Votre formulaire d'inscription doit ?tre adress? ? : * secretariat.ilf at ling.cnrs.fr * ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:22:38 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:22:38 +0100 Subject: Job: offre de mission de traduction fran=?ISO-8859-1?Q?=E7ais_?=> anglais, Red-on-line Message-ID: Date: Thu, 15 Nov 2012 15:39:58 +0000 From: Veronique Duong Message-ID: <9085291F556D1F40ABB44EFFA0E3B559647ACDA3 at ad-mail.info.local> X-url: http://www.red-on-line.net/ Actuellement, notre soci?t? Red-on-line, sp?cialis?e en veille r?glementaire et ?valuation de conformit? HSE, recherche un ou une ?tudiante pour effectuer la traduction d?une fiche juridique / technique du fran?ais vers l?anglais. La fiche fait 45 pages, et est ? traduire pour le lundi 26 novembre 2012. Requis : Niveau anglais : courant / bilingue / langue maternelle Gratification : 400? - 500? V?ronique Duong Ing?nieure linguiste charg?e de veille r?glementaire HSE www.red-on-line.net Immeuble Antony Parc 2 - 10, Place du G?n?ral de Gaulle BP 20156 / 92 186 ANTONY Cedex Tel : +33 (0)1 77 92 94 52 | Fax : +33 (0)1 77 92 98 59 Email : vduong at red-on-line.net ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:31:06 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:31:06 +0100 Subject: Job: Postdoc en informatique linguistique (TALN), Homme ou Femme Message-ID: Date: Thu, 15 Nov 2012 18:08:57 +0100 From: St?phane Le Roy Message-ID: <01ed01cdc353$e78caaf0$b6a600d0$@gmail.com> X-url: http://www.affinity-engine.fr/ L?entreprise aAffinity Engine (http://www.affinity-engine.fr/) d?veloppe et commercialise des moteurs de recommandation bas?s sur le langage naturel. Dans le cadre de son programme de recherche et d?veloppement programm? sur plusieurs ann?es, nous recrutons en CDI un/une jeune docteur en Traitement Automatique du Langage Naturel (TALN). Missions Poursuivant des travaux d?j? initi?s, sa mission consistera ? faire ?voluer l?existant mais aussi ? concevoir et r?aliser de nouveaux modules du moteur de recommandation multilingue. L?environnement technique est bas? sur le langage Java et diff?rentes technologies open source cloud ready. Dans une premi?re phase, il prendra en charge la r?alisation d?une chaine de traitement du langage naturel mettant notamment en ?uvre l'extraction d?entit?s nomm?es, la d?tection de la tonalit? (sentiment analysis), la recherche de synonymes et la traduction. La deuxi?me phase s?attachera au perfectionnement des diff?rents composants de la chaine afin d?am?liorer sa pertinence globale. La troisi?me phase consistera en l?ouverture de la chaine de traitement ? des documents ne contenant pas d?information textuelle. La personne recrut?e sera accueillie au sein de notre soci?t? et encadr?e directement par le directeur technique (ing?nieur en d?veloppement informatique + MBA) qui a con?u la premi?re architecture, et de mani?re secondaire par le directeur g?n?ral (ing?nieur + MBA) avec une exp?rience dans l'utilisation du datamining. Elle sera ?galement en contact r?gulier avec un cabinet sp?cialis? dans l'analyse du langage naturel. Profil Titulaire d?un doctorat en traitement du langage ; la/le candidat devra justifi? : - de son souhait de travailler pour une jeune entreprise priv?e, - de sa capacit? ? encadrer de futurs collaborateurs, - de sa bonne ma?trise de la programmation Java. Le poste est ? pourvoir ? Vannes (56) autant que possible mais aussi possiblement en r?gion parisienne. Salaire ? n?gocier. Postuler Merci d?envoyer votre candidature par email ? stephane at affinity-engine.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:36:02 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:36:02 +0100 Subject: These: Emeline Lecuit, Les tribulations d'un nom propre en traduction Message-ID: Date: Thu, 15 Nov 2012 18:13:06 +0100 (CET) From: Emeline Lecuit Message-ID: <1058190665.11145129.1352999586686.JavaMail.root at mail10> Bonjour, J'ai le plaisir de vous inviter ? ma soutenance de th?se, qui aura lieu le vendredi 30 novembre ? partir de 9h dans la salle des actes (salle 203), au deuxi?me ?tage du b?timent Tanneurs de l'Universit? Fran?ois Rabelais de Tours (au 3 rue des Tanneurs). A l'issue de la soutenance se tiendra un pot, auquel vous ?tes bien s?r convi?. Le sujet de ma th?se est: "Les tribulations d'un nom propre en traduction. Etude contrastive du nom propre et de sa traduction ? partir d'un corpus align? de dix langues europ?ennes." R?sum?: Les noms propres sont omnipr?sents et int?ressent, depuis des si?cles, philosophes et linguistes. Le travail r?alis? ici est une ?tude contrastive des noms propres en traduction, divis?e en quatre parties. Les deux premi?res parties sont th?oriques. La premi?re partie traite de la notion de nom propre en linguistique anglaise et en linguistique fran?aise. La deuxi?me partie pr?sente les diff?rents proc?d?s de traduction, illustr?s par des exemples sur les noms propres. Les deux parties suivantes sont exp?rimentales. La troisi?me partie d?taille les diff?rentes ?tapes de la constitution de notre corpus multilingue parall?le align? et annot?, compos? de onze versions du roman de Jules Verne, Le Tour du Monde en quatre-vingts jours, en dix langues europ?ennes. La quatri?me partie expose les r?sultats obtenus suite ? l?observation du comportement des noms propres en traduction. Cette ?tude contredit souvent l?hypoth?se largement r?pandue de leur intraduisibilit?. Mots-cl?s : noms propres, traduction, corpus multilingue parall?le align?, annotation, alignement Mon jury sera compos? de: M. Jean-Michel Fournier, Professeur des universit?s, Universit? Fran?ois-Rabelais de Tours (examinateur) M. Christopher Gledhill, Professeur des universit?s, Universit? Paris Diderot (rapporteur) M. Denis Jamet, Professeur des universit?s, Universit? Jean Moulin Lyon 3 (examinateur) M. Denis Maurel, Professeur des universit?s, Universit? Fran?ois-Rabelais de Tours (co-directeur) M. Dusko Vitas, Professeur des universit?s, Universit? de Belgrade (Serbie) (co-directeur) M. Geoffrey Williams, Professeur des universit?s, Universit? Bretagne-Sud (rapporteur) Cordialement, Emeline LECUIT Laboratoire Lig?rien de Linguistique UMR CNRS 7270 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:40:23 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:40:23 +0100 Subject: Appel: Atelier SOS'2013, Sources Ouvertes et Services, EGC'2013 Message-ID: Date: Fri, 16 Nov 2012 09:43:17 +0100 From: Laurie Serrano Message-ID: X-url: http://weblab-project.org/workshop/sos2013 *Merci de diffuser cet appel ? communications le plus largement possible. Toutes nos excuses pour d'?ventuelles r?ceptions multiples.* *Quatri?me ?dition de l?atelier "Sources Ouvertes et Services"* *SOS?2013 (en association avec EGC?2013)* *29 janvier 2013 - Toulouse, France* http://weblab-project.org/workshop/sos2013 *Pr?sentation de l'atelier :* Pour sa quatri?me ?dition, l'atelier SOS'2013 propose de poursuivre une r?flexion commune autour des diverses probl?matiques li?es au traitement de donn?es disponibles en sources ouvertes (SO). Les SO d?signent l'ensemble des m?dias accessibles librement, de fa?on gratuite ou payante, tels qu'Internet, les bases de donn?es publiques, les journaux, les CD-ROM, les cha?nes de t?l?vision et de radio, etc., par opposition aux sources ferm?es dont la consultation n?cessite de disposer d'autorisations sp?cifiques. Ces SO fournissent d?importants volumes de donn?es multim?dia h?t?rog?nes (image, texte, audio, vid?o, etc.) qui n?cessitent des traitements adapt?s en vue de leur exploitation. Cet atelier est d?di? ? toutes ces ?tapes, partant de la phase de d?couverte des sources d?information, en passant par la collecte et l'analyse des donn?es collect?es jusqu?? la phase de capitalisation et d?exploitation des connaissances. Un int?r?t particulier sera port? aux choix architecturaux retenus pour la r?alisation d?applications exploitant les SO. En effet, ces applications tentent g?n?ralement de faire cohabiter plusieurs briques logicielles (COTS, logiciels open source, d?veloppements ad-hoc, etc.) en vue de la r?alisation d'une t?che particuli?re. Cela repr?sente un d?fi scientifique et technique auquel les recherches sur l?encha?nement des traitements algorithmiques capables d'exploiter ces donn?es peuvent contribuer. L?accent sera mis sur les architectures orient?es services (SOA) et sur l?utilisation des technologies du Web S?mantique. Pour cette nouvelle ?dition, l'atelier SOS souhaite s'int?resser ?galement au traitement des grandes masses de donn?es ("Big data"). L'explosion r?cente des donn?es disponibles sur le Web a fait ?merger de nouvelles probl?matiques visant ? adapter et optimiser toute la chaine de traitement de l'information face aux nouveaux volumes ? traiter. Cet atelier souhaite rassembler des chercheurs issus ? la fois des mondes acad?mique et industriel afin d'obtenir un panel repr?sentatif d'acteurs et de leurs travaux sur les th?mes pr?sent?s ci-apr?s. *Th?mes de l'atelier :* Les auteurs sont invit?s ? envoyer des propositions ayant une port?e th?orique, m?thodologique ou pratique, sur l?un des th?mes suivants (liste non exhaustive) : * Identification et d?couverte automatique de sources d?information, * Acc?s et collecte d?information ? partir de sources ouvertes (Web, r?seaux sociaux, flux RSS et autres), * Classification, filtrage des informations d'int?r?t, * Extraction d?information ? partir de textes non structur?s et/ou utilisant des vocabulaires sp?cifiques (blogs, langage sms, forums), * Extraction d?information ? partir de gros volumes de donn?es multim?dia (texte, image, vid?o, audio), * Analyse des sentiments/opinions dans les m?dias sociaux (r?seaux sociaux, blogs, forums), * Mod?lisation et capitalisation des connaissances extraites ? partir de sources ouvertes (ontologies, annotations s?mantiques), * Exploitation des connaissances extraites ? partir de sources ouvertes : raisonnement, aide ? la d?cision, visualisation, * D?tection de signaux faibles, * Evaluation et qualification des sources d?information, * Evaluation et qualification des informations extraites ? partir de sources ouvertes, * Inf?rence, fouille et validation de liens entre donn?es, * Plate-formes d?int?gration de services de traitement h?t?rog?nes : interop?rabilit? des services, orchestration s?mantique, * Applications de veille strat?gique ou ?conomique ? partir de sources ouvertes, * Applications de renseignement d?origine sources ouvertes (ROSO), * Applications de traitement de l'information orient?es "Big data". *Comit? de programme :* Florence Amardeilh (Mondeca) Ga?l de Chalendar (CEA LIST) Olivier Corby (INRIA, Sophia Antipolis) Valentina Dragos (ONERA) Adil El Ghali (IBM) Christian Fluhr (GEOL Semantics) Bruno Grilheres (Cassidian) Dafni Stampouli (Cassidian) Nicolas Hernandez (Universit? de Nantes) Alexandre Pauchet (LITIS, Rouen) Ha?fa Zargayouna (LIPN, Universit? de Paris 13) Maroua Bouzid (GREYC, Universit? de Caen) Cassia Trojahn (IRIT, Toulouse) Klaus Atzenbeck (IISYS, Hof University, Germany) Sinan Yurtsever (Atos, Turkey) Nizar Ghoula (Universit? de Gen?ve, Switzerland) *Dates importantes :* * Date limite de soumission : *30 Novembre 2012* * Notification aux auteurs : 21 D?cembre 2012 * Version finale : 2 Janvier 2013 * Date de l'atelier : 29 Janvier 2013 *Soumission :* Cet atelier invite les auteurs ? soumettre leurs articles en fran?ais ou en anglais (r?sum? en anglais souhait? dans les deux cas). Les articles soumis ne devront pas d?passer 12 pages (annexes comprises). Nous vous demandons de respecter les instructions des organisateurs de EGC'2013 et d'utiliser la derni?re version du format RNTI disponible ? l'adresse suivante : http://www.antsearch.univ-tours.fr/rnti Chaque proposition sera ?valu?e par au moins deux membres du comit? de programme. Les communications retenues feront l?objet d?une pr?sentation orale par l'un des auteurs (en fran?ais ou en anglais ? leur convenance). La journ?e commencera par une pr?sentation d?un conf?rencier invit? sur l'un des th?mes de l?atelier et s?ach?vera par une table ronde autour des probl?matiques li?es ? l?exploitation des sources ouvertes. *Les articles doivent ?tre envoy?s ? l'adresse suivante : sos2013 at weblab-project.org* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 20:52:42 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 21:52:42 +0100 Subject: Appel: Coria 2013 et RJCRI 2013 Message-ID: Date: Fri, 16 Nov 2012 15:20:05 +0100 From: Catherine Berrut Message-Id: <2DF5586E-5335-4D1A-9303-1805C2EEA9CA at imag.fr> X-url: http://coria.unine.ch X-url: http://coria.unine.ch/rjcri.htm CORIA 2013, Neuch?tel (Suisse), du 3 au 5 Avril 2013 CORIA 2013 (http://coria.unine.ch) est la dixi?me ?dition de la COnf?rence en Recherche d'Information et Applications. Organis?e avec le support de l'ARIA (Association francophone de Recherche d'Information et Applications, http://www.asso-aria.org), elle est la principale manifestation francophone dans ce domaine. CORIA a pour but de rassembler les ?quipes et les chercheurs menant des travaux scientifiques dans le domaine de la recherche d'informations : recherche d'information sur le web, extraction d'information au sein de documents multim?dia, analyse d'opinion ou de r?seaux sociaux, contextes monolingue ou multilingue, recherche de documents num?riques et d'images, apprentissage et classification automatiques, interfaces homme-machine pour l'acc?s ? l'information, etc. CORIA se veut largement ouverte ? l'ensemble de la communaut? scientifique concern?e par la Recherche d'Information. Apr?s s'?tre tenue ? Toulouse, Grenoble, Lyon, Saint-?tienne, Lannion, Toulon, Sousse (Tunisie, en partenariat avec CIFED), Avignon, Bordeaux (en partenariat avec CIFED), CORIA aura lieu cette ann?e du 3 avril au 5 avril 2013 ? Neuch?tel (Suisse). L'activit? scientifique en recherche d'information conna?t une ?volution forte depuis la g?n?ralisation du web et, plus r?cemment, le d?veloppement de l'informatique nomade. Les limites du domaine sont elles-m?mes en mutation et favorisent les synergies avec les travaux en apprentissage automatique, traitement automatique des langues, traitement de l'image, traitement de la parole, communication ?crite et documents, syst?mes d'information et bases de donn?es, repr?sentation et gestion des connaissances... Les domaines d'application sont vastes et peuvent ?tre appliqu?s au web dans sa globalit? ou restreints par exemple ? des biblioth?ques num?riques ou des r?seaux sociaux. Le public vis? par CORIA 2013 est celui des universitaires et chercheurs - confirm?s ou non -, des industriels et des sp?cialistes du domaine et des ?tudiants en Master se dirigeant vers les m?tiers de la Recherche. Les soumissions peuvent ?tre faites en anglais ou en fran?ais. Les contributions peuvent concerner des travaux acad?miques ou des applications industrielles. Le programme pr?voit deux conf?rences invit?es, l'une de Jamie Callan (CMU), la seconde de Donna Harman (NIST). Ces deux conf?renciers feront par ailleurs un cours d?di?s aux doctorants lors d'un s?minaire du CUSO, le mardi 2 avril 2013 (le jour pr?c?dant la conf?rence). Pendant la conf?rence CORIA 2013 seront ?galement organis?es les 8e Rencontres Jeunes Chercheurs en Recherche d'Information (RJCRI). Elles ont pour objectif de permettre ? tous les doctorants de pr?senter leur probl?matique de recherche, d'?tablir des contacts avec des ?quipes travaillant sur des domaines similaires ou connexes, et d'offrir ? l'ensemble de la communaut? un aper?u des axes de recherche actuels. Les travaux s?lectionn?s pour les RJCRI donneront lieu ? une pr?sentation orale et sous forme de poster. Cette ann?e, les soumissions conjointes RJCRI et CORIA sont autoris?es (voir modalit?s dans RJCRI http://coria.unine.ch/rjcri.htm ) Th?matiques (liste non exhaustive) - Th?orie et mod?les formels pour la RI : mod?le logique, mod?les de langages - Multilinguisme : Recherche d'information multilingue, traduction automatique - Multim?dia (images, audio, vid?os, son, musique) : indexation, navigation, acc?s, interactions avec le texte - Passage ? l'?chelle : indexation, performances, architectures - Classification automatique, clustering, ranking, apprentissage automatique - Filtrage, routage, d?tection de nouveaut?s - Mod?lisation du contexte, personalisation - Traitement Automatique de la Langue Naturelle pour la recherche d'information - Syst?mes de Questions R?ponses - Extraction d'informations : ontologies, ressources et recherche d'informations, d?tection d'entit?s nomm?es - Web : grands graphes, utilisation de la topologie du web, lois de puissances, citations, analyse de liens - RI et documents structur?s : RI et XML, RI pr?cise et recherche de passages - R?seaux sociaux : analyse de blogs et de sites communautaires, suivi de conversations, analyse de rumeurs, analyse de sentiments, d?tection d'opinion - Recherche collaborative : filtrage, syst?mes de recommandation - Interaction utilisateur : interrogation flexible, interfaces, visualisation, mod?lisation de l'utilisateur, accessibilit?, indexation collaborative - Traitement et repr?sentation des connaissances : logique floue, m?ta-donn?es, ontologies, web s?mantique, ing?nierie des connaissances - Biblioth?ques num?riques : RI sur des livres num?ris?s, robustesse, OCR et indexabilit? - Syst?mes de recherche d'information d?di?s : recherche d'information g?nomique, g?ographique - RI distribu?e : recherche d'information mobile, situ?e, P2P - Outils pour la recherche d'information : ?valuation, bancs d'essais, m?triques, exp?rimentations qualitatives des syst?mes Dates importantes La soumission des articles se fera en deux ?tapes : d'abord la soumission d'un r?sum? et ensuite la soumission de l'article. Le calendrier de soumission est le m?me pour CORIA et les RJCRI : - Date limite de soumission des r?sum?s : 01/12/2012 - Date limite de soumission des articles : 07/12/2012 - R?ponse aux auteurs : 01/02/2013 - Date limite de soumission de la version finale : 22/02/2013 Site de d?p?t des articles de Coria : https://www.easychair.org/conferences/?conf=coria2013 Site de d?p?t des articles de RJCRI : https://www.easychair.org/conferences/?conf=rjcri2013 Format des articles - Les soumissions peuvent ?tre faites en anglais ou en fran?ais. - Les contributions peuvent concerner des travaux acad?miques ou des applications industrielles. - Les textes de communications doivent comporter 16 pages maximum au format des revues Hermes. Ils doivent ?tre pr?c?d?s d'une page de garde comportant le titre, les noms et coordonn?es pr?cises des auteurs, une liste de mots cl? en fran?ais et en anglais, un r?sum? d'une vingtaine de lignes au maximum. La mention ? article soumis ? CORIA et RJCRI ? doit ?tre port?e sur la page de garde le cas ?ch?ant. - Les articles peuvent ?tre ?crits en Word ou en LaTeX. - Le format des articles Word et LaTeX peut ?tre t?l?charg? sur le site Hermes. - Les articles d?pos?s doivent ?tre au format PDF exclusivement. Modalit?s RJCRI : voir http://coria.unine.ch/rjcri.htm Catherine Berrut, Professeur Universit? Joseph Fourier Laboratoire LIG et Polytech Grenoble BP 53 - 38041 Grenoble cedex 9 tel : 04 76 51 42 63 mail : catherine.berrut at imag.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 16 21:25:22 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 16 Nov 2012 22:25:22 +0100 Subject: Appel: WIMS'13 Message-ID: Date: Fri, 16 Nov 2012 18:26:53 +0100 From: Planti? Michel Message-ID: <50A6775D.4070704 at mines-ales.fr> X-url: http://aida.ii.uam.es/wims13/ (Apologies for cross-posting!) CALL FOR PAPERS International Conference on Web Intelligence, Mining and Semantics (WIMS'13) June 12-14, 2013 Madrid, Spain http://aida.ii.uam.es/wims13/ About WIMS'13: The 3rd International Conference on Web Intelligence, Mining and Semantics (WIMS'13) will be organised under the auspices of Autonomous University of Madrid, Spain. The WIMS series of conferences concerned with intelligent approaches to transform the World Wide Web into a global reasoning and semantics-driven computing machine. The conference will provide an excellent international forum for sharing knowledge and results in theory, methodology and applications of Web intelligence, Web mining and Web semantics. The purpose of the WIMS'13 is: - To provide a forum for established researchers and practitioners to present past and current research contributing to the state of the art of Web technology research and applications. - To give doctoral students an opportunity to present their research to a friendly and knowledgeable audience and receive valuable feedback. - To provide an informal social event where Web technology researchers and practitioners can meet. Conference Venue: The conference will be hosted by Autonomous University of Madrid. Confirmed Keynote Speakers: - Prof. Amit Sheth (Physical Cyber Social Computing: An early 21st century approach to - Computing for Human Experience), - Dr. Jason J. Jung (Contextual Synchronization on Social Collaboration) - Prof. Asunci?n G?mez-P?rez (TBA). Call for Papers/Tutorials/Posters/Industrial Track/Workshop proposals: http://aida.ii.uam.es/wims13/cfp.php Publication: Accepted papers/tutorials/posters will be published by ACM and disseminated through the ACM Digital Library. Selected extended papers will be invited to appear in a special issues of reputed journals in the field and also in a book published by Elsevier. Important Dates Tutorial and Workshop proposals due: November 30, 2012 Notification of workshop acceptance: December 8, 2013 Electronic submission of research papers: December 23, 2012 Electronic submission of poster papers: December 23, 2012 Notifications of tutorial acceptance: January 10, 2013 Notification of paper/poster acceptance: February 17, 2013 Registration opens: February 18, 2013 Camera-ready of accepted papers/tutorials: March 4, 2013 Deadline for paper submissions for workshops: February 7, 2013 Acceptance of papers for workshops: March 10, 2013 Camera ready workshop papers: March 30, 2013 Author registration deadline: March 30, 2013 Conference: 12-14 June,2013 Contact: David Camacho Escuela Polit?cnica Superior Universidad Aut?noma de Madrid Francisco Tom?s y Valiente, 11 , 28049, Madrid , Spain Tel/Fax: +34 91 497 51 00 E-mail:wims13 at uam.es ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:34:34 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:34:34 +0100 Subject: Job: postes d'annotateurs en francais, anglais, arabe a pourvoir (Val de Reuil / Paris), ELDA Message-ID: Date: Mon, 19 Nov 2012 12:43:56 +0100 From: ELRA ELDA Information Message-ID: <50AA1B7C.4070904 at elda.org> X-url: http://www.elda.org/rubrique284.html X-url: http://www.elda.org/rubrique287.html X-url: http://www.elda.org/rubrique286.html X-url: http://www.elda.org/rubrique103.html ELDA (www.elda.org) (Evaluation and Language resources Distribution Agency, www.elda.org) a pour activit?s principales la distribution et la production de ressources linguistiques, ainsi que l'?valuation de technologies de la langue. Dans le cadre de ses activit?s de production, ELDA offre plusieurs postes d'annotateur (H/F) ? mi-temps, ? Paris et ? Val de Reuil, dans le cadre d'un projet d'analyse automatique de documents ?crits. Ces documents doivent ?tre annot?s en langue fran?aise, anglaise et arabe. Veuillez consulter les 3 annonces ci-dessous pour d?terminer le poste auquel vous souhaitez postuler : - Postes d'annotateur en langue fran?aise/anglaise/arabe (H/F) ? Val de Rueil (27) (http://www.elda.org/rubrique284.html) - Postes d'annotateur en langue arabe (H/F) ? Val de Rueil (27) (http://www.elda.org/rubrique287.html) - Postes d'annotateur en langue fran?aise/anglaise/arabe (H/F) ? Paris (75013) (http://www.elda.org/rubrique286.html) Toutes les candidatures sont ? adresser ? Ma?lis Bodin (bodin at elda.org) avec Matthieu Carr? (carre at elda.org) en cc:. *Jobs @ ELDA (http://www.elda.org/rubrique103.html)* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:37:13 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:37:13 +0100 Subject: Revue: TAL, Varia TAL 53-1 Message-ID: Date: Mon, 19 Nov 2012 16:53:11 +0100 From: Jean-Luc Minel Message-ID: <50AA55E7.50302 at u-paris10.fr> X-url: http://www.atala.org/-Volume-53- Nous avons le plaisir de vous annoncer la mise en ligne du num?ro 53-1 de la revue TAL ? l'adresse : http://www.atala.org/-Volume-53- En vous souhaitant une bonne lecture. Le comit? de r?daction de la revue TAL ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:41:53 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:41:53 +0100 Subject: Job: Stage conventionn=?ISO-8859-1?Q?=E9_?=R&D TAL - RI - fouille de donnees Message-ID: Date: Tue, 20 Nov 2012 15:27:47 +0100 From: Estelle Delpech Message-ID: <50AB9363.8090408 at nomao.com> X-url: http://www.nomao.com *Stage conventionn? R&D M2* /Mots-cl?s : Web, recherche d'information, fouille de donn?es, traitement automatique des langues, apprentissage automatique/ *Objet du stage* Nomao est une start-up web innovante bas?e ? Toulouse qui con?oit et d?veloppe une application mobile et un site web permettant aux gens de trouver, garder et ?changer des bonnes adresses entre amis (restaurants, bars, shopping, m?decin...). Dans le cadre de son d?veloppement, Nomao recherche des stagiaires R&D de niveau M2 Informatique ou Sciences du Language avec une sp?cialisation en Traitement Automatique des Langues. Les sujets de stage ? pourvoir touchent des domaines vari?s tels que : recherche d'information g?olocalis?e, data mining, syst?mes de recommandation, traitement automatique des langues. *Profil recherch?* L'?tudiant/e devra avoir des comp?tences en d?veloppement logiciel et un int?r?t pour le Web, la fouille de donn?es ou traitement automatique des langues. La connaissance de Python et d'une langue ?trang?re sera un plus. *D?roulement du stage* La personne recrut?e sera accueillie dans les locaux de Nomao ? Toulouse et sera int?gr?e ? l'?quipe R&D. Le stage est conventionn? et sera indemnis? selon le profil (? partir de 436,05EUR/mois + tickets restaurants). *Contact* Merci d'envoyer CV et lettre de motivation ?Estelle Delpech, estelle at nomao.com (responsable R&D) *Estelle DELPECH* - LinkedIn (http://fr.linkedin.com/in/edelpech) - Viadeo (http://www.viadeo.com/invitation/e.d1) Responsable R&D et contenu estelle at nomao.com skype:edlingua +33 562 483 390 Nomao's website: Nomao (http://www.nomao.com) 1 Avenue Jean Rieux 31500 Toulouse France ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:43:54 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:43:54 +0100 Subject: Habilitation: Matthieu Constant, Mettre les expressions multi-mots au coeur du TAL Message-ID: Date: Tue, 20 Nov 2012 16:17:12 +0100 From: Matthieu Constant Message-ID: <50AB9EF8.5010907 at univ-mlv.fr> Chers coll?gues, J'ai le plaisir de vous inviter ? ma soutenance d'HDR le 3 d?cembre prochain, ? 14h30, ? l'Universit? Paris-Est Marne-la-Vall?e. Elle se d?roulera au Laboratoire d'Informatique Gaspard-Monge (LIGM), dans la salle 4B08R, 4e ?tage, batiment Copernic. Pour acc?der au LIGM, vous pouvez suivre le lien suivant: http://igm.univ-mlv.fr/LIGM/address_and_access/ Bien cordialement, Matthieu Constant Universit? Paris-Est Marne-la-Vall?e ****************************************************** Titre: Mettre les expressions multi-mots au coeur du Traitement Automatique des Langues - sur l'exploitation de ressources lexicales R?sum?: Durant cette soutenance, nous nous attacherons ? retracer les diff?rents travaux de recherche que nous avons men?s depuis plus de 10 ans. L'un de nos objectifs principaux a ?t? d'am?liorer la finesse linguistique de diff?rentes t?ches du TAL en prenant en compte les expressions multi-mots. En particulier, notre id?e directrice a ?t? d'exploiter des ressources lexicales riches et de les coupler ? diff?rents mod?les probabilistes ou diff?rentes proc?dures hybrides. Nos travaux peuvent se d?couper en trois axes. Le premier axe porte sur l'?tiquetage morphosyntaxique et l'analyse syntaxique. L'int?gration de la reconnaissance des expressions multi-mots dans telles t?ches a essentiellement consist? ? adapter divers mod?les probabilistes d?di?s ? ces t?ches. Comme ces expressions sont, par d?finition, difficilement pr?dictibles, l'exploitation de ressources lexicales est primordiale pour leur reconnaissance. Nous avons donc ?t? amen? ? trouver des strat?gies d'int?gration de ressources symboliques externes dans nos mod?les. Le deuxi?me axe consiste ? int?grer la reconnaissance d'expressions multi-mots dans des applications. Nous avons, en particulier, d?velopp? des applications li?es au monde priv? (extraction d'informations, classification) ou li?es au monde acad?mique (aide ? la construction de lexiques bilingues ou ? des ?tudes linguistiques). Dans tous les cas, nous nous sommes bas? sur des pr?traitements fins aliment?s par des ressources lexicales riches. Le troisi?me axe concerne la construction de ressources linguistiques. En effet, le d?veloppement des outils d?crits ci-dessus n'est possible que gr?ce ? l'existence de ressources (corpus annot?s ou lexiques). Or, les ressources autour des expressions multi-mots manquent cruellement ou sont incompl?tes. Pour toutes les ressources d?velopp?es, nous avons men? des ?tudes linguistiques fines et syst?matiques. Nous avons ?galement mis en place un outillage informatique pour les g?rer et les appliquer ? des textes. Jury: Prof. B?atrice Daille (Universit? de Nantes) [examinatrice] Prof. Laurence Danlos (Universit? Paris 7) [examinatrice] Prof. C?drick Fairon (Universit? catholique de Louvain) [examinateur] Prof. Eric Laporte (Universidade Federal do Esp?rito Santo) [examinateur] Prof. Alexis Nasr (Universit? Aix-Marseille) [rapporteur] Prof. Eric Wehrli (Universit? de Gen?ve) [rapporteur] Prof. Fran?ois Yvon (Universit? Paris-Sud) [rapporteur] ************************************************************* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:57:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:57:08 +0100 Subject: Appel: TOTh 2013 Message-ID: Date: Tue, 20 Nov 2012 16:23:03 +0100 From: Luc Damas Message-ID: X-url: http://www.porphyre.org/toth/toth-2013/appel-a-communications X-url: http://www.porphyre.org/toth/toth-2013-en/call-for-papers TOTh 2013 : APPEL A COMMUNICATIONS Terminologie & Ontologie : Th?ories et applications Chamb?ry ? France Conf?rence : 6 et 7 juin 2013 Formation : 4 et 5 juin 2013 http://www.porphyre.org/toth/ http://www.porphyre.org/toth/toth-2013/appel-a-communications http://www.porphyre.org/toth/files/TOTh-2013-appel-a-communications.pdf Dates importantes : ------------------------- 14 janvier 2013 : Date limite de soumission 4 mars 2013 : Notification d?acceptation 6 mai 2013 : Version d?finitive Soumission par EasyChair : ----------------------------------- Les soumissions d'articles (articles complets) se font exclusivement par EasyChair : http://www.easychair.org/conferences/?conf=toth2013 Pr?sentation : ------------------ En rapprochant terminologie et ontologie, les conf?rences TOTh mettent l?accent sur les apports mutuels de ces deux disciplines et sur de nouvelles perspectives de d?veloppement tant th?oriques que pratiques. La terminologie s?int?resse aux d?nominations des concepts et des objets dans un domaine pr?cis, mais aussi aux unit?s telles que les collocations, les combinaisons lexicales ou les phras?ologies en usage, qui font partie des vocabulaires, des discours et des langues de sp?cialit?. D?un point de vue m?thodologique, le terminologue d?veloppe des pratiques qui visent la conception et la cr?ation de ressources terminologiques utiles ? toute fin langagi?re : traduction, am?nagement, lexicographie, enseignement des langues ? des fins sp?cifiques, etc. La qualit? et la rigueur des discours de sp?cialit? ?tant directement d?pendantes de la relation entre l?organisation lexicale et l?organisation des connaissances, une r?flexion conjointe entre les terminologues, traducteurs, lexicographes, ing?nieurs des connaissances et informaticiens s?impose. La terminologie et l?ontologie partagent des objectifs similaires dans leur compr?hension et la description de la r?alit?. Les ontologies issues de l?ing?nierie des connaissances constituent aujourd?hui une des voies les plus prometteuses pour la mod?lisation du syst?me conceptuel des terminologies. Au c?ur de nombreuses applications du monde num?rique, les ontologies permettent l?op?rationnalisation des terminologies et leur utilisation ? diff?rentes fins : aide ? la traduction, gestion et traitement de l?information, gestion des connaissances et de contenus multilingues, web s?mantique, etc. Par nature transdisciplinaires, la terminologie et l?ontologie mobilisent des pratiques et des th?ories qui rel?vent de nombreuses disciplines dont principalement la linguistique, les langues de sp?cialit?, l??pist?mologie, l?ing?nierie des connaissances et les sciences de l?information. Publics & Disciplines : ---------------------------- Les conf?rences TOTh visent ? rassembler chercheurs, enseignants, formateurs, utilisateurs et industriels dont les pr?occupations rel?vent ? la fois de la terminologie et de l?ontologie, et de fa?on plus g?n?rale de la langue et de l?ing?nierie des connaissances. Elles se veulent un lieu d??change et de partage o? sont expos?s probl?mes, solutions et retours d?exp?riences tant sur le plan th?orique qu?applicatif ainsi que les nouvelles tendances et perspectives des disciplines associ?es : terminologie, langues de sp?cialit?, linguistique, intelligence artificielle, ing?nierie des connaissances, syst?mes d?information, ing?nierie collaborative, sciences de l?information, documentation, etc. Prix ? Jeune chercheur ? : -------------------------------- Depuis 2011 un prix ? Jeune chercheur ? est d?cern? par le comit? de programme lors de la conf?rence. Th?mes de la Conf?rence (liste non exhaustive) : -------------------------------------------------------------- Approches linguistiques : - langues de sp?cialit?, traduction, lexicographie de sp?cialit?, am?nagement linguistique et terminologique, communication de sp?cialit?, - multilinguisme, traduction, - th?ories du texte et des discours, s?mantique lexicale, - usages, variations, collocations terminologiques, phras?ologie, - produits terminologiques, lexiques, dictionnaires, th?saurus, - traitement de corpus : extraction de termes, extraction de connaissances, constitution et alignement de corpus, - construction et maintenance de ressources terminologiques, harmonisation des termes, harmonisation des concepts, normalisation, importance et limite des corpus, - validation de la qualit? des donn?es, r?le des experts. Mod?lisation des connaissances : - principes terminologiques pour la construction des syst?mes notionnels et conceptuels, - repr?sentation et gestion des connaissances : acquisition, mod?lisation des concepts, - ontologies : construction, ?valuation (qualit?), maintenance, alignement, fusion, - thesaurus mono- et multilingues, gestion documentaire, - apport de l?intelligence artificielle, de la linguistique, de l??pist?mologie, des syst?mes formels (logique des descriptions par exemple), - normes, formats d??changes. Applications : - environnements logiciels : construction et maintenance de terminologies, th?saurus, dictionnaires, ontologies, - les applications informatiques ? base de connaissances et de ressources terminologiques : aide ? la traduction, gestion de contenus mono- et multilingues, web s?mantique, recherche d?information, classification, gestion des connaissances, syst?mes d?information, etc. - partage de donn?es (linked data, open data), - biblioth?ques num?riques, - ?valuation des outils d?acquisition et de manipulation, ?volution des normes et standards dans le domaine des ressources linguistiques et ontologiques, terminom?trie. http://www.porphyre.org/toth/ http://www.porphyre.org/toth/toth-2013/appel-a-communications http://www.porphyre.org/toth/files/TOTh-2013-appel-a-communications.pdf ------------------------------------------------------------------------ TOTh 2013: CALL FOR PAPERS Terminology & Ontology: Theories and applications Chamb?ry ? France Conference: 6 and 7 June 2013 Training: 4 and 5 June 2013 http://www.porphyre.org/toth/ http://www.porphyre.org/toth/toth-2013-en/call-for-papers http://www.porphyre.org/toth/files/TOTh-2013-Call-for-papers.pdf DEADLINES: ------------------------------- 14 January 2013: Deadline for submitting 4 March March 2013: Notification of acceptance 6 May 2013: Final version Paper submission via Easychair: ----------------------------------------- http://www.easychair.org/conferences/?conf=toth2013 Presentation: ------------------ The TOTh conferences aim to bridge the gap between terminology and ontology by highlighting the contributions that one makes to the other and by opening up new perspectives for both theoretical and practical developments. Terminology is about names for concepts and objects in a given subject area, but it is also concerned with other units such as collocations, lexical combinations or phraseologies in actual use, all of which are part of specialized languages and discourse. The terminologist?s job is to design and produce terminological resources which can be used for a variety of language-based activities : translation, corpus language planning, teaching language for special purposes, etc. The quality and the precision of specialised discourse is directly linked to the relation between the way lexical items are ordered and the way knowledge is organised: sufficient encouragement in itself for active collaboration between terminologists, translators, lexicographers, knowledge engineers and IT specialists. Terminology and ontology share similar objectives in the way they approach and describe reality. Ontologies, which come from knowledge engineering, are now one of the most promising ways to model conceptual systems for terminologies. Of the numerous applications to be found in the digital world, ontologies are particularly useful to make terminologies operational and ensure their applications in various roles : as translation tools, for information and knowledge management, the semantic web, etc. Terminology and ontology are both basically transdisciplinary in approach, and both reach out to take on board practices and theories from many different subject fields, in particular from linguistics, language for special purposes, epistemology, artificial intelligence, information sciences. Target audience & Disciplines: --------------------------------------- The TOTh conferences aim to bring together all those involved in LSP, terminology and knowledge engineering and, more generally, all persons interested in issues related to language and knowledge. They are designed to be platforms of exchange and sharing where problems are outlined and solutions and feedback provided, for both theoretical and applied perspectives as well as for the new trends and perspectives of associated disciplines: terminology, languages for special purposes, linguistics, artificial intelligence, knowledge engineering, information systems, collaborative engineering, information sciences, documentation, etc. Young Researcher Prize: -------------------------------- Since 2011, a Young Researcher Prize is awarded by the Program committee and bestowed on the winner during the Conference. Conference topics (non exhaustive list): -------------------------------------------------- Linguistic approaches: - language for special purposes, translation, language and terminology planning, specialized multilingual communication, - usage, variation, term collocations, lexical combination, - terminological products: glossaries, dictionaries, thesauri, - corpus processing and natural language processing: text mining, extracting terms, extracting knowledge, corpus building, corpus aligning, - creating and maintaining terminological resources, harmonizing terms and concepts, importance and limitations of corpora, - theories of meaning, semantics, - validating the quality of data, the role of experts. Knowledge representation: - terminological principles for building conceptual systems, - ontology and knowledge representation: representation, building, maintaining, aligning, merging, - classification theory, - information retrieval, - mono- and multilingual thesauri, library science, records management, - input from artificial intelligence, linguistics, epistemology, formal systems (description logic for example). Applications: - software environments; building and maintaining terminologies, thesauri, dictionaries, ontologies, - IT applications based on knowledge and terminology resources: semantic web, computer aided translation, mono and multilingual content management systems, specialized digital libraries, information retrieval, classification, knowledge management, information systems, - assessing acquisition and manipulation tools, standards in the field of language and ontology resources. http://www.porphyre.org/toth/ http://www.porphyre.org/toth/toth-2013-en/call-for-papers <%22> http://www.porphyre.org/toth/files/TOTh-2013-Call-for-papers.pdf <%22> ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 20:59:53 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 21:59:53 +0100 Subject: Appel: FSMNLP 2013 Message-ID: Date: Tue, 20 Nov 2012 15:49:07 +0000 From: Mark-Jan Nederhof Message-ID: X-url: http://fsmnlp2013.cs.st-andrews.ac.uk/ First CALL FOR PAPERS Finite-State Methods and Natural Language Processing - FSMNLP 2013 11th International Conference University of St Andrews, Scotland (UK) July 15-17, 2013 http://fsmnlp2013.cs.st-andrews.ac.uk/ INTRODUCTION The international conference series Finite-State Methods and Natural Language Processing (FSMNLP) is the premier forum of the ACL Special Interest Group on Finite-State Methods (SIGFSM). It serves researchers and practitioners working on: * natural language processing (NLP) applications or language resources, * theoretical and implementational aspects, or * their combinations that have obvious relevance or an explicit relation to finite-state methods. KEYNOTE SPEAKER * Bill Byrne (University of Cambridge) TOPICS The conference invites papers related to themes including but not limited to: * NLP applications and linguistic aspects of finite-state methods * Finite-state models of language * Practices for building morphological models for the world's languages using finite-state technology * Machine learning of finite-state models of natural language * Finite-state manipulation software and tools with relevance to NLP IMPORTANT DATES * April 12, paper submission deadline * May 21, notification * June 15, camera-ready version SUBMISSIONS Papers should present original, unpublished research and implementation results. Simultaneous submission to other venues with published proceedings is prohibited. FSMNLP accepts two kinds of submissions: * long papers (8 pages including references) reporting completed, significant research, * short papers (4 pages including references) reporting ongoing work and partial results, implementations, grammars, practical tools, interactive software demos, etc. Short papers are expected to be presented as system demos in demo sessions, posters and/or short presentations, while long papers are presented in longer presentations. All submissions are electronic and in PDF format via a web-based submission server. Authors are strongly encouraged to use the latest ACL style (available for LaTeX and Word) in producing the PDF document. Awaiting availability of the 2013 style, the 2012 templates are available at: http://acl2012.org/call/sub01.asp Information about the author(s) and other identifying information such as obvious self-references (e.g., "We showed in [12] ...") and financial or personal acknowledgements should be omitted in the submitted papers whenever feasible. Papers will be submitted electronically in PDF using the EasyChair system. A paper may contain a clearly marked appendix and data files to support its claims. This material will not be published. While reviewers are urged to consult this extra material for better comprehension, it is at their discretion whether they do so. Such extra material should also be anonymized to the extent feasible. Use the following link for submission: https://www.easychair.org/conferences/?conf=fsmnlp2013 All accepted papers will be published in FSMNLP 2013 proceedings and archived in the ACL Anthology. The publication of selected, revised versions of accepted papers in a special journal issue is planned. PROGRAM COMMITTEE * I?aki Alegria (University of the Basque Country) * Jan Daciuk (Gda?sk University of Technology, Poland) * Frank Drewes (Ume? University, Sweden) * Dale Gerdemann (University of T?bingen, Germany) * Mike Hammond (University of Arizona, USA) * Colin de la Higuera (University of Nantes, France) * Mans Hulden (Ikerbasque, Basque Country) * Andr? Kempe (Cadege Technologies & Consulting, France) * Marco Kuhlmann (Uppsala University, Sweden) * Andreas Maletti (Universit?t Stuttgart, Germany) * Mark-Jan Nederhof (University of St Andrews, Scotland) * Kemal Oflazer (Sabanci University, Turkey) * Maite Oronoz Anchordoqui (University of the Basque Country) * Laurette Pretorius (University of South Africa) * Strahil Ristov (Rudjer Boskovic institute, Croatia) * Frederique Segond (Viseo Innovation, France) * Max Silberztein (Universit? de Franche-Comt?, France) * Richard Sproat (Oregon Health & Science University, USA) * Heiko Vogler (Technical University Dresden, Germany) * Anssi Yli-Jyr? (University of Helsinki, Finland) * Menno Van Zaanen (Tilburg University, Netherlands) * Lynette Van Zijl (Stellenbosch University, South Africa) ORGANIZING COMMITTEE * Per Ola Kristensson (University of St Andrews) * Mark-Jan Nederhof (University of St Andrews) * Vinodh Rajan Sampath (University of St Andrews) Further information about the conference is available at the website: http://fsmnlp2013.cs.st-andrews.ac.uk/ fsmnlp2013 at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 20 21:00:51 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 20 Nov 2012 22:00:51 +0100 Subject: Carnet: Deces de Emanuele Pianta Message-ID: Date: Tue, 20 Nov 2012 21:13:26 +0100 From: Thierry Hamon Message-ID: <87d2z86nix.fsf at smtp.univ-paris13.fr> Dear All, we are deeply saddened to inform you that Emanuele Pianta, head of CELCT and senior researcher at FBK, passed away yesterday, as a consequence of a serious car accident. Graduated in linguistics at the University of Padua, in 1993 Emanuele arrived at Fondazione Bruno Kessler and soon became one of the most brilliant and respected researchers in the field of language processing. Emanuele had the unique ability to combine his great expertise in the field of linguistics with the sensitivity to develop technologies applicable in real contexts of use. We remember him particularly for having started and coordinated the construction of MultiWordNet, the lexical database for the Italian language, and for coordinating the development of TextPro, the software for automatic analysis of written Italian. Since 2009 he had been the scientific director of CELCT, the Center for the Evaluation of Language and Communication Technologies, an office that he was still holding with success and passion. We also remember his love for teaching (at the University of Trento and Bolzano) and the many national and international collaborations which over the years he was able to build with passion and far-sightedness. A man of interdisciplinary culture, Emanuele was about to enthusiastically undertake a new scientific challenge in the field of Digital Humanities, where he was to lead a new research group. He leaves a wealth of knowledge and experience to CELCT, FBK and the whole scientific community, but also a great sense of void among those who have had the privilege to work with him. For all of us the loss of Emanuele is cause of immense grief and sadness beyond words. We?ll try to carry on his work, to pay tribute to Emanuele and all what he has achieved in his life. Our thoughts and prayers go to his family, colleagues and friends. Rachele Sprugnoli on behalf of CELCT and FBK ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 21 12:11:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 21 Nov 2012 13:11:25 +0100 Subject: Conf: Consortium Corpus Ecrits - Programme - 23 et 24 novembre 2012, Paris Message-ID: Date: Wed, 21 Nov 2012 12:27:07 +0100 From: V?ronique Brisset-Fontana Message-ID: <50ACBA8B.9030104 at ling.cnrs.fr> X-url: http://www.ilf.cnrs.fr/spip.php%3Frubrique97.html ------------------------------------------------------------------------ Consortium Corpus Ecrits */REUNION PL?NI?RE ANNUELLE/* *Vendredi 23 novembre 2012 de 9h00 ? 18h00* *Campus des Cordeliers - PARIS VI^e - Amphith??tre FARABEUF* */_09h00 - 09h30_/**//**/- Accueil-caf? (Salle Marie Curie)/* _09h30 - 09h45_- Introduction de Franck Neveu -- Directeur de la f?d?ration ILF _09h45 - 10h20_- Pr?sentation du groupe 1 /Usage des corpus et droits d'auteurs ou d'?diteurs (Aspects juridiques...)/ _10h20 - 10h55_- Pr?sentation du groupe 2 /Corpus d'?tat anciens de la langue (Num?risation, codage...)/ */_10h55 - 11h10_/**//**/- Pause __/* _11h10 - 11h45_- Pr?sentation du groupe 8 __ /Annotation du plus haut niveau : syntaxe, s?mantique, r?f?rence (Annotations collaboratives...)/ _11h45 - 12h20 - _Pr?sentation des groupes 3-4 /Num?risation (OCR, saisies, corrections...) et pluralit? de syst?mes d'?criture/ _12h20 - 12h55_- Pr?sentation du groupe 5 /Corpus multilingues (Parall?les, comparables ...)/ //*/_13h00 - 14h00_/**//**/- D?jeuner -- Buffet offert/* _14h00 - 14h35_- Pr?sentation du groupe 6 /Description de corpus collaborative -- M?tadonn?es/ _14h35 - 15h10_- Pr?sentation du groupe 7 /Corpus d'?crits modernes et prise en compte de nouveaux modes de communication (SMS,blog, courriel...)/ _15h10 - 15h45_- Pr?sentation du groupe 9 __ /Annotation de surface (Segmentation lexicale, description morphosyntaxique, chunking, lemmatisation, entit?s nomm?es...) / */_15h45 - 16h00_/**//**/- Pause __/* _16h00 - 16h45 - _Pr?sentation du groupe 10 /Exploration de corpus (M?thodes, outils...)/ _16h45 - 17h20 - _Pr?sentation du groupe 11 /Qualit? scientifique et accessibilit? des corpus (Place des corpus dans l'?valuation de la production scientifique des UR)/ _17h20 - 18h00 - _D?bats et cl?ture *----------------------------------------------------------------------* *Journ?e d'information et d'?changes sur les aspects juridiques * *li?s ? la constitution et ? la diffusion des corpus*** *Co-organis?e par les consortia Corpus ?crits, IRCOM et CAHIER* *Samedi 24 novembre 2012* *Campus des Cordeliers* 15, rue de l'Ecole de M?decine 75006 Paris M?tro Od?on Programme ** *10 h -- 11 h 30* Droits de l'auteur scientifique vs droits de l'?diteur commercial Pr?sentation : Sylvie Archaimbault (Corpus ?crits) R?pondant : Marie Cornu, CECOJI. *11 h 30- 13 h* L'utilisation de documents dans la constitution de corpus diffus?s Pr?sentation : Denise Pierrot (CAHIER) R?pondant : Marie Cornu, CECOJI. *D?jeuner sur place* *14 h 30 -- 16 h* Les droits de la personne film?e ou enregistr?e Pr?sentation : Gabriel Bergounioux (IRCOM) R?pondant : Nathalie Mallet-Poujol, UMR Dynamique du droit. Cette journ?e d'information et d'?changes part d'un constat : de nombreuses difficult?s, d'ordre juridique,sefont jour dans l'?laboration et la mise ? disposition de la communaut? des corpus auxquels participent les chercheurs. Celles-ci peuvent, dans certains cas de blocage, aboutir ? une interdiction de communication ? un public large de corpus constitu?s dans un cadre de recherche. Les probl?mes auxquels nous sommes confront?s sont vari?s, ils peuvent concerner l'?dition de travaux appuy?s sur des r?sultats d'utilisation de corpus, la mise en ligne d'articles d?j? publi?s chez un ?diteur, par l'auteur lui-m?me, ou en republication par un autre ?diteur, des retranscriptions d'exp?riences impliquant des relationsconfidentielles,l'enregistrement de personnes physiques... Face ? ces difficult?s, les chercheurs sont bien souvent d?munis et ne trouvent pas l'aide dont ils auraient besoin pour sortir des situations de blocage. Cette journ?e se donne pour objectif de travailler sur quelques cas repr?sentatifs de ces difficult?s d'ordre juridique, de faire converger des retours d'exp?rience et de faire ?merger des solutions qui pourront ?tre partag?es. Si vous souhaitez ?voquer une situation particuli?re ? laquelle vous avez ?t? ou vous ?tes confront?s, vous ?tes invit?s ? l'indiquer d?s maintenant. Des interventions de 5 minutes seront m?nag?es au titre de retour d'exp?rience, ce pour chacun des points ?voqu?s. Envoyer ? : archaimb at linguist.jussieu.fr Denise.Pierrot at ens-lyon.fr Par ailleurs, nous vous rappelons que la participation ? cette journ?e est libre, mais que *la pr?-inscription est obligatoire*. Merci de vous inscrire avec le formulaire joint ou disponible sur le site : http://www.ilf.cnrs.fr/spip.php%3Frubrique97.html Votre formulaire d'inscription doit ?tre adress? ? : *_secretariat.ilf at ling.cnrs.fr_* ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From zilles at CS.UREGINA.CA Wed Nov 21 16:56:44 2012 From: zilles at CS.UREGINA.CA (Sandra Zilles) Date: Wed, 21 Nov 2012 10:56:44 -0600 Subject: Call For Papers - Canadian AI Conference 2013 Message-ID: ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Apologies for cross-posting. Please distribute widely. ======================= Preliminary Call for Papers =========================== AI 2013: The 26th Canadian Conference on Artificial Intelligence May 28th to May 31st, 2013 Regina, Saskatchewan, Canada ================================================================================== IMPORTANT DATES --------------- Full paper submission deadline: January 21st, 2013 Notification of acceptance: February 25th, 2013 Final papers due: March 6th, 2013 Conference: May 28th to May 31st, 2013 CALL FOR PAPERS --------------- AI'2013, the twenty-sixth Canadian Conference on Artificial Intelligence, invites papers that present original work in all areas of Artificial intelligence, either theoretical or applied. Topics of interest include, but are not limited to: ? Agent Systems AI Applications Automated Reasoning Bioinformatics and BioNLP ? Case-based Reasoning ? Cognitive Models ? Constraint Satisfaction ? Data Mining ? E-Commerce ? Evolutionary Computation ? Games ? Information Retrieval ? Knowledge Representation ? Machine Learning ? Multi-media Processing ? Natural Language Processing ? Neural Nets ? Planning ? Robotics ? Search ? Smart Graphics ? Uncertainty ? User Modeling ? Web Applications Each paper will be reviewed by at least three Program Committee members according to its originality, technical merit and clarity of presentation. Accepted papers will be allocated either a maximum of 12 pages (long papers) or a maximum of 7 pages (short papers) in the proceedings. As in previous years, we plan to publish all accepted papers for which one of the authors will have registered and is present at the conference in the conference proceedings as Lecture Notes in Artificial Intelligence by Springer. The papers will have to be formatted accordingly. Papers submitted to AI'2013 must not have been accepted for publication elsewhere or be under review for another conference. BEST PAPER AWARD ---------------- The Best Paper Award will be presented at the conference to the authors of the best paper. SUBMISSIONS ----------- Authors are invited to submit electronically, by January 21st, 2013. Submissions must be uploaded on Easychair. Paper format: ? Papers must be written in English. ? Papers must be up to 12 pages in length. - Papers must be in PDF format. ? Papers must be formatted according to Springer LNCS style. The use of the LaTeX2e style file available from Springer is strongly encouraged. ORGANIZERS ---------- AI'2013 is collocated with two cognate conferences: the Canadian Graphical Interface Conference and the Canadian Conference on Computer and Robot Vision. General Co-chairs AI/GI/CRV: Cory Butz (University of Regina) Atefeh Farzindar (NLP Technologies Inc.) Program Co-chairs: Osmar Zaiane (University of Alberta) Sandra Zilles (University of Regina) Local Arrangement Chair: Orland Hoeber (University of Regina) Please mark the dates in your calendar. We hope to receive your submissions and see you at the conference. ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:15:30 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:15:30 +0100 Subject: Info: Questionnaire concernant les doctorants en CIFRE Message-ID: Date: Tue, 20 Nov 2012 22:46:51 +0100 From: AFTAL AFTAL Message-ID: X-url: http://tal.univ-paris3.fr/aftal X-url: https://docs.google.com/spreadsheet/viewform?formkey=dGNUc3RpTXBydW9CbkYzMTliN0gzZ2c6MQ L'AFTAL (http://tal.univ-paris3.fr/aftal), l'association des anciens des formations TAL de l'Universit? de Paris 3, organisera une session CIFRE pour les ?tudiants de Master 2 de la formation PluriTAL (Paris 3, Paris 10 et INaLCO). Nous aurions besoin de t?moignages d??tudiants actuellement/ayant fait leur th?se en CIFRE. Pourriez-vous diffuser le questionnaire se trouvant au lien ci-dessous aupr?s de vos ?tudiants ? https://docs.google.com/spreadsheet/viewform?formkey=dGNUc3RpTXBydW9CbkYzMTliN0gzZ2c6MQ Merci beaucoup par avance pour votre aide et n?h?sitez pas ? nous contacter ! Bien cordialement, L'?quipe AFTAL Web : http://tal.univ-paris3.fr/aftal/ Follow us on Twitter : http://twitter.com/AssoForTAL Fan-Page Facebook : http://www.facebook.com/AssoForTAL ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:23:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:23:25 +0100 Subject: Job: CORRECTION - postes d'annotateurs en francais, anglais, arabe a pourvoir (Val de Reuil / Paris), ELDA Message-ID: Date: Wed, 21 Nov 2012 10:00:00 +0100 From: ELRA ELDA Information Message-ID: <50AC9810.40802 at elda.org> X-url: http://www.elda.org/article284.html X-url: http://www.elda.org/article287.html X-url: http://www.elda.org/article286.html X-url: http://www.elda.org/rubrique103.html [suite ? erreur dans les liens html dans la versions pr?c?dente] ELDA (www.elda.org) (Evaluation and Language resources Distribution Agency,www.elda.org) a pour activit?s principales la distribution et la production de ressources linguistiques, ainsi que l'?valuation de technologies de la langue. Dans le cadre de ses activit?s de production, ELDA offre plusieurs postes d'annotateur (H/F) ? mi-temps, ? Paris et ? Val de Reuil, dans le cadre d'un projet d'analyse automatique de documents ?crits. Ces documents doivent ?tre annot?s en langue fran?aise, anglaise et arabe. Veuillez consulter les 3 annonces ci-dessous pour d?terminer le poste auquel vous souhaitez postuler : - Postes d'annotateur en langue fran?aise/anglaise/arabe (H/F) ? Val de Rueil (27) (http://www.elda.org/article284.html) - Postes d'annotateur en langue arabe (H/F) ? Val de Rueil (27) (http://www.elda.org/article287.html) - Postes d'annotateur en langue fran?aise/anglaise/arabe (H/F) ? Paris (75013) (http://www.elda.org/article286.html) Toutes les candidatures sont ? adresser ? Ma?lis Bodin (bodin at elda.org) avec Matthieu Carr? (carre at elda.org) en cc:. *Jobs @ ELDA (http://www.elda.org/rubrique103.html)* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:29:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:29:50 +0100 Subject: Journee: Journee d'etude sur l'annotation syntaxique de corpus oraux, 7 decembre 2012, Paris Message-ID: Date: Wed, 21 Nov 2012 11:04:46 +0100 From: Christophe Benzitoun Message-ID: <50ACA73E.6090508 at univ-nancy2.fr> *Annotation syntaxique de corpus oraux* *Projets r?cents et perspectives* Journ?e d'?tude Conscila (ENS Paris), Vendredi 7 d?cembre 2012 Programme /Session 1 -- Pr?sident de s?ance : Sylvain Kahane (Modyco & Paris X)/ ** *9h30 Le d?doublement du sujet dans le fran?ais parl? : Une ?tude de corpus avec la base de donn?es sgs* Aria Adli (Universit? de Strasbourg) *10h Analyse syntaxique en chunks nominaux d'un corpus oral ? l'aide de SEM, ?tiqueteur syntaxique du fran?ais* Yoann Dupont, Iris Eshkol-Taravella, Isabelle Tellier & Ilaine Wang (Lattice / LLL) *10h30 DisMo: A morphosyntactic annotator for spoken French* George Christodoulides & Iulia Grosman (UCLouvain, Institut Langage & Communication, Centre VALIBEL) /Pause / /Session 2 -- Pr?sidente de s?ance : Florence Lefeuvre (Syled & Paris 3)/ ** *11h20 Un corpus arbor? pour le fran?ais parl?: premiers r?sultats* Anne Abeill? (U. Paris Diderot, LLF, IUF), Beno?t Crabb? (U. Paris Diderot, Alpage) *11h50 Analyse Syntaxique du Fran?ais Parl? * Christophe Cerisara, Mathilde Dargnat & Claire Gardent (LORIA UMR 7503) /D?jeuner/ /Session 3 -- Pr?sidente de s?ance : Jeanne-Marie Debaisieux (Lattice & Paris 3)/ ** *14h15 Vers une red?finition de la notion de p?riph?rie gauche ? partir d'une annotation syntaxique et prosodique d'un corpus oral multigenres* Anne Catherine Simon, Liesbeth Degand, Noalig Tanguy & Thomas Van Damme (UCLouvain, Institut Langage & Communication, Centre VALIBEL) *14h45 Asym?trie et aspects dynamiques des structures (macro)syntaxique et prosodique de l'?nonc?* Philippe Martin (EA3967 Clillac-Arp / UFRL, Universit? Paris Diderot) *15h15 Syntactic properties of spontaneous speech in the LAcT framework. **The IPIC Data Base.* Emanuela Cresti & Massimo Moneglia LABLITA (Universit? di Firenze) /Pause/ /Session 4 -- Pr?sidente de s?ance : Paola Pietrandrea (Lattice & Roma 3)/ ** *16h15 L'annotation syntaxique est-elle pertinente pour am?liorer la reconnaissance automatique de la parole ?* Carole Lailler, Daniel Luzzati & Paul Del?glise (LIUM, Le Mans) *16h45 Rhapsodie : annotation micro- et macro-syntaxique d'un corpus de fran?ais parl?* Christophe Benzitoun, Anne Dister, Sylvain Kahane, Paola Pietrandrea & Noalig Tanguy (Atilf / Saint-Louis / Modyco / Lattice & Roma Tre / Lattice & Valibel) *17h15 Table ronde (fin : 18h)* ** *Organisation* Christophe Benzitoun -- ATILF CNRS & Universit? de Lorraine Noalig Tanguy -- Lattice UMR 8094 ENS/Paris 3 & Valibel / Universit? Catholique de Louvain *//* *Comit? scientifique* Fr?d?ric B?chet (Aix-Marseille Universit? / LIF UMR 7279) Marie-Jos? B?guelin (Universit? de Neuch?tel) Alain Berrendonner (Universit? de Fribourg) Mireille Bilger (Universit? de Perpignan) Sandrine Cadd?o (Aix-Marseille Universit? / Laboratoire Parole et Langage UMR 7309) Paul Cappeau (Universit? de Poitiers) Christophe Cerisara (Loria UMR 7503) Jeanne-Marie Debaisieux (Universit? Paris 3 Sorbonne Nouvelle / Lattice UMR 8094) Liesbeth Degand (Universit? catholique de Louvain / Valibel) Jos? Deulofeu (Aix-Marseille Universit? / LIF UMR 7279) Anne Dister (Facult?s universitaires Saint-Louis, Bruxelles) Iris Eshkol (Universit? d'Orl?ans / Laboratoire Lig?rien Linguistique UMR 7270) Fran?oise Gadet (Universit? Paris Ouest Nanterre La D?fense / Modyco UMR 7114) Kim Gerdes (Universit? Paris 3 Sorbonne Nouvelle / LPP / Institut d'Automation / Acad?mie de Sciences Chinoise) Eva Havu (Universit? de Helsinki) Sylvain Kahane (Universit? Paris Ouest Nanterre La D?fense / Modyco UMR 7114) Anne Lacheret (Universit? Paris Ouest Nanterre La D?fense / Modyco UMR 7114) Florence Lefeuvre (Universit? Paris 3 Sorbonne Nouvelle / Clesthia) Michel Pierrard (Universit? Libre de Bruxelles) Paola Pietrandrea (Universit? Roma Tre / Lattice UMR 8094) Thierry Poibeau (Lattice UMR 8094 ENS/Paris 3) Sophie Pr?vost (Lattice UMR 8094 ENS/Paris 3) Nathalie Rossi-Gensane (Universit? Toulouse 2 / CLLE ERSS UMR 5263) Fr?d?ric Sabio (Aix-Marseille Universit? / Laboratoire Parole et Langage UMR 7309) Catherine Schnedecker (Universit? de Strasbourg / Lilpa) Anne-Catherine Simon (Universit? catholique de Louvain / Valibel) Sandra Teston-Bonnard (Universit? de Lyon 2 / ICAR UMR 5191) V?ronique Traverso (ICAR UMR 5191) Dan Van Raemdonck (Universit? Libre de Bruxelles) Dominique Willems (Universit? de Gand) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:42:56 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:42:56 +0100 Subject: Job: Stage linguiste / terminologue / traducteur, Reverso Softissimo Message-ID: Date: Wed, 21 Nov 2012 12:43:20 +0100 From: "Juliette Mornet" Message-ID: <004001cdc7dd$6c7eedd0$457cc970$@softissimo.com> X-url: http://www.reverso.softissimo.com/ X-url: http://www.reverso.net/ Bonjour, Suite aux pr?c?dentes offres de stage diffus?es sur la liste LN, nous cherchons ? nouveau un ou plusieurs stagiaires du m?me profil. Stage linguiste / terminologue / traducteur Type de contrat : Stage de c?sure ou de fin d??tudes (minimum 4 mois) Lieu : Neuilly-sur-Seine Indemnit? de stage : Selon dur?e et exp?rience D?but : D?s que possible Avantages : Tickets restaurant et 50% transport ENTREPRISE Editeur de logiciels ? rayonnement international, Reverso-Softissimo est l?un des leaders mondiaux des solutions Intranet et Internet de traduction instantan?e et de dictionnaires ?lectroniques. Son portail grand public d?di? aux langues www.reverso.net g?n?re un tr?s fort trafic avec 200 millions de pages vues par mois et plus de 6 millions de visiteurs uniques. Reverso-Softissimo recherche un(e) linguiste pour participer aux travaux de production et de recherche de notre ?quipe linguistique dans un contexte professionnel motivant : haute technologie, forte croissance et d?veloppement international. Vous ?tes int?ress?(e) par notre domaine ? C?est le moment de rejoindre notre ?quipe ! MISSION Sous la direction du chef de projet linguistique, le stagiaire effectuera les missions suivantes : - cr?ation, mise ? jour, validation de dictionnaires bilingues ; - tests de la qualit? de traduction et r?daction de rapports d'analyse ; - recherche, ?valuation et analyse de ressources terminologiques ; - animation et d?veloppement de la communaut? d?utilisateurs du dictionnaire collaboratif. Cette liste n?est pas exhaustive et pourra ?tre amen?e ? ?voluer en fonction de l?implication du/de la stagiaire. PROFIL ?tudiant(e) en derni?re ann?e d?une ?cole ou d?une universit? en TAL, langues ?trang?res, linguistique, ing?nierie linguistique ou traduction, vous ma?trisez parfaitement l?anglais et le fran?ais ? l?oral comme ? l??crit, et id?alement une troisi?me langue. Vous avez des qualit?s r?dactionnelles ainsi qu?une grande rigueur, une bonne m?thodologie, un esprit logique et des capacit?s d?analyse et de synth?se ; votre sens de l?initiative, votre dynamisme et votre autonomie seront ?galement des qualit?s appr?ci?es dans le cadre de ce stage. Contact : Juliette MORNET 01.41.43.10.31 jmornet at reverso.com ------------------------------------------------------------------------ Internship for a linguist / terminologist / translator Contract: Year-off or end-of-course internship (4 months minimum) Place: Paris, France Traineeship allowance: Following duration and experience Beginning: As soon as possible Benefits: Meal tickets and 50% transport card THE COMPANY As an internationally recognized software publisher, Reverso-Softissimo is one of the world leaders in Intranet and Internet solutions for instant translation and electronic dictionaries. Reverso.net, its consumer portal dedicated to languages, drives a lot of traffic: 200 million page views a month and more than 6 million unique visitors! Reverso-Softissimo is looking for a linguist who would be involved in our linguistic team?s production and research work, in a very motivating professional environment; high technology, strong growth and international development. You are interested in our domain? It?s time for you to join our team! THE MISSION Under the direction of the linguistic project manager, the trainee will have the following missions: - creating, updating, validating bilingual dictionaries; - testing the quality of translations and writing analytical reports; - searching, assessing and analyzing terminological resources; - stimulating and developing the user community of the collaborative dictionary. The above list is not exhaustive and could evolve according to the trainee?s involvement. THE PROFILE You are a final-year student in a college or university specialized in NLP, foreign languages, linguistics, language engineering or translation; you have fluency in English and French both orally and in writing, and, ideally, in a third language too. You have a logical mind and good writing and analytical skills; you are also very rigorous and methodical. Your sense of initiative, dynamism and autonomy will be much appreciated during this traineeship. Contact: Juliette MORNET +33 (0)1 41 43 10 31 jmornet at reverso.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:45:52 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:45:52 +0100 Subject: Sujet de these: Two Salaried PhD Positions in Machine Translation at Dublin City University Message-ID: Date: Wed, 21 Nov 2012 17:20:34 +0000 From: Declan Groves Message-ID: X-url: http://expert-itn.eu X-url: http://www.nclt.dcu.ie/mt/ X-url: http://www.cngl.ie X-url: http://expert-itn.eu ------ Apologies for cross-posting. Please circulate to any potentially interested parties ------ TWO SALARIED PHD POSITIONS IN MACHINE TRANSLATION AT DUBLIN CITY UNIVERSITY - Marie Curie ITN project EXPERT ------ Applications are invited for two salaried 3-year Early Stage Researcher PhD positions in corpus-based approaches to machine translation. The positions have been awarded as part of the new EU FP7 Marie-Curie Initial raining Network EXPERT (http://expert-itn.eu), concerned with the exploitation of empirical approaches to machine translation, including statistical machine translation and example-based machine translation. The EXPERT project puts together researchers from six European universities (The University of Sheffield, Universidad de Malaga, Universitaet des Saarlandes, Dublin City University, Universiteit van Amesterdam, and University of Wolverhampton) and five translation services and technology providers (Pangeanic, Hermes and Translated, Celer Soluciones and WordFast). The two projects allocated to Dublin City University are: (i) the investigation of how individual corpus-based translation approaches (TM, EBMT and SMT) can benefit from each other; and (ii) investigation of the ideal infra-structure for a computer-aided translation: a pipeline with NLP tools for pre/post-processing, SMT, EBMT and TM techniques which can form the basis of a hybrid CAT tool. The work in both projects will focus on truly hybrid data-driven approaches to MT, in order to ultimately help facilitate the work of human translators. The research will be conducted as part of the MT group at the National Centre for Language Technology (NCLT) (http://www.nclt.dcu.ie/mt/) and the Centre for Next Generation Localisation (CNGL) (http://www.cngl.ie) in Dublin City University, with opportunities for collaborative work with several of the leading universities and industrial partners in EXPERT, and with the expectation of a 6-month secondment to 2-3 partners in this project. The team?s location at DCU, just minutes from Dublin city centre, offers a conducive environment to research, collaboration and innovation with a wealth of amenities on campus, including restaurants, the state-of-the-art University Sports Complex and swimming pool and the Helix, one of Ireland?s most impressive arts venues with three separate auditoria. SALARY DETAILS ----------------------- The successful individual will be employed as a salaried researcher at Dublin City University, while studying towards his/her PhD. Salary rates and additional mobility and training allowances are as per the Marie Curie programme. For employment in the Ireland, the reference figure for gross salary is *41,458* euros/year (before both employer and employee contributions to tax/pension/national insurance etc. subject to the regulations of the host country), plus additional contribution towards mobility and training. The post is fixed term for three years with a start date of 14 January 2013 or soon after. REQUIREMENTS & ELIGIBILITY ------------------------------------------ Applicants should hold, at the very minimum, a primary honours degree in a relevant field of study (e.g. Computer Science, Software Engineering, Computational Linguistics, Mathematics) and should have experience in natural language processing, machine translation or a related area. Please check Section III.3 of the following link for further information on the Marie Curie scheme regarding eligibility criteria: ftp://ftp.cordis.europa.eu/pub/fp7/docs/fp7-mga-annex3intramulti_en.pdf. In particular, candidates cannot have lived in Ireland for more than 12 months in the 3 years immediately prior to their appointment. More details on eligibility can also be found on the project website (http://expert-itn.eu) APPLICATION DETAILS ---------------------------------- For further details, including details of how to apply , please see: www4.dcu.ie/sites/default/files/graduate_research/pdfs/PhD%20opportunities%20EXPERT_DCU_Nov%202012.pdf Closing date for applications: 21st December 2012 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 23 21:47:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 23 Nov 2012 22:47:48 +0100 Subject: Livre: Piotrowski, Natural Language Processing for Historical Texts Message-ID: Date: Fri, 23 Nov 2012 15:56:21 -0500 From: Graeme Hirst Message-Id: X-url: http://www.morganclaypool.com/doi/pdf/10.2200/S00436ED1V01Y201207HLT017 X-url: http://www.morganclaypool.com/page/licensed NEW BOOK Natural Language Processing for Historical Texts by Michael Piotrowski, Leibniz Institute of European History, Germany Synthesis Lectures on Human Language Technologies #17 (Morgan & Claypool Publishers), 2012, 157 pages Abstract More and more historical texts are becoming available in digital form. Digitization of paper documents is motivated by the aim of preserving cultural heritage and making it more accessible, both to laypeople and scholars. As digital images cannot be searched for text, digitization projects increasingly strive to create digital text, which can be searched and otherwise automatically processed, in addition to facsimiles. Indeed, the emerging field of digital humanities heavily relies on the availability of digital text for its studies. Together with the increasing availability of historical texts in digital form, there is a growing interest in applying natural language processing (NLP) methods and tools to historical texts. However, the specific linguistic properties of historical texts -- the lack of standardized orthography, in particular -- pose special challenges for NLP. This book aims to give an introduction to NLP for historical texts and an overview of the state of the art in this field. The book starts with an overview of methods for the acquisition of historical texts (scanning and OCR), discusses text encoding and annotation schemes, and presents examples of corpora of historical texts in a variety of languages. The book then discusses specific methods, such as creating part-of-speech taggers for historical languages or handling spelling variation. A final chapter analyzes the relationship between NLP and the digital humanities. Certain recently emerging textual genres, such as SMS, social media, and chat messages, or newsgroup and forum postings share a number of properties with historical texts, for example, nonstandard orthography and grammar, and profuse use of abbreviations. The methods and techniques required for the effective processing of historical texts are thus also of interest for research in other domains. Table of Contents: Introduction / NLP and Digital Humanities / Spelling in Historical Texts / Acquiring Historical Texts / Text Encoding and Annotation Schemes / Handling Spelling Variation / NLP Tools for Historical Languages / Historical Corpora / Conclusion / Bibliography http://www.morganclaypool.com/doi/pdf/10.2200/S00436ED1V01Y201207HLT017 This title is available online without charge to members of institutions that have licensed the Synthesis Digital Library of Engineering and Computer Science. Members of licensing institutions have unlimited access to download, save, and print the PDF without restriction; use of the book as a course text is encouraged. To find out whether your institution is a subscriber, visit (http://www.morganclaypool.com/page/licensed), or just click on the book's URL above from an institutional IP address and attempt to download the PDF. Others may purchase the book from this URL as a PDF download for US$30 or in print for US$40. Printed copies are also available from Amazon and from booksellers worldwide at approximately US$45 or local currency equivalent. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:21:35 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:21:35 +0100 Subject: Appel: Ecritures anciennes et typographie numerique Message-ID: Date: Sat, 24 Nov 2012 11:00:09 +0100 From: Yannis Haralambous Message-Id: <12CF6930-DCF3-4C79-8513-7B3BB6A5DDBD at telecom-bretagne.eu> X-url: http://gieca.sciencesconf.org/resource/page/id/1 Bonjour ? tous, En partenariat avec l'Institut de Recherche sur les Arch?omat?riaux (IRAMAT, Orl?ans), l'?quipe des Biblioth?ques Virtuelles Humanistes du Centre d'?tudes sup?rieures de la Renaissance organise, les 21 et 22 mai 2013, un colloque consacr? ? la gestion informatis?e des ?critures anciennes (imprim?, manuscrit, ?pigraphie, numismatique, etc.). Les probl?matiques de codage, de balisage, d'affichage des caract?res sp?ciaux seront au coeur des discussions. Le sujet peut int?resser aussi bien les chercheurs en litt?rature ou en sciences historiques, que les catalogueurs d'imprim?s et de manuscrits anciens, les informaticiens ou les ?diteurs de textes. Nous esp?rons que les biblioth?caires et archivistes seront nombreux ? assister ou ? proposer des communications. L'appel ? contribution sera cl?t le 10 janvier 2013. Vous trouverez l'argumentaire et le texte de l'appel ? l'URL suivante : http://gieca.sciencesconf.org/resource/page/id/1 N'h?sitez pas ? relayer cette information ? vos ?ventuels partenaires int?ress?s, Bien cordialement, R?mi Jimenes, Doctorant, Ing?nieur d'?tude contractuel (Biblioth?ques Virtuelles Humanistes), Centre d'?tudes sup?rieures de la Renaissance. T?l. 02 47 36 77 65 S'inscrire ? la Lettre des BVH : http://www.bvh.univ-tours.fr/newsletter.asp ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:22:47 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:22:47 +0100 Subject: These: Karen Fort, Vers une methodologie de l'annotation manuelle de corpus Message-ID: Date: Sun, 25 Nov 2012 12:25:48 +0100 (CET) From: Karen Fort Message-ID: <1473845698.7970074.1353842747963.JavaMail.root at loria.fr> Bonjour, J'ai le plaisir de vous inviter ? ma soutenance de th?se, intitul?e : "Les ressources annot?es, un enjeu pour l'analyse de contenu : vers une m?thodologie de l'annotation manuelle de corpus" La soutenance se d?roulera le vendredi 7 d?cembre, ? 14h, ? l'Universit? Paris 13, Villetaneuse, salle B107 du LIPN (voir : http://lipn.univ-paris13.fr/fr/contact). Elle sera suivie d'un pot auquel vous ?tes bien s?r chaleureusement convi?s. Composition du jury : - Fr?d?ric B?chet, Professeur, Universit? de la M?diterran?e (rapporteur) - Claire Fran?ois, Ing?nieure de Recherche, INIST-CNRS, Nancy - Beno?t Habert, Professeur, ENS de Lyon (rapporteur) - Lori Lamel, Directrice de Recherche, LIMSI-CNRS, Orsay - Fran?ois L?vy, Professeur ?m?rite, Universit? Paris 13 - Adeline Nazarenko, Professeure, Universit? Paris 13 (directrice) - Eric Villemonte de la Clergerie Charg? de Recherche, INRIA, Rocquencourt R?sum? : L?annotation manuelle de corpus est devenue un enjeu fondamental pour le Traitement Automatique des Langues (TAL). En effet, les corpus annot?s sont utilis?s aussi bien pour cr?er que pour ?valuer des outils de TAL. Or, le processus d?annotation manuelle est encore mal connu et les outils propos?s pour supporter ce processus souvent mal utilis?s, ce qui ne permet pas de garantir le niveau de qualit? de ces annotations. Nous proposons dans cette th?se une vision unifi?e de l?annotation manuelle de corpus pour le TAL. Ce travail est le fruit de diverses exp?riences de gestion et de participation ? des campagnes d?annotation, mais ?galement de collaborations avec diff?rents chercheur(e)s. Nous proposons dans un premier temps une m?thodologie globale pour la gestion de campagnes d?annotation manuelle de corpus qui repose sur deux piliers majeurs : une organisation des campagnes d?annotation qui met l??valuation au c?ur du processus et une grille d?analyse des dimensions de complexit? d?une campagne d?annotation. Un second volet de notre travail a concern? les outils du gestionnaire de campagne. Nous avons pu ?valuer l?influence exacte de la pr?-annotation automatique sur la qualit? et la rapidit? de correction humaine, gr?ce ? une s?rie d?exp?riences men?e sur l?annotation morpho-syntaxique de l?anglais. Nous avons ?galement apport? des solutions pratiques concernant l??valuation de l?annotation manuelle, en donnant au gestionnaire les moyens de s?lectionner les mesures les plus appropri?es. Enfin, nous avons mis au jour les processus en ?uvre et les outils n?cessaires pour une campagne d?annotation et instanci? ainsi la m?thodologie que nous avons d?crite. Bien cordialement, Kar?n Fort Doctorante LIPN / ATER ENSMN Loria, ?quipe S?magramme Bureau C303 03 54 95 86 54 http://lipn.univ-paris13.fr/~fort/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:24:07 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:24:07 +0100 Subject: Job: Post Doc Position on Conversational Feedback (18 months, Aix-en-Provence, France) Message-ID: Date: Sun, 25 Nov 2012 22:09:26 +0100 From: Laurent Pr?vot Message-ID: Postdoc on "Conversational Feedback: Multidimensional analyses and modeling" (CoFee), Laboratoire Parole et Langage (Aix-En-Provence) (UMR 7309) Applications are invited for an 18 months postdoctoral position on linguistic feedback modeling. The aim of the project is to study the interfaces between linguistic domains (lexicon, prosody, kinesic) in the context of linguistic feedback behaviors. Only candidates with experience with at least two of the points below will be considered: - speech and prosody - dialogue / conversation / interaction analysis and modeling - kinesics (especially facial expression and head movements) - natural language processing Concerning the kind of approaches considered both corpus/quantitative and formal backgrounds are welcomed. The position is planned to start around February 1st but we can discuss about late starting period. The salary will be determined according to the French university standards (about 1950 euros / month after tax and health insurance coverage for a young researcher). Funding for presenting relevant research results into conferences comes with the position. Speaking French will be a plus for everyday life in Aix-en-Provence, but fluency in English is the minimal requirement. The research lab is located in the center of Aix-en-Provence (http://www.aixenprovencetourism.com/). Aix is a sunny middle-sized city of South East France, nested in the Provence countryside, 30 minutes from the Mediterranean and 1h30 from the Alps. The "Laboratoire Parole et Langage" is a very active lab currently involved in several large scale projects (Labex "Brain and Language Research Institute" : www.blri.fr ; EQUIPEX Open Resources and Tools for LANGuage (ORTOLANG) : www.ortolang.fr ; and Erasmus Mundus "Multilingualism and Multiculturalism": www.em-multi.eu ) offering a stimulating research environment and large and diverse opportunities of collaborations. A curriculum vitae and a list of publications should be sent to Laurent Pr?vot (laurent.prevot at lpl-aix.fr) by December 31st but please contact us asap if you are interested by the position for deepening mutual knowledge before formal application. For more information, please visit the following web pages: CoFee: cofee.hypotheses.org Laboratoire Parole et Langage: lpl-aix.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:28:13 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:28:13 +0100 Subject: These: Anne-Lyse Minard, Extraction de relations en domaine de specialite Message-ID: Date: Mon, 26 Nov 2012 13:17:07 +0100 From: minard Message-ID: <8045d94010a412ce5eaa9bb54fc3278d at limsi.fr> Message-ID: <8045d94010a412ce5eaa9bb54fc3278d at limsi.fr> X-Sender: minard at limsi.fr User-Agent: LIMSI Webmail Bonjour, J?ai le plaisir de vous inviter ? la soutenance de ma th?se intitul?e "Extraction de relations en domaine de sp?cialit?". La soutenance aura lieu vendredi 7 d?cembre 2012 ? 10h00 en salle de conf?rences du LIMSI-CNRS (B?t 508, Universit? Paris Sud, Orsay ; http://www.limsi.fr). Vous ?tes ?galement convi?s au traditionnel pot de th?se qui suivra la soutenance. Bien cordialement, Anne-Lyse Minard ----------------- Le jury de soutenance sera compos? de : * Directrices de th?se Brigitte Grau -- LIMSI-CNRS - ENSIIE Anne-Laure Ligozat -- LIMSI-CNRS - ENSIIE * Rapporteurs Emmanuel Morin -- LINA - Universit? de Nantes Horacio Saggion -- Universit? Pompeu Fabra, Barcelone * Examinateurs Juliette Dibie-Barth?lemy -- INRA-AgroParisTech Chantal Reynaud -- LRI - Universit? Paris-Sud Yannick Toussaint -- LORIA-INRIA * Invit? Stephen Randall Thomas -- IGR, IR4M-CNRS R?sum? de la th?se : La quantit? d'information disponible dans le domaine biom?dical ne cesse d'augmenter. Pour que cette information soit facilement utilisable par les experts d'un domaine, il est n?cessaire de l'extraire et de la structurer. Pour avoir des donn?es structur?es, il convient de d?tecter les relations existantes entre les entit?s dans les textes. Nos recherches se sont focalis?es sur la question de l'extraction de relations complexes repr?sentant des r?sultats exp?rimentaux, et sur la d?tection et la cat?gorisation de relations binaires entre des entit?s biom?dicales. Nous nous sommes int?ress?e aux r?sultats exp?rimentaux pr?sent?s dans les articles scientifiques. Nous appelons r?sultat exp?rimental, un r?sultat quantitatif obtenu suite ? une exp?rience et mis en relation avec les informations permettant de d?crire cette exp?rience. Ces r?sultats sont importants pour les experts en biologie, par exemple pour faire de la mod?lisation. Dans le domaine de la physiologie r?nale, une base de donn?es a ?t? cr??e pour centraliser ces r?sultats d'exp?rimentation, mais l'alimentation de la base est manuelle et de ce fait longue. Nous proposons une solution pour extraire automatiquement des articles scientifiques les connaissances pertinentes pour la base de donn?es, c'est-?-dire des r?sultats exp?rimentaux que nous repr?sentons par une relation n-aire. La m?thode proc?de en deux ?tapes : extraction automatique des documents et proposition de celles-ci pour validation ou modification par l'expert via une interface. Nous avons ?galement propos? une m?thode ? base d'apprentissage automatique pour l'extraction et la classification de relations binaires en domaine de sp?cialit?. Nous nous sommes int?ress?e aux caract?ristiques et vari?t?s d'expressions des relations, et ? la prise en compte de ces caract?ristiques dans un syst?me ? base d'apprentissage. Nous avons ?tudi? la prise en compte de la structure syntaxique de la phrase et la simplification de phrases dirig?e pour la t?che d'extraction de relations. Nous avons en particulier d?velopp? une m?thode de simplification ? base d'apprentissage automatique, qui utilise en cascade plusieurs classifieurs. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:29:56 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:29:56 +0100 Subject: Ecole: Methodology for Terminology Work (Online Workshop), January 16th - March 12th 2013 Message-ID: Date: Mon, 26 Nov 2012 15:19:05 +0100 From: "iula at online" Message-ID: <0AE2BC0C622341A2B0049DA8DE2BAE80 at ws076671> X-url: http://www.iula.upf.edu/teronlform0uk.htm Dear colleagues, We are pleased to announce that the online workshop Methodology for Terminology Work (second edition in English) will start on January 16th 2013. This workshop is offered by IULATERM, the leading Research Group in Terminology under the direction of M. Teresa Cabr?, in the framework of the online Master in Terminology. The online workshop Methodology for Terminology Work deals with the foundations of terminological practice within the framework of M. Teresa Cabr?'s Communicative Theory of Terminology, and its main objective is the elaboration of a terminological product (a glossary or vocabulary) following the main phases of terminology work: definition of the work, writing the work plan, creation and examination of the extraction corpus, database creation and revision, and work editing. The online workshop Methodology for Terminology Work is based on TERMINUS 2.0?, an application for terminology and corpus management developed by IULATERM Research Group. TERMINUS 2.0? is an integrated web application which provides tools for the complete terminographic workflow: document search, corpus compilation and exploration, automatic term extraction, dictionary and project management, database creation and maintenance, and dictionary edition (in digital or print format). Please note that the number of places for the workshop is limited; thus early registration is strongly recommended. Please see below for further details, and do not hesitate to write to us should you need any additional information. Workshop dates: January 16th - March 12th 2013 ECTS Credits: 10 Fee: ? 600 Registration: http://www.iula.upf.edu/teronlform0uk.htm (Please follow the instructions indicated under Registration procedure) Further information and contact: iulaonline at upf.edu Best regards, M. Teresa Cabr? Director Master in Terminology ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:32:21 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:32:21 +0100 Subject: Appel: Ateliers TALN'2013 Message-ID: Date: Mon, 26 Nov 2012 18:06:50 +0100 (CET) From: "Emmanuel MORIN" Message-ID: <1e466c6bdc01c1de214c16cb8791bcca.squirrel at webmail.univ-nantes.fr> PREMIER APPEL ? ATELIERS ------------------------ TALN'2013 20e conf?rence sur le Traitement Automatique des Langues Naturelles Centre de Congr?s Les Atlantes aux Sables d'Olonne du 17 au 21 juin 2013 CALENDRIER ---------- - Date limite de soumission : 25 janvier 2013 - R?ponse du comit? de programme : 8 f?vrier 2013 - Version finale des articles : 3 mai 2013 - Date des ateliers : 21 juin 2013 Organis?e par l'?quipe TALN du LINA (Laboratoire d?Informatique de Nantes Atlantiques) et l??quipe LST du LIUM (Laboratoire d'Informatique de l'Universit? du Maine), la 20e conf?rence sur le Traitement Automatique des Langues Naturelles (TALN) se tiendra du 17 au 21 juin 2013 au Centre de Congr?s Les Atlantes aux Sables d'Olonne. La conf?rence TALN?2013, qui est organis?e sous l??gide de l?ATALA, se tiendra conjointement avec la 15e ?dition des Rencontres des ?tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL'2013). OBJECTIFS --------- Un atelier porte sur une th?matique particuli?re de TALN afin de rassembler quelques expos?s plus cibl?s. Il a son propre pr?sident et son propre comit? de programme. Le responsable d'un atelier est charg? de l'appel ? candidatures et de la coordination de son comit? de programme. Les organisateurs de TALN s'occuperont de la partie logistique (gestion des salles, pauses caf? et diffusion des articles). Les ateliers auront lieu en parall?le sur une journ?e ou une demi-journ?e (2 ? 4 sessions de 1h30). MODALIT?S DE PROPOSITION ------------------------ Les propositions d'ateliers seront envoy?es sous forme ?lectronique ? emmanuel.morin at univ-nantes.fr et yannick.esteve at lium.univ-lemans.fr. Les propositions d'ateliers comprendront une description synth?tique (1 page) de la th?matique de la conf?rence ainsi que son comit? de programme et de la dur?e souhait?e. Le comit? de programme de TALN choisira parmi toutes les propositions. FORMAT ------ Les conf?rences auront lieu en fran?ais (ou en anglais pour les non-francophones). Les articles devront suivre le format de TALN et comprendront 12 ? 14 pages. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 28 08:31:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 28 Nov 2012 09:31:28 +0100 Subject: Appel: Atelier SOS'2013 "Sources Ouvertes et Services" - EGC'2013 Message-ID: Date: Mon, 26 Nov 2012 17:16:03 +0100 From: Laurie Serrano Message-ID: X-url: http://weblab-project.org/workshop/sos2013 *Merci de diffuser cet appel ? communications le plus largement possible. Toutes nos excuses pour d'?ventuelles r?ceptions multiples.* *Quatri?me ?dition de l?atelier "Sources Ouvertes et Services"* *SOS?2013 (en association avec EGC?2013)* *29 janvier 2013 - Toulouse, France* http://weblab-project.org/workshop/sos2013 *Pr?sentation de l'atelier :* Pour sa quatri?me ?dition, l'atelier SOS'2013 propose de poursuivre une r?flexion commune autour des diverses probl?matiques li?es au traitement de donn?es disponibles en sources ouvertes (SO). Les SO d?signent l'ensemble des m?dias accessibles librement, de fa?on gratuite ou payante, tels qu'Internet, les bases de donn?es publiques, les journaux, les CD-ROM, les cha?nes de t?l?vision et de radio, etc., par opposition aux sources ferm?es dont la consultation n?cessite de disposer d'autorisations sp?cifiques. Ces SO fournissent d?importants volumes de donn?es multim?dia h?t?rog?nes (image, texte, audio, vid?o, etc.) qui n?cessitent des traitements adapt?s en vue de leur exploitation. Cet atelier est d?di? ? toutes ces ?tapes, partant de la phase de d?couverte des sources d?information, en passant par la collecte et l'analyse des donn?es collect?es jusqu?? la phase de capitalisation et d?exploitation des connaissances. Un int?r?t particulier sera port? aux choix architecturaux retenus pour la r?alisation d?applications exploitant les SO. En effet, ces applications tentent g?n?ralement de faire cohabiter plusieurs briques logicielles (COTS, logiciels open source, d?veloppements ad-hoc, etc.) en vue de la r?alisation d'une t?che particuli?re. Cela repr?sente un d?fi scientifique et technique auquel les recherches sur l?encha?nement des traitements algorithmiques capables d'exploiter ces donn?es peuvent contribuer. L?accent sera mis sur les architectures orient?es services (SOA) et sur l?utilisation des technologies du Web S?mantique. Pour cette nouvelle ?dition, l'atelier SOS souhaite s'int?resser ?galement au traitement des grandes masses de donn?es ("Big data"). L'explosion r?cente des donn?es disponibles sur le Web a fait ?merger de nouvelles probl?matiques visant ? adapter et optimiser toute la chaine de traitement de l'information face aux nouveaux volumes ? traiter. Cet atelier souhaite rassembler des chercheurs issus ? la fois des mondes acad?mique et industriel afin d'obtenir un panel repr?sentatif d'acteurs et de leurs travaux sur les th?mes pr?sent?s ci-apr?s. *Th?mes de l'atelier :* Les auteurs sont invit?s ? envoyer des propositions ayant une port?e th?orique, m?thodologique ou pratique, sur l?un des th?mes suivants (liste non exhaustive) : * Identification et d?couverte automatique de sources d?information, * Acc?s et collecte d?information ? partir de sources ouvertes (Web, r?seaux sociaux, flux RSS et autres), * Classification, filtrage des informations d'int?r?t, * Extraction d?information ? partir de textes non structur?s et/ou utilisant des vocabulaires sp?cifiques (blogs, langage sms, forums), * Extraction d?information ? partir de gros volumes de donn?es multim?dia (texte, image, vid?o, audio), * Analyse des sentiments/opinions dans les m?dias sociaux (r?seaux sociaux, blogs, forums), * Mod?lisation et capitalisation des connaissances extraites ? partir de sources ouvertes (ontologies, annotations s?mantiques), * Exploitation des connaissances extraites ? partir de sources ouvertes : raisonnement, aide ? la d?cision, visualisation, * D?tection de signaux faibles, * Evaluation et qualification des sources d?information, * Evaluation et qualification des informations extraites ? partir de sources ouvertes, * Inf?rence, fouille et validation de liens entre donn?es, * Plate-formes d?int?gration de services de traitement h?t?rog?nes : interop?rabilit? des services, orchestration s?mantique, * Applications de veille strat?gique ou ?conomique ? partir de sources ouvertes, * Applications de renseignement d?origine sources ouvertes (ROSO), * Applications de traitement de l'information orient?es "Big data". *Comit? de programme :* Florence Amardeilh (Mondeca) Ga?l de Chalendar (CEA LIST) Olivier Corby (INRIA, Sophia Antipolis) Valentina Dragos (ONERA) Adil El Ghali (IBM) Christian Fluhr (GEOL Semantics) Bruno Grilheres (Cassidian) Dafni Stampouli (Cassidian) Nicolas Hernandez (Universit? de Nantes) Alexandre Pauchet (LITIS, Rouen) Ha?fa Zargayouna (LIPN, Universit? de Paris 13) Maroua Bouzid (GREYC, Universit? de Caen) Cassia Trojahn (IRIT, Toulouse) Klaus Atzenbeck (IISYS, Hof University, Germany) Sinan Yurtsever (Atos, Turkey) Nizar Ghoula (Universit? de Gen?ve, Switzerland) *Dates importantes :* * Date limite de soumission : *30 Novembre 2012* * Notification aux auteurs : 21 D?cembre 2012 * Version finale : 2 Janvier 2013 * Date de l'atelier : 29 Janvier 2013 *Soumission :* Cet atelier invite les auteurs ? soumettre leurs articles en fran?ais ou en anglais (r?sum? en anglais souhait? dans les deux cas). Les articles soumis ne devront pas d?passer 12 pages (annexes comprises). Nous vous demandons de respecter les instructions des organisateurs de EGC'2013 et d'utiliser la derni?re version du format RNTI disponible ? l'adresse suivante : http://www.antsearch.univ-tours.fr/rnti Chaque proposition sera ?valu?e par au moins deux membres du comit? de programme. Les communications retenues feront l?objet d?une pr?sentation orale par l'un des auteurs (en fran?ais ou en anglais ? leur convenance). La journ?e commencera par une pr?sentation d?un conf?rencier invit? sur l'un des th?mes de l?atelier et s?ach?vera par une table ronde autour des probl?matiques li?es ? l?exploitation des sources ouvertes. *Les articles doivent ?tre envoy?s ? l'adresse suivante : sos2013 at weblab-project.org* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ -------------------------------------------------------------------------