From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:36:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:36:37 +0200 Subject: Appel: revue TAL - Note de lecture (NASTASE) Message-ID: Date: Fri, 31 May 2013 09:05:08 +0200 (CEST) From: Denis Maurel Message-ID: <1838999710.13847508.1369983908967.JavaMail.root at mail10> La revue TAL publie régulièrement des notes de lecture. Nous recherchons un collègue souhaitant lire le livre: "Vivi NASTASE, Preslav NAKOV, Diarmuid Ó SÉAGHDHA, Stan SZPAKOWICZ. Semantic Relations Between Nominals. Morgan & Claypool publishers. 2013. 107 pages." et prêt à en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoyé gracieusement en échange du service rendu). Cette note de lecture doit être rédigée en français (trois pages maximum, au format de la revue) et envoyée fin août 2013. D'autres compte-rendu sont possibles si vous avez lu récemment un ouvrage qui vous a intéressé et si vous êtes prêt à partager votre lecture avec la communauté... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:58:07 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:58:07 +0200 Subject: Q: Masters en industrie des langues Message-ID: Date: Fri, 31 May 2013 15:48:10 +0000 From: Message-ID: <26244_1370015291_51A8C63B_26244_333_2_ED32B5012BA99F4AA999E2765EF060F20BEBA7 at PEXCVZYM12.corporate.adroot.infra.ftgroup> Bonjour, J'essaye de recenser les masters en industries des langues en France. Si vous êtes responsable d'un master, je vous remercie par avance de me communiquer les informations suivantes : - Université d'accueil et département. - Spécialité du master en industrie des langues. - Objectifs du master et contenu de la formation (un paragraphe). - Débouchés possibles. - Conditions d'entrée. - Contact. - URL du master. Je vous remercie par avance. Malek Boualem ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:56:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:56:35 +0200 Subject: Job: Postdoc position in WSD at LIMSI-CNRS Message-ID: Date: Fri, 31 May 2013 14:50:45 +0200 From: Marianna Apidianaki Message-Id: <9BA5AF06-BBDB-4B43-9B8E-DD7DE1FD6441 at limsi.fr> X-url: http://transread.limsi.fr [apologies for cross-posting] ****************************************************************** POSTDOC POSITION IN WORD SENSE DISAMBIGUATION AT LIMSI-CNRS, Orsay (Paris area), FRANCE ****************************************************************** A postdoctoral position in Word Sense Disambiguation (WSD) is available at the LIMSI-CNRS lab. The position is funded by the national (ANR) project TransRead (http://transread.limsi.fr) aimed at developing new multilingual text processing applications and facilitating the reading of multilingual documents for foreign language readers and learners. The postdoctoral researcher will work on both data-driven and knowledge-based Word Sense Disambiguation methods exploiting information in parallel corpora and large-scale multilingual resources (such as BabelNet and Wiktionary). The disambiguation output will serve to facilitate foreign language reading by providing semantic annotations in different languages. Research results will also be exploited in other applications developed in the group, such as Machine Translation. Requirements: - Ph.D. (or completed by Fall 2013) in Computer Science, Natural Language Processing, Computational Linguistics - Solid programming skills - Experience with statistical approaches to semantics, cross-lingual methods for NLP or Statistical Machine Translation - Strong publication record - Fluent English The successful candidate will join a dynamic research team working on various aspects of Statistical Machine Translation, Word Sense Disambiguation and paraphrasing. For information regarding our activities, see http://www.limsi.fr/Scientifique/tlp/mt/ Salary: 2000 € net per month Duration: 12 months, starting Fall or Winter 2013 Application deadline: Open until filled Interested candidates should send their CV and the names and contact information of 2 referees to Marianna Apidianaki (marianna at limsi.fr). Informal inquiries can be sent to the same address. About the LIMSI-CNRS The LIMSI-CNRS lab is situated at Orsay, a green area 25 km south of Paris. A suburban train connects Orsay to Paris city center. Detailed information about the LIMSI lab can be found at http://www.limsi.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:48:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:48:32 +0200 Subject: Appel: DICTAP2013, ICEL2013, ICEEE2013, ICIA2013, ICIEIS2013 Message-ID: Date: Fri, 31 May 2013 01:00:52 -0700 From: "The Society of Digital Information and Wireless Communications (SDIWC)" Message-ID: <71e7ff52d0023088a29ccd1d4a79675f at localhost.localdomain> Sorry for cross posting Could you please consider submitting your paper to one of these conferences. Name : The Third International Conference on Digital Information and Communication Technology and its Applications (DICTAP2013) Location : VSB-Technical University of Ostrava, Czech Republic Dates : July 8-10, 2013 URL : www.sdiwc.net Name : The Fourth International Conference on e-Learning(ICEL203) Location : VSB-Technical University of Ostrava, Czech Republic Dates : July 8-10, 2013 URL : www.sdiwc.net Name : The Second International Conference on Informatics & Applications (ICIA2013) Location : Technical University of Lodz, Poland Dates : Sept. 23-25, 2013 URL : www.sdiwc.net Name : The Second International Conference on E-Learning and E-Technologies in Education (ICEEE2013) Location : Technical University of Lodz, Poland Dates : Sept. 23-25, 2013 URL : www.sdiwc.net Name : The Second International Conference on Informatics Engineering & Information Science (ICIEIS2013) Location : Universiti Teknologi Malaysia, Kuala Lumpur, Malaysia Dates : Nov. 12-14, 2013 URL : www.sdiwc.net ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:55:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:55:04 +0200 Subject: Appel: Colloque CRELA - Cultures de recherche en linguistique appliquee Message-ID: Date: Fri, 31 May 2013 11:23:34 +0200 From: Patrick Paroubek Message-ID: <1369992214.2630.0.camel at localhost> X-url: http://www.atilf.fr/crela2013/ -----FR----------------------------------------------------------------- Appel à communication Cultures de recherche en linguistique appliquée Research cultures in applied linguistics Colloque international organisé par l'ATILF (équipe CRAPEL), l'Association Française de Linguistique Appliquée (AFLA), et les associations partenaires (ACEDLE, APLIUT, APLV, ARDAA, ASDIFLE, ATALA, GERALS, GERAS, GERES, RANACLES, SFT, SHESL, UPLEGESS)1 du 14 au 16 novembre 2013 à l'Université de Lorraine, Nancy DATE LIMITE REPORTEE AU 30 juin 2013 Pendant la seconde moitié du vingtième siècle le concept de « linguistique appliquée » a cédé la place en France à une spécialisation par domaines pour des raisons de politique scientifique. La liste de ces domaines est longue : acquisition / apprentissage, bi- / multilinguisme, didactique des langues, lexicographie, linguistique de corpus, terminologie, traductologie, traitement automatique des langues, variation linguistique. Dans d'autres cultures, sous un terme englobant (notamment applied linguistics en anglais, angewandte Linguistik en allemand, lingüística aplicada en espagnol, ?), différents domaines interagissent et s'enrichissent mutuellement. A travers le monde, les attentes politiques incitent à une plus grande inter- / trans- / multidisciplinarité. Qu'en est-il aujourd'hui de la notion de « linguistique appliquée » en France ? Est-elle opératoire pour définir un terrain fertilisant qui puisse réduire le fractionnement du domaine ? Le colloque international Cultures de recherche en linguistique appliquée / Research cultures in applied linguistics rassemblera des chercheurs et autres acteurs des différents domaines qui souhaitent se positionner par rapport au champ de la linguistique appliquée, afin de croiser les regards sur les cultures, pratiques et contenus des recherches aujourd'hui. Dans cette perspective, des propositions de communication sont attendues dans l'un des cinq axes du colloque : Référents théoriques des disciplines et domaines (diachronie, prospective de la recherche, croisements, etc.) Modélisation et théories (comment approcher plusieurs domaines en même temps, etc.) Méthodologie, instruments et ressources (approches et méthodologies privilégiées, méthodes dites mixtes, publications, dissémination, etc.) Notion de « terrain » en linguistique appliquée (analyse de terrains spécifiques, approche comparatiste, etc.) Varia (nouveau). Dans la problématique des organisateurs, toute communication décrivant des recherches qui se situent à la croisée de plusieurs domaines de la linguistique appliquée peut correspondre aux objectifs de ce colloque. Conférenciers Bernd Rüschoff, Président de l'AILA Anne Condamines (Université Toulouse Le Mirail, CNRS, CLLE) & Jean-Paul Narcy-Combes (Université Sorbonne Nouvelle, DILTEC, AFLA) Fernand Carton, Université de Lorraine Daniel Véronique (Université Aix-Marseille, Langage et Parole) Propositions Les propositions de communication (durée : 20 minutes + 10 minutes de questions) sont à télécharger sur le site (http://www.atilf.fr/crela2013/) avant le 30 juin 2013. Une première page comportera les noms, affiliation, courriel, téléphone usuel, adresse postale de chaque auteur. Une deuxième page entièrement anonyme comportera en français ou en anglais le titre de la communication, et un résumé de 500 mots (mise en page standard, format Word/PDF) incluant trois à cinq références bibliographiques maximum. Les propositions seront soumises à une double évaluation à l'aveugle (notification au 15 septembre 2013). Langues du colloque : français et anglais. Des communications dans d'autres langues sont possibles, si elles sont accompagnées d'un support (PowerPoint) en français ou en anglais. Publications Le colloque donnera lieu à une publication d'actes et à un ouvrage d'articles sélectionnés : des articles courts issus des communications (2.000 mots tout compris) pour une diffusion en ligne ; des articles longs (6.000 mots tout compris) soumis à nouveau à une double évaluation à l'aveugle du comité scientifique pour une publication papier avec un éditeur du domaine. Nancy, ville symbolique L'AFLA est la branche française de l'AILA, l'Association Internationale de Linguistique Appliquée. Ces deux associations ont été créées à Nancy, en octobre 1964. Les personnalités organisatrices étaient à l'époque Bernard Pottier (professeur à Strasbourg, chargé de cours à Nancy), premier président de l'AILA, le recteur Paul Imbs (qui venait de lancer le Trésor de la Langue Française), le doyen Jean Schneider, ou Yves Chalon, qui allait créer le CRAPEL. Il était question de « traduction mécanique », comme cela se disait à l'époque, d'enseignement des langues et de coopération scientifique en Europe. L'objet de l'AFLA est de « promouvoir et coordonner les recherches dans tous les domaines de la linguistique appliquée, et d'encourager la coopération interdisciplinaire et internationale dans ces mêmes domaines ». Et c'est à Nancy que l'AFLA se retrouve en 2013 pour préparer le colloque mondial de l'AILA qui se déroulera du 10 au 15 août 2014 à Brisbane (Australie). Nancy pratique Le colloque se déroulera sur le Campus Lettres et Sciences Humaines de l'Université de Lorraine à Nancy. Nancy est facile d'accès : 1h30 Paris-Nancy en TGV ; certaines liaisons passent par Lorraine TGV (à 45 minutes de Nancy en navette). Des vols à bas prix desservent les aéroports de Metz-Nancy, Luxembourg et Strasbourg. Journée NEQ La veille de l'ouverture du colloque, et adossée à celui-ci, se tiendra au même endroit la Journée d'Etude de l'Acedle Notions en Questions sur les « Corpus en didactique des langues », le mercredi 13 novembre 2013. La notion de « corpus » est très présente dans les recherches en linguistique ainsi qu'en didactique des langues depuis quelques années. Elle recouvre cependant une large gamme de définitions qui ne concordent pas toutes les unes avec les autres et que cette journée NeQ va s'employer à clarifier dans leurs enjeux pour les apprenants, les enseignants et les langues. Les conférenciers seront Kate Beeching (University of the West of England, Royaume-Uni), Natalie Kübler (CLILLAC-ARP, Université Paris Diderot - Paris 7), Ana Frankenberg-Garcia (ISLA-Campus Lisboa, Portugal), Sylvie De Cock (Centre for English Corpus Linguistics, Université Catholique de Louvain, Belgique). Comité scientifique José Aguilar (Université Sorbonne Nouvelle, DILTEC), Judith Barna (Université d'Artois, RECIFES, ARDAA), Fabrice Barthélémy (Université de Franche-Comté, ASDIFLE), Séverine Behra (Université de Lorraine, ATILF), Jean-Claude Bertin (Université du Havre, IDEES-CIRTAL, GERAS), Didier Bottineau (Université Paris Ouest, MODYCO, UPLEGESS), Alex Boulton (Université de Lorraine, ATILF), Cédric Brudermann (Université Pierre et Marie Curie, DILTEC), Peggy Candas (Université de Lorraine, ATILF, RANACLES), Danielle Candel (Université Paris-Diderot, CNRS, HTL, SHESL), Francis Carton (Université de Lorraine, ATILF), Anne Chateau (Université de Lorraine, ATILF, RANACLES), Anne Condamines (Université Toulouse Le Mirail, CNRS, CLLE), Jean-Marc Delagneau (Université du Havre, IDEES, GERALS, APLV), Marc Deneire (Université de Lorraine, ATILF), Loïc Depecker (Université Sorbonne Nouvelle, EA 1483, SFT), Martine Derivry (Université Paris 6, DILTEC), Aura Luz Duffé Montalvan (Université Rennes 2, GERES), Jörg Eschenauer (Ecole Nationale des Ponts Paris Tech, UPLEGESS), Jacqueline Feuillet (Université de Nantes, CRINI, AFLA), Dan Frost (Université de Savoie, LLS, APLIUT), Laurent Gautier (Université de Bourgogne, CITIL, GERALS), Daniel Gile (Université Sorbonne Nouvelle, EA 2290), John Humbley (Université Paris-Diderot-Paris 7, CLILLAC-ARP), Natalie Kübler (Université Paris-Diderot-Paris 7, CLILLAC-ARP), Dominique Macaire (Université de Lorraine, ATILF, ACEDLE), Latisha Mary (Université de Lorraine, ATILF), Carlos Melendez (Université de Lorraine, ATILF), Aliyah Morgenstern (Université Sorbonne Nouvelle, PRISMES), Jean-Paul Narcy-Combes (Université Sorbonne Nouvelle, DILTEC, AFLA), Marie-Françoise Narcy-Combes (Université de Nantes, CRINI, ACEDLE), Claude Normand (Université de Lorraine, ATILF), Patrick Paroubek (LIMSI CNRS), Myriam Pereiro (Université de Lorraine, ATILF), Annick Rivens Mompean (Université Lille 3, STL, RANACLES), Marcelo Tano (Ecole Nationale d'Ingénieurs de Metz, GERES), Linda Terrier (Université Toulouse-Le Mirail, CAS, APLIUT), Denyze Toffoli (Université de Strasbourg, ACEDLE), Enrique Sanchez Albarracin (INSA Lyon, EVS-ITUS, UPLEGESS), Claire Tardieu (Université Sorbonne Nouvelle, ARDAA), Mathieu Valette (INALCO, ERTIM), Daniel Véronique (Université Aix-Marseille, Langage et Parole), Geoffrey Williams (Université Bretagne du Sud, AFLA). Hélène Zumbihl (Université de Lorraine, ATILF) Comité de pilotage Coordination nationale : Jean-Paul Narcy-Combes Coordinateur local : Francis Carton Représentants des associations : Danielle Candel, John Humbley, Dominique Macaire Comité d'organisation ATILF (Université de Lorraine, CNRS) : Séverine Behra, Alex Boulton, Peggy Candas, Marc Deneire, Dominique Macaire, Latisha Mary, Claude Normand, Myriam Pereiro, Hélène Zumbihl. Cédric Brudermann (Université Pierre et Marie Curie, DILTEC); José Aguilar (Université Paris 3, DILTEC); Marcelo Tano (ENI Metz). Contact Francis Carton : crela2013 at atilf.fr. Crapel - ATILF, CNRS et Université de Lorraine, 23 bd Albert 1er, BP 13397, 54015 Nancy cedex, France Site web http://www.atilf.fr/crela2013/ -----EN----------------------------------------------------------------- Call for papers Research cultures in applied linguistics Cultures de recherche en linguistique appliquée An International Conference organised by the ATILF (équipe Crapel), Association Française de Linguistique Appliquée (AFLA), and partner associations (ACEDLE, APLIUT, APLV, ARDAA, ASDIFLE, ATALA, GERALS, GERAS, GERES, RANACLES, SFT, SHESL, UPLEGESS)1 from 14th to 16th November 2013 at the Université de Lorraine, Nancy EXTENDED DEADLINE: 30th June 2013 In France, institutional research policy over the last fifty years has had the effect of splitting up the concept of "applied linguistics" into various specialised fields, including language learning and acquisition, bi- and multilingualism, language teaching, lexicography, corpus linguistics, terminology, translation studies, automatic language processing, language variation, and so on. In other cultures, the umbrella term of applied linguistics, angewandte Linguistik or lingüística aplicada is used to cover the various fields of research which interact and enrich each other. There is a growing awareness on the international scene for the need for greater inter- / trans- / multidisciplinarity. What, then, is the situation in France today concerning applied linguistics? Can applied linguistics provide common ground and reduce fragmentation in the field? This international conference, entitled Research cultures in applied linguistics (Cultures de recherche en linguistique appliquée), aims to bring together researchers and practitioners who relate in some way to the field of applied linguistics to exchange views on the cultures, practices and contents of today's research. With this in mind, a call for papers is now open in one of the main themes for the conference: theoretical frameworks and domains (diachrony, prospective research, cross-disciplinary research, etc.) models and theories (how to approach several disciplines at once, etc.) methodology, tools and resources (approaches and methods, mixed methods, publication, dissemination, etc.) empirical study and field work in applied linguistics (analysis of specific fields, comparative approaches, etc.) miscellaneous (related areas in line with the conference themes, papers describing research in one or more fields of applied linguistics, etc.). Keynote speakers Bernd Rüschoff (President of AILA) Anne Condamines (Université Toulouse Le Mirail, CNRS, CLLE) Jean-Paul Narcy-Combes (Université Sorbonne Nouvelle, DILTEC, AFLA) Fernand Carton (Université de Lorraine) Submissions Submissions for papers (20 minutes oral presentation followed by 10 minutes for questions) can be uploaded before 30th June 2013 from the conference website: http://atilf.fr/crela2013. The first page should include the authors' names, affiliations, email addresses, phone numbers and postal addresses. The second page must be completely anonymised and include the title of the paper and a 500-word summary (standard layout as a Word/PDF document), including three to five bibliographical references at the most. The papers proposed will be submitted to a double-blind peer review and the applicants will receive notification of their decision by 15th September. Conference languages: French and English. Papers may be given in other languages so provided they are accompanied by a PowerPoint presentation in either French or English. Publications Conference publications will include proceedings and a volume of selected papers: short articles adapted from the paper given (maximum 2,000 words in all) to be published on line, long articles (maximum 6,000 words in all) submitted to a double blind evaluation by the scientific committee in view to publication by a publisher in the field. Nancy, a symbolic venue The Association française de linguistique appliquée (AFLA) is the French branch of AILA, both founded in Nancy in October 1964. The organisers were Professor Bernard Pottier (University of Strasbourg, also lecturing at Nancy), the first president of AILA, Rector Paul Imbs (who had just initiated work on the heritage dictionary Trésor de la langue française), Dean Jean Schneider, and Yves Chalon, who would go on to found the CRAPEL (Centre de Recherches et d'Applications Pédagogiques en Langues). Topics discussed included machine translation, language teaching and European cooperation in research work. AFLA's aim was to promote and coordinate research in all branches of applied linguistics and to foster interdisciplinary and international cooperation in these areas. Nancy was thus the obvious choice of venue to meet in 2013 to prepare the AILA world conference to be held from 10th to 15th August 2014 in Brisbane (Queensland, Australia). Getting to Nancy The AFLA conference will take place on the Lettres et Sciences Humaines campus at the Université de Lorraine in Nancy. Nancy is just one and a half hours from Paris by fast train (TGV); some trips require a change of trains at Lorraine TGV (shuttle to Nancy takes 45 minutes). There are also low cost flights to Metz-Nancy, Luxembourg and Strasbourg. NEQ Day The day before the AFLA conference (Wednesday 13th November) features a one-day conference on corpora in language teaching in the series Notions en Questions (NeQ) organised by the Acedle (Association des chercheurs et enseignants didacticiens des langues étrangères). Corpora have for years been central in research in linguistics and language learning, but the term 'corpus' varies widely and definitions do not necessarily coincide. This one-day conference therefore aims to explore the issues from the points of view of learners, teachers and languages. The guest speakers are Kate Beeching (University of the West of England, UK), Natalie Kübler (CLILLAC-ARP, Université Paris Diderot - Paris 7), Ana Frankenberg-Garcia (ISLA-Campus Lisboa, Portugal), Sylvie De Cock (Centre for English Corpus Linguistics, Université Catholique de Louvain, Belgium). Scientific committee José Aguilar (Université Sorbonne Nouvelle, DILTEC), Judith Barna (Université d'Artois, RECIFES, ARDAA), Fabrice Barthélémy (Université de Franche-Comté, ASDIFLE), Séverine Behra (Université de Lorraine, ATILF), Jean-Claude Bertin (Université du Havre, IDEES-CIRTAL, GERAS), Didier Bottineau (Université Paris Ouest, MODYCO, UPLEGESS), Alex Boulton (Université de Lorraine, ATILF, GERAS), Cédric Brudermann (Université Pierre et Marie Curie, DILTEC), Peggy Candas (Université de Lorraine, ATILF, RANACLES), Danielle Candel (Université Paris-Diderot, CNRS, HTL, SHESL), Francis Carton (Université de Lorraine, ATILF), Anne Chateau (Université de Lorraine, ATILF, RANACLES), Anne Condamines (Université Toulouse le Mirail, CLLE), Jean-Marc Delagneau (Université du Havre, IDEES, GERALS, APLV), Marc Deneire (Université de Lorraine, ATILF), Loïc Depecker (Université Sorbonne Nouvelle, EA 1483, Société Française de Terminologie), Martine Derivry (Université Paris 6, DILTEC), Aura Luz Duffé Montalvan (Université Rennes 2, GERES), Jörg Eschenauer (Ecole Nationale des Ponts Paris Tech, UPLEGESS), Jacqueline Feuillet (Université de Nantes, CRINI, AFLA), Dan Frost (Université de Savoie, LLS, APLIUT), Laurent Gautier (Université de Bourgogne, CITIL, GERALS), Daniel Gile (Université Sorbonne Nouvelle, EA 2290), John Humbley (Université Paris-Diderot-Paris 7, CLILLAC-ARP), Natalie Kübler (Université Paris-Diderot-Paris 7, CLILLAC-ARP), Dominique Macaire (Université de Lorraine, ATILF, ACEDLE), Latisha Mary (Université de Lorraine, ATILF), Carlos Meléndez Quero (Université de Lorraine, ATILF), Aliyah Morgenstern (Université Sorbonne Nouvelle, PRISMES), Jean-Paul Narcy-Combes (Université Sorbonne Nouvelle, DILTEC, AFLA), Marie-Françoise Narcy-Combes (Université de Nantes, CRINI, ACEDLE), Claude Normand (Université de Lorraine, ATILF), Patrick Paroubek (LIMSI CNRS), Myriam Pereiro (Université de Lorraine, ATILF), Annick Rivens Mompean (Université Lille 3, STL, RANACLES), Marcelo Tano (Ecole Nationale d'Ingénieurs de Metz, GERES), Linda Terrier (Université Toulouse-Le Mirail, CAS, APLIUT), Denyze Toffoli (Université de Strasbourg, ACEDLE), Enrique Sanchez Albarracin (INSA Lyon, EVS-ITUS, UPLEGESS), Claire Tardieu (Université Sorbonne Nouvelle, ARDAA), Mathieu Valette (INALCO, ERTIM), Daniel Véronique (Université Aix-Marseille, Langage et Parole), Geoffrey Williams (Université de Bretagne Sud, AFLA), Hélène Zumbihl (Université de Lorraine, ATILF). Steering committee Coordination for France: Jean-Paul Narcy-Combes Coordination for Nancy: Francis Carton Representatives of the associations: Danielle Candel, John Humbley, Dominique Macaire Organising committee ATILF (Université de Lorraine, CNRS): Séverine Behra, Alex Boulton, Peggy Candas, Marc Deneire, Dominique Macaire, Latisha Mary, Claude Normand, Myriam Pereiro, Hélène Zumbihl. Cédric Brudermann (Université Pierre et Marie Curie, DILTEC); José Aguilar (Université Paris 3, DILTEC); Marcelo Tano (ENI Metz). Contact Francis Carton: crela2013 at atilf.fr. Crapel - ATILF, CNRS and Université de Lorraine, 23 bd Albert 1er, BP 13397, 54015 Nancy cedex, France Web site http://www.atilf.fr/crela2013 -----SP----------------------------------------------------------------- Petición de contribuciones Culturas de investigación en lingüística aplicada Coloquio internacional Organizado por: ATILF (CRAPEL), Asociación Francesa de Lingüística Aplicada (AFLA) y varias otras asociaciones patrocinadoras (ACEDLE, APLIUT, APLV, ARDAA, ASDIFLE, ATALA, GERALS, GERAS, GERES, RANACLES, SFT, SHESL, UPLEGESS)1 Del 14 al 16 de noviembre de 2013, Nancy, Universidad de Lorena, Francia Fecha límite ampliada hasta el 30 de junio de 2013 En Francia, durante la segunda mitad del siglo XX, el concepto de "linguistique appliquée" ha cedido lugar, por razones de política científica, a una especialización por sectores. La lista de esos campos de estudio es larga: adquisición/aprendizaje, bi/multilingüismo, didáctica de lenguas, lexicografía, lingüística de corpus, terminología, traductología, tratamiento automático de idiomas, variación lingüística. En otras culturas, bajo esta misma denominación abarcadora (applied linguistics en inglés, angewandte linguistik en alemán, lingüística aplicada en español), diferentes campos científicos interactúan y se enriquecen mutuamente. En todas partes del mundo, las expectativas políticas incitan a más inter-/ trans-/ multidisciplinariedad. ¿En qué situación se encuentra hoy la noción de "lingüística aplicada" en Francia? ¿Es operativa para definir un terreno fértil que pueda reducir el fraccionamiento de este campo? El coloquio internacional "Culturas de investigación en lingüística aplicada" reunirá a investigadores y otros actores de diferentes disciplinas que desean posicionarse en el campo de la lingüística aplicada con el propósito de entrecruzar puntos de vista sobre las prácticas y los contenidos de las actuales investigaciones. Dentro de este marco, se esperan propuestas de comunicación en uno de los cuatro ejes del coloquio: Referentes teóricos de las disciplinas en sus diferentes campos (diacronía, prospectiva de la investigación, interrelaciones, etc.) Modelización y teorías (aproximación de varios ámbitos al mismo tiempo, etc.) Metodología, instrumentos y recursos (enfoques privilegiados, métodos mixtos, publicaciones, transmisión de conocimiento, etc.) Noción de "práctica" en lingüística aplicada (análisis de campos específicos, enfoque comparatista, etc.) Varia (nuevo). Dentro de la problemática de los organizadores, toda comunicación que describa investigaciones situadas en la encrucijada de varios dominios de la lingüística aplicada puede corresponder con los objetivos de este coloquio. Conferenciantes Bernd Rüschoff (Presidente de AILA) Anne Condamines (Universidad Toulouse Le Mirail, CNRS, CLLE) Jean-Paul Narcy-Combes (Universidad Sorbonne Nouvelle, DILTEC, AFLA) Fernand Carton (Universidad de Lorraine) Propuestas Las propuestas de comunicación (duración: 20 minutos + 10 minutos de preguntas) deben ser enviadas directamente a través de la página web (http://atilf.fr/crela2013) antes del 30 de junio de 2013. La primera página incluirá nombres y apellidos, afiliación, correo electrónico, teléfono y dirección postal de cada autor. La segunda página, enteramente anónima, constará del título de la ponencia, en francés o en inglés, seguido de un resumen de 500 palabras (paginación estándar, formato Word/PDF) incluyendo como máximo de tres a cinco referencias bibliográficas. Las propuestas serán sometidas a una doble evaluación anónima (notificación el 15 de septiembre de 2013). Lenguas del coloquio Francés e inglés. Se aceptarán también comunicaciones en otras lenguas pero tendrán que estar acompañadas de una presentación (PowerPoint) en francés o inglés. Publicaciones Se publicarán las actas del coloquio y las comunicaciones seleccionadas integrarán una publicación especial de: artículos cortos (en un máximo de 2.000 palabras) basados en las ponencias para una difusión en línea; artículos largos (en un máximo de 6.000 palabras) sometidos de nuevo a una doble evaluación anónima del comité científico para una publicación en papel de editor profesional. Nancy, ciudad simbólica La AFLA es la rama francesa de la AILA (Asociación Internacional de Lingüística Aplicada). Estas dos asociaciones han sido creadas en Nancy, en octubre de 1964. Los organizados de la época eran Bernard Pottier (profesor en Estrasburgo y encargado de cursos en Nancy), primer presidente de la AILA, el rector Paul Imbs (que acababa de publicar el Trésor de la Langue Française), el decano Jean Schneider, Yves Chalon, quien crearía luego el CRAPEL (Centre de Recherches et d'Applications Pédagogiques en Langues). Las temáticas que predominaban eran la "traducción mecánica", como se decía en aquel entonces, la enseñanza de idiomas y la cooperación científica en Europa. El objetivo de la AFLA es "promover y coordinar las investigaciones en todos los campos de la lingüística aplicada, y animar la cooperación interdisciplinaria e internacional en esa materia". Y es precisamente en Nancy que la AFLA se vuelve a encontrar en 2013 para preparar el coloquio mundial de la AILA que tendrá lugar del 10 al 15 de agosto de 2014 en Brisbane (Australia). Cómo llegar El coloquio tendrá lugar en el Campus Letras y Ciencias Humanas de la Universidad de Lorena en Nancy. Esta ciudad es de fácil acceso: está a 1 h 30 de París en tren; ciertas correspondencias pasan por la estación Lorraine TGV (a 45 minutos de Nancy en autobús). Existen también vuelos que llegan hasta los aeropuertos de Metz-Nancy, Luxemburgo y Estrasburgo. Jornada NEQ El miércoles 13 de noviembre de 2013, en vísperas de la apertura del coloquio, en el mismo lugar e integrada a éste, tendrá lugar la Jornada de Estudio de la ACEDLE (Association des Chercheurs et Enseignants Didacticiens des Langues Étrangères) titulada "Notions en Questions" sobre los "corpus en didáctica de lenguas". Desde hace algunos años, la noción de "corpus" está muy presente en las investigaciones de lingüística y didáctica de las lenguas. Sin embargo, esta noción agrupa una amplia gama de definiciones que no concuerdan entre sí. Esta Jornada NeQ tratará de clarificar este concepto en relación a los aprendientes, los docentes y las lenguas. Los oradores serán Kate Beeching (University of the West of England, Reino Unido), Natalie Kübler (CLILLAC-ARP, Université Paris Diderot - Paris 7), Ana Frankenberg-Garcia (ISLA-Campus Lisboa, Portugal) y Sylvie De Cock (Centre for English Corpus Linguistics, Universidad Católica de Lovaina, Bélgica). Comité científico José Aguilar (Université Sorbonne Nouvelle, DILTEC), Judith Barna (Université d'Artois, RECIFES, ARDAA), Fabrice Barthélémy (Université de Franche-Comté, ASDIFLE), Séverine Behra (Université de Lorraine, ATILF), Jean-Claude Bertin (Université du Havre, IDEES-CIRTAL, GERAS), Didier Bottineau (Université Paris Ouest, MODYCO, UPLEGESS), Alex Boulton (Université de Lorraine, ATILF), Cédric Brudermann (Université Pierre et Marie Curie, DILTEC), Peggy Candas (Université de Lorraine, ATILF, RANACLES), Danielle Candel (Université Paris-Diderot, CNRS, HTL, SHESL), Francis Carton (Université de Lorraine, ATILF), Anne Château (Université de Lorraine, ATILF, RANACLES), Anne Condamines (Université Toulouse Le Mirail, CLLE), Jean-Marc Delagneau (Université du Havre, IDEES, GERALS, APLV), Marc Deneire (Université de Lorraine, ATILF), Loïc Depecker (Université Sorbonne Nouvelle, EA 1483, SFT), Martine Derivry (Université Paris 6, DILTEC), Aura Luz Duffé Montalván (Université Rennes 2, GERES), Jörg Eschenauer (École Nationale des Ponts Paris Tech, UPLEGESS), Jacqueline Feuillet (Université de Nantes, CRINI, AFLA), Dan Frost (Université de Savoie, LLS, APLIUT), Laurent Gautier (Université de Bourgogne, CITIL, GERALS), Daniel Gile (Université Sorbonne Nouvelle, EA 2290), John Humbley (Université Paris-Diderot-Paris 7, CLILLAC-ARP), Natalie Kübler (Université Paris-Diderot-Paris 7, CLILLAC-ARP), Dominique Macaire (Université de Lorraine, ATILF, ACEDLE), Latisha Mary (Université de Lorraine, ATILF), Carlos Meléndez (Université de Lorraine, ATILF), Aliyah Morgenstern (Université Sorbonne Nouvelle, PRISMES), Jean-Paul Narcy-Combes (Université Sorbonne Nouvelle, DILTEC, AFLA), Marie-Françoise Narcy-Combes (Université de Nantes, CRINI, ACEDLE), Claude Normand (Université de Lorraine, ATILF), Patrick Paroubek (LIMSI CNRS), Myriam Pereiro (Université de Lorraine, ATILF), Annick Rivens Mompean (Université Lille 3, STL, RANACLES), Marcelo Tano (École Nationale d'Ingénieurs de Metz, GERES), Linda Terrier (Université Toulouse-Le Mirail, CAS, APLIUT), Denyze Toffoli (Université de Strasbourg, ACEDLE), Enrique Sánchez Albarracín (INSA Lyon, EVS-ITUS, UPLEGESS), Claire Tardieu (Université Sorbonne Nouvelle, ARDAA), Mathieu Valette (INALCO, ERTIM), Daniel Véronique (Université Aix-Marseille, Langage et Parole), Geoffrey Williams (Université Bretagne du Sud, AFLA). Comité de pilotaje Coordinación nacional: Jean-Paul Narcy-Combes Coordinador local: Francis Carton Representantes de asociaciones: Danielle Candel, John Humbley, Dominique Macaire Comité organizador Séverine Behra, Alex Boulton, Peggy Candas, Marc Deneire, Dominique Macaire, Latisha Mary, Claude Normand, Myriam Pereiro (ATILF-Université de Lorraine, CNRS) Cédric Brudermann (Université Pierre et Marie Curie, DILTEC) José Aguilar (Université Paris 3, DILTEC) Marcelo Tano (ENI Metz) Contacto Francis Carton : crela2013 at atilf.fr Crapel-ATILF, CNRS, Université de Lorraine, 23 bd Albert 1er, BP 13397, 54015 Nancy cedex, France. Página web http://atilf.fr/crela2013 ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 18:35:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 20:35:31 +0200 Subject: Conf: Plate-forme de l'Intelligence Artificielle - PFIA - 1 au 5 juillet, Lille Message-ID: Date: Sun, 02 Jun 2013 20:23:27 +0200 From: Maxime MORGE Message-ID: <51AB8D9F.2010605 at univ-lille1.fr> X-url: http://pfia2013.univ-lille1.fr La date limite pour bénéficier des tarifs préférentiels est dimanche 9 juin. Nos excuses pour les réceptions multiples. Ne pas hésiter à diffuser. -- PLATE-FORME de L'INTELLIGENCE ARTIFICIELLE 2013 1-5 juillet 2013 Lille http://pfia2013.univ-lille1.fr Organisée sous l'égide de l'AFIA tous les deux ans depuis 1999, la plate-forme de l'IA (PFIA) a pour objectif de réunir chercheurs, industriels et étudiants autour de conférences et d'ateliers consacrés à l'Intelligence Artificielle. En 2013, la plate-forme est organisée à Lille sur le campus de Villeneuve d'Ascq. Elle accueille six conférences nationales majeures en IA : * Conférence d'Apprentissage (CAp) * Journées francophones d'Ingénierie des Connaissances (IC) * Journées Francophones Planification, Décision, et Apprentissage pour la conduite de systèmes (JFPDA) * Journées Francophones sur les Systèmes Multi-Agents (JFSMA) * Journées francophones sur les Modèles Formels de l'Interaction (MFI) * Rencontres des Jeunes Chercheurs en Intelligence Artificielle (RJCIA) La plate-forme de l'IA intègre par ailleurs 12 ateliers thématiques représentatifs des thèmes portés par les conférences. Toutes les informations concernant l'organisation des conférences et des ateliers (CFP, deadline) peuvent être trouvées sur le site Internet de la plate-forme : http://pfia2013.univ-lille1.fr. La plate-forme de l'IA constitue un point de rencontre unique et convivial pour la communauté IA afin de rapprocher les différentes disciplines qui la composent et d'établir des passerelles entre elles. À cette intention, l'AFIA participe activement à faire de cet événement un lieu qui s'adresse à l'ensemble de la communauté francophone d'Intelligence Artificielle, notamment au travers de : * la tarification proposée pour accéder à la conférence. L'inscription aux 5 jours de conférences n’excède pas 360€, pauses et repas du midi compris ; * la réduction sur le tarif d'inscription proposée aux adhérents de l'AFIA permet d'accéder aux 5 jours de conférences pour 300€, pauses et repas du midi compris. Maxime Morge, pour le comité d'organisation PFIA2013. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 18:03:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 20:03:04 +0200 Subject: Appel: PT-AI 2013 - "Philosophy and Theory of Artificial Intelligence", Oxford, 21-22.09.2013 Message-ID: Date: Sat, 1 Jun 2013 12:37:38 +0300 From: Vincent C. Müller Message-Id: X-url: http://www.pt-ai.org/2013/ - - - please circulate - - - ANNOUNCEMENT & CALL FOR PAPERS Conference PT-AI 2013 - “Philosophy and Theory of Artificial Intelligence” 21-22.09.2013 Oxford, St. Antony's College http://www.pt-ai.org/2013/ INVITED SPEAKERS Jean-Christophe Baillie (Aldebaran Robotics, Paris) Theodore Berger (University of Southern California, L.A.) Selmer Bringsjord (Rensselaer Polytechnic Institute, Troy, NY) Daniel C. Dennett (Tufts University, Boston) Luciano Floridi (University of Hertfordshire & Oxford) Stuart J Russell (UC Berkeley) Murray Shanahan (Imperial College, London) Michael Wheeler (University of Stirling, Scotland) ========================================= ABSTRACTS We request anonymous abstracts of 600-1000 words (plus references) in plain text or PDF, plus a short abstract of up to 120 words. Accepted papers will be presented at the conference and published in the proceedings. (We plan to provide a copy of the proceedings to the corresponding author.) We foresee slots of at least 30 minutes per talk, including discussion. All submissions will be reviewed double-blind by at least two members of the programme committee. Submission online at EasyChair: https://www.easychair.org/conferences/?conf=ptai13 ========================================= DATES Deadline for submission of abstracts: 21.06.2013 Decisions announced: 12.7.2013 Conference: 21-22.09.13 Deadline for submission of full papers: 30.11.13 ========================================= THEMES Participants from all disciplines that are relevant for fundamental issues of present and future AI, especially cognitive science, computer science, neuroscience and philosophy. A broad framework is set by questions like: What are the necessary conditions for artificial intelligence (if any); what are sufficient ones? What do these questions relate to the conditions for intelligence in humans and other natural agents? What are the ethical and societal problems that artificial intelligence raises, or will raise? Some of the key issues will be: - AI and cognitive science - consciousness - dynamical systems - embedded, situated, distributed cognition, extended mind - embodiment, enaction, morphology - ethics of AI and robotics - brain emulation and simulation - goals, emotions, values, free will - hybrid systems, cyborgs - information - intelligence and intelligence testing - intentionality - interactive systems - learning and evolution - multi-agent systems - notions and forms of computing for AI - perception - probabilistic systems - reasoning - social impact of present and future AI - super-intelligence - ... ========================================= PUBLICATION Details on the publication for 2013 are not yet finalized. The papers from the 2011 event were published in a special volume of 'Minds and Machines' (22/2, with papers by Bostrom, Dreyfus, Gomila, O'Regan, Shagrir) and in an edited volume of the SAPERE series with Springer. http://www.springerlink.com/content/0924-6495/22/2/ http://www.springer.com/engineering/robotics/book/978-3-642-31673-9 ========================================= REGISTRATION Online registration will open early June. Participation fee will be £110, reduced £55. Accommodation at St. Antony's is available. Thank you for your time, Vincent C. Müller Chair, PT-AI 2013 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:50:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:50:03 +0200 Subject: Conf: Linguistique et Traitement Automatique de la Langue pour l'Aeronautique et l'Espace, 2 juillet 2013, Universite Toulouse 2 Le Mirail Message-ID: Date: Mon, 03 Jun 2013 10:11:02 +0200 From: Condamines Message-ID: <51AC4F96.8020402 at univ-tlse2.fr> X-url: http://w3.erss.univ-tlse2.fr/textes/seminaires/lingTALaerospace.html Linguistique et Traitement Automatique de la Langue pour l'Aéronautique et l'Espace : Dimensions langagières du risque 2 juillet 2013, Université Toulouse 2 Le Mirail Atelier organisé par le Laboratoire CLLE et l'Université Toulouse 2 le Mirail, avec le soutien du Réseau Thématique de Recherche Avancée-Sciences et Technologie pour l'Aéronautique et l'Espace et le parrainage du Pôle Aerospace Valley. Dans les dix dernières années, de nombreux projets se sont mis en place en linguistique appliquée comme en traitement automatique des langues pour favoriser une meilleure gestion de la communication dans les domaines "risqués". L'aéronautique et le spatial relèvent de ces domaines dans la mesure où des vies humaines sont impliquées et des sommes d'argent colossales sont investies. Quelle soit orale ou écrite, la communication dans ces domaines se fait la plupart du temps au moyen de la langue naturelle. Or, la langue n'est pas un moyen de transmission d'information parfait. En effet, elle fonctionne avec de l'implicite, des ambiguïtés, du flou, elle fait appel à des connaissances supposées partagées, etc. Par ailleurs, la production d'une masse pléthorique de documents non structurés constitue un frein à l'exploitation des informations qui s'y trouvent exprimées. L'objectif de l'atelier est de faire se rencontrer des chercheurs en linguistique, traitement automatique des langues et ingénierie des connaissances et des professionnels de l'aéronautique et du spatial afin de présenter un panorama des besoins et des réponses qui peuvent être faites en matière de gestion de la dimension langagière du risque. Inscription gratuite mais obligatoire, avant le 26 juin. http://w3.erss.univ-tlse2.fr/textes/seminaires/lingTALaerospace.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:53:25 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:53:25 +0200 Subject: Ecole: IQLA-GIAT, ecole d'ete d'analyse quantitative de donnees textuelles, 16-20 Sept. Padoue, Italie Message-ID: Date: Mon, 03 Jun 2013 14:04:23 +0200 From: Serge Heiden Message-ID: <51AC8647.3030506 at ens-lyon.fr> [Apologies for cross-postings] IQLA-GIAT Summer School in Quantitative Analysis of Textual Data University of Padua, 16-20 September 2013 ============================================================== Presentation ----------------- The analysis of textual data and large corpora is an object of research in many sectors of linguistics, computer sciences, mathematics and statistics and is used as a research tool within a number of disciplines such as psychology, sociology, sociolinguistics, education, history, political studies, communication and media studies. The recent evolution of information technologies (IT) and quantitative methods has led to a number of distinct but interrelated sectors (e.g. computational linguistics, information retrieval, natural language processing, text mining, sentiment analysis, opinion mining, etc.) with interesting industrial applications (e.g. electronic dictionaries, artificial intelligence, computer-aided translation) and, today, text analysis is an umbrella term referring to a wide range of qualitative, quantitative and mixed-methods approaches. Recent studies have repeatedly stressed the need for developing, adopting and sharing interdisciplinary approaches and the IQLA-GIAT Summer School is the ideal environment for developing innovative analytical tools by pooling together the research methods of both Quantitative Linguistics and the Statistical Analysis of Textual Data. Teaching activities will raise questions that can be answered thanks to quantitative methods implemented within a text analysis framework and other procedures which may be used to identify and compare the characteristics of texts. The aim is to discuss with students, young researchers and scholars of different disciplines the strengths, weaknesses, opportunities and threats of quantitative methods for text analysis. Specific skills will be developed mainly with reference to the operating logic of software and tools, so that participants are trained to exploit different tools within the same environment and the same tool in different environments. Objectives -------------- The participants selected for the IQLA-GIAT Summer School have the opportunity to develop the necessary expertise to exploit integrated approaches to text analysis for a better understanding of the role played by theoretical issues, expected results and data and software selection. The IQLA-GIAT Summer School is aimed at: 1. sharing information on software, corpora, relevant literature and research results; 2. promoting a dialogue among different disciplines on actual research issues; 3. developing innovative analytical tools and integrated research methods; 4. introducing students and young researchers to new strains of research and applications; 5. sharing state-of-the-art knowledge in five main areas: a) Corpora and textual data collection b) Quantitative linguistics c) Authorship attribution d) Content mapping and data visualization e) Software for computer-aided analysis of textual data Classes ---------- All courses are taught in English The teaching staff includes researchers and experts from European universities: Toulose II, ENS Lion (France), Trier (Germany), Athens (Greece), Neuchatel (Switzerland), Bologna, Padova, Trieste, Roma "La Sapienza" (Italy). Teaching activities include lectures and lab sessions, as well as workshops illustrating software and tools. Credits --------- The IQLA-GIAT Summer School in Quantitative Analysis of Textual Data is organized by GIAT – Interdisciplinary Text Analysis Group (www.giat.org) in collaboration with the International Quantitative Linguistics Association (www.iqla.org) and the Department of Computational Linguistics of the University of Trier (www.uni-trier.de). The IQLA-GIAT Summer School is a project funded by the University of Padua (www.unipd.it), coordinated by prof. Arjuna Tuzzi (University of Padua). Schedule ----------- The IQLA-GIAT Summer School will take place from Monday 16th to Friday 20th September 2013 The IQLA-GIAT Summer School is a full-time intensive course held on - Monday from 10.30 am to 6.00 pm - Tuesday through Friday from 9:30 am to 6:00 pm Location ----------- University of Padua Department of Philosophy, Sociology, Education & Applied Psychology (Dipartimento di Filosofia, Sociologia, Pedagogia e Psicologia Applicata - FISPPA) Sociology buildings via Cesarotti, 10/12 I-35123 Padova, ITALY Application -------------- The IQLA-GIAT Summer School is open to 20 participants including researchers, scholars and postgraduate students. Applicants should send a file in pdf format including: - curriculum vitae - personal mission statement (max 500 words) - the request for ECTS credit (if needed - 3 CFU). Applications should be sent to the following address: summerschool.giat at unipd.it Application deadline: 9th August 2013 ---------------------------------------------- Selection criteria privilege foreign (i.e. non-Italian) applicants and younger candidates to encourage participation from different countries and comply with gender equality. Candidates will receive a confirmation of acceptance by 16th August 2003 Tuition fee: 220 € Inscription deadline: 30th August 2013 ---------------------------------------------- Final Assessment --------------------- 1) All participants will be requested to fill in a questionnaire to assess the main aspects of the IQLA-GIAT Summer School (e.g. organization, teaching, materials, facilities and equipment, expectations, satisfaction rate, suggestions etc.). 2) If they wish to receive ECTS credits (3 CFU), participants shall take a written test including 30 multiple choice questions (one correct answer out of four). The passing grade is 15 correct answers. Grades will reflect the sum of all correct answers (one point) according to the following range: A (29-30 points); B (25-28 points); C (21-24 points); D (17-20 points); E (15-16 points). Secretariat ------------- Claudia Andreatta, Ph.D. summerschool.giat at unipd.it For any further information and details about terms, deadlines, application forms and payment modalities, please contact: summerschool.giat at unipd.it or arjuna.tuzzi at unipd.it. ======================================================================== Provisional program Introduction 1. Collecting Corpora (Stefano Ondelli, University of Trieste, Italy) 2. LAB – Collecting Corpora on the Web (Alberto Cammozzo, IT expert, Italy) 3. Qualitative vs. Quantitative Approaches (Alberta Contarello, University of Padua, Italy) 4. Quantitative Measures in Linguistics (Reinhard Köhler, University of Trier, Germany) Quantitative Linguistics 5. Measures of Lexical Richness (Sven Neumann, University of Trier, Germany) 6. Linguistics Laws ( Andrej Beliankou, University of Trier, Germany) 7. LAB – Probability distributions (Sven Neumann , Andrej Beliankou, University of Trier, Germany) 8. Quantitative Syntax Analysis (Reinhard Köhler, University of Trier, Germany) Authorship Attribution 9. Authorship Attribution I (Jacques Savoy, University of Neuchatel, Switzerland) 10. Authorship Attribution II (Mirko Degli Esposti, University of Bologna, Italy) 11. Authorship Attribution III (George Mikros, University of Athens, Greece) Content Mapping and Data Visualization 12. LAB – Profiling (George Mikros, University of Athens, Greece) 13. LAB – Content Mapping (Arjuna Tuzzi, University of Padua, Italy) Software (Workshop) 14. LAB – Software Iramuteq (Pierre Ratinaud, University of Toulose II, France) 15. LAB – Software TXM (Serge Heiden, ENS Lion, France) 16. LAB – Software Taltac (Isabella Chiari, University of Rome "La Sapienza", Italy) 17. LAB – in progress ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:55:16 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:55:16 +0200 Subject: Ecole: SSTiC 2013: next registration deadline 26 June, Tarragona, Spain, July 22-26, 2013 Message-ID: Date: Sun, 2 Jun 2013 22:13:01 +0200 From: "GRLMC" Message-ID: X-url: http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* 2013 INTERNATIONAL SUMMER SCHOOL ON TRENDS IN COMPUTING SSTiC 2013 Tarragona, Spain July 22-26, 2013 Organized by Rovira i Virgili University http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* +++ next registration deadline: June 26 +++ ********************************************************************* AIM: SSTiC 2013 will be an open forum for the convergence of top class well recognized computer scientists and people at the beginning of their research career (typically PhD students) as well as consolidated researchers. SSTiC 2013 will cover the whole spectrum of computer science by means of 59 six-hour courses dealing with hot topics at the frontiers of the field. By actively participating, lecturers and attendees will share the idea of scientific excellence as the main motto of their research work. ADDRESSED TO: Graduate students from around the world. There are no pre-requisites in terms of the academic degree the attendee must hold. However, since there will be several levels among the courses, in the description of some of them reference may be made to specific knowledge background. SSTiC 2013 is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. Finally, senior researchers will find it fruitful to listen and discuss with people who are main references of the diverse branches of computing nowadays. REGIME: 7 parallel sessions will be held during the whole event. Participants will be able to freely choose the courses they will be willing to attend as well as to move from one to another. VENUE: Palau Firal i de Congressos de Tarragona Arquitecte Rovira, 2 43001 Tarragona http://www.palaucongrestgna.com COURSES AND PROFESSORS: Shun-ichi Amari (Riken) [introductory] Information Geometry and Its Applications James Anderson (Chapel Hill) [intermediate] Scheduling and Synchronization in Real-Time Multicore Systems Pierre Baldi (Irvine) [intermediate] Big Data Informatics Challenges and Opportunities in the Life Sciences Yoshua Bengio (Montréal) [introductory/intermediate] Deep Learning of Representations Stephen Brewster (Glasgow) [advanced] Multimodal Human-Computer Interaction Bruno Buchberger (Linz) [introductory] Groebner Bases: An Algorithmic Method for Multivariate Polynomial Systems. Foundations and Applications Rajkumar Buyya (Melbourne) [intermediate] Cloud Computing Jan Camenisch (IBM Zurich) [intermediate] Cryptography for Privacy Jeffrey S. Chase (Duke) [intermediate] Trust Logic as an Enabler for Secure Federated Systems Larry S. Davis (College Park) [intermediate] Video Analysis of Human Activities Paul De Bra (Eindhoven) [intermediate] Adaptive Systems Paul Dourish (Irvine) [introductory] Ubiquitous Computing in a Social Context Max J. Egenhofer (Maine) [introductory/intermediate] Qualitative Spatial Relations: Formalizations and Inferences Richard M. Fujimoto (Georgia Tech) [introductory] Parallel and Distributed Simulation David Garlan (Carnegie Mellon) [advanced] Software Architecture: Past, Present and Future Mario Gerla (Los Angeles) [intermediate] Vehicle Cloud Computing Georgios B. Giannakis (Minnesota) [advanced] Sparsity and Low Rank for Robust Data Analytics and Networking Ralph Grishman (New York) [intermediate] Information Extraction from Natural Language Francisco Herrera (Granada) [intermediate] Imbalanced Classification: Current Approaches and Open Problems Paul Hudak (Yale) [introductory] Euterpea: From Signals to Symphonies Using Haskell Niraj K. Jha (Princeton) [intermediate] FinFET Circuit Design George Karypis (Minnesota) [introductory] Introduction to Parallel Computing: Architectures, Algorithms, and Programming Aggelos K. Katsaggelos (Northwestern) [intermediate/advanced] Sparsity-based Advances in Image Processing Arie E. Kaufman (Stony Brook) [advanced] Advances in Visualization Hugo Krawczyk (IBM Research) [intermediate] An Introduction to the Design and Analysis of Authenticated Key Exchange Protocols Pierre L'Ecuyer (Montréal) [intermediate] Quasi-Monte Carlo Methods in Simulation: Theory and Practice Laks Lakshmanan (British Columbia) [intermediate/advanced] Information and Influence Spread in Social Networks Wenke Lee (Georgia Tech) [introductory] DNS-based Monitoring of Malware Activities Maurizio Lenzerini (Roma La Sapienza) [intermediate] Ontology-based Data Integration Ming C. Lin (Chapel Hill) [introductory/intermediate] Physically-based Modeling and Simulation Jane W.S. Liu (Academia Sinica) [intermediate] Critical Information and Communication Technologies for Disaster Preparedness and Response Satoru Miyano (Tokyo) [intermediate] How to Hack Cancer Systems with Computational Methods Aloysius K. Mok (Austin) [intermediate] From Real-time Systems to Cyber-physical Systems Hermann Ney (Aachen) [intermediate/advanced] Probabilistic Modelling for Natural Language Processing - with Applications to Speech Recognition, Handwriting Recognition and Machine Translation Cathleen A. Norris (North Texas) & Elliot Soloway (Ann Arbor) [introductory] Primary & Secondary Educational Computing in the Age of Mobilism Jeff Offutt (George Mason) [intermediate] Cutting Edge Research in Engineering of Web Applications David Padua (Urbana) [intermediate] Parallel Programming with Abstractions Bijan Parsia (Manchester) [introductory] The Semantic Web: Conceptual and Technical Foundations Massoud Pedram (Southern California) [intermediate] Energy Efficient Architectures and Information Processing Systems Charles E. Perkins (FutureWei) [intermediate/advanced] Beyond 4G Prabhakar Raghavan (Google) [introductory/intermediate] Web Search and Advertising Sudhakar M. Reddy (Iowa) [introductory] Design for Test and Test of Digital VLSI Circuits Phillip Rogaway (Davis) [introductory/intermediate] Provably Secure Symmetric Encryption Gustavo Rossi (La Plata) [intermediate] Topics in Model Driven Web Engineering Kaushik Roy (Purdue) [introductory/intermediate] Low-energy Computing Robert Sargent (Syracuse) [introductory] Validating Models Douglas C. Schmidt (Vanderbilt) [intermediate] Patterns and Frameworks for Concurrent and Networked Software Bart Selman (Cornell) [intermediate] Fast Large-scale Probabilistic and Logical Inference Methods Mubarak Shah (Central Florida) [intermediate/advanced] Visual Crowd Surveillance Ron Shamir (Tel Aviv) [introductory] Revealing Structure in Disease Regulation and Networks Dawn Xiaodong Song (Berkeley) [introductory] Selected Topics in Computer Security Mike Thelwall (Wolverhampton) [introductory] Sentiment Strength Detection for the Social Web Julita Vassileva (Saskatchewan) [introductory/intermediate] Engaging Users in Social Computing Systems Philip Wadler (Edinburgh) [introductory] Topics in Lambda Calculus and Life Yao Wang (Polytechnic New York) [introductory/advanced] Video Compression: Fundamentals and Recent Development Gio Wiederhold (Stanford) [introductory] Software Economics: How Do the Results of the Intellectual Efforts Enter the Global Market Place Limsoon Wong (National Singapore) [introductory/intermediate] The Use of Context in Gene Expression and Proteomic Profile Analysis Michael Wooldridge (Oxford) [introductory] Autonomous Agents and Multi-Agent Systems Ronald R. Yager (Iona) [introductory/intermediate] Fuzzy Sets and Soft Computing Philip S. Yu (Illinois Chicago) [advanced] Mining Big Data REGISTRATION: It has to be done at http://grammars.grlmc.com/SSTiC2013/Registration.php Since the capacity of the venue is limited, registration requests will be processed on a first come first served basis. The registration period will be closed when the capacity of the venue will be complete. FEES: They are the same (a flat rate) for all people by the corresponding deadline. They give the right to attend all courses. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Participants will be delivered a certificate of attendance. IMPORTANT DATES: Announcement of the programme: January 26, 2013 Six registration deadlines: February 26, March 26, April 26, May 26, June 26, July 26, 2013 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat POSTAL ADDRESS: SSTiC 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Departament d’Economia i Coneixement, Generalitat de Catalunya Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:56:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:56:45 +0200 Subject: Q: Masters en industrie des langues (suite) Message-ID: Date: Mon, 3 Jun 2013 12:16:19 +0000 From: Message-ID: <14483_1370261793_51AC8920_14483_692_2_ED32B5012BA99F4AA999E2765EF060F20C00BD at PEXCVZYM12.corporate.adroot.infra.ftgroup> Bonjour, et merci à ceux qui m'ont déjà adressé des informations au sujet de leurs Masters en industries des langues. J'ai reçu deux questions sur l'objet de cette requête. Le but est de renseigner un rapport "interne" dans lequel seront recensés : - les principales équipes académiques travaillant dans le TALN (extraction d'information). - les principaux industriels travaillant dans le TALN (extraction d'information). - les réseaux du domaine. - les principaux masters en ingénieries des langues. - les principales conférences du domaine. - les journées thématiques. - les principales revues. - des livres, ... - etc. Le but derrière est de faire des choix de partenariat par exemple. Merci. Malek Boualem Abdel-Malek Boualem R&D Project Manager France Telecom Orange Labs FT/OLNC/OLPS/OPENSERV/CONTENT/FAST Phone : +33 (0)2 96 05 29 83 Mobile : +33 (0)6 85 71 40 63 Email : malek.boualem at orange.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:59:09 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:59:09 +0200 Subject: Job: CDI, Synapse Developpement Message-ID: Date: Mon, 3 Jun 2013 15:25:14 +0200 From: Patrick Séguéla Message-ID: <00cd01ce605d$c880c3b0$59824b10$@synapse-fr.com> X-url: http://www.synapse-developpement.fr/ Poste à pourvoir en CDI, Synapse Développement (http://www.synapse-developpement.fr/) Synapse Développement, société leader dans la mise à disposition de ressources et de technologies à base de linguistique pour le français et l’anglais, recherche un docteur-ingénieur en informatique, pour intégrer son équipe de recherche et développement basée à Toulouse. VOS MISSIONS : - Vous participez aux projets de recherche et développement de notre équipe. Ces projets peuvent être en collaboration avec des laboratoires académiques et entreprises européennes innovantes. Ils peuvent aussi être amenés par des clients désireux de créer un nouveau service. - Veille technologique sur les domaines comme le Machine Reading, le Machine Learning, les systèmes de Question/Réponse ou l’extraction d’entités nommées. - Possibilité de publication dans des conférences internationales - Prise en main et développement de la technologie d’analyse de texte et des applications commercialisées par Synapse Développement. PROFIL : Titulaire d’un doctorat ou diplôme équivalent. Vous êtes curieux, dynamique et passionné par la compréhension de textes par les ordinateurs. Vous aimez les défis technologiques et vous aimez résoudre de manière pragmatique des problèmes complexes. Vous avez envie de vous impliquer dans une équipe pluridisciplinaire. Vous avez envie de participer à l’aventure d’une petite société où l’activité de recherche et développement est très importante Compétences techniques : - Bonne connaissance des langages objets - Maîtrise du développement ASP ou JAVA. - Connaissance des standards du TAL - Connaissance des bases de données textuelles (Cassandra, Mongo DB, etc.) serait un plus. SOCIETE : Synapse Développement crée des applications de valorisation de contenus et d’analyse de données textuelles. Des entreprises comme Amazon et Microsoft embarquent nos technologies dans leurs produits, celles-ci étant donc utilisées aujourd’hui par des millions de personnes. Synapse a été créée en 1994 et sa première application a été le logiciel Cordial, correcteur d’orthographe et grammaire de référence pour le français. Dès 1994, l'accent a été mis sur l’innovation et sur la qualité des produits. Le correcteur Cordial est aujourd’hui un outil qui surclasse par sa précision les outils de correction intégrés dans les suites bureautiques ou gestionnaires de courriels du marché. Passionnés par la langue et souhaitant accompagner nos clients dans l’aide à la rédaction, nous avons édité de nombreuses ressources numériques tels que des dictionnaires de définitions et de synonymes. Ces ressources sont aujourd’hui les plus complètes pour le français et sont largement diffusées sous les formes les plus diverses : sites Internet, applications mobiles ou encore marque-pages numériques ! Par ailleurs, nous offrons des solutions aux entreprises qui souhaitent valoriser leurs contenus Internet ou analyser d’importants volumes de textes, issus des réseaux sociaux par exemple. Depuis 20 ans notre équipe R&D développe des algorithmes qui permettent à une machine de comprendre un texte. Nous sommes aujourd’hui capables de comprendre, résumer, classer, analyser la tonalité d’un contenu, l’indexer automatiquement et relier les documents entre eux, afin de présenter ces analyses de façon originale dans des scénarios de publication apportant une réelle plus-value au lecteur. La société emploie aujourd’hui une dizaine de personnes. Contact : Synapse Développement Mail : direction at synapse-fr.com Tel : 06.63.38.69.06 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:05:46 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:05:46 +0200 Subject: Livre: Analyses linguistiques sur corpus Message-ID: Date: Tue, 4 Jun 2013 10:54:59 +0200 From: "Ana Ars" Message-ID: <00a001ce6101$31b54d30$951fe790$@fr> X-url: http://editions.lavoisier.fr/notice.asp?ouvrage=2724386 Analyses linguistiques sur corpus Subordination et insubordination en français Traité Cognition et Traitement de l’Information (IC2) dirigée par Jean-Marie Pierrel sous la direction de Jeanne-Marie Debaisieux ISBN : 978-2-7462-4532-7 - Format : 16 x 24 - 504 p. - 170 € Editions Lavoisier Hermes Une étude qui renouvelle la question de la complexité et de l’intégration syntaxique Cet ouvrage se propose de revisiter de façon originale la notion de subordination en français dans la perspective de la linguistique de corpus. Après des chapitres d’introduction où est présenté un cadre descriptif inspiré de l'Approche pronominale étendue à la macrosyntaxe dans la ligne des travaux pionniers de C. Blanche-Benveniste, il rassemble un ensemble d’études monographiques des principaux types de conjonctions de subordination du français à partir d'analyses quantitatives et qualitatives d’exemples tirés de corpus écrits et oraux prenant en compte les variations attachées à divers genres de texte dans les deux domaines. Ces études synchroniques révèlent l’importance de ces morphèmes, généralement étudiés comme de simples outils grammaticaux, dans l’organisation du discours et la gestion de l’interaction. Elles sont mises en perspective avec une étude diachronique et une étude sur l’acquisition des structures. Les résultats renouvellent la question de la complexité et de l’intégration syntaxique. Consulter la présentation et le sommaire détaillés de l'ouvrage (http://editions.lavoisier.fr/notice.asp?ouvrage=2724386) Ana ARS Service de Presse LAVOISIER SAS Editions / EM Inter / Hermes / Synthèse agricole / Médecine Sciences Publications 14 rue de Provigny 94236 Cachan Cedex 01.47.40.67.63 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:00:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:00:32 +0200 Subject: Appel: Call for demonstrations, SIGDIAL 2013 Conference, 22-24 August 2013 Message-ID: Date: Mon, 3 Jun 2013 14:37:20 +0000 From: "Jason Williams (MSR)" Message-ID: <4532e36066c04fd4908f454b6c948566 at BY2PR03MB044.namprd03.prod.outlook.com> X-url: http://www.sigdial.org/workshops/conference14/ SIGDIAL 2013 CONFERENCE 14th Annual Meeting of the Special Interest Group on Discourse and Dialogue http://www.sigdial.org/workshops/conference14/ Metz, France 22-24 August 2013 CALL FOR DEMONSTRATIONS The program committee of SigDial 2013 welcomes the submission of demonstration descriptions. Demonstrations will be presented in special sessions, separate from short paper presentations and poster sessions. Accepted demonstration submissions will be published in a dedicated section of the conference proceedings. Demo descriptions should be no longer than 3 pages, including references. Demo submissions should follow the two-column ACL 2013 format. We strongly recommend the use of ACL LaTeX style files or Microsoft Word style files tailored for the ACL 2013 conference. Submissions must conform to the official ACL 2013 style guidelines (http://acl2013.org/site/call.html), and they must be electronic in PDF. Submissions will not be anonymous. Demonstrations which have appeared (or will appear) elsewhere may be presented at SigDial, although this should be noted at the time of submission. Authors are encouraged to submit additional supportive material such as video clips or sound clips and examples of available resources for review purposes. Submission is electronic using paper submission software at https://www.softconf.com/d/sigdial2013/ IMPORTANT DATES Demo Paper Submission Deadline Tuesday, 2 July 2013 (23:59, GMT-11) Demo Paper Notification Wednesday, 10 July 2013 Final Demo Paper Due Wednesday, 24 July 2013 Conference Thursday-Saturday, 22-24 August 2013 (Thu morning - Saturday mid-day) Any questions regarding submissions can be sent to the technical program co-chairs at program-chairs[at]sigdial.org. SigdDial 2013 Technical Program Co-Chairs Barbara Di Eugenio, University of Illinois at Chicago, USA Jason D. Williams, Microsoft Research, USA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:03:57 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:03:57 +0200 Subject: These: Baptiste Chardon, Chaine de traitement pour une approche discursive de l'analyse d'opinion Message-ID: Date: Tue, 4 Jun 2013 10:33:00 +0200 From: "Baptiste Chardon" Message-ID: <002c01ce60fe$1fd89390$5f89bab0$@synapse-fr.com> Bonjour, J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée : "Chaîne de traitement pour une approche discursive de l'analyse d'opinion" Cette soutenance se déroulera le mercredi 12 juin 2013 à 9h00, à l'IRIT, Université Paul Sabatier, 118 Route de Narbonne, 31400 TOULOUSE - salle des thèses. Vous êtes également cordialement conviés au pot qui suivra. Bien cordialement, Baptiste Chardon --------------------------------------- Le jury de soutenance sera composé de : Rapporteurs : Maite Taboada - Associate Professor (Simon Fraser University, Canada) Alexis Nasr - Professeur (LIF, Université Aix-Marseille) Examinateurs: Farah Benamara (Directrice de thèse) - Maître de conférences (IRIT, Université Paul Sabatier Toulouse 3) Nicholas Asher (Directeur de thèse) - Directeur de recherches (IRIT, Université Paul Sabatier Toulouse 3 - CNRS) Yvette Yannick Mathieu - Directeur de recherches (Université Paris 7 - CNRS) Florence Sèdes - Professeur (IRIT, Université Paul Sabatier Toulouse 3) Membre invité: Patrick Séguéla - Gérant (Synapse Développement, Toulouse) ------------------------------------------ Résumé La structure discursive d'un texte est un élément essentiel à la compréhension du contenu véhiculé par ce texte. Elle affecte, par exemple, la structure temporelle du texte, ou encore l'interprétation des expressions anaphoriques. La structure discursive a montré son utilité dans de nombreuses applications de TAL, telles que le résumé automatique, ou encore l’inférence textuelle. Dans cette thèse, nous aborderons les effets de la structure discursive sur l'analyse de sentiments. L’analyse des sentiments est un domaine de recherche extrêmement actif en traitement automatique des langues. En effet, ces dernières années ont vu se multiplier les sources de données textuelles porteuses d'opinion disponibles sur le web : avis d'internautes, de plus en plus centralisés par les moteurs de recherche, forums, réseaux sociaux, enquêtes consommateurs effectuées par les grandes marques. Devant cette abondance de données et de sources, l'automatisation de la synthèse des multiples avis devient cruciale pour obtenir efficacement une vue d'ensemble des opinions sur un sujet donné. L'intérêt de ces données est considérable, pour les sociétés qui souhaitent obtenir un retour client sur leurs produits ou leur image de marque comme pour les personnes souhaitant se renseigner pour un achat, une sortie, ou un voyage. La plupart des travaux actuels proposent une analyse des opinions au niveau du document ou au niveau de la phrase en ignorant la structure discursive. Dans cette thèse, nous nous plaçons dans le contexte de la théorie de la SDRT (Segmented Discourse Representation Theory) et proposons de répondre aux questions suivantes : - Existe-t-il un lien entre la structure discursive d’un document et les opinions émises dans ce même document ? - Quel est le rôle des relations de discours dans la détermination du caractère objectif ou subjectif d’un segment textuel ? - Quel est le rôle des éléments linguistiques, comme la négation et la modalité, lors de la détermination de la polarité d’un segment textuel subjectif ? - Quel est l’impact de la structure discursive lors de la détermination de l’opinion globale véhiculée dans un document ? - Est-ce qu'une approche basée sur le discours apporte une réelle valeur ajoutée comparée à une approche classique basée sur la notion de ‘sacs de mots’ ? - Cette valeur ajoutée est-elle dépendante du genre de corpus ? Afin de répondre à ces questions, nous proposons dans un premier temps un schéma d'annotation sur deux niveaux : tout d'abord au niveau du segment de discours, où chaque segment doit être annoté selon l'opinion qu'il véhicule, et ensuite au niveau du document, où tout segment doit être relié discursivement au reste du texte. Dans le but d'étudier l'impact des contraintes de genre du texte, notre campagne d'annotation a été conduite sur deux corpus de genres différents en français : commentaires de film d'une part, et commentaires d'articles de presse d'autre part. Nous proposons ensuite une architecture informatique permettant d’analyser les opinions dans le discours selon différents niveaux de grain : - Au niveau du segment où nous proposons de sélectionner les segments discursifs porteurs d'opinion du document à l'aide de deux classifieurs parallèles. La présence de traits discursifs permet de reconnaître une part importante des segments implicites, c'est-à-dire des segments ne comportant pas d'opinion lexicalisée. - Au niveau des expressions d’opinion au sein d’un segment où nous présentons une étude de l'effet linguistique des opérateurs venant altérer les caractéristiques a priori d'une expression d'opinion : négations, intensifieurs, modaux. Nous proposons ensuite un modèle de calcul, d'inspiration géométrique, permettant de déterminer finement l'impact de ces opérateurs, et ainsi de déterminer les caractéristiques de l'opinion au niveau du segment. - Au niveau du document où nous comparons plusieurs approches de remontée de l'opinion depuis le niveau des segments de discours jusqu'au niveau du document, afin de calculer l'opinion globale véhiculée par celui-ci. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:09:43 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:09:43 +0200 Subject: Seminaire: Apprentissage semi supervise pour l'analyse syntaxique, Alexis Nasr, mardi 11 juin, IRIT Message-ID: Date: Tue, 04 Jun 2013 13:51:09 +0200 From: benamara zitoune farah Message-ID: <51ADD4AD.7090801 at irit.fr> -------------------------------------------- Séminaire IRIT: mardi 11 juin à 14h salle des thèses. Titre : apprentissage semi supervisé pour l'analyse syntaxique Résumé : Dans ce séminaire, je mettrai en avant les limites des analyseurs syntaxique probabilistes appris sur corpus étiquetés en syntaxe. En particulier, je montrerai que les corpus utilisés pour l'apprentissage, mais aussi les hypothèses d'indépendance faites par les modèles d'analyse syntaxique ne permettent pas de prendre en compte des phénomènes linguistiques importants, en particulier les contraintes de sélection et les cadres de sous catégorisation. Je montrerai alors comment un corpus non étiqueté permet d'acquérir des informations relevant de ces deux phénomènes et je montrerai comment faire pour intégrer ces connaissances dans un analyseur syntaxique ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:08:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:08:03 +0200 Subject: Cursus: Master SdL, double orientation Lexique et Psycholinguistique Message-ID: Date: Tue, 04 Jun 2013 12:41:59 +0200 From: Fiammetta NAMER Message-ID: <51ADC477.4090806 at univ-lorraine.fr> X-url: https://ciell.univ-lorraine.fr/Candidature/indexCandidature.jsp *Master SDL, spécialité Langues Textes Discours, double orientation « Lexique -- Psycholinguistique de l'Acquisition » Nancy (Université de Lorraine) Rentrée 2013-2014* A la rentrée 2013, le Master Sciences du Langage de l'Université de Lorraine comporte deux spécialités : "Didactique du FLE et du FLI" (FLE/FLI) et "Langues Textes et Discours" (LTD) offertes sur les sites de Nancy et Metz. A Nancy,*la spécialité LTD consiste en une double orientation "Lexique-Psycholinguistique de l'Acquisition",* qui repose sur deux thématiques clefs du laboratoire ATILF (http://www.atilf.fr/), auquel est adossé le Master : - le lexique - l'acquisition du langage. Outre le*perfectionnement dans les disciplines linguistiques fondamentales* connexes au lexique (sémantique, syntaxe, typologie, discours, pragmatique), les enseignements obligatoires sont : . lexicologie, lexicographie, morphologie, morphophonologie, interface lexique-syntaxe, connecteurs, temps & aspect, pour la partie "Lexique"**(144h); ET . **psycholinguistiquede l'acquisition, développement normal et pathologique du langage, Linguistique de la LSF, Langue vivante LSF, pour la partie "Psycholinguistique de l'Acquisition"**(120h). *Le quatrième semestre de ce Master *est consacré soit à un*stage en milieu professionnel* dans l'un des deux domaines, soit à la *réalisation d'un mémoire de recherche* dans l'un des domaines de recherche du laboratoire. *Contacts :* . Spécialité LTD, parcours "Lexique-Psycholinguistique de l'Acquisition", Nancy : Pr Fiammetta Namer (fiammetta.namer at univ-lorraine.fr) *Autres spécialités du master SDL :* . Spécialité Linguistique, parcours "Textes et Discours", Metz : Pr Guy Achard-Bayle (guy-achard.bayle at univ-lorraine.fr) . Spécialité Didactique du FLE / FLI, Nancy : Pr Hervé Adami (herve.adami at univ-lorraine.fr) . Spécialité Didactique du FLE, Metz, : Pr Mohammed Kara (mohammed.kara at univ-lorraine.fr) *Informations administratives : * Mme Fabienne Dumont, Pôle Master - SDL (fabienne.dumont at univ-lorraine.fr) Inscriptions : https://ciell.univ-lorraine.fr/Candidature/indexCandidature.jsp ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:11:09 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:11:09 +0200 Subject: These: Geraldine Walther, Sur la canonicite en morphologie: perspective empirique, formelle et computationnelle Message-ID: Date: Wed, 5 Jun 2013 00:50:55 +0200 From: Géraldine Walther Message-Id: <7CCB140C-DC80-4710-9EF1-102204F99BE8 at linguist.univ-paris-diderot.fr> Bonjour, j'ai le plaisir de vous inviter à ma soutenance de thèse, qui s'intitule : "Sur la canonicité en morphologie: perspective empirique, formelle et computationnelle". La soutenance aura lieu le mardi 11 juin, à 15h, en salle 255 (2ème étage) du bâtiment Olympe de Gouges 8 rue Albert Einstein, 75013 Paris de l'Université Paris Diderot. Vous êtes également cordialement invités au pot qui suivra en salle 533, au 5ème étage du même bâtiment. Bien cordialement, Géraldine Walther ----- Composition du jury : Anne Abeillé, Professeur des Universités, Université Paris Diderot, LLF (directrice) Olivier Bonami, Maître de Conférences, Université Paris Sorbonne, LLF (co-directeur) Greville G. Corbett, Professeur, University of Surrey (rapporteur) Bernard Fradin, DR, CNRS LLF (président) Nabil Hathout, Directeur de Recherches, CNRS CLLE-ERSS (rapporteur) Gregory T. Stump, Professeur, University of Kentucky (examinateur) ----- Résumé : L’objectif principal de ma thèse est de proposer un modèle formel de la morphologie flexionnelle, nommé PARSLI (Paradigm Shape and Lexicon Interface) qui soit typologiquement fondé et qui permette de concevoir, d’implémenter et d’évaluer quantitativement des analyses formelles de systèmes flexionnels particuliers. Il repose pour cela sur les concepts de la typologie canonique (Corbett, 2003, 2007). Fondé sur une approche inférentielle-réalisationnelle de la morphologie (Stump, 2001), ce modèle permet notamment de formuler explicitement le rapport qu’entretient le lexique avec les caractéristiques morphologiques observables dans les paradigmes flexionnels des lexèmes et d’évaluer la part de régularité et d’irrégularité flexionnelle inhérente à la définition de chacun d’entre eux. PARSLI est implémenté dans un formalisme dédié, Alexinaparsli (Sagot & Walther, 2013), qui constitue une nouvelle version du formalisme lexical Alexina (Sagot, 2010), à l'origine conçu pour le traitment automatique des langues (TAL). PARSLI s’accompagne d’un éventail de mesures quantitatives. La première est une mesure de compacité reposant sur le concept de longueur de description minimale (Minimal Description Length ou MDL (Rissanen, 1984)) empruntée à la théorie de l’information (Walther & Sagot, 2011). Elle permet d’évaluer l’économie descriptive d’une description donnée et de la comparer quantitativement à des descriptions concurrentes. Dans la thèse, cette mesure sert à évaluer quantitativement la compacité de quatre descriptions implémentées concurrentes de la flexion verbale du français, de deux descriptions concurrentes de la flexion verbale du latin, ainsi que de deux descriptions implémentées du maltais. Le second ensemble de mesures est un ensemble de mesures de canonicité permettant de quantifier le degré de canonicité observable dans les paradigmes isolés ou les systèmes flexionnels complets d’une langue particulière décrite en PARSLI. Il s’agit ainsi d’un moyen de rendre quantifiable la notion qualitative de canonicité flexionnelle développé Corbett (2007). Dans la thèse, cet ensemble de mesures a été appliquée (en plus de la mesure de compacité) pour comparer deux descriptions du système verbal latin, dont l’une défend une approche dérivationnelle du passif latin tandis que l’autre suit l’analyse flexionnelle plus traditionnelle et a montré l’influence des choix descriptifs sur les caractéristiques typologiques (canoniques) des systèmes décrits. En parallèle, ma thèse aborde également, à partir de descriptions de systèmes flexionnels, les questions de la frontière entre la morphologie et les autres composantes de la langue, notamment par l’étude de données du maltais (interface morphologie flexionnelle/phonologie, du latin (interface morphologie flexionnelle/dérivationnelle) et du kurde sorani (interface morphologie flexionnelle/syntaxe). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:49:40 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:49:40 +0200 Subject: Cursus: Master en sciences du langage, specialite Ergonomie Cognitive et Ingenierie Linguistique (ECIL), Toulouse Message-ID: Date: Wed, 05 Jun 2013 14:16:36 +0200 From: Cécile Fabre Message-ID: <51AF2C24.2060809 at univ-tlse2.fr> X-url: http://w3.sc-du-langage.univ-tlse2.fr/master-ecil.php Un master en sciences du langage spécialité Ergonomie Cognitive et Ingénierie Linguistique (ECIL) est proposé à l'Université Toulouse 2 - Le Mirail. http://w3.sc-du-langage.univ-tlse2.fr/master-ecil.php Objectifs de la formation --------------------------------- Le master ECIL associe des compétences dans trois disciplines : linguistique, traitement automatique des langues (TAL) et ergonomie cognitive. Son objectif est de former des spécialistes du traitement informatisé des données langagières. A l’issue du master, les étudiants sont capables de participer au développement de solutions informatiques pour répondre aux besoins qui s’expriment actuellement en matière de traitement automatisé du langage : recherche d’information, veille, gestion des connaissances, aide à la rédaction, etc. Ils sont en mesure de concevoir des ressources linguistiques adaptées, d’évaluer et d’intégrer des systèmes existants dans des situations de travail variées ou de participer au développement de nouveaux logiciels de TAL. Des compétences dans le champ de l’ergonomie cognitive permettent de concevoir des systèmes réellement adaptés à l’activité et aux besoins des utilisateurs. Les étudiants formés en ergonomie sont capables d’expertiser ces besoins pour mieux y répondre. Contexte -------------------------------- Cette formation s'appuie sur un laboratoire de recherche associé au CNRS (CLLE : Cognition, Langage, Langues, Ergonomie) regroupant à Toulouse des chercheurs et des enseignants chercheurs actifs tant dans le domaine de l'ergonomie cognitive (CLLE-LTC) que dans celui de la linguistique et du traitement automatique des langues (CLLE-ERSS). Le master ECIL et le laboratoire CLLE ont tous deux été évalués A+. Le master s'appuie par ailleurs sur le tissu industriel toulousain et un réseau professionnel construit depuis une vingtaine d'années. Public visé -------------------------------- (les conditions précises d'admission sont à consulter sur le site de la formation, voir rubrique ci-dessous). La formation s'adresse en M1 à des étudiants titulaires d'une licence, ayant des compétences en linguistique, et intéressés par les nouvelles technologies. Les candidats à l'accès en M2 doivent opter pour l'un des deux parcours de M2 : * M2 ECIL parcours professionnel, qui intègre très étroitement les compétences ergonomie cognitive et ingénierie linguistique, et qui comporte des projets tutorés et un stage de longue durée. * M2 ECIL parcours recherche TAL, qui permet de réaliser un travail de recherche approfondi en linguistique dans le domaine du TAL. Les candidats au M2 doivent être titulaires d'un M1 en sciences du langage dans le domaine du TAL, ou pouvoir faire état de compétences conjuguées en linguistique et en informatique. Informations complémentaires -------------------------------------------- Pour plus d'information (admission, débouchés, organisation des enseignements, etc.) vous pouvez consulter le site de la formation : http://w3.sc-du-langage.univ-tlse2.fr/master-ecil.php et contacter la responsable, Cécile Fabre : cecile.fabre at univ-tlse2.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:55:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:55:32 +0200 Subject: Job: Poste en reconnaissance de la parole (6 a 12 mois - Geneve) Message-ID: Date: Wed, 5 Jun 2013 15:32:58 +0200 From: Jean-Philippe Goldman Message-ID: -----FRENCH BELOW----- The CUI/University of Geneva seeks a qualified candidate for one Specialist in speech processing for a period of 6 months (class 13; 5988.-). Depending on hiring rate (100% to 50%), the contract will be extended up to 12 months. In the context of a newly granted Swiss National Science Foundation Agora project, the CUI will collaborate with the Phonetischen Laboratorium of Universität Zurich (UZH) on "Swiss VoiceApp - Your voice. Your identity.” The project will combine speech recognition and processing as well as linguistic knowledge to provide a smartphone application for Swiss German dialect recognition and some information on the user’s voice. The main tasks of successful candidate will be the development of speech recognition engine based on speech corpora of dialectal variants. Knowledge of speech software, namely HTK and Praat, are highly recommended. Applicant should possess a master’s degree or an engineer diploma in computational linguistics, or in computer science but with strong knowledge of speech processing. Given the focus on Swiss German dialects, preference will be given to speaker of German. The start date is expected to be during autumn/winter 2013; the position will remain open until filled. Contact Please send (1) your CV, (2) a copy of your degree(s), (3) a short letter explaining that your skills and your interests fit in the project, to Jean-Philippe Goldman, before July 31th 2013, preferably electronically or by mail at the address below: Jean-Philippe Goldman CUI / UNI-Rondeau CH-1227 Carouge, Switzerland Jean-Philippe.Goldman at unige.ch ======================================================================== Le CUI / Université de Genève cherche à engager un/une Spécialiste en traitement de la parole pour un emploi temporaire d’une durée de 6 mois, (classe 13 ; 5988.-).Selon le taux d’engagement (de 100% à 50%) le contrat peut être étendu à 12 mois. Dans le contexte d’un projet récemment financé par le Fonds National de la Recherche, le CUI collaborera avec le Phonetisches Laboratorium de l’Université Zurich (UZH) sur le projet "Swiss VoiceApp - Your voice. Your identity.” Le projet combinera des techniques de reconnaissance de la parole et des connaissances linguistiques pour produire une application pour smartphone visant à l’identification de dialectes suisses alémaniques et de fournir à l’utilisateur des informations sur sa propre voix. La tâche principale du candidat sélectionné sera le développement d’un système de reconnaissance de la parole basé sur des corpus de variantes dialectales. La connaissance de logiciels de parole tels que HTK est essentielle. Le candidat devra posséder un MA ou un diplôme d’ingénieur en linguistique computationnelle, ou en informatique mais avec de bonnes connaissances en traitement de la parole. Étant donné l’orientation germanophone du projet, une préférence sera donnée à un locuteur de l’allemand. Le contrat pourra commencer en automne ou hiver 2013. Contact : Veuillez envoyer (1) votre CV, (2) une copie de vos diplômes, (3) une lettre sur vos compétences et intérêts en rapport avec le projet, à Jean-Philippe Goldman, avant le 31 juillet 2013, de préférence par voie électronique, ou par courrier à l’adresse suivante: Jean-Philippe Goldman CUI / UNI-Rondeau CH-1227 Carouge, Switzerland Jean-Philippe.Goldman at unige.ch ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:56:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:56:35 +0200 Subject: Info: Charte Ethique & Big Data Message-ID: Date: Wed, 5 Jun 2013 18:14:16 +0200 (CEST) From: Karen Fort Message-ID: <197789038.3242875.1370448856558.JavaMail.root at loria.fr> X-url: http://wiki.ethique-big-data.org Charte Éthique & Big Data Suite à plusieurs articles [1, 2, 3] mettant en avant les problèmes d'éthique, de droit et de qualité, liés à l'utilisation du Crowdsourcing pour la constitution de ressources langagières, des chercheurs et des industriels se sont réunis afin de proposer un moyen pratique d'encadrer la production de corpus, et de limiter ces problèmes récurrents de droit, d'éthique, de traçabilité, de qualité etc qui sont attachés à cette activité. La charte dont nous annonçons ici la parution est le résultat du travail de ce groupe. Valoriser les grands volumes de données La charte est une co‐construction d’acteurs majeurs, académiques et industriels, pour faciliter la création, la diffusion et l'utilisation des grands volumes de données (Big Data) et participer ainsi à leur valorisation. Une réponse concrète à de nouveaux enjeux La création, la maintenance, la diffusion et l'utilisation de données de toutes sortes est un enjeu majeur. Qu'il s'agisse de corpus de parole, de données démographiques, personnelles, de relevés de capteurs, de documents, thésaurus, ontologies. Ces bases de données sont essentielles à la recherche, mais également à la création et la maintenance de nouveaux services. Cependant, l'utilisation ou la réutilisation des données se heurtent trop souvent à des freins qui en empêchent l'exploitation optimale : provenance parfois opaque, éthique douteuse, traçabilité inexistante, protection intellectuelle incertaine, une qualité difficile à évaluer a priori. Dès lors, sécuriser la création de données est un facteur de compétitivité et un devoir. L’objectif de la charte Éthique & Big Data est de fournir des garanties concernant la maintenabilité des données, leur traçabilité, leur qualité, l'impact sur l'emploi, assurer l'éthique et réduire le risque juridique. Elle vise à harmoniser les rapports entre producteurs, fournisseurs et utilisateurs de données sur le plan du respect des lois, de celui de l'éthique, et garantir la confiance dans les rapports entre l'ensemble des acteurs impliqués. Un travail à plusieurs voix Cette charte a été conçue à l’initiative de l’APROGED, de l’ATALA, de l’AFCP et de CAP DIGITAL, par un groupe de travail animé par Alain Couillaut. Plusieurs associations et partenaires ont collaboré à sa rédaction et à sa diffusion. La charte comprend quatre volets : la description des données, la traçabilité, la propriété intellectuelle et les réglementations spécifiques. Vers l'adoption ... Adoptée par les partenaires de l’Alliance Big Data, la Charte Éthique & Big Data l’est déjà également par des producteurs de données du secteur de la recherche. Elle est diffusée sous licence Creative Common et est disponible sur le wiki http://wiki.ethique-big-data.org . Cette version est une première étape : les travaux continuent pour l’optimiser afin de répondre de façon plus complète aux différents besoins. Alain Couillault, Gilles Adda, Karën Fort, Hugues de Mazancourt au nom des rédacteurs de la charte [1] G. Adda, J. Mariani Language resources and Amazon Mechanical Turk: legal, ethical and other issues LISLR2010, ``Legal Issues for Sharing Language Resources workshop'', LREC2010, Malta, 17 mai 2010 [2] K. Fort, G. Adda, K. Bretonnel-Cohen Amazon mechanical Turk: gold mine or coal mine? Computational Linguistics, 2011, vol. 37, n°2, 413-420 [3] B. Sagot, K. Fort, G. Adda, J-J. Mariani, B. Lang, Un turc mécanique pour les ressources linguistiques : critique de la myriadisation du travail parcellisé 18ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2011), Montpellier, France, du au 2011. Karën Fort ATER ENSMN Loria, équipe Sémagramme Bureau C303 +33 (0)3 54 95 86 54 http://www.loria.fr/~fortkare/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:52:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:52:27 +0200 Subject: Appel: LREC 2014 Message-ID: Date: Wed, 05 Jun 2013 14:56:12 +0200 From: ELRA ELDA Information Message-ID: <51AF356C.4040506 at elda.org> *LREC 2014 - 9th Conference on Language Resources and Evaluation* FIRST CALL FOR PAPERS Harpa Conference Center, REYKJAVIK, ICELAND MAIN CONFERENCE: 28-29-30 MAY 2014 WORKSHOPS and TUTORIALS: 26-27-31 MAY 2014 Conference web site: http//www.lrec-conf.org/lrec2014 Follow us on Twitter: @LREC2014 https://twitter.com/LREC2014 ELRA is glad to announce the 9th edition of LREC, organised with the support of a wide range of international organisations. *CONFERENCE AIMS* LREC is the major event on Language Resources (LRs) and Evaluation for Human Language Technologies (HLT). LREC aims to provide an overview of the state-of-the-art, explore new R&D directions and emerging trends, exchange information regarding LRs and their applications, evaluation methodologies and tools, on-going and planned activities, industrial uses and needs, requirements coming from e-science and e-society, with respect both to policy issues and to scientific/technological and organisational ones. LREC provides a unique forum for researchers, industrials and funding agencies from across a wide spectrum of areas to discuss problems and opportunities, find new synergies and promote initiatives for international cooperation, in support of investigations in language sciences, progress in language technologies (LT) and development of corresponding products, services and applications, and standards. *CONFERENCE TOPICS* * Issues in the design, construction and use of LRs: text, speech, multimodality* * Guidelines, standards, best practices and models for LRs interoperability * Methodologies and tools for LRs construction and annotation * Methodologies and tools for extraction and acquisition of knowledge * Ontologies, terminology and knowledge representation * LRs and Semantic Web * LRs and Crowdsourcing * Metadata for LRs and semantic/content mark-up * Exploitation of LRs in systems and applications * Sign language, multimedia information and multimodal communication LRs in systems and applications such as: information extraction, information retrieval, audio-visual and multimedia search, speech dictation, meeting transcription, Computer Aided Language Learning, training and education, mobile communication, machine translation, speech translation, summarisation, web services, semantic search, text mining, inferencing, reasoning, etc. * Interfaces: (speech-based) dialogue systems, natural language and multimodal/multisensorial interactions, voice-activated services, etc. * Use of (multilingual) LRs in various fields of application like e-government, e-culture, e-health, e-participation, mobile applications, digital humanities, etc. * Industrial LRs requirements, user needs * Issues in LT evaluation* * LT evaluation methodologies, protocols and measures * Validation and quality assurance of LRs * Benchmarking of systems and products * Usability evaluation of HLT-based user interfaces and dialogue systems * User satisfaction evaluation * General issues regarding LRs & Evaluation* International and national activities, projects and collaboration Priorities, perspectives, strategies in national and international policies for LRs Multilingual issues, language coverage and diversity, less-resourced languages Open, linked and shared data and tools, open and collaborative architectures Organisational, economical, ethical and legal issues. *LREC 2014 HOT TOPICS* *Big Data, Linked Open Data, LRs and HLT* The ever-increasing quantities of large and complex digital datasets, structured or unstructured, multilingual, multimodal or multimedia, pose new challenges but at the same time open up new opportunities for HLT and related fields. Ubiquitous data and information capturing devices, social media and networks, the web at large with its big data/knowledge bases and other information capturing/aggregating/publishing platforms are providing useful information and/or knowledge for a wide range of LT applications. LREC 2014 puts a strong emphasis on the synergies of the big Linked Open Data and LRs/LT communities and their complementarity in cracking LT problems and developing useful applications and services. *LRs in the Collaborative Age* The amount of collaboratively generated and used language data is constantly increasing and it is therefore time to open a wide discussion on such LRs at LREC. There is a need to discuss the types of LRs that can be collaboratively generated and used. Are lexicons, dictionaries, corpora, ontologies (of language data), grammars, tagsets, data categories, all possible fields in which a collaborative approach can be applied? Can collaboratively generated LRs be standardised/harmonised? And how can quality control be applied to collaboratively generated LRs? How can a collaborative approach ensure that less-resourced languages receive the same digital dignity as mainstream languages? There is also a need to discuss legal aspects related to collaboratively generated LRs. And last but not least: are there different types of collaborative approaches, or is the Wikimedia style the best approach to collaborative generation and use of LRs? *LREC 2014 SPECIAL HIGHLIGHT* *Share your LRs!* In addition to describing your LRs in the LRE Map -- now a normal step in the submission procedure of many conferences -- LREC 2014 recognises that the time is ripe to launch another important initiative, the LREC Repository of shared LRs! When submitting a paper, you will be offered the possibility to share your LRs (data, tools, web-services, etc.), uploading them in a special LREC META-SHARE repository set up by ELRA. Your LRs will be made available to all LREC participants before the conference, to be re-used, compared, analysed, ... This effort of sharing LRs, linked to the LRE Map for their description, may become a new "regular" feature for conferences in our field, thus contributing to creating a common repository where everyone can deposit and share data. *PROGRAMME* The Scientific Programme will include invited talks, oral presentations, poster and demo presentations, and panels, in addition to a keynote address by the winner of the Antonio Zampolli Prize. *SUBMISSIONS AND DATES* Submission of proposals for oral and poster (or poster+demo) papers: 15 October 2013 Abstracts should consist of about 1500-2000 words, will be submitted through START and will be peer-reviewed. Submission of proposals for panels, workshops and tutorials: 15 October 2013 Proposals should be submitted via an online form on the LREC website and will be reviewed by the Programme Committee. *PROCEEDINGS* The Proceedings will include both oral and poster papers, in the same format. There is no difference in quality between oral and poster presentations. Only the appropriateness of the type of communication (more or less interactive) to the content of the paper will be considered. In addition a Book of Abstracts will be printed. *CONFERENCE PROGRAMME COMMITTEE * Nicoletta Calzolari -- CNR, Istituto di Linguistica Computazionale "Antonio Zampolli", Pisa - Italy (Conference chair) Khalid Choukri -- ELRA, Paris - France Thierry Declerck -- DFKI GmbH, Saarbrücken - Germany Hrafn Loftsson -- School of Computer Science, Reykjavík University - Iceland Bente Maegaard -- CST, University of Copenhagen - Denmark Joseph Mariani -- LIMSI-CNRS & IMMI, Orsay - France Asuncion Moreno -- Universitat Politècnica de Catalunya, Barcelona - Spain Jan Odijk -- UIL-OTS, Utrecht - The Netherlands Stelios Piperidis -- Athena Research Center/ILSP, Athens - Greece ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:54:19 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:54:19 +0200 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Thu, 06 Jun 2013 10:18:51 +0200 From: ELRA ELDA Information Message-ID: <51B045EB.6090607 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1197 X-url: http://catalog.elra.info/product_info.php?products_id=1198 X-url: http://catalog.elra.info/product_info.php?products_id=1199 X-url: http://catalog.elra.info/product_info.php?products_id=1200 X-url: http://catalog.elra.info/product_info.php?products_id=1201 X-url: http://catalog.elra.info/product_info.php?products_id=1202 X-url: http://catalog.elra.info/product_info.php?products_id=1203 X-url: http://catalog.elra.info/product_info.php?products_id=1204 X-url: http://catalog.elra.info/product_info.php?products_id=1205 X-url: http://catalog.elra.info/product_info.php?products_id=1206 X-url: http://catalog.elra.info/product_info.php?products_id=1196 Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** We are happy to announce that 10 new Pronunciation Dictionaries and 1 new Evaluation Package are now available in our catalogue. * The GlobalPhone Pronunciation Dictionaries:_* GlobalPhone is a multilingual speech and text database collected at Karlsruhe University, Germany. The GlobalPhone pronunciation dictionaries contain the pronunciations of all word forms found in the transcription data of the GlobalPhone speech & text database. The pronunciation dictionaries are currently available in 10 languages: Arabic (29230 entries/27059 words), Bulgarian (20193 entries), Czech (33049 entries/32942 words), French (36837 entries/20710 words), German (48979 entries/46035 words), Hausa (42662 entries/42079 words), Japanese (18094 entries), Polish (36484 entries), Portuguese (Brazilian) (54146 entries/54130 words) and Swedish (about 25000 entries). Other 8 languages will also be released: Chinese-Mandarin, Croatian, Korean, Russian, Spanish (Latin American), Thai, Turkish, and Vietnamese. Special prices are offered for a combined purchase of several GlobalPhone languages. Available GlobalPhone Pronuncation Dictionaries are listed below (click on the links for further details): ***ELRA-S0340 GlobalPhone French Pronunciation Dictionary*** For more information, see: http://catalog.elra.info/product_info.php?products_id=1197 **ELRA-S0341 GlobalPhone German Pronunciation Dictionary** For more information, see: http://catalog.elra.info/product_info.php?products_id=1198 **ELRA-S0348 GlobalPhone Japanese Pronunciation Dictionary** For more information, see: http://catalog.elra.info/product_info.php?products_id=1199 **ELRA-S0350 GlobalPhone Arabic Pronunciation Dictionary ** For more information, see: http://catalog.elra.info/product_info.php?products_id=1200 *ELRA-S0351 GlobalPhone Bulgarian Pronunciation Dictionary *For more information, see: http://catalog.elra.info/product_info.php?products_id=1201 *ELRA-S0352 GlobalPhone Czech Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1202 *ELRA-S0353 GlobalPhone Hausa Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1203 *ELRA-S0354 GlobalPhone Polish Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1204 *ELRA-S0355 GlobalPhone Portuguese (Brazilian) Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1205 *ELRA-S0356 GlobalPhone Swedish Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1206 ______________________ *ELRA-E0041 CHIL 2007+ Evaluation Package* The CHIL Seminars are scientific presentations given by students, faculty members or invited speakers in the field of multimodal interfaces and speech processing. The language is European English spoken by non native speakers. The recordings comprise the following: videos of the speaker and the audience from 4 fixed cameras, frontal close ups of the speaker, close talking and far-field microphone data of the speaker's voice and background sounds. The CHIL 2007+ Evaluation Package includes: 1) CHIL 2007 Evaluation Package (see ELRA-E0033) and 2) additional annotations which have been created within the scope of the Metanet4u Project (ICT PSP No 270893), sponsored by the European Commission. For more information, see: http://catalog.elra.info/product_info.php?products_id=1196 For more information on the catalogue, please contact Valérie Mapelli mapelli at elda.org Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:19:58 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:19:58 +0200 Subject: Appel: Terminology and Artificial Intelligence TIA 2013, Paris, Oct. 2013 Message-ID: Date: Fri, 07 Jun 2013 19:37:16 +0200 From: Nathalie Aussenac-Gilles Message-ID: <51B21A4C.6040002 at irit.fr> X-url: http://flores.lipn.univ-paris13.fr/tia2013/ Third Call for papers Terminologie et Intelligence Artificielle TIA 2013 Terminology and Artificial Intelligence TIA 2013 Terminology for a networked society: Recent advances in multilingual knowledge-based resources Paris, 28-29-30 octobre 2013 http://flores.lipn.univ-paris13.fr/tia2013/ IMPORTANT DATES Abstract submission: 21 June 2013 Paper submission (long and short papers): 28 June 2013 Notification to authors: 3 September 2013 Final camera-ready paper due: 23 September 2013 Conference: 28-30 October 2013 INTRODUCTION and MOTIVATION TIA 2013 will be the 10th in a series of successful events which, for the most part, initially took place in the francophone world. Over a period of almost 20 years – the first conference was held in 1995 – TIA has increasingly attracted the attention of many researchers and practitioners all over the world, and its work has become truly international. The aim of TIA 2013 is to provide an overview of the new ways in which multilingual terminology is present in an ever-increasing networked society, and to pay special attention both to the methods applied in the conceptualization of domain knowledge and to the applications and tools that will meet the requirements of e-society. In this way, terminology, linguistics and knowledge engineering provide the basis on which many other disciplines develop their applications such as domain ontologies, natural language processing tools, multilingual knowledge-based tools and web-based linguistic applications. New approaches to the standardization and to the reuse and integration of different tools designed to facilitate work in institutions, companies and society in general will be welcome. The TIA 2013 Conference aims to promote interdisciplinary research focusing on the intersection of different disciplines that deal with terminological aspects and knowledge engineering resources. Papers may address both theoretical questions and methodological aspects on these issues, as well as interdisciplinary approaches developed to facilitate convergence and co-operation in terminological aspects of importance to society. TOPICS OF INTEREST Terminology and ontology acquisition and management - Applying pattern recognition to enriching terminological resources - Lexicons, thesauri and ontologies as semantic resources - Lexicons and ontologies as means for knowledge transfer - Reusing, standardizing and merging terminological or ontological resources - Multilingual terminology extraction - Multilinguality and multimodality in terminological resources - Management of language resources Terminology and knowledge representation - Ontological semantics and linguistics - Ontology localization - Development of multimedia terminological resources - Terminology alignment in parallel corpora and other lexical resources - Representation of terms and conceptual relations in knowledge-based applications - Comparative studies of terminological resources and/or ontological resources from different languages, domains and approaches - Terminological resources in the 21st century - Harmonization of format and standards in terminological resources Terminology and ontologies for applications - Interoperability and reusability in knowledge-based tools and applications - Models and metamodels in annotating semantic and terminological resources - New R &D directions in terminology for industrial uses and needs SUBMISSIONS TIA 2013 solicits both regular papers, which present significant work, and short papers, which typically present work in progress or a smaller, focused contribution. The program committee may decide to change the category of a paper before acceptance. Papers can be written either in English or French. Regular papers should not exceed 8 pages in ACL-HLT 2011 format (see below for LaTeX and MS Word style files), including figures, examples and references. The mode of presentation of long papers (orally or as posters) will be decided based on the nature rather than on the quality of the work. Short papers should not exceed 4 pages in the same format as regular papers. They will also be presented orally or as posters at the conference depending on the nature of the work. Authors should submit the papers in PDF through the TIA submission page at https://www.easychair.org/conferences/?conf=tia2013 At the submission page, the author(s) must provide the following information: 1. name(s) of author(s) 2. affiliation(s), addresses, fax and e-mail 3. title of the paper 4. 5 to 10 key words in English or in French (in both languages if possible) 5. abstract in English or in French (in both languages if possible) (200 words maximum for each) As the reviewing will be blind, the paper itself must not include the authors' names and affiliations at submission time. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ...", must be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ...". Reviews of full papers (long and short) will be performed by three reviewers. STYLES FILES Authors are required to use the following style files so that the papers follow the conference format. Latex: tia2013latex.tgz MS Word: tia2013word.zip IMPORTANT: Remove authors’ information from your manuscripts when submitting them for blind review (see above)! PROGRAMME COMMITTEE Chairs Guadalupe Aguado de Cea (OEG, Universidad Politécnica de Madrid, Spain) Nathalie Aussenac-Gilles (IRIT, CNRS, Toulouse, France) Contact :tia2013 at easychair.org Members Guadalupe Aguado de Cea (Universidad Politécnica de Madrid, Spain) Amparo Alcina (Universitat Jaume-I, Castellón de la Plana, Spain) Sofia Ananiadou (NaCTeM, Manchester, UK) Nathalie Aussenac-Gilles (IRIT, Toulouse, France) Caroline Barrière (CRIM, Montréal, Canada) Paul Buitelaar (DERI, Galway, Ireland) Maria Teresa Cabré (Universitat Pompeu Fabra, Barcelona, Spain) Farid Cerbah (Dassault Aviation, Paris, France) Jean Charlet (AP-HP& INSERM, Paris, France) Philipp Cimiano (University of Bielefeld, Germany) Anne Condamines (CLLE-ERSS, Toulouse, France) Lyne Da Sylva (EBSI, Montréal, Canada) Béatrice Daille (LINA, Université de Nantes, Nantes, France) Valérie Delavigne (Institut national du cancer, France) Pascaline Dury (Université Lyon 2, Lyon, France) Fidelia Ibekwe-San Juan (Université Lyon 3, Lyon, France) Kyo Kageura (University of Tokyo, Tokyo, Japan) Olivia Kwong (City University Hong Kong, Hong Kong, China) Marie-Claude L’Homme (OLST, Université de Montréal, Canada) Elena Montiel-Ponsoda (Universidad Politécnica de Madrid, Spain) Adeline Nazarenko (LIPN, Université Paris 13, Villetaneuse, France) Mihako O'Hagan (Dublin City University, Dublin, Ireland) Pascale Sébillot (IRISA, Rennes, France) Serge Sharoff (University of Leeds, Leeds, UK) Monique Slodzian (ERTIM-INALCO, Paris, France) Mari Carmen Suarez de Figueroa (Universidad Politécnica de Madrid, Spain) Sylvie Szulman (LIPN, Université Paris 13, Villetaneuse, France) Koichi Takeuchi (Okayama University, Okayama, Japan) Rita Temmerman (Erasmushogeschool, Bruxelles, Belgium) Yannick Toussaint (LORIA, Nancy, France) Spela Vintar (University of Ljubljana, Ljubljana, Slovenia) Pierre Zweigenbaum (LIMSI-CNRS& CRIM-INALCO, Paris, France) ORGANISING COMMITTEE TIA 20131 is organized by the RCLN (Représentation des Connaissances et Langage Naturel) group of the LIPN lab at Paris 13 University. Local Chairs Adeline Nazarenko (LIPN, Paris 13, France) Syvlie Szulman (LIPN, Paris 13, France) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- -------------- next part -------------- An HTML attachment was scrubbed... URL: From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:16:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:16:24 +0200 Subject: Appel: GIR'13 Message-ID: Date: Fri, 7 Jun 2013 10:15:25 +0200 From: Mauro Gaio Message-Id: <9992A748-BED4-4598-940F-C342363811F2 at univ-pau.fr> X-url: http://www.geo.uzh.ch/~rsp/gir13/ 7th Workshop on Geographic Information Retrieval GIR'13 - First Call for Papers ---------------------------------------------------------------- http://www.geo.uzh.ch/~rsp/gir13/ ---------------------------------------------------------------- This is the first call for papers for the 7th Workshop on Geographic Information Retrieval (GIR'13), to be held on 5th November 2013 in conjunction with the ACM SIGSPATIAL 2013 conference in Orlando, Florida. The workshop continues the successful series of workshops held previously in cooperation with ACM SIGSPATIAL and in conjunction with SIGIR and CIKM conferences. The purpose of the workshop is to bring together members of the vibrant and growing community of researchers and practitioners working in the field of geographic information retrieval to discuss current research activity and potential future research directions. The subject and format of the workshop There is a vast quantity of information in text documents and other media that is referenced to geographic space and which is the subject of information search. The discipline of Geographical Information Retrieval (GIR) addresses this information demand. It is concerned with the development of methods to gain access to geographically-specific information originating in unstructured and semi-structured media such as text documents and images. The aim is thus to develop information systems that can automatically interpret the geographical terminology and spatial concepts that people use when recording and querying the information and that can retrieve information that is relevant to the user’s geographic information needs. GIR falls at the intersection of Information Retrieval (IR) and Geographical Information Science and focuses particularly on research and systems development for purposes of geo-information extraction, spatio-textual information indexing and management and spatially-oriented information retrieval. The workshop invites contributions on the following topics: - Detection, disambiguation and geocoding of geographical references in text; - User needs for geographic search; - Determination of the geographic focus of documents and media objects; - Interpretation of spatial natural language in documents and queries; - Extraction of geographically-specific facts from text; - Spatial indexing of documents and other media objects and of their information content; - Reasoning with and integration of structured geo-spatial facts for purposes of information retrieval; - Geo-spatial ontologies, gazetteers and geographic thesauri; - Geographical query interfaces for search on the web; - Geographic question / answering systems; - Geographic search engine architectures; - Relevance ranking of geographical information; - Evaluation methods for geographic search. We invite the submission of articles of up to 8 pages for presentation as long papers and 2 page short abstracts, reporting on work in progress, for short presentations. All submissions will be reviewed by three members of the programme committee, and all accepted papers will be published in the ACM Digital Library. Please note that we welcome contributions both from academic researchers and from practitioners working in industry and in public agencies engaged in GIR-related activities. The workshop programme will ensure opportunity for discussion of the presented papers. It will also include a panel session to discuss the future agenda for research in GIR. It is intended that this latter session, and the workshop as a whole, will facilitate the initiation of collaborative research proposals from the participants in the workshop. Submission procedure You should prepare your abstract in accordance with the ACM camera-ready instructions (http://www.acm.org/sigs/publications/proceedings-templates) and submit it using the EasyChair system (http://www.easychair.org/conferences/?conf=gir13) by 16th August 2013. Decisions on acceptance will be announced by 6th September 2013. At least one author of accepted papers will be required to register for the workshop in order to present the paper. Please note that attendance at the workshop will require registration for the main ACM SIGSPATIAL GIS conference (http://sigspatial2013.sigspatial.org/) in addition to registering for the workshop. Further details of the workshop can be found at http://www.geo.uzh.ch/~rsp/gir13/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:06:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:06:23 +0200 Subject: Revue: Cahiers de lexicologie, numero 102 Message-ID: Date: Thu, 06 Jun 2013 21:30:22 +0200 From: Pierre-André Buvet Message-ID: <51B0E34E.6040907 at ldi.univ-paris13.fr> Cahiers de lexicologie, no 102 Unité en sciences du langage et collocations Sous la direction de Salah Mejri L'UNITÉ EN SCIENCES DU LANGAGE - R. Martin, « Vers l'unification de la linguistique ? » - G. Gross, « Unité de l'analyse linguistique » - O. Soutet, « La conception génétique de la linguistique comme dépassement possible de l'opposition entre linguistique diachronique et linguistique synchronique » - C. Muller, «Le prédicat, entre (méta)catégorie et fonction » - A. Rousseau, « Les unités linguistiques simples et leur sémantique » - J.-R. Ladmiral, « À propos du concept d'unité dans les sciences du langage : la question des unités de traduction » - A. Class, «Niveaux d'analyse en traduction et en lexicologie ou peut-on déterminer des unités de traduction et de lexicologie ? » - F. Neveu, « Unité et complexité des termes de la science linguistique » - P. Lerat, « Jus de raisin : unité terminologique ou non ? » Les collocations - I. Mel'cuk, « Tout ce que nous voulions savoir sur les phrasèmes, mais... » - G. Kleiber, « Constructions «olfactives » : le cas de [Dét]odeur + de + N2 » - P.-A. Buvet, « Collocation, restriction de sélection et prédication » - J. Goes, « Les adjectifs primaires et la collocation » - X. Blanco, « Le défigement des collocations comme recours stylistique » - P. Mogorron Huerta, « Traitement des collocations dans les dictionnaires espagnols » ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:01:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:01:23 +0200 Subject: Appel: ENRICH Workshop at SIGIR 2013 Message-ID: Date: Thu, 6 Jun 2013 10:29:43 -0700 (PDT) From: Séamus Lawless Message-ID: <1370539783.75639.YahooMailNeo at web142604.mail.bf1.yahoo.com> X-url: http://www.cultura-strep.eu/events/enrich-2013/ ------------------------------------------------------------------------ Apologies for cross posting. Please forward to interested parties. ************************************************************************ Final Call for Papers The First Workshop on the Exploration, Navigation and Retrieval of Information in Cultural Heritage - ENRICH 2013 http://www.cultura-strep.eu/events/enrich-2013/ To be held in conjunction with the 36th Annual ACM SIGIR Conference Workshop date: August 1st, 2013 Location: Trinity College Dublin, Ireland. Submission deadline: 9th June 2013 ************************************************************************ ENRICH 2013 has three main goals: - to discuss the challenges and opportunities in Information Retrieval research in the area of Cultural Heritage - to encourage collaboration between researchers engaged in work in this specialist area of Information Retrieval, and to foster the formation of a research community - to identify a set of actions which the community should undertake to progress research in this area ************************************************************************ A key challenge facing the curators and providers of digital cultural heritage worldwide is to instigate, increase and enhance engagement with their collections. To achieve this, a fundamental change in the way these artefacts can be discovered, explored and contributed to by users and communities is required. Cultural heritage artefacts are digital representations of primary resources: manuscript collections, paintings, books, photographs etc. The text-based resources are often innately “noisy”, contain non-standard spelling, poor punctuation and obsolete grammar and word forms. The image-based resources often have limited associated metadata which describes the resources and their content. In addition, the information needs and tasks of cultural heritage users are often complex and diverse. This presents a specific set of challenges to traditional Information Retrieval (IR) techniques and approaches. This workshop will investigate the enhanced retrieval of, and interaction with, cultural heritage collections. We are interested in investigating innovative forms of personalised, multi-lingual IR, which can include: - IR approaches tailored to cope with the inconsistencies which are common in cultural heritage collections. - Content-aware retrieval approaches which respond to the entities and relationships contained within artefacts and across collections. - Personalised IR and presentation. - Community-aware IR approaches which respond to community activity, interest, contribution and experience. Such new forms of enhanced IR require rigorous evaluation and validation using appropriate metrics, contrasting digital cultural heritage collections and diverse users and communities. This workshop welcomes submissions which investigate such evaluation, taking into account the specific requirements of the domain. The nature of cultural heritage resources means that content analysis in support of IR is of specific interest. This includes the automated normalisation of historical texts, the use of Natural Language Processing (NLP) for entity extraction and metadata generation. The ENRICH workshop aims to promote the exchange of ideas between researchers working on the theory and foundations of IR, cross and multi-lingual IR, personalised IR and recommender systems. There are numerous research areas that can support such improved retrieval and exploration in the area of cultural heritage. Topics of interest include, but are not limited to, the following areas: - Multilingual semantic search - Context-aware and semantic recommender systems - Adaptation engines and algorithms for personalised multilingual IR - User modeling and adaptation (e.g. creation and exploitation of individual or stereotypical user profiles) - Content personalisation and personalised result presentation (e.g. beyond the ranked list) - Domain modeling - External knowledge resources for IR (e.g. ontologies) - Evaluation methodologies and metrics for personalised multilingual IR - Information Extraction, Data Mining and Natural Language Processing - Social Network Analysis *Submissions* We invite researchers to submit two categories of paper: Long paper submissions should report on substantial contributions of lasting value. Each accepted long paper will be presented in a plenary session of the workshop program. The maximum length is 8 pages. Short paper submissions should discuss exciting new work that is not yet mature enough for a long paper. The presentation may include the demonstration of a system. The maximum length is 4 pages. Accepted papers will be published in the proceedings of the workshop. Accepted papers will have the possibility to include a demonstration of novel applications as part of their presentation All submissions should be prepared according to the ACM SIG Proceedings Templates, as for all SIGIR submissions. For your convenience, you can use the templates for Microsoft Word or LaTeX that have been made available on the ACM website: http://www.acm.org/sigs/publications/proceedings-templates/ The ENRICH Workshop does not use blind reviews, so please include authors’ names and affiliations on your submission. All submissions will receive several independent reviews. Submissions must be in PDF format and must be in English. All papers must be submitted electronically before the 9th of June 2013 through the EasyChair submission page -https://www.easychair.org/conferences/?conf=enrich2013 ENRICH 2013 will be hosted in the Long Room Hub, the Digital Arts and Humanities Research Institute of Trinity College Dublin -http://www.tcd.ie/trinitylongroomhub/. The Long Room Hub is a signature building at the heart of the historic TCD campus. The institute takes its name from the Library's iconic ‘Long Room'. The Long Room Hub is the home of a number of major, EU funded, Digital Humanities research projects, which use the most advanced digital technologies for the democratization of knowledge and also explore new research questions, approaches and methodologies enabled by technological change. *Important Dates* Deadline for submission:9th June Notification of acceptance:28th June Camera-ready version of papers:8th July Workshop:1st August *Organizers* Prof. Séamus Lawless (School of Computer Science, Trinity College Dublin, Ireland) seamus.lawless at scss.tcd.ie Prof. Maristella Agosti (Department of Information Engineering, University of Padova, Italy) maristella.agosti at unipd.it Dr. Paul Clough (Information School, University of Sheffield, UK) p.d.clough at sheffield.ac.uk Prof. Owen Conlan (School of Computer Science, Trinity College Dublin, Ireland) owen.conlan at scss.tcd.ie *Further Information* http://www.cultura-strep.eu/events/enrich-2013/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:08:21 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:08:21 +0200 Subject: Seminaire: INFOLINGU, Denis LE PESANT, Modyco, Universite Paris 10, 10 juin 2013 Message-ID: Date: Fri, 7 Jun 2013 00:22:56 +0200 From: Myriam RAKHO Message-ID: ************************************************************************ * INFOLINGU* Le séminaire de l'équipe Informatique Linguistique du Laboratoire d'Informatique Gaspard Monge (LIGM) Université Paris-Est Marne-la-Vallée ************************************************************************ Date : *Le Lundi 10 juin 2013 à 10h30 Lieu : Université Paris-Est Marne-la-Vallée Bâtiment Copernic, 4ème étage, salle de séminaires 4B08R *Toute personne intéressée est la bienvenue.* ************************************************************************ ------------------------------------------------------------------------ Intervenant : ------------------------------------------------------------------------ Denis LE PESANT - Modyco, Université Paris 10 ------------------------------------------------------------------------ Titre de la présentation : ------------------------------------------------------------------------ *Les 200 prépositions locatives du français : une méthode de classification sémantique ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:58:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:58:48 +0200 Subject: Job: Post-doc TAL, 6 mois Message-ID: Date: Thu, 06 Jun 2013 14:57:20 +0200 From: Isabelle Tellier Message-ID: <20130606145720.87865r4zz0y87ods at webmail.univ-paris3.fr> X-url: http://mastodons.lip6.fr PROPOSITION DE POST-DOC ARESOS Reconnaissance automatique des acteurs et des sujets de discussion pour la reconstruction de dynamiques socio-sémantiques post-doc en informatique (traitement automatique des langues) de 6 mois à démarrer en juillet-août 2013 Dans le cadre du projet ARESOS (http://mastodons.lip6.fr) soutenu par l'appel Mastodons du CNRS sur les grandes masses de données, le Lattice (http://www.lattice.cnrs.fr) et l'Institut des Systèmes Complexes (http://www.iscpif.fr) proposent un post-doc de 6 mois en traitement automatique des langues. L'objectif du post-doc sera de développer des outils d'extraction automatique « d'acteurs » (personnes physiques, associations, institutions, etc.) et de « sujets de discussions » dans des grands corpus textuels francophones issus de multiples sources du Web (blogs, forums, médias sociaux) et portant sur différentes controverses socio-techniques (biologie de synthèse, biofuel, etc.). Cette extraction a pour but de représenter le contenu sémantique des textes de façon compacte et néanmoins précise, en vue d'analyses à plus large échelle permettant de décrire la structure des débats et leur dynamique. L'analyse des cooccurrences entre sujets permettra d'identifier comment les discours des acteurs d'une controverse agencent des arguments d'une certaine façon contribuant à modeler des blocs argumentatifs plus ou moins stables ou partagés. L'extraction des acteurs à partir des contenus textuels nous permettra de construire le réseau hétérogène dynamique liant les acteurs principaux d'une controverse aux principales positions existantes. A terme la modélisation d'un tel système socio-sémantique devrait nous aider à mieux comprendre la dynamique d'émergence des controverses. Pour analyser finement ces contenus textuels, il est en effet essentiel de repérer automatiquement les agents porteurs d'opinion (désignés par des groupes nominaux ou des entités nommées) et les sujets sur lesquels ils s'expriment. L'association entre ces deux entités pourra ensuite être qualifiée par la nature de l'opinion émise. Pour réaliser cette extraction, le/la candidat(e) retenu(e) pourra s'aider d'outils déjà existants pour le français : extracteur de termes, étiqueteur en partie du discours (POS), chunker, reconnaisseur d'entités nommées... L'approche privilégiée fera appel en priorité à des techniques d'apprentissage automatique supervisé (notamment CRF, mais d'autres approches pourront être essayées). La solution devra être robuste afin de s'adapter aux différents types de textes traités. L'extraction textuelle sera ensuite couplée à des outils d'analyse et de cartographie de réseaux hétérogènes pour explorer les potentialités d'une approche « socio-sémantique » dans la compréhension de la dynamique des controverses. Compétences souhaitées : thèse en TALN, apprentissage automatique, reconnaissance des entités nommées, réseaux complexes Encadrement : Isabelle Tellier , Thierry Poibeau (Lattice), Jean-Philippe Cointet (ISC) envoyer CV + lettre de motivation à isabelle.tellier at univ-paris3.fr, jean-philippe cointet (jphcoi at yahoo.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 19:39:46 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 21:39:46 +0200 Subject: Ressources: New release of DGT-TM (parallel corpus in 23 languages) Message-ID: Date: Mon, 10 Jun 2013 11:31:27 +0200 From: Ralf Steinberger Message-id: <019201ce65bd$490a5000$db1ef000$@jrc.ec.europa.eu> X-url: http://ipsc.jrc.ec.europa.eu/?id=197 DGT-TM is an extraction of the translation memory of the European Institutions for all official EU languages, produced by the European Commission’s Directorate General for Translation (DGT) and distributed by the Joint Research Centre (JRC). Translation memories are sentences and their manually produced translations. The new release is called DGT-TM-2013. It follows the previous releases, DGT-TM (2007), DGT-TM-2011 and DGT-TM-2012. DGT-TM-2013 adds over ten million translation units to the previous 63 million translation units, resulting in 73 million translation units in total. New features of DGT-TM-2013 are: - Significantly more data for the Bulgarian, Maltese and Romanian languages; - Mostly about 460K new translation units per language. - Most documents of this release were translated in 2012, but it also contains previously unpublished documents from older years. - Unfortunately, no new Irish translation units are part of this release. Languages: All 253 language pairs involving the following 23 languages: Bulgarian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Irish, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish and Swedish. URL: http://ipsc.jrc.ec.europa.eu/?id=197 Creator: European Commission - Directorate General for Translation (DGT http://ec.europa.eu/dgs/translation/index_en.htm) WHAT IS DGT-TM The 'Acquis Communautaire' (http://europa.eu/abc/eurojargon/index_en.htm) is the entire body of European legislation, comprising all the treaties, regulations and directives adopted by the European Union (EU). Since each new country joining the EU is required to accept the whole Acquis Communautaire, this body of legislation has been translated into 22 official languages. For the 23rd official EU language, Irish, the Acquis has not been translated on a regular basis; which is why DGT-TM includes only little data in Irish. The Acquis Communautaire was split into sentences and aligned automatically at sentence level, resulting in the DGT translation memory, DGT-TM. The text data is accompanied by software that allows to extract all sentences and their translations for any of the 253 possible language pair combinations. MOTIVATION FOR THIS RELEASE The public data release is in line with the general effort of the European Commission to support multilingualism, language diversity and the re-use of Commission information. It follows the release of a number of further multilingual data sets: - the JRC-Acquis parallel corpus in 2006 (over 1 billion words in 22 languages), - the DGT-TM Translation Memory in 2007, - the multilingual named entity resource JRC-Names in 2011, - the multilingual multi-label classification tool (and accompanying text data) JRC EuroVoc Indexer (JEX) (22 languages) in 2012, - the ECDC-TM Translation Memory in 2012 (domain: Public Health) - the DGT-Acquis parallel corpus in 2012, - the EAC-TM Translation Memory in 2013 (domain: Education and Culture), - and further smaller multilingual resources. See http://ipsc.jrc.ec.europa.eu/?id=61 for more information on these resources. WHAT DGT-TM CAN BE USED FOR DGT-TM can be fed into translation memory software to support human translators in their work. As it is a large parallel corpus in electronic form, it can furthermore be used by specialists in computational linguistics to train statistical machine translation software, to generate multilingual dictionaries, to train and test multilingual information extraction software, and more. MORE INFORMATION ON DGT-TM At http://langtech.jrc.ec.europa.eu/JRC_Publications.html, you find detailed publications on the JRC’s multilingual language technology activity. For details on DGT-TM, you can read: Steinberger Ralf, Andreas Eisele, Szymon Klocek, Spyridon Pilos & Patrick Schlüter (2012). DGT-TM: A freely Available Translation Memory in 22 Languages. Proceedings of the 8th international conference on Language Resources and Evaluation (LREC'2012), Istanbul, 21-27 May 2012. http://langtech.jrc.ec.europa.eu/Documents/2012_LREC_DGT-TM_Final.pdf The article ‘An overview of the European Union's highly multilingual parallel corpora’ (submitted) gives a comparative overview of the various resources distributed by the JRC. WHAT NEXT? The JRC and collaborating services at the European Parliament are currently finalising the release of yet another large-scale multilingual parallel corpus. Ralf Steinberger (http://langtech.jrc.ec.europa.eu/RS.html) European Commission - Joint Research Centre (JRC) 21027 Ispra (VA), Italy URL – Applications: (http://emm.newsbrief.eu/overview.html) URL – Resources: http://ipsc.jrc.ec.europa.eu/index.php?id=61 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 19:41:41 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 21:41:41 +0200 Subject: Appel: Call for demos, HMGE Workshop @ ESSLLI 2013 Message-ID: Date: Mon, 10 Jun 2013 14:50:50 +0200 From: Yannick Parmentier Message-ID: <20130610125049.GG4849 at nausicaa> X-url: http://www.univ-orleans.fr/lifo/evenements/HMGE13/ ** apologies for cross-posting ** CALL FOR SYSTEM DEMONSTRATIONS ====================================================== High-level Methodologies for Grammar Engineering (HMGE 2013) ESSLLI 2013 Workshop (Language and Computation Area) University of Düsseldorf, Germany August 12-16, 2013 http://www.univ-orleans.fr/lifo/evenements/HMGE13/ ====================================================== INTRODUCTION ============ The HMGE Workshop is concerned with the complex task of grammar engineering. On top of research papers (program to be announced soon), we would like to invite demonstrations of systems related to this topic. More precisely, we invite submissions regarding the following aspects of grammar engineering (without being limited to these): * development, maintenance and enhancement of grammars * semi-automatic acquisition of grammars * debugging environments for grammar design * dedicated description languages for grammar engineering * applications of large-scale grammars SUBMISSIONS =========== Demonstration papers are not anonymous and consist of one-page descriptions (excluding references), in PDF format (A4 size), to be sent to hmge13 at easychair.org by June, 24th. There are no specific formatting instructions for these demo papers. Selected system descriptions will be included in the workshop proceedings. Demos will consist of 20-minute talks followed by 10 minutes of questions. VENUE ===== The workshop will be held as part of ESSLLI in August 2013 in Düsseldorf, Germany. More information about ESSLLI can be found at the ESSLLI web pages at http://esslli2013.de/. IMPORTANT DATES =============== Demo submission deadline: June 24, 2013 Notification: July 1st, 2013 Workshop: August 12-16, 2013 PROGRAM COMMITTEE ================= Emily Bender, Washington Philippe Blache, Aix-en-Provence Miriam Butt, Konstanz Eric De La Clergerie, Paris Benoît Crabbé, Paris Berthold Crysmann, Paris Stefanie Dipper, Bochum Denys Duchier, Orléans Claire Gardent, Nancy Josef van Genabith, Dublin Timm Lichte, Düsseldorf Montserrat Marimon, Barcelona Yusuke Miyao, Tokyo Stefan Müller, Berlin Gertjan van Noord, Groningen Yannick Parmentier, Orléans ORGANIZING COMMITTEE ==================== Denys Duchier (LIFO - Université d'Orléans) Yannick Parmentier (LIFO - Université d'Orléans) Information about the Workshop is available at the HMGE workshop website: http://www.univ-orleans.fr/lifo/evenements/HMGE13/ E-mail: hmge13 at easychair.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:07:02 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:07:02 +0200 Subject: Livre: Modelling Language Message-ID: Date: Tue, 11 Jun 2013 14:26:11 +0200 From: Sylviane CARDEY Message-Id: <5.0.2.1.2.20130611135226.03a7e4f0 at pop.univ-fcomte.fr> X-url: http://www.benjamins.com/#catalog/books/nlp.10/main Modelling Language Sylviane Cardey Institut universitaire de France and Université de Franche-Comté http://www.benjamins.com/#catalog/books/nlp.10/main In response to the need for reliable results from natural language processing, this book presents an original way of decomposing a language(s) in a microscopic manner by means of intra/inter-language norms and divergences, going progressively from languages as systems to the linguistic, mathematical and computational models, which being based on a constructive approach are inherently traceable. Languages are described with their elements aggregating or repelling each other to form viable interrelated micro-systems. The abstract model, which contrary to the current state of the art works in intension, is exploitable for all sorts of applications where only the elements which are useful are assembled in the micro-systems needed to solve the problem in hand. Numerous definitions, schemata and examples involving many languages make the book accessible to students as well as academics and industrial researchers looking for new theories and methodologies for representations and problem solving wherever language and quality meet. Table of contents Preface Prologue Introduction Part 1. System, language and its components Chapter 1.1 The concept of system Chapter 1.2 Language as a system Chapter 1.3 The system’s microcomponents Chapter 1.4 Syntactic analysis Chapter 1.5 Semantics Chapter 1.6 Norm in language Part 2. Modelling the norms Chapter 2.1 Model Chapter 2.2 Our model Part 3. Methodologies and applications Chapter 3.1 Grammar checkers Chapter 3.2 Part of speech tagger Chapter 3.3 Sense mining Chapter 3.4 Controlled languages Chapter 3.5 Intralanguage ambiguity Chapter 3.6 MultiCoDiCT Chapter 3.7 Controlled language and machine translation Chapter 3.8 Oral Conclusion Epilogue References Index "The book presents a very fresh, excellent, persuasive new approach to the analysis and generation of languages. Languages are viewed as systems as well as their lexicomorphosyntactic components. The linguistic and mathematical models are convincing and accompanied with good examples and a variety of applications such as grammar checking, part of speech tagging, sense mining, controlled language, machine translation, and also oral speech processing. The author shows that this model is applicable to any language and examples are given on French, English, German, Spanish, Arabic, Malay, Chinese, Thai, etc. The book’s topdown model based approach is particularly attractive for computational linguists looking for reliable results and is strongly recommended to students who are interested in linguistics and natural language processing as well as professionals in the above mentioned wide application areas." Makoto Nagao, Japan "S. Cardey presents an original approach to the scientific analysis of language grounded in a firm understanding of previous theories and based on the interaction of lexis, morphology and syntax. Natural language is modeled within a framework that draws on logic, set theory and the theory of algorithms, thus bridging linguistic theory and formal mathematical analysis. The model developed here will prove valuable for theoretical linguists studying typologically diverse languages as well as for a wide range of natural language engineers facing challenging applications such as semantic data mining and machine translation." Christiane D. Fellbaum, Princeton University [Natural Language Processing, 10] 2013. xi, 194 pp. Publishing status: Available Hardbound - Available ISBN 978 90 272 4996 8 | EUR 90.00 | USD 135.00 e-Book ¬ Forthcoming ISBN 978 90 272 7208 9 | EUR 90.00 | USD 135.00 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 19:32:30 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 21:32:30 +0200 Subject: Conf: SLSP 2013, Tarragona, Spain, July 29-31, 2013 Message-ID: Date: Sun, 9 Jun 2013 14:48:36 +0200 From: "GRLMC" Message-ID: <56FDC34B9EC94C3E83331F7FB39FA2B1 at Carlos1> X-url: http://grammars.grlmc.com/SLSP2013/ ************************************************************************ 1st INTERNATIONAL CONFERENCE ON STATISTICAL LANGUAGE AND SPEECH PROCESSING SLSP 2013 Tarragona, Spain July 29-31, 2013 http://grammars.grlmc.com/SLSP2013/ ************************************************************************ PROGRAMME Monday, July 29: 8:00 - 8:50 Registration 8:50 - 9:00 Opening 9:00 - 9:50 Yoshua Bengio: Deep Learning of Representations: Looking Forward (I) - Invited Tutorial 9:50 - 10:20 Coffee Break 10:20 - 11:35 Horacio Saggion, Stefan Bott, and Luz Rello: Comparing Resources for Spanish Lexical Simplification Borbála Siklósi, Attila Novák, and Gábor Prószéky: Context-aware Correction of Spelling Errors in Hungarian Medical Documents Attia Nehar, Djelloul Ziadi, and Hadda Cherroun: Rational Kernels for Arabic Text Classification 11:35 - 11:45 Break 11:45 - 13:00 Horia Cucu, Andi Buzo, Laurent Besacier, and Corneliu Burileanu: Statistical Error Correction Methods for Domain-Specific ASR Systems Myung-Jae Kim, Il-Ho Yang, and Ha-Jin Yu: Histogram Equalization Using Centroids of Fuzzy C-Means of Background Speakers' Utterances for Speaker Identification Layla El Asri, Romain Laroche, and Olivier Pietquin: Reward Shaping for Statistical Optimisation of Dialogue Management 13:00 - 14:30 Lunch 14:30 - 15:20 Samuel W. K. Chan and Mickey M. C. Chong: Predicting Part-of-Speech Tags and Morpho-Syntactic Relations using Similarity-based Technique Nobal Niraula, Rajendra Banjade, Dan Ștefănescu, and Vasile Rus: Experiments with Semantic Similarity Measures based on LDA and LSA 15:20 - 15:30 Break 15:30 - 16:20 Yoshua Bengio: Deep Learning of Representations: Looking Forward (II) - Invited Tutorial Tuesday, July 30: 9:00 - 9:50 Christof Monz: Challenges and Opportunities of Multilingual Information Access - Invited Lecture 9:50 - 10:20 Coffee Break 10:20 - 11:35 Akira Hayashi, Kazunori Iwata, and Nobuo Suematsu: Finding the Most Likely Upper Level State Sequence for Hierarchical HMMs Jordan Rodu, Dean P. Foster, Weichen Wu, and Lyle H. Ungar: Using Regression for Spectral Estimation of HMMs Amit Kirschenbaum: Unsupervised Segmentation for Different Types of Morphological Processes Using Multiple Sequence Alignment 11:35 - 11:45 Break 11:45 - 13:00 Abdessalam Bouchekif, Géraldine Damnati, and Delphine Charlet: Complementarity of Lexical Cohesion and Speaker Role Information for Story Segmentation of French TV Broadcast News Markus Saers, Karteek Addanki, and Dekai Wu: Iterative Rule Segmentation under Minimum Description Length for Unsupervised Transduction Grammar Induction Ngoc Thang Vu, Heike Adel, and Tanja Schultz: An Investigation of Code-Switching Attitude Dependent Language Modeling 13:00 - 14:30 Lunch 14:30 - 15:20 Hans Moen and Erwin Marsi: Cross-Lingual Random Indexing for Information Retrieval Javad Nouri, Lidia Pivovarova, and Roman Yangarber: MDL-based Models for Transliteration Generation 15:20 - 15:30 Break 15:30 - 16:20 Sanja Štajner and Richard Evans: Can Statistical Tests Be Used for Feature Selection in Diachronic Text Classification? Luis Trindade, Hui Wang, William Blackburn, and Niall Rooney: Factored Semantic Sequence Kernel for Sentiment Polarity Classification 17:30 Visit to the City Wednesday, July 31: 9:00 - 9:50 Tanja Schultz: Multilingual Speech Processing with a special emphasis on Rapid Language Adaptation - Invited Lecture 9:50 - 10:20 Coffee Break 10:20 - 11:35 Fethi Bougares, Mickael Rouvier, Nathalie Camelin, Paul Deléglise, and Yannick Estève: An Investigation of Single-pass ASR System Combination for Spoken Language Understanding Marwa Graja, Maher Jaoua, and Lamia Hadrich Belguith: Discriminative Framework for Spoken Tunisian Dialect Understanding Bassam Jabaian, Fabrice Lefèvre, and Laurent Besacier: Generalization of Discriminative Approaches for Speech Language Understanding in a Multilingual Context 11:35 - 11:45 Break 11:45 - 13:00 Felix Stahlberg, Tim Schlippe, Stephan Vogel, and Tanja Schultz: Pronunciation Extraction from Phoneme Sequences Through Cross-Lingual Word-to-Phoneme Alignment Stanisław Kacprzak and Mariusz Ziółko: Speech/Music Discrimination via Energy Density Analysis Karteek Addanki and Dekai Wu: Unsupervised Rhyme Scheme Identification in Hip Hop Lyrics using Hidden Markov Models 13:00 Closing ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:35:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:35:55 +0200 Subject: Livre: Methodes et outils pour l'analyse phonetique des grands corpus oraux Message-ID: Date: Wed, 12 Jun 2013 17:02:20 +0200 From: "Ana Ars" Message-ID: <00c101ce677d$dc4ba140$94e2e3c0$@fr> X-url: http://editions.lavoisier.fr/notice.asp?ouvrage=2724385 Méthodes et outils pour l'analyse phonétique des grands corpus oraux Traité Cognition et Traitement de l'Information (IC2) dirigée par Jean-Marie Pierrel Sous la direction de Noël Nguyen et Martine Adda-Decker ISBN : 978-2-7462-4530-3 - Format : 16,5 x 24 - 320 p. - 110 € Editions Lavoisier Hermes Cet ouvrage offre un panorama des méthodes et des outils utilisables pour les analyses phonétiques sur de grands corpus oraux. Les ressources considérables dont nous disposons aujourd'hui dans le domaine de l’oral, en sont venues à jouer un rôle majeur pour les phonologues et les phonéticiens, qui entreprennent de soumettre leurs hypothèses théoriques à des tests empiriques étendus. On a vu se généraliser l'utilisation d'un large ensemble d'instruments et de méthodes pour le traitement et l'analyse automatique des données recueillies. L'ouvrage aborde notamment le prétraitement des données acoustiques, l’extraction (semi-)automatique des paramètres d’analyse, la mise en relation entre les données acoustiques et les catégories phonologiques. L’accent est placé sur le français, et les données recueillies dans le projet « Phonologie du français contemporain » sont utilisées dans de nombreux exemples. Une large place est accordée à la contribution des technologies de la parole, et notamment les systèmes de reconnaissance automatique de la parole, à l’analyse phonétique des grands corpus oraux. Consulter la présentation et le sommaire détaillés de l'ouvrage (http://editions.lavoisier.fr/notice.asp?ouvrage=2724385) Ana ARS Service de Presse LAVOISIER SAS Editions / EM Inter / Hermes / Synthèse agricole / Médecine Sciences Publications 14 rue de Provigny 94236 Cachan Cedex 01.47.40.67.63 ana.ars at lavoisier.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:10:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:10:10 +0200 Subject: Appel: EACL 2014, Call for tutorial proposals Message-ID: Date: Tue, 11 Jun 2013 15:21:51 +0200 From: peter ljunglöf Message-Id: EACL 2014 CALL FOR TUTORIAL PROPOSALS Proposals are invited for the Tutorial Program of the 14th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2014), to be held in Gothenburg, Sweden, from 26 to 30 April 2014. The selected tutorials will be given on the Saturday and Sunday preceding the main conference (26 and 27 April). EACL 2014 seeks proposals for tutorials in all areas of computational linguistics, broadly conceived to include disciplines such as Linguistics, Speech, Information Retrieval, Psycholinguistics, and Multimodal Processing. We particularly welcome (1) tutorials which cover advances in newly emerging areas not previously covered in an *ACL related tutorial, and (2) tutorials which provide introductions into related fields which are potentially relevant for the CL community (e.g. bioinformatics, neuroscience, human language processing, video and image analysis, machine learning techniques). In order to gather a widespread audience, the experience and qualifications of the instructors will also be taken into account. REMUNERATION Remuneration for tutorials is regulated by ACL policies: http://aclweb.org/adminwiki/index.php?title=Policy_on_tutorial_teacher_payment. Please note that enumeration for tutorial presenters is fixed according to the above policy and does not cover registration fees for the main conference. SUBMISSION DETAILS Proposals for tutorials should contain: 1. A title and brief description of the tutorial content and its relevance to the ACL community (not more than 2 pages). 2. A brief outline of the tutorial structure showing that the tutorial's core content can be covered in a three-hour slot (excluding a coffee break). In exceptional cases six-hour tutorial slots are available as well. 3. The names, postal addresses, phone numbers, and email addresses of the tutorial instructors, including a one-paragraph statement of their research interests and areas of expertise. 4. A list of previous venues and approximate audience sizes, if the same or a similar tutorial has been given elsewhere; otherwise an estimate of the audience size. 5. A description of special requirements for technical equipment (e.g. internet access). Proposals should be submitted by electronic mail, in plain ASCII text, to "tutorials at eacl2014 dot org", no later than 1 November 2013. The subject line should be: "EACL 2014 Tutorial Proposal". Please note that only proposals submitted by e-mail will be taken into account. TUTORIAL SPEAKER RESPONSIBILITIES Accepted tutorial speakers will be notified by 15 November 2013, and must then provide abstracts of their tutorials for inclusion in the conference registration material by 15 December 2013. The description should be in two formats: an ASCII version that can be included in email announcements and published on the conference web site, and a PDF version for inclusion in the electronic proceedings (detailed instructions to follow). Tutorial speakers must provide tutorial materials, at least containing copies of the course slides as well as a bibliography for the material covered in the tutorial, by 1 February 2014. IMPORTANT DATES Submission deadline for tutorial proposals: 1 November 2013 Notification of acceptance: 15 November 2013 Tutorial descriptions due: 15 December 2013 Tutorial course material due: 1 February 2014 Tutorial dates: 26-27 April 2014 TUTORIAL CHAIRS Marco Baroni, University of Trento, Italy Afra Alishahi, Tilburg University, Netherlands Please send inquiries concerning EACL 2014 tutorials to "tutorials at eacl2014 dot org". ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 19:43:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 21:43:32 +0200 Subject: Ressources: corpus CO2 de parole spontanee annotee en co-reference Message-ID: Date: Mon, 10 Jun 2013 20:31:04 +0200 From: Jean Yves ANTOINE Message-ID: <51B61B68.2070502 at univ-tours.fr> X-url: http://www.info.univ-tours.fr/~antoine/parole_publique/CO2/index.html ======================================================================= Sortie de CO2 : corpus libre de dialogue oral annoté en coréférences et anaphores associatives ======================================================================= Le Laboratoired'Informatique (LI) de l'Université de Tours et le Laboratoire Ligérien de Linguistique (LLL) de l'Université d'Orléans ont le plaisir de vous annoncer la sortie du corpus CO2, diffusé librement auprès de tous sous licence Creative Commons CC-BY-NC-SA.Ce corpus est constitué d'un extrait du corpus oral ESLO1 (connu souvent sous le nom de "corpus d'Orléans") qui a été annoté en coréférencesnominales et pronominales. L'annotation distingue coréférences directes, indirectes, pronominales mais également anaphores associatives.L'annotation est déportée et a été réalisée à l'aide du logiciel libreGLOZZ développé par le GREYC (http://www.glozz.org/) Financé par les universités de Tours et d'Orléans, membres du PRES Centre Val de Loire, le corpus représente 3h28 d'enregistrement et 35192 mots. Il constitue une mise en bouche avant la sortie du corpus ANCOR, réalisé par les deux mêmes laboratoires et qui suit les mêmes conventions d'annotation. Comprenant 453000 mots, ce corpus sera présenté au prochaincongrès TALN et rendu disponible, toujours sous lamême licence, en septembre 2013. Dans l'immédiat, vous pouvez déjà découvrir et récupérer le corpus CO2 sur le site Parole Publique : http://www.info.univ-tours.fr/~antoine/parole_publique/CO2/index.html ------------------------------------------------------------------------ Contacts : Jean-Yves.Antoine at univ-tours.fr ou Emmanuel.Schang at univ-tours.fr (concepteurs du corpus) Annotations : Judith Muzerelle et Aurore Pelletier Rappel : le corpus ESLO (audio + transcriptionsorthographique) est par ailleurs diffusé librement également sous licence CC-BY-NC-SA. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:05:42 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:05:42 +0200 Subject: Appel: COLDOC2013, Date de soumission etendue au 22 Juin 2013 Message-ID: Date: Mon, 10 Jun 2013 20:48:33 +0200 From: coldoc modyco Message-ID: X-url: http://coldoc2013fr.wordpress.com/ Désolé pour les envois croisés ------------------------------------------------------------------------ COLDOC2013 : La question des genres à l'écrit et à l'oral 13-14 novembre 2013 dernier appel à communication ------------------------------------------------------------------------ COLDOC2013: Extension de la date de soumission au 22 Juin Cher(e)s collègues, Nous vous prions de trouver ci-joint l'appel à communication du COLDOC 2013, le colloque des doctorants et jeunes chercheurs du laboratoire Modyco de Nanterre. Cette année, le colloque portera sur le thème suivant : "La question des genres à l'écrit et à l'oral". Vous trouverez l'appel à communication ci-dessous. Vous pourrez aussi trouver ces informations sur le site du colloque à l'adresse suivante: http://coldoc2013fr.wordpress.com/appel/ Bien cordialement, Lucie Rousier-Vercruyssen pour le comité d'organisation de COLDOC2013 (http://coldoc2013fr.wordpress.com/). *Dates importantes :** * soumission de propositions de communication : * 22** juin 2103* notification d'acceptation des soumissions : 31 juillet 2013 Programme disponible : 31 juillet 2013 Remise des articles complets pour les actes : 3 septembre 2013 Soumission finale de la communication : 13 octobre 2013 *inscriptions* *gratuites* pour tous les participants * *soumission* La soumission devra contenir au maximum 3 pages (voir les directives de soumission sur le site COLDOC2013 - http://coldoc2013.wordpress.com/submissions/) et devra être envoyé via le site EasyChair de COLDOC2013 (https://www.easychair.org/conferences/?conf=coldoc2013). Les projets d'articles seront soumis à une relecture anonyme par deux membres du comité scientifique. Les contributions de COLDOC2013 seront suivies d'une publication spéciale avec des communications sélectionnées. *COLDOC2013 appel à communication * COLDOC 2013 a pour objectif d'interroger de façon pluridisciplinaire la notion de genre et d'illustrer la variété des problèmes théoriques et pratiques qu'elle pose. L'appel à contributions se veut ouvert et vise à articuler différents points de vue sur la question des genres, afin de contribuer à circonscrire une catégorie essentielle pour l'interprétation. Longtemps considérée sous l'angle taxinomique, la catégorie du genre s'est vue renouvelée par l'intérêt qu'ont manifesté pour elle différentes disciplines des sciences humaines, intégrant progressivement différents aspects dans leurs approches définitoires : les contextes d'énonciation, le support (écrit ou parlé), les normes langagières, l'évolution en diachronie, les pratiques sociales, etc. (cf S. Branca, « Types, modes et genres entre langue et discours », Langage et Société n°87, p. 5 –24, mars 1999). Ce renouvellement se lit aussi à travers le fait qu'on cherche moins systématiquement à en définir les règles de production ou à déterminer des catégories classificatoires qu'à poser la question du genre en interrogeant les processus de reconnaissance et d'interprétation. La réflexion et les études de cas s'orientent ainsi sur le point de vue de la réception (horizons d'attente, habitudes, pré-construits culturels, cadre cognitif, circuit de communication,…), le genre étant alors envisagé comme un ensemble de contraintes ou de conditions de possibilités du sens. COLDOC 2013 cherchera, en réunissant des contributions d'horizons variés, à rendre compte de l'état de l'art du travail accompli, de sa diversité, mais aussi, en s'appuyant sur des propositions théoriques et appliquées, à proposer de nouvelles catégories descriptives nécessaires à la quête du sens dans le discours écrit et oral. Cette édition 2013 de COLDOC encourage donc fortement les participations des mémorants, doctorants et jeunes chercheurs en linguistique générale, linguistique de corpus, linguistique diachronique, linguistique textuelle, sociolinguistique, didactique, traitement automatique des textes ou de la parole et, plus généralement, de tout domaine qui s'intéresserait à l'étude du genre pour lui-même ou comme catégorie d'analyse (catégorie interprétative, etc.). Plusieurs questions, mentionnées ici sans exhaustivité, peuvent être envisagées comme source d'inspiration. Ces questions, autant théoriques que pratiques mettent en lumière la grande diversité d'approches possibles dans l'étude des genres aussi bien écrits qu'oraux : - Pourquoi catégoriser selon des genres ? Comment établir des frontières entre genres ? - Comment définir, formaliser et modéliser le genre ? - Selon quelles dynamiques le genre se construit-il ? - Dans quelle mesure les approches diachroniques renouvellent-elles l'étude des genres ? - Quel(s) rapport(s) entretiennent « genres » et « opérations linguistiques » (décrire, résumer, raconter...) ? - Le genre a-t-il une influence sur les phénomènes grammaticaux ? - Quelles sont ses instanciations sociolinguistiques ? - Comment les variables linguistiques de l'usage, de la variété et des registres de langue peuvent-elles devenir des marqueurs sociaux propres au genre dans lequel les locuteurs communiquent ? - Comment la linguistique de corpus répond-elle à l'étude du genre ? - Comment l'étude du genre à l'écrit est-elle applicable aux genres oraux et vice versa? - Sur quels observables se base-t-on pour l'attribution du genre ? Peut-on le calculer automatiquement ? - Quelle est la place des genres en didactique comme outil d'enseignement et d'apprentissage de la langue et de la littérature ? - Comment catégoriser et interpréter selon les nouveaux dispositifs de communication (forums, blogs, réseaux sociaux, chats, tweets, emails, etc.) l'émergence de nouvelles pratiques langagières ? - Les techniques d'analyse automatique des textes et des discours redistribuent-elles la catégorisation en genres ? Font-elles émerger d'autres formes de catégorisations ? - La distinction oral-écrit est-elle une distinction majeure dans l'étude des genres ? - Comment prendre en compte le genre dans le développement des ressources en TAL (lexique, grammaire, parseurs, etc. ) ? *Comité scientifique* Jean-Michel ADAM (Université de Lausanne, Suisse) Sophie ANQUETIL (CoDiRe, Université de Nantes et CRISCO, Université de Caen, France) Antoine AUCHLIN (Université de Genève, Suisse) Jacqueline AUTHIER (SYLED-EA 2290, Université Sorbonne Nouvelle, France) Mathieu AVANZI (Institut des Sciences du Langage et de la Communication, Université de Neuchâtel, Suisse) Delphine BATTISTELLI (Université Paris-Sorbonne, France) Sonia BRANCA-ROSOFF (SYLED-EA 2290, Université Sorbonne Nouvelle, France) Bernard COMBETTES (ATILF, Université de Lorraine, France) Anne CONDAMINES (CLLE-ERSS/CNRS, Université Toulouse Le Mirail, France) Marcel CORI (MoDyCo/CNRS, Université Paris Ouest, France) Shirley CARTER THOMAS (Lattice, Institut Mines-Télécom, Télécom Ecole de Management, France) Flore COULOUMA (CREA-EA 370, Université Paris Ouest, France) Guillaume DESAGULIER (MoDyCo – Université Paris 8, Université Paris Ouest) Sarah DE VOGUE (MoDyCo – Université Paris-Ouest, France) Marion FOSSARD (Institut de Logopédie adulte, Université de Neuchâtel, Suisse) Jean-Philippe GOLDMAN (Université de Genève, Suisse) Jean-François JEANDILLOU (MoDyCo/CNRS, Université Paris-Ouest, France) Anne LACHERET (MoDyCo/CNRS, Université Paris-Ouest, France) Bernard LAKS (MoDyCo/CNRS, Université Paris-Ouest, France) Sabine LEHMANN (MoDyCo/CNRS, Université Paris-Ouest, France) Sylvain LOISEAU (Laboratoire Lexiques, Dictionnaires, Informatique/CNRS, Université Paris 13-Nord, France) Julien LONGHI (CRTF, Université de Cergy-Pontoise) Dominique MAINGUENEAU (UFR de Langue française, Université Paris Sorbonne, France) Philippe MARTIN (CLILLAC-ARP, Université Paris Diderot, France) Caroline MELLET (MoDyCo/CNRS, Université Paris-Ouest, France) Jean-Luc MINEL (MoDyCo/CNRS, Université Paris-Ouest, France) Colette NOYAU (MoDyCo/CNRS, Université Paris-Ouest, France) Sabine PÉTILLON (MoDyCo/CNRS, Université Paris-Ouest, France) Paola PIETRANDREA (MoDyCo, Université Roma Tre, Italie) Fanny RINCK (IUFM de Grenoble, laboratoire Lidilem,EA609, Université de Grenoble 3, France) Anne-Catherine SIMON (Valibel, Discours et Variation, Université Catholique de Louvain, Belgique) Frédérique SITRI (SYLED-EA 2290/MoDyCo/CNRS, Université Paris-Ouest, France) Noalig TANGUY (Lattice, France) *Comité d'Organisation* *Julie BELIAO (Doctorante Laboratoire MoDyCo, Université Paris-Ouest, France)* *Anaïs MORENO (Doctorante Laboratoire MoDyCo, Université Paris-Ouest, France)* *Tony ONGUENE (Doctorant Laboratoire MoDyCo, Université Paris-Ouest, France)* *Lucie ROUSIER-VERCRUYSSEN (Doctorante Laboratoire MoDyCo, Université de Neuchâtel, Suisse)* *Charles TEISSEDRE (Docteur, ATER Paris-Sorbonne, France)* ------------------------------------------------------------------------ COLDOC2013 : Genres in Written and Oral Productions 13-14 november 2013 last call for papers ------------------------------------------------------------------------ COLDOC2013: Extended Deadline 22th June Dear colleague(s), Please find below the call for papers for the 9th edition of COLDOC, a conference organized by MoDyCo lab, Paris, for PhD students and young researchers. The call for paper can also be found on the COLDOC2013 website (http://coldoc2013.wordpress.com/). This might be of interest to some of PhD students and young researchers in Linguistics. Thanks in advance for broadcasting this information around you! Best regards, Julie Beliao pour le comité d'organisation de COLDOC2013 (http://coldoc2013fr.wordpress.com/). *Important dates:** * extended abstract submission: * 22** june 2103* extended abstract acceptation notification: 31 july 2013 paper submission: 3 september 2013 paper acceptation notification: 31 july 2013 final paper submission: 13 october 2013 *inscriptions* *free* for all participants * *submission* Paper proposal should be a maximum of 3 pages (see submission guidelines on COLDOC2013 site - http://coldoc2013.wordpress.com/submissions/) and should be made via the EasyChair page of COLDOC2013 (https://www.easychair.org/conferences/?conf=coldoc2013). Every paper will be blind reviewed by at least 2 members of the scientific committee. The COLDOC2013 contributions be followed by a special publication of selected papers. *COLDOC2013 call for paper * COLDOC 2013 aims to examine the notion of genre in a multidisciplinary approach and to illustrate the variety of both theoretical and practical problems it raises. The call for papers is open to a wide variety of contributions that can help identify an essential category for interpretation. Although it has long remained been restricted to taxonomic approaches, the issue of genre categorisation sees new developments thanks to the interest it has raised in various humanities disciplines, gradually integrating different aspects in their definitional approaches: contexts of utterance, medium (written or spoken), language norms, social practices, etc. This renewal is also expressed by the fact that the studies less systematically seek to define it through production rules or classificatory categories, but rather try to examine the question of genre through the process of recognition and interpretation. Theoretical approaches and case studies tend to focus on the addressee's point of view: horizons of expectations, habits, cultural pre-conceptions, cognitive framework, communication circuit, etc. The genre is then modeled as a set of constraints or necessary conditions of meaning. COLDOC 2013, bringing contributions from diverse backgrounds, aims to review the state of the art and the diversity of work on genres. Relying on theoretical and applied propositions, COLDOC 2013 aims to suggest new descriptive categories needed in the search for meaning in written and oral discourse. This 2013 edition of COLDOC therefore strongly encourages participation from masters students, PhD students candidates and young researchers in general linguistics, corpus linguistics, sociolinguistics, computational linguistics (written or speech) and, more generally, any area that would be interested in the study of genres. Several issues - solely as examples - can be considered as sources of inspiration. These issues, both theoretical and practical, highlight the variety of possible approaches in the study of textual and oral genres: - Why categorize according to genres? How should boundaries between genres be established? - How should genres be defined, formalized and modeled? - What are the dynamics implied in genre building? - What are the implied relation(s) between ‘genre' and ‘linguistic operations' (describe, summarize, tell…)? - Does genre influence grammatical phenomena? - What are the sociolinguistic instantiations of genre? - How can usage, variety and language registers linguistic variables become genre-specific social markers? - How does corpus linguistics answer to genre study? - How can genre study in written productions be applied to oral genres and vice versa? - What observables is genre assignment based on? Can it be automatically calculated? - What is the role of genre as a tool for teaching and learning language and literature? - How can we categorize and interpret the emergence of new linguistic practices according to new communication devices (forums, blogs, social networks, chats, tweets, emails, etc.)? - Do techniques for automatic analysis of texts and discourses question or redistribute the categorization into genres? Do they contribute to other forms of categorization? - Is the oral-written distinction a major distinction in the study of genres? - How can genre be accounted for in the development of NLP resources (lexicon, grammar, parsers, etc.)? *Scientific committee* Guy ACHARD-BAYLE (Université de Lorraine, France) Jean-Michel ADAM (Université de Lausanne, Suisse) Sophie ANQUETIL (CoDiRe, Université de Nantes et CRISCO, Université de Caen, France) Antoine AUCHLIN (Université de Genève, Suisse) Jacqueline AUTHIER (SYLED-EA 2290, Université Sorbonne Nouvelle, France) Mathieu AVANZI (Institut des Sciences du Langage et de la Communication, Université de Neuchâtel, Suisse) Delphine BATTISTELLI (STIH, Université Paris Sorbonne, France) Jacqueline BILLIEZ (Université de Stendhal Grenoble III, France) Sonia BRANCA-ROSOFF (SYLED-EA 2290, Université Sorbonne Nouvelle, France) Bernard COMBETTES (ATILF, Université de Lorraine, France) Anne CONDAMINES (CLLE-ERSS/CNRS, Université Toulouse Le Mirail, France) Marcel CORI (MoDyCo/CNRS, Université Paris-Ouest, France) Shirley CARTER THOMAS (Lattice, Institut Mines-Télécom, Télécom Ecole de Management, France) Flore COULOUMA (CREA-EA 370, Université Paris Ouest, France) Guillaume DESAGULIER (MoDyCo - Université Paris 8, Université Paris Ouest) Sarah DE VOGUE (MoDyCo - Université Paris-Ouest, France) Marion FOSSARD (Institut de Logopédie adulte, Université de Neuchâtel, Suisse) Françoise GADET (MoDyCo/CNRS, Université Paris-Ouest, France) Jean-Philippe GOLDMAN (Université de Genève, Suisse) Jean-François JEANDILLOU (MoDyCo/CNRS, Université Paris-Ouest, France) Anne LACHERET (MoDyCo/CNRS, Université Paris-Ouest, France) Bernard LAKS (MoDyCo/CNRS, Université Paris-Ouest, France) Sabine LEHMANN (MoDyCo/CNRS, Université Paris-Ouest, France) Sylvain LOISEAU (Laboratoire Lexiques, Dictionnaires, Informatique/CNRS, Université Paris 13-Nord, France) Julien LONGHI (CRTF, Université de Cergy-Pontoise) Juan Manuel LOPEZ MUNOZ (Université de Cadix, Espagne) Dominique MAINGUENEAU (UFR de Langue française, Université Paris Sorbonne, France) Philippe MARTIN (CLILLAC-ARP, Université Paris Diderot, France) Caroline MELLET (MoDyCo/CNRS, Université Paris-Ouest, France) Jean-Luc MINEL (MoDyCo/CNRS, Université Paris-Ouest, France) Colette NOYAU (MoDyCo/CNRS, Université Paris-Ouest, France) Sabine PÉTILLON (MoDyCo/CNRS, Université Paris-Ouest, France) Paola PIETRANDREA (MoDyCo, Université Roma Tre, Italie) François PROVENZANO (Université de Liège, Belgique) Alain RABATEL (Université de Lyon I, France) Fanny RINCK (IUFM de Grenoble, laboratoire Lidilem,EA609, Université de Grenoble 3, France) Anne-Catherine SIMON (Valibel, Discours et Variation, Université Catholique de Louvain, Belgique) Frédérique SITRI (SYLED-EA 2290/MoDyCo/CNRS, Université Paris-Ouest, France) Noalig TANGUY (Lattice, France) Gian Maria TORE (Université de Luxembourg, Luxembourg) Organization Committee Julie BELIAO (Doctorante Laboratoire MoDyCo, Université Paris-Ouest, France) Anaïs MORENO (Doctorante Laboratoire MoDyCo, Université Paris-Ouest, France) Tony ONGUENE (Doctorant Laboratoire MoDyCo, Université Paris-Ouest, France) Lucie ROUSIER-VERCRUYSSEN (Doctorante Laboratoire MoDyCo, Université de Neuchâtel, Suisse) Charles TEISSEDRE (Docteur, ATER Paris-Sorbonne, France) Julie Beliao for the organizing committee of COLDOC2013. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:21:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:21:35 +0200 Subject: Conf: Interspeech 2013, Lyon (France), 25-29 August 2013 Message-ID: Date: Wed, 12 Jun 2013 01:35:02 +0200 From: Interspeech 2013 Message-ID: <51B7B426.5010800 at inria.fr> X-url: http://www.interspeech2013.org INTERSPEECH 2013 Conference with special focus on "Speech in Life Sciences and Human Societies" 25-29 August 2013, Lyon (France) Join us for the 14th edition of the INTERSPEECH Conference in Lyon, 25-29 August 2013. Register now... ... and experience the largest international event in the field of speech communication sciences, in a wonderful venue and area at the heart of Europe. Conference website : http://www.interspeech2013.org ---------- Flash News ---------- Early registration : deadline extended until June 21st Register at http://www.interspeech2013.org/content/general-information-online-registration Accomodation package in university residence starting from €170 for 5 nights More info on : http://www.afcp-parole.org/IS13/index.html A preliminary version of the programme "at a glance" is now accessible at : http://www.interspeech2013.org/content/programme-glance-tentative-programme Full programme to be disclosed soon. During the conference, an exciting special event celebrating the 25th anniversary of ESCA/ISCA will review the major scientific evolutions of the field, the milestones achieved and the challenges ahead. Follow us on twitter! #interspeech2013 -------------------------- The Interspeech conference -------------------------- INTERSPEECH, the annual conference of the International Speech Communication Association (ISCA), is the world's largest and most comprehensive conference on Spoken Language Processing science and technology. This year's edition will be hosted in the Lyon Convention Center, which offers first-grade facilities in a very attractive city and region, at the heart of Europe. The conference covers all aspects of speech science and technology, ranging from fundamental contributions to practical applications, in a wide variety of areas. The programme will consist of 750 communications as oral and poster sessions, 4 keynote talks by internationally renowned experts, 6 high-level tutorials, 30 Show & Tell demos, plus an exhibition and satellite workshops. Tutorials : http://www.interspeech2013.org/content/tutorials Keynote talks: http://www.interspeech2013.org/content/keynote-speakers Satellite workshops: http://www.interspeech2013.org/content/satellite-workshops All details on : http://www.interspeech2013.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:33:05 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:33:05 +0200 Subject: Appel: Workshop Conflict and Communication Message-ID: Date: Wed, 12 Jun 2013 11:57:41 +0200 From: Laura Vincze Message-ID: X-url: http://www.dcs.gla.ac.uk/~vincia/conflict/index.html Please find in attachment the call for papers for the International Workshop on Conflict and Communication organized at the University Roma Tre, 29-31 October 2013. Submission of abstracts extended to 24th of June 2013. Universita’ Roma Tre Aula Magna Department of Philosophy, Communication, and Screen and Stage studies Via Ostiense 234 - Roma October 29 – 31, 2013 http://www.dcs.gla.ac.uk/~vincia/conflict/index.html International Workshop Conflict and communication. Multimodal Social Signals of conflict and negotiation in humans, animals, and machines When in an environment resources are limited, and two or more humans or other animals need the same resource, its attainment by one is incompatible with the attainment by the other: thus conflict arises. Conflict may simply hold between two or more beliefs (cognitive conflict), or between goals of the same person or animal (intraindividual conflict), or finally between the goals of two or more individuals or groups (interpersonal and social conflict). In all cases conflict may cause internal turmoil or social aggression, and yet sometimes may also be a carrier of positive novelty and change. This workshop focuses on interpersonal and social conflict, and on the communication that may arise from it, but also give rise to it, or finally determine conflict escalation or resolution. Since such a complex topic as conflict needs to be confronted by a high level of multidisciplinarity, we encourage contributions from various fields, among which: Psychology, Ethology, Political Sciences, Neuroscience, Linguistics, Argumentation, Social Simulation, Robotics, Social Signal processing, Swarm intelligence... Some core topics in the workshop, and their leading questions, are the following: *Theoretical issues in conflict* What is conflict, and what is the boundary between competition and conflict? Are all cases of aggression determined by conflict, and does conflict always lead to aggression? What are the mechanisms and triggering rules of escalation and what are those of negotiation? Sometimes conflicts are not explicit or evident, but rather deep, underground, covert. What are the signals of overt and covert conflicts? What are the routes of conflict? Is conflict primary (only stemming from context, bare competition over resources) or sometimes secondary to emotions (for instance might one start to raise conflict with another only due to personality clash)? What are the dynamics of conflict? Some theories propose that social hierarchies and leadership arise right with the function of minimizing conflicts. Is this (always) true? Are there types of social organization or leadership more apt than others to prevent conflict? What could / should be changed in an organization to lower the number and level of conflicts? Do the ways people and animals sense and manage conflict and its escalation and resolution change across ontogenetic and phylogenetic evolution, and if so, how do they? Are there neurological bases to the capacity of sensing and managing social conflict? *Social signals and multimodality * How is conflict expressed in communicative interaction between humans? How do the various types of conflict differ from each other, for example, discussion, argument, quarrel, contest? Do different rules apply to them? One of the main communicative forms triggered by conflict is argumentation. Can we distinguish more and less conflictual argumentations? What are the signals that reveal the existence of conflict, escalation, de-escalation, negotiation, smoothing? What are the signals of conflict between non-human animals? Are there signals shared by human and non-human animals? Conflictual communication may be studied in various modalities. In the acoustic modalities, what are the characterizing features of voice or noise in conflict? Can conflict be expressed by music? Are some types of intonation more typically used during conflict? Are there speech acts or other communicative acts typical of conflict, such as accusation, criticism, insult? How is conflict expressed in the structure of turn-taking and floor management? Are there cues of conflict in intonation and voice quality? In the visual modalities, what are the gestures, postures, gaze items and facial expressions typically used in conflict? Can conflict be expressed by art, graphics and other visual artifacts? *Ethical issues, deception and non-cooperative communication in conflict* Is there an ethics of conflict? Are there moral rules for negotiation or reconciliation? Are there cases in which conflict cannot be avoided, or negotiation should be skipped, due to ethical reasons? Does negotiation often entail deception? What are the effects of truthful and deceitful communication on conflict? Is deception exploited to avoid conflict or is it a major cause of conflict? Sometimes sincere communication, by making the conflict explicit, may contribute to exacerbate it, so people may try to avoid sincerity or use hypocrisy or vagueness to prevent conflict; but on the other hand, if one lets conflict emerge, might this contribute, and in what cases and ways, to clarify positions, look for agreement, and start negotiation? What is the relation of conflict with truthful and deceitful communication in animals? Generally animals tend to use deception more to prevent conflict than to find a way out of it – see the function of bluff and other deceitful displays – but is this always and necessary so? *Emotions and conflict* What emotions are generally a cause of conflict, and what are the most typical effects of it? How are they expressed with or without a conflictual interaction? How can trust, envy, admiration, pride, compassion or other emotions prevent, trigger, enhance, smooth conflict? How can their sincere or simulated expression work in conflict management? What is the role of empathy and other affective states in negotiation and reconciliation? *Simulation, analysis and synthesis of conflict* Is it possible to build systems for the automatic detection of conflict, both bottom up – by detecting signals of conflict – and top-down – by analyzing contexts and inferring their likeliness for conflict generation? Is it possible to construct a synthetic “negotiation counselor”? How can automatic argumentative systems be adapted to conflict prevention or resolution? How can the simulation of conflict in robots and neural systems give hints for the prevention and managing of conflict in humans? The topics of the Workshop include, but are not limited to: - theoretical and computational models of conflict - conflict, negotiation, conflict resolution, reconciliation - multimodality - multimodal corpora - social signal processing - phonetics, prosody and intonation - gesture - discourse strategies - argumentation and persuasion - deception - conversational analysis - public speaking - political communication - persuasive dialogue systems - speech analysis and synthesis - gesture and action recognition - applications - Embodied Conversational Agents - Persuasive Technology Program Committee: Jens Allwood Francesca Cantù Marco Cristani Anna Esposito Ellen Giebels Emile Hendricks Dirk Heylen Giovanna Leone Giacomo Marramao Elio Matassi David Meghnagi Enrico Menduni Alessandro Neri Magalie Ochs Franca Orletti Fabio Paglieri Albert Ali Salah Björn Schuller Key-note Speakers: Judee Burgoon, Center for the Management of Information, University of Arizona http://www.borders.arizona.edu/cms/content/judee-burgoon Cristiano Calstelfranchi, Istituto di Scienze e Tecnologie della Cognizione – CNR, Roma http://www.istc.cnr.it/it/people/cristiano-castelfranchi Ellen Giebels, Centre for Conflict, Risk and Safety Perception, University of Twente http://www.utwente.nl/gw/pcrv/en/emp/giebels.doc/ Shrikanth Narayanan, Signal Analysis and Interpretation Lab, University of South California http://sail.usc.edu/shri.php The Workshop is open to all motivated scientists, of any nationality, both on the Social Scientists and the Computer Scientists side. To encourage young researchers’ participation, grants are available for up to 8 Participants (maximum of 600 EUROS for accommodation, living and travel expenses), upon selection of the best abstracts, of the applicants’ potential contribution to the Workshop, and the benefits that they may draw from the meeting for their future activities. SUBMISSIONS: Authors are invited to submit an abstract of 400-600 words for presentation at the Workshop. After the Workshop a selection of the papers presented will be published in a book of a Springer series. Abstracts and Papers should be sent to the following addresses: poggi at uniroma3.it; fderrico at uniroma3.it; laura.vincze at gmail.com; IMPORTAT DATES: June10st, 2013: Submission of abstracts (400 – 600 words) July 10th, 2013: Notification of acceptance Extended to: June 24th, 2013: Submission of abstracts (400 – 600 words) July 24th, 2013: Notification of acceptance October 29-31, 2013: Workshop November 30th, 2013: Paper submission January 20th, 2014: Notification of acceptance of papers February 28th, 2014: Camera-ready paper Scientific organization: Isabella Poggi*, Francesca D’Errico**, Alessandro Vinciarelli***, Laura Vincze* *Università Roma Tre* Università Telematica Internazionale UNINETTUNO University of Glasgow Contacts: Isabella Poggi, poggi at uniroma3.it Francesca D’Errico, fderrico at uniroma3.it Alessandro Vinciarelli, Alessandro.Vinciarelli at glasgow.ac.uk Laura Vincze, laura.vincze at gmail.com; ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:18:53 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:18:53 +0200 Subject: Conf: ESSLLI 2013, extension for early bird registration, August 5-16, 2013, Dusseldorf, Germany Message-ID: Date: Tue, 11 Jun 2013 19:50:27 +0200 From: Wolfgang Maier Message-ID: X-url: http://www.esslli2013.de ** apologies for cross-posting ** CALL FOR PARTICIPATION (Early bird registration deadline extended!) ================================================================== ESSLLI 2013 The 25th European Summer School in Logic, Language and Information August 5-16, 2013, Düsseldorf, Germany http://www.esslli2013.de ================================================================== The 25th European Summer School in Logic, Language and Information (ESSLLI 2013) has extended the deadline for early bird registration. To take advantage of the early bird rates, register at http://esslli2013.de/registration before ** June 22, 2013 ** ESSLLI brings together logicians, linguists, computer scientists, and philosophers to study language, logic, and information, and their interconnections. The school hosts approximately 50 courses at both introductory and advanced levels, and brings together around 500 participants from all over the world. Along with the courses, ESSLLI hosts workshops and invited lectures, providing opportunities for in-depth discussion of current research. For more information on ESSLLI and on Düsseldorf, please check our website at http://esslli2013.de and our Facebook Page at https://www.facebook.com/essli.dusseldorf. We are very proud to be hosting the 25th ESSLLI in Düsseldorf and we look forward to seeing you there! -- Wolfgang Maier, on behalf of the ESSLLI 2013 Organization Committee ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:14:18 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:14:18 +0200 Subject: Appel: Collaboration pour la lemmatisation du francais medieval Message-ID: Date: Tue, 11 Jun 2013 17:07:20 +0200 From: Céline Guillot Message-ID: <51B73D28.4010603 at ens-lyon.fr> X-url: http://txm.bfm-corpus.org/ X-url: http://nl.ijs.si/ME/V4 Chers collègues, À l'occasion du projet PRESTO financé par l'ANR et la DFG (D. Vigier, Univ. Lyon2 et resp. P. Blumenthal, Univ. de Cologne), la Base de Français Médiéval (http://txm.bfm-corpus.org/) lance une vaste opération de lemmatisation d'un corpus de textes médiévaux (9e-15e siècles). Pour cela, nous avons prévu : - de construire un ou plusieurs lemmatiseurs sur la base des logiciels de l'état de l'art (TreeTagger, LGTagger...) ; - de construire un lexique morphologique le plus complet possible associant « forme(*) - catégorie morphosyntaxique(**) - lemme(***) » ; - de construire des corpus d'apprentissage déjà étiquetés. Nous souhaitons développer le lexique en appliquant un modèle de construction équivalent à celui utilisé pour le développement des logiciels ouverts (open-source), c'est à dire en compilant différents lexiques en un lexique commun diffusé sous licence libre - de type LGPLFLR (Lesser General Public License For Linguistic Resources - voir : http://hoop.univ-mlv.fr/lgpllr.html). Cette licence précisera explicitement la contribution de chaque partenaire et la mise à jour régulière du lexique sera réalisée de façon communautaire au bénéfice de tous les contributeurs. Le développement du lemmatiseur se fera dans le cadre de la plateforme TXM qui offre déjà un cadre de développement open-source en logistique de corpus (gestion de formats standards en import et en export, intégration d'outils de TAL tiers, etc.). Ce nouvel outil de lemmatisation sera ouvert à tous et librement adaptable (open-source avec une licence de diffusion de logiciel de type GNU GPL - voir : http://www.rodage.org/gpl-3.0.fr.txt). Si vous disposez de ressources pour la période médiévale, nous souhaiterions savoir si vous êtes intéressés par des échanges et par le partage d'un lexique ou de corpus d'apprentissage dans les conditions décrites ci-dessus. Si vous connaissez des personnes qui pourraient être intéressées, nous vous serions très reconnaissants de leur faire suivre ce mail. Bien cordialement, Céline Guillot pour l'équipe BFM (*) certaines formes pourront être composées si nécessaire (par exemple comme dans le cas d'un dictionnaire Unitex) (**) nous souhaiterions utiliser un jeu d'étiquettes normalisé basé par exemple sur le standard Multext adapté à l'époque médiévale (http://nl.ijs.si/ME/V4) (***) nous souhaiterions utiliser des formes modernisées des lemmes ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:16:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:16:45 +0200 Subject: Cursus: Master specialite, Traitement Automatique des Langues, Universite de Lorraine Message-ID: Date: Tue, 11 Jun 2013 17:33:24 +0200 (CEST) From: Laure Buhry Message-ID: <180013217.5085055.1370964804345.JavaMail.root at inria.fr> X-url: http://ufr-mathinfo.fr/sciencescognitives/ X-url: http://www.lct-master.org. Le master Sciences de la Cognition et Applications (SCA) de l'université de Lorraine propose une spécialité : Traitement Automatique des Langues La première année est commune à deux spécialités : Sciences Cognitives et Média Numériques, et Traitement Automatique des Langues (TAL). Cette formation de master en TAL combine des cours fondamentaux et des cours à visée applicative. Ses débouchés sont aussi bien académiques qu'industriels. Elle peut intéresser les étudiants français possédant une licence en sciences cognitives, en sciences du langage ou en informatique. Site web du master SCA : http://ufr-mathinfo.fr/sciencescognitives/ Cette formation est également support au programme : master Erasmus Mundus « Language and Communication Technologies » (LCT) . La formation TAL du master SCA proposée par l'Université de Lorraine est commune aux étudiants Erasmus Mundus LCT et à ceux qui veulent seulement faire le master de l'Université de Lorraine. De ce fait, les cours sont dispensés en anglais. Les universités partenaires du master LCT sont les suivantes : + université de la Sarre à Sarrebrück (Allemagne) + université de Trento (Italie) + université de Malte + université Charles de Prague (République Tchèque) + université de Lorraine + université de Groningen (Pays-Bas) + université Jiao Tong de Changhaï (Chine) + université de Melbourne (Australie) + université du Pays Basques (Espagne). Les étudiants du programme Erasmus Mundus font leur première année de master dans une université du consortium et leur deuxième année dans une autre université de ce consortium. À l'issue de leurs études, ils sont diplômés des deux universités où ils ont effectué leurs études. site web du programme LCT : http://www.lct-master.org. Pour plus de renseignements : + responsable master SCA : manuel.rebuschi at univ-lorraine.fr + responsable spécialité TAL : laure.buhry at inria.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:38:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:38:48 +0200 Subject: Appel: Donnees hybrides et contextualisation des corpus, Nouvelles approches en sciences du langage Message-ID: Date: Wed, 12 Jun 2013 20:44:57 +0200 From: Alice Krieg-Planque Message-ID: <51B8C1A9.5030506 at club-internet.fr> X-url: http://f.hypotheses.org/wp-content/blogs.dir/1033/files/2013/06/Appel-à-communications-corpus-et-contextes-20141.pdf Les universités de Paris 13, Paris 5 et Paris 3 lancent un appel pour un colloque de doctorants intitulé "Données hybrides et contextualisation des corpus. Nouvelles approches en sciences du langage" qui se tiendra à Paris les 23-24 Mai 2014. La date limite de soumission est le 9 décembre 2013. L'adresse d'envoi des propositions de communication est : corpusetcontextes at gmail.com. Pour télécharger l'appel : http://f.hypotheses.org/wp-content/blogs.dir/1033/files/2013/06/Appel-à-communications-corpus-et-contextes-20141.pdf Merci de diffuser auprès de vos réseaux. Bien cordialement Catherine Ruchon ruchon at free.fr Doctorante en sciences du langage Université Paris 13 Sorbonne Paris Cité PLÉIADE (CENEL) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:25:13 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:25:13 +0200 Subject: Appel: AIRS 2013 Message-ID: Date: Wed, 12 Jun 2013 06:41:55 +0000 From: "Zhang Min (I2R)" Message-ID: ========== Apologies for cross-posting ======= The Ninth Asia Information Retrieval Societies Conference (AIRS 2013) December 09-11, 2013, Singapore The Chinese and Oriental Languages Information Processing Society (COLIPS) is glad to host AIRS 2013 in Singapore, a well communicated and top conference city in Asia, from 9 to 11 December 2013. Singapore has already been the host city for other major conferences such as SIGIR 2008 and ACL 2009 (COLIPS being one of the local organizers of the latter one), as well as a previous edition of AIRS in 2006 and many other international workshops and events. All these successful experiences, which have been continuously confirmed over the years by the positive feedback from participating delegates and board members, have endorse the reputation of Singapore as a world-class venue for organizing and hosting international conferences and meetings. Additionally, Singapore’s long tradition in high-quality research in infocomm technologies, as well as its vibrant and dynamic academic and industrial communities, determines the fundamental interest from COLIPS to organize well recognized conferences relevant to the infocomm area, such as AIRS. The Asia Information Retrieval Societies Conference (AIRS) aims to bring together researchers and developers to exchange new ideas and latest achievements in the field of Information Retrieval. The scope of the conference covers applications, systems, technologies and theory a spects of information retrieval in text, audio, image, video and multimedia data. The AIRS 2013 welcomes submissions of original papers in the broad field of Information Retrieval. The technical areas covered include, but are not limited to, the following: 1. IR Models and Theories 2. User Study, Evaluation and Interactive IR 3. Web IR, Scalability and IR in Social Media 4. Multimedia IR 5. Natural Language Processing for IR 6. Machine Learning and Data Mining for IR 7. IR Applications Important Dates: - Jun 23rd, Paper Submission Due - Jul 28th, Notification of Acceptance - Aug 11th, Camera Ready Due - Dec 9th – 11th AIRS 2013 to be held in Singapore The AIRS 2013 proceedings will be published as a Springer’s LNCS volume. Submissions should comply with the corresponding author instructions available at the Springer's LNCS website: http://www.springer.com/computer/lncs Paper submissions must be completed electronically and in PDF format to the following URL: https://www.softconf.com/e/airs2013/ Organizing Committee - Conference Co-chairs: Rafael E. Banchs (Institute for Infocomm Research) Min Zhang (Chinese and Oriental Language Information Processing Society and Institute for Infocomm Research, Singapore) - Program Committee Co-Chairs: Fabrizio Silvestri (Istituto de Scienza e Tecnologia dell’Informazione, Italy) Tie-Yan Liu (Microsoft Research Asia, China) Rafael E. Banchs (Institute for Infocomm Research, Singapore) - Publication Co-Chairs: Sheng Gao (Institute for Infocomm Research) Jun Lang (Chinese and Oriental Language Information Processing Society) - Local Organizing Committee Co-Chairs: Minghui Dong (Chinese and Oriental Language Information Processing Society) Seokhwan Kim (Institute for Infocomm Research) Marta Ruiz Costa-jussà (Universitat Politecnica de Catalunya / Institute for Infocomm Research) - Publicity Co-Chairs: Min Yen Kan (National University of Singapore) Jens Grivolla (Barcelona Media Innovation Centre) - Conference Advisor: Haizhou Li (Institute for Infocomm Research) AIRS Steering Committee: - Hsin-Hsi Chen (Taiwan) - Gary Geunbae Lee (Korea) - Wai Lam (Hong Kong) - Alistair Moffat (Australia) - Hwee Tou Ng (Singapore) - Tetsuya Sakai (Mainland China) - Dawei Song (UK) - Masaharu Yoshioka (Japan) Area Co-chairs: 1. IR Models and Theories - Bin Wang (Chinese Academy of Sciences, China) - Craig Macdonald (University of Glasgow, UK) 2. User Study, IR Evaluation and Interactive IR - Tetsuya Sakai (Microsoft Research Asia, China) - Ben Carterette (University of Delaware, USA) 3. Web IR, Scalability, and IR in Social Media - Alistair Moffat (University of Melbourne, Australia) - Min Zhang (Tsinghua University, China) 4. Multimedia IR - Kazunari Sugiyama (National University of Singapore, Singapore) - Joemon Jose (University of Glasgow, UK) 5. Natural Language Processing for IR - Qi Haoliang (Heilongjiang Institute of Technology, China) - Donald Metzler (Google Research, USA) 6. Machine Learning and Data Mining for IR - Sadao Kurohashi (Kyoto University, Japan) - Roi Blanco (University of A Coruña, Spain) 7. IR Applications - Jimmy Huang (York University, Canada) - Gabriella Pasi (Universita de Milano Bicocca, Italy) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 19:56:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 21:56:24 +0200 Subject: ATALA: Convocation a l'Assemblee Generale ordinaire le 20 juin 2013 Message-ID: Date: Fri, 14 Jun 2013 21:37:51 +0200 From: Thierry Hamon Message-ID: <87ppvozdo0.fsf at smtp.univ-paris13.fr> X-url: http://www.atala.org/IMG/pdf/procuration_AG_2009.pdf Chers adhérents de l'ATALA, Comme chaque année, le moment est venu de nous réunir en Assemblée Générale ordinaire. Le rendez-vous est fixé au jeudi 20 juin 2013 à 16h30 aux Sables d'Olonne, pendant la conférence TALN/RÉCITAL 2013. Vous trouverez ci-dessous la convocation à cette Assemblée Générale et un appel à candidature pour le Conseil d'Administration. En souhaitant vous y retrouver nombreux, amicalement, Benoît Sagot, secrétaire de l'ATALA. ------------------------------------------------------------------- CONVOCATION À L'ASSEMBLÉE GÉNÉRALE ORDINAIRE DE L'ATALA ------------------------------------------------------------------- Jeudi 20 juin 2013 à 16h30, Les Sables d'Olonne. Ordre du jour : - Rapport moral par la Présidente, Frédérique Segond. - Rapport financier par le Trésorier, Georges Antoniadis. - Rapport sur la revue TAL par Patrick Paroubek. - Rapport sur les conférences TALN-RÉCITAL par Frédéric Béchet. - Rapport sur les journées d'étude par Isablle Tellier. - Renouvellement du tiers sortant du Conseil d'Administration. Pour rappel, composition actuelle du Conseil d'Administration : * Elus en 2010 : Jonathan Chevelu, Emmanuel Morin, Benoît Sagot. * Elus en 2011 : Maxime Amblard, Frédéric Béchet, Frédérique Segond, Anne García-Fernandez, Adil El Ghali, Cyril Grouin, Mathieu Lafourcade, Yves Lepage, Patrick Paroubek, Alexandre Patry, Benoît Trouvilliez * Elus en 2012 : Georges Antoniadis, Karën Fort, Nuria Gala, Thierry Hamon, Didier Schwab, Isabelle Tellier, Anne Vilnat Les adhérents qui ne participeront pas à l'Assemblée Générale peuvent voter par procuration en remettant une procuration remplie et signée à un membre de l'association qui assistera à l'AG. Un formulaire de procuration est téléchargeable à l'adresse suivante http://www.atala.org/IMG/pdf/procuration_AG_2009.pdf et à la fin du message. Si le quorum n'est pas atteint, une assemblée générale extraordinaire sera convoquée à 16h45 avec le même ordre du jour. ------------------------------------------------------------------- APPEL À CANDIDATURES POUR LE CONSEIL D'ADMINISTRATION ------------------------------------------------------------------- Les membres du tiers sortant sont rééligibles, mais ils doivent en exprimer le souhait. L'entrée au CA est ouverte à tout membre de l'ATALA. Les personnes souhaitant se porter candidates sont priées de le signaler soit par courrier électronique à contact at atala.org, soit le jour de l'AG. Les candidatures seront affichées sur le site http://www.atala.org au fur et à mesure de leur réception. Nous attirons l'attention sur le fait que l'ATALA souhaite accueillir en son CA des personnes motivées et prêtes à s'investir dans les activités administratives de l'association. ------------------------------------------------------------------------ "Je soussigné (nom, prénom, domicile)............................................................... Donne, par la présente, pouvoir à M. ........................................................................ Pour me représenter lors des votes de l'Assemblée Générale Ordinaire qui se tiendra le jeudi 20 juin 2013." ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 19:57:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 21:57:04 +0200 Subject: Appel: Revue TAL - Note de lecture (SOGAARD) Message-ID: Date: Thu, 13 Jun 2013 10:49:42 +0200 (CEST) From: Denis Maurel Message-ID: <168371801.17120965.1371113382946.JavaMail.root at mail10> La revue TAL publie régulièrement des notes de lecture. Nous recherchons un collègue souhaitant lire le livre: "Anders SØGAARD. Semi-Supervised Learning and Domain Adaptation in Natural Language Processing. Morgan & Claypool publishers. 2013. 93 pages." et prêt à en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoyé gracieusement en échange du service rendu). Cette note de lecture doit être rédigée en français (trois pages maximum, au format de la revue) et envoyée fin août 2013. D'autres compte-rendu sont possibles si vous avez lu récemment un ouvrage qui vous a intéressé et si vous êtes prêt à partager votre lecture avec la communauté... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 19:58:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 21:58:32 +0200 Subject: Conf: SIIM@IC@PFIA'2013, Lille, 1er juillet 2013 Message-ID: Date: Thu, 13 Jun 2013 11:02:50 +0200 From: Lina Soualmia Message-ID: X-url: http://www.irit.fr/SIIM/2013/ La 2ème édition du Symposium sur l'Ingénierie de l'Information Médicale aura lieu le 1er juillet à Lille Elle est associée aux 24èmes journées francophones d'Ingénierie des Connaissances au sein de la Plateforme pour l'IA Site web : http://www.irit.fr/SIIM/2013/ ****************************** Présentation ---------------- SIIM 2013 est la seconde édition du Symposium sur l’ingénierie de l’information médicale qui réunit les communautés en informatique médicale, des systèmes d'information et de gestion de la connaissance en ciblant des problématiques liées à l’ingénierie de l’information médicale. L'édition inaugurale a eu lieu en 2011 à Toulouse ( http://www.irit.fr/SIIM/2011/index.php) et a émergé des journées ayant eu lieu à Rennes en 2003, Rouen en 2004 et de l’atelier qui s’est déroulé à Nîmes en 2010 autour du web sémantique médical ( http://www-limbio.smbh.univ-paris13.fr/wsm10/). Son objectif majeur est de débattre des verrous liés à la modélisation, la structuration, l’extraction, la recherche et la fouille d’informations de tous types et de questions connexes et ce, à travers la présentation des activités de recherche innovantes, des techniques, des technologies et de démonstrateurs développés aussi bien dans le monde académique, dans les laboratoires affiliés aux structures de santé et par des industriels impliqués dans le domaine de l’ingénierie de l’information qui couvre la modélisation, la structuration, l’extraction, la recherche et la fouille d’informations de tous types : structurée sous forme de donnée, semi-structurée ou non structurée sous forme de texte, d’image, de son, ...etc. Le symposium SIIM cible un public de jeunes chercheurs, chercheurs et industriels impliqués dans le domaine de l’usage de l’information médicale depuis sa production jusqu’à sa valorisation. Programme : -------------------- Pour plus de détails sur le programme : http://www.irit.fr/SIIM/2013/programme.php Thèmes ---------- - Terminologies et Ontologies médicales : Interopérabilité des systèmes d’information en santé, indexation terminologique de la littérature médicale, de dossiers médicaux de patients et de récits cliniques, annotations de documents, formalismes de représentation, alignement d’ontologies et de terminologies. - Usage du Web 2.0 en santé : Réseaux collaboratifs des praticiens de santé, patients et famille, réseaux bibliographiques dans le domaine médical, annotation sociale de ressources médicales. - Traitement d'informations multimodales : Traitement du texte, image et son, classification et intégration de contenus médicaux multimodaux, multi-sources - Extraction de l’information et de connaissances à partir de contenus médicaux : Anonymisation, extraction d’entités nommées, de variable et/ou indicateurs pathologiques, recherche de corrélations, fouille de données - Systèmes d'informations en santé : Représentation, traitement et accès aux informations et des connaissances en santé, systèmes d’information décisionnels de santé, gestion des dossiers médicaux de patients, personnalisation et santé Inscriptions : --------------------- Cette année, l'édition de SIIM est intégrée au sein de la plateforme de l'Intelligence Artificielle, les inscriptions sont donc centralisées. Pour plus de détails : http://pfia2013.univ-lille1.fr/ Organisateurs: ------------------- TAMINE LECHANI Lynda, IRIT, Toulouse SOUALMIA Lina, LITIS, Rouen Comité d'initiative : ---------------------- CHARLET Jean Charlet, ICS, INSERM, Paris JAULENT Marie-Christine, ICS, INSERM, Paris LUENGO Vanda, LIG, Grenoble SOUALMIA Lina, LITIS, Rouen SOUF Nathalie, IRIT, Toulouse TAMINE LECHANI Lynda, IRIT, Toulouse Comité de Programme : --------------------------- Brigitte Grau, LIMSI, Paris Orsay Catherine Berrut, LIG, Grenoble Fleur Mougin, ISPED, Université Bordeaux 2 Jean Charlet, ICS, INSERM, Paris Lina Soualmia, LITIS, Rouen Lynda Tamine Lechani, IRIT, Toulouse Marie-Christine Jaulent, ICS, INSERM, Paris Natalia Grabar, STL, Lille Nathalie Souf, IRIT, Toulouse Sandra Bringay, LIRMM, Université Montpellier 2 Vanda Luengo, LIG, Grenoble Pierre Zweigenbaum, LIMSI, Paris Orsay ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 20:00:53 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 22:00:53 +0200 Subject: Seminaire: Jennifer Foster, Analyse syntaxique au-dela du F-score, 01/07/2013, Villetaneuse Message-ID: Date: Thu, 13 Jun 2013 16:22:03 +0200 From: Antoine Rozenknop Message-ID: <51B9D58B.9070105 at lipn.univ-paris13.fr> Le LIPN accueillera Jennifer Foster, de l'Université de Dublin, pour un séminaire qui portera sur l'utilité de l'analyse syntaxique dans les applications avales. Le séminaire aura lieu au LIPN (Univ.Paris 13, campus de Villetaneuse) en salle B107, le lundi 1er juillet à 14 heures. Pour venir au LIPN, voir les informations sur : http://lipn.univ-paris13.fr/fr/contact Cordialement, Antoine Rozenknop --- Titre --- After the f-score: applying parser output in sentiment analysis, grammatical error detection and quality estimation for machine translation --- Résumé --- Syntactic parsing is viewed as a fundamental task which is useful forseveral natural language processing applications, either because theidentification of predicate-argument structure can help in"sense-making" applications such as sentiment analysis or questionanswering, or because the identification of syntactic anomaly can helpin "language proofing" applications such as grammar checking orcomputer-aided language learning. In this talk, I will discussexperiments carried out in the National Centre for Language Technologyin Dublin City University which aim to determine the usefulness ofparser output in three downstream applications, namely, sentimentanalysis, grammatical error detection and quality estimation for machinetranslation. In all these experiments some kind of phrase structureparser (lexicalised PCFG, PCFG-LA and LFG precision grammar parsing) wasused to parse the input, and in some cases, the phrase structures wereconverted to syntactic dependencies. The information from the phrasestructure trees and dependency graphs was employed in the downstreamapplication via tree kernels or manually engineered features. It is clear from these experiments that syntactic parsing always provides someuseful information but it is not yet clear how best to encode thissyntactic information or what the relationship between the accuracy ofthe parser (as measured by intrinsic evaluation metrics such as ParsevalF1 or labelled attachment accuracy) and its usefulness in the downstreamapplication is. --- Séminaires LIPN : http://lipn.univ-paris13.fr/fr/seminaires --- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 20:04:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 22:04:03 +0200 Subject: Habilitation: Frederic Landragin, Dialogue homme-machine multimodel Message-ID: Date: Fri, 14 Jun 2013 16:27:22 +0200 From: Frederic Landragin Message-ID: <51BB284A.8070704 at ens.fr> X-url: http://editions.lavoisier.fr/notice.asp?ouvrage=2732845 X-url: http://eu.wiley.com/WileyCDA/WileyTitle/productCd-184821457X.html Vous êtes cordialement invités à venir assister à la soutenance d'HDR de Frédéric Landragin, "Dialogue homme-machine multimodal, de la pragmatique linguistique à la conception de systèmes", qui aura lieu le vendredi 28 juin à 14h en salle de conférences du LIMSI. Le jury sera constitué par Mesdames et Monsieur : - Harry Bunt, University of Tilburg (rapporteur), - Sophie Rosset, CNRS, LIMSI, - Catherine Schnedecker, Université de Strasbourg (rapporteur), - Isabelle Tellier, Université de Paris 3 Sorbonne Nouvelle, - Mariët Theune, University of Twente (rapporteur), - Anne Vilnat, Université de Paris-Sud. Résumé : Un des objectifs fondamentaux du dialogue homme-machine est de se rapprocher du dialogue naturel en langage naturel, c'est-à-dire de permettre une interaction entre la machine et son utilisateur humain dans la langue de celui-ci (langage naturel), avec une structure d'échanges similaire à celle d'un dialogue humain (dialogue naturel). Les recherches impliquées se nourrissent de travaux linguistiques qui analysent la langue, et de travaux pragmatiques qui analysent l'usage du langage en contexte. Deux facettes importantes de la pragmatique linguistique portent ainsi sur les phénomènes de référence, par exemple les désignations des objets accessibles dans le contexte situationnel, et sur les actes de langage, ou actes de dialogue, c'est-à-dire les actions communicatives effectuées par les énoncés constituant les tours de parole. Nous présentons nos travaux de modélisation et de formalisation de ces deux facettes, avec leur application au dialogue avec support visuel et au dialogue associant parole et gestes co-verbaux (dialogue multimodal). Un autre objectif du dialogue homme-machine est de mettre en oeuvre des méthodologies et des moyens, par exemple des architectures logicielles réutilisables, pour faciliter le développement de systèmes. Nous présentons nos réflexions et nos réalisations dans ce sens, à travers notamment notre participation à un ensemble de projets européens. Nous proposons enfin des perspectives de recherche qui visent à mieux intégrer au dialogue homme-machine des phénomènes linguistiques et pragmatiques telles que la saillance et l'ambiguïté. La partie de cette habilitation relative à l'état de l'art et à la synthèse des travaux effectués fait l'objet d'un livre dont la parution est prévue pour septembre 2013 : http://editions.lavoisier.fr/notice.asp?ouvrage=2732845 Une version en anglais est prévue pour juillet 2013 : http://eu.wiley.com/WileyCDA/WileyTitle/productCd-184821457X.html ___________________________________________________________________ Frederic Landragin CNRS - Laboratoire LaTTICe - 1 rue Maurice Arnoux - 92120 Montrouge http://www.lattice.cnrs.fr/Frederic-Landragin/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 21:19:13 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 23:19:13 +0200 Subject: Job: Post-doc position in data-mining and statistic (LIRMM, Montpellier, France) Message-ID: Date: Tue, 18 Jun 2013 22:49:45 +0200 From: Sandra Bringay Message-Id: <8C5134AA-F519-49E0-B1AB-989B2D7054F3 at lirmm.fr> X-url: http://www.iresp.net/ X-url: http://www.lirmm.fr/ X-url: http://ens.math.univ-montp2.fr X-url: http://www.icm.unicancer.fr/ Experienced researcher position in Statistic and DataMining Understanding the quality of life of patients with breast cancer: Medical information extraction and sentiment analysis in health forum An Experienced Researcher position (e.g. post-doc, 10 months), funded by the GIS-IRESP (http://www.iresp.net/), is available in Montpellier (France) at the LIRMM laboratory (Laboratory of computer sciences, robotic, micro-electronic of Montpellier, University of Montpellier, CNRS, http://www.lirmm.fr/), the I3M Laboratory (Institute of Mathematics and mathematical modelling of Montpellier, http://ens.math.univ-montp2.fr/) and the ICM (Institute of Cancer Montpellier, http://www.icm.unicancer.fr/). Topic: The proposed topic is part of a larger project called "Comparison of longitudinal analysis models of the health-related quality of life (QoL) in oncology". The overall aim of this project is to propose and compare QoL longitudinal analysis methods based on a methodology already used in survival analysis or on more complex theoretical models (linear mixed model, IRT model). These methods will be applied to clinical trial data to analyse the EORTC QLQ-C30 questionnaire in a variety of therapeutic situations and tumor sites. The sentiment analysis extracted from health forum will appear to be an interesting alternative to quality of life study based on standardised auto-questionnaires and will provide a perspective via results coming from the QLQ-C30 analysis. This project will be focus on women with breast cancer and on the development process of the disease to take into account the longitudinal aspect. Eight researchers have been working on this topic since early 2013. We are now looking for a researcher who will work together with this team. The originality of this post-doc is to be part of a multidisciplinary project and to develop semi-automatic medical information extraction methods and sentiment analysis methods applied to health forum. The main objective is to provide healthcare professionals and patients with a knowledge discovery framework. The extraction of relevant information within health forum is a first step to define a semi-automatic method for sentiment analysis related to cancer management (e.g., identification of latent topics that describe a corpus of messages from several health forums). One of the main issues is to propose original methods taking into account the heterogeneity of authors, topics, texts in their structure and their contents. This research work focuses initially on the automatic extraction of features such as medical, opinion, risk… features. In a second step, the research will develop useful views to present these features to the targeted users: health care professionals and patients. In this highly subjective context, the characterization and understanding of the representations of the patients medical concepts is difficult. However, these tasks are particularly fundamental to plan and design medical public policies. Finally, the work proposed in this post-doc should help meet this dual challenge: medical information extraction and sentiment analysis related to cancer management. Under the overall guidance of the research coordinator at LIRMM, I3M and ICM, the researcher will also contribute to the preparation of project deliverables, publish related work in scientific journals, participate in workshops and meetings and track schedules of tasks. The position is a research-only post, with no teaching obligations. Location: The work will be carried out at the LIRMM laboratory (Montpellier in France). The consortium of the project is composed of computer science researchers, statisticians as well as health care professionals. Supervision: The project will be formally jointly supervised by Dr. Sandra Bringay at LIRMM, Dr. Cyrille Joutard and Pr. Christian Lavergne at I3M and Dr. Mollevi Caroline at ICM. Requirements: The candidate is required to hold a PhD obtained in a topic related to text mining, statistic or automatic natural language processing, with a firm background in sentiment analysis and focus on the development and implementation of web-based tools. Candidates with backgrounds in medical datasets are strongly encouraged to apply. Strong experience in programming language (e.g. C++, PERL, PHP…) is requested. Working experience at national and international levels is an asset. The candidate will work in a team with PhD researchers and MSc students. The candidate should demonstrate team building skills, and ability to work collaboratively and to establish and maintain effective working relationships with colleagues of different nationalities and cultural backgrounds. The candidate should prove ability to analyse and integrate diverse information and to communicate it (verbally and in writing) clearly and effectively. For the advertised post, fluency in oral and written English is required. Knowledge in French is an asset. It is expected that the successful candidate will participate in all meetings and workshops organized by the project – related additional funding will be available. The candidate must be willing to disseminate the results within the project during the meetings, but also and in particular through presentations at conferences and contributions to scientific journals. Starting date: October 2013 (some flexibility is possible, but at the latest January 2014). Salary: 1850€ (Net Income) Application deadline: 15th July 2013, applications will be processed as they are received. Contact: Interested candidates should contact and send their application (curriculum vitae, statement of research interest, publications, and addresses of three referees) by email to: Dr. Sandra BRINGAY MCF LIRMM – UMIII bringay at lirmm.fr LIRMM, UMR 5506 161 rue Ada 34095 Montpellier Cedex 5 Tél : (33/0) 04 67 41 86 31 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:11:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:11:37 +0200 Subject: Ecole: SSTiC 2013, next registration deadline 26 June 2013 Message-ID: Date: Sun, 16 Jun 2013 10:44:26 +0200 From: "GRLMC" Message-ID: <66C51A5AEFC34B0BB9DA1F0D4FEC58D2 at Carlos1> X-url: http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* 2013 INTERNATIONAL SUMMER SCHOOL ON TRENDS IN COMPUTING SSTiC 2013 Tarragona, Spain July 22-26, 2013 Organized by Rovira i Virgili University http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* +++ next registration deadline: June 26 +++ ********************************************************************* AIM: SSTiC 2013 will be an open forum for the convergence of top class well recognized computer scientists and people at the beginning of their research career (typically PhD students) as well as consolidated researchers. SSTiC 2013 will cover the whole spectrum of computer science by means of 56 six-hour courses dealing with hot topics at the frontiers of the field. By actively participating, lecturers and attendees will share the idea of scientific excellence as the main motto of their research work. ADDRESSED TO: Graduate students from around the world. There are no pre-requisites in terms of the academic degree the attendee must hold. However, since there will be several levels among the courses, in the description of some of them reference may be made to specific knowledge background. SSTiC 2013 is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. Finally, senior researchers will find it fruitful to listen and discuss with people who are main references of the diverse branches of computing nowadays. REGIME: 7 parallel sessions will be held during the whole event. Participants will be able to freely choose the courses they will be willing to attend as well as to move from one to another. VENUE: Palau Firal i de Congressos de Tarragona Arquitecte Rovira, 2 43001 Tarragona http://www.palaucongrestgna.com COURSES AND PROFESSORS: Shun-ichi Amari (Riken) [introductory] Information Geometry and Its Applications James Anderson (Chapel Hill) [intermediate] Scheduling and Synchronization in Real-Time Multicore Systems Pierre Baldi (Irvine) [intermediate] Big Data Informatics Challenges and Opportunities in the Life Sciences Yoshua Bengio (Montréal) [introductory/intermediate] Deep Learning of Representations Stephen Brewster (Glasgow) [advanced] Multimodal Human-Computer Interaction Bruno Buchberger (Linz) [introductory] Groebner Bases: An Algorithmic Method for Multivariate Polynomial Systems. Foundations and Applications Rajkumar Buyya (Melbourne) [intermediate] Cloud Computing Jan Camenisch (IBM Zurich) [intermediate] Cryptography for Privacy Larry S. Davis (College Park) [intermediate] Video Analysis of Human Activities Paul De Bra (Eindhoven) [intermediate] Adaptive Systems Paul Dourish (Irvine) [introductory] Ubiquitous Computing in a Social Context Max J. Egenhofer (Maine) [introductory/intermediate] Qualitative Spatial Relations: Formalizations and Inferences Richard M. Fujimoto (Georgia Tech) [introductory] Parallel and Distributed Simulation David Garlan (Carnegie Mellon) [advanced] Software Architecture: Past, Present and Future Mario Gerla (Los Angeles) [intermediate] Vehicle Cloud Computing Georgios B. Giannakis (Minnesota) [advanced] Sparsity and Low Rank for Robust Data Analytics and Networking Ralph Grishman (New York) [intermediate] Information Extraction from Natural Language Francisco Herrera (Granada) [intermediate] Imbalanced Classification: Current Approaches and Open Problems Paul Hudak (Yale) [introductory] Euterpea: From Signals to Symphonies Using Haskell Niraj K. Jha (Princeton) [intermediate] FinFET Circuit Design George Karypis (Minnesota) [introductory] Introduction to Parallel Computing: Architectures, Algorithms, and Programming Aggelos K. Katsaggelos (Northwestern) [intermediate/advanced] Sparsity-based Advances in Image Processing Arie E. Kaufman (Stony Brook) [advanced] Advances in Visualization Hugo Krawczyk (IBM Research) [intermediate] An Introduction to the Design and Analysis of Authenticated Key Exchange Protocols Pierre L'Ecuyer (Montréal) [intermediate] Quasi-Monte Carlo Methods in Simulation: Theory and Practice Laks Lakshmanan (British Columbia) [intermediate/advanced] Information and Influence Spread in Social Networks Wenke Lee (Georgia Tech) [introductory] DNS-based Monitoring of Malware Activities Maurizio Lenzerini (Roma La Sapienza) [intermediate] Ontology-based Data Integration Ming C. Lin (Chapel Hill) [introductory/intermediate] Physically-based Modeling and Simulation Jane W.S. Liu (Academia Sinica) [intermediate] Critical Information and Communication Technologies for Disaster Preparedness and Response Satoru Miyano (Tokyo) [intermediate] How to Hack Cancer Systems with Computational Methods Aloysius K. Mok (Austin) [intermediate] From Real-time Systems to Cyber-physical Systems Hermann Ney (Aachen) [intermediate/advanced] Probabilistic Modelling for Natural Language Processing - with Applications to Speech Recognition, Handwriting Recognition and Machine Translation Cathleen A. Norris (North Texas) & Elliot Soloway (Ann Arbor) [introductory] Primary & Secondary Educational Computing in the Age of Mobilism Jeff Offutt (George Mason) [intermediate] Cutting Edge Research in Engineering of Web Applications David Padua (Urbana) [intermediate] Parallel Programming with Abstractions Bijan Parsia (Manchester) [introductory] The Semantic Web: Conceptual and Technical Foundations Charles E. Perkins (FutureWei) [intermediate/advanced] Beyond 4G Prabhakar Raghavan (Google) [introductory/intermediate] Web Search and Advertising Phillip Rogaway (Davis) [introductory/intermediate] Provably Secure Symmetric Encryption Gustavo Rossi (La Plata) [intermediate] Topics in Model Driven Web Engineering Kaushik Roy (Purdue) [introductory/intermediate] Low-energy Computing Robert Sargent (Syracuse) [introductory] Validating Models Douglas C. Schmidt (Vanderbilt) [intermediate] Patterns and Frameworks for Concurrent and Networked Software Bart Selman (Cornell) [intermediate] Fast Large-scale Probabilistic and Logical Inference Methods Mubarak Shah (Central Florida) [intermediate/advanced] Visual Crowd Surveillance Ron Shamir (Tel Aviv) [introductory] Revealing Structure in Disease Regulation and Networks Dawn Xiaodong Song (Berkeley) [introductory] Selected Topics in Computer Security Mike Thelwall (Wolverhampton) [introductory] Sentiment Strength Detection for the Social Web Julita Vassileva (Saskatchewan) [introductory/intermediate] Engaging Users in Social Computing Systems Philip Wadler (Edinburgh) [introductory] Topics in Lambda Calculus and Life Yao Wang (Polytechnic New York) [introductory/advanced] Video Compression: Fundamentals and Recent Development Gio Wiederhold (Stanford) [introductory] Software Economics: How Do the Results of the Intellectual Efforts Enter the Global Market Place Limsoon Wong (National Singapore) [introductory/intermediate] The Use of Context in Gene Expression and Proteomic Profile Analysis Michael Wooldridge (Oxford) [introductory] Autonomous Agents and Multi-Agent Systems Ronald R. Yager (Iona) [introductory/intermediate] Fuzzy Sets and Soft Computing Philip S. Yu (Illinois Chicago) [advanced] Mining Big Data REGISTRATION: It has to be done at http://grammars.grlmc.com/SSTiC2013/Registration.php Since the capacity of the venue is limited, registration requests will be processed on a first come first served basis. The registration period will be closed when the capacity of the venue will be complete. FEES: Fees may be for the whole week (full-time participant) or per blocks of days (part-time participant). They are a flat rate allowing one to attend all courses within the time window set: 5, 4, 3 or 2 days. Fees vary depending on the deadline. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Participants will be delivered a certificate of attendance. IMPORTANT DATES: Announcement of the programme: January 26, 2013 Registration deadlines: next: June 26, 2013 last: July 25, 2013 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat POSTAL ADDRESS: SSTiC 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Departament d’Economia i Coneixement, Generalitat de Catalunya Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:27:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:27:23 +0200 Subject: Job: Stage Linguiste, LexisNexis Message-ID: Date: Mon, 17 Jun 2013 10:23:05 +0200 From: "Aubier, Céline (LNG-PAR)" Message-ID: <44D17B4C0772314AA60885B57DAA67463CB1B776 at LNGPAREXCP01VA.legal.regn.net> STAGE Linguiste LexisNexis en France (600 collaborateurs, 140 M€ de CA), filiale du groupe anglo-néerlandais Reed Elsevier, est un acteur majeur dans les services d'information professionnelle. Ses activités couvrent trois domaines : l'information et l'édition juridiques, la diffusion de la presse et de l'information économique et financière sur Internet, les logiciels professionnels. L'entreprise s'appuie sur une expertise éditoriale centenaire et sur une technologie de pointe pour apporter au monde du droit et aux professionnels de tous secteurs d'activités une vaste gamme de produits et services réputés : JurisClasseur, Litec, D.O, Bottin Administratif et les services en ligne LexisNexis. Mission : Intégré(e) à l'équipe « Management de l'information» votre mission consistera à participer aux activités relatives au textmining, qui traitent de l'extraction d'information juridique à valeur ajoutée. Profil : Master 2 en linguistique informatique Vous êtes d'une nature rigoureuse et méticuleuse Connaissance d'Unitex obligatoire Niveau d'étude : Master 1 ou 2 / stage de fin d'étude. LIEU : 141 rue de Javel 75015 PARIS DUREE : 5-6 mois dès que possible MODALITES: Indemnité mensuelle de 436,05 euros Tickets restaurant 50% du titre de transport pris en charge Convention de stage obligatoire Merci d'envoyer votre candidature (CV + lettre de motivation) ainsi que vos disponibilités par mail à : celine.aubier at lexisnexis.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:19:36 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:19:36 +0200 Subject: Appel: Terminology and Artificial Intelligence TIA 2013 - extended deadline Message-ID: Date: Mon, 17 Jun 2013 14:06:46 +0200 From: Nathalie Aussenac-Gilles Message-ID: <51BEFBD6.4060507 at irit.fr> X-url: http://flores.lipn.univ-paris13.fr/tia2013/ Due to general demand the deadline for submission of papers has been extended: *5 July 2011* ------------------------------------------------------------------------ Third Call for papers Terminologie et Intelligence Artificielle TIA 2013 Terminology and Artificial Intelligence TIA 2013 Terminology for a networked society: Recent advances in multilingual knowledge-based resources Paris, 28-29-30 octobre 2013 http://flores.lipn.univ-paris13.fr/tia2013/ ------------------------------------------------------------------------ IMPORTANT DATES Abstract submission: 28 June 2013 (instead of 21 June 2013 ) Paper submission (long and short papers): 5 July 2013 (instead of 28 June 2013) Notification to authors: 3 September 2013 Final camera-ready paper due: 23 September 2013 Conference: 28-30 October 2013 INTRODUCTION and MOTIVATION TIA 2013 will be the 10th in a series of successful events which, for the most part, initially took place in the francophone world. Over a period of almost 20 years (the first conference was held in 1995) TIA has increasingly attracted the attention of many researchers and practitioners all over the world, and its work has become truly international. The aim of TIA 2013 is to provide an overview of the new ways in which multilingual terminology is present in an ever-increasing networked society, and to pay special attention both to the methods applied in the conceptualization of domain knowledge and to the applications and tools that will meet the requirements of e-society. In this way, terminology, linguistics and knowledge engineering provide the basis on which many other disciplines develop their applications such as domain ontologies, natural language processing tools, multilingual knowledge-based tools and web-based linguistic applications. New approaches to the standardization and to the reuse and integration of different tools designed to facilitate work in institutions, companies and society in general will be welcome. The TIA 2013 Conference aims to promote interdisciplinary research focusing on the intersection of different disciplines that deal with terminological aspects and knowledge engineering resources. Papers may address both theoretical questions and methodological aspects on these issues, as well as interdisciplinary approaches developed to facilitate convergence and co-operation in terminological aspects of importance to society. TOPICS OF INTEREST Terminology and ontology acquisition and management - Applying pattern recognition to enriching terminological resources - Lexicons, thesauri and ontologies as semantic resources - Lexicons and ontologies as means for knowledge transfer - Reusing, standardizing and merging terminological or ontological resources - Multilingual terminology extraction - Multilinguality and multimodality in terminological resources - Management of language resources Terminology and knowledge representation - Ontological semantics and linguistics - Ontology localization - Development of multimedia terminological resources - Terminology alignment in parallel corpora and other lexical resources - Representation of terms and conceptual relations in knowledge-based applications - Comparative studies of terminological resources and/or ontological resources from different languages, domains and approaches - Terminological resources in the 21st century - Harmonization of format and standards in terminological resources Terminology and ontologies for applications - Interoperability and reusability in knowledge-based tools and applications - Models and metamodels in annotating semantic and terminological resources - New R &D directions in terminology for industrial uses and needs SUBMISSIONS TIA 2013 solicits both regular papers, which present significant work, and short papers, which typically present work in progress or a smaller, focused contribution. The program committee may decide to change the category of a paper before acceptance. Papers can be written either in English or French. Regular papers should not exceed 8 pages in ACL-HLT 2011 format (see below for LaTeX and MS Word style files), including figures, examples and references. The mode of presentation of long papers (orally or as posters) will be decided based on the nature rather than on the quality of the work. Short papers should not exceed 4 pages in the same format as regular papers. They will also be presented orally or as posters at the conference depending on the nature of the work. Authors should submit the papers in PDF through the TIA submission page at https://www.easychair.org/conferences/?conf=tia2013 At the submission page, the author(s) must provide the following information: 1. name(s) of author(s) 2. affiliation(s), addresses, fax and e-mail 3. title of the paper 4. 5 to 10 key words in English or in French (in both languages if possible) 5. abstract in English or in French (in both languages if possible) (200 words maximum for each) As the reviewing will be blind, the paper itself must not include the authors' names and affiliations at submission time. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ...", must be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ...". Reviews of full papers (long and short) will be performed by three reviewers. STYLES FILES Authors are required to use the following style files so that the papers follow the conference format. Latex: tia2013latex.tgz MS Word: tia2013word.zip IMPORTANT: Remove authors' information from your manuscripts when submitting them for blind review (see above)! PROGRAMME COMMITTEE Chairs Guadalupe Aguado de Cea (OEG, Universidad Politécnica de Madrid, Spain) Nathalie Aussenac-Gilles (IRIT, CNRS, Toulouse, France) Contact : tia2013 at easychair.org Members - Guadalupe Aguado de Cea (Universidad Politécnica de Madrid, Spain) - Amparo Alcina (Universitat Jaume-I, Castellón de la Plana, Spain) - Sofia Ananiadou (NaCTeM, Manchester, UK) - Nathalie Aussenac-Gilles (IRIT, Toulouse, France) - Caroline Barrière (CRIM, Montréal, Canada) - Paul Buitelaar (DERI, Galway, Ireland) - Maria Teresa Cabré (Universitat Pompeu Fabra, Barcelona, Spain) - Farid Cerbah (Dassault Aviation, Paris, France) - Jean Charlet (AP-HP&- INSERM, Paris, France) - Philipp Cimiano (University of Bielefeld, Germany) - Anne Condamines (CLLE-ERSS, Toulouse, France) - Lyne Da Sylva (EBSI, Montréal, Canada) - Béatrice Daille (LINA, Université de Nantes, Nantes, France) - Valérie Delavigne (Institut national du cancer, France) - Pascaline Dury (Université Lyon 2, Lyon, France) - Fidelia Ibekwe-San Juan (Université Lyon 3, Lyon, France) - Kyo Kageura (University of Tokyo, Tokyo, Japan) - Olivia Kwong (City University Hong Kong, Hong Kong, China) - Marie-Claude L'Homme (OLST, Université de Montréal, Canada) - Elena Montiel-Ponsoda (Universidad Politécnica de Madrid, Spain) - Adeline Nazarenko (LIPN, Université Paris 13, Villetaneuse, France) - Mihako O'Hagan (Dublin City University, Dublin, Ireland) - Pascale Sébillot (IRISA, Rennes, France) - Serge Sharoff (University of Leeds, Leeds, UK) - Monique Slodzian (ERTIM-INALCO, Paris, France) - Mari Carmen Suarez de Figueroa (Universidad Politécnica de Madrid, Spain) - Sylvie Szulman (LIPN, Université Paris 13, Villetaneuse, France) - Koichi Takeuchi (Okayama University, Okayama, Japan) - Rita Temmerman (Erasmushogeschool, Bruxelles, Belgium) - Yannick Toussaint (LORIA, Nancy, France) - Spela Vintar (University of Ljubljana, Ljubljana, Slovenia) - Pierre Zweigenbaum (LIMSI-CNRS - CRIM-INALCO, Paris, France) ORGANISING COMMITTEE TIA 20131 is organized by the RCLN (Représentation des Connaissances et Langage Naturel) group of the LIPN lab at Paris 13 University. Local Chairs - Adeline Nazarenko (LIPN, Paris 13, France) - Syvlie Szulman (LIPN, Paris 13, France) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:09:26 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:09:26 +0200 Subject: These: Cyril Grouin, Anonymisation de documents cliniques Message-ID: Date: Sat, 15 Jun 2013 07:33:06 +0200 From: Cyril Grouin Message-Id: <5B0D218A-2F1E-45F0-9092-E66DDC3CCD8A at limsi.fr> Bonjour, J'ai le plaisir de vous convier à la soutenance de mon travail de thèse de doctorat, réalisé conjointement au LIMSI (groupes ILES) et au Centre de Recherche des Cordeliers (INSERM U872 Eq20 & UPMC), intitulée : "Anonymisation de documents cliniques : performances et limites des méthodes symboliques et par apprentissage statistique" Cette soutenance aura lieu le mercredi 26 juin 2013 à 14h00 dans la salle de conférences du LIMSI (bât. 508), campus d'Orsay (91). Vous êtes également invités au pot de thèse qui suivra. Bien cordialement, Cyril Grouin ----- Composition du jury : - Pr Stefan J. DARMONI, PU-PH, CHU de Rouen (rapporteur) - Pr Pascal STACCINI, PU-PH, CHU de Nice (rapporteur) - M. Thierry ARTIÈRES, Professeur, LIP6/UPMC (examinateur) - Pr Anita BURGUN, PU-PH, HEGP/INSERM U872 Eq22 (examinatrice) - Mme Marie-Christine JAULENT, DR, INSERM U872 Eq20 (directrice) - M. Pierre ZWEIGENBAUM, DR, LIMSI-CNRS (directeur) ----- Résumé : Ce travail porte sur l'anonymisation automatique de comptes rendus cliniques. L'anonymisation consiste à masquer les informations personnelles présentes dans les documents tout en préservant les informations cliniques. Cette étape est obligatoire pour utiliser des documents cliniques en dehors du parcours de soins, qu'il s'agisse de publication de cas d'étude ou en recherche scientifique (mise au point d'outils informatiques de traitement du contenu des dossiers, recherche de cas similaire, etc.). Nous avons défini douze catégories d'informations à traiter : nominatives (noms, prénoms, etc.) et numériques (âges, dates, codes postaux, etc.). Deux approches ont été utilisées pour anonymiser les documents, l'une dite « symbolique », à base de connaissances d'expert formalisées par des expressions régulières et la projection de lexiques, l'autre par apprentissage statistique au moyen de CRF de chaîne linéaire. Plusieurs expériences ont été menées parmi lesquelles l'utilisation simple ou enchaînée de chacune des deux approches. Nous obtenons nos meilleurs résultats (F-mesure globale=0,922) en enchaînant les deux méthodes avec rassemblement des noms et prénoms en une seule catégorie (pour cette catégorie : rappel=0,953 et F-mesure=0,931). Ce travail de thèse s'accompagne de la production de plusieurs ressources : un guide d'annotation, un corpus de référence de 562 documents dont 100 annotés en double avec adjudication et calculs de taux d'accord inter-annotateurs (K=0,807 avant fusion) et un corpus anonymisé de 17.000 comptes rendus cliniques. ----- Abstract: This work focuses on the automatic de-identification of clinical records. The de-identification consists in concealing personal information within documents while preserving clinical data. This task is mandatory so as to use clinical records outside of the patient care process, for case study publications or in scientific research (producing automatic system to process the documents, similar cases search, etc.). We defined 12 categories of information to de-identify: nominative data (last names, first names, etc.) and numerical data (ages, dates, zip codes, etc.). Two approaches have been used to de-identify the documents, an expert knowledge based method using regular expressions and lexical mapping, and a machine-learning process based upon CRF. Several experiments have been performed including the use of each approach separately or in combination. We achieved our best results (overall F-measure=0.922) while combining both approaches and merging last names and first names categories into a single one (recall=0.953 and F-measure=0.931 on this category). This work is combined with the production of several resources: a guidelines, a gold standard corpus composed of 562 documents among them 100 double annotated with adjudication and inter-annotator agreement computation (K=0.807 before merging) and a de-identified corpus of 17,000 clinical records. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:16:00 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:16:00 +0200 Subject: Appel: Workshop and tutorial proposals, TIA 2013, Paris, Oct. 2013 Message-ID: Date: Mon, 17 Jun 2013 01:27:20 +0200 From: Nathalie Aussenac-Gilles Message-ID: <51BE49D8.7080904 at irit.fr> X-url: http://flores.lipn.univ-paris13.fr/tia2013/ ================================================================ CALL FOR WORKSHOP AND TUTORIAL PROPOSALS 10th INTERNATIONAL CONFERENCE ON TERMINOLOGY AND ARTIFICIAL INTELLIGENCE 10ème conférence internationale Terminologie et Intelligence Artificielle Terminology for a networked society: Recent advances in multilingual knowledge-based resources Paris, 28-30 october, 2013 Deadline for workshop proposals: July 10, 2013 http://flores.lipn.univ-paris13.fr/tia2013/ ================================================================ The 10th Terminology and Artificial Intelligence (TIA) conference invites proposals for tutorials and workshops to be held in conjunction with TIA. We solicit proposals on any topic of interest to terminology and advanced applications (see the main topics of the conference at http://flores.lipn.univ-paris13.fr/tia2013/). Both full-day workshops and half-day workshops or tutorials are possible. The format of workshops is flexible. It can be, for instance, in the form of a small conference with a focused topic of interest, or in the form of a panel discussion with invited speakers. If participants are to be selected on the basis of paper contributions, the selection process should be as light and simple as possible due to the time schedule. The workshops and tutorials will be held at the same venue as the TIA main conference in Paris, and the allocated date is October 28th, 2013. SUBMISSION INFORMATION Proposals for a workshop or a tutorial should contain: o A title and brief (2-page max) description of the workshop topic and content, or the tutorial scope and pedagogic objective o The proposed format: call for papers, panel, criteria for participant selections, out-line of the tutorial, etc. o The proposed duration: full-day or half-day. o An estimate of the number of attendees. o The names, postal addresses, phone numbers, and email addresses of the organizers. o In the case of workshops, a list of potential members of the program committee if any, with an indication of which members have already agreed. o A description of special requirements for technical needs. The TIA programme committee will select workshop proposals based on their quality and relevance. Submissions and information requests should be sent by e-mail to: tia2013 at easychair.org Information SUBMISSION DEADLINE July 10, 2013 TIMELINE FOR WORKSHOPS July 10, 2013: Workshop proposal deadline July 17, 2013: Notification of acceptance July 25, 2013: Proposed date for sending workshop CFP September 10, 2013: Proposed paper due date September 30, 2013: Proposed notification of acceptance October 10, 2013: Camera-ready deadline October 30, 2013: Workshops and tutorials ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:14:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:14:10 +0200 Subject: Job: Offre post-doctorat en linguistique textuelle / linguistique de corpus, Greyc et Crisco, Universite de Caen Message-ID: Date: Sun, 16 Jun 2013 22:33:31 +0200 From: Thierry Charnois Message-ID: <51BE211B.6060903 at unicaen.fr> *INTITULE du PROFIL :**Postdoctorant en linguistique textuelle et/ou linguistique de corpus* Thématique de recherche : Linguistique textuelle Laboratoires : Greyc et Crisco, Université de Caen Noms et coordonnées des responsables : Thierry Charnois thierry.charnois at unicaen.fr Dominique Legallois dominique.legallois at unicaen.fr Lieu d'exercice des fonctions : * Laboratoire Greyc (campus 2) * Laboratoire Crisco (campus 1) Durée du contrat : 12 mois Date de début : 1er Septembre 2013 Date de fin : 31 août 2014 Formation requise : Doctorat en sciences du langage (de préférence) ou Doctorat en traitement automatique des langues Compétences à mobiliser : Analyse des relations de cohérence locales et globales ; identification des séquences organisatrices d'un texte ; formalisation des observables ; utilisation d'outils informatiques pour la linguistique de corpus ; Langue travaillée : Principalement le français, mais d'autres langues sont possibles. Résumé de l'objectif du contrat : il s'agit de proposer une modélisation linguistique des schémas textuels, fondée sur les indices lexico-grammaticaux (constructions spécifiques, répétitions lexicales, densité lexicale, noms sous-spécifiés, réseaux phrastiques) ; cette modélisation linguistique doit pouvoir aider à comprendre la récursivité des Séquences d'Enchaînement (Legallois, 2006), leur déploiement, la variation de la structure textuelle selon les genres (expositifs, argumentatifs, narratifs). Les séquences d'enchaînement sont des schémas articulant des parties textuelles selon des relations telles que : problème-solution- évaluation ; objectif-mise en oeuvre- évaluation, etc. Le chercheur recruté devra collaborer avec des collègues informaticiens pour élaborer une formalisation exploitable informatiquement. Résultat attendus : Une connaissance plus systématique de l'organisation textuelle et générique ; l'appréciation de la densité des Séquences dans un texte ; constitution d'un répertoire de ressources linguistiques participant à l'organisation textuelle ; formalisation des relations de cohérence au niveau du texte en vue d'une implémentation informatique ; contribution appliquée à des questions de Traitement Automatique des Langues, telles que les résumés de texte, les systèmes de questions-réponses, l'extraction d'information. Bibliographie (indicative) : /-Biber, Connor et Upton, 2007, //Discourse/on the /Move,//Benjamins/ /-Hoey M. (2001) //Textual Interaction: An Introduction to Written Discourse Analysis./Routledge /-Legallois, D., 2006, « Quand le texte sig/nale sa structure : la fonction textuelle des noms sous spécifiés » /Corela/. (en ligne) /-Scott M. et Tribble Ch. 2006,//Textual Patterns, //J. Benjamins/ /-Smith, C., 2003, //Discourse Modes,/Cambridge University Press. Salaire : environ 1950 euros Les candidatures sont à envoyer dès que possible et avant le 4 juillet 2013. Envoyer un CV détaillé et une lettre de motivation par courrier électronique à : thierry.charnois at unicaen.fr et dominique.legallois at unicaen.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:23:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:23:35 +0200 Subject: Job: Poste de chercheur postdoctoral, Labex EFL, LLF, Universite Paris Diderot Message-ID: Date: Mon, 17 Jun 2013 09:58:23 +0200 From: Olivier Bonami Message-Id: <153CCEB4-46C9-4BC6-B485-FB48CE8518EC at paris-sorbonne.fr> X-url: http://www.labex-efl.org/?q=fr/node/176 DATE LIMITE REPOUSSEE AU 28 JUIN 2013 Le Labex « Empirical foundations of linguistics » (axe « Grammaire expérimentale ») recrute un chercheur postdoctoral pour sur le thème suivant: Évaluation quantitative de la complexité des systèmes flexionnels Le postdoctorant sera employé pour une période de 12 mois par l'Université Paris Diderot (Laboratoire de Linguistique Formelle), pour un salaire de 24 000 € net par an. La date souhaitée de prise de fonction se situe entre octobre et décembre 2013. Les candidats doivent avoir soutenu leur thèse de doctorat avant septembre 2013. Le dossier de candidature est à envoyer par courriel à Olivier Bonami (olivier.bonami at univ-paris-diderot.fr). Il comprendra une courte lettre de motivation, un CV et une liste de publications, les noms et adresses de deux référents potentiels, et un lien vers une page web où les publications peuvent être consultées. La date limite de candidature est repoussée au 28 juin 2013. Contact: olivier.bonami at univ-paris-diderot.fr Page web de l'annonce: http://www.labex-efl.org/?q=fr/node/176 Labex EFL: http://www.labex-efl.org Description détaillée de l'offre: L’analyse quantitative des systèmes flexionnels a fait l’objet d’un intérêt renouvelé dans la période récente. Deux facteurs limitent la portée des travaux existants dans ce domaine émergent : (i) la focalisation sur un petit ensemble de langues génétiquement proches ; (ii) le manque de mesures quantitatives qui prennent en compte le caractère multifactoriel de la complexité des systèmes flexionnels. Le Labex Fondements empiriques de la linguistique (EFL) offre une occasion unique de s’attaquer à ces difficultés. Regroupant 13 équipes de recherches de la région parisienne, le Labex EFL comporte à la fois des spécialistes d’un vaste ensemble de langues typologiquement diverses et des spécialistes de linguistique théorique, de linguistique informatique, et de psycholinguistique. Le postdoctorant rejoindra un groupe interdisciplinaire d’une dizaine de chercheurs du Labex EFL qui travaillent ensemble à la conception, à l’utilisation et à l’évaluation de mesures quantitatives de divers aspects de la complexité des systèmes flexionnels. Un objectif de plus long terme est d’évaluer expérimentalement l’impact de la complexité des systèmes flexionnels. Les tâches du postdoctorant comprendront : – la sélection ou la conception de ressources linguistiques sur un échantillon de langues typologiquement variées, en vue de l’évaluation de la complexité de leurs systèmes flexionnels ; – l’évaluation de l’applicabilité et de la pertinence de mesures quantitatives existantes à cet échantillon de langues ; – une contribution à la conception et à l’implémentation de nouvelles mesures quantitatives pour des aspects des systèmes flexionnels qui n’ont pas été explorés dans les travaux précédents. Le candidat idéal serait un linguiste ou un linguiste informaticien pratiquant les théories morphologiques contemporaines, ayant une connaissance avancée de la typologie linguistique et des méthodes de terrain, et ayant déjà une expérience de l’application de méthodes quantitatives à des données linguistiques extensives. Peu de candidats potentiels correspondent à ce profil idéal, et les candidatures qui n’y correspondent que partiellement seront donc prises en considération. Il n’y a pas de domaine linguistique prédéfini pour le travail du postdoctorant. Le groupe de chercheurs qu’il intégrera est compétent, et possède des ressources, sur les langues germaniques, iraniennes, romanes, afro-asiatiques, finno-ougriennes, et sud-caucasiques, sur les langues méso-américaines (avec un accent particulier sur le phylum oto-mangue), et sur les langues créoles. Un des objectifs du projet est d’améliorer la compréhension des systèmes flexionnels de ces langues, mais un candidat qui apporterait une expertise pertinente sur une langue ou une famille n’appartenant pas à cette liste serait tout à fait bienvenu. Le postdoctorant aura également la possibilité de participer aux autres activités du Labex EFL et rejoindra une communauté active ayant un intérêt commun pour les approches empiriques, quantitatives et expérimentales en linguistique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:34:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:34:24 +0200 Subject: Sujet de these: 2 open PhD positions in Natural Language Processing, Marseille, France Message-ID: Date: Tue, 18 Jun 2013 15:31:53 +0200 From: Frederic Bechet Message-ID: <51C06149.8040209 at lif.univ-mrs.fr> PhD positions - Computer Science, Natural Language Processing - Marseille, France The NLP group of the Laboratoire d'Informatique Fondamentale of the Aix Marseille University has 2 open PhD positions in Computer Science in the context of an European project (3 years). Location : Campus de Luminy (http://sciences.univ-amu.fr/sites-geographiques/site-luminy), Marseille, France Starting : October 1st 2013 Deadline for application: July 15th 2013 The two fully funded PhD studentships will focus on 2 different aspects of the project: 1- Discourse parsing of speech. This PhD will focus on developing discourse analysis methods adapted to a large range of conversational styles and domains from spoken conversations to social media interaction. Automatic methods will be studied for five types of discourse analysis: discourse parsing, event and temporal structure, argumentation structure and intra-document coreference. The applicative domain of this research will be the automatic summarization task of human-human dialogs. The language targeted will be French and English. 2- Syntactic and semantic parsing with deep learning methods. Recently, neural network approaches based on a deep learning paradigm has been successfully applied to some NLP tasks such as POS and NE tagging or dependency parsing ( http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/de//pubs/archive/35671.pdf ). In this PhD we will investigate how this paradigm performs and can be adapted in the context of robust syntactic and semantic parsing of human human conversations collected on social media platforms and telephone call centres. The successful candidates should : - hold a relevant degree in the field of Natural Language Processing or Machine Learning. - have good algorithmic and programming skills Description of the lab: The University of Aix-Marseille (AMU) is currently one of the largest university in France, created in 2012 from the fusion of the 3 former Aix-Marseille universities (Université de Provence, Université de la Méditerranée, Université Paul Cézanne). The LIF (Fundamental Computer Science Lab), is a JRU between the Centre National de la Recherhe Scientifique (CNRS) and AMU. The Natural Language Processing group of LIF aims at developing symbolic and statistical methods for the automatic processing of textual and speech data. The two main characteristics of this research group are: (1) to host both linguists working on the development of rich linguistic resources such as syntactic and semantic lexicons and computer scientists with a very strong experience in numerical approaches for NLP; and (2) to work on both spoken and written languages, at the descriptive level as well as the application level thanks to a strong expertise of some members of the group in Automatic Speech Recognition methods. Contacts: Alexis Nasr : alexis.nasr at lif.univ-mrs.fr Frederic Bechet : frederic.bechet at lif.univ-mrs.fr Benoit Favre : benoit.favre at lif.univ-mrs.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:32:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:32:45 +0200 Subject: Ecole: ESSLLI, early bird registration, June 22 Message-ID: Date: Tue, 18 Jun 2013 10:55:09 +0200 From: Daniel Altshuler Message-ID: X-url: http://esslli2013.de Dear colleagues, Friendly reminder that early bird registration for ESSLLI 2013ends this Saturday, June 22. In order to register, please proceed to http://esslli2013.de/register We look forward to seeing you in Düsseldorf this summer! Best regards, Daniel Altshuler (on behalf of the ESSLLI 2013 committee). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:36:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:36:27 +0200 Subject: Seminaire: INFOLINGU, Jean-Marc LEBLANC, 24 juin 2013, Universite Paris-Est Marne-la-Vallee Message-ID: Date: Tue, 18 Jun 2013 19:46:54 +0200 From: Myriam RAKHO Message-ID: ************************************************************************ * INFOLINGU* Le séminaire de l'équipe Informatique Linguistique du Laboratoire d'Informatique Gaspard Monge (LIGM) Université Paris-Est Marne-la-Vallée ************************************************************************ Date : *Le Lundi 24 juin 2013 à 10h30 * Lieu : Université Paris-Est Marne-la-Vallée Bâtiment Copernic, 4ème étage, salle de séminaires 4B08R *Toute personne intéressée est la bienvenue.* ************************************************************************ ------------------------------------------------------------------------ Intervenant : ------------------------------------------------------------------------ * Jean-Marc LEBLANC - CEDITEC, UPEC * ------------------------------------------------------------------------ Titre de la présentation : ------------------------------------------------------------------------ * à venir* ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:30:57 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:30:57 +0200 Subject: Conf: DO 2013, Program now online, July 7, 2013, Montreal, Canada Message-ID: Date: Mon, 17 Jun 2013 18:36:28 -0400 From: Selja Seppälä Message-Id: X-url: http://definitionsinontologies.weebly.com/do-2013-program.html We are pleased to announce that the Definitions in Ontologies workshop program is now online: http://definitionsinontologies.weebly.com/do-2013-program.html. July 7, 2013 Montreal, Canada DO 2013 Program: 8:30–8:45 Welcome 8:45–9:00 Lynn M. Schriml Definition of Disease Terms 9:00–9:15 Gerardo Sierra-Martinez and Laura Elena Hernandez-Dominguez Automatic Construction of the Knowledge Base of an Onomasio-logical Dictionary 9:15–9:30 Guoqian Jiang, Harold Solbrig and Christopher Chute A Semantic Web-Based Approach for Harvesting Multilingual Textual Definitions from Wikipedia to Support ICD-11 Revision 9:30–9:45 Antonio San Martín and Pilar León Araúz Flexible Terminological Definitions and Conceptual Frames 9:45–10:15 Discussion 10:15–10:45 Coffee Break 10:45–11:15 Invited Speaker: Barry Smith Introduction to the Logic of Definitions 11:15–11:30 Selja Seppälä Using BFO Categories for Creating Generic Definition Templates 11:30–11:45 Alan Ruttenberg Tool Support for Definition Authorship and Management: Desiderata 11:45–12:00 Discussion +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Survey: Please take a moment to participate to our survey on defining practices in ontologies: https://docs.google.com/forms/d/11yxHNL6noN8_oa8aEuHowOZZTvd__t164pNgtmEzSG8/viewform?pli=1 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:29:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:29:45 +0200 Subject: Job: PostDoc, Orange Labs (Lannion, 22) Message-ID: Date: Mon, 17 Jun 2013 08:55:37 +0000 From: Message-ID: <4696_1371459338_51BECF0A_4696_373_1_ED32B5012BA99F4AA999E2765EF060F20C2564 at PEXCVZYM12.corporate.adroot.infra.ftgroup> Proposition de sujet de PostDoc à Orange Labs (Lannion, 22) Projection des données lexicales (françaises) sur des connaissances Contexte : Un enjeu majeur du traitement automatique des langues naturelles consiste à générer une représentation conceptuelle des documents afin de factoriser des termes synonymes ou au contraire différencier des termes homonymes. Les différents concepts associés à terme peuvent être générés manuellement ou automatiquement mais constituent dans tous les cas un espace de concepts nécessaire à toute opération ultérieure (désambigüisation, arguments de relations sémantiques, thématisation, ...). Sujet : L'équipe CONTENT/FAST d'Orange Labs travaille sur l'extraction d'information des textes (en français) afin d'en obtenir une représentation RDF. Nous nous appuyons sur des bases de connaissances (internes ou issues des efforts communautaires comme LinkedOpenData par ex. DBpedia). Pour cela, nos données linguistiques (lexiques, thésaurus) doivent être alignées avec les instances et classes de la base de connaissances. Le sujet proposé vise tout d'abord à étendre notre espace sémantique par l'utilisation de ressources publiques du LOD ou LLOD telles qu'OpenCyc, WordNet, BabelNet, DBpédia YAGO2, Wiktionary. Cet accroissement doit être quantitatif par ajout d'entités nommées notamment mais aussi qualitatif en visant (par owl:sameAs) une hiérarchie de concepts (par ex. WordNet). Dans un deuxième temps, le candidat mettra en oeuvre un accès à cet espace en le couplant à nos outils de TALN (extraction des liens sémantiques d'un texte). Le traitement global sera appliqué à des corpus proposés par Orange de manière à étudier l'impact de chaque ressource sur le résultat d'une analyse dont le résultat est la projection de chaque terme sur ces concepts associés. Le résultat de l'étude doit nous permettre de décider de l'intérêt effectif de ces ressources et de la manière de les utiliser conjointement. Une autre étude plus fondamentale portera sur la granularité conceptuelle. Le nombre et la nature des différents concepts associés à un terme est un problème ouvert qui dépend probablement des données à traiter. Dans cette optique, l'émergence de concepts par des approches de type data-mining peut fournir une aide. Cette étude pourra donc s'orienter soit vers la mise au point d'un critère théorique soit vers un calcul d'optimalité lié à un corpus. Profil souhaité : - Un doctorat en informatique ou TAL (thèse soutenue depuis moins de 12 mois). - connaissances en alignement d'ontologies et Web Sémantique (technologies, formats, ontologies, thesarus, ...) - connaissances en traitement automatique des langues (TAL) - pratique de programmation (Java, C++), Linux Divers : CDD de 12 mois. Date de début du post-doctorat : dès que possible (4e trimestre 2013). Lieu : Orange Labs à Lannion (Côtes d'Armor, Bretagne). Pour plus d'information, contacter : Johannes Heinecke Tél : 02 96 05 21 77 Email : johannes.heinecke(at)orange.com Abdel-Malek Boualem R&D Project Manager France Telecom Orange Labs FT/OLNC/OLPS/OPENSERV/CONTENT/FAST Phone : +33 (0)2 96 05 29 83 Mobile : +33 (0)6 85 71 40 63 Email : malek.boualem at orange.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 09:55:11 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 11:55:11 +0200 Subject: Conf: IC 2013 (programme de la conference et des ateliers associes), Villeneuve d'Ascq, 3-5 Juillet 2013 Message-ID: Date: Fri, 21 Jun 2013 15:48:49 +0200 From: Nathalie Aussenac-Gilles Message-ID: <51C459C1.3010507 at irit.fr> X-url: http://pfia2013.univ-lille1.fr/doku.php?id=fr:ic X-url: http://www.irit.fr/SIIM/2013/ X-url: http://weblab-project.org/workshop/sos-dlwd2013/ X-url: http://liris.cnrs.fr/~rapc/wiki/doku.php/rapc2013 X-url: http://www.irit.fr/QetR/2013/ ------------------------------------------------------------------------ IC 2013 24es Journées francophones d'Ingénierie des Connaissances http://pfia2013.univ-lille1.fr/doku.php?id=fr:ic Cité Scientifique, Université Lille 1, Villeneuve d'Ascq, du 3 au 5 Juillet 2013 (dans le cadre de la plateforme IA de l'AFIA) La conférence IC 2013 aura lieu dans 10 jours et un programme alléchant est à venir. Highlights: - 1 exposé invité de Serge Abiteboul: "From data and information to knowledge: the Web of tomorrow" - 23 articles scientifiques répartis dans 7 sessions couvrant des sujets qui sont au coeur de l'ingénierie des connaissances tels que la construction d'ontologies, l'extraction de connaissances dans du texte, le raisonnement, le web sémantique ou encore la modélisation de traces et l'exploitation de communautés - 10 posters dans une session dédiée, souvent issus de travaux jeunes mais prometteurs - 6 ateliers qui auront lieu les lundi 1 et mardi 2 juillet et qui couvrent des sujets tels que la qualité des données ou la production de données dans le web sémantique, la recherche d'information sémantique, le raisonnement à partir de cas, la modélisation de connaissances dans le domain médical ou des sciences du vivant et de l'environnement. Vous pouvez encore vous enregistrez ! Toutes les informations pratiques sont à http://pfia2013.univ-lille1.fr/doku.php?id=fr:start * Exposé Invité IC* Serge Abiteboul: "From data and information to knowledge: the Web of tomorrow", http://pfia2013.univ-lille1.fr/doku.php?id=fr:invite#serge_abiteboul Relational database management systems serve as mediators between individuals and machines. They are among the greatest successes of computer science in the last century. Web search engines brought information management to levels that were previously unconceivable before. Then, after Internet and networks of machines, after the Web and the network of content, came the time of networks of Internet users. Social networks enable computer users to communicate, publish, and interact with others leading to new modes of thinking, new kinds of relations. With the increase in the volume of data and information they provide, a collective intelligence is currently emerging. One of the main challenges for the coming years is the development of technologies that will make it possible to find, evaluate, validate, verify and rank information, and thus build tomorrow's "Web of knowledge". By considering evolutions of the Web, we will try to imagine that world with billions of computer systems connected, collectively reasoning to help Internet users survive in an ocean of data and information. *Programme de la conférence IC* * Session: Traces et Communautés (Animateur: Gilles Falquet) - Amélie Cordier, Marie Lefevre, Pierre-Antoine Champin et Alain Mille. Modéliser les traces d'interaction pour raisonner à partir de l'expérience tracée - Patrice Bouvier, Karim Sehaba, Élise Lavoué et Sébastien George. Approche qualitative pour identifier et qualifier l'engagement des joueurs à partir de leurs traces d'interaction - Michel Crampes et Michel Plantié. Partition et recouvrement de communautés dans les graphes bipartis, unipartis et orientés * Session: Ontologies I (Animateur: Sylvie Despres) - Xavier Aimé et Jean Charlet. IC : Ingénierie des Connaissances ou Ingénierie du Conformisme - Celine Joiron, Frederic Furst, Gilles Kassel, Alistair Jones, Jean-Paul Barthès, Claude Moulin et Dominique Lenne. Une ontologie pour la conception d'une plateforme collaborative exploitant une table multi-tactile et multi-modale - Asma Ben Abacha, Marcos Da Silveira et Cédric Pruski. Une approche pour la validation du contenu d'une ontologie par un système à base de questions/réponses * Session: Extraction de Connaissances (Animateur: Nathalie Pernelle) - My Thao Tang et Yannick Toussaint. Vers un processus continu d'extraction de connaissances à partir de textes - Kamel Mouna, Aussenac-Gilles Nathalie, Buscaldi Davide et Comparot Catherine. Construction semi-automatique d'ontologies à partir d'une collection de pages web structurées - Laurie Serrano, Maroua Bouzid, Thierry Charnois, Stephan Brunessaux et Bruno Grilheres. Extraction et agrégation automatique d'événements pour la veille en sources ouvertes : du texte à la connaissance (*) - Ourdia Ressad, Sylvie Szulman, Haifa Zargayouna et Eve Paul. Construction collaborative d'une Ressource Termino-Ontologique (RTO) pour le droit des collectivités territoriales (*) * Session: Ontologies II (Animateur: Jean Charlet) - Claudine Metral, Nizar Ghoula, Vitor Silva et Gilles Falquet. Une ontologie de techniques de visualisation d'informations: application aux modèles urbains 3D enrichis - Michel Héon et Roger Nkambou. G-OWL : Vers un langage de modélisation graphique, polymorphique et typé pour la construction d'une ontologie dans la notation OWL - Mariem Mahfoudh, Laurent Thiry, Germain Forestier et Michel Hassenforder. Adaptation consistante d'ontologies à l'aide des grammaires de graphes (*) - Julie Bourbeillon, Laëtitia Piel, Ramla El Ayeb, Damien Rousselière et Thomas Guyet. Construction semi-automatique d'une ontologie de la perception des paysages (*) * Session: Web Sémantique (Animateur: Catherine Faron Zucker) - Camille Pradel, Ollivier Haemmerlé et Nathalie Hernandez. Passage de la langue naturelle à une requête SPARQL dans le système SWIP - Sébastien Harispe, Sylvie Ranwez, Stéfan Janaqi et Jacky Montmain. Mesures sémantiques basées sur la notion de projection RDF pour les systèmes de recommandation - Maria Koutraki, Nathalie Pernelle, Fatiha Sais, Brigitte Safar et Tushar Ghosh. Découverte de liens d'identité entre instances décrites par des ontologies partiellement alignées (*) - Julien Corman. Explorer les théorèmes d'une Tbox (*) * Session: Raisonnement (Animateur: Pierre Antoine Champin) - Stella Marc-Zwecker, François de Bertrand de Beuvron, Cecilia Zanni-Merk et Florence Le Ber. Implémentation d'un raisonnement spatial qualitatif sur les relations RCC8 au moyen de OWL et de SWRL - Emmanuelle Gaillard, Jean Lieber, Yannick Naudet et Emmanuel Nauer. Raisonner sur des connaissances provenant d'une e-communauté * Session: Applications (Animateur: Yannick Toussaint) - Blandine Ginon, Stéphanie Jean-Daubias et Pierre-Antoine Champin. Mise en place d'un système d'assistance personnalisée dans une application existante - Brigitte Seroussi, Nizar Messai, Cédric Laouénan, France Mentré and Jacques Bouaud. Profils patients associés à la non conformité des décisions aux recommandations de prise en charge thérapeutique des cancers du sein : utilisation de l'analyse de concepts formels - James Ortiz, Damien De Nizza, Hubert Meurisse et Pierre-Yves Schobbens. Formalisation et Construction d'une Ontologie dans le Domaine des Infections Orthopédiques (*) * Session: Posters - Kenza Harkouken Saiah, Nicolas Sabouret et Jean-Yves Donnart. Une ontologie de services pour la représentation de la sémantique d'un environnement virtuel urbain - Étienne Deparis, Marie-Helene Abel, Gaelle Lortal et Juliette Mattioli. Modélisation sociale d'une organisation et usage de son réseau - Nourhene Alaya et Sadok Ben Yahia. Nouvelle mesure de degré de relation sémantique pour une meilleur modularisation d'ontologies - Laurie Planes, Stéphane Dervaux, Juliette Dibie-Barthélemy, Nicolas Guinet et Liliana Ibanescu. Utilisation d'un outil de recherche d'information pour la mise en correspondance de thesaurus - Francky Trichet et Christophe Thovex. Analyse Sémantique des Réseaux Sociaux d'Usages et d'Opinions - Antoine Vincent, Bruno Bachimont et Alain Bonardi. Prescrire une modélisation par les patrons : exemple des patrons de création pour la représentation des processus de production sonore - Mohamed Nader Jelassi, Sadok Ben Yahia et Engelbert Mephu Nguifo. Nouvelle approche de recommandation personnalisée dans les folksonomies basée sur le profil des utilisateurs - Sahbi Zahaf et Faiez Gargouri. Mémoire organisationnelle appuyée par un cadre ontologique pour l'exploitation des processus d'affaires : application au processus RAO - Fabien Amarger, Catherine Roussey, Jean-Pierre Chanet, Ollivier Haemmerlé et Nathalie Hernandez. Web de données agricole : transformation de sources pour une ontologie modulaire - Gaëlle Lortal, Etienne Deparis, Claire Laudy, Stefano Moretti et Juliette Mattioli. Un bouquet de théories pour une plateforme de décision stratégique à base de réseaux sociaux *Programme des ateliers de la conférence IC* Lundi 1 juillet 2013: - "Recherche d'Information Sémantique (RISE)" organisés par Jean Pierre Chevalet, Catherine Roussey et Haïfa Zargayouna https://sites.google.com/site/frenchsemanticir/home/rise-2013 - "Symposium sur l'Ingénierie de l'Information Médicale (SIIM)" organisés par Lina Soualmia, Lynda Tamine, Jean Charlet et Marie-Christine Jaulent http://www.irit.fr/SIIM/2013/ - "Des Sources Ouvertes au Web de Données (SOS-DLWD)" organisés par Khaled Khelif, Fatiha Saïs, François Scharffe, Rania Khefifi et Laurie Serrano. http://weblab-project.org/workshop/sos-dlwd2013/ Mardi 2 juillet 2013: - "INtégration de sources/masses de données hétérogènes et Ontologies, dans le domaine des sciences du VIVant et de l'Environnement (IN-OVIVE)" organisés par Patrice Buche, Juliette Dibie-Barthélemy, Claire Nédellec, Pascal Neveu et Lydie Soler https://colloque.inra.fr/in_ovive_2013 - "Raisonnement à Partir de Cas (RàPC)" organisés par Valmi Dufour-Lussier, Emmanuelle Gaillard et Alice Hermann http://liris.cnrs.fr/~rapc/wiki/doku.php/rapc2013 - "Qualité et Robustesse pour le web de données (Q&R)" organisés par Pierre Antoine Champin, Jean Charlet, Nathalie Hernandez, Mouna Kamel et Camille Pradel http://www.irit.fr/QetR/2013/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 09:59:13 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 11:59:13 +0200 Subject: Seminaire: Les reseaux lexicaux pour le TAL, CLLE, Axe TAL, 27 juin 2013 Message-ID: Date: Wed, 19 Jun 2013 09:35:16 +0200 From: Bruno Gaume Message-ID: <51C15F34.9070400 at gmail.com> [Veuillez nous excuser en cas de réceptions multiples] Les réseaux lexicaux pour le TAL Journée d'étude de l'Axe TAL de CLLE-ERSS (ouvert au public) jeudi 27 juin 2013 Les réseaux lexicaux permettent de représenter à grande échelle tout type de relation entre des mots ; ils sont construits à partir de diverses ressources (corpus, dictionnaires, logs de requêtes, etc.). Le but de cette journée d'étude est de présenter leurs caractéristiques, et leur usage en Traitement Automatique des Langues. Les différents exposés, en s'appuyant sur des applications concrètes, aborderont des questions liées à la construction, la comparaison, l'évaluation, l'utilisation et les limites de ces ressources. PROGRAMME : 10H-->10H20 : Bruno Gaume (CLLE) Structure des réseaux lexicaux 10H20-->10H40 : Yann Desalle (CLLE) SLAM: système robuste pour l'interprétation lexicale automatique de métaphores 10H40-->11H : Yann Desalle (CLLE) De l'exploration automatique des réseaux de synonymie à l'étude de la dynamique d'acquisition lexicale des verbes en français et en mandarin. 11H-->11H20 : PAUSE 11H20-->11H40 : Benoit Gaillard (CLLE) Tmuse : un outil d'exploration lexicale 11H40-->12H : Emmanuel Navarro (IRIT) Kodex, un système de recherche d'information 12H-->14H : PAUSE 14H-->14H30 : Valérie Hanoka (ALPAGE) Utilisation d'un graphe de traduction pour la complétion d'ontologies légères multilingues 14H30-->16H : Laurent Prevot (LPL) Quelles ressources sémantiques pour traiter la parole spontanée? PROGRAMME DETAILLE : Les réseaux lexicaux pour le TAL Journée d'étude de l'Axe TAL de CLLE-ERSS (ouvert au public) jeudi 27 juin 2013 salle OBM4 (près de la Maison De la Recherche) Université Toulouse 2, 5 Allée Antonio Machado 31100 Toulouse Métro : ligne A, station Mirail Université ------------------------------------------------------------------------ 10H-->10H20 TITRE : Structure des réseaux lexicaux INTERVENANT : Bruno Gaume (CLLE) RESUME : Les grands réseaux de terrain sont les réseaux que l'on trouve en pratique, ils sont construits à partir de données issues de différents domaines d'étude : La sociologie comme le réseau d'amis de Facebook, la linguistique comme les réseaux de synonymie, la webologie comme le réseau des pages web. Plusieurs études montrent un fait remarquable qui est que tous ces réseaux, pourtant d'origines si diverses, possèdent des propriétés identiques bien particulières et font partie de la classe des Réseaux Petits Mondes Hiérarchiques (RPMH). Un autre fait tout aussi remarquable est que cette classe des RPMH est très petite au regard de l'ensemble des réseaux possibles : la probabilité de tirer au hasard parmi l'ensemble des réseaux possibles un RPMH est très proche de zéro. C'est-à-dire que les réseaux auxquels nous avons à faire dans la vraie vie se ressemblent tous par leurs structures communes, bien qu'intrinsèquement cette structure soit très rare du point de vue de la théorie de la mesure. Dans cet exposé je commencerai par présenter les quatre propriétés fondamentales omniprésentes dans les réseaux lexicaux. Je présenterais ensuite la dynamique des trajets d'un marcheur qui se déplace aléatoirement sur les sommets d'un réseau lexical à travers les relations lexicales. Nous verrons que l'étude de ces dynamiques permet de définir des outils de métrologie lexicale. ------------------------------------------------------------------------ 10H20-->10H40 TITRE : SLAM: système robuste pour l'interprétation lexicale automatique de métaphores INTERVENANT : Yann Desalle (CLLE) RESUME : SLAM (Solution Lexicale Automatique pour Métaphores) est un système robuste pour l'interprétation automatique de métaphores par substitution lexicale (par exemple, SLAM("déshabiller* une pomme") = "peler une pomme" ). Ce système réalise une substitution lexicale du foyer métaphorique des métaphores substitutives non conventionnelles grâce à un indice de tension sémantique globale entre les candidats-substituts et la métaphore à interpréter. Cette tension globale est la combinaison de deux tensions primitives: (a) une tension sémantique paradigmatique entre les candidats-substituts et le foyer métaphorique ("déshabiller") et (b) une tension sémantique syntagmatique entre les candidats-substituts et le contexte métaphorique (le complément d'objet direct "une pomme"). L'idée sous-jacente à cette résolution est que: (a) plus la tension paradigmatique est faible plus le candidat-substitut conserve le sens du foyer métaphorique et (b) plus la tension syntagmatique est faible plus la paraphrase obtenue après substitution est conventionnelle. La tension paradigmatique repose sur une mesure de proximité sémantique calculée sur un graphe de synonymie, et la tension syntagmatique repose sur une mesure de congruence sémantique de triplets syntaxiques calculée sur un corpus. Bien qu'en général les graphes de synonymie présentent un faible taux d'accord au niveau des liens, l'évaluation de SLAM montre que le système est robuste, c'est-à-dire que la plupart des dictionnaires de synonymie peuvent être utilisés pour calculer l'indice de tension paradigmatique. Une démonstration de l'application suivra la présentation. ------------------------------------------------------------------------ 10H40-->11H TITRE : De l'exploration automatique des réseaux de synonymie à l'étude de la dynamique d'acquisition lexicale des verbes en français et en mandarin. INTERVENANT : Yann Desalle (CLLE) RESUME : Une exploration automatique des réseaux lexicaux adaptée à leur structure de "réseau petit monde hiérarchique" ouvre de nouvelles voies pour l'analyse lexico-sémantique des productions verbales. Ainsi, nous verrons dans cet exposé comment les réseaux de synonymie permettent de modéliser une partie de la dynamique d'acquisition lexicale des verbes. Tout d'abord, l'analyse par exploration automatique des réseaux de synonymie de verbes produits par des jeunes enfants (2-5 ans) et des adultes natifs du français et du mandarin en dénomination d'actions de séparation/détérioration d'objet a mis au jour deux modes de manifestation de la flexibilité sémantique chez les jeunes enfants: (a) manifestation par production de verbes plus génériques et/ou polysémiques que ceux produits par les adultes; (b) manifestation par production de verbes plus "approximatifs" que ceux produits par les adultes. Ensuite, la comparaison des verbes produits en français et en mandarin a mis en évidence une différence linguistique dans la répartition de ces modes de manifestation de la flexibilité sémantique: alors qu'en français ils privilégient la production de verbes génériques/polysémiques, en mandarin ils privilégient la production de verbes approximatifs. Enfin, un indice du degré d'acquisition du lexique des verbes (indice REFLEX) a été construit sur la base des résultats exposés ci-dessus. Cet indice prend en compte les deux modes de réalisation de la flexibilité sémantique et permet la catégorisation différentielle des jeunes enfants vs adultes en français et en mandarin. ------------------------------------------------------------------------ 11H-->11H20 PAUSE ------------------------------------------------------------------------ 11H20-->11H40 TITRE : Tmuse : un outil d'exploration lexicale INTERVENANT : Benoit Gaillard (CLLE) RESUME : Tmuse est un outil d'exploration lexicale qui propose une visualisation du paysage sémantique de mots recherchés par l'utilisateur. Sur la base de réseaux de synonymes, l'application sélectionne, par Proxémie, les mots les plus sémantiquement proches de la requête. Ces mots et leurs liens de synonymie sont représentés sous la forme d'un graphe interactif en 3 dimensions. Les positions relatives des sommets de ce graphe respectent au mieux leur proximité sémantique, et les communautés de mots, détectées par des méthodes de clustering de graphe, sont mises en valeurs par des colorations distinctes. Dans le cas bilingue, l'application propose des traductions par Proxémie de chacune de ces communautés. L'exposé détaillera les principes sur lesquels l'application s'appuie, et en illustrera les différentes fonctionnalités. ------------------------------------------------------------------------ 11H40-->12H TITRE : Kodex, un système de recherche d'information INTERVENANT : Emmanuel Navarro (IRIT) RESUME : Nous allons présenter ici Kodex, un système de recherche d'information modulable qui classifie automatiquement les résultats d'une recherche de documents. Kodex présente les documents retournés pour une recherche, organisés en plusieurs groupes. Cette présentation rend visible la polysémie de la requête par rapport à la collection de documents, et aide l'utilisateur à affiner sa recherche. Pour cela Kodex utilise une méthode de clustering de graphes bipartis reliant documents et termes. Nous présenterons les grandes lignes du fonctionnement de Kodex, ainsi que l'architecture logicielle modulable utilisée. Une démonstration de l'application sera faite. ------------------------------------------------------------------------ 12H-->14H PAUSE ------------------------------------------------------------------------ 14H-->14H30 TITRE : Utilisation d'un graphe de traduction pour la complétion d'ontologies légères multilingues INTERVENANT : Valérie Hanoka (ALPAGE) RÉSUMÉ : Nous allons présenter ici un outil de complétion d'ontologies légères multilingue basé sur un gros graphe de traduction et de synonymie. Ce graphe contient 9.10^5 noeuds représentant un couple (langue, mot) et 7.10^6 arcs de traduction ou synonymie. Au total, 548 langues sont représentées, dont 20 langues disposant de plus de 10000 noeuds. Parallèlement, nous disposons d'une ontologie légère multilingue de couverture variable selon la langue. Nous présenterons plusieurs algorithmes de complétion à même de proposer des candidats pour l'extension d'ontologies dans chacune des langues: un premier algorithme heuristique ayant fait l'objet d'une publication (Hanoka et Sagot, 2012) et une adaptation du clustering local stochastique (Schaeffer, 2005) permettant d'émettre des candidats y compris pour les langues rares. Enfin, nous évoquerons le contexte d'utilisation du graphe de traduction et de synonymie dans le cadre de la structuration de terminologies multilingues extraites de corpus comparables dans plusieurs langues. ------------------------------------------------------------------------ 14H30-->16H TITRE : Quelles ressources sémantiques pour traiter la parole spontanée? INTERVENANT : Laurent Prevot (LPL) RESUME : Le traitement automatique de l'oral spontané pose des questions différentes de celui de l'écrit. A l'écrit, le recours aux ressources sémantiques, comme les réseaux lexicaux, est maintenant bien établi notamment grâce à l'existence de lexiques de qualité et de corpus de grande taille. En passant à l'oral, la taille des corpus et l'adéquation des lexiques et autres outils deviennent des problèmes cruciaux. Concernant les corpus, tandis que la faible performance en reconnaissance automatique sur de la parole spontanée n'autorise pas un traitement classique des sorties de tels systèmes, le coût de transcription manuelle resulte en des corpus d'une autre échelle que ceux de l'écrit. Par ailleurs, les spécificités de l'oral spontané requièrent dans le meilleur des cas une adaptation des ressources traditionnelles. Dans cet exposé, je montrerai à quels problèmes se heurtent des méthodes utilisant les réseaux lexicaux utilisés sur des corpus d'oral spontané. Dans ce contexte, j'aborderai plus spécifiquement les sujets suivants: l'utilisation de ressources sémantiques pour le traitement des disfluences et la segmentation et la classification des unités discursives. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:16:15 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:16:15 +0200 Subject: Seminaire: Alpage, Joakim Nivre, Training Deterministic Parsers Using Non-Deterministic Oracles, 27 juin, 10h30 Message-ID: Date: Thu, 20 Jun 2013 10:04:52 +0200 From: Marie Candito Message-ID: ************** Séminaire de l'équipe Alpage ********* Il s'agit du séminaire de recherche en linguistique informatique organisé par l'équipe Alpage, équipe mixte INRIA - Paris Diderot, spécialisée en analyse syntaxique automatique et en traitement du discours. *Le prochain séminaire se tiendra exceptionnellement : JEUDI 27 juin de 10h30 à 12h (une demi-heure plus tôt qu'habituellement), en salle 265* Bâtiment Olympe de Gouges rue Albert Einstein 75013 Paris (dernier bâtiment de la rue Albert Einstein, numéro non attribué...) Toute personne intéressée est la bienvenue. ********************************************************** *Joakim Nivre, Uppsala University* Joint work with Yoav Goldberg, Bar-Ilan University. *Title *: Training Deterministic Parsers Using Non-Deterministic Oracles *Abstract* : Greedy transition-based dependency parsers are among the fastest available systems for natural language parsing but tend to suffer from search errors and subsequent error propagation. This problem is aggravated by the fact that they are normally trained using oracles that are deterministic and incomplete in the sense that they assume a unique canonical derivation and are only valid as long as the parser does not stray from this path. In this talk, I will introduce oracles that are nondeterministic and complete in the sense that they allow different derivations of the same parse tree and make optimal predictions for all parser states, including states from which the gold parse is no longer reachable. Experimental evaluation on a wide range of data sets shows that using these oracles to train greedy parsers gives substantial improvements in accuracy because of reduced error propagation. Moreover, this improvement comes at no cost in terms of efficiency, unlike other techniques like beam search. ********************************************************** ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:12:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:12:24 +0200 Subject: Job: Hiring NLP researchers, SyNTHEMA Message-ID: Date: Wed, 19 Jun 2013 19:15:39 +0200 From: Carlo Aliprandi Message-ID: <51C1E73B.7000809 at synthema.it> X-url: http://www.linkedin.com/groups?viewMemberFeed=&gid=125258&memberID=14086896&goback=%2Egna_125258 X-url: http://www.fp7-savas.eu/sites/default/files/documents/NLP2013.pdf X-url: http://www.fp7-savas.eu/sites/default/files/documents/JunNLP2013.pdf X-url: http://www.synthema.it/index.php/Tecnologia/speechtechnology/ X-url: http://www.linkedin.com/pub/carlo-aliprandi/4/874/180 X-url: http://www.linkedin.com/miniprofile?vieweeID=14086896&context=anet&view" X-url: http://www.linkedin.com/groups?viewMemberFeed=&gid=125258&memberID=14086896&goback=%2Egna_125258" X-url: http://www.fp7-savas.eu/sites/default/files/documents/NLP2013.pdf" X-url: http://www.fp7-savas.eu/sites/default/files/documents/NLP2013.pdf Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:08:07 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:08:07 +0200 Subject: Appel: JSSP2013 - Joint Symposium on Semantic Processing Message-ID: Date: Wed, 19 Jun 2013 16:00:54 +0200 From: Alberto Lavelli Message-ID: <20130619140054.GA5026 at fbk.eu> X-url: http://jssp2013.fbk.eu/ = APOLOGIES FOR MULTIPLE POSTINGS = Joint Symposium on Semantic Processing: Textual Inference and Structures in Corpora FBK, Trento (Italy), November 20-22, 2013 http://jssp2013.fbk.eu/ Preliminary Call for Papers In the last decade, many Natural Language Processing tasks have matured to a point where semantic questions, ranging from paraphrasing to relevance assessment to disambiguation, are coming into the focus of attention. This symposium aims at bringing together researchers from different strands of research on semantic processing, with a focus on two aspects. The first is the textual inference paradigm, proposed as a unifying generic framework that captures major semantic processing needs in different application areas. Textual entailment research has yielded so far a range of inference algorithms, which were mostly developed within individual "in-house" systems. The symposium aims at addressing current bottlenecks by discussing future research directions and perspectives for consolidation and unification of textual inference technology. The second aspect concerns linguistic structures, as identified by empirical work within corpus linguistics, whose benefit for Computational Linguistics has not yet been fully realized. The aim of the symposium is to suggest progress towards models of language that facilitate successful processing of semantic knowledge in natural language applications. The symposium is open to any research topic related to textual inference and structures in corpora. More specifically, topics of interest include, but are not limited to: - Tools for textual inference - Resources for textual inference - Unification and consolidation in textual inference - Textual inference in real-world scenarios - Textual inference and other textual relations - Evaluation methodologies of textual inference - Multilingual and language-independent techniques for textual inference - Cross-lingual textual entailment - Representation of lexical and phrasal meaning: syntax-semantics interface - Syntax-lexical semantics interface - Shallow and deep semantic processing and reasoning: rule-based and probabilistic methods - Learning textual inference rules from data - Pattern extraction from corpus - Grammar inference - Distributional semantics - Semantic parsing - Modeling lexicon and context in semantic interpretation - Semantic roles labeling - Normalization for a broad range of semantic categories - Design decisions in construction of semantic frames - Extension of semantic frames - Representing and resolving semantic ambiguity - Context extraction for word sense disambiguation - Open domain relation extraction - Open domain event extraction - Large scale event extraction and event classification - Dynamic event relationships - Building and using ontologies to model inference - Computational modeling of linguistic theories - Alignment of lexical resources - Applications of textual inference and semantic processing The Symposium is a joint event supported by the EU-funded project EXCITEMENT (http://www.excitement-project.eu/), which aims to set up a generic architecture and a comprehensive open-source platform for multilingual textual inference, and by the B-CROCE project, which is the beneficiary of a Marie Curie Integration grant dedicated to finding regular structures as patterns in corpora. The symposium benefits from the participation of a large number of keynote presentations by people whose research has had a significant impact on semantic processing. The symposium aims at providing a stimulating and intriguing forum for mutual update and discussion of these research directions in semantic processing, and we hope to attract a substantial number of involved senior and junior researchers worldwide. To that end, the symposium will have a special structure, including: - A large number of keynote presentations by people whose research has had a significant impact in semantic processing - Presentations of submitted papers (oral and poster sessions) - Two panel discussions (one on each aspect of the symposium) - Two tutorials: the textual-inference tutorial will present the new open-source platform provided by the EXCITEMENT project (inference engines, modules and knowledge resources); the other tutorial will focus on corpus patterns (theoretical and computational aspects of corpus pattern analysis, chain clarifying relationships, frames, argument structures). Both tutorials include a hands-on session. All the details concerning the event may be found on the Symposium’s web page http://jssp2013.fbk.eu CONFIRMED KEYNOTE SPEAKERS AND PANELISTS Eneko Agirre, University of the Basque Country, Spain Marco Baroni, University of Trento, Italy Johan Bos, University of Groeningen, The Netherlands Philipp Cimiano, University of Bielefeld, Germany Peter Clark, Vulcan Inc., USA Ido Dagan, Bar Ilan University, Israel Patrick Hanks, University of Wolverhampton, UK Elisabetta Jezek, University of Pavia, Italy Mirella Lapata, University of Edinburgh, UK Bernardo Magnini, FBK, Italy Günter Neumann, DFKI, Germany Sebastian Pado, Heidelberg University, Germany Octavian Popescu, FBK, Italy Dan Roth, University of Illinois at Urbana-Champaign, USA Sabine Schulte im Walde, University of Stuttgart, Germany Roberto Zamparelli, University of Trento, Italy Torsten Zesch, University Darmstadt, Germany IMPORTANT DATES September 15, 2013: Papers due October 15, 2013: Notification of acceptance October 29, 2013: Camera-ready deadline November 20-22, 2013: Symposium SUBMISSIONS Authors are invited to submit papers on work in the topic areas of this workshop. We distinguish two types of papers: * Long papers present completed work and should not exceed 8 pages (plus any number of additional pages with references only) * Short papers present work in progress and should not exceed 4 pages (plus two additional pages of references) Papers are to be submitted via the symposium EasyChair submission page: https://www.easychair.org/conferences/?conf=jssp2013 As reviewing will be blind, please ensure that papers are anonymous. The papers should not include the authors' names and affiliations or any references to web sites, project names etc. revealing the authors' identity. Submissions should follow the two-column format of ACL 2013 proceedings (see the official style files at http://www.acl2013.org/call.html). PROGRAM COMMITTEE (confirmed members) Enrique Alfonseca, Google Research, Switerzland Luisa Bentivogli, FBK, Italy Antonio Horta Branco, Faculdade de Ciências de Lisboa, Portugal Elena Cabrio, INRIA Sophia Antipolis, France Dan Cristea, University of Iasi, Romania Ido Dagan, Bar Ilan University, Israel Rodolfo Delmonte, University "Ca' Foscari", Venice, Italy Liviu Dinu, University of Bucharest, Romania Eduard Hovy, Carnegie Mellon University, USA Elisabetta Jezek, Pavia University, Italy Alberto Lavelli, FBK, Italy Alessandro Lenci, University of Pisa, Italy Bernardo Magnini, FBK, Italy Simonetta Montemagni, Istituto di Linguistica Computazionale, Italy Günter Neumann, DFKI, Germany Rodney D. Nielsen, University of Colorado, USA Tae-Gil Noh, Heidelberg University, Germany Jan Odijk, Institute of Linguistics OTS, The Netherlands Constantin Orasan, University of Wolverhampton, UK Sebastian Pado, Heidelberg University, Germany Martha Palmer, University of Colorado Boulder, USA Octavian Popescu, FBK, Italy German Rigau, Facultad de Informatica de San Sebastian UPV/EHU, Spain Anne Vilnat, Universite Paris-Sud, France Rui Wang, DFKI, Germany Annie Zaenen, Stanford University, USA Fabio Massimo Zanzotto, University "Tor Vergata", Rome, Italy ORGANIZING COMMITTEE Ido Dagan, Bar Ilan University, Israel Elisabetta Jezek, Pavia University, Italy Alberto Lavelli, FBK, Italy Bernardo Magnini, FBK, Italy Günter Neumann, DFKI, Germany Sebastian Pado, Heidelberg University, Germany Octavian Popescu, FBK, Italy ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:21:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:21:44 +0200 Subject: Conf: International UDC Seminar 2013 entitled "Classification & Visualization", The Hague, 24-25 October 2013 Message-ID: Date: Thu, 20 Jun 2013 17:07:58 +0200 From: "Widad Mustafa El Hadi " Message-ID: <00e501ce6dc7$f595d580$e0c18080$@mustafa at free.fr> X-url: http://seminar.udcc.org/2013 === INVITATION FOR REGISTRATION === International UDC Seminar 2013 entitled "Classification& Visualization: Interfaces to Knowledge" will take place on Thursday 24 - Friday 25 October in the National Library of the Netherlands (Koninklijke Bibliotheek), The Hague Conference website: http://seminar.udcc.org/2013. The objective of this conference is to explore cutting edge advances and techniques in the visualization of knowledge across various fields of application and their potential impact on developments in the more main stream bibliographic and documentary classifications. Speakers include: W. Boyd Rayward, Lev Manovich, Kathryn La Barre, Fabrice Papy, Marcel Worring, Luca Rosati, Andrea Resmini, Richard Smiraglia, Charles van den Heuvel, Andrea Scharnhorst, Scott Weingart, etc. To learn more about the conference programme and to register go to the conference website http://seminar.udcc.org/2013Early bird registration closes on 30th June: €180 early bird fee, students €140 (to 30 June) €220 regular fee, students €180 Registration fee covers lunches, refreshments, reception and the conference proceedings book. Contact: seminar2013 at udcc.org We look forward to seeing you in October Dr. Aida Slavic, UDCC, The Hague, Netherlands ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:23:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:23:44 +0200 Subject: These: Enrique Henestroza Anguiano, Efficient Large-Context Dependency Parsing and Correction with Distributional Lexical Resources Message-ID: Date: Thu, 20 Jun 2013 10:27:11 -0700 From: Enrique Henestroza Anguiano Message-ID: Bonjour, J'ai le plaisir de vous inviter à ma soutenance de thèse, qui s'intitule : "Efficient Large-Context Dependency Parsing and Correction with Distributional Lexical Resources". La soutenance aura lieu le jeudi 27 juin, à 15h, en salle 147 (1er étage) du bâtiment Olympe de Gouges 8 rue Albert Einstein, 75013 Paris de l'Université Paris Diderot. Vous êtes également cordialement invités au pot qui suivra. Bien cordialement, Enrique Henestroza Anguiano ----- Composition du jury : Bernd Bohnet, University of Birmingham (examinateur) Marie Candito, Université Paris Diderot (co-directrice de thèse) Matthieu Constant, Université Paris-Est (rapporteur) Laurence Danlos, Université Paris Diderot (directrice de thèse) Alexis Nasr, Université Aix Marseille (co-directeur de thèse) Joakim Nivre, Uppsala University (rapporteur) ----- Résumé : Cette thèse présente des méthodes pour améliorer l'analyse syntaxique probabiliste en dépendances. Nous employons l'analyse à base de transitions avec une modélisation effectuée par des machines à vecteurs supports (Cortes and Vapnik, 1995), et nos expériences sont réalisées sur le français. L'analyse a base de transitions est rapide, de par la faible complexité des algorithmes sous-jacents, eux mêmes fondés sur une optimisation locale des décisions d'attachement. Ainsi notre premier fil directeur est d'élargir le contexte syntaxique utilisé. Partant du système de transitions arc-eager (Nivre, 2008), nous proposons une variante qui considère simultanément plusieurs gouverneurs candidats pour les attachements à droite. Nous testons aussi la correction des analyses, inspirée par Hall and Novák (2005), qui révise chaque attachement en choisissant parmi plusieurs gouverneurs alternatifs dans le voisinage syntaxique. Nos approches améliorent légèrement la précision globale ainsi que celles de l'attachement des groupes prépositionnels et de la coordination. Notre deuxième fil explore des approches semi-supervisées. Nous testons l'auto-entrainement avec un analyseur en deux étapes, basé sur McClosky et al. (2006), pour le domaine journalistique ainsi que pour l'adaptation au domaine médical. Nous passons ensuite à la modélisation lexicale à base de corpus, avec des classes lexicales généralisées pour réduire la dispersion des données, et des préférences lexicales de l'attachement des groupes prépositionnels pour aider à la désambiguïsation. Nos approches améliorent dans certains cas la précision et la couverture de l'analyseur, sans augmenter sa complexité théorique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:29:47 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:29:47 +0200 Subject: Job: Jeune Docteur - R&D analyse semantique et reseaux sociaux Message-ID: Date: Thu, 20 Jun 2013 22:30:54 +0200 From: Sylvain Eche Message-ID: Jeune Docteur - R&D analyse sémantique et réseaux sociaux Social Moov est une startup qui développe une technologie innovante dans le marketing sur les réseaux sociaux. La société compte aujourd'hui 30 collaborateurs et des bureaux en France et Angleterre. Afin d'accélérer sa R&D, nous recherchons un jeune docteur pour travailler sur les sujets R&D suivants : - Analyses sémantiques des discussions en cours sur les réseaux sociaux (tweeter / facebook) afin d'identifier les sujets tendances du moment et définir des ciblages publicitaires adaptés. - Algorithmes décisionnels pour identifier le meilleur timing pour poster un message sur une communauté en fonction des discussions courantes. - Construction de graphes de proximités afin d'identifier pour une marque donnée, les sujets ou centres d'intérêt les plus proches. - Optimisation des diffusions publicitaire afin de converger rapidement vers le message optimal à diffuser sur une cible donnée. Votre mission consistera à : Structurer l'ensemble de la R&D de la société. Réaliser des états de l'art. Documenter la R&D. Mettre en place et développer des prototypes fonctionnels. Réaliser des spécifications techniques pour les équipes de développeurs. Faire naitre des opportunités de partenariat avec le monde universitaire. Profil : Obligatoirement jeune docteur, vous avez réalisé une thèse dans l'analyse sémantique, la théorie des graphes, la fouille de donnée ou l'analyse des réseaux sociaux. Vous avez également déjà utilisé des technologies comme hadoop ou mahout pour analyser des masses importantes de données. Poste à pourvoir ASAP. Rémunération : A négocier. Lieu : Paris Bastille. Contact : Sylvain Eche (sylvain at socialmoov.com) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:04:39 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:04:39 +0200 Subject: Sujet de these: Projection interlingue d'annotations linguistiques a partir de corpus paralleles et comparables, CEA LIST Message-ID: Date: Wed, 19 Jun 2013 13:46:08 +0000 From: SEMMAR Nasredine 202247 Message-ID: <50CC12289F0C854FBFF134F270030CD71C3D734E at EXDAG0-B2.intra.cea.fr> [Version française] (English version below) Le CEA LIST propose une allocation doctorale de recherche pour la rentrée universitaire 2013. Sujet de thèse : Projection interlingue d’annotations linguistiques à partir de corpus parallèles et comparables Lieu de la thèse : CEA Saclay Nano-INNOV, Laboratoire Vision et Ingénierie des Contenus (LVIC), 91191 Gif-sur-Yvette Encadrant : Nasredine Semmar, CEA LIST, Laboratoire Vision et Ingénierie des Contenus (LVIC) Directeur de thèse: Laurent Besacier, Université de Grenoble, Laboratoire d’Informatique de Grenoble (LIG) Le Laboratoire Vision et Ingénierie des Contenus (LVIC) du CEA LIST est spécialisé en extraction et en recherche d’information multimédia et multilingue. Contexte et objectifs généraux de la thèse : ----------------------------------------------------- L'annotation linguistique de ressources consiste à ajouter des informations de nature interprétative aux données brutes originales [Leech, 1997]. Ces informations peuvent être d'ordre terminologique, lexical, morphologique, syntaxique ou sémantique et les ressources linguistiques peuvent être des lexiques, dictionnaires, transcriptions de dialogues ou corpus de textes [Véronis, 2000]. Les applications utilisant les ressources linguistiques annotées sont nombreuses et diverses : recherche d'information interlingue, fouille de textes, extraction d'informations, aide à la traduction, traduction automatique, etc. C'est la raison pour laquelle, depuis quelques années, la construction automatique de telles ressources est devenue un champ de recherche important en Traitement Automatique de la Langue (TAL) [Hamon et al., 2007] [Viprey et Léthier, 2008] [Mazziotta, 2010] [Bestgen, 2013]. La plupart des approches développées pour la construction de ressources linguistiques annotées ont un objectif commun : minimiser le coût de la production de telles ressources en supprimant l'intervention humaine ou en la limitant à la seule tâche de validation et d'évaluation. Le point commun de ces approches est de trouver et d'explorer des mécanismes non (ou très peu) coûteux pour exploiter des ressources linguistiques annotées déjà disponibles pour certaines langues et des corpus parallèles pour produire de nouvelles ressources annotées pour des langues faiblement dotées. C'est le cas des approches qui s'appuient sur la projection interlingue d'annotations. Ces approches partent d'un corpus parallèle dont les textes en langue source sont déjà annotés, et proposent des annotations pour des textes en langue cible à l'aide de techniques d'alignement. Ces approches permettent de produire des ressources linguistiques adéquates à moindre coût pour des langues peu dotées mais elles ouvrent également la voie à des recherches sur l'extension multilingue d'outils de TAL monolingues. Nous pourrons citer les travaux de Yarowsky et al (2001) qui ont utilisé un corpus parallèle pour adapter des outils monolingues (POS Taggers, chunkers et analyseurs morphologiques) à de nouvelles langues. La projection entre langues a été réalisée en utilisant des techniques d'alignement de mots entre les phrases du corpus parallèle. Cette approche a été adaptée par Hwa et al. (2002) aux nivaux grammatical et syntaxique pour faire une projection des informations concernant les dépendances syntaxiques de l'anglais vers le chinois. Feldman et al (2006) ont expérimenté la projection interlingue à partir de corpus comparables pour transférer des étiquettes morpho-syntaxiques entre le russe, le polonais et le tchèque. L'annotation en allemand de rôles sémantiques par projection interlingue à partir de la paire de langues anglais-allemand a été déjà abordée par Pado et Lapata (2005) (2009). Pado et Pitel (2007) ont évalué la généricité de cette approche du point de vue des langues en l'appliquant à la paire anglais-français. Les résultats sont proches de ceux obtenus pour l'allemand. Kim et al (2011) ont utilisé des informations fournies par un aligneur de mots pour transférer les entités nommées et leurs relations de l'anglais vers le coréen en vue de la construction d'un corpus d'apprentissage pour un système d'extraction d'information à partir du Web. Abdul Hay (2012) a utilisé les relations sémantiques extraites par transitivité traductionnelle à partir de corpus multilingue aligné pour la constitution d'une ressource sémantique en arabe. Plus récemment, Jabaian (2012) s'est intéressé à la portabilité multilingue d'un système de compréhension de la parole en proposant d'utiliser la traduction automatique afin de minimiser le coût du développement d'un nouveau système de compréhension dans une nouvelle langue (Jabaian et al., 2013). Les approches de projection interlingue par alignement de mots affichent des résultats satisfaisants en annotations lexicales et morpho-syntaxiques pour les couples de langues voisines, mais il reste plusieurs défis à relever pour les annotations syntaxiques et sémantiques des langues à morphologie riche ou celles possédant des syntagmes longs. Cette thèse se situe dans le contexte de l'automatisation du processus de construction de ressources linguistiques multilingues annotées par projection interlingue. L'objectif est d'identifier des équivalences terminologiques, morpho-syntaxiques, syntaxiques ou sémantiques à partir de corpus de textes parallèles ou comparables. Deux processus constituent un prérequis pour la projection interlingue d'annotations à partir de corpus : un alignement au niveau des paragraphes, des phrases ou d'unités lexicales de taille variable, et une analyse linguistique pour l'annotation des textes en langue source. Déroulement de la thèse : ------------------------------- Le sujet de thèse proposé a pour but d'explorer et d'expérimenter de nouvelles approches de projection interlingue d'annotations et se propose d'aborder cette problématique selon les trois axes suivants, dans le prolongement des travaux déjà réalisés au laboratoire LVIC : - Utilisation d'approches statistiques et de recherche d'information interlingue pour la constitution de corpus de textes parallèles à partir de corpus comparables. Il s'agit de mesurer une certaine similarité entre les textes du corpus comparable afin d'identifier les textes contenant les mêmes phrases. - Constitution de lexiques multilingues en développant de nouvelles approches d'alignement de mots simples, mots composés et expressions à partir de corpus textes comparables. - Développement d'un modèle de projection interlingue d'annotations terminologiques, morpho-syntaxiques, syntaxiques et sémantiques indépendant de la langue. Le laboratoire LVIC du CEA LIST dispose d'une plate-forme modulaire de traitement des langues, LIMA (Besançon et al., 2010), permettant de réaliser une analyse linguistique jusqu'au niveau syntaxique et intégrant certaines analyses sémantiques et discursives. Le doctorant réalisera son travail en s'appuyant sur cette plate-forme et bénéficiera des travaux déjà réalisés au niveau du laboratoire en alignement de mots simples, mots composés et d'expressions multi-mots à partir de corpus de textes parallèles (Semmar et Laib, 2010) et comparables (Bouamor et al., 2013). Références bibliographiques : ------------------------------------ - ABDUL HAY A. (2012). Constitution d'une ressource sémantique arabe à partir de corpus multilingue aligné. Thèse de doctorat en informatique et sciences du langage, Université de Grenoble, France. - BESANÇON R., DE CHALENDAR G., FERRET O., GARA F., LAIB M., MESNARD O., SEMMAR N. (2010). LIMA: A multilingual framework for linguistic analysis and linguistic resources development and evaluation. LREC 2010, Malta. - BESTGEN Y. (2013). Construction automatique de ressources lexicales pour la fouille d'opinion : extension aux n-grammes. Dixième édition de la COnférence en Recherche d'Information et Applications, CORIA 2013. - BOUAMOR D., SEMMAR N., ZWEIGENBAUM P. (2013). Similarité sémantique pour l'extraction de lexiques bilingues à partir de corpus comparables. TALN 2013. - FELDMAN A., HANA J., BREW C. (2006). Experiments in Cross-Language Morphological Annotation Transfer. A. Gelbukh (Ed.): CICLing 2006. - HAMON T., DERIVIERE J., NAZARENKO A. (2007). OGMIOS : une plate-forme d'annotation linguistique de collection de documents issus du Web. TALN 2007. - HWA R., RESNIK P., WEINBERG A., KOLAK O. (2002). Evaluation translational correspondence using annotation projection. ACL 2002, 392—399, Philadelphia, USA. - JABAIAN B. (2012). Systèmes de compréhension et de traduction de la parole : vers une approche unifiée dans le cadre de la portabilité multilingue des systèmes de dialogue. Thèse de doctorat en informatique, Université d'Avignon et des Pays de Vaucluse, France. - JABAIAN B., BESACIER L., LEFEVRE F. (2013). Comparison and Combination of Lightly Supervised Approaches for Language Portability of a Spoken Language Understanding System. IEEE Transactions on Audio, Speech & Language Processing, 21(3):636-648, 2013. - KIM S., JEONG M., LEE J., LEE G. G. (2011). A Cross-lingual Annotation Projection-based Self-supervision Approach for Open Information Extraction. 5th International Joint Conference on Natural Language Processing, 2011. - LEECH G. (1997). Introduction corpus annotation. Garside, R., Leech, G., McEnery, A., (Eds.), Corpus annotation: Linguistic information from computer text corpora. London: Longman, 1 :18. - PADÓ S., LAPATA M. (2005). Cross-lingual projection of role-semantic information. HLT/EMNLP 2005, Vancouver, Canada. - PADÓ S., LAPATA M. (2009). Cross-lingual Annotation Projection of Semantic Roles. Journal of Artificial Intelligence Research 36, 307-340. - PADÓ S., PITEL G. (2007). Annotation précise du français en sémantique de rôles par projection cross-linguistique. TALN 2007, Toulouse, France. - MAZZIOTA N. (2010). Logiciel NotaBene pour l'annotation linguistique Annotations et conceptualisations multiples. RECHERCHES QUALITATIVES, Hors Série numéro 9, pages 83-94. - SEMMAR N., LAIB M. (2010). Using a Hybrid Word Alignment Approach for Automatic Construction and Updating of Arabic to French Lexicons. LREC 2010, Malta. - VERONIS J. (2000). Annotation automatique de corpus : panorama et état de la technique. Chapitre 4, Editions Hermès, 2000. - VIPREY J. M., LETHIER V. (2008). Annotation linguistique de corpus : vers l'exhaustivité par la convivialité. 9es Journées internationales d'Analyse statistique des Données Textuelles, JADT 2008. - YAROWSKY D., NGAI G., WICENTOWSKI R. (2001). Inducing multilingual text analysis tools via robust projection across aligned corpora. HLT 2001, pp. 161—168, San Francisco, USA. Conditions sur les candidatures et Profil recherché: -------------------------------------------------------------- - Age : moins de 26 ans à la date de recrutement; - Diplôme de Master Recherche ou équivalent en informatique ; - Compétences en informatique (Linux, C++, Perl, etc.); - Connaissances en traitement automatique de la langue et en statistique souhaitées. Modalité de dépôt de candidature : ------------------------------------------- Les candidatures (CV + Lettre de motivation + Lettres de recommandation + Relevé de notes depuis le Bac) sont à envoyer le plus rapidement possible à Nasredine Semmar (nasredine.semmar at cea.fr) et Laurent Besacier (laurent.besacier at imag.fr). Contacts pour plus d'information : Nasredine Semmar, Email: nasredine.semmar at cea.fr, Tél: +33 (0)1 69 08 01 46 [English version] Funded PhD position, CEA LIST, Laboratoire Vision et Ingénierie des Contenus (LVIC), France The Vision and Content Engineering Laboratory (LVIC) of the CEA LIST, France, is looking for a PhD student to work in the area of building annotated multilingual linguistic resources. The LVIC is specialized in multilingual and multimedia information extraction and retrieval. Thesis title: Cross-language projection of linguistic annotations using parallel and comparable corpora Thesis subject: ------------------ Annotating corpora with linguistic information (part-of-speech tagging, sense tagging, syntactic analysis, named entity identification, semantic role annotation) involves significant human efforts. The availability of parallel corpora and some resource-rich languages (such as English which has large amounts of annotated corpora and several analysis tools available) has recently led to several research works in order to project linguistic annotations from the resource-rich source language to a target language with less resources. The goal of cross-language projection is, on the one hand, to provide all languages with linguistic annotations, and on the other hand, to automatically induce text analysis tools for these languages. Scientific challenges of cross-language projection of linguistic annotations from parallel corpora are related to the results of word alignment tools and the syntactic divergences of the source and target languages. Indeed, each word of the source language can map to single, multiple, or zero words in the target language, and part-of-speech tagsets for source and target language may be different. Many efforts have been developed to project linguistic annotations from resource-rich languages to other languages but most of them have only explored approaches applying one-to-one mapping. This thesis falls within the scope of automating the process of building annotated multilingual linguistic resources. The main purpose in this process is to identify lexical, syntactical and semantic equivalences across parallel or comparable corpora. The proposed subject aims to explore and experiment new approaches for language-independent projection for linguistic resources construction and annotation. It proposes to tackle this issue based on the following areas: - Constitution of aligned sentences and sub-sentences from comparable corpora using statistical and cross-language information retrieval approaches. - Building bilingual lexicons of single words and multiword expressions using word alignment. - Exploring rule-based, heuristic-based and hybrid approaches for mapping linguistic annotations using parallel corpora. Candidate profile: The successful candidate must be at greatest 26 years old by December 2013, will have a Master's degree (or equivalent qualification) in Computer Science with a good background in Computational Linguistics. Please send a CV, a cover letter, letters of recommendation and report card to: Nasredine Semmar (nasredine.semmar at cea.fr) and Laurent Besacier (laurent.besacier at imag.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:35:22 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:35:22 +0200 Subject: Job: Post doc, Semiotics of Image Fraud Detection, Caen Message-ID: Date: Sun, 23 Jun 2013 19:12:42 +0200 From: Nadine Lucas Message-Id: <1E3D314D-0F59-4A5C-AFF0-09F3D3DC732E at unicaen.fr> ########################################################## Postdoctoral Fellowship in Semiotics of Image Fraud Detection Normandy University (UCBN France) CNRS GREYC Laboratory Application deadline: 15.07.2013 (11:59 pm GMT) ########################################################## POSITION ANNOUNCEMENT Post-Doc position in the DOCSCOPE project at the National Center for Scientific Research (CNRS) GREYC Laboratory, Caen, Normandy, France. Duration: 12 months Application deadline: 15.07.2013 (11:59 pm GMT) The Human Language Technology team (HULTECH) proposes a Post-Doc fellowship within the context of the newly started DOCSCOPE project (ANR label) at the CNRS GREYC Laboratory for high standard candidates with a Ph.D. degree in Computer Science or Electronic Engineering. POSITION The DOCSCOPE project aims to contribute to the identification of falsified documents by developing new methods to detect directly visible or hidden visual clues using new technologies of documentary image processing. The exploitation of the results (revealing incoherence, alterations, fraudulent modifications, doctored photographs, etc.) also integrates an interpretation phase, which makes it possible to specify the significance of changes, or the meaning of whatever manipulations have been detected. Research stemming from Semiology (or Semiotics) and particularly work applied to image analysis, document analysis or text as image have obviously their role to play in the global DOCSCOPE procedure. Within this project, the analysis is not dependent on comparison with an annotated database, but relies on careful induction from sets of clues. The successful candidate is expected to work in collaboration with other researchers, programmers, and students involved in the project in an interdisciplinary team, and to collaborate with the research units involved in the project. JOB REQUIREMENTS - Ph.D. degree in Computer Science or Electronic Engineering; - Theoretical background in Natural Language Processing, Text Mining or Information Retrieval; - Ability to carry out a research program and keep deadlines; - Ability to work in a collaborative research environment; - Oral and written proficiency in English. OPTIONAL REQUIREMENTS: - Ph.D. or experience related to forgery / cheating / falsification; - Experience with practical applications; - Soft skill (e.g., communication, team building, problem solving, etc.); - Oral and written proficiency in French; - Background in Linguistics, Philosophy or Semiotics. EMPLOYMENT - Type of contract: Research position - Full time - Number of positions: 1 - Net salary: 1900 euros/month. - Start date: ideally 1st September 2013 - Duration: up to 1 year - Workplace: University of Caen-Basse-Normandie (UCBN), UFR Sciences, Caen, France APPLICATION To apply online, please send your detailed CV including a statement of interest and the contacts of three reference persons. The applicant must also attach his/her Ph.D. Certificate and a list of any publications, certificates or other qualifications (if any) considered relevant for assessing the candidate’s abilities in relation to this Call. IMPORTANT: All these documents must be sent as PDF files in a single zipped folder. Please note the candidate must state the following information clearly, precisely and under his/her own responsibility, in the application: - Personal information: date and place of birth, nationality, residence and contact address during the selection procedure; - Citizenship: applicants who are citizens of a country that is not a European Union Member State must already possess or at least have requested a Work Residence Permit. This requirement is not mandatory for the current application, but if the Residence Permit or related requests are not presented at the time the contract will be stipulated, all the related rights will be forfeited; - Doctoral Degree. Emails should have the following reference code: DOCSCOPE_PostDoc2013 Applications must be sent to Serge Mauger (serge.mauger at unicaen.fr) and Gaël Dias (gael.dias at unicaen.fr). Application deadline: 15.07.2013 (11:59 pm GMT). Only applications received before the aforementioned deadline will be considered. For further information, please feel free to contact Serge Mauger (serge.mauger at unicaen.fr) or Nadine Lucas (nadine.lucas at unicaen.fr) or Pierre Beust (pierre.beust at unicaen.fr) or Gaël Dias (gael.dias at unicaen.fr). Nadine Lucas, CR HDR Equipe Human Language Technologies (HULTECH) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:38:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:38:27 +0200 Subject: Appel: JADT2014, 3-6 Juin 2014, Paris Message-ID: Date: Mon, 24 Jun 2013 08:51:13 +0200 From: Serge Fleury Message-ID: X-url: http://tal.univ-paris3.fr/jadt/jadt2014/appels/Appel-JADT-2014-fr.pdf X-url: http://jadt.org *JADT 2014 (Paris) 3-6 juin 2014* (See English Below) *Appel à communication* http://tal.univ-paris3.fr/jadt/jadt2014/appels/Appel-JADT-2014-fr.pdf Les Journées internationales d’Analyse statistique des Données Textuelles (JADT) réunissent tous les deux ans, depuis 1990, des chercheurs travaillant dans les différents domaines concernés par les traitements automatiques et statistiques de données textuelles. Elles permettent aux participants de présenter leurs résultats, de confronter leurs outils et leurs expériences. Les JADT 2014 réuniront à Paris (France), du *3 au 6 juin 2014*, statisticiens, linguistes, sociologues, spécialistes de l’analyse du discours ou de la fouille de texte, informaticiens, lexicographes, chercheurs en TAL, etc. Site du colloque : http://jadt.org *Organisation* ERTIM, Inalco (Institut national des langues et civilisations orientales) CLESTHIA-SYLED, Université de la Sorbonne nouvelle – Paris 3 *Thèmes du colloque* La conférence sera centrée sur les applications des modèles et des outils statistiques dans les domaines suivants : Textométrie, statistique textuelle Analyse exploratoire de données textuelles Linguistique de corpus et linguistique quantitative Traitement automatique du langage naturel Étiquetage, lemmatisation, enrichissement linguistique Analyse statistique des données structurées et non structurées Classification de textes, cartographie lexicale et textuelle Recherche documentaire, recherche d’informations Fouille de textes, fouille du web, Web sémantique Stylométrie, analyse du discours Logiciels pour l’analyse textuelle Apprentissage automatique pour l’analyse des données textuelles Corpus multilingues et corpus parallèles *Dates importantes* Titre et Résumé (facultatif / max 20 lignes) 1er octobre 2013 Date limite de soumission: Première version (Texte complet) 1er novembre 2013 Notification aux auteurs 1er février 2014 Date limite d’inscription 1er mars 2014 Date limite de soumission: Dernière version 1er mars 2014 Atelier corpus multilingues 3 juin 2014 Dates de la conférence JADT2014 4-6 juin 2014 *Langues des articles et des présentations* Les propositions de communication, les communications définitives et les présentations orales pourront être faites dans les langues suivantes : anglais, français, italien, espagnol. Toutes les communications devront être précédées d’un résumé en anglais. *Propositions de communication* JADT 2014 utilise le système EasyChair pour gérer les propositions de communication. *Soumission* : https://www.easychair.org/conferences/?conf=jadt2014 Les communications finales doivent correspondre au travail qui aura été évalué par les relecteurs. Les articles doivent faire le point sur l’état de l’art du domaine et/ou des références à des travaux antérieurs. Dans le cas où cette mise en perspective n’apparaitrait pas dans la proposition de communication, les auteurs sont invités à en expliquer les raisons. Nous invitons les auteurs à souligner, dans leur proposition, les liens qui existent entre leur travail et les thèmes de la conférence. *Titre et pré-soumission (facultatif)* Les participants qui désirent présenter une contribution ou un poster sont invités à envoyer un titre et un résumé (maximum 20 lignes) avant le 1er octobre 2013. *Articles* Les auteurs devront fournir la version complète de leur contribution avant le 1er novembre 2013. Les articles seront évalués par le comité scientifique. Le texte complet de la communication ne devra pas excéder 12 pages, références comprises. Le comité de programme informera les auteurs de sa décision d’acceptation et du classement de la communication (communication orale ou poster) le 1er février 2014. *Version finale* Les auteurs devront fournir la version finale de leur contribution (12 pages maximum) avant le 1er mars 2014, en utilisant la même procédure de soumission. La version finale sera relue avant édition. *Directives pour les auteurs* Anglais : http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-en.doc http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-en.pdf Français : http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-fr.doc http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-fr.pdf *Contacts* Pour plus d’informations ou pour toute question, écrivez à l’adresse suivante : jadt2014 at gmail.com *Comité d’organisation* Jean-Michel Daube (ERTIM, INALCO) Serge Fleury (SYLED, Sorbonne nouvelle, Paris 3) Marion Iché (AFTAL) Marguerite Leenhardt (XiKo – SYLED, Sorbonne nouvelle, Paris 3) Emilie Née (CEDITEC, Université Paris Est Créteil, Paris 12) Mathieu Valette (ERTIM, INALCO) *Comité scientifique* Ramón Álvarez Esteban, Univ. de León, Esp Simona Balbi, Univ. de Naples, It Valérie Beaudouin, Telecom ParisTech, Fr Mónica Bécue, Univ. Polyt. de Catalunya, Esp Sergio Bolasco, Univ. de Rome ’La Sapienza’, It Étienne Brunet, Univ. de Nice Sophia Antipolis, Fr Lou Burnard, Univ. d’ Oxford, RU Isabella Chiari, Univ. de Rome ’La Sapienza’, It François Daoust, UQÀM, Montreal, Ca Anne Dister, FUSL et UCL, Bruxelles et Louvain, Be Jules Duchastel, UQÀM, Montreal, Ca Serge Fleury, Univ. Paris 3, Fr Cédrick Fairon, UCL, Louvain, Be Luca Giuliano, Univ. de Rome ’La Sapienza’, It Serge Heiden, ENS-LSH, Lyon, Fr Ludovic Lebart, CNRS, ENST, Paris, Fr Jean-Marc Leblanc, Univ. de Créteil, Fr Alain Lelu, Univ. de Franche Comté, Fr Dominique Longrée, Université de Liège, Be Pascal Marchand, Univ. de Toulouse, Fr William Martinez, Univ. de Lisboa, Pt Damon Mayaffre, CNRS, Nice, Fr Sylvie Mellet, CNRS, Nice, Fr Denis Monière, Univ. de Montréal, Ca Bénédicte Pincemin, CNRS, Lyon, Fr Gérald Purnelle, Université de Liège, Be Max Reinert, CNRS, Univ. de Versailles SQY, Fr André Salem, Univ. Paris 3, Fr Monique Slodzian, Inalco, Fr Arjuna Tuzzi, Univ. de Padoue, It Mathieu Valette, Inalco, Fr Jean-Marie Viprey, Univ. De Franche Comté, Fr __________________________________________________ *Call for papers* http://tal.univ-paris3.fr/jadt/jadt2014/appels/call-JADT-2014-en.pdf JADT 2014, the 12th International Conference on the Statistical Analysis of Textual Data, will be held in Paris (France) from *3 to 6 June 2014* (organised by ERTIM (Inalco, Institut national des langues et civilisations orientales), CLESTHIA-SYLED (Université Sorbonne nouvelle Paris 3)). This biennial conference, which has constantly been gaining importance since it was first held in Barcelona (1990), is open to all scholars and researchers working in the field of textual data analysis, ranging from lexicography to the analysis of political discourse, from information retrieval to marketing research, from computational linguistics to sociolinguistics, from text mining to content analysis. After the success of the previous meetings (http://lexicometrica.univ-paris3.fr/jadt/), the three-day conference in Paris will continue to offer a workshop-style forum through technical paper sessions, invited talks, and panel discussions. The conference website is http://jadt.org *Conference topics* The themes of interest of the conference concern the application of statistical models and tools in the following domains: Textometry, Statistical Analysis of Textual Data Exploratory Textual Data Analysis Corpus and Quantitative Linguistics Natural Language Processing Text Corpus Encoding Statistical Analysis of Unstructured and Structured Data Text Categorisation, Fuzzy Classification and Visualization Information Retrieval and Information Extraction Text Mining, Web Mining, Semantic Web Stylometry, Discourse analysis Software for Textual Data Analysis Machine Learning for Textual Data Analysis Multilingual and parallel corpora *Languages for the papers and the presentations* Submissions, communications and presentations can be made in any one of the following languages: English, French, Italian, Spanish. All communications and presentations must contain an English abstract. *Important dates* Title and Abstract (optional / max 20 lines) October 1st 2013 Submission Deadline: First Version of Paper (Full-text) November 1st 2013 Notification to Authors February 1st 2014 Deadline for registration March 1st 2014 Final Camera-Ready Paper Delivery March 1st 2014 *Workshop Multilingual Corpora June 3 2014 Conference Dates June 4-6 2014 * JADT 2014 uses the EasyChair system to manage submissions. *Submission* : https://www.easychair.org/conferences/?conf=jadt2014 *Title and pre-submission (optional)* Participants interested in presenting a paper for either an oral or poster presentation, should submit title and abstract (maximum 20 lines) by October 1st, 2013. *Papers* The Authors should submit the full paper by November 1st, 2013. The papers will be peer reviewed. The full text of the communication should be 12 pages at the most, including references. Authors will be notified of the Scientific Committee’s decisions on the acceptance of their proposal and on the presentation format (oral communication or poster) by February 1st, 2014. *Final Papers (for Proceedings publication)* The Authors are invited to submit the final accepted version of paper (12 pages) of their contribution by March 1st, 2014, using the same paper’s submission procedure. The final paper will be subject to a final re-reading. * Authors Guidelines* English : http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-en.doc http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-en.pdf French : http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-fr.doc http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-fr.pdf *Contacts* For further information or enquiries write to : jadt2014 at gmail.com * Steering committee* Jean-Michel Daube (ERTIM, INALCO) Serge Fleury (SYLED, Sorbonne nouvelle, Paris 3) Marion Iché (AFTAL) Marguerite Leenhardt (XiKo – SYLED, Sorbonne nouvelle, Paris 3) Emilie Née (CEDITEC, Université Paris Est Créteil, Paris 12) Mathieu Valette (ERTIM, INALCO) *Scientific committee* Ramón Álvarez Esteban, Univ. de León, Esp Simona Balbi, Univ. de Naples, It Valérie Beaudouin, Telecom ParisTech, Fr Mónica Bécue, Univ. Polyt. de Catalunya, Esp Sergio Bolasco, Univ. de Rome ’La Sapienza’, It Étienne Brunet, Univ. de Nice Sophia Antipolis, Fr Lou Burnard, Univ. d’ Oxford, RU Isabella Chiari, Univ. de Rome ’La Sapienza’, It François Daoust, UQÀM, Montreal, Ca Anne Dister, FUSL et UCL, Bruxelles et Louvain, Be Jules Duchastel, UQÀM, Montreal, Ca Serge Fleury, Univ. Paris 3, Fr Cédrick Fairon, UCL, Louvain, Be Luca Giuliano, Univ. de Rome ’La Sapienza’, It Serge Heiden, ENS-LSH, Lyon, Fr Ludovic Lebart, CNRS, ENST, Paris, Fr Jean-Marc Leblanc, Univ. de Créteil, Fr Alain Lelu, Univ. de Franche Comté, Fr Dominique Longrée, Université de Liège, Be Pascal Marchand, Univ. de Toulouse, Fr William Martinez, Po Damon Mayaffre, CNRS, Nice, Fr Sylvie Mellet, CNRS, Nice, Fr Denis Monière, Univ. de Montréal, Ca Bénédicte Pincemin, CNRS, Lyon, Fr Gérald Purnelle, Université de Liège, Be Max Reinert, CNRS, Univ. de Versailles SQY, Fr André Salem, Univ. Paris 3, Fr Monique Slodzian, Inalco, Fr Arjuna Tuzzi, Univ. de Padoue, It Mathieu Valette, Inalco, Fr Jean-Marie Viprey, Univ. De Franche Comté, Fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:40:07 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:40:07 +0200 Subject: Appel: Deadline extension, Special issue of the ITL journal on readability and text simplification Message-ID: Date: Mon, 24 Jun 2013 13:44:49 +0200 From: Delphine Bernhard Message-ID: <51C83131.7020208 at unistra.fr> X-url: http://poj.peeters-leuven.be/content.php?url=journal&journal_code=itl X-url: http://itl-sirs.sciencesconf.org/ **** EXTENDED DEADLINE: July 15 **** ############################################################# Call for papers "Current research in readability and text simplification" A special issue of the International Journal of Applied Linguistics (ITL) (http://poj.peeters-leuven.be/content.php?url=journal&journal_code=itl) ############################################################# With the rapid growth of the number of online documents, Internet has become a formidable source of information. However, most of the reliable websites are intended for rather experienced readers and can present comprehension difficulties for certain types of readers, such as children, learners of a foreign language, or readers with language deficits. To offer those kind of readers a better access to information, two strategies based on natural language processing (NLP) have been investigated in recent years: readability and text simplification. Readability includes a range of methods targeted at the automatic evaluation of text difficulty in relation to a given population of readers. Throughout the 20th century, various readability formulas have been developped (Dale and Chall, 1948; Flesch, 1948 ; Fry, 1968). They have been recently enhanced using various contributions from NLP, such as language models (Collins-Thompson, 2005, Schwarm and Ostendorf, 2005 ; Heilman et al., 2007, ...), various aspects of discourse (Pitler and Nenkova, 2008; Feng et al., 2010) or multiword expressions (Watrin and François, 2011). Moreover, criteria identified by researchers in psycholinguistics or language acquisition are increasingly taken into account. These formulas have also been used within web platforms, such as Read-X (Miltsakaki, 2009) or REAP (Collins-Thompson and Callan, 2004), to help readers find on the web documents matching their level. However, it is sometimes the case that, for a given topic, there are no target documents suitable for a specific user. In this context, automatic text simplification has appeared as a possible way to make existing texts accessible to poorer readers that would normally have trouble processing them. Automatic text simplification indeed aims at generating a simplified version of an input text. Two main types of automatic simplification methods can be distinguished : (i) lexical simplification, which aims at replacing complex words or expressions with simpler synonyms or paraphrases and (ii) syntactic simplification, which modifies the structure of sentences, by deleting, moving or replacing difficult syntactic structures. In recent years, methods for automatic simplification have been largely influenced by other domains of NLP. Lexical simplification, as it consists in finding a suitable synonym or paraphrase for a complex expression, is closely related to the task of lexical substitution, which, in turn, is related to Word Sense Disambiguation (Specia et al., 2012). Statistical Machine Translation methods have also influenced text simplification, as large comparable corpora such as Wikipedia and the Simple English Wikipedia have become available (Zhu et al., 2010 ; Wubben et al., 2012 ; ...). This special issue will therefore address these two areas of increasing importance, with a focus on systems informed by research on language acquisition or used in the context of computer-assisted language learning (CALL). To be more specific, all following contributions are suitable for publication (the list is not exclusive): - readability formulas for L1 or for L2 including some NLP components - readability formulas taking into account some characteristics of a specific population of learners (such as readers with a given L1, etc.) - NLP approaches of text understandability. - lexical, syntactic, or semantic approaches of text simplification in the context of CALL. - contributions of readability to text simplification - tools or techniques providing a more detailed difficulty diagnosis for users (e.g. difficult words or syntactic structures). All contributions should explicitly discuss how they relate to current research in language acquisition, educational linguistics or computer-assisted language learning. MAIN DATES - submission deadline: July 15, 2013 - first notification: August, 31, 2013 - submission of the revised version: October 31, 2013 - final version: December 31, 2013 - publication: 2014 (to be detailed) Papers should be submitted in Word format through the following web site : http://itl-sirs.sciencesconf.org/ Recommendations for authors are available at http://itl-sirs.sciencesconf.org/resource/page/id/1 GUEST EDITORS Thomas François (Université catholique de Louvain, Belgium) Delphine Bernhard (Université de Strasbourg, France) SCIENTIFIC COMMITTEE Kevyn Collins-Thompson (Microsoft Research) Piet Desmet (Katholieke Universiteit Leuven) Cédrick Fairon (Université catholique de Louvain) Lijun Feng (Standard& Poor's) Michael Heilman (Educational Testing Service) Véronique Hoste (Hogeschool Gent) Matt Huernerfauth (City University of New York) Anne-Laure Ligozat (LIMSI-CNRS, Orsay) Annie Louis (University of Pennsylvania Aurélien Max (LIMSI-CNRS, Orsay) Eleni Miltsakaki (University of Pennsylvania) Ruslan Mitkov (University of Wolverhampton) Marie-Francine Moens (Katholieke Universiteit Leuven) Emily Pitler (University of Pennsylvania) Horacio Saggion (Universitat Pompeu Fabra, Barcelona) Advaith Siddhartan (University of Aberdeen) Lucia Specia (University of Sheffield) Kristian Woodsend (University of Edinburgh) Sander Wubben (Tilburg University) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:43:51 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:43:51 +0200 Subject: Seminaire: Alpage, Teresa Lynn, The Irish dependency treebank develop, 2 juillet 2013, Paris Message-ID: Date: Mon, 24 Jun 2013 17:50:37 +0200 From: Marie Candito Message-ID: ************** Séminaire de l'équipe Alpage ********* Il s'agit du séminaire de recherche en linguistique informatique organisé par l'équipe Alpage, équipe mixte INRIA - Paris Diderot, spécialisée en analyse syntaxique automatique et en traitement du discours. *Le prochain séminaire se tiendra exceptionnellement : MARDI 2 JUILLET de 11h à 12h30, en salle 265* Bâtiment Olympe de Gouges rue Albert Einstein 75013 Paris (dernier bâtiment de la rue Albert Einstein, numéro non attribué...) Toute personne intéressée est la bienvenue. ********************************************************** Teresa Lynn (Dublin University and Macquarie University) Title : The Irish dependency treebank development Abstract : In this talk I will discuss the ongoing development of the Irish dependency treebank. Irish is an Indo-European language and shares linguistic features with other Celtic languages such as rich morphology and VSO word order. Irish is a minority language of the EU. It is regarded as a low-density language in terms of NLP resources. My PhD research involves the development of the first treebank and statistical parser for Irish. I will discuss details such as the significance of Inter-annotator Agreement, preliminary parsing experiments and the analysis of a bootstrapping approach to the treebank development. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:45:00 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:45:00 +0200 Subject: These: Estelle Delpech, Traduction assistee par ordinateur et corpus comparables Message-ID: Date: Mon, 24 Jun 2013 23:10:13 +0200 (CEST) From: "Estelle DELPECH" Message-ID: <5b7a3b6870e73c2108fdb4db6792c01c.squirrel at webmail.univ-nantes.fr> Bonjour, J'ai le plaisir de vous inviter à la soutenance de mon travail de thèse réalisé au sein du Laboratoire d'Informatique de Nantes Atlantique (LINA) et intitulé : "Traduction assistée par ordinateur et corpus comparables - contributions à la traduction compositionnelle". La soutenance aura lieu le mardi 2 juillet 2013 à 14h00 dans la salle 3 du LINA. Vous êtes également convié-e-s au pot de thèse qui suivra. Bien cordialement, Estelle Delpech ----- Composition du jury : - Nabil Hathout, Directeur de recherches, CNRS (Examinateur) - Élisabeth Lavault-Olléan, Professeure, Université Stendhal Grenoble 3 (Rapporteur) - Michel Simard, Senior Research Officer, Centre National de Recherche du Canada (Rapporteur) - Béatrice Daille, Professeure, Université de Nantes (Directrice de thèse) - Emmanuel Morin, Professeur, Université de Nantes (Co-directeur de thèse) - Emmanuel Planas, Maître de conférences, Université Catholique de l’Ouest (Invité) ----- Résumé : Notre travail concerne l’extraction de lexiques bilingues à partir de corpus comparables, avec une application à la traduction spécialisée. Nous avons d’abord évalué les méthodes classiques d’acquisition de lexiques en corpus comparables (basées sur l’hypothèse distributionnelle : plus deux termes apparaissent dans des contextes similaires, plus il y a de chances qu’ils soient des traductions) d’un point de vue applicatif. L’évaluation a montré que les traducteurs sont mal à l’aise avec les lexiques extraits : la traduction correcte est trop souvent noyée dans une liste de traductions candidates et ils préféreraient utiliser un lexique plus petit mais plus précis. Partant de ce constat, nous nous sommes orientés vers une autre approche qui a fait récemment ses preuves pour l’exploitation des corpus comparables et produit des lexiques plus adaptés aux besoins des traducteurs : la traduction compositionnelle (la traduction du terme source est fonction de la traduction de ses parties). Nous nous sommes concentrés sur la traduction d’unités monolexicales : le terme source est découpé en morphèmes, les morphèmes sont traduits puis recomposés en un terme cible. Dans ce cadre, nous avons poursuivi trois axes de recherche : la génération de traductions fertiles (cas où le terme cible contient plus de mots lexicaux que le terme source), l’indépendance aux structures morphologiques et l’ordonnancement des traductions candidates. Mots-clés : traduction assistée par ordinateur, corpus comparables, compositionnalité, learning-to-rank, évaluation centrée utilisateur, morphologie computationnelle. ----- Abstract: Our work deals with the extraction of bilingual lexicons from comparable corpora with an application to specialized translation. We started by evaluating classical methods based on the distributional hypothesis (the more two terms appear in similar contexts, the more likely they are translations of each other) in a user-oriented fashion. This evaluation raised the fact that translators feel very uncomfortable with this kind of lexicon: they feel correct translations are uneasy to spot in the lists of candidate translations and would rather use a smaller lexicon but with higher precision rates. Based on this observation, we turned to another approach for term translation which has been recently and successfully experimented on comparable corpora and produce lexicons that meet the demands of the translators: compositional translation. In this framework, the translation of a term is composed of the translation of its parts. We concentrated on the translation of monolexical terms: the source term is decomposed into morphemes, morphemes are translated into the target language and recomposed as a target term. We investigated three lines of research: generation of fertile translations (cases in which the target term has more lexical words than the source term), independence to morphological structure and candidate translation ranking. Keywords : computer-aided translation, comparable corpora, compositionality, learningto- rank, user-centered evaluation, computational morphology ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:41:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:41:35 +0200 Subject: Job: Ingenieur, 24 mois, Constitution de corpus de langues rares Message-ID: Date: Mon, 24 Jun 2013 14:32:55 +0200 From: guillaume at vjf.cnrs.fr Message-ID: <34a4891e59c5dd9ee90c5548b0dcae08.squirrel at www.vjf.cnrs.fr> X-url: http://himalco.hypotheses.org/ X-url: http://lacito.vjf.cnrs.fr/archivage/index.htm Profil de poste : CDD de 24 mois au laboratoire LACITO-CNRS Niveau : Ingénieur d’études Contribution à la constitution de corpus de langues rares : textes et dictionnaires en ligne CONTEXTE : Le projet HimalCo, financé par l’Agence Nationale de la Recherche (2013-2015), porte sur la constitution et l’exploitation de corpus pour dix langues à tradition orale. Les corpus sont composés de ressources sonores (enregistrements audio), textuelles (transcription, annotations) ainsi que de données lexicales (dictionnaires et enregistrements de mots) : http://himalco.hypotheses.org/ Les corpus et les outils issus du projet HimalCo iront à terme alimenter la plateforme de la collection Pangloss qui regroupe elle-même plus de 70 corpus de langues rares : http://lacito.vjf.cnrs.fr/archivage/index.htm MISSIONS : La personne recrutée en CDD travaillera en étroite collaboration avec l’ingénieur responsable de la Collection Pangloss et participant au projet HimalCo. Elle devra rapidement faire preuve d’autonomie dans la réalisation des tâches qui lui sont confiées. Les tâches à effectuer pour le projet sont diverses. Voici une liste non exhaustive : - traitement et mise en forme des corpus : suivi des tâches, gestion des contacts avec les déposants, alignement texte/son, préparation et vérification de métadonnées... - dépôt de documents à l’archivage pérenne et mise à jour des pages web correspondantes sur le site de la Collection Pangloss - développement de fonctionnalités en ligne pour la consultation des textes parallèles et des dictionnaires - développement d’outils et mise à jour d’outils existants pour la mise en forme, la diffusion et la recherche dans les corpus - dialogue avec les partenaires de la Collection Pangloss - déploiement d’un outil logiciel de suivi des tâches (de la prise de contact initiale jusqu’au dépôt final) si le temps nécessaire peut être dégagé COMPETENCES : - Connaissances en structuration de données textuelles (HTML, XML, XSL) et sonores (wav). - PHP - Perl - Java souhaité Capacité d’écoute pour comprendre les besoins et les pratiques des linguistes. Une expérience de l’étude et/ou du traitement de données linguistiques serait un plus. DUREE ET DATES : La durée totale du contrat est de 24 mois. Les dates prévues sont : de novembre 2013 à octobre 2015 inclus. La date de début peut être avancée à septembre ou octobre 2013 si la personne recrutée le souhaite. Aucun engagement ne peut être pris concernant une prolongation du contrat au-delà de 24 mois : les possibilités sont soumises aux contingences des futurs Appels à projets de recherche (pour les CDD) et des créations de poste (pour les CDI). Contact : guillaume at vjf.cnrs.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:45:58 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:45:58 +0200 Subject: Conf: PFIA, 1 au 5 juillet 2013, Lille Message-ID: Date: Tue, 25 Jun 2013 08:17:55 +0200 From: Maxime MORGE Message-ID: <51C93613.7050208 at univ-lille1.fr> X-url: http://pfia2013.univ-lille1.fr Nos excuses pour les réceptions multiples. Ne pas hésiter à diffuser. PLATE-FORME INTELLIGENCE ARTIFICIELLE 2013 1-5 juillet 2013 Lille http://pfia2013.univ-lille1.fr Vous êtes cordialement invité(e)s à participer à la Plate-Forme IA (PFIA) organisée en 2013 à Lille sur le campus de Villeneuve d'Ascq. Sous l'égide de l'AFIA, la plate-forme a pour objectif de réunir chercheurs, industriels et étudiants autour de conférences et d'ateliers consacrés à l'Intelligence Artificielle. Elle accueille cinq conférences invitées : http://pfia2013.univ-lille1.fr/doku.php?id=fr:invite * Serge Abiteboul (INRIA Saclay) From data and information to knowledge: the Web of tomorrow * Antoine Bordes (CNRS Compiègne) Traiter de grandes masses de données relationnelles grâce à l'apprentissage automatique. * Hans van Ditmarsch (CNRS Nancy) Awareness and Knowledge * Joelle Pineau (Université McGill à Montréal) L'apprentissage automatique au service de la robotique sociale * Franco Zambonelli (Université de Modène et d'Émilie-Romagne) Engineering Socio-technical Urban Superorganisms La Plate-Forme IA héberge les six conférences suivantes : * Conférence d'Apprentissage (CAp) * Journées francophones d'Ingénierie des Connaissances (IC) * Journées Francophones Planification, Décision, et Apprentissage pour la conduite de systèmes (JFPDA) * Journées Francophones sur les Systèmes Multi-Agents (JFSMA) * Journées francophones sur les Modèles Formels de l'Interaction (MFI) * Rencontres des Jeunes Chercheurs en Intelligence Artificielle (RJCIA) La Plate-Forme IA intègre par ailleurs 9 ateliers thématiques représentatifs des thèmes portés par les conférences : http://pfia2013.univ-lille1.fr/doku.php?id=fr:ateliers ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:49:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:49:31 +0200 Subject: These: Fran=?ISO-8859-1?Q?=E7ois_?=Morlane-Hondere, Evaluation des ressources extraites par analyse distributionnelle automatique Message-ID: Date: Tue, 25 Jun 2013 12:04:31 +0200 From: François Morlane-Hondère Message-ID: X-url: http://w3.erss.univ-tlse2.fr/membre/morlane/ Bonjour, J'ai le plaisir de vous convier à la soutenance de ma thèse, qui s'intitule "Une approche linguistique de l'évaluation des ressources extraites par analyse distributionnelle automatique". Cette soutenance aura lieu le mercredi 10 juillet 2013 à 14h à la salle D29 de la Maison de la Recherche, à l'Université Toulouse II Le Mirail. Elle sera suivie du traditionnel pot de thèse auquel vous êtes chaleureusement conviés. Bien cordialement, François Morlane-Hondère ----- Composition du jury : Pierre-André Buvet - Maître de conférences HDR, Université Paris 13/LDI (examinateur) Béatrice Daille - Professeur, Université de Nantes/LINA (rapporteur) Cécile Fabre - Professeur, Université de Toulouse II/CLLE-ERSS (directrice) Nabil Hathout - Directeur de recherche, CNRS et Université de Toulouse II/CLLE-ERSS (examinateur) Alain Polguère - Professeur, Université de Lorraine/ATILF (rapporteur) ----- Résumé : Dans cette thèse, nous abordons du point de vue linguistique la question de l'évaluation des bases lexicales extraites par analyse distributionnelle automatique (ADA). Les méthodes d'évaluation de ces ressources qui sont actuellement mises en oeuvre (comparaison à des lexiques de référence, évaluation par la tâche, test du TOEFL...) relèvent en effet d'une approche quantitative des données qui ne laisse que peu de place à l'interprétation des rapprochements générés. De ce fait, les conditions qui font que certains couples de mots sont extraits alors que d'autres ne le sont pas restent mal connues. Notre travail vise une meilleure compréhension des fonctionnements en corpus qui régissent les rapprochements distributionnels. Pour cela, nous avons dans un premier temps adopté une approche quantitative qui a consisté à comparer plusieurs ressources distributionnelles calculées sur des corpus différents à des lexiques de références (le Dictionnaire électronique des synonymes du CRISCO et le réseau lexical JeuxDeMots). Cette étape nous a permis, premièrement, d'avoir une estimation globale du contenu de nos ressources, et, deuxièmement, de sélectionner des échantillons de couples de mots à étudier d'un point de vue qualitatif. Cette deuxième étape constitue le coeur de la thèse. Nous avons choisi de nous focaliser sur les relations lexico-sémantiques que sont la synonymie, l'antonymie, l'hyperonymie et la méronymie, que nous abordons en mettant en place quatre protocoles différents. En nous appuyant sur les relations contenues dans les lexiques de référence, nous avons comparé les propriétés distributionnelles des couples de synonymes/antonymes/hyperonymes/méronymes qui ont été extraits par l'ADA avec celles des couples qui ne l'ont pas été. Nous mettons ainsi au jour plusieurs phénomènes qui favorisent ou bloquent la substituabilité des couples de mots (donc leur extraction par l'ADA). Ces phénomènes sont considérés au regard de paramètres comme la nature du corpus qui a permis de générer les bases distributionnelles étudiées (corpus encyclopédique, journalistique ou littéraire) ou les limites des lexiques de référence. Ainsi, en même temps qu'il questionne les méthodes d'évaluation des bases distributionnelles actuellement employées, ce travail de thèse illustre l'intérêt qu'il y a à considérer ces ressources comme des objets d'études linguistiques à part entière. Les bases distributionnelles sont en effet le résultat d'une mise en oeuvre à grande échelle du principe de substituabilité, ce qui en fait un matériau de choix pour la description des relations lexico-sémantiques. François Morlane-Hondère Doctorant contractuel Université Toulouse II - Le Mirail Laboratoire CLLE-ERSS (UMR 5263) & Département de Sciences du Langage http://w3.erss.univ-tlse2.fr/membre/morlane/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:48:09 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:48:09 +0200 Subject: Conf: SIIM'13, PFIA, Lille, 1er juillet 2013 Message-ID: Date: Tue, 25 Jun 2013 11:01:02 +0200 From: Lina Soualmia Message-ID: X-url: http://www.irit.fr/SIIM/2013/ La 2ème édition du Symposium sur l'Ingénierie de l'Information Médicale aura lieu le 1er juillet à Lille Elle est associée aux 24èmes journées francophones d'Ingénierie des Connaissances au sein de la Plateforme pour l'IA Site web : http://www.irit.fr/SIIM/2013/ ****************************** Présentation ---------------- SIIM 2013 est la seconde édition du Symposium sur l’ingénierie de l’information médicale qui réunit les communautés en informatique médicale, des systèmes d'information et de gestion de la connaissance en ciblant des problématiques liées à l’ingénierie de l’information médicale. L'édition inaugurale a eu lieu en 2011 à Toulouse ( http://www.irit.fr/SIIM/2011/index.php) et a émergé des journées ayant eu lieu à Rennes en 2003, Rouen en 2004 et de l’atelier qui s’est déroulé à Nîmes en 2010 autour du web sémantique médical ( http://www-limbio.smbh.univ-paris13.fr/wsm10/). Son objectif majeur est de débattre des verrous liés à la modélisation, la structuration, l’extraction, la recherche et la fouille d’informations de tous types et de questions connexes et ce, à travers la présentation des activités de recherche innovantes, des techniques, des technologies et de démonstrateurs développés aussi bien dans le monde académique, dans les laboratoires affiliés aux structures de santé et par des industriels impliqués dans le domaine de l’ingénierie de l’information qui couvre la modélisation, la structuration, l’extraction, la recherche et la fouille d’informations de tous types : structurée sous forme de donnée, semi-structurée ou non structurée sous forme de texte, d’image, de son, ...etc. Le symposium SIIM cible un public de jeunes chercheurs, chercheurs et industriels impliqués dans le domaine de l’usage de l’information médicale depuis sa production jusqu’à sa valorisation. Programme : -------------------- Pour plus de détails sur le programme : http://www.irit.fr/SIIM/2013/programme.php Thèmes ---------- - Terminologies et Ontologies médicales : Interopérabilité des systèmes d’information en santé, indexation terminologique de la littérature médicale, de dossiers médicaux de patients et de récits cliniques, annotations de documents, formalismes de représentation, alignement d’ontologies et de terminologies. - Usage du Web 2.0 en santé : Réseaux collaboratifs des praticiens de santé, patients et famille, réseaux bibliographiques dans le domaine médical, annotation sociale de ressources médicales. - Traitement d'informations multimodales : Traitement du texte, image et son, classification et intégration de contenus médicaux multimodaux, multi-sources - Extraction de l’information et de connaissances à partir de contenus médicaux : Anonymisation, extraction d’entités nommées, de variable et/ou indicateurs pathologiques, recherche de corrélations, fouille de données - Systèmes d'informations en santé : Représentation, traitement et accès aux informations et des connaissances en santé, systèmes d’information décisionnels de santé, gestion des dossiers médicaux de patients, personnalisation et santé Inscriptions : --------------------- Cette année, l'édition de SIIM est intégrée au sein de la plateforme de l'Intelligence Artificielle, les inscriptions sont donc centralisées. Pour plus de détails : http://pfia2013.univ-lille1.fr/ Organisateurs: ------------------- TAMINE LECHANI Lynda, IRIT, Toulouse SOUALMIA Lina, LITIS, Rouen Comité d'initiative : ---------------------- CHARLET Jean Charlet, ICS, INSERM, Paris JAULENT Marie-Christine, ICS, INSERM, Paris LUENGO Vanda, LIG, Grenoble SOUALMIA Lina, LITIS, Rouen SOUF Nathalie, IRIT, Toulouse TAMINE LECHANI Lynda, IRIT, Toulouse Comité de Programme : --------------------------- Brigitte Grau, LIMSI, Paris Orsay Catherine Berrut, LIG, Grenoble Fleur Mougin, ISPED, Université Bordeaux 2 Jean Charlet, ICS, INSERM, Paris Lina Soualmia, LITIS, Rouen Lynda Tamine Lechani, IRIT, Toulouse Marie-Christine Jaulent, ICS, INSERM, Paris Natalia Grabar, STL, Lille Nathalie Souf, IRIT, Toulouse Sandra Bringay, LIRMM, Université Montpellier 2 Vanda Luengo, LIG, Grenoble Pierre Zweigenbaum, LIMSI, Paris Orsay ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:46:47 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:46:47 +0200 Subject: Appel: revue TAL - Note de lecture (DEBAISIEUX) Message-ID: Date: Tue, 25 Jun 2013 10:52:20 +0200 (CEST) From: Denis Maurel Message-ID: <1051527772.19943070.1372150340205.JavaMail.root at mail10> La revue TAL publie régulièrement des notes de lecture. Nous recherchons un collègue souhaitant lire le livre: "Jeanne-Marie DEBAISIEUX. Analyses linguistiques sur corpus. Subordination et insubordination en français. Hermès-Lavoisier. 2013. 503 pages" et prêt à en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoyé gracieusement en échange du service rendu). Cette note de lecture doit être rédigée en français (trois pages maximum, au format de la revue) et envoyée fin août 2013. D'autres compte-rendu sont possibles si vous avez lu récemment un ouvrage qui vous a intéressé et si vous êtes prêt à partager votre lecture avec la communauté... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:52:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:52:55 +0200 Subject: These: ERRATUM, Soutenance Enrique Henestroza Anguiano a 14h30 et pas 15h Message-ID: Date: Tue, 25 Jun 2013 19:29:10 +0200 From: Enrique Henestroza Anguiano Message-ID: Bonjour, Veuillez noter qu'une erreur s'est glissée dans mon annonce : la soutenance de ma thèse débutera à *14h30* et pas 15h le 27 juin. Je vous prie de m'excuser pour la gêne occasionnée. Enrique ------------------------------------------------------------------------ Bonjour, J'ai le plaisir de vous inviter à ma soutenance de thèse, qui s'intitule : "Efficient Large-Context Dependency Parsing and Correction with Distributional Lexical Resources". La soutenance aura lieu le jeudi 27 juin, à 15h, en salle 147 (1er étage) du bâtiment Olympe de Gouges 8 rue Albert Einstein, 75013 Paris de l'Université Paris Diderot. Vous êtes également cordialement invités au pot qui suivra. Bien cordialement, Enrique Henestroza Anguiano ----- Composition du jury : Bernd Bohnet, University of Birmingham (examinateur) Marie Candito, Université Paris Diderot (co-directrice de thèse) Matthieu Constant, Université Paris-Est (rapporteur) Laurence Danlos, Université Paris Diderot (directrice de thèse) Alexis Nasr, Université Aix Marseille (co-directeur de thèse) Joakim Nivre, Uppsala University (rapporteur) ----- Résumé : Cette thèse présente des méthodes pour améliorer l'analyse syntaxique probabiliste en dépendances. Nous employons l'analyse à base de transitions avec une modélisation effectuée par des machines à vecteurs supports (Cortes and Vapnik, 1995), et nos expériences sont réalisées sur le français. L'analyse a base de transitions est rapide, de par la faible complexité des algorithmes sous-jacents, eux mêmes fondés sur une optimisation locale des décisions d'attachement. Ainsi notre premier fil directeur est d'élargir le contexte syntaxique utilisé. Partant du système de transitions arc-eager (Nivre, 2008), nous proposons une variante qui considère simultanément plusieurs gouverneurs candidats pour les attachements à droite. Nous testons aussi la correction des analyses, inspirée par Hall and Novák (2005), qui révise chaque attachement en choisissant parmi plusieurs gouverneurs alternatifs dans le voisinage syntaxique. Nos approches améliorent légèrement la précision globale ainsi que celles de l'attachement des groupes prépositionnels et de la coordination. Notre deuxième fil explore des approches semi-supervisées. Nous testons l'auto-entrainement avec un analyseur en deux étapes, basé sur McClosky et al. (2006), pour le domaine journalistique ainsi que pour l'adaptation au domaine médical. Nous passons ensuite à la modélisation lexicale à base de corpus, avec des classes lexicales généralisées pour réduire la dispersion des données, et des préférences lexicales de l'attachement des groupes prépositionnels pour aider à la désambiguïsation. Nos approches améliorent dans certains cas la précision et la couverture de l'analyseur, sans augmenter sa complexité théorique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:51:43 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:51:43 +0200 Subject: Job: Research Fellow, Computational / Corpus Linguistics, University of University of Nottingham Message-ID: Date: Tue, 25 Jun 2013 11:43:21 +0000 From: "Rayson, Paul" Message-ID: <7D5C3FC73E33024E9EF70607229B05CC4871CD at EX-0-MB1.lancs.local> X-url: http://www.nottingham.ac.uk/cral X-url: http://www.nottingham.ac.uk/jobs/currentvacancies/ref/ARTS12705 ***** Research Fellow (fixed-term), 2 years, University of Nottingham, UK Closing date: Tuesday, 16th July 2013 Salary: £27854 to £36298 per annum, depending on skills and experience, salary progression beyond this scale is subject to performance The Research Fellow will be part of the AHRC-funded project 'CLiC Dickens characterisation in the representation of speech and body language from a corpus stylistic perspective' under the direction of Professor Michaela Mahlberg and Professor Peter Stockwell. The post will be based in the Centre for Research in Applied Linguistics within the School of English (http://www.nottingham.ac.uk/cral). Candidates should have a first degree (or equivalent) in computer science, linguistics, language and literature, or other subject as appropriate and a PhD (or equivalent) in corpus linguistics (with emphasis on programming), computational linguistics or other subject as appropriate. They should also be able to demonstrate programming experience, experience in the development of (interactive) web interfaces and an interest in corpus linguistics and literature. The project will build on previous research that developed a prototype of the search program CLiC (Corpus Linguistics in Cheshire). The post holder will be responsible for the technical development of CLiC, assist Professor Mahlberg and Professor Stockwell with analytical tasks (with the aim to produce co-authored publications), act as main contact for an international end-user panel and will be involved in impact activities. The successful candidate will receive an induction that includes contributions from the University¹s Web Technologies team. The interview process will include a short presentation on a task relevant to the post, and a formal interview. Informal enquiries may be addressed to Michaela Mahlberg (michaela.mahlberg at nottingham.ac.uk) Please note that applications sent directly to this email address will not be accepted. For further information please visit http://www.nottingham.ac.uk/jobs/currentvacancies/ref/ARTS12705 Date for interviews: Wed 24 July 2013 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:18:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:18:24 +0200 Subject: Ecole: SSTiC 2013, Tarragona, Spain, July 22-26, 2013 Message-ID: Date: Sat, 29 Jun 2013 16:51:54 +0200 From: "GRLMC" Message-ID: <9B7583D41ABC4212B1FFE856677A2B8D at Carlos1> X-url: http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* 2013 INTERNATIONAL SUMMER SCHOOL ON TRENDS IN COMPUTING SSTiC 2013 Tarragona, Spain July 22-26, 2013 Organized by Rovira i Virgili University http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* AIM: SSTiC 2013 will be an open forum for the convergence of top class well recognized computer scientists and people at the beginning of their research career (typically PhD students) as well as consolidated researchers. SSTiC 2013 will cover the whole spectrum of computer science by means of 54 six-hour courses dealing with hot topics at the frontiers of the field. By actively participating, lecturers and attendees will share the idea of scientific excellence as the main motto of their research work. ADDRESSED TO: Graduate students from around the world. There are no pre-requisites in terms of the academic degree the attendee must hold. However, since there will be several levels among the courses, in the description of some of them reference may be made to specific knowledge background. SSTiC 2013 is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. Finally, senior researchers will find it fruitful to listen and discuss with people who are main references of the diverse branches of computing nowadays. REGIME: 6 parallel sessions will be held during the whole event. Participants will be able to freely choose the courses they will be willing to attend as well as to move from one to another. VENUE: Campus Catalunya Universitat Rovira i Virgili Av. Catalunya, 35 43002 Tarragona COURSES AND PROFESSORS: Shun-ichi Amari (Riken) [introductory] Information Geometry and Its Applications James Anderson (Chapel Hill) [intermediate] Scheduling and Synchronization in Real-Time Multicore Systems Pierre Baldi (Irvine) [intermediate] Big Data Informatics Challenges and Opportunities in the Life Sciences Yoshua Bengio (Montréal) [introductory/intermediate] Deep Learning of Representations Stephen Brewster (Glasgow) [advanced] Multimodal Human-Computer Interaction Bruno Buchberger (Linz) [introductory] Groebner Bases: An Algorithmic Method for Multivariate Polynomial Systems. Foundations and Applications Rajkumar Buyya (Melbourne) [intermediate] Cloud Computing Jan Camenisch (IBM Zurich) [intermediate] Cryptography for Privacy Larry S. Davis (College Park) [intermediate] Video Analysis of Human Activities Paul De Bra (Eindhoven) [intermediate] Adaptive Systems Paul Dourish (Irvine) [introductory] Ubiquitous Computing in a Social Context Max J. Egenhofer (Maine) [introductory/intermediate] Qualitative Spatial Relations: Formalizations and Inferences Richard M. Fujimoto (Georgia Tech) [introductory] Parallel and Distributed Simulation David Garlan (Carnegie Mellon) [advanced] Software Architecture: Past, Present and Future Mario Gerla (Los Angeles) [intermediate] Vehicle Cloud Computing Ralph Grishman (New York) [intermediate] Information Extraction from Natural Language Francisco Herrera (Granada) [intermediate] Imbalanced Classification: Current Approaches and Open Problems Paul Hudak (Yale) [introductory] Euterpea: From Signals to Symphonies Using Haskell Niraj K. Jha (Princeton) [intermediate] FinFET Circuit Design George Karypis (Minnesota) [introductory] Introduction to Parallel Computing: Architectures, Algorithms, and Programming Aggelos K. Katsaggelos (Northwestern) [intermediate/advanced] Sparsity-based Advances in Image Processing Arie E. Kaufman (Stony Brook) [advanced] Advances in Visualization Hugo Krawczyk (IBM Research) [intermediate] An Introduction to the Design and Analysis of Authenticated Key Exchange Protocols Pierre L'Ecuyer (Montréal) [intermediate] Quasi-Monte Carlo Methods in Simulation: Theory and Practice Laks Lakshmanan (British Columbia) [intermediate/advanced] Information and Influence Spread in Social Networks Wenke Lee (Georgia Tech) [introductory] DNS-based Monitoring of Malware Activities Maurizio Lenzerini (Roma La Sapienza) [intermediate] Ontology-based Data Integration Ming C. Lin (Chapel Hill) [introductory/intermediate] Physically-based Modeling and Simulation Jane W.S. Liu (Academia Sinica) [intermediate] Critical Information and Communication Technologies for Disaster Preparedness and Response Satoru Miyano (Tokyo) [intermediate] How to Hack Cancer Systems with Computational Methods Aloysius K. Mok (Austin) [intermediate] From Real-time Systems to Cyber-physical Systems Hermann Ney (Aachen) [intermediate/advanced] Probabilistic Modelling for Natural Language Processing - with Applications to Speech Recognition, Handwriting Recognition and Machine Translation Cathleen A. Norris (North Texas) & Elliot Soloway (Ann Arbor) [introductory] Primary & Secondary Educational Computing in the Age of Mobilism Jeff Offutt (George Mason) [intermediate] Cutting Edge Research in Engineering of Web Applications Bijan Parsia (Manchester) [introductory] The Semantic Web: Conceptual and Technical Foundations Charles E. Perkins (FutureWei) [intermediate/advanced] Beyond 4G Prabhakar Raghavan (Google) [introductory/intermediate] Web Search and Advertising Phillip Rogaway (Davis) [introductory/intermediate] Provably Secure Symmetric Encryption Gustavo Rossi (La Plata) [intermediate] Topics in Model Driven Web Engineering Kaushik Roy (Purdue) [introductory/intermediate] Low-energy Computing Robert Sargent (Syracuse) [introductory] Validating Models Douglas C. Schmidt (Vanderbilt) [intermediate] Patterns and Frameworks for Concurrent and Networked Software Bart Selman (Cornell) [intermediate] Fast Large-scale Probabilistic and Logical Inference Methods Mubarak Shah (Central Florida) [intermediate/advanced] Visual Crowd Surveillance Ron Shamir (Tel Aviv) [introductory] Revealing Structure in Disease Regulation and Networks Dawn Xiaodong Song (Berkeley) [introductory] Selected Topics in Computer Security Mike Thelwall (Wolverhampton) [introductory] Sentiment Strength Detection for the Social Web Julita Vassileva (Saskatchewan) [introductory/intermediate] Engaging Users in Social Computing Systems Philip Wadler (Edinburgh) [introductory] Topics in Lambda Calculus and Life Yao Wang (Polytechnic New York) [introductory/advanced] Video Compression: Fundamentals and Recent Development Gio Wiederhold (Stanford) [introductory] Software Economics: How Do the Results of the Intellectual Efforts Enter the Global Market Place Limsoon Wong (National Singapore) [introductory/intermediate] The Use of Context in Gene Expression and Proteomic Profile Analysis Michael Wooldridge (Oxford) [introductory] Autonomous Agents and Multi-Agent Systems Ronald R. Yager (Iona) [introductory/intermediate] Fuzzy Sets and Soft Computing Philip S. Yu (Illinois Chicago) [advanced] Mining Big Data REGISTRATION: It has to be done at http://grammars.grlmc.com/SSTiC2013/Registration.php Since the capacity of the venue is limited, registration requests will be processed on a first come first served basis. The registration period will be closed when the capacity of the venue will be complete. It is highly convenient to register prior to the event. FEES: Fees may be for the whole week (full-time participant) or per blocks of days (part-time participant). They are a flat rate allowing one to attend all courses within the time window set: 5, 4, 3 or 2 days. Fees vary depending on the deadline. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Participants will be delivered a certificate of attendance. QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat POSTAL ADDRESS: SSTiC 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Departament d’Economia i Coneixement, Generalitat de Catalunya Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:27:43 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:27:43 +0200 Subject: Job: Post-doctorat en TALN, Orange Message-ID: Date: Thu, 27 Jun 2013 08:22:08 +0000 From: Message-ID: <5455_1372321329_51CBF631_5455_2314_1_6A3EA12B995B52459CDFCEFF0835C6B10AF9B1 at PEXCVZYM12.corporate.adroot.infra.ftgroup> Chers collègues, Orange propose actuellement un post-doctorat. Merci de consulter l'offre ci-dessou et, le cas échéant, de postuler auprès de moi et de laurent.roussarie at orange.com, Cordialement, Romain Laroche ft/nsm/rd/tech/asap/nadia Ingénieur de recherche sur les systèmes de dialogue Research engineer on dialogue systems phone: 01 45 29 62 77 romain.laroche at orange-ftgroup.com ------------------------------------------------------------------------ Méthodes d'analyse sémantique statistique pour l'extraction de connaissances à partir de corpus semi-annotés Mots clefs : Analyse sémantique, Apprentissage actif, Interaction Homme-Machine, Dialogue naturel Contexte : Le sujet de post-doctorat se rapporte à la problématique de l'analyse sémantique dans les systèmes dialogue en général. L'analyse sémantique consiste à transformer un énoncé dans une interprétation (catégorie sémantique) pour permettre au système de dialogue de poursuivre ses calculs. L'analyseur sémantique de Disserto s'appuie sur une approche à base de règles. Le traitement s'effectue en deux étapes : étiqueter les mots en « tags », puis appliquer les règles sémantiques appropriées aux tags, de telle manière qu'une combinaison ou association donnée de tags fournisse une interprétation correcte. Ce principe d'analyse sémantique à base de règles d'étiquetage et d'association peut être utilisé dans n'importe quelle langue. Cependant, cette méthode est manuelle et nécessite l'intervention d'un développeur (knowledge engineer). Ce dernier va analyser un corpus de phrases issues d'interactions de différents utilisateurs avec le service de dialogue, afin d'élaborer les règles d'analyse sémantiques les plus pertinentes. Les phrases contenues dans ce type de corpus peuvent être : - non annotées (par exemple lorsqu'elles sont issues des logs d'un service en exploitation) - annotées manuellement par un opérateur : par exemple dans le cas de service mettant en œuvre des fonctions de magicien d'Oz sur la reconnaissance vocale (on parle alors de Reconnaissance Vocal Assistée par Opérateur) ou sur l'analyse sémantique (illustrée dans l'application DissertOz). Le rôle du post-doctorant sera de développer de nouveaux algorithmes et de fournir les outils associés qui permettent de faciliter et d'optimiser le travail du développeur lors de l'élaboration des règles d'analyse sémantique de Disserto. ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:41:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:41:37 +0200 Subject: Appel: Revue TAL, TAL et les reseaux sociaux Message-ID: Date: Fri, 28 Jun 2013 14:36:28 -0400 From: "Atefeh Farzindar" Message-ID: <008c01ce742e$66ec4180$34c4c480$@nlptechnologies.ca> X-url: http://www.nlptechnologies.ca/fr/TAL-reseaux-sociaux X-url: http://www.nlptechnologies.ca/en/TAL-Social-media Appel à proposition d’articles pour un numéro spécial de la revue scientifique internationale traitement automatique du langage naturel pour l'analyse des réseaux sociaux http://www.nlptechnologies.ca/fr/TAL-reseaux-sociaux La revue TAL et les réseaux sociaux 2013 – Volume 54, Numéro 3 Appel à proposition d’articles Les réseaux sociaux, structures dynamiques formées d'individus et/ou d'organisations, ont toujours joué un rôle majeur dans nos sociétés. Ils se sont développés et diversifiés avec le Web 2.0. qui ouvre la possibilité aux utilisateurs de créer et de partager du contenu par l'intermédiaire de multiples plates-formes (blogs, micro-blogs, wikis, sites de partage, etc.). Dans ce contexte, le volume sans précédent des données textuelles, leur variété ainsi que le réseau d'interaction des utilisateurs représentent de nouvelles opportunités pour la compréhension du comportement social. L'étude des messages échangés constitue un nouveau défi pour le Traitement Automatique des Langues. Dans ce cadre, il est intéressant de discuter la robustesse des méthodes de TAL (analyseurs morpho-syntaxiques, systèmes d'extraction de la terminologie et d'entités nommées, etc.) sur ces données. Dans ce numéro spécial, de nouvelles approches pourront être présentées dans le but d'analyser ces données textuelles massives, souvent bruitées et hétérogènes issues des réseaux sociaux. Dates importantes Soumission des résumés : 15 octobre 2013 Soumission des articles : 29 octobre 2013 Éditeurs Invités : Atefeh Farzindar, NLP Technologies et Université de Montréal, Canada Mathieu Roche, LIRMM (CNRS, Université Montpellier 2) et TETIS (Cirad, Irstea, AgroParisTech), France Pour plus d'information SVP visiter : http://www.nlptechnologies.ca/fr/TAL-reseaux-sociaux ------------------------------------------------------------------------ Call for papers for a special issue of TAL, an international journal, on natural language processing for social media analysis http://www.nlptechnologies.ca/en/TAL-Social-media TAL journal and social networks 2013 – Volume 54, Number 3 Call for papers Social networks, dynamic structures comprised of individuals or organizations, have always played a major role in our societies. They have evolved and diversified with the Web 2.0, which offers users the possibility to create and share content through multiple platforms (blogs, micro-blogs, wikis, sharing sites, etc.). In this environment, the unprecedented volume and variety of textual data as well as the users’ interaction network give rise to new opportunities to better understand social behavior. The study of messages exchanged represents a new challenge in Natural Language Processing. In this context, it becomes interesting to discuss the strength of NLP methods (morphosyntactic analysers, systems of term extraction and of named entity recognition, etc.) on this data. In this special issue, new approaches will be presented for the purpose of analysing this massive, heterogeneous and usually noisy textual data coming from social networks. Guest Editors: Atefeh Farzindar, NLP Technologies and Université de Montréal, Canada Mathieu Roche, LIRMM (CNRS, Montpellier 2 University) and TETIS (Cirad, Irstea, AgroParisTech), France Important dates Submission of abstracts: October 15, 2013 Submission of articles: October 29, 2013 For further information please visit : http://www.nlptechnologies.ca/en/TAL-Social-media ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:21:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:21:37 +0200 Subject: Job: Open position, Project Manager in Speech and Multimodal Technologies, ELDA Message-ID: Date: Wed, 26 Jun 2013 12:54:49 +0200 From: ELRA ELDA Information Message-ID: <51CAC879.3030402 at elda.org> X-url: http://www.elda.org X-url: http://www.elra.info The European Language resources Distribution Agency (ELDA), a company specialized in Human Language Technologies within an international context, acting as the distribution agency of the European Language Resources Association (ELRA), is currently seeking to fill an immediate vacancy for Technical Engineer/Scientist (Project Manager) position, specialized in Speech and Multimodal technologies. *Technical Engineer / Scientist (Project Manager) in Speech and Multimodal Technologies* Under the supervision of the CEO, the responsibilities of the Technical Engineer/Scientist include designing/specifying language resources, setting up production frameworks and platforms, carrying out quality control and assessment. He/she will be in charge of renovating the current language resources production workflows. This yields excellent opportunities for young, creative, and motivated candidates wishing to participate actively to the Language Engineering field. He/she will be in charge of conducting the activities related to language resources and Natural Language Processing technologies. The task will mostly consist in managing language resources production projects and co-ordinating ELDA's participation in R&D projects while being also hands-on whenever required by the development team. Profile : * PhD in computer science, speech, audiovisual/multimodal technologies * Experience and/or good knowledge in speech data collection, expertise in phonetics, transcription tools * Experience in speech recognition, synthesis, speaker ID and the well-used packages (e.g., HTK, Julius, ...) and the tools to produce, collect and assess quality of resources and datasets * Experience and/or good knowledge of the Language Technology area * Experience with technology transfer projects, industrial projects, collaborative projects within the European Commission or other international frameworks * Ability to work independently and as part of a team, in particular the ability to supervise members of a multidisciplinary team * Dynamic and communicative, flexible to combine and work on different tasks * Good knowledge of Linux and open source software * Proficiency in C++, PhP, Java, Django is a plus * Proficiency in French and English * Citizenship of (or residency papers) a European Union country Applications will be considered until the position is filled. The position is based in Paris. Salary : Commensurate with qualifications and experience. Applicants should email a cover letter addressing the points listed above together with a curriculum vitae to : Khalid Choukri ELRA / ELDA 55-57, rue Brillat-Savarin 75013 Paris FRANCE Fax : 01 43 13 33 30 Mail : job at elda.org ELRA was established in February 1995, with the support of the European Commission, to promote the development and exploitation of Language Resources (LRs). Language Resources include all data necessary for language engineering, such as monolingual and multilingual lexica, text corpora, speech databases and terminology. The role of this non-profit membership Association is to promote the production of LRs, to collect and to validate them and, foremost, make them available to users. The association also gathers information on market needs and trends. For further information about ELDA/ELRA, visit : http://www.elda.org http://www.elra.info ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:24:43 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:24:43 +0200 Subject: Livre: Bender, Linguistic Fundamentals for NLP: 100 Essentials from Morphology and Syntax Message-ID: Date: Wed, 26 Jun 2013 12:12:43 -0400 From: Graeme Hirst Message-Id: <026AB355-7C06-4C6D-94C3-68D2AAC6D695 at cs.toronto.edu> X-url: http://www.morganclaypool.com/doi/abs/10.2200/S00493ED1V01Y201303HLT020 BOOK ANNOUNCEMENT Linguistic Fundamentals for Natural Language Processing: 100 Essentials from Morphology and Syntax by Emily M. Bender, University of Washington Synthesis Lectures on Human Language Technologies #20 (Morgan & Claypool Publishers), 2013, 184 pages Abstract Many NLP tasks have at their core a subtask of extracting the dependencies -- who did what to whom -- from natural language sentences. This task can be understood as the inverse of the problem solved in different ways by diverse human languages, namely, how to indicate the relationship between different parts of a sentence. Understanding how languages solve the problem can be extremely useful in both feature design and error analysis in the application of machine learning to NLP. Likewise, understanding cross-linguistic variation can be important for the design of MT systems and other multilingual applications. The purpose of this book is to present in a succinct and accessible fashion information about the morphological and syntactic structure of human languages that can be useful in creating more linguistically sophisticated, more language-independent, and thus more successful NLP systems. Table of Contents: Acknowledgments / Introduction/motivation / Morphology: Introduction / Morphophonology / Morphosyntax / Syntax: Introduction / Parts of speech / Heads, arguments, and adjuncts / Argument types and grammatical functions / Mismatches between syntactic position and semantic roles / Resources / Bibliography / Author's Biography / General Index / Index of Languages http://www.morganclaypool.com/doi/abs/10.2200/S00493ED1V01Y201303HLT020 This title is available online without charge to members of institutions that have licensed the Synthesis Digital Library of Engineering and Computer Science. Members of licensing institutions have unlimited access to download, save, and print the PDF without restriction; use of the book as a course text is encouraged. To find out whether your institution is a subscriber, visit http://www.morganclaypool.com/page/licensed, or just click on the book's URL above from an institutional IP address and attempt to download the PDF. Others may purchase the book from this URL as a PDF download for US$30 or in print for US$40. Printed copies are also available from Amazon and from booksellers worldwide at approximately US$45 or local currency equivalent. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:22:52 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:22:52 +0200 Subject: Livre: S=?ISO-8859-1?Q?=F8gaard=2C_?=Semi-Supervised Learning and Domain Adaptation in NLP Message-ID: Date: Wed, 26 Jun 2013 12:10:14 -0400 From: Graeme Hirst Message-Id: X-url: http://www.morganclaypool.com/doi/abs/10.2200/S00497ED1V01Y201304HLT021 BOOK ANNOUNCEMENT Semi-Supervised Learning and Domain Adaptation in Natural Language Processing by Anders Søgaard, University of Copenhagen Synthesis Lectures on Human Language Technologies #21 (Morgan & Claypool Publishers), 2013, x+93 pages Abstract This book introduces basic supervised learning algorithms applicable to natural language processing (NLP) and shows how the performance of these algorithms can often be improved by exploiting the marginal distribution of large amounts of unlabeled data. One reason for that is data sparsity, i.e., the limited amounts of data we have available in NLP. However, in most real-world NLP applications our labeled data is also heavily biased. This book introduces extensions of supervised learning algorithms to cope with data sparsity and different kinds of sampling bias. This book is intended to be both readable by first-year students and interesting to the expert audience. My intention was to introduce what is necessary to appreciate the major challenges we face in contemporary NLP related to data sparsity and sampling bias, without wasting too much time on details about supervised learning algorithms or particular NLP applications. I use text classification, part-of-speech tagging, and dependency parsing as running examples, and limit myself to a small set of cardinal learning algorithms. I have worried less about theoretical guarantees ("this algorithm never does too badly") than about useful rules of thumb ("in this case this algorithm may perform really well"). In NLP, data is so noisy, biased, and non-stationary that few theoretical guarantees can be established and we are typically left with our gut feelings and a catalogue of crazy ideas. I hope this book will provide its readers with both. Throughout the book we include snippets of Python code and empirical evaluations, when relevant. Table of Contents: Introduction / Supervised and Unsupervised Prediction / Semi-Supervised Learning / Learning under Bias / Learning under Unknown Bias / Evaluating under Bias http://www.morganclaypool.com/doi/abs/10.2200/S00497ED1V01Y201304HLT021 This title is available online without charge to members of institutions that have licensed the Synthesis Digital Library of Engineering and Computer Science. Members of licensing institutions have unlimited access to download, save, and print the PDF without restriction; use of the book as a course text is encouraged. To find out whether your institution is a subscriber, visit http://www.morganclaypool.com/page/licensed, or just click on the book's URL above from an institutional IP address and attempt to download the PDF. Others may purchase the book from this URL as a PDF download for US$30 or in print for US$40. Printed copies are also available from Amazon and from booksellers worldwide at approximately US$45 or local currency equivalent. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:23:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:23:48 +0200 Subject: Livre: Nastase et al, Semantic Relations Between Nominals Message-ID: Date: Wed, 26 Jun 2013 12:11:25 -0400 From: Graeme Hirst Message-Id: <6194FBE2-322E-4048-9084-9DEFAFC6C3C6 at cs.toronto.edu> X-url: http://www.morganclaypool.com/doi/abs/10.2200/S00489ED1V01Y201303HLT019 BOOK ANNOUNCEMENT Semantic Relations Between Nominals by Vivi Nastase, FBK, Trento, Italy Preslav Nakov, QCRI, Qatar Foundation Diarmuid Ó Séaghdha, Computer Laboratory, University of Cambridge, UK Stan Szpakowicz, EECS, University of Ottawa and ICS, Polish Academy of Sciences Synthesis Lectures on Human Language Technologies #19 (Morgan & Claypool Publishers), 2013, 119 pages Abstract People make sense of a text by identifying the semantic relations which connect the entities or concepts described by that text. A system which aspires to human-like performance must also be equipped to identify, and learn from, semantic relations in the texts it processes. Understanding even a simple sentence such as "Opportunity and Curiosity find similar rocks on Mars" requires recognizing relations (rocks are located on Mars, signalled by the word on) and drawing on already known relations (Opportunity and Curiosity are instances of the class of Mars rovers). A language-understanding system should be able to find such relations in documents and progressively build a knowledge base or even an ontology. Resources of this kind assist continuous learning and other advanced language-processing tasks such as text summarization, question answering and machine translation. The book discusses the recognition in text of semantic relations which capture interactions between base noun phrases. After a brief historical background, we introduce a range of relation inventories of varying granularity, which have been proposed by computational linguists. There is also variation in the scale at which systems operate, from snippets all the way to the whole Web, and in the techniques of recognizing relations in texts, from full supervision through weak or distant supervision to self-supervised or completely unsupervised methods. A discussion of supervised learning covers available datasets, feature sets which describe relation instances, and successful algorithms. An overview of weakly supervised and unsupervised learning zooms in on the acquisition of relations from large corpora with hardly any annotated data. We show how bootstrapping from seed examples or patterns scales up to very large text collections on the Web. We also present machine learning techniques in which data redundancy and variability lead to fast and reliable relation extraction. Table of Contents: Introduction / Relations between Nominals, Relations between Concepts / Extracting Semantic Relations with Supervision / Extracting Semantic Relations with Little or No Supervision / Conclusion http://www.morganclaypool.com/doi/abs/10.2200/S00489ED1V01Y201303HLT019 This title is available online without charge to members of institutions that have licensed the Synthesis Digital Library of Engineering and Computer Science. Members of licensing institutions have unlimited access to download, save, and print the PDF without restriction; use of the book as a course text is encouraged. To find out whether your institution is a subscriber, visit http://www.morganclaypool.com/page/licensed, or just click on the book's URL above from an institutional IP address and attempt to download the PDF. Others may purchase the book from this URL as a PDF download for US$30 or in print for US$40. Printed copies are also available from Amazon and from booksellers worldwide at approximately US$45 or local currency equivalent. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:30:50 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:30:50 +0200 Subject: Appel: Final call for demonstrations, SIGDIAL 2013 Conference Message-ID: Date: Thu, 27 Jun 2013 14:44:34 +0000 From: "Jason Williams (MSR)" Message-ID: X-url: http://www.sigdial.org/workshops/conference14/ SIGDIAL 2013 CONFERENCE 14th Annual Meeting of the Special Interest Group on Discourse and Dialogue http://www.sigdial.org/workshops/conference14/ Metz, France 22-24 August 2013 CALL FOR DEMONSTRATIONS The program committee of SigDial 2013 welcomes the submission of demonstration descriptions. Demonstrations will be presented in special sessions, separate from short paper presentations and poster sessions. Accepted demonstration submissions will be published in a dedicated section of the conference proceedings. Demo descriptions should be no longer than 3 pages, including references. Demo submissions should follow the two-column ACL 2013 format. We strongly recommend the use of ACL LaTeX style files or Microsoft Word style files tailored for the ACL 2013 conference. Submissions must conform to the official ACL 2013 style guidelines (http://acl2013.org/site/call.html), and they must be electronic in PDF. Submissions will not be anonymous. Demonstrations which have appeared (or will appear) elsewhere may be presented at SigDial, although this should be noted at the time of submission. Authors are encouraged to submit additional supportive material such as video clips or sound clips and examples of available resources for review purposes. Submission is electronic using paper submission software at https://www.softconf.com/d/sigdial2013/ IMPORTANT DATES Demo Paper Submission Deadline Tuesday, 2 July 2013 (23:59, GMT-11) Demo Paper Notification Wednesday, 10 July 2013 Final Demo Paper Due Wednesday, 24 July 2013 Conference Thursday-Saturday, 22-24 August 2013 (Thu morning - Saturday mid-day) Any questions regarding submissions can be sent to the technical program co-chairs at program-chairs[at]sigdial.org. SigdDial 2013 Technical Program Co-Chairs Barbara Di Eugenio, University of Illinois at Chicago, USA Jason D. Williams, Microsoft Research, USA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:47:51 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:47:51 +0200 Subject: Appel: L'annotation de la subjectivite langagiere Message-ID: Date: Sun, 30 Jun 2013 19:18:35 +0200 From: Agata Jackiewicz Message-ID: <35818286b57dc441a7cf797851cdc713 at bore.paris-sorbonne.fr> APPEL À COMMUNICATIONS Journée d'Etude L'annotation de la subjectivité langagière Méthodes, Modélisation, Outils, Retours d'expérience 3 octobre 2013 Maison de la Recherche, Université Paris-Sorbonne, 28 rue Serpente 75006 Paris Fédération de recherche ILF (Institut de la Langue Française) Consortium Corpus Ecrits, Groupe de travail Annotation de haut niveau Depuis quelques années, le thème de la recherche d'informations dans de très grands corpus et sur le WEB, tout particulièrement dans le domaine de l'expression des émotions et des opinions (sentiment analysis), intéresse de nombreux spécialistes tant dans le domaine des sciences du langage que dans celui des industries de la langue. D'autre part, le consortium Corpus Ecrits de l'ILF est impliqué dans un projet de création d'un grand corpus de référence du français. C'est dans ce contexte que s'inscrit la journée d'étude du Groupe de travail Annotation de haut niveau (consortium Corpus Ecrits de l'ILF) du 3 octobre 2013. Elle sera l'occasion de cibler plus particulièrement le thème de l'annotation de la subjectivité langagière, en vue d'un tour d'horizon des premiers résultats obtenus et des travaux en cours. Les études visées pourront porter sur : - la linguistique des émotions et des sentiments - la linguistique des opinions - les phénomènes énonciatifs relevant de l'expression de la subjectivité - ou de manière plus ciblée, sur les aspects et les facettes des jugements évaluatifs : point de vue (engagement, prise en charge), polarité, intensité, identité, etc. La problématique de l'annotation peut être abordée selon les perspectives suivantes : - la modélisation linguistique et informatique de la subjectivité langagière - l'expression en langue et en discours - la construction, l'acquisition et la validation des ressources linguistiques (dictionnaires, corpus...) - les méthodes et les outils pour identifier, annoter et extraire opinions et sentiments dans des documents textuels ou audiovisuels - la présentation synthétique de la diversité des contenus subjectifs. L'annotation des données langagières soulève de nombreuses questions, touchant par exemple à la nature de l'objet à annoter (notion, forme, structure), au choix des corpus et des stratégies d'annotation (manuelle ou automatique), à la délimitation des phénomènes à annoter, à la gestion des cas particuliers, aux compétences des annotateurs (naïfs ou experts). Il s'agira de déterminer comment les travaux actuels sur la subjectivité se saisissent de ces questions, et quelles réponses ils apportent. TYPES DE COMMUNICATION Les auteurs peuvent présenter leurs travaux sous forme d'une communication orale, d'un poster ou d'une démonstration informatique. MODALITÉS DE SOUMISSION Les propositions de communications devront se présenter sous la forme d'un résumé de 2 à 3 pages, bibliographie incluse (Times New Roman 12, interligne simple). Elles comporteront les indications suivantes : - titre de la communication - auteur(s) et affiliation(s) - 4 ou 5 mots-clés - exposé de la problématique de l'étude donnant les détails pertinents (type de corpus, méthodologie, résultats, écueils et difficultés ...) - principales références bibliographiques - type de communication souhaité : présentation orale, poster, démonstration. Les propositions de communication devront être envoyées avant le 2 septembre 2013 aux adresses suivantes : Agata.Jackiewicz at paris-sorbonne.fr, denis.lepesant at orange.fr DATES IMPORTANTES - soumission des résumés : avant le 02/09/2013 - notification d'acceptation : 18/09/2012 - journée d'étude : 03/10/2013 COMITÉ D'ORGANISATION - Agata Jackiewicz (STIH, Université Paris-Sorbonne), - Denis Le Pesant (MoDyCo, Université Paris Ouest Nanterre), - Amalia Todirascu (FDT, LiLPa, Université de Strasbourg), - Agnès Tutin (Lidilem, Université Stendhal - Grenoble 3). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:36:38 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:36:38 +0200 Subject: Job: Internship Announcement (4 months), Large-Scale Socio-Semantic Corpus Indexing And Analysis Message-ID: Date: Fri, 28 Jun 2013 12:01:18 +0200 (CEST) From: Pascale Sebillot Message-ID: <717388927.3792745.1372413678721.JavaMail.root at irisa.fr> X-url: http://www.cnrs.fr/mi/spip.php?article53 X-url: http://mastodons.lip6.fr/ Internship Announcement (4 months) LARGE-SCALE SOCIO-SEMANTIC CORPUS INDEXING AND ANALYSIS CNRS MASTODONS / ARESOS ISC-PIF (Paris), LIP6 (Paris), IRISA (Rennes) In the context of the ARESOS project funded by the French national CNRS action MASTODONS (Grandes masses de données scientifiques, http://www.cnrs.fr/mi/spip.php?article53 ), we are proposing a paid internship in the area of large-scale content indexing and analysis. The covered period is 4 months from September 1st to December 31, 2013.. Participating Labs : ISC-PIF (Paris), LIP6 (Paris), IRISA (Rennes) Location : The work will be carried out at Paris and/or Rennes (open for discussion) with some short visits in the other laboratories. Funding : CNRS Mastodons ( http://mastodons.lip6.fr/ ) Contact : bernd.amann at lip6.fr Language : English and/or French Gross salary : to be defined depending on the qualification of the candidate Period : September 1st 2013 - December 31, 2013 (4 months) CONTEXT The starting point of this project is an existing platform for the phylogenetic analysis of evolving text corpora (blog, forum, bibliography) developed by David Chavalarias (CAMS/CNRS) and Jean-Philippe Cointet (INRA-SenS), who are also members of the Institut des Systèmes Complexes de Paris Ile-de-France ( http://www.iscpif.fr/ ). This platform includes several specialized tools for the extraction, indexing, clustering and alignment of contents which can be combined into complex workflows for the semantic and temporal analysis of evolving text corpora. OBJECTIVES Current workflow implementations are optimized for medium sized corpora (~300k items, ~4000 concepts). Our goal is to develop new techniques and algorithms for processing larger collections and terminologies and which allow for more interactive content analysis user interfaces: * Large-scale phylogenetic analysis of evolving corpora : we propose to explore two directions for extending the platform: 1. define and integrate new data structures and indexing methods for accessing and joining text contents; in particular, explore efficient approximation and compression techniques for reducing processing cost and data size (similarity and co-occurrence matrix). 2. study the parallelization and MapReduce implementation of some key functionalities (extraction, indexing, clustering) * Online analysis of dynamic information: The analysis workflow depends on complex temporal and semantic processing steps which might generate results which are erroneous or useless for the final user. The goal is to adapt the current workflow for following the content evolution online by incrementally updating the generated analytic data model (incrementally maintain the temporal co-occurrence matrix). We propose to study to what extent it is possible to regroup data according to the user interests and to decompose the workflow into independent processes that can be executed in parallel (MapReduce). The development of these techniques and algorithms will build on the experience of two database research teams including B. Amann, C. Constantin and H. Naacke from LIP6-UPMC ( http://www-bd.lip6.fr/ ) and D. Gross-Amblard and Z. Miklos from IRISA-Rennes ( http://people.irisa.fr/David.Gross_Amblard/ and http://people.irisa.fr/Zoltan.Miklos/ ). WORK PLAN The work to be accomplished is decomposed into several steps: 1. Problem analysis and state-of-the art 2. Detailed task specification 3. Implementation and experimentation on large corpora (WebOfScience, GlobalPulse Twitter collection) CANDIDATE PROFILE Candidates should send their CV to bernd.amann at lip6.fr . We are particularly interested in applicants holding at least a Masters diploma with some background covering one or several topics among large-scale data processing, unsupervised / semi-supervised machine learning, text mining and natural language processing (NLP). Due to the near deadline of this proposal, candidates from foreign countries should already have a work permit covering the internship period. BIBLIOGRAPHY Chavalarias D, Cointet J-P (2013) Phylomemetic Patterns in Science Evolution-The Rise and Fall of Scientific Fields. PLoS ONE 8(2): e54847. doi:10.1371/journal.pone.0054847 Kyuseok Shim. MapReduce Algorithms for Big Data Analysis, Tutorial (VLDB12, SWCW13) Richard M. C. McCreadie, Craig Macdonald, and Iadh Ounis. 2009. On single-pass indexing with MapReduce. In Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval (SIGIR '09). ACM, New York, NY, USA, 742-743. DOI=10.1145/1571941.1572106 http://doi.acm.org/10.1145/1571941.1572106 Spiros Papadimitriou and Jimeng Sun. 2008. DisCo: Distributed Co-clustering with Map-Reduce: A Case Study towards Petabyte-Scale End-to-End Mining. In Proceedings of the 2008 Eighth IEEE International Conference on Data Mining (ICDM '08). IEEE Computer Society, Washington, DC, USA, 512-521. DOI=10.1109/ICDM.2008.142 http://dx.doi.org/10.1109/ICDM.2008.142 -- Bernd Amann Université Pierre et Marie Curie LIP6 - Boite Courrier 169 4 place Jussieu 75 252 Paris cedex 05 Equipe Base de Données Bureau 25-26/506 Mél : Bernd.Amann at lip6.fr Tél : +33 (0)1 44 27 70 09 Fax : +33 (0)1 44 27 70 00 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:20:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:20:23 +0200 Subject: Info: Transparents du seminaire Alpage, Joakim Nivre, Training Deterministic Parsers Using Non-Deterministic Oracles Message-ID: Date: Fri, 28 Jun 2013 17:01:23 +0200 From: Marie Candito Message-ID: Pour info, les slides du séminaire de Joakim Nivre sont disponibles sur la page du séminaire : https://www.rocq.inria.fr/alpage-wiki/tiki-download_wiki_attachment.php?attId=3&download=y Bonne journée ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:36:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:36:37 +0200 Subject: Appel: revue TAL - Note de lecture (NASTASE) Message-ID: Date: Fri, 31 May 2013 09:05:08 +0200 (CEST) From: Denis Maurel Message-ID: <1838999710.13847508.1369983908967.JavaMail.root at mail10> La revue TAL publie r?guli?rement des notes de lecture. Nous recherchons un coll?gue souhaitant lire le livre: "Vivi NASTASE, Preslav NAKOV, Diarmuid ? S?AGHDHA, Stan SZPAKOWICZ. Semantic Relations Between Nominals. Morgan & Claypool publishers. 2013. 107 pages." et pr?t ? en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoy? gracieusement en ?change du service rendu). Cette note de lecture doit ?tre r?dig?e en fran?ais (trois pages maximum, au format de la revue) et envoy?e fin ao?t 2013. D'autres compte-rendu sont possibles si vous avez lu r?cemment un ouvrage qui vous a int?ress? et si vous ?tes pr?t ? partager votre lecture avec la communaut?... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:58:07 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:58:07 +0200 Subject: Q: Masters en industrie des langues Message-ID: Date: Fri, 31 May 2013 15:48:10 +0000 From: Message-ID: <26244_1370015291_51A8C63B_26244_333_2_ED32B5012BA99F4AA999E2765EF060F20BEBA7 at PEXCVZYM12.corporate.adroot.infra.ftgroup> Bonjour, J'essaye de recenser les masters en industries des langues en France. Si vous ?tes responsable d'un master, je vous remercie par avance de me communiquer les informations suivantes : - Universit? d'accueil et d?partement. - Sp?cialit? du master en industrie des langues. - Objectifs du master et contenu de la formation (un paragraphe). - D?bouch?s possibles. - Conditions d'entr?e. - Contact. - URL du master. Je vous remercie par avance. Malek Boualem ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:56:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:56:35 +0200 Subject: Job: Postdoc position in WSD at LIMSI-CNRS Message-ID: Date: Fri, 31 May 2013 14:50:45 +0200 From: Marianna Apidianaki Message-Id: <9BA5AF06-BBDB-4B43-9B8E-DD7DE1FD6441 at limsi.fr> X-url: http://transread.limsi.fr [apologies for cross-posting] ****************************************************************** POSTDOC POSITION IN WORD SENSE DISAMBIGUATION AT LIMSI-CNRS, Orsay (Paris area), FRANCE ****************************************************************** A postdoctoral position in Word Sense Disambiguation (WSD) is available at the LIMSI-CNRS lab. The position is funded by the national (ANR) project TransRead (http://transread.limsi.fr) aimed at developing new multilingual text processing applications and facilitating the reading of multilingual documents for foreign language readers and learners. The postdoctoral researcher will work on both data-driven and knowledge-based Word Sense Disambiguation methods exploiting information in parallel corpora and large-scale multilingual resources (such as BabelNet and Wiktionary). The disambiguation output will serve to facilitate foreign language reading by providing semantic annotations in different languages. Research results will also be exploited in other applications developed in the group, such as Machine Translation. Requirements: - Ph.D. (or completed by Fall 2013) in Computer Science, Natural Language Processing, Computational Linguistics - Solid programming skills - Experience with statistical approaches to semantics, cross-lingual methods for NLP or Statistical Machine Translation - Strong publication record - Fluent English The successful candidate will join a dynamic research team working on various aspects of Statistical Machine Translation, Word Sense Disambiguation and paraphrasing. For information regarding our activities, see http://www.limsi.fr/Scientifique/tlp/mt/ Salary: 2000 ? net per month Duration: 12 months, starting Fall or Winter 2013 Application deadline: Open until filled Interested candidates should send their CV and the names and contact information of 2 referees to Marianna Apidianaki (marianna at limsi.fr). Informal inquiries can be sent to the same address. About the LIMSI-CNRS The LIMSI-CNRS lab is situated at Orsay, a green area 25 km south of Paris. A suburban train connects Orsay to Paris city center. Detailed information about the LIMSI lab can be found at http://www.limsi.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:48:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:48:32 +0200 Subject: Appel: DICTAP2013, ICEL2013, ICEEE2013, ICIA2013, ICIEIS2013 Message-ID: Date: Fri, 31 May 2013 01:00:52 -0700 From: "The Society of Digital Information and Wireless Communications (SDIWC)" Message-ID: <71e7ff52d0023088a29ccd1d4a79675f at localhost.localdomain> Sorry for cross posting Could you please consider submitting your paper to one of these conferences. Name : The Third International Conference on Digital Information and Communication Technology and its Applications (DICTAP2013) Location : VSB-Technical University of Ostrava, Czech Republic Dates : July 8-10, 2013 URL : www.sdiwc.net Name : The Fourth International Conference on e-Learning(ICEL203) Location : VSB-Technical University of Ostrava, Czech Republic Dates : July 8-10, 2013 URL : www.sdiwc.net Name : The Second International Conference on Informatics & Applications (ICIA2013) Location : Technical University of Lodz, Poland Dates : Sept. 23-25, 2013 URL : www.sdiwc.net Name : The Second International Conference on E-Learning and E-Technologies in Education (ICEEE2013) Location : Technical University of Lodz, Poland Dates : Sept. 23-25, 2013 URL : www.sdiwc.net Name : The Second International Conference on Informatics Engineering & Information Science (ICIEIS2013) Location : Universiti Teknologi Malaysia, Kuala Lumpur, Malaysia Dates : Nov. 12-14, 2013 URL : www.sdiwc.net ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 17:55:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 19:55:04 +0200 Subject: Appel: Colloque CRELA - Cultures de recherche en linguistique appliquee Message-ID: Date: Fri, 31 May 2013 11:23:34 +0200 From: Patrick Paroubek Message-ID: <1369992214.2630.0.camel at localhost> X-url: http://www.atilf.fr/crela2013/ -----FR----------------------------------------------------------------- Appel ? communication Cultures de recherche en linguistique appliqu?e Research cultures in applied linguistics Colloque international organis? par l'ATILF (?quipe CRAPEL), l'Association Fran?aise de Linguistique Appliqu?e (AFLA), et les associations partenaires (ACEDLE, APLIUT, APLV, ARDAA, ASDIFLE, ATALA, GERALS, GERAS, GERES, RANACLES, SFT, SHESL, UPLEGESS)1 du 14 au 16 novembre 2013 ? l'Universit? de Lorraine, Nancy DATE LIMITE REPORTEE AU 30 juin 2013 Pendant la seconde moiti? du vingti?me si?cle le concept de ? linguistique appliqu?e ? a c?d? la place en France ? une sp?cialisation par domaines pour des raisons de politique scientifique. La liste de ces domaines est longue : acquisition / apprentissage, bi- / multilinguisme, didactique des langues, lexicographie, linguistique de corpus, terminologie, traductologie, traitement automatique des langues, variation linguistique. Dans d'autres cultures, sous un terme englobant (notamment applied linguistics en anglais, angewandte Linguistik en allemand, ling??stica aplicada en espagnol, ?), diff?rents domaines interagissent et s'enrichissent mutuellement. A travers le monde, les attentes politiques incitent ? une plus grande inter- / trans- / multidisciplinarit?. Qu'en est-il aujourd'hui de la notion de ? linguistique appliqu?e ? en France ? Est-elle op?ratoire pour d?finir un terrain fertilisant qui puisse r?duire le fractionnement du domaine ? Le colloque international Cultures de recherche en linguistique appliqu?e / Research cultures in applied linguistics rassemblera des chercheurs et autres acteurs des diff?rents domaines qui souhaitent se positionner par rapport au champ de la linguistique appliqu?e, afin de croiser les regards sur les cultures, pratiques et contenus des recherches aujourd'hui. Dans cette perspective, des propositions de communication sont attendues dans l'un des cinq axes du colloque : R?f?rents th?oriques des disciplines et domaines (diachronie, prospective de la recherche, croisements, etc.) Mod?lisation et th?ories (comment approcher plusieurs domaines en m?me temps, etc.) M?thodologie, instruments et ressources (approches et m?thodologies privil?gi?es, m?thodes dites mixtes, publications, diss?mination, etc.) Notion de ? terrain ? en linguistique appliqu?e (analyse de terrains sp?cifiques, approche comparatiste, etc.) Varia (nouveau). Dans la probl?matique des organisateurs, toute communication d?crivant des recherches qui se situent ? la crois?e de plusieurs domaines de la linguistique appliqu?e peut correspondre aux objectifs de ce colloque. Conf?renciers Bernd R?schoff, Pr?sident de l'AILA Anne Condamines (Universit? Toulouse Le Mirail, CNRS, CLLE) & Jean-Paul Narcy-Combes (Universit? Sorbonne Nouvelle, DILTEC, AFLA) Fernand Carton, Universit? de Lorraine Daniel V?ronique (Universit? Aix-Marseille, Langage et Parole) Propositions Les propositions de communication (dur?e : 20 minutes + 10 minutes de questions) sont ? t?l?charger sur le site (http://www.atilf.fr/crela2013/) avant le 30 juin 2013. Une premi?re page comportera les noms, affiliation, courriel, t?l?phone usuel, adresse postale de chaque auteur. Une deuxi?me page enti?rement anonyme comportera en fran?ais ou en anglais le titre de la communication, et un r?sum? de 500 mots (mise en page standard, format Word/PDF) incluant trois ? cinq r?f?rences bibliographiques maximum. Les propositions seront soumises ? une double ?valuation ? l'aveugle (notification au 15 septembre 2013). Langues du colloque : fran?ais et anglais. Des communications dans d'autres langues sont possibles, si elles sont accompagn?es d'un support (PowerPoint) en fran?ais ou en anglais. Publications Le colloque donnera lieu ? une publication d'actes et ? un ouvrage d'articles s?lectionn?s : des articles courts issus des communications (2.000 mots tout compris) pour une diffusion en ligne ; des articles longs (6.000 mots tout compris) soumis ? nouveau ? une double ?valuation ? l'aveugle du comit? scientifique pour une publication papier avec un ?diteur du domaine. Nancy, ville symbolique L'AFLA est la branche fran?aise de l'AILA, l'Association Internationale de Linguistique Appliqu?e. Ces deux associations ont ?t? cr??es ? Nancy, en octobre 1964. Les personnalit?s organisatrices ?taient ? l'?poque Bernard Pottier (professeur ? Strasbourg, charg? de cours ? Nancy), premier pr?sident de l'AILA, le recteur Paul Imbs (qui venait de lancer le Tr?sor de la Langue Fran?aise), le doyen Jean Schneider, ou Yves Chalon, qui allait cr?er le CRAPEL. Il ?tait question de ? traduction m?canique ?, comme cela se disait ? l'?poque, d'enseignement des langues et de coop?ration scientifique en Europe. L'objet de l'AFLA est de ? promouvoir et coordonner les recherches dans tous les domaines de la linguistique appliqu?e, et d'encourager la coop?ration interdisciplinaire et internationale dans ces m?mes domaines ?. Et c'est ? Nancy que l'AFLA se retrouve en 2013 pour pr?parer le colloque mondial de l'AILA qui se d?roulera du 10 au 15 ao?t 2014 ? Brisbane (Australie). Nancy pratique Le colloque se d?roulera sur le Campus Lettres et Sciences Humaines de l'Universit? de Lorraine ? Nancy. Nancy est facile d'acc?s : 1h30 Paris-Nancy en TGV ; certaines liaisons passent par Lorraine TGV (? 45 minutes de Nancy en navette). Des vols ? bas prix desservent les a?roports de Metz-Nancy, Luxembourg et Strasbourg. Journ?e NEQ La veille de l'ouverture du colloque, et adoss?e ? celui-ci, se tiendra au m?me endroit la Journ?e d'Etude de l'Acedle Notions en Questions sur les ? Corpus en didactique des langues ?, le mercredi 13 novembre 2013. La notion de ? corpus ? est tr?s pr?sente dans les recherches en linguistique ainsi qu'en didactique des langues depuis quelques ann?es. Elle recouvre cependant une large gamme de d?finitions qui ne concordent pas toutes les unes avec les autres et que cette journ?e NeQ va s'employer ? clarifier dans leurs enjeux pour les apprenants, les enseignants et les langues. Les conf?renciers seront Kate Beeching (University of the West of England, Royaume-Uni), Natalie K?bler (CLILLAC-ARP, Universit? Paris Diderot - Paris 7), Ana Frankenberg-Garcia (ISLA-Campus Lisboa, Portugal), Sylvie De Cock (Centre for English Corpus Linguistics, Universit? Catholique de Louvain, Belgique). Comit? scientifique Jos? Aguilar (Universit? Sorbonne Nouvelle, DILTEC), Judith Barna (Universit? d'Artois, RECIFES, ARDAA), Fabrice Barth?l?my (Universit? de Franche-Comt?, ASDIFLE), S?verine Behra (Universit? de Lorraine, ATILF), Jean-Claude Bertin (Universit? du Havre, IDEES-CIRTAL, GERAS), Didier Bottineau (Universit? Paris Ouest, MODYCO, UPLEGESS), Alex Boulton (Universit? de Lorraine, ATILF), C?dric Brudermann (Universit? Pierre et Marie Curie, DILTEC), Peggy Candas (Universit? de Lorraine, ATILF, RANACLES), Danielle Candel (Universit? Paris-Diderot, CNRS, HTL, SHESL), Francis Carton (Universit? de Lorraine, ATILF), Anne Chateau (Universit? de Lorraine, ATILF, RANACLES), Anne Condamines (Universit? Toulouse Le Mirail, CNRS, CLLE), Jean-Marc Delagneau (Universit? du Havre, IDEES, GERALS, APLV), Marc Deneire (Universit? de Lorraine, ATILF), Lo?c Depecker (Universit? Sorbonne Nouvelle, EA 1483, SFT), Martine Derivry (Universit? Paris 6, DILTEC), Aura Luz Duff? Montalvan (Universit? Rennes 2, GERES), J?rg Eschenauer (Ecole Nationale des Ponts Paris Tech, UPLEGESS), Jacqueline Feuillet (Universit? de Nantes, CRINI, AFLA), Dan Frost (Universit? de Savoie, LLS, APLIUT), Laurent Gautier (Universit? de Bourgogne, CITIL, GERALS), Daniel Gile (Universit? Sorbonne Nouvelle, EA 2290), John Humbley (Universit? Paris-Diderot-Paris 7, CLILLAC-ARP), Natalie K?bler (Universit? Paris-Diderot-Paris 7, CLILLAC-ARP), Dominique Macaire (Universit? de Lorraine, ATILF, ACEDLE), Latisha Mary (Universit? de Lorraine, ATILF), Carlos Melendez (Universit? de Lorraine, ATILF), Aliyah Morgenstern (Universit? Sorbonne Nouvelle, PRISMES), Jean-Paul Narcy-Combes (Universit? Sorbonne Nouvelle, DILTEC, AFLA), Marie-Fran?oise Narcy-Combes (Universit? de Nantes, CRINI, ACEDLE), Claude Normand (Universit? de Lorraine, ATILF), Patrick Paroubek (LIMSI CNRS), Myriam Pereiro (Universit? de Lorraine, ATILF), Annick Rivens Mompean (Universit? Lille 3, STL, RANACLES), Marcelo Tano (Ecole Nationale d'Ing?nieurs de Metz, GERES), Linda Terrier (Universit? Toulouse-Le Mirail, CAS, APLIUT), Denyze Toffoli (Universit? de Strasbourg, ACEDLE), Enrique Sanchez Albarracin (INSA Lyon, EVS-ITUS, UPLEGESS), Claire Tardieu (Universit? Sorbonne Nouvelle, ARDAA), Mathieu Valette (INALCO, ERTIM), Daniel V?ronique (Universit? Aix-Marseille, Langage et Parole), Geoffrey Williams (Universit? Bretagne du Sud, AFLA). H?l?ne Zumbihl (Universit? de Lorraine, ATILF) Comit? de pilotage Coordination nationale : Jean-Paul Narcy-Combes Coordinateur local : Francis Carton Repr?sentants des associations : Danielle Candel, John Humbley, Dominique Macaire Comit? d'organisation ATILF (Universit? de Lorraine, CNRS) : S?verine Behra, Alex Boulton, Peggy Candas, Marc Deneire, Dominique Macaire, Latisha Mary, Claude Normand, Myriam Pereiro, H?l?ne Zumbihl. C?dric Brudermann (Universit? Pierre et Marie Curie, DILTEC); Jos? Aguilar (Universit? Paris 3, DILTEC); Marcelo Tano (ENI Metz). Contact Francis Carton : crela2013 at atilf.fr. Crapel - ATILF, CNRS et Universit? de Lorraine, 23 bd Albert 1er, BP 13397, 54015 Nancy cedex, France Site web http://www.atilf.fr/crela2013/ -----EN----------------------------------------------------------------- Call for papers Research cultures in applied linguistics Cultures de recherche en linguistique appliqu?e An International Conference organised by the ATILF (?quipe Crapel), Association Fran?aise de Linguistique Appliqu?e (AFLA), and partner associations (ACEDLE, APLIUT, APLV, ARDAA, ASDIFLE, ATALA, GERALS, GERAS, GERES, RANACLES, SFT, SHESL, UPLEGESS)1 from 14th to 16th November 2013 at the Universit? de Lorraine, Nancy EXTENDED DEADLINE: 30th June 2013 In France, institutional research policy over the last fifty years has had the effect of splitting up the concept of "applied linguistics" into various specialised fields, including language learning and acquisition, bi- and multilingualism, language teaching, lexicography, corpus linguistics, terminology, translation studies, automatic language processing, language variation, and so on. In other cultures, the umbrella term of applied linguistics, angewandte Linguistik or ling??stica aplicada is used to cover the various fields of research which interact and enrich each other. There is a growing awareness on the international scene for the need for greater inter- / trans- / multidisciplinarity. What, then, is the situation in France today concerning applied linguistics? Can applied linguistics provide common ground and reduce fragmentation in the field? This international conference, entitled Research cultures in applied linguistics (Cultures de recherche en linguistique appliqu?e), aims to bring together researchers and practitioners who relate in some way to the field of applied linguistics to exchange views on the cultures, practices and contents of today's research. With this in mind, a call for papers is now open in one of the main themes for the conference: theoretical frameworks and domains (diachrony, prospective research, cross-disciplinary research, etc.) models and theories (how to approach several disciplines at once, etc.) methodology, tools and resources (approaches and methods, mixed methods, publication, dissemination, etc.) empirical study and field work in applied linguistics (analysis of specific fields, comparative approaches, etc.) miscellaneous (related areas in line with the conference themes, papers describing research in one or more fields of applied linguistics, etc.). Keynote speakers Bernd R?schoff (President of AILA) Anne Condamines (Universit? Toulouse Le Mirail, CNRS, CLLE) Jean-Paul Narcy-Combes (Universit? Sorbonne Nouvelle, DILTEC, AFLA) Fernand Carton (Universit? de Lorraine) Submissions Submissions for papers (20 minutes oral presentation followed by 10 minutes for questions) can be uploaded before 30th June 2013 from the conference website: http://atilf.fr/crela2013. The first page should include the authors' names, affiliations, email addresses, phone numbers and postal addresses. The second page must be completely anonymised and include the title of the paper and a 500-word summary (standard layout as a Word/PDF document), including three to five bibliographical references at the most. The papers proposed will be submitted to a double-blind peer review and the applicants will receive notification of their decision by 15th September. Conference languages: French and English. Papers may be given in other languages so provided they are accompanied by a PowerPoint presentation in either French or English. Publications Conference publications will include proceedings and a volume of selected papers: short articles adapted from the paper given (maximum 2,000 words in all) to be published on line, long articles (maximum 6,000 words in all) submitted to a double blind evaluation by the scientific committee in view to publication by a publisher in the field. Nancy, a symbolic venue The Association fran?aise de linguistique appliqu?e (AFLA) is the French branch of AILA, both founded in Nancy in October 1964. The organisers were Professor Bernard Pottier (University of Strasbourg, also lecturing at Nancy), the first president of AILA, Rector Paul Imbs (who had just initiated work on the heritage dictionary Tr?sor de la langue fran?aise), Dean Jean Schneider, and Yves Chalon, who would go on to found the CRAPEL (Centre de Recherches et d'Applications P?dagogiques en Langues). Topics discussed included machine translation, language teaching and European cooperation in research work. AFLA's aim was to promote and coordinate research in all branches of applied linguistics and to foster interdisciplinary and international cooperation in these areas. Nancy was thus the obvious choice of venue to meet in 2013 to prepare the AILA world conference to be held from 10th to 15th August 2014 in Brisbane (Queensland, Australia). Getting to Nancy The AFLA conference will take place on the Lettres et Sciences Humaines campus at the Universit? de Lorraine in Nancy. Nancy is just one and a half hours from Paris by fast train (TGV); some trips require a change of trains at Lorraine TGV (shuttle to Nancy takes 45 minutes). There are also low cost flights to Metz-Nancy, Luxembourg and Strasbourg. NEQ Day The day before the AFLA conference (Wednesday 13th November) features a one-day conference on corpora in language teaching in the series Notions en Questions (NeQ) organised by the Acedle (Association des chercheurs et enseignants didacticiens des langues ?trang?res). Corpora have for years been central in research in linguistics and language learning, but the term 'corpus' varies widely and definitions do not necessarily coincide. This one-day conference therefore aims to explore the issues from the points of view of learners, teachers and languages. The guest speakers are Kate Beeching (University of the West of England, UK), Natalie K?bler (CLILLAC-ARP, Universit? Paris Diderot - Paris 7), Ana Frankenberg-Garcia (ISLA-Campus Lisboa, Portugal), Sylvie De Cock (Centre for English Corpus Linguistics, Universit? Catholique de Louvain, Belgium). Scientific committee Jos? Aguilar (Universit? Sorbonne Nouvelle, DILTEC), Judith Barna (Universit? d'Artois, RECIFES, ARDAA), Fabrice Barth?l?my (Universit? de Franche-Comt?, ASDIFLE), S?verine Behra (Universit? de Lorraine, ATILF), Jean-Claude Bertin (Universit? du Havre, IDEES-CIRTAL, GERAS), Didier Bottineau (Universit? Paris Ouest, MODYCO, UPLEGESS), Alex Boulton (Universit? de Lorraine, ATILF, GERAS), C?dric Brudermann (Universit? Pierre et Marie Curie, DILTEC), Peggy Candas (Universit? de Lorraine, ATILF, RANACLES), Danielle Candel (Universit? Paris-Diderot, CNRS, HTL, SHESL), Francis Carton (Universit? de Lorraine, ATILF), Anne Chateau (Universit? de Lorraine, ATILF, RANACLES), Anne Condamines (Universit? Toulouse le Mirail, CLLE), Jean-Marc Delagneau (Universit? du Havre, IDEES, GERALS, APLV), Marc Deneire (Universit? de Lorraine, ATILF), Lo?c Depecker (Universit? Sorbonne Nouvelle, EA 1483, Soci?t? Fran?aise de Terminologie), Martine Derivry (Universit? Paris 6, DILTEC), Aura Luz Duff? Montalvan (Universit? Rennes 2, GERES), J?rg Eschenauer (Ecole Nationale des Ponts Paris Tech, UPLEGESS), Jacqueline Feuillet (Universit? de Nantes, CRINI, AFLA), Dan Frost (Universit? de Savoie, LLS, APLIUT), Laurent Gautier (Universit? de Bourgogne, CITIL, GERALS), Daniel Gile (Universit? Sorbonne Nouvelle, EA 2290), John Humbley (Universit? Paris-Diderot-Paris 7, CLILLAC-ARP), Natalie K?bler (Universit? Paris-Diderot-Paris 7, CLILLAC-ARP), Dominique Macaire (Universit? de Lorraine, ATILF, ACEDLE), Latisha Mary (Universit? de Lorraine, ATILF), Carlos Mel?ndez Quero (Universit? de Lorraine, ATILF), Aliyah Morgenstern (Universit? Sorbonne Nouvelle, PRISMES), Jean-Paul Narcy-Combes (Universit? Sorbonne Nouvelle, DILTEC, AFLA), Marie-Fran?oise Narcy-Combes (Universit? de Nantes, CRINI, ACEDLE), Claude Normand (Universit? de Lorraine, ATILF), Patrick Paroubek (LIMSI CNRS), Myriam Pereiro (Universit? de Lorraine, ATILF), Annick Rivens Mompean (Universit? Lille 3, STL, RANACLES), Marcelo Tano (Ecole Nationale d'Ing?nieurs de Metz, GERES), Linda Terrier (Universit? Toulouse-Le Mirail, CAS, APLIUT), Denyze Toffoli (Universit? de Strasbourg, ACEDLE), Enrique Sanchez Albarracin (INSA Lyon, EVS-ITUS, UPLEGESS), Claire Tardieu (Universit? Sorbonne Nouvelle, ARDAA), Mathieu Valette (INALCO, ERTIM), Daniel V?ronique (Universit? Aix-Marseille, Langage et Parole), Geoffrey Williams (Universit? de Bretagne Sud, AFLA), H?l?ne Zumbihl (Universit? de Lorraine, ATILF). Steering committee Coordination for France: Jean-Paul Narcy-Combes Coordination for Nancy: Francis Carton Representatives of the associations: Danielle Candel, John Humbley, Dominique Macaire Organising committee ATILF (Universit? de Lorraine, CNRS): S?verine Behra, Alex Boulton, Peggy Candas, Marc Deneire, Dominique Macaire, Latisha Mary, Claude Normand, Myriam Pereiro, H?l?ne Zumbihl. C?dric Brudermann (Universit? Pierre et Marie Curie, DILTEC); Jos? Aguilar (Universit? Paris 3, DILTEC); Marcelo Tano (ENI Metz). Contact Francis Carton: crela2013 at atilf.fr. Crapel - ATILF, CNRS and Universit? de Lorraine, 23 bd Albert 1er, BP 13397, 54015 Nancy cedex, France Web site http://www.atilf.fr/crela2013 -----SP----------------------------------------------------------------- Petici?n de contribuciones Culturas de investigaci?n en ling??stica aplicada Coloquio internacional Organizado por: ATILF (CRAPEL), Asociaci?n Francesa de Ling??stica Aplicada (AFLA) y varias otras asociaciones patrocinadoras (ACEDLE, APLIUT, APLV, ARDAA, ASDIFLE, ATALA, GERALS, GERAS, GERES, RANACLES, SFT, SHESL, UPLEGESS)1 Del 14 al 16 de noviembre de 2013, Nancy, Universidad de Lorena, Francia Fecha l?mite ampliada hasta el 30 de junio de 2013 En Francia, durante la segunda mitad del siglo XX, el concepto de "linguistique appliqu?e" ha cedido lugar, por razones de pol?tica cient?fica, a una especializaci?n por sectores. La lista de esos campos de estudio es larga: adquisici?n/aprendizaje, bi/multiling?ismo, did?ctica de lenguas, lexicograf?a, ling??stica de corpus, terminolog?a, traductolog?a, tratamiento autom?tico de idiomas, variaci?n ling??stica. En otras culturas, bajo esta misma denominaci?n abarcadora (applied linguistics en ingl?s, angewandte linguistik en alem?n, ling??stica aplicada en espa?ol), diferentes campos cient?ficos interact?an y se enriquecen mutuamente. En todas partes del mundo, las expectativas pol?ticas incitan a m?s inter-/ trans-/ multidisciplinariedad. ?En qu? situaci?n se encuentra hoy la noci?n de "ling??stica aplicada" en Francia? ?Es operativa para definir un terreno f?rtil que pueda reducir el fraccionamiento de este campo? El coloquio internacional "Culturas de investigaci?n en ling??stica aplicada" reunir? a investigadores y otros actores de diferentes disciplinas que desean posicionarse en el campo de la ling??stica aplicada con el prop?sito de entrecruzar puntos de vista sobre las pr?cticas y los contenidos de las actuales investigaciones. Dentro de este marco, se esperan propuestas de comunicaci?n en uno de los cuatro ejes del coloquio: Referentes te?ricos de las disciplinas en sus diferentes campos (diacron?a, prospectiva de la investigaci?n, interrelaciones, etc.) Modelizaci?n y teor?as (aproximaci?n de varios ?mbitos al mismo tiempo, etc.) Metodolog?a, instrumentos y recursos (enfoques privilegiados, m?todos mixtos, publicaciones, transmisi?n de conocimiento, etc.) Noci?n de "pr?ctica" en ling??stica aplicada (an?lisis de campos espec?ficos, enfoque comparatista, etc.) Varia (nuevo). Dentro de la problem?tica de los organizadores, toda comunicaci?n que describa investigaciones situadas en la encrucijada de varios dominios de la ling??stica aplicada puede corresponder con los objetivos de este coloquio. Conferenciantes Bernd R?schoff (Presidente de AILA) Anne Condamines (Universidad Toulouse Le Mirail, CNRS, CLLE) Jean-Paul Narcy-Combes (Universidad Sorbonne Nouvelle, DILTEC, AFLA) Fernand Carton (Universidad de Lorraine) Propuestas Las propuestas de comunicaci?n (duraci?n: 20 minutos + 10 minutos de preguntas) deben ser enviadas directamente a trav?s de la p?gina web (http://atilf.fr/crela2013) antes del 30 de junio de 2013. La primera p?gina incluir? nombres y apellidos, afiliaci?n, correo electr?nico, tel?fono y direcci?n postal de cada autor. La segunda p?gina, enteramente an?nima, constar? del t?tulo de la ponencia, en franc?s o en ingl?s, seguido de un resumen de 500 palabras (paginaci?n est?ndar, formato Word/PDF) incluyendo como m?ximo de tres a cinco referencias bibliogr?ficas. Las propuestas ser?n sometidas a una doble evaluaci?n an?nima (notificaci?n el 15 de septiembre de 2013). Lenguas del coloquio Franc?s e ingl?s. Se aceptar?n tambi?n comunicaciones en otras lenguas pero tendr?n que estar acompa?adas de una presentaci?n (PowerPoint) en franc?s o ingl?s. Publicaciones Se publicar?n las actas del coloquio y las comunicaciones seleccionadas integrar?n una publicaci?n especial de: art?culos cortos (en un m?ximo de 2.000 palabras) basados en las ponencias para una difusi?n en l?nea; art?culos largos (en un m?ximo de 6.000 palabras) sometidos de nuevo a una doble evaluaci?n an?nima del comit? cient?fico para una publicaci?n en papel de editor profesional. Nancy, ciudad simb?lica La AFLA es la rama francesa de la AILA (Asociaci?n Internacional de Ling??stica Aplicada). Estas dos asociaciones han sido creadas en Nancy, en octubre de 1964. Los organizados de la ?poca eran Bernard Pottier (profesor en Estrasburgo y encargado de cursos en Nancy), primer presidente de la AILA, el rector Paul Imbs (que acababa de publicar el Tr?sor de la Langue Fran?aise), el decano Jean Schneider, Yves Chalon, quien crear?a luego el CRAPEL (Centre de Recherches et d'Applications P?dagogiques en Langues). Las tem?ticas que predominaban eran la "traducci?n mec?nica", como se dec?a en aquel entonces, la ense?anza de idiomas y la cooperaci?n cient?fica en Europa. El objetivo de la AFLA es "promover y coordinar las investigaciones en todos los campos de la ling??stica aplicada, y animar la cooperaci?n interdisciplinaria e internacional en esa materia". Y es precisamente en Nancy que la AFLA se vuelve a encontrar en 2013 para preparar el coloquio mundial de la AILA que tendr? lugar del 10 al 15 de agosto de 2014 en Brisbane (Australia). C?mo llegar El coloquio tendr? lugar en el Campus Letras y Ciencias Humanas de la Universidad de Lorena en Nancy. Esta ciudad es de f?cil acceso: est? a 1 h 30 de Par?s en tren; ciertas correspondencias pasan por la estaci?n Lorraine TGV (a 45 minutos de Nancy en autob?s). Existen tambi?n vuelos que llegan hasta los aeropuertos de Metz-Nancy, Luxemburgo y Estrasburgo. Jornada NEQ El mi?rcoles 13 de noviembre de 2013, en v?speras de la apertura del coloquio, en el mismo lugar e integrada a ?ste, tendr? lugar la Jornada de Estudio de la ACEDLE (Association des Chercheurs et Enseignants Didacticiens des Langues ?trang?res) titulada "Notions en Questions" sobre los "corpus en did?ctica de lenguas". Desde hace algunos a?os, la noci?n de "corpus" est? muy presente en las investigaciones de ling??stica y did?ctica de las lenguas. Sin embargo, esta noci?n agrupa una amplia gama de definiciones que no concuerdan entre s?. Esta Jornada NeQ tratar? de clarificar este concepto en relaci?n a los aprendientes, los docentes y las lenguas. Los oradores ser?n Kate Beeching (University of the West of England, Reino Unido), Natalie K?bler (CLILLAC-ARP, Universit? Paris Diderot - Paris 7), Ana Frankenberg-Garcia (ISLA-Campus Lisboa, Portugal) y Sylvie De Cock (Centre for English Corpus Linguistics, Universidad Cat?lica de Lovaina, B?lgica). Comit? cient?fico Jos? Aguilar (Universit? Sorbonne Nouvelle, DILTEC), Judith Barna (Universit? d'Artois, RECIFES, ARDAA), Fabrice Barth?l?my (Universit? de Franche-Comt?, ASDIFLE), S?verine Behra (Universit? de Lorraine, ATILF), Jean-Claude Bertin (Universit? du Havre, IDEES-CIRTAL, GERAS), Didier Bottineau (Universit? Paris Ouest, MODYCO, UPLEGESS), Alex Boulton (Universit? de Lorraine, ATILF), C?dric Brudermann (Universit? Pierre et Marie Curie, DILTEC), Peggy Candas (Universit? de Lorraine, ATILF, RANACLES), Danielle Candel (Universit? Paris-Diderot, CNRS, HTL, SHESL), Francis Carton (Universit? de Lorraine, ATILF), Anne Ch?teau (Universit? de Lorraine, ATILF, RANACLES), Anne Condamines (Universit? Toulouse Le Mirail, CLLE), Jean-Marc Delagneau (Universit? du Havre, IDEES, GERALS, APLV), Marc Deneire (Universit? de Lorraine, ATILF), Lo?c Depecker (Universit? Sorbonne Nouvelle, EA 1483, SFT), Martine Derivry (Universit? Paris 6, DILTEC), Aura Luz Duff? Montalv?n (Universit? Rennes 2, GERES), J?rg Eschenauer (?cole Nationale des Ponts Paris Tech, UPLEGESS), Jacqueline Feuillet (Universit? de Nantes, CRINI, AFLA), Dan Frost (Universit? de Savoie, LLS, APLIUT), Laurent Gautier (Universit? de Bourgogne, CITIL, GERALS), Daniel Gile (Universit? Sorbonne Nouvelle, EA 2290), John Humbley (Universit? Paris-Diderot-Paris 7, CLILLAC-ARP), Natalie K?bler (Universit? Paris-Diderot-Paris 7, CLILLAC-ARP), Dominique Macaire (Universit? de Lorraine, ATILF, ACEDLE), Latisha Mary (Universit? de Lorraine, ATILF), Carlos Mel?ndez (Universit? de Lorraine, ATILF), Aliyah Morgenstern (Universit? Sorbonne Nouvelle, PRISMES), Jean-Paul Narcy-Combes (Universit? Sorbonne Nouvelle, DILTEC, AFLA), Marie-Fran?oise Narcy-Combes (Universit? de Nantes, CRINI, ACEDLE), Claude Normand (Universit? de Lorraine, ATILF), Patrick Paroubek (LIMSI CNRS), Myriam Pereiro (Universit? de Lorraine, ATILF), Annick Rivens Mompean (Universit? Lille 3, STL, RANACLES), Marcelo Tano (?cole Nationale d'Ing?nieurs de Metz, GERES), Linda Terrier (Universit? Toulouse-Le Mirail, CAS, APLIUT), Denyze Toffoli (Universit? de Strasbourg, ACEDLE), Enrique S?nchez Albarrac?n (INSA Lyon, EVS-ITUS, UPLEGESS), Claire Tardieu (Universit? Sorbonne Nouvelle, ARDAA), Mathieu Valette (INALCO, ERTIM), Daniel V?ronique (Universit? Aix-Marseille, Langage et Parole), Geoffrey Williams (Universit? Bretagne du Sud, AFLA). Comit? de pilotaje Coordinaci?n nacional: Jean-Paul Narcy-Combes Coordinador local: Francis Carton Representantes de asociaciones: Danielle Candel, John Humbley, Dominique Macaire Comit? organizador S?verine Behra, Alex Boulton, Peggy Candas, Marc Deneire, Dominique Macaire, Latisha Mary, Claude Normand, Myriam Pereiro (ATILF-Universit? de Lorraine, CNRS) C?dric Brudermann (Universit? Pierre et Marie Curie, DILTEC) Jos? Aguilar (Universit? Paris 3, DILTEC) Marcelo Tano (ENI Metz) Contacto Francis Carton : crela2013 at atilf.fr Crapel-ATILF, CNRS, Universit? de Lorraine, 23 bd Albert 1er, BP 13397, 54015 Nancy cedex, France. P?gina web http://atilf.fr/crela2013 ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 18:35:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 20:35:31 +0200 Subject: Conf: Plate-forme de l'Intelligence Artificielle - PFIA - 1 au 5 juillet, Lille Message-ID: Date: Sun, 02 Jun 2013 20:23:27 +0200 From: Maxime MORGE Message-ID: <51AB8D9F.2010605 at univ-lille1.fr> X-url: http://pfia2013.univ-lille1.fr La date limite pour b?n?ficier des tarifs pr?f?rentiels est dimanche 9 juin. Nos excuses pour les r?ceptions multiples. Ne pas h?siter ? diffuser. -- PLATE-FORME de L'INTELLIGENCE ARTIFICIELLE 2013 1-5 juillet 2013 Lille http://pfia2013.univ-lille1.fr Organis?e sous l'?gide de l'AFIA tous les deux ans depuis 1999, la plate-forme de l'IA (PFIA) a pour objectif de r?unir chercheurs, industriels et ?tudiants autour de conf?rences et d'ateliers consacr?s ? l'Intelligence Artificielle. En 2013, la plate-forme est organis?e ? Lille sur le campus de Villeneuve d'Ascq. Elle accueille six conf?rences nationales majeures en IA : * Conf?rence d'Apprentissage (CAp) * Journ?es francophones d'Ing?nierie des Connaissances (IC) * Journ?es Francophones Planification, D?cision, et Apprentissage pour la conduite de syst?mes (JFPDA) * Journ?es Francophones sur les Syst?mes Multi-Agents (JFSMA) * Journ?es francophones sur les Mod?les Formels de l'Interaction (MFI) * Rencontres des Jeunes Chercheurs en Intelligence Artificielle (RJCIA) La plate-forme de l'IA int?gre par ailleurs 12 ateliers th?matiques repr?sentatifs des th?mes port?s par les conf?rences. Toutes les informations concernant l'organisation des conf?rences et des ateliers (CFP, deadline) peuvent ?tre trouv?es sur le site Internet de la plate-forme : http://pfia2013.univ-lille1.fr. La plate-forme de l'IA constitue un point de rencontre unique et convivial pour la communaut? IA afin de rapprocher les diff?rentes disciplines qui la composent et d'?tablir des passerelles entre elles. ? cette intention, l'AFIA participe activement ? faire de cet ?v?nement un lieu qui s'adresse ? l'ensemble de la communaut? francophone d'Intelligence Artificielle, notamment au travers de : * la tarification propos?e pour acc?der ? la conf?rence. L'inscription aux 5 jours de conf?rences n?exc?de pas 360?, pauses et repas du midi compris ; * la r?duction sur le tarif d'inscription propos?e aux adh?rents de l'AFIA permet d'acc?der aux 5 jours de conf?rences pour 300?, pauses et repas du midi compris. Maxime Morge, pour le comit? d'organisation PFIA2013. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 2 18:03:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 2 Jun 2013 20:03:04 +0200 Subject: Appel: PT-AI 2013 - "Philosophy and Theory of Artificial Intelligence", Oxford, 21-22.09.2013 Message-ID: Date: Sat, 1 Jun 2013 12:37:38 +0300 From: Vincent C. M?ller Message-Id: X-url: http://www.pt-ai.org/2013/ - - - please circulate - - - ANNOUNCEMENT & CALL FOR PAPERS Conference PT-AI 2013 - ?Philosophy and Theory of Artificial Intelligence? 21-22.09.2013 Oxford, St. Antony's College http://www.pt-ai.org/2013/ INVITED SPEAKERS Jean-Christophe Baillie (Aldebaran Robotics, Paris) Theodore Berger (University of Southern California, L.A.) Selmer Bringsjord (Rensselaer Polytechnic Institute, Troy, NY) Daniel C. Dennett (Tufts University, Boston) Luciano Floridi (University of Hertfordshire & Oxford) Stuart J Russell (UC Berkeley) Murray Shanahan (Imperial College, London) Michael Wheeler (University of Stirling, Scotland) ========================================= ABSTRACTS We request anonymous abstracts of 600-1000 words (plus references) in plain text or PDF, plus a short abstract of up to 120 words. Accepted papers will be presented at the conference and published in the proceedings. (We plan to provide a copy of the proceedings to the corresponding author.) We foresee slots of at least 30 minutes per talk, including discussion. All submissions will be reviewed double-blind by at least two members of the programme committee. Submission online at EasyChair: https://www.easychair.org/conferences/?conf=ptai13 ========================================= DATES Deadline for submission of abstracts: 21.06.2013 Decisions announced: 12.7.2013 Conference: 21-22.09.13 Deadline for submission of full papers: 30.11.13 ========================================= THEMES Participants from all disciplines that are relevant for fundamental issues of present and future AI, especially cognitive science, computer science, neuroscience and philosophy. A broad framework is set by questions like: What are the necessary conditions for artificial intelligence (if any); what are sufficient ones? What do these questions relate to the conditions for intelligence in humans and other natural agents? What are the ethical and societal problems that artificial intelligence raises, or will raise? Some of the key issues will be: - AI and cognitive science - consciousness - dynamical systems - embedded, situated, distributed cognition, extended mind - embodiment, enaction, morphology - ethics of AI and robotics - brain emulation and simulation - goals, emotions, values, free will - hybrid systems, cyborgs - information - intelligence and intelligence testing - intentionality - interactive systems - learning and evolution - multi-agent systems - notions and forms of computing for AI - perception - probabilistic systems - reasoning - social impact of present and future AI - super-intelligence - ... ========================================= PUBLICATION Details on the publication for 2013 are not yet finalized. The papers from the 2011 event were published in a special volume of 'Minds and Machines' (22/2, with papers by Bostrom, Dreyfus, Gomila, O'Regan, Shagrir) and in an edited volume of the SAPERE series with Springer. http://www.springerlink.com/content/0924-6495/22/2/ http://www.springer.com/engineering/robotics/book/978-3-642-31673-9 ========================================= REGISTRATION Online registration will open early June. Participation fee will be ?110, reduced ?55. Accommodation at St. Antony's is available. Thank you for your time, Vincent C. M?ller Chair, PT-AI 2013 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:50:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:50:03 +0200 Subject: Conf: Linguistique et Traitement Automatique de la Langue pour l'Aeronautique et l'Espace, 2 juillet 2013, Universite Toulouse 2 Le Mirail Message-ID: Date: Mon, 03 Jun 2013 10:11:02 +0200 From: Condamines Message-ID: <51AC4F96.8020402 at univ-tlse2.fr> X-url: http://w3.erss.univ-tlse2.fr/textes/seminaires/lingTALaerospace.html Linguistique et Traitement Automatique de la Langue pour l'A?ronautique et l'Espace : Dimensions langagi?res du risque 2 juillet 2013, Universit? Toulouse 2 Le Mirail Atelier organis? par le Laboratoire CLLE et l'Universit? Toulouse 2 le Mirail, avec le soutien du R?seau Th?matique de Recherche Avanc?e-Sciences et Technologie pour l'A?ronautique et l'Espace et le parrainage du P?le Aerospace Valley. Dans les dix derni?res ann?es, de nombreux projets se sont mis en place en linguistique appliqu?e comme en traitement automatique des langues pour favoriser une meilleure gestion de la communication dans les domaines "risqu?s". L'a?ronautique et le spatial rel?vent de ces domaines dans la mesure o? des vies humaines sont impliqu?es et des sommes d'argent colossales sont investies. Quelle soit orale ou ?crite, la communication dans ces domaines se fait la plupart du temps au moyen de la langue naturelle. Or, la langue n'est pas un moyen de transmission d'information parfait. En effet, elle fonctionne avec de l'implicite, des ambigu?t?s, du flou, elle fait appel ? des connaissances suppos?es partag?es, etc. Par ailleurs, la production d'une masse pl?thorique de documents non structur?s constitue un frein ? l'exploitation des informations qui s'y trouvent exprim?es. L'objectif de l'atelier est de faire se rencontrer des chercheurs en linguistique, traitement automatique des langues et ing?nierie des connaissances et des professionnels de l'a?ronautique et du spatial afin de pr?senter un panorama des besoins et des r?ponses qui peuvent ?tre faites en mati?re de gestion de la dimension langagi?re du risque. Inscription gratuite mais obligatoire, avant le 26 juin. http://w3.erss.univ-tlse2.fr/textes/seminaires/lingTALaerospace.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:53:25 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:53:25 +0200 Subject: Ecole: IQLA-GIAT, ecole d'ete d'analyse quantitative de donnees textuelles, 16-20 Sept. Padoue, Italie Message-ID: Date: Mon, 03 Jun 2013 14:04:23 +0200 From: Serge Heiden Message-ID: <51AC8647.3030506 at ens-lyon.fr> [Apologies for cross-postings] IQLA-GIAT Summer School in Quantitative Analysis of Textual Data University of Padua, 16-20 September 2013 ============================================================== Presentation ----------------- The analysis of textual data and large corpora is an object of research in many sectors of linguistics, computer sciences, mathematics and statistics and is used as a research tool within a number of disciplines such as psychology, sociology, sociolinguistics, education, history, political studies, communication and media studies. The recent evolution of information technologies (IT) and quantitative methods has led to a number of distinct but interrelated sectors (e.g. computational linguistics, information retrieval, natural language processing, text mining, sentiment analysis, opinion mining, etc.) with interesting industrial applications (e.g. electronic dictionaries, artificial intelligence, computer-aided translation) and, today, text analysis is an umbrella term referring to a wide range of qualitative, quantitative and mixed-methods approaches. Recent studies have repeatedly stressed the need for developing, adopting and sharing interdisciplinary approaches and the IQLA-GIAT Summer School is the ideal environment for developing innovative analytical tools by pooling together the research methods of both Quantitative Linguistics and the Statistical Analysis of Textual Data. Teaching activities will raise questions that can be answered thanks to quantitative methods implemented within a text analysis framework and other procedures which may be used to identify and compare the characteristics of texts. The aim is to discuss with students, young researchers and scholars of different disciplines the strengths, weaknesses, opportunities and threats of quantitative methods for text analysis. Specific skills will be developed mainly with reference to the operating logic of software and tools, so that participants are trained to exploit different tools within the same environment and the same tool in different environments. Objectives -------------- The participants selected for the IQLA-GIAT Summer School have the opportunity to develop the necessary expertise to exploit integrated approaches to text analysis for a better understanding of the role played by theoretical issues, expected results and data and software selection. The IQLA-GIAT Summer School is aimed at: 1. sharing information on software, corpora, relevant literature and research results; 2. promoting a dialogue among different disciplines on actual research issues; 3. developing innovative analytical tools and integrated research methods; 4. introducing students and young researchers to new strains of research and applications; 5. sharing state-of-the-art knowledge in five main areas: a) Corpora and textual data collection b) Quantitative linguistics c) Authorship attribution d) Content mapping and data visualization e) Software for computer-aided analysis of textual data Classes ---------- All courses are taught in English The teaching staff includes researchers and experts from European universities: Toulose II, ENS Lion (France), Trier (Germany), Athens (Greece), Neuchatel (Switzerland), Bologna, Padova, Trieste, Roma "La Sapienza" (Italy). Teaching activities include lectures and lab sessions, as well as workshops illustrating software and tools. Credits --------- The IQLA-GIAT Summer School in Quantitative Analysis of Textual Data is organized by GIAT ? Interdisciplinary Text Analysis Group (www.giat.org) in collaboration with the International Quantitative Linguistics Association (www.iqla.org) and the Department of Computational Linguistics of the University of Trier (www.uni-trier.de). The IQLA-GIAT Summer School is a project funded by the University of Padua (www.unipd.it), coordinated by prof. Arjuna Tuzzi (University of Padua). Schedule ----------- The IQLA-GIAT Summer School will take place from Monday 16th to Friday 20th September 2013 The IQLA-GIAT Summer School is a full-time intensive course held on - Monday from 10.30 am to 6.00 pm - Tuesday through Friday from 9:30 am to 6:00 pm Location ----------- University of Padua Department of Philosophy, Sociology, Education & Applied Psychology (Dipartimento di Filosofia, Sociologia, Pedagogia e Psicologia Applicata - FISPPA) Sociology buildings via Cesarotti, 10/12 I-35123 Padova, ITALY Application -------------- The IQLA-GIAT Summer School is open to 20 participants including researchers, scholars and postgraduate students. Applicants should send a file in pdf format including: - curriculum vitae - personal mission statement (max 500 words) - the request for ECTS credit (if needed - 3 CFU). Applications should be sent to the following address: summerschool.giat at unipd.it Application deadline: 9th August 2013 ---------------------------------------------- Selection criteria privilege foreign (i.e. non-Italian) applicants and younger candidates to encourage participation from different countries and comply with gender equality. Candidates will receive a confirmation of acceptance by 16th August 2003 Tuition fee: 220 ? Inscription deadline: 30th August 2013 ---------------------------------------------- Final Assessment --------------------- 1) All participants will be requested to fill in a questionnaire to assess the main aspects of the IQLA-GIAT Summer School (e.g. organization, teaching, materials, facilities and equipment, expectations, satisfaction rate, suggestions etc.). 2) If they wish to receive ECTS credits (3 CFU), participants shall take a written test including 30 multiple choice questions (one correct answer out of four). The passing grade is 15 correct answers. Grades will reflect the sum of all correct answers (one point) according to the following range: A (29-30 points); B (25-28 points); C (21-24 points); D (17-20 points); E (15-16 points). Secretariat ------------- Claudia Andreatta, Ph.D. summerschool.giat at unipd.it For any further information and details about terms, deadlines, application forms and payment modalities, please contact: summerschool.giat at unipd.it or arjuna.tuzzi at unipd.it. ======================================================================== Provisional program Introduction 1. Collecting Corpora (Stefano Ondelli, University of Trieste, Italy) 2. LAB ? Collecting Corpora on the Web (Alberto Cammozzo, IT expert, Italy) 3. Qualitative vs. Quantitative Approaches (Alberta Contarello, University of Padua, Italy) 4. Quantitative Measures in Linguistics (Reinhard K?hler, University of Trier, Germany) Quantitative Linguistics 5. Measures of Lexical Richness (Sven Neumann, University of Trier, Germany) 6. Linguistics Laws ( Andrej Beliankou, University of Trier, Germany) 7. LAB ? Probability distributions (Sven Neumann , Andrej Beliankou, University of Trier, Germany) 8. Quantitative Syntax Analysis (Reinhard K?hler, University of Trier, Germany) Authorship Attribution 9. Authorship Attribution I (Jacques Savoy, University of Neuchatel, Switzerland) 10. Authorship Attribution II (Mirko Degli Esposti, University of Bologna, Italy) 11. Authorship Attribution III (George Mikros, University of Athens, Greece) Content Mapping and Data Visualization 12. LAB ? Profiling (George Mikros, University of Athens, Greece) 13. LAB ? Content Mapping (Arjuna Tuzzi, University of Padua, Italy) Software (Workshop) 14. LAB ? Software Iramuteq (Pierre Ratinaud, University of Toulose II, France) 15. LAB ? Software TXM (Serge Heiden, ENS Lion, France) 16. LAB ? Software Taltac (Isabella Chiari, University of Rome "La Sapienza", Italy) 17. LAB ? in progress ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:55:16 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:55:16 +0200 Subject: Ecole: SSTiC 2013: next registration deadline 26 June, Tarragona, Spain, July 22-26, 2013 Message-ID: Date: Sun, 2 Jun 2013 22:13:01 +0200 From: "GRLMC" Message-ID: X-url: http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* 2013 INTERNATIONAL SUMMER SCHOOL ON TRENDS IN COMPUTING SSTiC 2013 Tarragona, Spain July 22-26, 2013 Organized by Rovira i Virgili University http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* +++ next registration deadline: June 26 +++ ********************************************************************* AIM: SSTiC 2013 will be an open forum for the convergence of top class well recognized computer scientists and people at the beginning of their research career (typically PhD students) as well as consolidated researchers. SSTiC 2013 will cover the whole spectrum of computer science by means of 59 six-hour courses dealing with hot topics at the frontiers of the field. By actively participating, lecturers and attendees will share the idea of scientific excellence as the main motto of their research work. ADDRESSED TO: Graduate students from around the world. There are no pre-requisites in terms of the academic degree the attendee must hold. However, since there will be several levels among the courses, in the description of some of them reference may be made to specific knowledge background. SSTiC 2013 is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. Finally, senior researchers will find it fruitful to listen and discuss with people who are main references of the diverse branches of computing nowadays. REGIME: 7 parallel sessions will be held during the whole event. Participants will be able to freely choose the courses they will be willing to attend as well as to move from one to another. VENUE: Palau Firal i de Congressos de Tarragona Arquitecte Rovira, 2 43001 Tarragona http://www.palaucongrestgna.com COURSES AND PROFESSORS: Shun-ichi Amari (Riken) [introductory] Information Geometry and Its Applications James Anderson (Chapel Hill) [intermediate] Scheduling and Synchronization in Real-Time Multicore Systems Pierre Baldi (Irvine) [intermediate] Big Data Informatics Challenges and Opportunities in the Life Sciences Yoshua Bengio (Montr?al) [introductory/intermediate] Deep Learning of Representations Stephen Brewster (Glasgow) [advanced] Multimodal Human-Computer Interaction Bruno Buchberger (Linz) [introductory] Groebner Bases: An Algorithmic Method for Multivariate Polynomial Systems. Foundations and Applications Rajkumar Buyya (Melbourne) [intermediate] Cloud Computing Jan Camenisch (IBM Zurich) [intermediate] Cryptography for Privacy Jeffrey S. Chase (Duke) [intermediate] Trust Logic as an Enabler for Secure Federated Systems Larry S. Davis (College Park) [intermediate] Video Analysis of Human Activities Paul De Bra (Eindhoven) [intermediate] Adaptive Systems Paul Dourish (Irvine) [introductory] Ubiquitous Computing in a Social Context Max J. Egenhofer (Maine) [introductory/intermediate] Qualitative Spatial Relations: Formalizations and Inferences Richard M. Fujimoto (Georgia Tech) [introductory] Parallel and Distributed Simulation David Garlan (Carnegie Mellon) [advanced] Software Architecture: Past, Present and Future Mario Gerla (Los Angeles) [intermediate] Vehicle Cloud Computing Georgios B. Giannakis (Minnesota) [advanced] Sparsity and Low Rank for Robust Data Analytics and Networking Ralph Grishman (New York) [intermediate] Information Extraction from Natural Language Francisco Herrera (Granada) [intermediate] Imbalanced Classification: Current Approaches and Open Problems Paul Hudak (Yale) [introductory] Euterpea: From Signals to Symphonies Using Haskell Niraj K. Jha (Princeton) [intermediate] FinFET Circuit Design George Karypis (Minnesota) [introductory] Introduction to Parallel Computing: Architectures, Algorithms, and Programming Aggelos K. Katsaggelos (Northwestern) [intermediate/advanced] Sparsity-based Advances in Image Processing Arie E. Kaufman (Stony Brook) [advanced] Advances in Visualization Hugo Krawczyk (IBM Research) [intermediate] An Introduction to the Design and Analysis of Authenticated Key Exchange Protocols Pierre L'Ecuyer (Montr?al) [intermediate] Quasi-Monte Carlo Methods in Simulation: Theory and Practice Laks Lakshmanan (British Columbia) [intermediate/advanced] Information and Influence Spread in Social Networks Wenke Lee (Georgia Tech) [introductory] DNS-based Monitoring of Malware Activities Maurizio Lenzerini (Roma La Sapienza) [intermediate] Ontology-based Data Integration Ming C. Lin (Chapel Hill) [introductory/intermediate] Physically-based Modeling and Simulation Jane W.S. Liu (Academia Sinica) [intermediate] Critical Information and Communication Technologies for Disaster Preparedness and Response Satoru Miyano (Tokyo) [intermediate] How to Hack Cancer Systems with Computational Methods Aloysius K. Mok (Austin) [intermediate] From Real-time Systems to Cyber-physical Systems Hermann Ney (Aachen) [intermediate/advanced] Probabilistic Modelling for Natural Language Processing - with Applications to Speech Recognition, Handwriting Recognition and Machine Translation Cathleen A. Norris (North Texas) & Elliot Soloway (Ann Arbor) [introductory] Primary & Secondary Educational Computing in the Age of Mobilism Jeff Offutt (George Mason) [intermediate] Cutting Edge Research in Engineering of Web Applications David Padua (Urbana) [intermediate] Parallel Programming with Abstractions Bijan Parsia (Manchester) [introductory] The Semantic Web: Conceptual and Technical Foundations Massoud Pedram (Southern California) [intermediate] Energy Efficient Architectures and Information Processing Systems Charles E. Perkins (FutureWei) [intermediate/advanced] Beyond 4G Prabhakar Raghavan (Google) [introductory/intermediate] Web Search and Advertising Sudhakar M. Reddy (Iowa) [introductory] Design for Test and Test of Digital VLSI Circuits Phillip Rogaway (Davis) [introductory/intermediate] Provably Secure Symmetric Encryption Gustavo Rossi (La Plata) [intermediate] Topics in Model Driven Web Engineering Kaushik Roy (Purdue) [introductory/intermediate] Low-energy Computing Robert Sargent (Syracuse) [introductory] Validating Models Douglas C. Schmidt (Vanderbilt) [intermediate] Patterns and Frameworks for Concurrent and Networked Software Bart Selman (Cornell) [intermediate] Fast Large-scale Probabilistic and Logical Inference Methods Mubarak Shah (Central Florida) [intermediate/advanced] Visual Crowd Surveillance Ron Shamir (Tel Aviv) [introductory] Revealing Structure in Disease Regulation and Networks Dawn Xiaodong Song (Berkeley) [introductory] Selected Topics in Computer Security Mike Thelwall (Wolverhampton) [introductory] Sentiment Strength Detection for the Social Web Julita Vassileva (Saskatchewan) [introductory/intermediate] Engaging Users in Social Computing Systems Philip Wadler (Edinburgh) [introductory] Topics in Lambda Calculus and Life Yao Wang (Polytechnic New York) [introductory/advanced] Video Compression: Fundamentals and Recent Development Gio Wiederhold (Stanford) [introductory] Software Economics: How Do the Results of the Intellectual Efforts Enter the Global Market Place Limsoon Wong (National Singapore) [introductory/intermediate] The Use of Context in Gene Expression and Proteomic Profile Analysis Michael Wooldridge (Oxford) [introductory] Autonomous Agents and Multi-Agent Systems Ronald R. Yager (Iona) [introductory/intermediate] Fuzzy Sets and Soft Computing Philip S. Yu (Illinois Chicago) [advanced] Mining Big Data REGISTRATION: It has to be done at http://grammars.grlmc.com/SSTiC2013/Registration.php Since the capacity of the venue is limited, registration requests will be processed on a first come first served basis. The registration period will be closed when the capacity of the venue will be complete. FEES: They are the same (a flat rate) for all people by the corresponding deadline. They give the right to attend all courses. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Participants will be delivered a certificate of attendance. IMPORTANT DATES: Announcement of the programme: January 26, 2013 Six registration deadlines: February 26, March 26, April 26, May 26, June 26, July 26, 2013 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat POSTAL ADDRESS: SSTiC 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Departament d?Economia i Coneixement, Generalitat de Catalunya Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:56:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:56:45 +0200 Subject: Q: Masters en industrie des langues (suite) Message-ID: Date: Mon, 3 Jun 2013 12:16:19 +0000 From: Message-ID: <14483_1370261793_51AC8920_14483_692_2_ED32B5012BA99F4AA999E2765EF060F20C00BD at PEXCVZYM12.corporate.adroot.infra.ftgroup> Bonjour, et merci ? ceux qui m'ont d?j? adress? des informations au sujet de leurs Masters en industries des langues. J'ai re?u deux questions sur l'objet de cette requ?te. Le but est de renseigner un rapport "interne" dans lequel seront recens?s : - les principales ?quipes acad?miques travaillant dans le TALN (extraction d'information). - les principaux industriels travaillant dans le TALN (extraction d'information). - les r?seaux du domaine. - les principaux masters en ing?nieries des langues. - les principales conf?rences du domaine. - les journ?es th?matiques. - les principales revues. - des livres, ... - etc. Le but derri?re est de faire des choix de partenariat par exemple. Merci. Malek Boualem Abdel-Malek Boualem R&D Project Manager France Telecom Orange Labs FT/OLNC/OLPS/OPENSERV/CONTENT/FAST Phone : +33 (0)2 96 05 29 83 Mobile : +33 (0)6 85 71 40 63 Email : malek.boualem at orange.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 06:59:09 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 08:59:09 +0200 Subject: Job: CDI, Synapse Developpement Message-ID: Date: Mon, 3 Jun 2013 15:25:14 +0200 From: Patrick S?gu?la Message-ID: <00cd01ce605d$c880c3b0$59824b10$@synapse-fr.com> X-url: http://www.synapse-developpement.fr/ Poste ? pourvoir en CDI, Synapse D?veloppement (http://www.synapse-developpement.fr/) Synapse D?veloppement, soci?t? leader dans la mise ? disposition de ressources et de technologies ? base de linguistique pour le fran?ais et l?anglais, recherche un docteur-ing?nieur en informatique, pour int?grer son ?quipe de recherche et d?veloppement bas?e ? Toulouse. VOS MISSIONS : - Vous participez aux projets de recherche et d?veloppement de notre ?quipe. Ces projets peuvent ?tre en collaboration avec des laboratoires acad?miques et entreprises europ?ennes innovantes. Ils peuvent aussi ?tre amen?s par des clients d?sireux de cr?er un nouveau service. - Veille technologique sur les domaines comme le Machine Reading, le Machine Learning, les syst?mes de Question/R?ponse ou l?extraction d?entit?s nomm?es. - Possibilit? de publication dans des conf?rences internationales - Prise en main et d?veloppement de la technologie d?analyse de texte et des applications commercialis?es par Synapse D?veloppement. PROFIL : Titulaire d?un doctorat ou dipl?me ?quivalent. Vous ?tes curieux, dynamique et passionn? par la compr?hension de textes par les ordinateurs. Vous aimez les d?fis technologiques et vous aimez r?soudre de mani?re pragmatique des probl?mes complexes. Vous avez envie de vous impliquer dans une ?quipe pluridisciplinaire. Vous avez envie de participer ? l?aventure d?une petite soci?t? o? l?activit? de recherche et d?veloppement est tr?s importante Comp?tences techniques : - Bonne connaissance des langages objets - Ma?trise du d?veloppement ASP ou JAVA. - Connaissance des standards du TAL - Connaissance des bases de donn?es textuelles (Cassandra, Mongo DB, etc.) serait un plus. SOCIETE : Synapse D?veloppement cr?e des applications de valorisation de contenus et d?analyse de donn?es textuelles. Des entreprises comme Amazon et Microsoft embarquent nos technologies dans leurs produits, celles-ci ?tant donc utilis?es aujourd?hui par des millions de personnes. Synapse a ?t? cr??e en 1994 et sa premi?re application a ?t? le logiciel Cordial, correcteur d?orthographe et grammaire de r?f?rence pour le fran?ais. D?s 1994, l'accent a ?t? mis sur l?innovation et sur la qualit? des produits. Le correcteur Cordial est aujourd?hui un outil qui surclasse par sa pr?cision les outils de correction int?gr?s dans les suites bureautiques ou gestionnaires de courriels du march?. Passionn?s par la langue et souhaitant accompagner nos clients dans l?aide ? la r?daction, nous avons ?dit? de nombreuses ressources num?riques tels que des dictionnaires de d?finitions et de synonymes. Ces ressources sont aujourd?hui les plus compl?tes pour le fran?ais et sont largement diffus?es sous les formes les plus diverses : sites Internet, applications mobiles ou encore marque-pages num?riques ! Par ailleurs, nous offrons des solutions aux entreprises qui souhaitent valoriser leurs contenus Internet ou analyser d?importants volumes de textes, issus des r?seaux sociaux par exemple. Depuis 20 ans notre ?quipe R&D d?veloppe des algorithmes qui permettent ? une machine de comprendre un texte. Nous sommes aujourd?hui capables de comprendre, r?sumer, classer, analyser la tonalit? d?un contenu, l?indexer automatiquement et relier les documents entre eux, afin de pr?senter ces analyses de fa?on originale dans des sc?narios de publication apportant une r?elle plus-value au lecteur. La soci?t? emploie aujourd?hui une dizaine de personnes. Contact : Synapse D?veloppement Mail : direction at synapse-fr.com Tel : 06.63.38.69.06 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:05:46 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:05:46 +0200 Subject: Livre: Analyses linguistiques sur corpus Message-ID: Date: Tue, 4 Jun 2013 10:54:59 +0200 From: "Ana Ars" Message-ID: <00a001ce6101$31b54d30$951fe790$@fr> X-url: http://editions.lavoisier.fr/notice.asp?ouvrage=2724386 Analyses linguistiques sur corpus Subordination et insubordination en fran?ais Trait? Cognition et Traitement de l?Information (IC2) dirig?e par Jean-Marie Pierrel sous la direction de Jeanne-Marie Debaisieux ISBN : 978-2-7462-4532-7 - Format : 16 x 24 - 504 p. - 170 ? Editions Lavoisier Hermes Une ?tude qui renouvelle la question de la complexit? et de l?int?gration syntaxique Cet ouvrage se propose de revisiter de fa?on originale la notion de subordination en fran?ais dans la perspective de la linguistique de corpus. Apr?s des chapitres d?introduction o? est pr?sent? un cadre descriptif inspir? de l'Approche pronominale ?tendue ? la macrosyntaxe dans la ligne des travaux pionniers de C. Blanche-Benveniste, il rassemble un ensemble d??tudes monographiques des principaux types de conjonctions de subordination du fran?ais ? partir d'analyses quantitatives et qualitatives d?exemples tir?s de corpus ?crits et oraux prenant en compte les variations attach?es ? divers genres de texte dans les deux domaines. Ces ?tudes synchroniques r?v?lent l?importance de ces morph?mes, g?n?ralement ?tudi?s comme de simples outils grammaticaux, dans l?organisation du discours et la gestion de l?interaction. Elles sont mises en perspective avec une ?tude diachronique et une ?tude sur l?acquisition des structures. Les r?sultats renouvellent la question de la complexit? et de l?int?gration syntaxique. Consulter la pr?sentation et le sommaire d?taill?s de l'ouvrage (http://editions.lavoisier.fr/notice.asp?ouvrage=2724386) Ana ARS Service de Presse LAVOISIER SAS Editions / EM Inter / Hermes / Synth?se agricole / M?decine Sciences Publications 14 rue de Provigny 94236 Cachan Cedex 01.47.40.67.63 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:00:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:00:32 +0200 Subject: Appel: Call for demonstrations, SIGDIAL 2013 Conference, 22-24 August 2013 Message-ID: Date: Mon, 3 Jun 2013 14:37:20 +0000 From: "Jason Williams (MSR)" Message-ID: <4532e36066c04fd4908f454b6c948566 at BY2PR03MB044.namprd03.prod.outlook.com> X-url: http://www.sigdial.org/workshops/conference14/ SIGDIAL 2013 CONFERENCE 14th Annual Meeting of the Special Interest Group on Discourse and Dialogue http://www.sigdial.org/workshops/conference14/ Metz, France 22-24 August 2013 CALL FOR DEMONSTRATIONS The program committee of SigDial 2013 welcomes the submission of demonstration descriptions. Demonstrations will be presented in special sessions, separate from short paper presentations and poster sessions. Accepted demonstration submissions will be published in a dedicated section of the conference proceedings. Demo descriptions should be no longer than 3 pages, including references. Demo submissions should follow the two-column ACL 2013 format. We strongly recommend the use of ACL LaTeX style files or Microsoft Word style files tailored for the ACL 2013 conference. Submissions must conform to the official ACL 2013 style guidelines (http://acl2013.org/site/call.html), and they must be electronic in PDF. Submissions will not be anonymous. Demonstrations which have appeared (or will appear) elsewhere may be presented at SigDial, although this should be noted at the time of submission. Authors are encouraged to submit additional supportive material such as video clips or sound clips and examples of available resources for review purposes. Submission is electronic using paper submission software at https://www.softconf.com/d/sigdial2013/ IMPORTANT DATES Demo Paper Submission Deadline Tuesday, 2 July 2013 (23:59, GMT-11) Demo Paper Notification Wednesday, 10 July 2013 Final Demo Paper Due Wednesday, 24 July 2013 Conference Thursday-Saturday, 22-24 August 2013 (Thu morning - Saturday mid-day) Any questions regarding submissions can be sent to the technical program co-chairs at program-chairs[at]sigdial.org. SigdDial 2013 Technical Program Co-Chairs Barbara Di Eugenio, University of Illinois at Chicago, USA Jason D. Williams, Microsoft Research, USA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:03:57 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:03:57 +0200 Subject: These: Baptiste Chardon, Chaine de traitement pour une approche discursive de l'analyse d'opinion Message-ID: Date: Tue, 4 Jun 2013 10:33:00 +0200 From: "Baptiste Chardon" Message-ID: <002c01ce60fe$1fd89390$5f89bab0$@synapse-fr.com> Bonjour, J'ai le plaisir de vous inviter ? la soutenance de ma th?se intitul?e : "Cha?ne de traitement pour une approche discursive de l'analyse d'opinion" Cette soutenance se d?roulera le mercredi 12 juin 2013 ? 9h00, ? l'IRIT, Universit? Paul Sabatier, 118 Route de Narbonne, 31400 TOULOUSE - salle des th?ses. Vous ?tes ?galement cordialement convi?s au pot qui suivra. Bien cordialement, Baptiste Chardon --------------------------------------- Le jury de soutenance sera compos? de : Rapporteurs : Maite Taboada - Associate Professor (Simon Fraser University, Canada) Alexis Nasr - Professeur (LIF, Universit? Aix-Marseille) Examinateurs: Farah Benamara (Directrice de th?se) - Ma?tre de conf?rences (IRIT, Universit? Paul Sabatier Toulouse 3) Nicholas Asher (Directeur de th?se) - Directeur de recherches (IRIT, Universit? Paul Sabatier Toulouse 3 - CNRS) Yvette Yannick Mathieu - Directeur de recherches (Universit? Paris 7 - CNRS) Florence S?des - Professeur (IRIT, Universit? Paul Sabatier Toulouse 3) Membre invit?: Patrick S?gu?la - G?rant (Synapse D?veloppement, Toulouse) ------------------------------------------ R?sum? La structure discursive d'un texte est un ?l?ment essentiel ? la compr?hension du contenu v?hicul? par ce texte. Elle affecte, par exemple, la structure temporelle du texte, ou encore l'interpr?tation des expressions anaphoriques. La structure discursive a montr? son utilit? dans de nombreuses applications de TAL, telles que le r?sum? automatique, ou encore l?inf?rence textuelle. Dans cette th?se, nous aborderons les effets de la structure discursive sur l'analyse de sentiments. L?analyse des sentiments est un domaine de recherche extr?mement actif en traitement automatique des langues. En effet, ces derni?res ann?es ont vu se multiplier les sources de donn?es textuelles porteuses d'opinion disponibles sur le web : avis d'internautes, de plus en plus centralis?s par les moteurs de recherche, forums, r?seaux sociaux, enqu?tes consommateurs effectu?es par les grandes marques. Devant cette abondance de donn?es et de sources, l'automatisation de la synth?se des multiples avis devient cruciale pour obtenir efficacement une vue d'ensemble des opinions sur un sujet donn?. L'int?r?t de ces donn?es est consid?rable, pour les soci?t?s qui souhaitent obtenir un retour client sur leurs produits ou leur image de marque comme pour les personnes souhaitant se renseigner pour un achat, une sortie, ou un voyage. La plupart des travaux actuels proposent une analyse des opinions au niveau du document ou au niveau de la phrase en ignorant la structure discursive. Dans cette th?se, nous nous pla?ons dans le contexte de la th?orie de la SDRT (Segmented Discourse Representation Theory) et proposons de r?pondre aux questions suivantes : - Existe-t-il un lien entre la structure discursive d?un document et les opinions ?mises dans ce m?me document ? - Quel est le r?le des relations de discours dans la d?termination du caract?re objectif ou subjectif d?un segment textuel ? - Quel est le r?le des ?l?ments linguistiques, comme la n?gation et la modalit?, lors de la d?termination de la polarit? d?un segment textuel subjectif ? - Quel est l?impact de la structure discursive lors de la d?termination de l?opinion globale v?hicul?e dans un document ? - Est-ce qu'une approche bas?e sur le discours apporte une r?elle valeur ajout?e compar?e ? une approche classique bas?e sur la notion de ?sacs de mots? ? - Cette valeur ajout?e est-elle d?pendante du genre de corpus ? Afin de r?pondre ? ces questions, nous proposons dans un premier temps un sch?ma d'annotation sur deux niveaux : tout d'abord au niveau du segment de discours, o? chaque segment doit ?tre annot? selon l'opinion qu'il v?hicule, et ensuite au niveau du document, o? tout segment doit ?tre reli? discursivement au reste du texte. Dans le but d'?tudier l'impact des contraintes de genre du texte, notre campagne d'annotation a ?t? conduite sur deux corpus de genres diff?rents en fran?ais : commentaires de film d'une part, et commentaires d'articles de presse d'autre part. Nous proposons ensuite une architecture informatique permettant d?analyser les opinions dans le discours selon diff?rents niveaux de grain : - Au niveau du segment o? nous proposons de s?lectionner les segments discursifs porteurs d'opinion du document ? l'aide de deux classifieurs parall?les. La pr?sence de traits discursifs permet de reconna?tre une part importante des segments implicites, c'est-?-dire des segments ne comportant pas d'opinion lexicalis?e. - Au niveau des expressions d?opinion au sein d?un segment o? nous pr?sentons une ?tude de l'effet linguistique des op?rateurs venant alt?rer les caract?ristiques a priori d'une expression d'opinion : n?gations, intensifieurs, modaux. Nous proposons ensuite un mod?le de calcul, d'inspiration g?om?trique, permettant de d?terminer finement l'impact de ces op?rateurs, et ainsi de d?terminer les caract?ristiques de l'opinion au niveau du segment. - Au niveau du document o? nous comparons plusieurs approches de remont?e de l'opinion depuis le niveau des segments de discours jusqu'au niveau du document, afin de calculer l'opinion globale v?hicul?e par celui-ci. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:09:43 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:09:43 +0200 Subject: Seminaire: Apprentissage semi supervise pour l'analyse syntaxique, Alexis Nasr, mardi 11 juin, IRIT Message-ID: Date: Tue, 04 Jun 2013 13:51:09 +0200 From: benamara zitoune farah Message-ID: <51ADD4AD.7090801 at irit.fr> -------------------------------------------- S?minaire IRIT: mardi 11 juin ? 14h salle des th?ses. Titre : apprentissage semi supervis? pour l'analyse syntaxique R?sum? : Dans ce s?minaire, je mettrai en avant les limites des analyseurs syntaxique probabilistes appris sur corpus ?tiquet?s en syntaxe. En particulier, je montrerai que les corpus utilis?s pour l'apprentissage, mais aussi les hypoth?ses d'ind?pendance faites par les mod?les d'analyse syntaxique ne permettent pas de prendre en compte des ph?nom?nes linguistiques importants, en particulier les contraintes de s?lection et les cadres de sous cat?gorisation. Je montrerai alors comment un corpus non ?tiquet? permet d'acqu?rir des informations relevant de ces deux ph?nom?nes et je montrerai comment faire pour int?grer ces connaissances dans un analyseur syntaxique ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:08:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:08:03 +0200 Subject: Cursus: Master SdL, double orientation Lexique et Psycholinguistique Message-ID: Date: Tue, 04 Jun 2013 12:41:59 +0200 From: Fiammetta NAMER Message-ID: <51ADC477.4090806 at univ-lorraine.fr> X-url: https://ciell.univ-lorraine.fr/Candidature/indexCandidature.jsp *Master SDL, sp?cialit? Langues Textes Discours, double orientation ? Lexique -- Psycholinguistique de l'Acquisition ? Nancy (Universit? de Lorraine) Rentr?e 2013-2014* A la rentr?e 2013, le Master Sciences du Langage de l'Universit? de Lorraine comporte deux sp?cialit?s : "Didactique du FLE et du FLI" (FLE/FLI) et "Langues Textes et Discours" (LTD) offertes sur les sites de Nancy et Metz. A Nancy,*la sp?cialit? LTD consiste en une double orientation "Lexique-Psycholinguistique de l'Acquisition",* qui repose sur deux th?matiques clefs du laboratoire ATILF (http://www.atilf.fr/), auquel est adoss? le Master : - le lexique - l'acquisition du langage. Outre le*perfectionnement dans les disciplines linguistiques fondamentales* connexes au lexique (s?mantique, syntaxe, typologie, discours, pragmatique), les enseignements obligatoires sont : . lexicologie, lexicographie, morphologie, morphophonologie, interface lexique-syntaxe, connecteurs, temps & aspect, pour la partie "Lexique"**(144h); ET . **psycholinguistiquede l'acquisition, d?veloppement normal et pathologique du langage, Linguistique de la LSF, Langue vivante LSF, pour la partie "Psycholinguistique de l'Acquisition"**(120h). *Le quatri?me semestre de ce Master *est consacr? soit ? un*stage en milieu professionnel* dans l'un des deux domaines, soit ? la *r?alisation d'un m?moire de recherche* dans l'un des domaines de recherche du laboratoire. *Contacts :* . Sp?cialit? LTD, parcours "Lexique-Psycholinguistique de l'Acquisition", Nancy : Pr Fiammetta Namer (fiammetta.namer at univ-lorraine.fr) *Autres sp?cialit?s du master SDL :* . Sp?cialit? Linguistique, parcours "Textes et Discours", Metz : Pr Guy Achard-Bayle (guy-achard.bayle at univ-lorraine.fr) . Sp?cialit? Didactique du FLE / FLI, Nancy : Pr Herv? Adami (herve.adami at univ-lorraine.fr) . Sp?cialit? Didactique du FLE, Metz, : Pr Mohammed Kara (mohammed.kara at univ-lorraine.fr) *Informations administratives : * Mme Fabienne Dumont, P?le Master - SDL (fabienne.dumont at univ-lorraine.fr) Inscriptions : https://ciell.univ-lorraine.fr/Candidature/indexCandidature.jsp ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 5 07:11:09 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Jun 2013 09:11:09 +0200 Subject: These: Geraldine Walther, Sur la canonicite en morphologie: perspective empirique, formelle et computationnelle Message-ID: Date: Wed, 5 Jun 2013 00:50:55 +0200 From: G?raldine Walther Message-Id: <7CCB140C-DC80-4710-9EF1-102204F99BE8 at linguist.univ-paris-diderot.fr> Bonjour, j'ai le plaisir de vous inviter ? ma soutenance de th?se, qui s'intitule : "Sur la canonicit? en morphologie: perspective empirique, formelle et computationnelle". La soutenance aura lieu le mardi 11 juin, ? 15h, en salle 255 (2?me ?tage) du b?timent Olympe de Gouges 8 rue Albert Einstein, 75013 Paris de l'Universit? Paris Diderot. Vous ?tes ?galement cordialement invit?s au pot qui suivra en salle 533, au 5?me ?tage du m?me b?timent. Bien cordialement, G?raldine Walther ----- Composition du jury : Anne Abeill?, Professeur des Universit?s, Universit? Paris Diderot, LLF (directrice) Olivier Bonami, Ma?tre de Conf?rences, Universit? Paris Sorbonne, LLF (co-directeur) Greville G. Corbett, Professeur, University of Surrey (rapporteur) Bernard Fradin, DR, CNRS LLF (pr?sident) Nabil Hathout, Directeur de Recherches, CNRS CLLE-ERSS (rapporteur) Gregory T. Stump, Professeur, University of Kentucky (examinateur) ----- R?sum? : L?objectif principal de ma th?se est de proposer un mod?le formel de la morphologie flexionnelle, nomm? PARSLI (Paradigm Shape and Lexicon Interface) qui soit typologiquement fond? et qui permette de concevoir, d?impl?menter et d??valuer quantitativement des analyses formelles de syst?mes flexionnels particuliers. Il repose pour cela sur les concepts de la typologie canonique (Corbett, 2003, 2007). Fond? sur une approche inf?rentielle-r?alisationnelle de la morphologie (Stump, 2001), ce mod?le permet notamment de formuler explicitement le rapport qu?entretient le lexique avec les caract?ristiques morphologiques observables dans les paradigmes flexionnels des lex?mes et d??valuer la part de r?gularit? et d?irr?gularit? flexionnelle inh?rente ? la d?finition de chacun d?entre eux. PARSLI est impl?ment? dans un formalisme d?di?, Alexinaparsli (Sagot & Walther, 2013), qui constitue une nouvelle version du formalisme lexical Alexina (Sagot, 2010), ? l'origine con?u pour le traitment automatique des langues (TAL). PARSLI s?accompagne d?un ?ventail de mesures quantitatives. La premi?re est une mesure de compacit? reposant sur le concept de longueur de description minimale (Minimal Description Length ou MDL (Rissanen, 1984)) emprunt?e ? la th?orie de l?information (Walther & Sagot, 2011). Elle permet d??valuer l??conomie descriptive d?une description donn?e et de la comparer quantitativement ? des descriptions concurrentes. Dans la th?se, cette mesure sert ? ?valuer quantitativement la compacit? de quatre descriptions impl?ment?es concurrentes de la flexion verbale du fran?ais, de deux descriptions concurrentes de la flexion verbale du latin, ainsi que de deux descriptions impl?ment?es du maltais. Le second ensemble de mesures est un ensemble de mesures de canonicit? permettant de quantifier le degr? de canonicit? observable dans les paradigmes isol?s ou les syst?mes flexionnels complets d?une langue particuli?re d?crite en PARSLI. Il s?agit ainsi d?un moyen de rendre quantifiable la notion qualitative de canonicit? flexionnelle d?velopp? Corbett (2007). Dans la th?se, cet ensemble de mesures a ?t? appliqu?e (en plus de la mesure de compacit?) pour comparer deux descriptions du syst?me verbal latin, dont l?une d?fend une approche d?rivationnelle du passif latin tandis que l?autre suit l?analyse flexionnelle plus traditionnelle et a montr? l?influence des choix descriptifs sur les caract?ristiques typologiques (canoniques) des syst?mes d?crits. En parall?le, ma th?se aborde ?galement, ? partir de descriptions de syst?mes flexionnels, les questions de la fronti?re entre la morphologie et les autres composantes de la langue, notamment par l??tude de donn?es du maltais (interface morphologie flexionnelle/phonologie, du latin (interface morphologie flexionnelle/d?rivationnelle) et du kurde sorani (interface morphologie flexionnelle/syntaxe). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:49:40 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:49:40 +0200 Subject: Cursus: Master en sciences du langage, specialite Ergonomie Cognitive et Ingenierie Linguistique (ECIL), Toulouse Message-ID: Date: Wed, 05 Jun 2013 14:16:36 +0200 From: C?cile Fabre Message-ID: <51AF2C24.2060809 at univ-tlse2.fr> X-url: http://w3.sc-du-langage.univ-tlse2.fr/master-ecil.php Un master en sciences du langage sp?cialit? Ergonomie Cognitive et Ing?nierie Linguistique (ECIL) est propos? ? l'Universit? Toulouse 2 - Le Mirail. http://w3.sc-du-langage.univ-tlse2.fr/master-ecil.php Objectifs de la formation --------------------------------- Le master ECIL associe des comp?tences dans trois disciplines : linguistique, traitement automatique des langues (TAL) et ergonomie cognitive. Son objectif est de former des sp?cialistes du traitement informatis? des donn?es langagi?res. A l?issue du master, les ?tudiants sont capables de participer au d?veloppement de solutions informatiques pour r?pondre aux besoins qui s?expriment actuellement en mati?re de traitement automatis? du langage : recherche d?information, veille, gestion des connaissances, aide ? la r?daction, etc. Ils sont en mesure de concevoir des ressources linguistiques adapt?es, d??valuer et d?int?grer des syst?mes existants dans des situations de travail vari?es ou de participer au d?veloppement de nouveaux logiciels de TAL. Des comp?tences dans le champ de l?ergonomie cognitive permettent de concevoir des syst?mes r?ellement adapt?s ? l?activit? et aux besoins des utilisateurs. Les ?tudiants form?s en ergonomie sont capables d?expertiser ces besoins pour mieux y r?pondre. Contexte -------------------------------- Cette formation s'appuie sur un laboratoire de recherche associ? au CNRS (CLLE : Cognition, Langage, Langues, Ergonomie) regroupant ? Toulouse des chercheurs et des enseignants chercheurs actifs tant dans le domaine de l'ergonomie cognitive (CLLE-LTC) que dans celui de la linguistique et du traitement automatique des langues (CLLE-ERSS). Le master ECIL et le laboratoire CLLE ont tous deux ?t? ?valu?s A+. Le master s'appuie par ailleurs sur le tissu industriel toulousain et un r?seau professionnel construit depuis une vingtaine d'ann?es. Public vis? -------------------------------- (les conditions pr?cises d'admission sont ? consulter sur le site de la formation, voir rubrique ci-dessous). La formation s'adresse en M1 ? des ?tudiants titulaires d'une licence, ayant des comp?tences en linguistique, et int?ress?s par les nouvelles technologies. Les candidats ? l'acc?s en M2 doivent opter pour l'un des deux parcours de M2 : * M2 ECIL parcours professionnel, qui int?gre tr?s ?troitement les comp?tences ergonomie cognitive et ing?nierie linguistique, et qui comporte des projets tutor?s et un stage de longue dur?e. * M2 ECIL parcours recherche TAL, qui permet de r?aliser un travail de recherche approfondi en linguistique dans le domaine du TAL. Les candidats au M2 doivent ?tre titulaires d'un M1 en sciences du langage dans le domaine du TAL, ou pouvoir faire ?tat de comp?tences conjugu?es en linguistique et en informatique. Informations compl?mentaires -------------------------------------------- Pour plus d'information (admission, d?bouch?s, organisation des enseignements, etc.) vous pouvez consulter le site de la formation : http://w3.sc-du-langage.univ-tlse2.fr/master-ecil.php et contacter la responsable, C?cile Fabre : cecile.fabre at univ-tlse2.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:55:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:55:32 +0200 Subject: Job: Poste en reconnaissance de la parole (6 a 12 mois - Geneve) Message-ID: Date: Wed, 5 Jun 2013 15:32:58 +0200 From: Jean-Philippe Goldman Message-ID: -----FRENCH BELOW----- The CUI/University of Geneva seeks a qualified candidate for one Specialist in speech processing for a period of 6 months (class 13; 5988.-). Depending on hiring rate (100% to 50%), the contract will be extended up to 12 months. In the context of a newly granted Swiss National Science Foundation Agora project, the CUI will collaborate with the Phonetischen Laboratorium of Universit?t Zurich (UZH) on "Swiss VoiceApp - Your voice. Your identity.? The project will combine speech recognition and processing as well as linguistic knowledge to provide a smartphone application for Swiss German dialect recognition and some information on the user?s voice. The main tasks of successful candidate will be the development of speech recognition engine based on speech corpora of dialectal variants. Knowledge of speech software, namely HTK and Praat, are highly recommended. Applicant should possess a master?s degree or an engineer diploma in computational linguistics, or in computer science but with strong knowledge of speech processing. Given the focus on Swiss German dialects, preference will be given to speaker of German. The start date is expected to be during autumn/winter 2013; the position will remain open until filled. Contact Please send (1) your CV, (2) a copy of your degree(s), (3) a short letter explaining that your skills and your interests fit in the project, to Jean-Philippe Goldman, before July 31th 2013, preferably electronically or by mail at the address below: Jean-Philippe Goldman CUI / UNI-Rondeau CH-1227 Carouge, Switzerland Jean-Philippe.Goldman at unige.ch ======================================================================== Le CUI / Universit? de Gen?ve cherche ? engager un/une Sp?cialiste en traitement de la parole pour un emploi temporaire d?une dur?e de 6 mois, (classe 13 ; 5988.-).Selon le taux d?engagement (de 100% ? 50%) le contrat peut ?tre ?tendu ? 12 mois. Dans le contexte d?un projet r?cemment financ? par le Fonds National de la Recherche, le CUI collaborera avec le Phonetisches Laboratorium de l?Universit? Zurich (UZH) sur le projet "Swiss VoiceApp - Your voice. Your identity.? Le projet combinera des techniques de reconnaissance de la parole et des connaissances linguistiques pour produire une application pour smartphone visant ? l?identification de dialectes suisses al?maniques et de fournir ? l?utilisateur des informations sur sa propre voix. La t?che principale du candidat s?lectionn? sera le d?veloppement d?un syst?me de reconnaissance de la parole bas? sur des corpus de variantes dialectales. La connaissance de logiciels de parole tels que HTK est essentielle. Le candidat devra poss?der un MA ou un dipl?me d?ing?nieur en linguistique computationnelle, ou en informatique mais avec de bonnes connaissances en traitement de la parole. ?tant donn? l?orientation germanophone du projet, une pr?f?rence sera donn?e ? un locuteur de l?allemand. Le contrat pourra commencer en automne ou hiver 2013. Contact : Veuillez envoyer (1) votre CV, (2) une copie de vos dipl?mes, (3) une lettre sur vos comp?tences et int?r?ts en rapport avec le projet, ? Jean-Philippe Goldman, avant le 31 juillet 2013, de pr?f?rence par voie ?lectronique, ou par courrier ? l?adresse suivante: Jean-Philippe Goldman CUI / UNI-Rondeau CH-1227 Carouge, Switzerland Jean-Philippe.Goldman at unige.ch ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:56:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:56:35 +0200 Subject: Info: Charte Ethique & Big Data Message-ID: Date: Wed, 5 Jun 2013 18:14:16 +0200 (CEST) From: Karen Fort Message-ID: <197789038.3242875.1370448856558.JavaMail.root at loria.fr> X-url: http://wiki.ethique-big-data.org Charte ?thique & Big Data Suite ? plusieurs articles [1, 2, 3] mettant en avant les probl?mes d'?thique, de droit et de qualit?, li?s ? l'utilisation du Crowdsourcing pour la constitution de ressources langagi?res, des chercheurs et des industriels se sont r?unis afin de proposer un moyen pratique d'encadrer la production de corpus, et de limiter ces probl?mes r?currents de droit, d'?thique, de tra?abilit?, de qualit? etc qui sont attach?s ? cette activit?. La charte dont nous annon?ons ici la parution est le r?sultat du travail de ce groupe. Valoriser les grands volumes de donn?es La charte est une co?construction d?acteurs majeurs, acad?miques et industriels, pour faciliter la cr?ation, la diffusion et l'utilisation des grands volumes de donn?es (Big Data) et participer ainsi ? leur valorisation. Une r?ponse concr?te ? de nouveaux enjeux La cr?ation, la maintenance, la diffusion et l'utilisation de donn?es de toutes sortes est un enjeu majeur. Qu'il s'agisse de corpus de parole, de donn?es d?mographiques, personnelles, de relev?s de capteurs, de documents, th?saurus, ontologies. Ces bases de donn?es sont essentielles ? la recherche, mais ?galement ? la cr?ation et la maintenance de nouveaux services. Cependant, l'utilisation ou la r?utilisation des donn?es se heurtent trop souvent ? des freins qui en emp?chent l'exploitation optimale : provenance parfois opaque, ?thique douteuse, tra?abilit? inexistante, protection intellectuelle incertaine, une qualit? difficile ? ?valuer a priori. D?s lors, s?curiser la cr?ation de donn?es est un facteur de comp?titivit? et un devoir. L?objectif de la charte ?thique & Big Data est de fournir des garanties concernant la maintenabilit? des donn?es, leur tra?abilit?, leur qualit?, l'impact sur l'emploi, assurer l'?thique et r?duire le risque juridique. Elle vise ? harmoniser les rapports entre producteurs, fournisseurs et utilisateurs de donn?es sur le plan du respect des lois, de celui de l'?thique, et garantir la confiance dans les rapports entre l'ensemble des acteurs impliqu?s. Un travail ? plusieurs voix Cette charte a ?t? con?ue ? l?initiative de l?APROGED, de l?ATALA, de l?AFCP et de CAP DIGITAL, par un groupe de travail anim? par Alain Couillaut. Plusieurs associations et partenaires ont collabor? ? sa r?daction et ? sa diffusion. La charte comprend quatre volets : la description des donn?es, la tra?abilit?, la propri?t? intellectuelle et les r?glementations sp?cifiques. Vers l'adoption ... Adopt?e par les partenaires de l?Alliance Big Data, la Charte ?thique & Big Data l?est d?j? ?galement par des producteurs de donn?es du secteur de la recherche. Elle est diffus?e sous licence Creative Common et est disponible sur le wiki http://wiki.ethique-big-data.org . Cette version est une premi?re ?tape : les travaux continuent pour l?optimiser afin de r?pondre de fa?on plus compl?te aux diff?rents besoins. Alain Couillault, Gilles Adda, Kar?n Fort, Hugues de Mazancourt au nom des r?dacteurs de la charte [1] G. Adda, J. Mariani Language resources and Amazon Mechanical Turk: legal, ethical and other issues LISLR2010, ``Legal Issues for Sharing Language Resources workshop'', LREC2010, Malta, 17 mai 2010 [2] K. Fort, G. Adda, K. Bretonnel-Cohen Amazon mechanical Turk: gold mine or coal mine? Computational Linguistics, 2011, vol. 37, n?2, 413-420 [3] B. Sagot, K. Fort, G. Adda, J-J. Mariani, B. Lang, Un turc m?canique pour les ressources linguistiques : critique de la myriadisation du travail parcellis? 18?me Conf?rence sur le Traitement Automatique des Langues Naturelles (TALN 2011), Montpellier, France, du au 2011. Kar?n Fort ATER ENSMN Loria, ?quipe S?magramme Bureau C303 +33 (0)3 54 95 86 54 http://www.loria.fr/~fortkare/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:52:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:52:27 +0200 Subject: Appel: LREC 2014 Message-ID: Date: Wed, 05 Jun 2013 14:56:12 +0200 From: ELRA ELDA Information Message-ID: <51AF356C.4040506 at elda.org> *LREC 2014 - 9th Conference on Language Resources and Evaluation* FIRST CALL FOR PAPERS Harpa Conference Center, REYKJAVIK, ICELAND MAIN CONFERENCE: 28-29-30 MAY 2014 WORKSHOPS and TUTORIALS: 26-27-31 MAY 2014 Conference web site: http//www.lrec-conf.org/lrec2014 Follow us on Twitter: @LREC2014 https://twitter.com/LREC2014 ELRA is glad to announce the 9th edition of LREC, organised with the support of a wide range of international organisations. *CONFERENCE AIMS* LREC is the major event on Language Resources (LRs) and Evaluation for Human Language Technologies (HLT). LREC aims to provide an overview of the state-of-the-art, explore new R&D directions and emerging trends, exchange information regarding LRs and their applications, evaluation methodologies and tools, on-going and planned activities, industrial uses and needs, requirements coming from e-science and e-society, with respect both to policy issues and to scientific/technological and organisational ones. LREC provides a unique forum for researchers, industrials and funding agencies from across a wide spectrum of areas to discuss problems and opportunities, find new synergies and promote initiatives for international cooperation, in support of investigations in language sciences, progress in language technologies (LT) and development of corresponding products, services and applications, and standards. *CONFERENCE TOPICS* * Issues in the design, construction and use of LRs: text, speech, multimodality* * Guidelines, standards, best practices and models for LRs interoperability * Methodologies and tools for LRs construction and annotation * Methodologies and tools for extraction and acquisition of knowledge * Ontologies, terminology and knowledge representation * LRs and Semantic Web * LRs and Crowdsourcing * Metadata for LRs and semantic/content mark-up * Exploitation of LRs in systems and applications * Sign language, multimedia information and multimodal communication LRs in systems and applications such as: information extraction, information retrieval, audio-visual and multimedia search, speech dictation, meeting transcription, Computer Aided Language Learning, training and education, mobile communication, machine translation, speech translation, summarisation, web services, semantic search, text mining, inferencing, reasoning, etc. * Interfaces: (speech-based) dialogue systems, natural language and multimodal/multisensorial interactions, voice-activated services, etc. * Use of (multilingual) LRs in various fields of application like e-government, e-culture, e-health, e-participation, mobile applications, digital humanities, etc. * Industrial LRs requirements, user needs * Issues in LT evaluation* * LT evaluation methodologies, protocols and measures * Validation and quality assurance of LRs * Benchmarking of systems and products * Usability evaluation of HLT-based user interfaces and dialogue systems * User satisfaction evaluation * General issues regarding LRs & Evaluation* International and national activities, projects and collaboration Priorities, perspectives, strategies in national and international policies for LRs Multilingual issues, language coverage and diversity, less-resourced languages Open, linked and shared data and tools, open and collaborative architectures Organisational, economical, ethical and legal issues. *LREC 2014 HOT TOPICS* *Big Data, Linked Open Data, LRs and HLT* The ever-increasing quantities of large and complex digital datasets, structured or unstructured, multilingual, multimodal or multimedia, pose new challenges but at the same time open up new opportunities for HLT and related fields. Ubiquitous data and information capturing devices, social media and networks, the web at large with its big data/knowledge bases and other information capturing/aggregating/publishing platforms are providing useful information and/or knowledge for a wide range of LT applications. LREC 2014 puts a strong emphasis on the synergies of the big Linked Open Data and LRs/LT communities and their complementarity in cracking LT problems and developing useful applications and services. *LRs in the Collaborative Age* The amount of collaboratively generated and used language data is constantly increasing and it is therefore time to open a wide discussion on such LRs at LREC. There is a need to discuss the types of LRs that can be collaboratively generated and used. Are lexicons, dictionaries, corpora, ontologies (of language data), grammars, tagsets, data categories, all possible fields in which a collaborative approach can be applied? Can collaboratively generated LRs be standardised/harmonised? And how can quality control be applied to collaboratively generated LRs? How can a collaborative approach ensure that less-resourced languages receive the same digital dignity as mainstream languages? There is also a need to discuss legal aspects related to collaboratively generated LRs. And last but not least: are there different types of collaborative approaches, or is the Wikimedia style the best approach to collaborative generation and use of LRs? *LREC 2014 SPECIAL HIGHLIGHT* *Share your LRs!* In addition to describing your LRs in the LRE Map -- now a normal step in the submission procedure of many conferences -- LREC 2014 recognises that the time is ripe to launch another important initiative, the LREC Repository of shared LRs! When submitting a paper, you will be offered the possibility to share your LRs (data, tools, web-services, etc.), uploading them in a special LREC META-SHARE repository set up by ELRA. Your LRs will be made available to all LREC participants before the conference, to be re-used, compared, analysed, ... This effort of sharing LRs, linked to the LRE Map for their description, may become a new "regular" feature for conferences in our field, thus contributing to creating a common repository where everyone can deposit and share data. *PROGRAMME* The Scientific Programme will include invited talks, oral presentations, poster and demo presentations, and panels, in addition to a keynote address by the winner of the Antonio Zampolli Prize. *SUBMISSIONS AND DATES* Submission of proposals for oral and poster (or poster+demo) papers: 15 October 2013 Abstracts should consist of about 1500-2000 words, will be submitted through START and will be peer-reviewed. Submission of proposals for panels, workshops and tutorials: 15 October 2013 Proposals should be submitted via an online form on the LREC website and will be reviewed by the Programme Committee. *PROCEEDINGS* The Proceedings will include both oral and poster papers, in the same format. There is no difference in quality between oral and poster presentations. Only the appropriateness of the type of communication (more or less interactive) to the content of the paper will be considered. In addition a Book of Abstracts will be printed. *CONFERENCE PROGRAMME COMMITTEE * Nicoletta Calzolari -- CNR, Istituto di Linguistica Computazionale "Antonio Zampolli", Pisa - Italy (Conference chair) Khalid Choukri -- ELRA, Paris - France Thierry Declerck -- DFKI GmbH, Saarbr?cken - Germany Hrafn Loftsson -- School of Computer Science, Reykjav?k University - Iceland Bente Maegaard -- CST, University of Copenhagen - Denmark Joseph Mariani -- LIMSI-CNRS & IMMI, Orsay - France Asuncion Moreno -- Universitat Polit?cnica de Catalunya, Barcelona - Spain Jan Odijk -- UIL-OTS, Utrecht - The Netherlands Stelios Piperidis -- Athena Research Center/ILSP, Athens - Greece ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:54:19 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:54:19 +0200 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Thu, 06 Jun 2013 10:18:51 +0200 From: ELRA ELDA Information Message-ID: <51B045EB.6090607 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1197 X-url: http://catalog.elra.info/product_info.php?products_id=1198 X-url: http://catalog.elra.info/product_info.php?products_id=1199 X-url: http://catalog.elra.info/product_info.php?products_id=1200 X-url: http://catalog.elra.info/product_info.php?products_id=1201 X-url: http://catalog.elra.info/product_info.php?products_id=1202 X-url: http://catalog.elra.info/product_info.php?products_id=1203 X-url: http://catalog.elra.info/product_info.php?products_id=1204 X-url: http://catalog.elra.info/product_info.php?products_id=1205 X-url: http://catalog.elra.info/product_info.php?products_id=1206 X-url: http://catalog.elra.info/product_info.php?products_id=1196 Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** We are happy to announce that 10 new Pronunciation Dictionaries and 1 new Evaluation Package are now available in our catalogue. * The GlobalPhone Pronunciation Dictionaries:_* GlobalPhone is a multilingual speech and text database collected at Karlsruhe University, Germany. The GlobalPhone pronunciation dictionaries contain the pronunciations of all word forms found in the transcription data of the GlobalPhone speech & text database. The pronunciation dictionaries are currently available in 10 languages: Arabic (29230 entries/27059 words), Bulgarian (20193 entries), Czech (33049 entries/32942 words), French (36837 entries/20710 words), German (48979 entries/46035 words), Hausa (42662 entries/42079 words), Japanese (18094 entries), Polish (36484 entries), Portuguese (Brazilian) (54146 entries/54130 words) and Swedish (about 25000 entries). Other 8 languages will also be released: Chinese-Mandarin, Croatian, Korean, Russian, Spanish (Latin American), Thai, Turkish, and Vietnamese. Special prices are offered for a combined purchase of several GlobalPhone languages. Available GlobalPhone Pronuncation Dictionaries are listed below (click on the links for further details): ***ELRA-S0340 GlobalPhone French Pronunciation Dictionary*** For more information, see: http://catalog.elra.info/product_info.php?products_id=1197 **ELRA-S0341 GlobalPhone German Pronunciation Dictionary** For more information, see: http://catalog.elra.info/product_info.php?products_id=1198 **ELRA-S0348 GlobalPhone Japanese Pronunciation Dictionary** For more information, see: http://catalog.elra.info/product_info.php?products_id=1199 **ELRA-S0350 GlobalPhone Arabic Pronunciation Dictionary ** For more information, see: http://catalog.elra.info/product_info.php?products_id=1200 *ELRA-S0351 GlobalPhone Bulgarian Pronunciation Dictionary *For more information, see: http://catalog.elra.info/product_info.php?products_id=1201 *ELRA-S0352 GlobalPhone Czech Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1202 *ELRA-S0353 GlobalPhone Hausa Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1203 *ELRA-S0354 GlobalPhone Polish Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1204 *ELRA-S0355 GlobalPhone Portuguese (Brazilian) Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1205 *ELRA-S0356 GlobalPhone Swedish Pronunciation Dictionary* For more information, see: http://catalog.elra.info/product_info.php?products_id=1206 ______________________ *ELRA-E0041 CHIL 2007+ Evaluation Package* The CHIL Seminars are scientific presentations given by students, faculty members or invited speakers in the field of multimodal interfaces and speech processing. The language is European English spoken by non native speakers. The recordings comprise the following: videos of the speaker and the audience from 4 fixed cameras, frontal close ups of the speaker, close talking and far-field microphone data of the speaker's voice and background sounds. The CHIL 2007+ Evaluation Package includes: 1) CHIL 2007 Evaluation Package (see ELRA-E0033) and 2) additional annotations which have been created within the scope of the Metanet4u Project (ICT PSP No 270893), sponsored by the European Commission. For more information, see: http://catalog.elra.info/product_info.php?products_id=1196 For more information on the catalogue, please contact Val?rie Mapelli mapelli at elda.org Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:19:58 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:19:58 +0200 Subject: Appel: Terminology and Artificial Intelligence TIA 2013, Paris, Oct. 2013 Message-ID: Date: Fri, 07 Jun 2013 19:37:16 +0200 From: Nathalie Aussenac-Gilles Message-ID: <51B21A4C.6040002 at irit.fr> X-url: http://flores.lipn.univ-paris13.fr/tia2013/ Third Call for papers Terminologie et Intelligence Artificielle TIA 2013 Terminology and Artificial Intelligence TIA 2013 Terminology for a networked society: Recent advances in multilingual knowledge-based resources Paris, 28-29-30 octobre 2013 http://flores.lipn.univ-paris13.fr/tia2013/ IMPORTANT DATES Abstract submission: 21 June 2013 Paper submission (long and short papers): 28 June 2013 Notification to authors: 3 September 2013 Final camera-ready paper due: 23 September 2013 Conference: 28-30 October 2013 INTRODUCTION and MOTIVATION TIA 2013 will be the 10th in a series of successful events which, for the most part, initially took place in the francophone world. Over a period of almost 20 years ? the first conference was held in 1995 ? TIA has increasingly attracted the attention of many researchers and practitioners all over the world, and its work has become truly international. The aim of TIA 2013 is to provide an overview of the new ways in which multilingual terminology is present in an ever-increasing networked society, and to pay special attention both to the methods applied in the conceptualization of domain knowledge and to the applications and tools that will meet the requirements of e-society. In this way, terminology, linguistics and knowledge engineering provide the basis on which many other disciplines develop their applications such as domain ontologies, natural language processing tools, multilingual knowledge-based tools and web-based linguistic applications. New approaches to the standardization and to the reuse and integration of different tools designed to facilitate work in institutions, companies and society in general will be welcome. The TIA 2013 Conference aims to promote interdisciplinary research focusing on the intersection of different disciplines that deal with terminological aspects and knowledge engineering resources. Papers may address both theoretical questions and methodological aspects on these issues, as well as interdisciplinary approaches developed to facilitate convergence and co-operation in terminological aspects of importance to society. TOPICS OF INTEREST Terminology and ontology acquisition and management - Applying pattern recognition to enriching terminological resources - Lexicons, thesauri and ontologies as semantic resources - Lexicons and ontologies as means for knowledge transfer - Reusing, standardizing and merging terminological or ontological resources - Multilingual terminology extraction - Multilinguality and multimodality in terminological resources - Management of language resources Terminology and knowledge representation - Ontological semantics and linguistics - Ontology localization - Development of multimedia terminological resources - Terminology alignment in parallel corpora and other lexical resources - Representation of terms and conceptual relations in knowledge-based applications - Comparative studies of terminological resources and/or ontological resources from different languages, domains and approaches - Terminological resources in the 21st century - Harmonization of format and standards in terminological resources Terminology and ontologies for applications - Interoperability and reusability in knowledge-based tools and applications - Models and metamodels in annotating semantic and terminological resources - New R &D directions in terminology for industrial uses and needs SUBMISSIONS TIA 2013 solicits both regular papers, which present significant work, and short papers, which typically present work in progress or a smaller, focused contribution. The program committee may decide to change the category of a paper before acceptance. Papers can be written either in English or French. Regular papers should not exceed 8 pages in ACL-HLT 2011 format (see below for LaTeX and MS Word style files), including figures, examples and references. The mode of presentation of long papers (orally or as posters) will be decided based on the nature rather than on the quality of the work. Short papers should not exceed 4 pages in the same format as regular papers. They will also be presented orally or as posters at the conference depending on the nature of the work. Authors should submit the papers in PDF through the TIA submission page at https://www.easychair.org/conferences/?conf=tia2013 At the submission page, the author(s) must provide the following information: 1. name(s) of author(s) 2. affiliation(s), addresses, fax and e-mail 3. title of the paper 4. 5 to 10 key words in English or in French (in both languages if possible) 5. abstract in English or in French (in both languages if possible) (200 words maximum for each) As the reviewing will be blind, the paper itself must not include the authors' names and affiliations at submission time. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ...", must be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ...". Reviews of full papers (long and short) will be performed by three reviewers. STYLES FILES Authors are required to use the following style files so that the papers follow the conference format. Latex: tia2013latex.tgz MS Word: tia2013word.zip IMPORTANT: Remove authors? information from your manuscripts when submitting them for blind review (see above)! PROGRAMME COMMITTEE Chairs Guadalupe Aguado de Cea (OEG, Universidad Polit?cnica de Madrid, Spain) Nathalie Aussenac-Gilles (IRIT, CNRS, Toulouse, France) Contact :tia2013 at easychair.org Members Guadalupe Aguado de Cea (Universidad Polit?cnica de Madrid, Spain) Amparo Alcina (Universitat Jaume-I, Castell?n de la Plana, Spain) Sofia Ananiadou (NaCTeM, Manchester, UK) Nathalie Aussenac-Gilles (IRIT, Toulouse, France) Caroline Barri?re (CRIM, Montr?al, Canada) Paul Buitelaar (DERI, Galway, Ireland) Maria Teresa Cabr? (Universitat Pompeu Fabra, Barcelona, Spain) Farid Cerbah (Dassault Aviation, Paris, France) Jean Charlet (AP-HP& INSERM, Paris, France) Philipp Cimiano (University of Bielefeld, Germany) Anne Condamines (CLLE-ERSS, Toulouse, France) Lyne Da Sylva (EBSI, Montr?al, Canada) B?atrice Daille (LINA, Universit? de Nantes, Nantes, France) Val?rie Delavigne (Institut national du cancer, France) Pascaline Dury (Universit? Lyon 2, Lyon, France) Fidelia Ibekwe-San Juan (Universit? Lyon 3, Lyon, France) Kyo Kageura (University of Tokyo, Tokyo, Japan) Olivia Kwong (City University Hong Kong, Hong Kong, China) Marie-Claude L?Homme (OLST, Universit? de Montr?al, Canada) Elena Montiel-Ponsoda (Universidad Polit?cnica de Madrid, Spain) Adeline Nazarenko (LIPN, Universit? Paris 13, Villetaneuse, France) Mihako O'Hagan (Dublin City University, Dublin, Ireland) Pascale S?billot (IRISA, Rennes, France) Serge Sharoff (University of Leeds, Leeds, UK) Monique Slodzian (ERTIM-INALCO, Paris, France) Mari Carmen Suarez de Figueroa (Universidad Polit?cnica de Madrid, Spain) Sylvie Szulman (LIPN, Universit? Paris 13, Villetaneuse, France) Koichi Takeuchi (Okayama University, Okayama, Japan) Rita Temmerman (Erasmushogeschool, Bruxelles, Belgium) Yannick Toussaint (LORIA, Nancy, France) Spela Vintar (University of Ljubljana, Ljubljana, Slovenia) Pierre Zweigenbaum (LIMSI-CNRS& CRIM-INALCO, Paris, France) ORGANISING COMMITTEE TIA 20131 is organized by the RCLN (Repr?sentation des Connaissances et Langage Naturel) group of the LIPN lab at Paris 13 University. Local Chairs Adeline Nazarenko (LIPN, Paris 13, France) Syvlie Szulman (LIPN, Paris 13, France) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- -------------- next part -------------- An HTML attachment was scrubbed... URL: From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:16:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:16:24 +0200 Subject: Appel: GIR'13 Message-ID: Date: Fri, 7 Jun 2013 10:15:25 +0200 From: Mauro Gaio Message-Id: <9992A748-BED4-4598-940F-C342363811F2 at univ-pau.fr> X-url: http://www.geo.uzh.ch/~rsp/gir13/ 7th Workshop on Geographic Information Retrieval GIR'13 - First Call for Papers ---------------------------------------------------------------- http://www.geo.uzh.ch/~rsp/gir13/ ---------------------------------------------------------------- This is the first call for papers for the 7th Workshop on Geographic Information Retrieval (GIR'13), to be held on 5th November 2013 in conjunction with the ACM SIGSPATIAL 2013 conference in Orlando, Florida. The workshop continues the successful series of workshops held previously in cooperation with ACM SIGSPATIAL and in conjunction with SIGIR and CIKM conferences. The purpose of the workshop is to bring together members of the vibrant and growing community of researchers and practitioners working in the field of geographic information retrieval to discuss current research activity and potential future research directions. The subject and format of the workshop There is a vast quantity of information in text documents and other media that is referenced to geographic space and which is the subject of information search. The discipline of Geographical Information Retrieval (GIR) addresses this information demand. It is concerned with the development of methods to gain access to geographically-specific information originating in unstructured and semi-structured media such as text documents and images. The aim is thus to develop information systems that can automatically interpret the geographical terminology and spatial concepts that people use when recording and querying the information and that can retrieve information that is relevant to the user?s geographic information needs. GIR falls at the intersection of Information Retrieval (IR) and Geographical Information Science and focuses particularly on research and systems development for purposes of geo-information extraction, spatio-textual information indexing and management and spatially-oriented information retrieval. The workshop invites contributions on the following topics: - Detection, disambiguation and geocoding of geographical references in text; - User needs for geographic search; - Determination of the geographic focus of documents and media objects; - Interpretation of spatial natural language in documents and queries; - Extraction of geographically-specific facts from text; - Spatial indexing of documents and other media objects and of their information content; - Reasoning with and integration of structured geo-spatial facts for purposes of information retrieval; - Geo-spatial ontologies, gazetteers and geographic thesauri; - Geographical query interfaces for search on the web; - Geographic question / answering systems; - Geographic search engine architectures; - Relevance ranking of geographical information; - Evaluation methods for geographic search. We invite the submission of articles of up to 8 pages for presentation as long papers and 2 page short abstracts, reporting on work in progress, for short presentations. All submissions will be reviewed by three members of the programme committee, and all accepted papers will be published in the ACM Digital Library. Please note that we welcome contributions both from academic researchers and from practitioners working in industry and in public agencies engaged in GIR-related activities. The workshop programme will ensure opportunity for discussion of the presented papers. It will also include a panel session to discuss the future agenda for research in GIR. It is intended that this latter session, and the workshop as a whole, will facilitate the initiation of collaborative research proposals from the participants in the workshop. Submission procedure You should prepare your abstract in accordance with the ACM camera-ready instructions (http://www.acm.org/sigs/publications/proceedings-templates) and submit it using the EasyChair system (http://www.easychair.org/conferences/?conf=gir13) by 16th August 2013. Decisions on acceptance will be announced by 6th September 2013. At least one author of accepted papers will be required to register for the workshop in order to present the paper. Please note that attendance at the workshop will require registration for the main ACM SIGSPATIAL GIS conference (http://sigspatial2013.sigspatial.org/) in addition to registering for the workshop. Further details of the workshop can be found at http://www.geo.uzh.ch/~rsp/gir13/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:06:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:06:23 +0200 Subject: Revue: Cahiers de lexicologie, numero 102 Message-ID: Date: Thu, 06 Jun 2013 21:30:22 +0200 From: Pierre-Andr? Buvet Message-ID: <51B0E34E.6040907 at ldi.univ-paris13.fr> Cahiers de lexicologie, no 102 Unit? en sciences du langage et collocations Sous la direction de Salah Mejri L'UNIT? EN SCIENCES DU LANGAGE - R. Martin, ? Vers l'unification de la linguistique ? ? - G. Gross, ? Unit? de l'analyse linguistique ? - O. Soutet, ? La conception g?n?tique de la linguistique comme d?passement possible de l'opposition entre linguistique diachronique et linguistique synchronique ? - C. Muller, ?Le pr?dicat, entre (m?ta)cat?gorie et fonction ? - A. Rousseau, ? Les unit?s linguistiques simples et leur s?mantique ? - J.-R. Ladmiral, ? ? propos du concept d'unit? dans les sciences du langage : la question des unit?s de traduction ? - A. Class, ?Niveaux d'analyse en traduction et en lexicologie ou peut-on d?terminer des unit?s de traduction et de lexicologie ? ? - F. Neveu, ? Unit? et complexit? des termes de la science linguistique ? - P. Lerat, ? Jus de raisin : unit? terminologique ou non ? ? Les collocations - I. Mel'cuk, ? Tout ce que nous voulions savoir sur les phras?mes, mais... ? - G. Kleiber, ? Constructions ?olfactives ? : le cas de [D?t]odeur + de + N2 ? - P.-A. Buvet, ? Collocation, restriction de s?lection et pr?dication ? - J. Goes, ? Les adjectifs primaires et la collocation ? - X. Blanco, ? Le d?figement des collocations comme recours stylistique ? - P. Mogorron Huerta, ? Traitement des collocations dans les dictionnaires espagnols ? ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:01:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:01:23 +0200 Subject: Appel: ENRICH Workshop at SIGIR 2013 Message-ID: Date: Thu, 6 Jun 2013 10:29:43 -0700 (PDT) From: S?amus Lawless Message-ID: <1370539783.75639.YahooMailNeo at web142604.mail.bf1.yahoo.com> X-url: http://www.cultura-strep.eu/events/enrich-2013/ ------------------------------------------------------------------------ Apologies for cross posting. Please forward to interested parties. ************************************************************************ Final Call for Papers The First Workshop on the Exploration, Navigation and Retrieval of Information in Cultural Heritage - ENRICH 2013 http://www.cultura-strep.eu/events/enrich-2013/ To be held in conjunction with the 36th Annual ACM SIGIR Conference Workshop date: August 1st, 2013 Location: Trinity College Dublin, Ireland. Submission deadline: 9th June 2013 ************************************************************************ ENRICH 2013 has three main goals: - to discuss the challenges and opportunities in Information Retrieval research in the area of Cultural Heritage - to encourage collaboration between researchers engaged in work in this specialist area of Information Retrieval, and to foster the formation of a research community - to identify a set of actions which the community should undertake to progress research in this area ************************************************************************ A key challenge facing the curators and providers of digital cultural heritage worldwide is to instigate, increase and enhance engagement with their collections. To achieve this, a fundamental change in the way these artefacts can be discovered, explored and contributed to by users and communities is required. Cultural heritage artefacts are digital representations of primary resources: manuscript collections, paintings, books, photographs etc. The text-based resources are often innately ?noisy?, contain non-standard spelling, poor punctuation and obsolete grammar and word forms. The image-based resources often have limited associated metadata which describes the resources and their content. In addition, the information needs and tasks of cultural heritage users are often complex and diverse. This presents a specific set of challenges to traditional Information Retrieval (IR) techniques and approaches. This workshop will investigate the enhanced retrieval of, and interaction with, cultural heritage collections. We are interested in investigating innovative forms of personalised, multi-lingual IR, which can include: - IR approaches tailored to cope with the inconsistencies which are common in cultural heritage collections. - Content-aware retrieval approaches which respond to the entities and relationships contained within artefacts and across collections. - Personalised IR and presentation. - Community-aware IR approaches which respond to community activity, interest, contribution and experience. Such new forms of enhanced IR require rigorous evaluation and validation using appropriate metrics, contrasting digital cultural heritage collections and diverse users and communities. This workshop welcomes submissions which investigate such evaluation, taking into account the specific requirements of the domain. The nature of cultural heritage resources means that content analysis in support of IR is of specific interest. This includes the automated normalisation of historical texts, the use of Natural Language Processing (NLP) for entity extraction and metadata generation. The ENRICH workshop aims to promote the exchange of ideas between researchers working on the theory and foundations of IR, cross and multi-lingual IR, personalised IR and recommender systems. There are numerous research areas that can support such improved retrieval and exploration in the area of cultural heritage. Topics of interest include, but are not limited to, the following areas: - Multilingual semantic search - Context-aware and semantic recommender systems - Adaptation engines and algorithms for personalised multilingual IR - User modeling and adaptation (e.g. creation and exploitation of individual or stereotypical user profiles) - Content personalisation and personalised result presentation (e.g. beyond the ranked list) - Domain modeling - External knowledge resources for IR (e.g. ontologies) - Evaluation methodologies and metrics for personalised multilingual IR - Information Extraction, Data Mining and Natural Language Processing - Social Network Analysis *Submissions* We invite researchers to submit two categories of paper: Long paper submissions should report on substantial contributions of lasting value. Each accepted long paper will be presented in a plenary session of the workshop program. The maximum length is 8 pages. Short paper submissions should discuss exciting new work that is not yet mature enough for a long paper. The presentation may include the demonstration of a system. The maximum length is 4 pages. Accepted papers will be published in the proceedings of the workshop. Accepted papers will have the possibility to include a demonstration of novel applications as part of their presentation All submissions should be prepared according to the ACM SIG Proceedings Templates, as for all SIGIR submissions. For your convenience, you can use the templates for Microsoft Word or LaTeX that have been made available on the ACM website: http://www.acm.org/sigs/publications/proceedings-templates/ The ENRICH Workshop does not use blind reviews, so please include authors? names and affiliations on your submission. All submissions will receive several independent reviews. Submissions must be in PDF format and must be in English. All papers must be submitted electronically before the 9th of June 2013 through the EasyChair submission page -https://www.easychair.org/conferences/?conf=enrich2013 ENRICH 2013 will be hosted in the Long Room Hub, the Digital Arts and Humanities Research Institute of Trinity College Dublin -http://www.tcd.ie/trinitylongroomhub/. The Long Room Hub is a signature building at the heart of the historic TCD campus. The institute takes its name from the Library's iconic ?Long Room'. The Long Room Hub is the home of a number of major, EU funded, Digital Humanities research projects, which use the most advanced digital technologies for the democratization of knowledge and also explore new research questions, approaches and methodologies enabled by technological change. *Important Dates* Deadline for submission:9th June Notification of acceptance:28th June Camera-ready version of papers:8th July Workshop:1st August *Organizers* Prof. S?amus Lawless (School of Computer Science, Trinity College Dublin, Ireland) seamus.lawless at scss.tcd.ie Prof. Maristella Agosti (Department of Information Engineering, University of Padova, Italy) maristella.agosti at unipd.it Dr. Paul Clough (Information School, University of Sheffield, UK) p.d.clough at sheffield.ac.uk Prof. Owen Conlan (School of Computer Science, Trinity College Dublin, Ireland) owen.conlan at scss.tcd.ie *Further Information* http://www.cultura-strep.eu/events/enrich-2013/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 08:08:21 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 10:08:21 +0200 Subject: Seminaire: INFOLINGU, Denis LE PESANT, Modyco, Universite Paris 10, 10 juin 2013 Message-ID: Date: Fri, 7 Jun 2013 00:22:56 +0200 From: Myriam RAKHO Message-ID: ************************************************************************ * INFOLINGU* Le s?minaire de l'?quipe Informatique Linguistique du Laboratoire d'Informatique Gaspard Monge (LIGM) Universit? Paris-Est Marne-la-Vall?e ************************************************************************ Date : *Le Lundi 10 juin 2013 ? 10h30 Lieu : Universit? Paris-Est Marne-la-Vall?e B?timent Copernic, 4?me ?tage, salle de s?minaires 4B08R *Toute personne int?ress?e est la bienvenue.* ************************************************************************ ------------------------------------------------------------------------ Intervenant : ------------------------------------------------------------------------ Denis LE PESANT - Modyco, Universit? Paris 10 ------------------------------------------------------------------------ Titre de la pr?sentation : ------------------------------------------------------------------------ *Les 200 pr?positions locatives du fran?ais : une m?thode de classification s?mantique ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 8 07:58:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Jun 2013 09:58:48 +0200 Subject: Job: Post-doc TAL, 6 mois Message-ID: Date: Thu, 06 Jun 2013 14:57:20 +0200 From: Isabelle Tellier Message-ID: <20130606145720.87865r4zz0y87ods at webmail.univ-paris3.fr> X-url: http://mastodons.lip6.fr PROPOSITION DE POST-DOC ARESOS Reconnaissance automatique des acteurs et des sujets de discussion pour la reconstruction de dynamiques socio-s?mantiques post-doc en informatique (traitement automatique des langues) de 6 mois ? d?marrer en juillet-ao?t 2013 Dans le cadre du projet ARESOS (http://mastodons.lip6.fr) soutenu par l'appel Mastodons du CNRS sur les grandes masses de donn?es, le Lattice (http://www.lattice.cnrs.fr) et l'Institut des Syst?mes Complexes (http://www.iscpif.fr) proposent un post-doc de 6 mois en traitement automatique des langues. L'objectif du post-doc sera de d?velopper des outils d'extraction automatique ? d'acteurs ? (personnes physiques, associations, institutions, etc.) et de ? sujets de discussions ? dans des grands corpus textuels francophones issus de multiples sources du Web (blogs, forums, m?dias sociaux) et portant sur diff?rentes controverses socio-techniques (biologie de synth?se, biofuel, etc.). Cette extraction a pour but de repr?senter le contenu s?mantique des textes de fa?on compacte et n?anmoins pr?cise, en vue d'analyses ? plus large ?chelle permettant de d?crire la structure des d?bats et leur dynamique. L'analyse des cooccurrences entre sujets permettra d'identifier comment les discours des acteurs d'une controverse agencent des arguments d'une certaine fa?on contribuant ? modeler des blocs argumentatifs plus ou moins stables ou partag?s. L'extraction des acteurs ? partir des contenus textuels nous permettra de construire le r?seau h?t?rog?ne dynamique liant les acteurs principaux d'une controverse aux principales positions existantes. A terme la mod?lisation d'un tel syst?me socio-s?mantique devrait nous aider ? mieux comprendre la dynamique d'?mergence des controverses. Pour analyser finement ces contenus textuels, il est en effet essentiel de rep?rer automatiquement les agents porteurs d'opinion (d?sign?s par des groupes nominaux ou des entit?s nomm?es) et les sujets sur lesquels ils s'expriment. L'association entre ces deux entit?s pourra ensuite ?tre qualifi?e par la nature de l'opinion ?mise. Pour r?aliser cette extraction, le/la candidat(e) retenu(e) pourra s'aider d'outils d?j? existants pour le fran?ais : extracteur de termes, ?tiqueteur en partie du discours (POS), chunker, reconnaisseur d'entit?s nomm?es... L'approche privil?gi?e fera appel en priorit? ? des techniques d'apprentissage automatique supervis? (notamment CRF, mais d'autres approches pourront ?tre essay?es). La solution devra ?tre robuste afin de s'adapter aux diff?rents types de textes trait?s. L'extraction textuelle sera ensuite coupl?e ? des outils d'analyse et de cartographie de r?seaux h?t?rog?nes pour explorer les potentialit?s d'une approche ? socio-s?mantique ? dans la compr?hension de la dynamique des controverses. Comp?tences souhait?es : th?se en TALN, apprentissage automatique, reconnaissance des entit?s nomm?es, r?seaux complexes Encadrement : Isabelle Tellier , Thierry Poibeau (Lattice), Jean-Philippe Cointet (ISC) envoyer CV + lettre de motivation ? isabelle.tellier at univ-paris3.fr, jean-philippe cointet (jphcoi at yahoo.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 19:39:46 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 21:39:46 +0200 Subject: Ressources: New release of DGT-TM (parallel corpus in 23 languages) Message-ID: Date: Mon, 10 Jun 2013 11:31:27 +0200 From: Ralf Steinberger Message-id: <019201ce65bd$490a5000$db1ef000$@jrc.ec.europa.eu> X-url: http://ipsc.jrc.ec.europa.eu/?id=197 DGT-TM is an extraction of the translation memory of the European Institutions for all official EU languages, produced by the European Commission?s Directorate General for Translation (DGT) and distributed by the Joint Research Centre (JRC). Translation memories are sentences and their manually produced translations. The new release is called DGT-TM-2013. It follows the previous releases, DGT-TM (2007), DGT-TM-2011 and DGT-TM-2012. DGT-TM-2013 adds over ten million translation units to the previous 63 million translation units, resulting in 73 million translation units in total. New features of DGT-TM-2013 are: - Significantly more data for the Bulgarian, Maltese and Romanian languages; - Mostly about 460K new translation units per language. - Most documents of this release were translated in 2012, but it also contains previously unpublished documents from older years. - Unfortunately, no new Irish translation units are part of this release. Languages: All 253 language pairs involving the following 23 languages: Bulgarian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Irish, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish and Swedish. URL: http://ipsc.jrc.ec.europa.eu/?id=197 Creator: European Commission - Directorate General for Translation (DGT http://ec.europa.eu/dgs/translation/index_en.htm) WHAT IS DGT-TM The 'Acquis Communautaire' (http://europa.eu/abc/eurojargon/index_en.htm) is the entire body of European legislation, comprising all the treaties, regulations and directives adopted by the European Union (EU). Since each new country joining the EU is required to accept the whole Acquis Communautaire, this body of legislation has been translated into 22 official languages. For the 23rd official EU language, Irish, the Acquis has not been translated on a regular basis; which is why DGT-TM includes only little data in Irish. The Acquis Communautaire was split into sentences and aligned automatically at sentence level, resulting in the DGT translation memory, DGT-TM. The text data is accompanied by software that allows to extract all sentences and their translations for any of the 253 possible language pair combinations. MOTIVATION FOR THIS RELEASE The public data release is in line with the general effort of the European Commission to support multilingualism, language diversity and the re-use of Commission information. It follows the release of a number of further multilingual data sets: - the JRC-Acquis parallel corpus in 2006 (over 1 billion words in 22 languages), - the DGT-TM Translation Memory in 2007, - the multilingual named entity resource JRC-Names in 2011, - the multilingual multi-label classification tool (and accompanying text data) JRC EuroVoc Indexer (JEX) (22 languages) in 2012, - the ECDC-TM Translation Memory in 2012 (domain: Public Health) - the DGT-Acquis parallel corpus in 2012, - the EAC-TM Translation Memory in 2013 (domain: Education and Culture), - and further smaller multilingual resources. See http://ipsc.jrc.ec.europa.eu/?id=61 for more information on these resources. WHAT DGT-TM CAN BE USED FOR DGT-TM can be fed into translation memory software to support human translators in their work. As it is a large parallel corpus in electronic form, it can furthermore be used by specialists in computational linguistics to train statistical machine translation software, to generate multilingual dictionaries, to train and test multilingual information extraction software, and more. MORE INFORMATION ON DGT-TM At http://langtech.jrc.ec.europa.eu/JRC_Publications.html, you find detailed publications on the JRC?s multilingual language technology activity. For details on DGT-TM, you can read: Steinberger Ralf, Andreas Eisele, Szymon Klocek, Spyridon Pilos & Patrick Schl?ter (2012). DGT-TM: A freely Available Translation Memory in 22 Languages. Proceedings of the 8th international conference on Language Resources and Evaluation (LREC'2012), Istanbul, 21-27 May 2012. http://langtech.jrc.ec.europa.eu/Documents/2012_LREC_DGT-TM_Final.pdf The article ?An overview of the European Union's highly multilingual parallel corpora? (submitted) gives a comparative overview of the various resources distributed by the JRC. WHAT NEXT? The JRC and collaborating services at the European Parliament are currently finalising the release of yet another large-scale multilingual parallel corpus. Ralf Steinberger (http://langtech.jrc.ec.europa.eu/RS.html) European Commission - Joint Research Centre (JRC) 21027 Ispra (VA), Italy URL ? Applications: (http://emm.newsbrief.eu/overview.html) URL ? Resources: http://ipsc.jrc.ec.europa.eu/index.php?id=61 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 19:41:41 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 21:41:41 +0200 Subject: Appel: Call for demos, HMGE Workshop @ ESSLLI 2013 Message-ID: Date: Mon, 10 Jun 2013 14:50:50 +0200 From: Yannick Parmentier Message-ID: <20130610125049.GG4849 at nausicaa> X-url: http://www.univ-orleans.fr/lifo/evenements/HMGE13/ ** apologies for cross-posting ** CALL FOR SYSTEM DEMONSTRATIONS ====================================================== High-level Methodologies for Grammar Engineering (HMGE 2013) ESSLLI 2013 Workshop (Language and Computation Area) University of D?sseldorf, Germany August 12-16, 2013 http://www.univ-orleans.fr/lifo/evenements/HMGE13/ ====================================================== INTRODUCTION ============ The HMGE Workshop is concerned with the complex task of grammar engineering. On top of research papers (program to be announced soon), we would like to invite demonstrations of systems related to this topic. More precisely, we invite submissions regarding the following aspects of grammar engineering (without being limited to these): * development, maintenance and enhancement of grammars * semi-automatic acquisition of grammars * debugging environments for grammar design * dedicated description languages for grammar engineering * applications of large-scale grammars SUBMISSIONS =========== Demonstration papers are not anonymous and consist of one-page descriptions (excluding references), in PDF format (A4 size), to be sent to hmge13 at easychair.org by June, 24th. There are no specific formatting instructions for these demo papers. Selected system descriptions will be included in the workshop proceedings. Demos will consist of 20-minute talks followed by 10 minutes of questions. VENUE ===== The workshop will be held as part of ESSLLI in August 2013 in D?sseldorf, Germany. More information about ESSLLI can be found at the ESSLLI web pages at http://esslli2013.de/. IMPORTANT DATES =============== Demo submission deadline: June 24, 2013 Notification: July 1st, 2013 Workshop: August 12-16, 2013 PROGRAM COMMITTEE ================= Emily Bender, Washington Philippe Blache, Aix-en-Provence Miriam Butt, Konstanz Eric De La Clergerie, Paris Beno?t Crabb?, Paris Berthold Crysmann, Paris Stefanie Dipper, Bochum Denys Duchier, Orl?ans Claire Gardent, Nancy Josef van Genabith, Dublin Timm Lichte, D?sseldorf Montserrat Marimon, Barcelona Yusuke Miyao, Tokyo Stefan M?ller, Berlin Gertjan van Noord, Groningen Yannick Parmentier, Orl?ans ORGANIZING COMMITTEE ==================== Denys Duchier (LIFO - Universit? d'Orl?ans) Yannick Parmentier (LIFO - Universit? d'Orl?ans) Information about the Workshop is available at the HMGE workshop website: http://www.univ-orleans.fr/lifo/evenements/HMGE13/ E-mail: hmge13 at easychair.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:07:02 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:07:02 +0200 Subject: Livre: Modelling Language Message-ID: Date: Tue, 11 Jun 2013 14:26:11 +0200 From: Sylviane CARDEY Message-Id: <5.0.2.1.2.20130611135226.03a7e4f0 at pop.univ-fcomte.fr> X-url: http://www.benjamins.com/#catalog/books/nlp.10/main Modelling Language Sylviane Cardey Institut universitaire de France and Universit? de Franche-Comt? http://www.benjamins.com/#catalog/books/nlp.10/main In response to the need for reliable results from natural language processing, this book presents an original way of decomposing a language(s) in a microscopic manner by means of intra/inter-language norms and divergences, going progressively from languages as systems to the linguistic, mathematical and computational models, which being based on a constructive approach are inherently traceable. Languages are described with their elements aggregating or repelling each other to form viable interrelated micro-systems. The abstract model, which contrary to the current state of the art works in intension, is exploitable for all sorts of applications where only the elements which are useful are assembled in the micro-systems needed to solve the problem in hand. Numerous definitions, schemata and examples involving many languages make the book accessible to students as well as academics and industrial researchers looking for new theories and methodologies for representations and problem solving wherever language and quality meet. Table of contents Preface Prologue Introduction Part 1. System, language and its components Chapter 1.1 The concept of system Chapter 1.2 Language as a system Chapter 1.3 The system?s microcomponents Chapter 1.4 Syntactic analysis Chapter 1.5 Semantics Chapter 1.6 Norm in language Part 2. Modelling the norms Chapter 2.1 Model Chapter 2.2 Our model Part 3. Methodologies and applications Chapter 3.1 Grammar checkers Chapter 3.2 Part of speech tagger Chapter 3.3 Sense mining Chapter 3.4 Controlled languages Chapter 3.5 Intralanguage ambiguity Chapter 3.6 MultiCoDiCT Chapter 3.7 Controlled language and machine translation Chapter 3.8 Oral Conclusion Epilogue References Index "The book presents a very fresh, excellent, persuasive new approach to the analysis and generation of languages. Languages are viewed as systems as well as their lexicomorphosyntactic components. The linguistic and mathematical models are convincing and accompanied with good examples and a variety of applications such as grammar checking, part of speech tagging, sense mining, controlled language, machine translation, and also oral speech processing. The author shows that this model is applicable to any language and examples are given on French, English, German, Spanish, Arabic, Malay, Chinese, Thai, etc. The book?s topdown model based approach is particularly attractive for computational linguists looking for reliable results and is strongly recommended to students who are interested in linguistics and natural language processing as well as professionals in the above mentioned wide application areas." Makoto Nagao, Japan "S. Cardey presents an original approach to the scientific analysis of language grounded in a firm understanding of previous theories and based on the interaction of lexis, morphology and syntax. Natural language is modeled within a framework that draws on logic, set theory and the theory of algorithms, thus bridging linguistic theory and formal mathematical analysis. The model developed here will prove valuable for theoretical linguists studying typologically diverse languages as well as for a wide range of natural language engineers facing challenging applications such as semantic data mining and machine translation." Christiane D. Fellbaum, Princeton University [Natural Language Processing, 10] 2013. xi, 194 pp. Publishing status: Available Hardbound - Available ISBN 978 90 272 4996 8 | EUR 90.00 | USD 135.00 e-Book ? Forthcoming ISBN 978 90 272 7208 9 | EUR 90.00 | USD 135.00 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 19:32:30 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 21:32:30 +0200 Subject: Conf: SLSP 2013, Tarragona, Spain, July 29-31, 2013 Message-ID: Date: Sun, 9 Jun 2013 14:48:36 +0200 From: "GRLMC" Message-ID: <56FDC34B9EC94C3E83331F7FB39FA2B1 at Carlos1> X-url: http://grammars.grlmc.com/SLSP2013/ ************************************************************************ 1st INTERNATIONAL CONFERENCE ON STATISTICAL LANGUAGE AND SPEECH PROCESSING SLSP 2013 Tarragona, Spain July 29-31, 2013 http://grammars.grlmc.com/SLSP2013/ ************************************************************************ PROGRAMME Monday, July 29: 8:00 - 8:50 Registration 8:50 - 9:00 Opening 9:00 - 9:50 Yoshua Bengio: Deep Learning of Representations: Looking Forward (I) - Invited Tutorial 9:50 - 10:20 Coffee Break 10:20 - 11:35 Horacio Saggion, Stefan Bott, and Luz Rello: Comparing Resources for Spanish Lexical Simplification Borb?la Sikl?si, Attila Nov?k, and G?bor Pr?sz?ky: Context-aware Correction of Spelling Errors in Hungarian Medical Documents Attia Nehar, Djelloul Ziadi, and Hadda Cherroun: Rational Kernels for Arabic Text Classification 11:35 - 11:45 Break 11:45 - 13:00 Horia Cucu, Andi Buzo, Laurent Besacier, and Corneliu Burileanu: Statistical Error Correction Methods for Domain-Specific ASR Systems Myung-Jae Kim, Il-Ho Yang, and Ha-Jin Yu: Histogram Equalization Using Centroids of Fuzzy C-Means of Background Speakers' Utterances for Speaker Identification Layla El Asri, Romain Laroche, and Olivier Pietquin: Reward Shaping for Statistical Optimisation of Dialogue Management 13:00 - 14:30 Lunch 14:30 - 15:20 Samuel W. K. Chan and Mickey M. C. Chong: Predicting Part-of-Speech Tags and Morpho-Syntactic Relations using Similarity-based Technique Nobal Niraula, Rajendra Banjade, Dan ?tef?nescu, and Vasile Rus: Experiments with Semantic Similarity Measures based on LDA and LSA 15:20 - 15:30 Break 15:30 - 16:20 Yoshua Bengio: Deep Learning of Representations: Looking Forward (II) - Invited Tutorial Tuesday, July 30: 9:00 - 9:50 Christof Monz: Challenges and Opportunities of Multilingual Information Access - Invited Lecture 9:50 - 10:20 Coffee Break 10:20 - 11:35 Akira Hayashi, Kazunori Iwata, and Nobuo Suematsu: Finding the Most Likely Upper Level State Sequence for Hierarchical HMMs Jordan Rodu, Dean P. Foster, Weichen Wu, and Lyle H. Ungar: Using Regression for Spectral Estimation of HMMs Amit Kirschenbaum: Unsupervised Segmentation for Different Types of Morphological Processes Using Multiple Sequence Alignment 11:35 - 11:45 Break 11:45 - 13:00 Abdessalam Bouchekif, G?raldine Damnati, and Delphine Charlet: Complementarity of Lexical Cohesion and Speaker Role Information for Story Segmentation of French TV Broadcast News Markus Saers, Karteek Addanki, and Dekai Wu: Iterative Rule Segmentation under Minimum Description Length for Unsupervised Transduction Grammar Induction Ngoc Thang Vu, Heike Adel, and Tanja Schultz: An Investigation of Code-Switching Attitude Dependent Language Modeling 13:00 - 14:30 Lunch 14:30 - 15:20 Hans Moen and Erwin Marsi: Cross-Lingual Random Indexing for Information Retrieval Javad Nouri, Lidia Pivovarova, and Roman Yangarber: MDL-based Models for Transliteration Generation 15:20 - 15:30 Break 15:30 - 16:20 Sanja ?tajner and Richard Evans: Can Statistical Tests Be Used for Feature Selection in Diachronic Text Classification? Luis Trindade, Hui Wang, William Blackburn, and Niall Rooney: Factored Semantic Sequence Kernel for Sentiment Polarity Classification 17:30 Visit to the City Wednesday, July 31: 9:00 - 9:50 Tanja Schultz: Multilingual Speech Processing with a special emphasis on Rapid Language Adaptation - Invited Lecture 9:50 - 10:20 Coffee Break 10:20 - 11:35 Fethi Bougares, Mickael Rouvier, Nathalie Camelin, Paul Del?glise, and Yannick Est?ve: An Investigation of Single-pass ASR System Combination for Spoken Language Understanding Marwa Graja, Maher Jaoua, and Lamia Hadrich Belguith: Discriminative Framework for Spoken Tunisian Dialect Understanding Bassam Jabaian, Fabrice Lef?vre, and Laurent Besacier: Generalization of Discriminative Approaches for Speech Language Understanding in a Multilingual Context 11:35 - 11:45 Break 11:45 - 13:00 Felix Stahlberg, Tim Schlippe, Stephan Vogel, and Tanja Schultz: Pronunciation Extraction from Phoneme Sequences Through Cross-Lingual Word-to-Phoneme Alignment Stanis?aw Kacprzak and Mariusz Zi??ko: Speech/Music Discrimination via Energy Density Analysis Karteek Addanki and Dekai Wu: Unsupervised Rhyme Scheme Identification in Hip Hop Lyrics using Hidden Markov Models 13:00 Closing ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:35:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:35:55 +0200 Subject: Livre: Methodes et outils pour l'analyse phonetique des grands corpus oraux Message-ID: Date: Wed, 12 Jun 2013 17:02:20 +0200 From: "Ana Ars" Message-ID: <00c101ce677d$dc4ba140$94e2e3c0$@fr> X-url: http://editions.lavoisier.fr/notice.asp?ouvrage=2724385 M?thodes et outils pour l'analyse phon?tique des grands corpus oraux Trait? Cognition et Traitement de l'Information (IC2) dirig?e par Jean-Marie Pierrel Sous la direction de No?l Nguyen et Martine Adda-Decker ISBN : 978-2-7462-4530-3 - Format : 16,5 x 24 - 320 p. - 110 ? Editions Lavoisier Hermes Cet ouvrage offre un panorama des m?thodes et des outils utilisables pour les analyses phon?tiques sur de grands corpus oraux. Les ressources consid?rables dont nous disposons aujourd'hui dans le domaine de l?oral, en sont venues ? jouer un r?le majeur pour les phonologues et les phon?ticiens, qui entreprennent de soumettre leurs hypoth?ses th?oriques ? des tests empiriques ?tendus. On a vu se g?n?raliser l'utilisation d'un large ensemble d'instruments et de m?thodes pour le traitement et l'analyse automatique des donn?es recueillies. L'ouvrage aborde notamment le pr?traitement des donn?es acoustiques, l?extraction (semi-)automatique des param?tres d?analyse, la mise en relation entre les donn?es acoustiques et les cat?gories phonologiques. L?accent est plac? sur le fran?ais, et les donn?es recueillies dans le projet ? Phonologie du fran?ais contemporain ? sont utilis?es dans de nombreux exemples. Une large place est accord?e ? la contribution des technologies de la parole, et notamment les syst?mes de reconnaissance automatique de la parole, ? l?analyse phon?tique des grands corpus oraux. Consulter la pr?sentation et le sommaire d?taill?s de l'ouvrage (http://editions.lavoisier.fr/notice.asp?ouvrage=2724385) Ana ARS Service de Presse LAVOISIER SAS Editions / EM Inter / Hermes / Synth?se agricole / M?decine Sciences Publications 14 rue de Provigny 94236 Cachan Cedex 01.47.40.67.63 ana.ars at lavoisier.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:10:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:10:10 +0200 Subject: Appel: EACL 2014, Call for tutorial proposals Message-ID: Date: Tue, 11 Jun 2013 15:21:51 +0200 From: peter ljungl?f Message-Id: EACL 2014 CALL FOR TUTORIAL PROPOSALS Proposals are invited for the Tutorial Program of the 14th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2014), to be held in Gothenburg, Sweden, from 26 to 30 April 2014. The selected tutorials will be given on the Saturday and Sunday preceding the main conference (26 and 27 April). EACL 2014 seeks proposals for tutorials in all areas of computational linguistics, broadly conceived to include disciplines such as Linguistics, Speech, Information Retrieval, Psycholinguistics, and Multimodal Processing. We particularly welcome (1) tutorials which cover advances in newly emerging areas not previously covered in an *ACL related tutorial, and (2) tutorials which provide introductions into related fields which are potentially relevant for the CL community (e.g. bioinformatics, neuroscience, human language processing, video and image analysis, machine learning techniques). In order to gather a widespread audience, the experience and qualifications of the instructors will also be taken into account. REMUNERATION Remuneration for tutorials is regulated by ACL policies: http://aclweb.org/adminwiki/index.php?title=Policy_on_tutorial_teacher_payment. Please note that enumeration for tutorial presenters is fixed according to the above policy and does not cover registration fees for the main conference. SUBMISSION DETAILS Proposals for tutorials should contain: 1. A title and brief description of the tutorial content and its relevance to the ACL community (not more than 2 pages). 2. A brief outline of the tutorial structure showing that the tutorial's core content can be covered in a three-hour slot (excluding a coffee break). In exceptional cases six-hour tutorial slots are available as well. 3. The names, postal addresses, phone numbers, and email addresses of the tutorial instructors, including a one-paragraph statement of their research interests and areas of expertise. 4. A list of previous venues and approximate audience sizes, if the same or a similar tutorial has been given elsewhere; otherwise an estimate of the audience size. 5. A description of special requirements for technical equipment (e.g. internet access). Proposals should be submitted by electronic mail, in plain ASCII text, to "tutorials at eacl2014 dot org", no later than 1 November 2013. The subject line should be: "EACL 2014 Tutorial Proposal". Please note that only proposals submitted by e-mail will be taken into account. TUTORIAL SPEAKER RESPONSIBILITIES Accepted tutorial speakers will be notified by 15 November 2013, and must then provide abstracts of their tutorials for inclusion in the conference registration material by 15 December 2013. The description should be in two formats: an ASCII version that can be included in email announcements and published on the conference web site, and a PDF version for inclusion in the electronic proceedings (detailed instructions to follow). Tutorial speakers must provide tutorial materials, at least containing copies of the course slides as well as a bibliography for the material covered in the tutorial, by 1 February 2014. IMPORTANT DATES Submission deadline for tutorial proposals: 1 November 2013 Notification of acceptance: 15 November 2013 Tutorial descriptions due: 15 December 2013 Tutorial course material due: 1 February 2014 Tutorial dates: 26-27 April 2014 TUTORIAL CHAIRS Marco Baroni, University of Trento, Italy Afra Alishahi, Tilburg University, Netherlands Please send inquiries concerning EACL 2014 tutorials to "tutorials at eacl2014 dot org". ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 19:43:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 21:43:32 +0200 Subject: Ressources: corpus CO2 de parole spontanee annotee en co-reference Message-ID: Date: Mon, 10 Jun 2013 20:31:04 +0200 From: Jean Yves ANTOINE Message-ID: <51B61B68.2070502 at univ-tours.fr> X-url: http://www.info.univ-tours.fr/~antoine/parole_publique/CO2/index.html ======================================================================= Sortie de CO2 : corpus libre de dialogue oral annot? en cor?f?rences et anaphores associatives ======================================================================= Le Laboratoired'Informatique (LI) de l'Universit? de Tours et le Laboratoire Lig?rien de Linguistique (LLL) de l'Universit? d'Orl?ans ont le plaisir de vous annoncer la sortie du corpus CO2, diffus? librement aupr?s de tous sous licence Creative Commons CC-BY-NC-SA.Ce corpus est constitu? d'un extrait du corpus oral ESLO1 (connu souvent sous le nom de "corpus d'Orl?ans") qui a ?t? annot? en cor?f?rencesnominales et pronominales. L'annotation distingue cor?f?rences directes, indirectes, pronominales mais ?galement anaphores associatives.L'annotation est d?port?e et a ?t? r?alis?e ? l'aide du logiciel libreGLOZZ d?velopp? par le GREYC (http://www.glozz.org/) Financ? par les universit?s de Tours et d'Orl?ans, membres du PRES Centre Val de Loire, le corpus repr?sente 3h28 d'enregistrement et 35192 mots. Il constitue une mise en bouche avant la sortie du corpus ANCOR, r?alis? par les deux m?mes laboratoires et qui suit les m?mes conventions d'annotation. Comprenant 453000 mots, ce corpus sera pr?sent? au prochaincongr?s TALN et rendu disponible, toujours sous lam?me licence, en septembre 2013. Dans l'imm?diat, vous pouvez d?j? d?couvrir et r?cup?rer le corpus CO2 sur le site Parole Publique : http://www.info.univ-tours.fr/~antoine/parole_publique/CO2/index.html ------------------------------------------------------------------------ Contacts : Jean-Yves.Antoine at univ-tours.fr ou Emmanuel.Schang at univ-tours.fr (concepteurs du corpus) Annotations : Judith Muzerelle et Aurore Pelletier Rappel : le corpus ESLO (audio + transcriptionsorthographique) est par ailleurs diffus? librement ?galement sous licence CC-BY-NC-SA. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:05:42 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:05:42 +0200 Subject: Appel: COLDOC2013, Date de soumission etendue au 22 Juin 2013 Message-ID: Date: Mon, 10 Jun 2013 20:48:33 +0200 From: coldoc modyco Message-ID: X-url: http://coldoc2013fr.wordpress.com/ D?sol? pour les envois crois?s ------------------------------------------------------------------------ COLDOC2013 : La question des genres ? l'?crit et ? l'oral 13-14 novembre 2013 dernier appel ? communication ------------------------------------------------------------------------ COLDOC2013: Extension de la date de soumission au 22 Juin Cher(e)s coll?gues, Nous vous prions de trouver ci-joint l'appel ? communication du COLDOC 2013, le colloque des doctorants et jeunes chercheurs du laboratoire Modyco de Nanterre. Cette ann?e, le colloque portera sur le th?me suivant : "La question des genres ? l'?crit et ? l'oral". Vous trouverez l'appel ? communication ci-dessous. Vous pourrez aussi trouver ces informations sur le site du colloque ? l'adresse suivante: http://coldoc2013fr.wordpress.com/appel/ Bien cordialement, Lucie Rousier-Vercruyssen pour le comit? d'organisation de COLDOC2013 (http://coldoc2013fr.wordpress.com/). *Dates importantes :** * soumission de propositions de communication : * 22** juin 2103* notification d'acceptation des soumissions : 31 juillet 2013 Programme disponible : 31 juillet 2013 Remise des articles complets pour les actes : 3 septembre 2013 Soumission finale de la communication : 13 octobre 2013 *inscriptions* *gratuites* pour tous les participants * *soumission* La soumission devra contenir au maximum 3 pages (voir les directives de soumission sur le site COLDOC2013 - http://coldoc2013.wordpress.com/submissions/) et devra ?tre envoy? via le site EasyChair de COLDOC2013 (https://www.easychair.org/conferences/?conf=coldoc2013). Les projets d'articles seront soumis ? une relecture anonyme par deux membres du comit? scientifique. Les contributions de COLDOC2013 seront suivies d'une publication sp?ciale avec des communications s?lectionn?es. *COLDOC2013 appel ? communication * COLDOC 2013 a pour objectif d'interroger de fa?on pluridisciplinaire la notion de genre et d'illustrer la vari?t? des probl?mes th?oriques et pratiques qu'elle pose. L'appel ? contributions se veut ouvert et vise ? articuler diff?rents points de vue sur la question des genres, afin de contribuer ? circonscrire une cat?gorie essentielle pour l'interpr?tation. Longtemps consid?r?e sous l'angle taxinomique, la cat?gorie du genre s'est vue renouvel?e par l'int?r?t qu'ont manifest? pour elle diff?rentes disciplines des sciences humaines, int?grant progressivement diff?rents aspects dans leurs approches d?finitoires : les contextes d'?nonciation, le support (?crit ou parl?), les normes langagi?res, l'?volution en diachronie, les pratiques sociales, etc. (cf S. Branca, ? Types, modes et genres entre langue et discours ?, Langage et Soci?t? n?87, p. 5 ?24, mars 1999). Ce renouvellement se lit aussi ? travers le fait qu'on cherche moins syst?matiquement ? en d?finir les r?gles de production ou ? d?terminer des cat?gories classificatoires qu'? poser la question du genre en interrogeant les processus de reconnaissance et d'interpr?tation. La r?flexion et les ?tudes de cas s'orientent ainsi sur le point de vue de la r?ception (horizons d'attente, habitudes, pr?-construits culturels, cadre cognitif, circuit de communication,?), le genre ?tant alors envisag? comme un ensemble de contraintes ou de conditions de possibilit?s du sens. COLDOC 2013 cherchera, en r?unissant des contributions d'horizons vari?s, ? rendre compte de l'?tat de l'art du travail accompli, de sa diversit?, mais aussi, en s'appuyant sur des propositions th?oriques et appliqu?es, ? proposer de nouvelles cat?gories descriptives n?cessaires ? la qu?te du sens dans le discours ?crit et oral. Cette ?dition 2013 de COLDOC encourage donc fortement les participations des m?morants, doctorants et jeunes chercheurs en linguistique g?n?rale, linguistique de corpus, linguistique diachronique, linguistique textuelle, sociolinguistique, didactique, traitement automatique des textes ou de la parole et, plus g?n?ralement, de tout domaine qui s'int?resserait ? l'?tude du genre pour lui-m?me ou comme cat?gorie d'analyse (cat?gorie interpr?tative, etc.). Plusieurs questions, mentionn?es ici sans exhaustivit?, peuvent ?tre envisag?es comme source d'inspiration. Ces questions, autant th?oriques que pratiques mettent en lumi?re la grande diversit? d'approches possibles dans l'?tude des genres aussi bien ?crits qu'oraux : - Pourquoi cat?goriser selon des genres ? Comment ?tablir des fronti?res entre genres ? - Comment d?finir, formaliser et mod?liser le genre ? - Selon quelles dynamiques le genre se construit-il ? - Dans quelle mesure les approches diachroniques renouvellent-elles l'?tude des genres ? - Quel(s) rapport(s) entretiennent ? genres ? et ? op?rations linguistiques ? (d?crire, r?sumer, raconter...) ? - Le genre a-t-il une influence sur les ph?nom?nes grammaticaux ? - Quelles sont ses instanciations sociolinguistiques ? - Comment les variables linguistiques de l'usage, de la vari?t? et des registres de langue peuvent-elles devenir des marqueurs sociaux propres au genre dans lequel les locuteurs communiquent ? - Comment la linguistique de corpus r?pond-elle ? l'?tude du genre ? - Comment l'?tude du genre ? l'?crit est-elle applicable aux genres oraux et vice versa? - Sur quels observables se base-t-on pour l'attribution du genre ? Peut-on le calculer automatiquement ? - Quelle est la place des genres en didactique comme outil d'enseignement et d'apprentissage de la langue et de la litt?rature ? - Comment cat?goriser et interpr?ter selon les nouveaux dispositifs de communication (forums, blogs, r?seaux sociaux, chats, tweets, emails, etc.) l'?mergence de nouvelles pratiques langagi?res ? - Les techniques d'analyse automatique des textes et des discours redistribuent-elles la cat?gorisation en genres ? Font-elles ?merger d'autres formes de cat?gorisations ? - La distinction oral-?crit est-elle une distinction majeure dans l'?tude des genres ? - Comment prendre en compte le genre dans le d?veloppement des ressources en TAL (lexique, grammaire, parseurs, etc. ) ? *Comit? scientifique* Jean-Michel ADAM (Universit? de Lausanne, Suisse) Sophie ANQUETIL (CoDiRe, Universit? de Nantes et CRISCO, Universit? de Caen, France) Antoine AUCHLIN (Universit? de Gen?ve, Suisse) Jacqueline AUTHIER (SYLED-EA 2290, Universit? Sorbonne Nouvelle, France) Mathieu AVANZI (Institut des Sciences du Langage et de la Communication, Universit? de Neuch?tel, Suisse) Delphine BATTISTELLI (Universit? Paris-Sorbonne, France) Sonia BRANCA-ROSOFF (SYLED-EA 2290, Universit? Sorbonne Nouvelle, France) Bernard COMBETTES (ATILF, Universit? de Lorraine, France) Anne CONDAMINES (CLLE-ERSS/CNRS, Universit? Toulouse Le Mirail, France) Marcel CORI (MoDyCo/CNRS, Universit? Paris Ouest, France) Shirley CARTER THOMAS (Lattice, Institut Mines-T?l?com, T?l?com Ecole de Management, France) Flore COULOUMA (CREA-EA 370, Universit? Paris Ouest, France) Guillaume DESAGULIER (MoDyCo ? Universit? Paris 8, Universit? Paris Ouest) Sarah DE VOGUE (MoDyCo ? Universit? Paris-Ouest, France) Marion FOSSARD (Institut de Logop?die adulte, Universit? de Neuch?tel, Suisse) Jean-Philippe GOLDMAN (Universit? de Gen?ve, Suisse) Jean-Fran?ois JEANDILLOU (MoDyCo/CNRS, Universit? Paris-Ouest, France) Anne LACHERET (MoDyCo/CNRS, Universit? Paris-Ouest, France) Bernard LAKS (MoDyCo/CNRS, Universit? Paris-Ouest, France) Sabine LEHMANN (MoDyCo/CNRS, Universit? Paris-Ouest, France) Sylvain LOISEAU (Laboratoire Lexiques, Dictionnaires, Informatique/CNRS, Universit? Paris 13-Nord, France) Julien LONGHI (CRTF, Universit? de Cergy-Pontoise) Dominique MAINGUENEAU (UFR de Langue fran?aise, Universit? Paris Sorbonne, France) Philippe MARTIN (CLILLAC-ARP, Universit? Paris Diderot, France) Caroline MELLET (MoDyCo/CNRS, Universit? Paris-Ouest, France) Jean-Luc MINEL (MoDyCo/CNRS, Universit? Paris-Ouest, France) Colette NOYAU (MoDyCo/CNRS, Universit? Paris-Ouest, France) Sabine P?TILLON (MoDyCo/CNRS, Universit? Paris-Ouest, France) Paola PIETRANDREA (MoDyCo, Universit? Roma Tre, Italie) Fanny RINCK (IUFM de Grenoble, laboratoire Lidilem,EA609, Universit? de Grenoble 3, France) Anne-Catherine SIMON (Valibel, Discours et Variation, Universit? Catholique de Louvain, Belgique) Fr?d?rique SITRI (SYLED-EA 2290/MoDyCo/CNRS, Universit? Paris-Ouest, France) Noalig TANGUY (Lattice, France) *Comit? d'Organisation* *Julie BELIAO (Doctorante Laboratoire MoDyCo, Universit? Paris-Ouest, France)* *Ana?s MORENO (Doctorante Laboratoire MoDyCo, Universit? Paris-Ouest, France)* *Tony ONGUENE (Doctorant Laboratoire MoDyCo, Universit? Paris-Ouest, France)* *Lucie ROUSIER-VERCRUYSSEN (Doctorante Laboratoire MoDyCo, Universit? de Neuch?tel, Suisse)* *Charles TEISSEDRE (Docteur, ATER Paris-Sorbonne, France)* ------------------------------------------------------------------------ COLDOC2013 : Genres in Written and Oral Productions 13-14 november 2013 last call for papers ------------------------------------------------------------------------ COLDOC2013: Extended Deadline 22th June Dear colleague(s), Please find below the call for papers for the 9th edition of COLDOC, a conference organized by MoDyCo lab, Paris, for PhD students and young researchers. The call for paper can also be found on the COLDOC2013 website (http://coldoc2013.wordpress.com/). This might be of interest to some of PhD students and young researchers in Linguistics. Thanks in advance for broadcasting this information around you! Best regards, Julie Beliao pour le comit? d'organisation de COLDOC2013 (http://coldoc2013fr.wordpress.com/). *Important dates:** * extended abstract submission: * 22** june 2103* extended abstract acceptation notification: 31 july 2013 paper submission: 3 september 2013 paper acceptation notification: 31 july 2013 final paper submission: 13 october 2013 *inscriptions* *free* for all participants * *submission* Paper proposal should be a maximum of 3 pages (see submission guidelines on COLDOC2013 site - http://coldoc2013.wordpress.com/submissions/) and should be made via the EasyChair page of COLDOC2013 (https://www.easychair.org/conferences/?conf=coldoc2013). Every paper will be blind reviewed by at least 2 members of the scientific committee. The COLDOC2013 contributions be followed by a special publication of selected papers. *COLDOC2013 call for paper * COLDOC 2013 aims to examine the notion of genre in a multidisciplinary approach and to illustrate the variety of both theoretical and practical problems it raises. The call for papers is open to a wide variety of contributions that can help identify an essential category for interpretation. Although it has long remained been restricted to taxonomic approaches, the issue of genre categorisation sees new developments thanks to the interest it has raised in various humanities disciplines, gradually integrating different aspects in their definitional approaches: contexts of utterance, medium (written or spoken), language norms, social practices, etc. This renewal is also expressed by the fact that the studies less systematically seek to define it through production rules or classificatory categories, but rather try to examine the question of genre through the process of recognition and interpretation. Theoretical approaches and case studies tend to focus on the addressee's point of view: horizons of expectations, habits, cultural pre-conceptions, cognitive framework, communication circuit, etc. The genre is then modeled as a set of constraints or necessary conditions of meaning. COLDOC 2013, bringing contributions from diverse backgrounds, aims to review the state of the art and the diversity of work on genres. Relying on theoretical and applied propositions, COLDOC 2013 aims to suggest new descriptive categories needed in the search for meaning in written and oral discourse. This 2013 edition of COLDOC therefore strongly encourages participation from masters students, PhD students candidates and young researchers in general linguistics, corpus linguistics, sociolinguistics, computational linguistics (written or speech) and, more generally, any area that would be interested in the study of genres. Several issues - solely as examples - can be considered as sources of inspiration. These issues, both theoretical and practical, highlight the variety of possible approaches in the study of textual and oral genres: - Why categorize according to genres? How should boundaries between genres be established? - How should genres be defined, formalized and modeled? - What are the dynamics implied in genre building? - What are the implied relation(s) between ?genre' and ?linguistic operations' (describe, summarize, tell?)? - Does genre influence grammatical phenomena? - What are the sociolinguistic instantiations of genre? - How can usage, variety and language registers linguistic variables become genre-specific social markers? - How does corpus linguistics answer to genre study? - How can genre study in written productions be applied to oral genres and vice versa? - What observables is genre assignment based on? Can it be automatically calculated? - What is the role of genre as a tool for teaching and learning language and literature? - How can we categorize and interpret the emergence of new linguistic practices according to new communication devices (forums, blogs, social networks, chats, tweets, emails, etc.)? - Do techniques for automatic analysis of texts and discourses question or redistribute the categorization into genres? Do they contribute to other forms of categorization? - Is the oral-written distinction a major distinction in the study of genres? - How can genre be accounted for in the development of NLP resources (lexicon, grammar, parsers, etc.)? *Scientific committee* Guy ACHARD-BAYLE (Universit? de Lorraine, France) Jean-Michel ADAM (Universit? de Lausanne, Suisse) Sophie ANQUETIL (CoDiRe, Universit? de Nantes et CRISCO, Universit? de Caen, France) Antoine AUCHLIN (Universit? de Gen?ve, Suisse) Jacqueline AUTHIER (SYLED-EA 2290, Universit? Sorbonne Nouvelle, France) Mathieu AVANZI (Institut des Sciences du Langage et de la Communication, Universit? de Neuch?tel, Suisse) Delphine BATTISTELLI (STIH, Universit? Paris Sorbonne, France) Jacqueline BILLIEZ (Universit? de Stendhal Grenoble III, France) Sonia BRANCA-ROSOFF (SYLED-EA 2290, Universit? Sorbonne Nouvelle, France) Bernard COMBETTES (ATILF, Universit? de Lorraine, France) Anne CONDAMINES (CLLE-ERSS/CNRS, Universit? Toulouse Le Mirail, France) Marcel CORI (MoDyCo/CNRS, Universit? Paris-Ouest, France) Shirley CARTER THOMAS (Lattice, Institut Mines-T?l?com, T?l?com Ecole de Management, France) Flore COULOUMA (CREA-EA 370, Universit? Paris Ouest, France) Guillaume DESAGULIER (MoDyCo - Universit? Paris 8, Universit? Paris Ouest) Sarah DE VOGUE (MoDyCo - Universit? Paris-Ouest, France) Marion FOSSARD (Institut de Logop?die adulte, Universit? de Neuch?tel, Suisse) Fran?oise GADET (MoDyCo/CNRS, Universit? Paris-Ouest, France) Jean-Philippe GOLDMAN (Universit? de Gen?ve, Suisse) Jean-Fran?ois JEANDILLOU (MoDyCo/CNRS, Universit? Paris-Ouest, France) Anne LACHERET (MoDyCo/CNRS, Universit? Paris-Ouest, France) Bernard LAKS (MoDyCo/CNRS, Universit? Paris-Ouest, France) Sabine LEHMANN (MoDyCo/CNRS, Universit? Paris-Ouest, France) Sylvain LOISEAU (Laboratoire Lexiques, Dictionnaires, Informatique/CNRS, Universit? Paris 13-Nord, France) Julien LONGHI (CRTF, Universit? de Cergy-Pontoise) Juan Manuel LOPEZ MUNOZ (Universit? de Cadix, Espagne) Dominique MAINGUENEAU (UFR de Langue fran?aise, Universit? Paris Sorbonne, France) Philippe MARTIN (CLILLAC-ARP, Universit? Paris Diderot, France) Caroline MELLET (MoDyCo/CNRS, Universit? Paris-Ouest, France) Jean-Luc MINEL (MoDyCo/CNRS, Universit? Paris-Ouest, France) Colette NOYAU (MoDyCo/CNRS, Universit? Paris-Ouest, France) Sabine P?TILLON (MoDyCo/CNRS, Universit? Paris-Ouest, France) Paola PIETRANDREA (MoDyCo, Universit? Roma Tre, Italie) Fran?ois PROVENZANO (Universit? de Li?ge, Belgique) Alain RABATEL (Universit? de Lyon I, France) Fanny RINCK (IUFM de Grenoble, laboratoire Lidilem,EA609, Universit? de Grenoble 3, France) Anne-Catherine SIMON (Valibel, Discours et Variation, Universit? Catholique de Louvain, Belgique) Fr?d?rique SITRI (SYLED-EA 2290/MoDyCo/CNRS, Universit? Paris-Ouest, France) Noalig TANGUY (Lattice, France) Gian Maria TORE (Universit? de Luxembourg, Luxembourg) Organization Committee Julie BELIAO (Doctorante Laboratoire MoDyCo, Universit? Paris-Ouest, France) Ana?s MORENO (Doctorante Laboratoire MoDyCo, Universit? Paris-Ouest, France) Tony ONGUENE (Doctorant Laboratoire MoDyCo, Universit? Paris-Ouest, France) Lucie ROUSIER-VERCRUYSSEN (Doctorante Laboratoire MoDyCo, Universit? de Neuch?tel, Suisse) Charles TEISSEDRE (Docteur, ATER Paris-Sorbonne, France) Julie Beliao for the organizing committee of COLDOC2013. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:21:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:21:35 +0200 Subject: Conf: Interspeech 2013, Lyon (France), 25-29 August 2013 Message-ID: Date: Wed, 12 Jun 2013 01:35:02 +0200 From: Interspeech 2013 Message-ID: <51B7B426.5010800 at inria.fr> X-url: http://www.interspeech2013.org INTERSPEECH 2013 Conference with special focus on "Speech in Life Sciences and Human Societies" 25-29 August 2013, Lyon (France) Join us for the 14th edition of the INTERSPEECH Conference in Lyon, 25-29 August 2013. Register now... ... and experience the largest international event in the field of speech communication sciences, in a wonderful venue and area at the heart of Europe. Conference website : http://www.interspeech2013.org ---------- Flash News ---------- Early registration : deadline extended until June 21st Register at http://www.interspeech2013.org/content/general-information-online-registration Accomodation package in university residence starting from ?170 for 5 nights More info on : http://www.afcp-parole.org/IS13/index.html A preliminary version of the programme "at a glance" is now accessible at : http://www.interspeech2013.org/content/programme-glance-tentative-programme Full programme to be disclosed soon. During the conference, an exciting special event celebrating the 25th anniversary of ESCA/ISCA will review the major scientific evolutions of the field, the milestones achieved and the challenges ahead. Follow us on twitter! #interspeech2013 -------------------------- The Interspeech conference -------------------------- INTERSPEECH, the annual conference of the International Speech Communication Association (ISCA), is the world's largest and most comprehensive conference on Spoken Language Processing science and technology. This year's edition will be hosted in the Lyon Convention Center, which offers first-grade facilities in a very attractive city and region, at the heart of Europe. The conference covers all aspects of speech science and technology, ranging from fundamental contributions to practical applications, in a wide variety of areas. The programme will consist of 750 communications as oral and poster sessions, 4 keynote talks by internationally renowned experts, 6 high-level tutorials, 30 Show & Tell demos, plus an exhibition and satellite workshops. Tutorials : http://www.interspeech2013.org/content/tutorials Keynote talks: http://www.interspeech2013.org/content/keynote-speakers Satellite workshops: http://www.interspeech2013.org/content/satellite-workshops All details on : http://www.interspeech2013.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:33:05 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:33:05 +0200 Subject: Appel: Workshop Conflict and Communication Message-ID: Date: Wed, 12 Jun 2013 11:57:41 +0200 From: Laura Vincze Message-ID: X-url: http://www.dcs.gla.ac.uk/~vincia/conflict/index.html Please find in attachment the call for papers for the International Workshop on Conflict and Communication organized at the University Roma Tre, 29-31 October 2013. Submission of abstracts extended to 24th of June 2013. Universita? Roma Tre Aula Magna Department of Philosophy, Communication, and Screen and Stage studies Via Ostiense 234 - Roma October 29 ? 31, 2013 http://www.dcs.gla.ac.uk/~vincia/conflict/index.html International Workshop Conflict and communication. Multimodal Social Signals of conflict and negotiation in humans, animals, and machines When in an environment resources are limited, and two or more humans or other animals need the same resource, its attainment by one is incompatible with the attainment by the other: thus conflict arises. Conflict may simply hold between two or more beliefs (cognitive conflict), or between goals of the same person or animal (intraindividual conflict), or finally between the goals of two or more individuals or groups (interpersonal and social conflict). In all cases conflict may cause internal turmoil or social aggression, and yet sometimes may also be a carrier of positive novelty and change. This workshop focuses on interpersonal and social conflict, and on the communication that may arise from it, but also give rise to it, or finally determine conflict escalation or resolution. Since such a complex topic as conflict needs to be confronted by a high level of multidisciplinarity, we encourage contributions from various fields, among which: Psychology, Ethology, Political Sciences, Neuroscience, Linguistics, Argumentation, Social Simulation, Robotics, Social Signal processing, Swarm intelligence... Some core topics in the workshop, and their leading questions, are the following: *Theoretical issues in conflict* What is conflict, and what is the boundary between competition and conflict? Are all cases of aggression determined by conflict, and does conflict always lead to aggression? What are the mechanisms and triggering rules of escalation and what are those of negotiation? Sometimes conflicts are not explicit or evident, but rather deep, underground, covert. What are the signals of overt and covert conflicts? What are the routes of conflict? Is conflict primary (only stemming from context, bare competition over resources) or sometimes secondary to emotions (for instance might one start to raise conflict with another only due to personality clash)? What are the dynamics of conflict? Some theories propose that social hierarchies and leadership arise right with the function of minimizing conflicts. Is this (always) true? Are there types of social organization or leadership more apt than others to prevent conflict? What could / should be changed in an organization to lower the number and level of conflicts? Do the ways people and animals sense and manage conflict and its escalation and resolution change across ontogenetic and phylogenetic evolution, and if so, how do they? Are there neurological bases to the capacity of sensing and managing social conflict? *Social signals and multimodality * How is conflict expressed in communicative interaction between humans? How do the various types of conflict differ from each other, for example, discussion, argument, quarrel, contest? Do different rules apply to them? One of the main communicative forms triggered by conflict is argumentation. Can we distinguish more and less conflictual argumentations? What are the signals that reveal the existence of conflict, escalation, de-escalation, negotiation, smoothing? What are the signals of conflict between non-human animals? Are there signals shared by human and non-human animals? Conflictual communication may be studied in various modalities. In the acoustic modalities, what are the characterizing features of voice or noise in conflict? Can conflict be expressed by music? Are some types of intonation more typically used during conflict? Are there speech acts or other communicative acts typical of conflict, such as accusation, criticism, insult? How is conflict expressed in the structure of turn-taking and floor management? Are there cues of conflict in intonation and voice quality? In the visual modalities, what are the gestures, postures, gaze items and facial expressions typically used in conflict? Can conflict be expressed by art, graphics and other visual artifacts? *Ethical issues, deception and non-cooperative communication in conflict* Is there an ethics of conflict? Are there moral rules for negotiation or reconciliation? Are there cases in which conflict cannot be avoided, or negotiation should be skipped, due to ethical reasons? Does negotiation often entail deception? What are the effects of truthful and deceitful communication on conflict? Is deception exploited to avoid conflict or is it a major cause of conflict? Sometimes sincere communication, by making the conflict explicit, may contribute to exacerbate it, so people may try to avoid sincerity or use hypocrisy or vagueness to prevent conflict; but on the other hand, if one lets conflict emerge, might this contribute, and in what cases and ways, to clarify positions, look for agreement, and start negotiation? What is the relation of conflict with truthful and deceitful communication in animals? Generally animals tend to use deception more to prevent conflict than to find a way out of it ? see the function of bluff and other deceitful displays ? but is this always and necessary so? *Emotions and conflict* What emotions are generally a cause of conflict, and what are the most typical effects of it? How are they expressed with or without a conflictual interaction? How can trust, envy, admiration, pride, compassion or other emotions prevent, trigger, enhance, smooth conflict? How can their sincere or simulated expression work in conflict management? What is the role of empathy and other affective states in negotiation and reconciliation? *Simulation, analysis and synthesis of conflict* Is it possible to build systems for the automatic detection of conflict, both bottom up ? by detecting signals of conflict ? and top-down ? by analyzing contexts and inferring their likeliness for conflict generation? Is it possible to construct a synthetic ?negotiation counselor?? How can automatic argumentative systems be adapted to conflict prevention or resolution? How can the simulation of conflict in robots and neural systems give hints for the prevention and managing of conflict in humans? The topics of the Workshop include, but are not limited to: - theoretical and computational models of conflict - conflict, negotiation, conflict resolution, reconciliation - multimodality - multimodal corpora - social signal processing - phonetics, prosody and intonation - gesture - discourse strategies - argumentation and persuasion - deception - conversational analysis - public speaking - political communication - persuasive dialogue systems - speech analysis and synthesis - gesture and action recognition - applications - Embodied Conversational Agents - Persuasive Technology Program Committee: Jens Allwood Francesca Cant? Marco Cristani Anna Esposito Ellen Giebels Emile Hendricks Dirk Heylen Giovanna Leone Giacomo Marramao Elio Matassi David Meghnagi Enrico Menduni Alessandro Neri Magalie Ochs Franca Orletti Fabio Paglieri Albert Ali Salah Bj?rn Schuller Key-note Speakers: Judee Burgoon, Center for the Management of Information, University of Arizona http://www.borders.arizona.edu/cms/content/judee-burgoon Cristiano Calstelfranchi, Istituto di Scienze e Tecnologie della Cognizione ? CNR, Roma http://www.istc.cnr.it/it/people/cristiano-castelfranchi Ellen Giebels, Centre for Conflict, Risk and Safety Perception, University of Twente http://www.utwente.nl/gw/pcrv/en/emp/giebels.doc/ Shrikanth Narayanan, Signal Analysis and Interpretation Lab, University of South California http://sail.usc.edu/shri.php The Workshop is open to all motivated scientists, of any nationality, both on the Social Scientists and the Computer Scientists side. To encourage young researchers? participation, grants are available for up to 8 Participants (maximum of 600 EUROS for accommodation, living and travel expenses), upon selection of the best abstracts, of the applicants? potential contribution to the Workshop, and the benefits that they may draw from the meeting for their future activities. SUBMISSIONS: Authors are invited to submit an abstract of 400-600 words for presentation at the Workshop. After the Workshop a selection of the papers presented will be published in a book of a Springer series. Abstracts and Papers should be sent to the following addresses: poggi at uniroma3.it; fderrico at uniroma3.it; laura.vincze at gmail.com; IMPORTAT DATES: June10st, 2013: Submission of abstracts (400 ? 600 words) July 10th, 2013: Notification of acceptance Extended to: June 24th, 2013: Submission of abstracts (400 ? 600 words) July 24th, 2013: Notification of acceptance October 29-31, 2013: Workshop November 30th, 2013: Paper submission January 20th, 2014: Notification of acceptance of papers February 28th, 2014: Camera-ready paper Scientific organization: Isabella Poggi*, Francesca D?Errico**, Alessandro Vinciarelli***, Laura Vincze* *Universit? Roma Tre* Universit? Telematica Internazionale UNINETTUNO University of Glasgow Contacts: Isabella Poggi, poggi at uniroma3.it Francesca D?Errico, fderrico at uniroma3.it Alessandro Vinciarelli, Alessandro.Vinciarelli at glasgow.ac.uk Laura Vincze, laura.vincze at gmail.com; ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:18:53 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:18:53 +0200 Subject: Conf: ESSLLI 2013, extension for early bird registration, August 5-16, 2013, Dusseldorf, Germany Message-ID: Date: Tue, 11 Jun 2013 19:50:27 +0200 From: Wolfgang Maier Message-ID: X-url: http://www.esslli2013.de ** apologies for cross-posting ** CALL FOR PARTICIPATION (Early bird registration deadline extended!) ================================================================== ESSLLI 2013 The 25th European Summer School in Logic, Language and Information August 5-16, 2013, D?sseldorf, Germany http://www.esslli2013.de ================================================================== The 25th European Summer School in Logic, Language and Information (ESSLLI 2013) has extended the deadline for early bird registration. To take advantage of the early bird rates, register at http://esslli2013.de/registration before ** June 22, 2013 ** ESSLLI brings together logicians, linguists, computer scientists, and philosophers to study language, logic, and information, and their interconnections. The school hosts approximately 50 courses at both introductory and advanced levels, and brings together around 500 participants from all over the world. Along with the courses, ESSLLI hosts workshops and invited lectures, providing opportunities for in-depth discussion of current research. For more information on ESSLLI and on D?sseldorf, please check our website at http://esslli2013.de and our Facebook Page at https://www.facebook.com/essli.dusseldorf. We are very proud to be hosting the 25th ESSLLI in D?sseldorf and we look forward to seeing you there! -- Wolfgang Maier, on behalf of the ESSLLI 2013 Organization Committee ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:14:18 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:14:18 +0200 Subject: Appel: Collaboration pour la lemmatisation du francais medieval Message-ID: Date: Tue, 11 Jun 2013 17:07:20 +0200 From: C?line Guillot Message-ID: <51B73D28.4010603 at ens-lyon.fr> X-url: http://txm.bfm-corpus.org/ X-url: http://nl.ijs.si/ME/V4 Chers coll?gues, ? l'occasion du projet PRESTO financ? par l'ANR et la DFG (D. Vigier, Univ. Lyon2 et resp. P. Blumenthal, Univ. de Cologne), la Base de Fran?ais M?di?val (http://txm.bfm-corpus.org/) lance une vaste op?ration de lemmatisation d'un corpus de textes m?di?vaux (9e-15e si?cles). Pour cela, nous avons pr?vu : - de construire un ou plusieurs lemmatiseurs sur la base des logiciels de l'?tat de l'art (TreeTagger, LGTagger...) ; - de construire un lexique morphologique le plus complet possible associant ? forme(*) - cat?gorie morphosyntaxique(**) - lemme(***) ? ; - de construire des corpus d'apprentissage d?j? ?tiquet?s. Nous souhaitons d?velopper le lexique en appliquant un mod?le de construction ?quivalent ? celui utilis? pour le d?veloppement des logiciels ouverts (open-source), c'est ? dire en compilant diff?rents lexiques en un lexique commun diffus? sous licence libre - de type LGPLFLR (Lesser General Public License For Linguistic Resources - voir : http://hoop.univ-mlv.fr/lgpllr.html). Cette licence pr?cisera explicitement la contribution de chaque partenaire et la mise ? jour r?guli?re du lexique sera r?alis?e de fa?on communautaire au b?n?fice de tous les contributeurs. Le d?veloppement du lemmatiseur se fera dans le cadre de la plateforme TXM qui offre d?j? un cadre de d?veloppement open-source en logistique de corpus (gestion de formats standards en import et en export, int?gration d'outils de TAL tiers, etc.). Ce nouvel outil de lemmatisation sera ouvert ? tous et librement adaptable (open-source avec une licence de diffusion de logiciel de type GNU GPL - voir : http://www.rodage.org/gpl-3.0.fr.txt). Si vous disposez de ressources pour la p?riode m?di?vale, nous souhaiterions savoir si vous ?tes int?ress?s par des ?changes et par le partage d'un lexique ou de corpus d'apprentissage dans les conditions d?crites ci-dessus. Si vous connaissez des personnes qui pourraient ?tre int?ress?es, nous vous serions tr?s reconnaissants de leur faire suivre ce mail. Bien cordialement, C?line Guillot pour l'?quipe BFM (*) certaines formes pourront ?tre compos?es si n?cessaire (par exemple comme dans le cas d'un dictionnaire Unitex) (**) nous souhaiterions utiliser un jeu d'?tiquettes normalis? bas? par exemple sur le standard Multext adapt? ? l'?poque m?di?vale (http://nl.ijs.si/ME/V4) (***) nous souhaiterions utiliser des formes modernis?es des lemmes ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:16:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:16:45 +0200 Subject: Cursus: Master specialite, Traitement Automatique des Langues, Universite de Lorraine Message-ID: Date: Tue, 11 Jun 2013 17:33:24 +0200 (CEST) From: Laure Buhry Message-ID: <180013217.5085055.1370964804345.JavaMail.root at inria.fr> X-url: http://ufr-mathinfo.fr/sciencescognitives/ X-url: http://www.lct-master.org. Le master Sciences de la Cognition et Applications (SCA) de l'universit? de Lorraine propose une sp?cialit? : Traitement Automatique des Langues La premi?re ann?e est commune ? deux sp?cialit?s : Sciences Cognitives et M?dia Num?riques, et Traitement Automatique des Langues (TAL). Cette formation de master en TAL combine des cours fondamentaux et des cours ? vis?e applicative. Ses d?bouch?s sont aussi bien acad?miques qu'industriels. Elle peut int?resser les ?tudiants fran?ais poss?dant une licence en sciences cognitives, en sciences du langage ou en informatique. Site web du master SCA : http://ufr-mathinfo.fr/sciencescognitives/ Cette formation est ?galement support au programme : master Erasmus Mundus ? Language and Communication Technologies ? (LCT) . La formation TAL du master SCA propos?e par l'Universit? de Lorraine est commune aux ?tudiants Erasmus Mundus LCT et ? ceux qui veulent seulement faire le master de l'Universit? de Lorraine. De ce fait, les cours sont dispens?s en anglais. Les universit?s partenaires du master LCT sont les suivantes : + universit? de la Sarre ? Sarrebr?ck (Allemagne) + universit? de Trento (Italie) + universit? de Malte + universit? Charles de Prague (R?publique Tch?que) + universit? de Lorraine + universit? de Groningen (Pays-Bas) + universit? Jiao Tong de Changha? (Chine) + universit? de Melbourne (Australie) + universit? du Pays Basques (Espagne). Les ?tudiants du programme Erasmus Mundus font leur premi?re ann?e de master dans une universit? du consortium et leur deuxi?me ann?e dans une autre universit? de ce consortium. ? l'issue de leurs ?tudes, ils sont dipl?m?s des deux universit?s o? ils ont effectu? leurs ?tudes. site web du programme LCT : http://www.lct-master.org. Pour plus de renseignements : + responsable master SCA : manuel.rebuschi at univ-lorraine.fr + responsable sp?cialit? TAL : laure.buhry at inria.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:38:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:38:48 +0200 Subject: Appel: Donnees hybrides et contextualisation des corpus, Nouvelles approches en sciences du langage Message-ID: Date: Wed, 12 Jun 2013 20:44:57 +0200 From: Alice Krieg-Planque Message-ID: <51B8C1A9.5030506 at club-internet.fr> X-url: http://f.hypotheses.org/wp-content/blogs.dir/1033/files/2013/06/Appel-?-communications-corpus-et-contextes-20141.pdf Les universit?s de Paris 13, Paris 5 et Paris 3 lancent un appel pour un colloque de doctorants intitul? "Donn?es hybrides et contextualisation des corpus. Nouvelles approches en sciences du langage" qui se tiendra ? Paris les 23-24 Mai 2014. La date limite de soumission est le 9 d?cembre 2013. L'adresse d'envoi des propositions de communication est : corpusetcontextes at gmail.com. Pour t?l?charger l'appel : http://f.hypotheses.org/wp-content/blogs.dir/1033/files/2013/06/Appel-?-communications-corpus-et-contextes-20141.pdf Merci de diffuser aupr?s de vos r?seaux. Bien cordialement Catherine Ruchon ruchon at free.fr Doctorante en sciences du langage Universit? Paris 13 Sorbonne Paris Cit? PL?IADE (CENEL) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 12 20:25:13 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Jun 2013 22:25:13 +0200 Subject: Appel: AIRS 2013 Message-ID: Date: Wed, 12 Jun 2013 06:41:55 +0000 From: "Zhang Min (I2R)" Message-ID: ========== Apologies for cross-posting ======= The Ninth Asia Information Retrieval Societies Conference (AIRS 2013) December 09-11, 2013, Singapore The Chinese and Oriental Languages Information Processing Society (COLIPS) is glad to host AIRS 2013 in Singapore, a well communicated and top conference city in Asia, from 9 to 11 December 2013. Singapore has already been the host city for other major conferences such as SIGIR 2008 and ACL 2009 (COLIPS being one of the local organizers of the latter one), as well as a previous edition of AIRS in 2006 and many other international workshops and events. All these successful experiences, which have been continuously confirmed over the years by the positive feedback from participating delegates and board members, have endorse the reputation of Singapore as a world-class venue for organizing and hosting international conferences and meetings. Additionally, Singapore?s long tradition in high-quality research in infocomm technologies, as well as its vibrant and dynamic academic and industrial communities, determines the fundamental interest from COLIPS to organize well recognized conferences relevant to the infocomm area, such as AIRS. The Asia Information Retrieval Societies Conference (AIRS) aims to bring together researchers and developers to exchange new ideas and latest achievements in the field of Information Retrieval. The scope of the conference covers applications, systems, technologies and theory a spects of information retrieval in text, audio, image, video and multimedia data. The AIRS 2013 welcomes submissions of original papers in the broad field of Information Retrieval. The technical areas covered include, but are not limited to, the following: 1. IR Models and Theories 2. User Study, Evaluation and Interactive IR 3. Web IR, Scalability and IR in Social Media 4. Multimedia IR 5. Natural Language Processing for IR 6. Machine Learning and Data Mining for IR 7. IR Applications Important Dates: - Jun 23rd, Paper Submission Due - Jul 28th, Notification of Acceptance - Aug 11th, Camera Ready Due - Dec 9th ? 11th AIRS 2013 to be held in Singapore The AIRS 2013 proceedings will be published as a Springer?s LNCS volume. Submissions should comply with the corresponding author instructions available at the Springer's LNCS website: http://www.springer.com/computer/lncs Paper submissions must be completed electronically and in PDF format to the following URL: https://www.softconf.com/e/airs2013/ Organizing Committee - Conference Co-chairs: Rafael E. Banchs (Institute for Infocomm Research) Min Zhang (Chinese and Oriental Language Information Processing Society and Institute for Infocomm Research, Singapore) - Program Committee Co-Chairs: Fabrizio Silvestri (Istituto de Scienza e Tecnologia dell?Informazione, Italy) Tie-Yan Liu (Microsoft Research Asia, China) Rafael E. Banchs (Institute for Infocomm Research, Singapore) - Publication Co-Chairs: Sheng Gao (Institute for Infocomm Research) Jun Lang (Chinese and Oriental Language Information Processing Society) - Local Organizing Committee Co-Chairs: Minghui Dong (Chinese and Oriental Language Information Processing Society) Seokhwan Kim (Institute for Infocomm Research) Marta Ruiz Costa-juss? (Universitat Politecnica de Catalunya / Institute for Infocomm Research) - Publicity Co-Chairs: Min Yen Kan (National University of Singapore) Jens Grivolla (Barcelona Media Innovation Centre) - Conference Advisor: Haizhou Li (Institute for Infocomm Research) AIRS Steering Committee: - Hsin-Hsi Chen (Taiwan) - Gary Geunbae Lee (Korea) - Wai Lam (Hong Kong) - Alistair Moffat (Australia) - Hwee Tou Ng (Singapore) - Tetsuya Sakai (Mainland China) - Dawei Song (UK) - Masaharu Yoshioka (Japan) Area Co-chairs: 1. IR Models and Theories - Bin Wang (Chinese Academy of Sciences, China) - Craig Macdonald (University of Glasgow, UK) 2. User Study, IR Evaluation and Interactive IR - Tetsuya Sakai (Microsoft Research Asia, China) - Ben Carterette (University of Delaware, USA) 3. Web IR, Scalability, and IR in Social Media - Alistair Moffat (University of Melbourne, Australia) - Min Zhang (Tsinghua University, China) 4. Multimedia IR - Kazunari Sugiyama (National University of Singapore, Singapore) - Joemon Jose (University of Glasgow, UK) 5. Natural Language Processing for IR - Qi Haoliang (Heilongjiang Institute of Technology, China) - Donald Metzler (Google Research, USA) 6. Machine Learning and Data Mining for IR - Sadao Kurohashi (Kyoto University, Japan) - Roi Blanco (University of A Coru?a, Spain) 7. IR Applications - Jimmy Huang (York University, Canada) - Gabriella Pasi (Universita de Milano Bicocca, Italy) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 19:56:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 21:56:24 +0200 Subject: ATALA: Convocation a l'Assemblee Generale ordinaire le 20 juin 2013 Message-ID: Date: Fri, 14 Jun 2013 21:37:51 +0200 From: Thierry Hamon Message-ID: <87ppvozdo0.fsf at smtp.univ-paris13.fr> X-url: http://www.atala.org/IMG/pdf/procuration_AG_2009.pdf Chers adh?rents de l'ATALA, Comme chaque ann?e, le moment est venu de nous r?unir en Assembl?e G?n?rale ordinaire. Le rendez-vous est fix? au jeudi 20 juin 2013 ? 16h30 aux Sables d'Olonne, pendant la conf?rence TALN/R?CITAL 2013. Vous trouverez ci-dessous la convocation ? cette Assembl?e G?n?rale et un appel ? candidature pour le Conseil d'Administration. En souhaitant vous y retrouver nombreux, amicalement, Beno?t Sagot, secr?taire de l'ATALA. ------------------------------------------------------------------- CONVOCATION ? L'ASSEMBL?E G?N?RALE ORDINAIRE DE L'ATALA ------------------------------------------------------------------- Jeudi 20 juin 2013 ? 16h30, Les Sables d'Olonne. Ordre du jour : - Rapport moral par la Pr?sidente, Fr?d?rique Segond. - Rapport financier par le Tr?sorier, Georges Antoniadis. - Rapport sur la revue TAL par Patrick Paroubek. - Rapport sur les conf?rences TALN-R?CITAL par Fr?d?ric B?chet. - Rapport sur les journ?es d'?tude par Isablle Tellier. - Renouvellement du tiers sortant du Conseil d'Administration. Pour rappel, composition actuelle du Conseil d'Administration : * Elus en 2010 : Jonathan Chevelu, Emmanuel Morin, Beno?t Sagot. * Elus en 2011 : Maxime Amblard, Fr?d?ric B?chet, Fr?d?rique Segond, Anne Garc?a-Fernandez, Adil El Ghali, Cyril Grouin, Mathieu Lafourcade, Yves Lepage, Patrick Paroubek, Alexandre Patry, Beno?t Trouvilliez * Elus en 2012 : Georges Antoniadis, Kar?n Fort, Nuria Gala, Thierry Hamon, Didier Schwab, Isabelle Tellier, Anne Vilnat Les adh?rents qui ne participeront pas ? l'Assembl?e G?n?rale peuvent voter par procuration en remettant une procuration remplie et sign?e ? un membre de l'association qui assistera ? l'AG. Un formulaire de procuration est t?l?chargeable ? l'adresse suivante http://www.atala.org/IMG/pdf/procuration_AG_2009.pdf et ? la fin du message. Si le quorum n'est pas atteint, une assembl?e g?n?rale extraordinaire sera convoqu?e ? 16h45 avec le m?me ordre du jour. ------------------------------------------------------------------- APPEL ? CANDIDATURES POUR LE CONSEIL D'ADMINISTRATION ------------------------------------------------------------------- Les membres du tiers sortant sont r??ligibles, mais ils doivent en exprimer le souhait. L'entr?e au CA est ouverte ? tout membre de l'ATALA. Les personnes souhaitant se porter candidates sont pri?es de le signaler soit par courrier ?lectronique ? contact at atala.org, soit le jour de l'AG. Les candidatures seront affich?es sur le site http://www.atala.org au fur et ? mesure de leur r?ception. Nous attirons l'attention sur le fait que l'ATALA souhaite accueillir en son CA des personnes motiv?es et pr?tes ? s'investir dans les activit?s administratives de l'association. ------------------------------------------------------------------------ "Je soussign? (nom, pr?nom, domicile)............................................................... Donne, par la pr?sente, pouvoir ? M. ........................................................................ Pour me repr?senter lors des votes de l'Assembl?e G?n?rale Ordinaire qui se tiendra le jeudi 20 juin 2013." ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 19:57:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 21:57:04 +0200 Subject: Appel: Revue TAL - Note de lecture (SOGAARD) Message-ID: Date: Thu, 13 Jun 2013 10:49:42 +0200 (CEST) From: Denis Maurel Message-ID: <168371801.17120965.1371113382946.JavaMail.root at mail10> La revue TAL publie r?guli?rement des notes de lecture. Nous recherchons un coll?gue souhaitant lire le livre: "Anders S?GAARD. Semi-Supervised Learning and Domain Adaptation in Natural Language Processing. Morgan & Claypool publishers. 2013. 93 pages." et pr?t ? en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoy? gracieusement en ?change du service rendu). Cette note de lecture doit ?tre r?dig?e en fran?ais (trois pages maximum, au format de la revue) et envoy?e fin ao?t 2013. D'autres compte-rendu sont possibles si vous avez lu r?cemment un ouvrage qui vous a int?ress? et si vous ?tes pr?t ? partager votre lecture avec la communaut?... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 19:58:32 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 21:58:32 +0200 Subject: Conf: SIIM@IC@PFIA'2013, Lille, 1er juillet 2013 Message-ID: Date: Thu, 13 Jun 2013 11:02:50 +0200 From: Lina Soualmia Message-ID: X-url: http://www.irit.fr/SIIM/2013/ La 2?me ?dition du Symposium sur l'Ing?nierie de l'Information M?dicale aura lieu le 1er juillet ? Lille Elle est associ?e aux 24?mes journ?es francophones d'Ing?nierie des Connaissances au sein de la Plateforme pour l'IA Site web : http://www.irit.fr/SIIM/2013/ ****************************** Pr?sentation ---------------- SIIM 2013 est la seconde ?dition du Symposium sur l?ing?nierie de l?information m?dicale qui r?unit les communaut?s en informatique m?dicale, des syst?mes d'information et de gestion de la connaissance en ciblant des probl?matiques li?es ? l?ing?nierie de l?information m?dicale. L'?dition inaugurale a eu lieu en 2011 ? Toulouse ( http://www.irit.fr/SIIM/2011/index.php) et a ?merg? des journ?es ayant eu lieu ? Rennes en 2003, Rouen en 2004 et de l?atelier qui s?est d?roul? ? N?mes en 2010 autour du web s?mantique m?dical ( http://www-limbio.smbh.univ-paris13.fr/wsm10/). Son objectif majeur est de d?battre des verrous li?s ? la mod?lisation, la structuration, l?extraction, la recherche et la fouille d?informations de tous types et de questions connexes et ce, ? travers la pr?sentation des activit?s de recherche innovantes, des techniques, des technologies et de d?monstrateurs d?velopp?s aussi bien dans le monde acad?mique, dans les laboratoires affili?s aux structures de sant? et par des industriels impliqu?s dans le domaine de l?ing?nierie de l?information qui couvre la mod?lisation, la structuration, l?extraction, la recherche et la fouille d?informations de tous types : structur?e sous forme de donn?e, semi-structur?e ou non structur?e sous forme de texte, d?image, de son, ...etc. Le symposium SIIM cible un public de jeunes chercheurs, chercheurs et industriels impliqu?s dans le domaine de l?usage de l?information m?dicale depuis sa production jusqu?? sa valorisation. Programme : -------------------- Pour plus de d?tails sur le programme : http://www.irit.fr/SIIM/2013/programme.php Th?mes ---------- - Terminologies et Ontologies m?dicales : Interop?rabilit? des syst?mes d?information en sant?, indexation terminologique de la litt?rature m?dicale, de dossiers m?dicaux de patients et de r?cits cliniques, annotations de documents, formalismes de repr?sentation, alignement d?ontologies et de terminologies. - Usage du Web 2.0 en sant? : R?seaux collaboratifs des praticiens de sant?, patients et famille, r?seaux bibliographiques dans le domaine m?dical, annotation sociale de ressources m?dicales. - Traitement d'informations multimodales : Traitement du texte, image et son, classification et int?gration de contenus m?dicaux multimodaux, multi-sources - Extraction de l?information et de connaissances ? partir de contenus m?dicaux : Anonymisation, extraction d?entit?s nomm?es, de variable et/ou indicateurs pathologiques, recherche de corr?lations, fouille de donn?es - Syst?mes d'informations en sant? : Repr?sentation, traitement et acc?s aux informations et des connaissances en sant?, syst?mes d?information d?cisionnels de sant?, gestion des dossiers m?dicaux de patients, personnalisation et sant? Inscriptions : --------------------- Cette ann?e, l'?dition de SIIM est int?gr?e au sein de la plateforme de l'Intelligence Artificielle, les inscriptions sont donc centralis?es. Pour plus de d?tails : http://pfia2013.univ-lille1.fr/ Organisateurs: ------------------- TAMINE LECHANI Lynda, IRIT, Toulouse SOUALMIA Lina, LITIS, Rouen Comit? d'initiative : ---------------------- CHARLET Jean Charlet, ICS, INSERM, Paris JAULENT Marie-Christine, ICS, INSERM, Paris LUENGO Vanda, LIG, Grenoble SOUALMIA Lina, LITIS, Rouen SOUF Nathalie, IRIT, Toulouse TAMINE LECHANI Lynda, IRIT, Toulouse Comit? de Programme : --------------------------- Brigitte Grau, LIMSI, Paris Orsay Catherine Berrut, LIG, Grenoble Fleur Mougin, ISPED, Universit? Bordeaux 2 Jean Charlet, ICS, INSERM, Paris Lina Soualmia, LITIS, Rouen Lynda Tamine Lechani, IRIT, Toulouse Marie-Christine Jaulent, ICS, INSERM, Paris Natalia Grabar, STL, Lille Nathalie Souf, IRIT, Toulouse Sandra Bringay, LIRMM, Universit? Montpellier 2 Vanda Luengo, LIG, Grenoble Pierre Zweigenbaum, LIMSI, Paris Orsay ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 20:00:53 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 22:00:53 +0200 Subject: Seminaire: Jennifer Foster, Analyse syntaxique au-dela du F-score, 01/07/2013, Villetaneuse Message-ID: Date: Thu, 13 Jun 2013 16:22:03 +0200 From: Antoine Rozenknop Message-ID: <51B9D58B.9070105 at lipn.univ-paris13.fr> Le LIPN accueillera Jennifer Foster, de l'Universit? de Dublin, pour un s?minaire qui portera sur l'utilit? de l'analyse syntaxique dans les applications avales. Le s?minaire aura lieu au LIPN (Univ.Paris 13, campus de Villetaneuse) en salle B107, le lundi 1er juillet ? 14 heures. Pour venir au LIPN, voir les informations sur : http://lipn.univ-paris13.fr/fr/contact Cordialement, Antoine Rozenknop --- Titre --- After the f-score: applying parser output in sentiment analysis, grammatical error detection and quality estimation for machine translation --- R?sum? --- Syntactic parsing is viewed as a fundamental task which is useful forseveral natural language processing applications, either because theidentification of predicate-argument structure can help in"sense-making" applications such as sentiment analysis or questionanswering, or because the identification of syntactic anomaly can helpin "language proofing" applications such as grammar checking orcomputer-aided language learning. In this talk, I will discussexperiments carried out in the National Centre for Language Technologyin Dublin City University which aim to determine the usefulness ofparser output in three downstream applications, namely, sentimentanalysis, grammatical error detection and quality estimation for machinetranslation. In all these experiments some kind of phrase structureparser (lexicalised PCFG, PCFG-LA and LFG precision grammar parsing) wasused to parse the input, and in some cases, the phrase structures wereconverted to syntactic dependencies. The information from the phrasestructure trees and dependency graphs was employed in the downstreamapplication via tree kernels or manually engineered features. It is clear from these experiments that syntactic parsing always provides someuseful information but it is not yet clear how best to encode thissyntactic information or what the relationship between the accuracy ofthe parser (as measured by intrinsic evaluation metrics such as ParsevalF1 or labelled attachment accuracy) and its usefulness in the downstreamapplication is. --- S?minaires LIPN : http://lipn.univ-paris13.fr/fr/seminaires --- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 14 20:04:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Jun 2013 22:04:03 +0200 Subject: Habilitation: Frederic Landragin, Dialogue homme-machine multimodel Message-ID: Date: Fri, 14 Jun 2013 16:27:22 +0200 From: Frederic Landragin Message-ID: <51BB284A.8070704 at ens.fr> X-url: http://editions.lavoisier.fr/notice.asp?ouvrage=2732845 X-url: http://eu.wiley.com/WileyCDA/WileyTitle/productCd-184821457X.html Vous ?tes cordialement invit?s ? venir assister ? la soutenance d'HDR de Fr?d?ric Landragin, "Dialogue homme-machine multimodal, de la pragmatique linguistique ? la conception de syst?mes", qui aura lieu le vendredi 28 juin ? 14h en salle de conf?rences du LIMSI. Le jury sera constitu? par Mesdames et Monsieur : - Harry Bunt, University of Tilburg (rapporteur), - Sophie Rosset, CNRS, LIMSI, - Catherine Schnedecker, Universit? de Strasbourg (rapporteur), - Isabelle Tellier, Universit? de Paris 3 Sorbonne Nouvelle, - Mari?t Theune, University of Twente (rapporteur), - Anne Vilnat, Universit? de Paris-Sud. R?sum? : Un des objectifs fondamentaux du dialogue homme-machine est de se rapprocher du dialogue naturel en langage naturel, c'est-?-dire de permettre une interaction entre la machine et son utilisateur humain dans la langue de celui-ci (langage naturel), avec une structure d'?changes similaire ? celle d'un dialogue humain (dialogue naturel). Les recherches impliqu?es se nourrissent de travaux linguistiques qui analysent la langue, et de travaux pragmatiques qui analysent l'usage du langage en contexte. Deux facettes importantes de la pragmatique linguistique portent ainsi sur les ph?nom?nes de r?f?rence, par exemple les d?signations des objets accessibles dans le contexte situationnel, et sur les actes de langage, ou actes de dialogue, c'est-?-dire les actions communicatives effectu?es par les ?nonc?s constituant les tours de parole. Nous pr?sentons nos travaux de mod?lisation et de formalisation de ces deux facettes, avec leur application au dialogue avec support visuel et au dialogue associant parole et gestes co-verbaux (dialogue multimodal). Un autre objectif du dialogue homme-machine est de mettre en oeuvre des m?thodologies et des moyens, par exemple des architectures logicielles r?utilisables, pour faciliter le d?veloppement de syst?mes. Nous pr?sentons nos r?flexions et nos r?alisations dans ce sens, ? travers notamment notre participation ? un ensemble de projets europ?ens. Nous proposons enfin des perspectives de recherche qui visent ? mieux int?grer au dialogue homme-machine des ph?nom?nes linguistiques et pragmatiques telles que la saillance et l'ambigu?t?. La partie de cette habilitation relative ? l'?tat de l'art et ? la synth?se des travaux effectu?s fait l'objet d'un livre dont la parution est pr?vue pour septembre 2013 : http://editions.lavoisier.fr/notice.asp?ouvrage=2732845 Une version en anglais est pr?vue pour juillet 2013 : http://eu.wiley.com/WileyCDA/WileyTitle/productCd-184821457X.html ___________________________________________________________________ Frederic Landragin CNRS - Laboratoire LaTTICe - 1 rue Maurice Arnoux - 92120 Montrouge http://www.lattice.cnrs.fr/Frederic-Landragin/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 21:19:13 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 23:19:13 +0200 Subject: Job: Post-doc position in data-mining and statistic (LIRMM, Montpellier, France) Message-ID: Date: Tue, 18 Jun 2013 22:49:45 +0200 From: Sandra Bringay Message-Id: <8C5134AA-F519-49E0-B1AB-989B2D7054F3 at lirmm.fr> X-url: http://www.iresp.net/ X-url: http://www.lirmm.fr/ X-url: http://ens.math.univ-montp2.fr X-url: http://www.icm.unicancer.fr/ Experienced researcher position in Statistic and DataMining Understanding the quality of life of patients with breast cancer: Medical information extraction and sentiment analysis in health forum An Experienced Researcher position (e.g. post-doc, 10 months), funded by the GIS-IRESP (http://www.iresp.net/), is available in Montpellier (France) at the LIRMM laboratory (Laboratory of computer sciences, robotic, micro-electronic of Montpellier, University of Montpellier, CNRS, http://www.lirmm.fr/), the I3M Laboratory (Institute of Mathematics and mathematical modelling of Montpellier, http://ens.math.univ-montp2.fr/) and the ICM (Institute of Cancer Montpellier, http://www.icm.unicancer.fr/). Topic: The proposed topic is part of a larger project called "Comparison of longitudinal analysis models of the health-related quality of life (QoL) in oncology". The overall aim of this project is to propose and compare QoL longitudinal analysis methods based on a methodology already used in survival analysis or on more complex theoretical models (linear mixed model, IRT model). These methods will be applied to clinical trial data to analyse the EORTC QLQ-C30 questionnaire in a variety of therapeutic situations and tumor sites. The sentiment analysis extracted from health forum will appear to be an interesting alternative to quality of life study based on standardised auto-questionnaires and will provide a perspective via results coming from the QLQ-C30 analysis. This project will be focus on women with breast cancer and on the development process of the disease to take into account the longitudinal aspect. Eight researchers have been working on this topic since early 2013. We are now looking for a researcher who will work together with this team. The originality of this post-doc is to be part of a multidisciplinary project and to develop semi-automatic medical information extraction methods and sentiment analysis methods applied to health forum. The main objective is to provide healthcare professionals and patients with a knowledge discovery framework. The extraction of relevant information within health forum is a first step to define a semi-automatic method for sentiment analysis related to cancer management (e.g., identification of latent topics that describe a corpus of messages from several health forums). One of the main issues is to propose original methods taking into account the heterogeneity of authors, topics, texts in their structure and their contents. This research work focuses initially on the automatic extraction of features such as medical, opinion, risk? features. In a second step, the research will develop useful views to present these features to the targeted users: health care professionals and patients. In this highly subjective context, the characterization and understanding of the representations of the patients medical concepts is difficult. However, these tasks are particularly fundamental to plan and design medical public policies. Finally, the work proposed in this post-doc should help meet this dual challenge: medical information extraction and sentiment analysis related to cancer management. Under the overall guidance of the research coordinator at LIRMM, I3M and ICM, the researcher will also contribute to the preparation of project deliverables, publish related work in scientific journals, participate in workshops and meetings and track schedules of tasks. The position is a research-only post, with no teaching obligations. Location: The work will be carried out at the LIRMM laboratory (Montpellier in France). The consortium of the project is composed of computer science researchers, statisticians as well as health care professionals. Supervision: The project will be formally jointly supervised by Dr. Sandra Bringay at LIRMM, Dr. Cyrille Joutard and Pr. Christian Lavergne at I3M and Dr. Mollevi Caroline at ICM. Requirements: The candidate is required to hold a PhD obtained in a topic related to text mining, statistic or automatic natural language processing, with a firm background in sentiment analysis and focus on the development and implementation of web-based tools. Candidates with backgrounds in medical datasets are strongly encouraged to apply. Strong experience in programming language (e.g. C++, PERL, PHP?) is requested. Working experience at national and international levels is an asset. The candidate will work in a team with PhD researchers and MSc students. The candidate should demonstrate team building skills, and ability to work collaboratively and to establish and maintain effective working relationships with colleagues of different nationalities and cultural backgrounds. The candidate should prove ability to analyse and integrate diverse information and to communicate it (verbally and in writing) clearly and effectively. For the advertised post, fluency in oral and written English is required. Knowledge in French is an asset. It is expected that the successful candidate will participate in all meetings and workshops organized by the project ? related additional funding will be available. The candidate must be willing to disseminate the results within the project during the meetings, but also and in particular through presentations at conferences and contributions to scientific journals. Starting date: October 2013 (some flexibility is possible, but at the latest January 2014). Salary: 1850? (Net Income) Application deadline: 15th July 2013, applications will be processed as they are received. Contact: Interested candidates should contact and send their application (curriculum vitae, statement of research interest, publications, and addresses of three referees) by email to: Dr. Sandra BRINGAY MCF LIRMM ? UMIII bringay at lirmm.fr LIRMM, UMR 5506 161 rue Ada 34095 Montpellier Cedex 5 T?l : (33/0) 04 67 41 86 31 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:11:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:11:37 +0200 Subject: Ecole: SSTiC 2013, next registration deadline 26 June 2013 Message-ID: Date: Sun, 16 Jun 2013 10:44:26 +0200 From: "GRLMC" Message-ID: <66C51A5AEFC34B0BB9DA1F0D4FEC58D2 at Carlos1> X-url: http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* 2013 INTERNATIONAL SUMMER SCHOOL ON TRENDS IN COMPUTING SSTiC 2013 Tarragona, Spain July 22-26, 2013 Organized by Rovira i Virgili University http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* +++ next registration deadline: June 26 +++ ********************************************************************* AIM: SSTiC 2013 will be an open forum for the convergence of top class well recognized computer scientists and people at the beginning of their research career (typically PhD students) as well as consolidated researchers. SSTiC 2013 will cover the whole spectrum of computer science by means of 56 six-hour courses dealing with hot topics at the frontiers of the field. By actively participating, lecturers and attendees will share the idea of scientific excellence as the main motto of their research work. ADDRESSED TO: Graduate students from around the world. There are no pre-requisites in terms of the academic degree the attendee must hold. However, since there will be several levels among the courses, in the description of some of them reference may be made to specific knowledge background. SSTiC 2013 is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. Finally, senior researchers will find it fruitful to listen and discuss with people who are main references of the diverse branches of computing nowadays. REGIME: 7 parallel sessions will be held during the whole event. Participants will be able to freely choose the courses they will be willing to attend as well as to move from one to another. VENUE: Palau Firal i de Congressos de Tarragona Arquitecte Rovira, 2 43001 Tarragona http://www.palaucongrestgna.com COURSES AND PROFESSORS: Shun-ichi Amari (Riken) [introductory] Information Geometry and Its Applications James Anderson (Chapel Hill) [intermediate] Scheduling and Synchronization in Real-Time Multicore Systems Pierre Baldi (Irvine) [intermediate] Big Data Informatics Challenges and Opportunities in the Life Sciences Yoshua Bengio (Montr?al) [introductory/intermediate] Deep Learning of Representations Stephen Brewster (Glasgow) [advanced] Multimodal Human-Computer Interaction Bruno Buchberger (Linz) [introductory] Groebner Bases: An Algorithmic Method for Multivariate Polynomial Systems. Foundations and Applications Rajkumar Buyya (Melbourne) [intermediate] Cloud Computing Jan Camenisch (IBM Zurich) [intermediate] Cryptography for Privacy Larry S. Davis (College Park) [intermediate] Video Analysis of Human Activities Paul De Bra (Eindhoven) [intermediate] Adaptive Systems Paul Dourish (Irvine) [introductory] Ubiquitous Computing in a Social Context Max J. Egenhofer (Maine) [introductory/intermediate] Qualitative Spatial Relations: Formalizations and Inferences Richard M. Fujimoto (Georgia Tech) [introductory] Parallel and Distributed Simulation David Garlan (Carnegie Mellon) [advanced] Software Architecture: Past, Present and Future Mario Gerla (Los Angeles) [intermediate] Vehicle Cloud Computing Georgios B. Giannakis (Minnesota) [advanced] Sparsity and Low Rank for Robust Data Analytics and Networking Ralph Grishman (New York) [intermediate] Information Extraction from Natural Language Francisco Herrera (Granada) [intermediate] Imbalanced Classification: Current Approaches and Open Problems Paul Hudak (Yale) [introductory] Euterpea: From Signals to Symphonies Using Haskell Niraj K. Jha (Princeton) [intermediate] FinFET Circuit Design George Karypis (Minnesota) [introductory] Introduction to Parallel Computing: Architectures, Algorithms, and Programming Aggelos K. Katsaggelos (Northwestern) [intermediate/advanced] Sparsity-based Advances in Image Processing Arie E. Kaufman (Stony Brook) [advanced] Advances in Visualization Hugo Krawczyk (IBM Research) [intermediate] An Introduction to the Design and Analysis of Authenticated Key Exchange Protocols Pierre L'Ecuyer (Montr?al) [intermediate] Quasi-Monte Carlo Methods in Simulation: Theory and Practice Laks Lakshmanan (British Columbia) [intermediate/advanced] Information and Influence Spread in Social Networks Wenke Lee (Georgia Tech) [introductory] DNS-based Monitoring of Malware Activities Maurizio Lenzerini (Roma La Sapienza) [intermediate] Ontology-based Data Integration Ming C. Lin (Chapel Hill) [introductory/intermediate] Physically-based Modeling and Simulation Jane W.S. Liu (Academia Sinica) [intermediate] Critical Information and Communication Technologies for Disaster Preparedness and Response Satoru Miyano (Tokyo) [intermediate] How to Hack Cancer Systems with Computational Methods Aloysius K. Mok (Austin) [intermediate] From Real-time Systems to Cyber-physical Systems Hermann Ney (Aachen) [intermediate/advanced] Probabilistic Modelling for Natural Language Processing - with Applications to Speech Recognition, Handwriting Recognition and Machine Translation Cathleen A. Norris (North Texas) & Elliot Soloway (Ann Arbor) [introductory] Primary & Secondary Educational Computing in the Age of Mobilism Jeff Offutt (George Mason) [intermediate] Cutting Edge Research in Engineering of Web Applications David Padua (Urbana) [intermediate] Parallel Programming with Abstractions Bijan Parsia (Manchester) [introductory] The Semantic Web: Conceptual and Technical Foundations Charles E. Perkins (FutureWei) [intermediate/advanced] Beyond 4G Prabhakar Raghavan (Google) [introductory/intermediate] Web Search and Advertising Phillip Rogaway (Davis) [introductory/intermediate] Provably Secure Symmetric Encryption Gustavo Rossi (La Plata) [intermediate] Topics in Model Driven Web Engineering Kaushik Roy (Purdue) [introductory/intermediate] Low-energy Computing Robert Sargent (Syracuse) [introductory] Validating Models Douglas C. Schmidt (Vanderbilt) [intermediate] Patterns and Frameworks for Concurrent and Networked Software Bart Selman (Cornell) [intermediate] Fast Large-scale Probabilistic and Logical Inference Methods Mubarak Shah (Central Florida) [intermediate/advanced] Visual Crowd Surveillance Ron Shamir (Tel Aviv) [introductory] Revealing Structure in Disease Regulation and Networks Dawn Xiaodong Song (Berkeley) [introductory] Selected Topics in Computer Security Mike Thelwall (Wolverhampton) [introductory] Sentiment Strength Detection for the Social Web Julita Vassileva (Saskatchewan) [introductory/intermediate] Engaging Users in Social Computing Systems Philip Wadler (Edinburgh) [introductory] Topics in Lambda Calculus and Life Yao Wang (Polytechnic New York) [introductory/advanced] Video Compression: Fundamentals and Recent Development Gio Wiederhold (Stanford) [introductory] Software Economics: How Do the Results of the Intellectual Efforts Enter the Global Market Place Limsoon Wong (National Singapore) [introductory/intermediate] The Use of Context in Gene Expression and Proteomic Profile Analysis Michael Wooldridge (Oxford) [introductory] Autonomous Agents and Multi-Agent Systems Ronald R. Yager (Iona) [introductory/intermediate] Fuzzy Sets and Soft Computing Philip S. Yu (Illinois Chicago) [advanced] Mining Big Data REGISTRATION: It has to be done at http://grammars.grlmc.com/SSTiC2013/Registration.php Since the capacity of the venue is limited, registration requests will be processed on a first come first served basis. The registration period will be closed when the capacity of the venue will be complete. FEES: Fees may be for the whole week (full-time participant) or per blocks of days (part-time participant). They are a flat rate allowing one to attend all courses within the time window set: 5, 4, 3 or 2 days. Fees vary depending on the deadline. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Participants will be delivered a certificate of attendance. IMPORTANT DATES: Announcement of the programme: January 26, 2013 Registration deadlines: next: June 26, 2013 last: July 25, 2013 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat POSTAL ADDRESS: SSTiC 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Departament d?Economia i Coneixement, Generalitat de Catalunya Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:27:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:27:23 +0200 Subject: Job: Stage Linguiste, LexisNexis Message-ID: Date: Mon, 17 Jun 2013 10:23:05 +0200 From: "Aubier, C?line (LNG-PAR)" Message-ID: <44D17B4C0772314AA60885B57DAA67463CB1B776 at LNGPAREXCP01VA.legal.regn.net> STAGE Linguiste LexisNexis en France (600 collaborateurs, 140 M? de CA), filiale du groupe anglo-n?erlandais Reed Elsevier, est un acteur majeur dans les services d'information professionnelle. Ses activit?s couvrent trois domaines : l'information et l'?dition juridiques, la diffusion de la presse et de l'information ?conomique et financi?re sur Internet, les logiciels professionnels. L'entreprise s'appuie sur une expertise ?ditoriale centenaire et sur une technologie de pointe pour apporter au monde du droit et aux professionnels de tous secteurs d'activit?s une vaste gamme de produits et services r?put?s : JurisClasseur, Litec, D.O, Bottin Administratif et les services en ligne LexisNexis. Mission : Int?gr?(e) ? l'?quipe ? Management de l'information? votre mission consistera ? participer aux activit?s relatives au textmining, qui traitent de l'extraction d'information juridique ? valeur ajout?e. Profil : Master 2 en linguistique informatique Vous ?tes d'une nature rigoureuse et m?ticuleuse Connaissance d'Unitex obligatoire Niveau d'?tude : Master 1 ou 2 / stage de fin d'?tude. LIEU : 141 rue de Javel 75015 PARIS DUREE : 5-6 mois d?s que possible MODALITES: Indemnit? mensuelle de 436,05 euros Tickets restaurant 50% du titre de transport pris en charge Convention de stage obligatoire Merci d'envoyer votre candidature (CV + lettre de motivation) ainsi que vos disponibilit?s par mail ? : celine.aubier at lexisnexis.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:19:36 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:19:36 +0200 Subject: Appel: Terminology and Artificial Intelligence TIA 2013 - extended deadline Message-ID: Date: Mon, 17 Jun 2013 14:06:46 +0200 From: Nathalie Aussenac-Gilles Message-ID: <51BEFBD6.4060507 at irit.fr> X-url: http://flores.lipn.univ-paris13.fr/tia2013/ Due to general demand the deadline for submission of papers has been extended: *5 July 2011* ------------------------------------------------------------------------ Third Call for papers Terminologie et Intelligence Artificielle TIA 2013 Terminology and Artificial Intelligence TIA 2013 Terminology for a networked society: Recent advances in multilingual knowledge-based resources Paris, 28-29-30 octobre 2013 http://flores.lipn.univ-paris13.fr/tia2013/ ------------------------------------------------------------------------ IMPORTANT DATES Abstract submission: 28 June 2013 (instead of 21 June 2013 ) Paper submission (long and short papers): 5 July 2013 (instead of 28 June 2013) Notification to authors: 3 September 2013 Final camera-ready paper due: 23 September 2013 Conference: 28-30 October 2013 INTRODUCTION and MOTIVATION TIA 2013 will be the 10th in a series of successful events which, for the most part, initially took place in the francophone world. Over a period of almost 20 years (the first conference was held in 1995) TIA has increasingly attracted the attention of many researchers and practitioners all over the world, and its work has become truly international. The aim of TIA 2013 is to provide an overview of the new ways in which multilingual terminology is present in an ever-increasing networked society, and to pay special attention both to the methods applied in the conceptualization of domain knowledge and to the applications and tools that will meet the requirements of e-society. In this way, terminology, linguistics and knowledge engineering provide the basis on which many other disciplines develop their applications such as domain ontologies, natural language processing tools, multilingual knowledge-based tools and web-based linguistic applications. New approaches to the standardization and to the reuse and integration of different tools designed to facilitate work in institutions, companies and society in general will be welcome. The TIA 2013 Conference aims to promote interdisciplinary research focusing on the intersection of different disciplines that deal with terminological aspects and knowledge engineering resources. Papers may address both theoretical questions and methodological aspects on these issues, as well as interdisciplinary approaches developed to facilitate convergence and co-operation in terminological aspects of importance to society. TOPICS OF INTEREST Terminology and ontology acquisition and management - Applying pattern recognition to enriching terminological resources - Lexicons, thesauri and ontologies as semantic resources - Lexicons and ontologies as means for knowledge transfer - Reusing, standardizing and merging terminological or ontological resources - Multilingual terminology extraction - Multilinguality and multimodality in terminological resources - Management of language resources Terminology and knowledge representation - Ontological semantics and linguistics - Ontology localization - Development of multimedia terminological resources - Terminology alignment in parallel corpora and other lexical resources - Representation of terms and conceptual relations in knowledge-based applications - Comparative studies of terminological resources and/or ontological resources from different languages, domains and approaches - Terminological resources in the 21st century - Harmonization of format and standards in terminological resources Terminology and ontologies for applications - Interoperability and reusability in knowledge-based tools and applications - Models and metamodels in annotating semantic and terminological resources - New R &D directions in terminology for industrial uses and needs SUBMISSIONS TIA 2013 solicits both regular papers, which present significant work, and short papers, which typically present work in progress or a smaller, focused contribution. The program committee may decide to change the category of a paper before acceptance. Papers can be written either in English or French. Regular papers should not exceed 8 pages in ACL-HLT 2011 format (see below for LaTeX and MS Word style files), including figures, examples and references. The mode of presentation of long papers (orally or as posters) will be decided based on the nature rather than on the quality of the work. Short papers should not exceed 4 pages in the same format as regular papers. They will also be presented orally or as posters at the conference depending on the nature of the work. Authors should submit the papers in PDF through the TIA submission page at https://www.easychair.org/conferences/?conf=tia2013 At the submission page, the author(s) must provide the following information: 1. name(s) of author(s) 2. affiliation(s), addresses, fax and e-mail 3. title of the paper 4. 5 to 10 key words in English or in French (in both languages if possible) 5. abstract in English or in French (in both languages if possible) (200 words maximum for each) As the reviewing will be blind, the paper itself must not include the authors' names and affiliations at submission time. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ...", must be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ...". Reviews of full papers (long and short) will be performed by three reviewers. STYLES FILES Authors are required to use the following style files so that the papers follow the conference format. Latex: tia2013latex.tgz MS Word: tia2013word.zip IMPORTANT: Remove authors' information from your manuscripts when submitting them for blind review (see above)! PROGRAMME COMMITTEE Chairs Guadalupe Aguado de Cea (OEG, Universidad Polit?cnica de Madrid, Spain) Nathalie Aussenac-Gilles (IRIT, CNRS, Toulouse, France) Contact : tia2013 at easychair.org Members - Guadalupe Aguado de Cea (Universidad Polit?cnica de Madrid, Spain) - Amparo Alcina (Universitat Jaume-I, Castell??n de la Plana, Spain) - Sofia Ananiadou (NaCTeM, Manchester, UK) - Nathalie Aussenac-Gilles (IRIT, Toulouse, France) - Caroline Barri?re (CRIM, Montr?al, Canada) - Paul Buitelaar (DERI, Galway, Ireland) - Maria Teresa Cabr? (Universitat Pompeu Fabra, Barcelona, Spain) - Farid Cerbah (Dassault Aviation, Paris, France) - Jean Charlet (AP-HP&- INSERM, Paris, France) - Philipp Cimiano (University of Bielefeld, Germany) - Anne Condamines (CLLE-ERSS, Toulouse, France) - Lyne Da Sylva (EBSI, Montr?al, Canada) - B?atrice Daille (LINA, Universit? de Nantes, Nantes, France) - Val?rie Delavigne (Institut national du cancer, France) - Pascaline Dury (Universit? Lyon 2, Lyon, France) - Fidelia Ibekwe-San Juan (Universit? Lyon 3, Lyon, France) - Kyo Kageura (University of Tokyo, Tokyo, Japan) - Olivia Kwong (City University Hong Kong, Hong Kong, China) - Marie-Claude L'Homme (OLST, Universit? de Montr?al, Canada) - Elena Montiel-Ponsoda (Universidad Polit?cnica de Madrid, Spain) - Adeline Nazarenko (LIPN, Universit? Paris 13, Villetaneuse, France) - Mihako O'Hagan (Dublin City University, Dublin, Ireland) - Pascale S?billot (IRISA, Rennes, France) - Serge Sharoff (University of Leeds, Leeds, UK) - Monique Slodzian (ERTIM-INALCO, Paris, France) - Mari Carmen Suarez de Figueroa (Universidad Polit?cnica de Madrid, Spain) - Sylvie Szulman (LIPN, Universit? Paris 13, Villetaneuse, France) - Koichi Takeuchi (Okayama University, Okayama, Japan) - Rita Temmerman (Erasmushogeschool, Bruxelles, Belgium) - Yannick Toussaint (LORIA, Nancy, France) - Spela Vintar (University of Ljubljana, Ljubljana, Slovenia) - Pierre Zweigenbaum (LIMSI-CNRS - CRIM-INALCO, Paris, France) ORGANISING COMMITTEE TIA 20131 is organized by the RCLN (Repr?sentation des Connaissances et Langage Naturel) group of the LIPN lab at Paris 13 University. Local Chairs - Adeline Nazarenko (LIPN, Paris 13, France) - Syvlie Szulman (LIPN, Paris 13, France) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:09:26 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:09:26 +0200 Subject: These: Cyril Grouin, Anonymisation de documents cliniques Message-ID: Date: Sat, 15 Jun 2013 07:33:06 +0200 From: Cyril Grouin Message-Id: <5B0D218A-2F1E-45F0-9092-E66DDC3CCD8A at limsi.fr> Bonjour, J'ai le plaisir de vous convier ? la soutenance de mon travail de th?se de doctorat, r?alis? conjointement au LIMSI (groupes ILES) et au Centre de Recherche des Cordeliers (INSERM U872 Eq20 & UPMC), intitul?e : "Anonymisation de documents cliniques : performances et limites des m?thodes symboliques et par apprentissage statistique" Cette soutenance aura lieu le mercredi 26 juin 2013 ? 14h00 dans la salle de conf?rences du LIMSI (b?t. 508), campus d'Orsay (91). Vous ?tes ?galement invit?s au pot de th?se qui suivra. Bien cordialement, Cyril Grouin ----- Composition du jury : - Pr Stefan J. DARMONI, PU-PH, CHU de Rouen (rapporteur) - Pr Pascal STACCINI, PU-PH, CHU de Nice (rapporteur) - M. Thierry ARTI?RES, Professeur, LIP6/UPMC (examinateur) - Pr Anita BURGUN, PU-PH, HEGP/INSERM U872 Eq22 (examinatrice) - Mme Marie-Christine JAULENT, DR, INSERM U872 Eq20 (directrice) - M. Pierre ZWEIGENBAUM, DR, LIMSI-CNRS (directeur) ----- R?sum? : Ce travail porte sur l'anonymisation automatique de comptes rendus cliniques. L'anonymisation consiste ? masquer les informations personnelles pr?sentes dans les documents tout en pr?servant les informations cliniques. Cette ?tape est obligatoire pour utiliser des documents cliniques en dehors du parcours de soins, qu'il s'agisse de publication de cas d'?tude ou en recherche scientifique (mise au point d'outils informatiques de traitement du contenu des dossiers, recherche de cas similaire, etc.). Nous avons d?fini douze cat?gories d'informations ? traiter : nominatives (noms, pr?noms, etc.) et num?riques (?ges, dates, codes postaux, etc.). Deux approches ont ?t? utilis?es pour anonymiser les documents, l'une dite ? symbolique ?, ? base de connaissances d'expert formalis?es par des expressions r?guli?res et la projection de lexiques, l'autre par apprentissage statistique au moyen de CRF de cha?ne lin?aire. Plusieurs exp?riences ont ?t? men?es parmi lesquelles l'utilisation simple ou encha?n?e de chacune des deux approches. Nous obtenons nos meilleurs r?sultats (F-mesure globale=0,922) en encha?nant les deux m?thodes avec rassemblement des noms et pr?noms en une seule cat?gorie (pour cette cat?gorie : rappel=0,953 et F-mesure=0,931). Ce travail de th?se s'accompagne de la production de plusieurs ressources : un guide d'annotation, un corpus de r?f?rence de 562 documents dont 100 annot?s en double avec adjudication et calculs de taux d'accord inter-annotateurs (K=0,807 avant fusion) et un corpus anonymis? de 17.000 comptes rendus cliniques. ----- Abstract: This work focuses on the automatic de-identification of clinical records. The de-identification consists in concealing personal information within documents while preserving clinical data. This task is mandatory so as to use clinical records outside of the patient care process, for case study publications or in scientific research (producing automatic system to process the documents, similar cases search, etc.). We defined 12 categories of information to de-identify: nominative data (last names, first names, etc.) and numerical data (ages, dates, zip codes, etc.). Two approaches have been used to de-identify the documents, an expert knowledge based method using regular expressions and lexical mapping, and a machine-learning process based upon CRF. Several experiments have been performed including the use of each approach separately or in combination. We achieved our best results (overall F-measure=0.922) while combining both approaches and merging last names and first names categories into a single one (recall=0.953 and F-measure=0.931 on this category). This work is combined with the production of several resources: a guidelines, a gold standard corpus composed of 562 documents among them 100 double annotated with adjudication and inter-annotator agreement computation (K=0.807 before merging) and a de-identified corpus of 17,000 clinical records. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:16:00 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:16:00 +0200 Subject: Appel: Workshop and tutorial proposals, TIA 2013, Paris, Oct. 2013 Message-ID: Date: Mon, 17 Jun 2013 01:27:20 +0200 From: Nathalie Aussenac-Gilles Message-ID: <51BE49D8.7080904 at irit.fr> X-url: http://flores.lipn.univ-paris13.fr/tia2013/ ================================================================ CALL FOR WORKSHOP AND TUTORIAL PROPOSALS 10th INTERNATIONAL CONFERENCE ON TERMINOLOGY AND ARTIFICIAL INTELLIGENCE 10?me conf?rence internationale Terminologie et Intelligence Artificielle Terminology for a networked society: Recent advances in multilingual knowledge-based resources Paris, 28-30 october, 2013 Deadline for workshop proposals: July 10, 2013 http://flores.lipn.univ-paris13.fr/tia2013/ ================================================================ The 10th Terminology and Artificial Intelligence (TIA) conference invites proposals for tutorials and workshops to be held in conjunction with TIA. We solicit proposals on any topic of interest to terminology and advanced applications (see the main topics of the conference at http://flores.lipn.univ-paris13.fr/tia2013/). Both full-day workshops and half-day workshops or tutorials are possible. The format of workshops is flexible. It can be, for instance, in the form of a small conference with a focused topic of interest, or in the form of a panel discussion with invited speakers. If participants are to be selected on the basis of paper contributions, the selection process should be as light and simple as possible due to the time schedule. The workshops and tutorials will be held at the same venue as the TIA main conference in Paris, and the allocated date is October 28th, 2013. SUBMISSION INFORMATION Proposals for a workshop or a tutorial should contain: o A title and brief (2-page max) description of the workshop topic and content, or the tutorial scope and pedagogic objective o The proposed format: call for papers, panel, criteria for participant selections, out-line of the tutorial, etc. o The proposed duration: full-day or half-day. o An estimate of the number of attendees. o The names, postal addresses, phone numbers, and email addresses of the organizers. o In the case of workshops, a list of potential members of the program committee if any, with an indication of which members have already agreed. o A description of special requirements for technical needs. The TIA programme committee will select workshop proposals based on their quality and relevance. Submissions and information requests should be sent by e-mail to: tia2013 at easychair.org Information SUBMISSION DEADLINE July 10, 2013 TIMELINE FOR WORKSHOPS July 10, 2013: Workshop proposal deadline July 17, 2013: Notification of acceptance July 25, 2013: Proposed date for sending workshop CFP September 10, 2013: Proposed paper due date September 30, 2013: Proposed notification of acceptance October 10, 2013: Camera-ready deadline October 30, 2013: Workshops and tutorials ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:14:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:14:10 +0200 Subject: Job: Offre post-doctorat en linguistique textuelle / linguistique de corpus, Greyc et Crisco, Universite de Caen Message-ID: Date: Sun, 16 Jun 2013 22:33:31 +0200 From: Thierry Charnois Message-ID: <51BE211B.6060903 at unicaen.fr> *INTITULE du PROFIL :**Postdoctorant en linguistique textuelle et/ou linguistique de corpus* Th?matique de recherche : Linguistique textuelle Laboratoires : Greyc et Crisco, Universit? de Caen Noms et coordonn?es des responsables : Thierry Charnois thierry.charnois at unicaen.fr Dominique Legallois dominique.legallois at unicaen.fr Lieu d'exercice des fonctions : * Laboratoire Greyc (campus 2) * Laboratoire Crisco (campus 1) Dur?e du contrat : 12 mois Date de d?but : 1er Septembre 2013 Date de fin : 31 ao?t 2014 Formation requise : Doctorat en sciences du langage (de pr?f?rence) ou Doctorat en traitement automatique des langues Comp?tences ? mobiliser : Analyse des relations de coh?rence locales et globales ; identification des s?quences organisatrices d'un texte ; formalisation des observables ; utilisation d'outils informatiques pour la linguistique de corpus ; Langue travaill?e : Principalement le fran?ais, mais d'autres langues sont possibles. R?sum? de l'objectif du contrat : il s'agit de proposer une mod?lisation linguistique des sch?mas textuels, fond?e sur les indices lexico-grammaticaux (constructions sp?cifiques, r?p?titions lexicales, densit? lexicale, noms sous-sp?cifi?s, r?seaux phrastiques) ; cette mod?lisation linguistique doit pouvoir aider ? comprendre la r?cursivit? des S?quences d'Encha?nement (Legallois, 2006), leur d?ploiement, la variation de la structure textuelle selon les genres (expositifs, argumentatifs, narratifs). Les s?quences d'encha?nement sont des sch?mas articulant des parties textuelles selon des relations telles que : probl?me-solution- ?valuation ; objectif-mise en oeuvre- ?valuation, etc. Le chercheur recrut? devra collaborer avec des coll?gues informaticiens pour ?laborer une formalisation exploitable informatiquement. R?sultat attendus : Une connaissance plus syst?matique de l'organisation textuelle et g?n?rique ; l'appr?ciation de la densit? des S?quences dans un texte ; constitution d'un r?pertoire de ressources linguistiques participant ? l'organisation textuelle ; formalisation des relations de coh?rence au niveau du texte en vue d'une impl?mentation informatique ; contribution appliqu?e ? des questions de Traitement Automatique des Langues, telles que les r?sum?s de texte, les syst?mes de questions-r?ponses, l'extraction d'information. Bibliographie (indicative) : /-Biber, Connor et Upton, 2007, //Discourse/on the /Move,//Benjamins/ /-Hoey M. (2001) //Textual Interaction: An Introduction to Written Discourse Analysis./Routledge /-Legallois, D., 2006, ? Quand le texte sig/nale sa structure : la fonction textuelle des noms sous sp?cifi?s ? /Corela/. (en ligne) /-Scott M. et Tribble Ch. 2006,//Textual Patterns, //J. Benjamins/ /-Smith, C., 2003, //Discourse Modes,/Cambridge University Press. Salaire : environ 1950 euros Les candidatures sont ? envoyer d?s que possible et avant le 4 juillet 2013. Envoyer un CV d?taill? et une lettre de motivation par courrier ?lectronique ? : thierry.charnois at unicaen.fr et dominique.legallois at unicaen.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:23:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:23:35 +0200 Subject: Job: Poste de chercheur postdoctoral, Labex EFL, LLF, Universite Paris Diderot Message-ID: Date: Mon, 17 Jun 2013 09:58:23 +0200 From: Olivier Bonami Message-Id: <153CCEB4-46C9-4BC6-B485-FB48CE8518EC at paris-sorbonne.fr> X-url: http://www.labex-efl.org/?q=fr/node/176 DATE LIMITE REPOUSSEE AU 28 JUIN 2013 Le Labex ? Empirical foundations of linguistics ? (axe ? Grammaire exp?rimentale ?) recrute un chercheur postdoctoral pour sur le th?me suivant: ?valuation quantitative de la complexit? des syst?mes flexionnels Le postdoctorant sera employ? pour une p?riode de 12 mois par l'Universit? Paris Diderot (Laboratoire de Linguistique Formelle), pour un salaire de 24 000 ? net par an. La date souhait?e de prise de fonction se situe entre octobre et d?cembre 2013. Les candidats doivent avoir soutenu leur th?se de doctorat avant septembre 2013. Le dossier de candidature est ? envoyer par courriel ? Olivier Bonami (olivier.bonami at univ-paris-diderot.fr). Il comprendra une courte lettre de motivation, un CV et une liste de publications, les noms et adresses de deux r?f?rents potentiels, et un lien vers une page web o? les publications peuvent ?tre consult?es. La date limite de candidature est repouss?e au 28 juin 2013. Contact: olivier.bonami at univ-paris-diderot.fr Page web de l'annonce: http://www.labex-efl.org/?q=fr/node/176 Labex EFL: http://www.labex-efl.org Description d?taill?e de l'offre: L?analyse quantitative des syst?mes flexionnels a fait l?objet d?un int?r?t renouvel? dans la p?riode r?cente. Deux facteurs limitent la port?e des travaux existants dans ce domaine ?mergent : (i) la focalisation sur un petit ensemble de langues g?n?tiquement proches ; (ii) le manque de mesures quantitatives qui prennent en compte le caract?re multifactoriel de la complexit? des syst?mes flexionnels. Le Labex Fondements empiriques de la linguistique (EFL) offre une occasion unique de s?attaquer ? ces difficult?s. Regroupant 13 ?quipes de recherches de la r?gion parisienne, le Labex EFL comporte ? la fois des sp?cialistes d?un vaste ensemble de langues typologiquement diverses et des sp?cialistes de linguistique th?orique, de linguistique informatique, et de psycholinguistique. Le postdoctorant rejoindra un groupe interdisciplinaire d?une dizaine de chercheurs du Labex EFL qui travaillent ensemble ? la conception, ? l?utilisation et ? l??valuation de mesures quantitatives de divers aspects de la complexit? des syst?mes flexionnels. Un objectif de plus long terme est d??valuer exp?rimentalement l?impact de la complexit? des syst?mes flexionnels. Les t?ches du postdoctorant comprendront : ? la s?lection ou la conception de ressources linguistiques sur un ?chantillon de langues typologiquement vari?es, en vue de l??valuation de la complexit? de leurs syst?mes flexionnels ; ? l??valuation de l?applicabilit? et de la pertinence de mesures quantitatives existantes ? cet ?chantillon de langues ; ? une contribution ? la conception et ? l?impl?mentation de nouvelles mesures quantitatives pour des aspects des syst?mes flexionnels qui n?ont pas ?t? explor?s dans les travaux pr?c?dents. Le candidat id?al serait un linguiste ou un linguiste informaticien pratiquant les th?ories morphologiques contemporaines, ayant une connaissance avanc?e de la typologie linguistique et des m?thodes de terrain, et ayant d?j? une exp?rience de l?application de m?thodes quantitatives ? des donn?es linguistiques extensives. Peu de candidats potentiels correspondent ? ce profil id?al, et les candidatures qui n?y correspondent que partiellement seront donc prises en consid?ration. Il n?y a pas de domaine linguistique pr?d?fini pour le travail du postdoctorant. Le groupe de chercheurs qu?il int?grera est comp?tent, et poss?de des ressources, sur les langues germaniques, iraniennes, romanes, afro-asiatiques, finno-ougriennes, et sud-caucasiques, sur les langues m?so-am?ricaines (avec un accent particulier sur le phylum oto-mangue), et sur les langues cr?oles. Un des objectifs du projet est d?am?liorer la compr?hension des syst?mes flexionnels de ces langues, mais un candidat qui apporterait une expertise pertinente sur une langue ou une famille n?appartenant pas ? cette liste serait tout ? fait bienvenu. Le postdoctorant aura ?galement la possibilit? de participer aux autres activit?s du Labex EFL et rejoindra une communaut? active ayant un int?r?t commun pour les approches empiriques, quantitatives et exp?rimentales en linguistique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:34:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:34:24 +0200 Subject: Sujet de these: 2 open PhD positions in Natural Language Processing, Marseille, France Message-ID: Date: Tue, 18 Jun 2013 15:31:53 +0200 From: Frederic Bechet Message-ID: <51C06149.8040209 at lif.univ-mrs.fr> PhD positions - Computer Science, Natural Language Processing - Marseille, France The NLP group of the Laboratoire d'Informatique Fondamentale of the Aix Marseille University has 2 open PhD positions in Computer Science in the context of an European project (3 years). Location : Campus de Luminy (http://sciences.univ-amu.fr/sites-geographiques/site-luminy), Marseille, France Starting : October 1st 2013 Deadline for application: July 15th 2013 The two fully funded PhD studentships will focus on 2 different aspects of the project: 1- Discourse parsing of speech. This PhD will focus on developing discourse analysis methods adapted to a large range of conversational styles and domains from spoken conversations to social media interaction. Automatic methods will be studied for five types of discourse analysis: discourse parsing, event and temporal structure, argumentation structure and intra-document coreference. The applicative domain of this research will be the automatic summarization task of human-human dialogs. The language targeted will be French and English. 2- Syntactic and semantic parsing with deep learning methods. Recently, neural network approaches based on a deep learning paradigm has been successfully applied to some NLP tasks such as POS and NE tagging or dependency parsing ( http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/de//pubs/archive/35671.pdf ). In this PhD we will investigate how this paradigm performs and can be adapted in the context of robust syntactic and semantic parsing of human human conversations collected on social media platforms and telephone call centres. The successful candidates should : - hold a relevant degree in the field of Natural Language Processing or Machine Learning. - have good algorithmic and programming skills Description of the lab: The University of Aix-Marseille (AMU) is currently one of the largest university in France, created in 2012 from the fusion of the 3 former Aix-Marseille universities (Universit? de Provence, Universit? de la M?diterran?e, Universit? Paul C?zanne). The LIF (Fundamental Computer Science Lab), is a JRU between the Centre National de la Recherhe Scientifique (CNRS) and AMU. The Natural Language Processing group of LIF aims at developing symbolic and statistical methods for the automatic processing of textual and speech data. The two main characteristics of this research group are: (1) to host both linguists working on the development of rich linguistic resources such as syntactic and semantic lexicons and computer scientists with a very strong experience in numerical approaches for NLP; and (2) to work on both spoken and written languages, at the descriptive level as well as the application level thanks to a strong expertise of some members of the group in Automatic Speech Recognition methods. Contacts: Alexis Nasr : alexis.nasr at lif.univ-mrs.fr Frederic Bechet : frederic.bechet at lif.univ-mrs.fr Benoit Favre : benoit.favre at lif.univ-mrs.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:32:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:32:45 +0200 Subject: Ecole: ESSLLI, early bird registration, June 22 Message-ID: Date: Tue, 18 Jun 2013 10:55:09 +0200 From: Daniel Altshuler Message-ID: X-url: http://esslli2013.de Dear colleagues, Friendly reminder that early bird registration for ESSLLI 2013ends this Saturday, June 22. In order to register, please proceed to http://esslli2013.de/register We look forward to seeing you in D?sseldorf this summer! Best regards, Daniel Altshuler (on behalf of the ESSLLI 2013 committee). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:36:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:36:27 +0200 Subject: Seminaire: INFOLINGU, Jean-Marc LEBLANC, 24 juin 2013, Universite Paris-Est Marne-la-Vallee Message-ID: Date: Tue, 18 Jun 2013 19:46:54 +0200 From: Myriam RAKHO Message-ID: ************************************************************************ * INFOLINGU* Le s?minaire de l'?quipe Informatique Linguistique du Laboratoire d'Informatique Gaspard Monge (LIGM) Universit? Paris-Est Marne-la-Vall?e ************************************************************************ Date : *Le Lundi 24 juin 2013 ? 10h30 * Lieu : Universit? Paris-Est Marne-la-Vall?e B?timent Copernic, 4?me ?tage, salle de s?minaires 4B08R *Toute personne int?ress?e est la bienvenue.* ************************************************************************ ------------------------------------------------------------------------ Intervenant : ------------------------------------------------------------------------ * Jean-Marc LEBLANC - CEDITEC, UPEC * ------------------------------------------------------------------------ Titre de la pr?sentation : ------------------------------------------------------------------------ * ? venir* ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:30:57 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:30:57 +0200 Subject: Conf: DO 2013, Program now online, July 7, 2013, Montreal, Canada Message-ID: Date: Mon, 17 Jun 2013 18:36:28 -0400 From: Selja Sepp?l? Message-Id: X-url: http://definitionsinontologies.weebly.com/do-2013-program.html We are pleased to announce that the Definitions in Ontologies workshop program is now online: http://definitionsinontologies.weebly.com/do-2013-program.html. July 7, 2013 Montreal, Canada DO 2013 Program: 8:30?8:45 Welcome 8:45?9:00 Lynn M. Schriml Definition of Disease Terms 9:00?9:15 Gerardo Sierra-Martinez and Laura Elena Hernandez-Dominguez Automatic Construction of the Knowledge Base of an Onomasio-logical Dictionary 9:15?9:30 Guoqian Jiang, Harold Solbrig and Christopher Chute A Semantic Web-Based Approach for Harvesting Multilingual Textual Definitions from Wikipedia to Support ICD-11 Revision 9:30?9:45 Antonio San Mart?n and Pilar Le?n Ara?z Flexible Terminological Definitions and Conceptual Frames 9:45?10:15 Discussion 10:15?10:45 Coffee Break 10:45?11:15 Invited Speaker: Barry Smith Introduction to the Logic of Definitions 11:15?11:30 Selja Sepp?l? Using BFO Categories for Creating Generic Definition Templates 11:30?11:45 Alan Ruttenberg Tool Support for Definition Authorship and Management: Desiderata 11:45?12:00 Discussion +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Survey: Please take a moment to participate to our survey on defining practices in ontologies: https://docs.google.com/forms/d/11yxHNL6noN8_oa8aEuHowOZZTvd__t164pNgtmEzSG8/viewform?pli=1 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 18 20:29:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 18 Jun 2013 22:29:45 +0200 Subject: Job: PostDoc, Orange Labs (Lannion, 22) Message-ID: Date: Mon, 17 Jun 2013 08:55:37 +0000 From: Message-ID: <4696_1371459338_51BECF0A_4696_373_1_ED32B5012BA99F4AA999E2765EF060F20C2564 at PEXCVZYM12.corporate.adroot.infra.ftgroup> Proposition de sujet de PostDoc ? Orange Labs (Lannion, 22) Projection des donn?es lexicales (fran?aises) sur des connaissances Contexte : Un enjeu majeur du traitement automatique des langues naturelles consiste ? g?n?rer une repr?sentation conceptuelle des documents afin de factoriser des termes synonymes ou au contraire diff?rencier des termes homonymes. Les diff?rents concepts associ?s ? terme peuvent ?tre g?n?r?s manuellement ou automatiquement mais constituent dans tous les cas un espace de concepts n?cessaire ? toute op?ration ult?rieure (d?sambig?isation, arguments de relations s?mantiques, th?matisation, ...). Sujet : L'?quipe CONTENT/FAST d'Orange Labs travaille sur l'extraction d'information des textes (en fran?ais) afin d'en obtenir une repr?sentation RDF. Nous nous appuyons sur des bases de connaissances (internes ou issues des efforts communautaires comme LinkedOpenData par ex. DBpedia). Pour cela, nos donn?es linguistiques (lexiques, th?saurus) doivent ?tre align?es avec les instances et classes de la base de connaissances. Le sujet propos? vise tout d'abord ? ?tendre notre espace s?mantique par l'utilisation de ressources publiques du LOD ou LLOD telles qu'OpenCyc, WordNet, BabelNet, DBp?dia YAGO2, Wiktionary. Cet accroissement doit ?tre quantitatif par ajout d'entit?s nomm?es notamment mais aussi qualitatif en visant (par owl:sameAs) une hi?rarchie de concepts (par ex. WordNet). Dans un deuxi?me temps, le candidat mettra en oeuvre un acc?s ? cet espace en le couplant ? nos outils de TALN (extraction des liens s?mantiques d'un texte). Le traitement global sera appliqu? ? des corpus propos?s par Orange de mani?re ? ?tudier l'impact de chaque ressource sur le r?sultat d'une analyse dont le r?sultat est la projection de chaque terme sur ces concepts associ?s. Le r?sultat de l'?tude doit nous permettre de d?cider de l'int?r?t effectif de ces ressources et de la mani?re de les utiliser conjointement. Une autre ?tude plus fondamentale portera sur la granularit? conceptuelle. Le nombre et la nature des diff?rents concepts associ?s ? un terme est un probl?me ouvert qui d?pend probablement des donn?es ? traiter. Dans cette optique, l'?mergence de concepts par des approches de type data-mining peut fournir une aide. Cette ?tude pourra donc s'orienter soit vers la mise au point d'un crit?re th?orique soit vers un calcul d'optimalit? li? ? un corpus. Profil souhait? : - Un doctorat en informatique ou TAL (th?se soutenue depuis moins de 12 mois). - connaissances en alignement d'ontologies et Web S?mantique (technologies, formats, ontologies, thesarus, ...) - connaissances en traitement automatique des langues (TAL) - pratique de programmation (Java, C++), Linux Divers : CDD de 12 mois. Date de d?but du post-doctorat : d?s que possible (4e trimestre 2013). Lieu : Orange Labs ? Lannion (C?tes d'Armor, Bretagne). Pour plus d'information, contacter : Johannes Heinecke T?l : 02 96 05 21 77 Email : johannes.heinecke(at)orange.com Abdel-Malek Boualem R&D Project Manager France Telecom Orange Labs FT/OLNC/OLPS/OPENSERV/CONTENT/FAST Phone : +33 (0)2 96 05 29 83 Mobile : +33 (0)6 85 71 40 63 Email : malek.boualem at orange.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 09:55:11 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 11:55:11 +0200 Subject: Conf: IC 2013 (programme de la conference et des ateliers associes), Villeneuve d'Ascq, 3-5 Juillet 2013 Message-ID: Date: Fri, 21 Jun 2013 15:48:49 +0200 From: Nathalie Aussenac-Gilles Message-ID: <51C459C1.3010507 at irit.fr> X-url: http://pfia2013.univ-lille1.fr/doku.php?id=fr:ic X-url: http://www.irit.fr/SIIM/2013/ X-url: http://weblab-project.org/workshop/sos-dlwd2013/ X-url: http://liris.cnrs.fr/~rapc/wiki/doku.php/rapc2013 X-url: http://www.irit.fr/QetR/2013/ ------------------------------------------------------------------------ IC 2013 24es Journ?es francophones d'Ing?nierie des Connaissances http://pfia2013.univ-lille1.fr/doku.php?id=fr:ic Cit? Scientifique, Universit? Lille 1, Villeneuve d'Ascq, du 3 au 5 Juillet 2013 (dans le cadre de la plateforme IA de l'AFIA) La conf?rence IC 2013 aura lieu dans 10 jours et un programme all?chant est ? venir. Highlights: - 1 expos? invit? de Serge Abiteboul: "From data and information to knowledge: the Web of tomorrow" - 23 articles scientifiques r?partis dans 7 sessions couvrant des sujets qui sont au coeur de l'ing?nierie des connaissances tels que la construction d'ontologies, l'extraction de connaissances dans du texte, le raisonnement, le web s?mantique ou encore la mod?lisation de traces et l'exploitation de communaut?s - 10 posters dans une session d?di?e, souvent issus de travaux jeunes mais prometteurs - 6 ateliers qui auront lieu les lundi 1 et mardi 2 juillet et qui couvrent des sujets tels que la qualit? des donn?es ou la production de donn?es dans le web s?mantique, la recherche d'information s?mantique, le raisonnement ? partir de cas, la mod?lisation de connaissances dans le domain m?dical ou des sciences du vivant et de l'environnement. Vous pouvez encore vous enregistrez ! Toutes les informations pratiques sont ? http://pfia2013.univ-lille1.fr/doku.php?id=fr:start * Expos? Invit? IC* Serge Abiteboul: "From data and information to knowledge: the Web of tomorrow", http://pfia2013.univ-lille1.fr/doku.php?id=fr:invite#serge_abiteboul Relational database management systems serve as mediators between individuals and machines. They are among the greatest successes of computer science in the last century. Web search engines brought information management to levels that were previously unconceivable before. Then, after Internet and networks of machines, after the Web and the network of content, came the time of networks of Internet users. Social networks enable computer users to communicate, publish, and interact with others leading to new modes of thinking, new kinds of relations. With the increase in the volume of data and information they provide, a collective intelligence is currently emerging. One of the main challenges for the coming years is the development of technologies that will make it possible to find, evaluate, validate, verify and rank information, and thus build tomorrow's "Web of knowledge". By considering evolutions of the Web, we will try to imagine that world with billions of computer systems connected, collectively reasoning to help Internet users survive in an ocean of data and information. *Programme de la conf?rence IC* * Session: Traces et Communaut?s (Animateur: Gilles Falquet) - Am?lie Cordier, Marie Lefevre, Pierre-Antoine Champin et Alain Mille. Mod?liser les traces d'interaction pour raisonner ? partir de l'exp?rience trac?e - Patrice Bouvier, Karim Sehaba, ?lise Lavou? et S?bastien George. Approche qualitative pour identifier et qualifier l'engagement des joueurs ? partir de leurs traces d'interaction - Michel Crampes et Michel Planti?. Partition et recouvrement de communaut?s dans les graphes bipartis, unipartis et orient?s * Session: Ontologies I (Animateur: Sylvie Despres) - Xavier Aim? et Jean Charlet. IC : Ing?nierie des Connaissances ou Ing?nierie du Conformisme - Celine Joiron, Frederic Furst, Gilles Kassel, Alistair Jones, Jean-Paul Barth?s, Claude Moulin et Dominique Lenne. Une ontologie pour la conception d'une plateforme collaborative exploitant une table multi-tactile et multi-modale - Asma Ben Abacha, Marcos Da Silveira et C?dric Pruski. Une approche pour la validation du contenu d'une ontologie par un syst?me ? base de questions/r?ponses * Session: Extraction de Connaissances (Animateur: Nathalie Pernelle) - My Thao Tang et Yannick Toussaint. Vers un processus continu d'extraction de connaissances ? partir de textes - Kamel Mouna, Aussenac-Gilles Nathalie, Buscaldi Davide et Comparot Catherine. Construction semi-automatique d'ontologies ? partir d'une collection de pages web structur?es - Laurie Serrano, Maroua Bouzid, Thierry Charnois, Stephan Brunessaux et Bruno Grilheres. Extraction et agr?gation automatique d'?v?nements pour la veille en sources ouvertes : du texte ? la connaissance (*) - Ourdia Ressad, Sylvie Szulman, Haifa Zargayouna et Eve Paul. Construction collaborative d'une Ressource Termino-Ontologique (RTO) pour le droit des collectivit?s territoriales (*) * Session: Ontologies II (Animateur: Jean Charlet) - Claudine Metral, Nizar Ghoula, Vitor Silva et Gilles Falquet. Une ontologie de techniques de visualisation d'informations: application aux mod?les urbains 3D enrichis - Michel H?on et Roger Nkambou. G-OWL : Vers un langage de mod?lisation graphique, polymorphique et typ? pour la construction d'une ontologie dans la notation OWL - Mariem Mahfoudh, Laurent Thiry, Germain Forestier et Michel Hassenforder. Adaptation consistante d'ontologies ? l'aide des grammaires de graphes (*) - Julie Bourbeillon, La?titia Piel, Ramla El Ayeb, Damien Rousseli?re et Thomas Guyet. Construction semi-automatique d'une ontologie de la perception des paysages (*) * Session: Web S?mantique (Animateur: Catherine Faron Zucker) - Camille Pradel, Ollivier Haemmerl? et Nathalie Hernandez. Passage de la langue naturelle ? une requ?te SPARQL dans le syst?me SWIP - S?bastien Harispe, Sylvie Ranwez, St?fan Janaqi et Jacky Montmain. Mesures s?mantiques bas?es sur la notion de projection RDF pour les syst?mes de recommandation - Maria Koutraki, Nathalie Pernelle, Fatiha Sais, Brigitte Safar et Tushar Ghosh. D?couverte de liens d'identit? entre instances d?crites par des ontologies partiellement align?es (*) - Julien Corman. Explorer les th?or?mes d'une Tbox (*) * Session: Raisonnement (Animateur: Pierre Antoine Champin) - Stella Marc-Zwecker, Fran?ois de Bertrand de Beuvron, Cecilia Zanni-Merk et Florence Le Ber. Impl?mentation d'un raisonnement spatial qualitatif sur les relations RCC8 au moyen de OWL et de SWRL - Emmanuelle Gaillard, Jean Lieber, Yannick Naudet et Emmanuel Nauer. Raisonner sur des connaissances provenant d'une e-communaut? * Session: Applications (Animateur: Yannick Toussaint) - Blandine Ginon, St?phanie Jean-Daubias et Pierre-Antoine Champin. Mise en place d'un syst?me d'assistance personnalis?e dans une application existante - Brigitte Seroussi, Nizar Messai, C?dric Laou?nan, France Mentr? and Jacques Bouaud. Profils patients associ?s ? la non conformit? des d?cisions aux recommandations de prise en charge th?rapeutique des cancers du sein : utilisation de l'analyse de concepts formels - James Ortiz, Damien De Nizza, Hubert Meurisse et Pierre-Yves Schobbens. Formalisation et Construction d'une Ontologie dans le Domaine des Infections Orthop?diques (*) * Session: Posters - Kenza Harkouken Saiah, Nicolas Sabouret et Jean-Yves Donnart. Une ontologie de services pour la repr?sentation de la s?mantique d'un environnement virtuel urbain - ?tienne Deparis, Marie-Helene Abel, Gaelle Lortal et Juliette Mattioli. Mod?lisation sociale d'une organisation et usage de son r?seau - Nourhene Alaya et Sadok Ben Yahia. Nouvelle mesure de degr? de relation s?mantique pour une meilleur modularisation d'ontologies - Laurie Planes, St?phane Dervaux, Juliette Dibie-Barth?lemy, Nicolas Guinet et Liliana Ibanescu. Utilisation d'un outil de recherche d'information pour la mise en correspondance de thesaurus - Francky Trichet et Christophe Thovex. Analyse S?mantique des R?seaux Sociaux d'Usages et d'Opinions - Antoine Vincent, Bruno Bachimont et Alain Bonardi. Prescrire une mod?lisation par les patrons : exemple des patrons de cr?ation pour la repr?sentation des processus de production sonore - Mohamed Nader Jelassi, Sadok Ben Yahia et Engelbert Mephu Nguifo. Nouvelle approche de recommandation personnalis?e dans les folksonomies bas?e sur le profil des utilisateurs - Sahbi Zahaf et Faiez Gargouri. M?moire organisationnelle appuy?e par un cadre ontologique pour l'exploitation des processus d'affaires : application au processus RAO - Fabien Amarger, Catherine Roussey, Jean-Pierre Chanet, Ollivier Haemmerl? et Nathalie Hernandez. Web de donn?es agricole : transformation de sources pour une ontologie modulaire - Ga?lle Lortal, Etienne Deparis, Claire Laudy, Stefano Moretti et Juliette Mattioli. Un bouquet de th?ories pour une plateforme de d?cision strat?gique ? base de r?seaux sociaux *Programme des ateliers de la conf?rence IC* Lundi 1 juillet 2013: - "Recherche d'Information S?mantique (RISE)" organis?s par Jean Pierre Chevalet, Catherine Roussey et Ha?fa Zargayouna https://sites.google.com/site/frenchsemanticir/home/rise-2013 - "Symposium sur l'Ing?nierie de l'Information M?dicale (SIIM)" organis?s par Lina Soualmia, Lynda Tamine, Jean Charlet et Marie-Christine Jaulent http://www.irit.fr/SIIM/2013/ - "Des Sources Ouvertes au Web de Donn?es (SOS-DLWD)" organis?s par Khaled Khelif, Fatiha Sa?s, Fran?ois Scharffe, Rania Khefifi et Laurie Serrano. http://weblab-project.org/workshop/sos-dlwd2013/ Mardi 2 juillet 2013: - "INt?gration de sources/masses de donn?es h?t?rog?nes et Ontologies, dans le domaine des sciences du VIVant et de l'Environnement (IN-OVIVE)" organis?s par Patrice Buche, Juliette Dibie-Barth?lemy, Claire N?dellec, Pascal Neveu et Lydie Soler https://colloque.inra.fr/in_ovive_2013 - "Raisonnement ? Partir de Cas (R?PC)" organis?s par Valmi Dufour-Lussier, Emmanuelle Gaillard et Alice Hermann http://liris.cnrs.fr/~rapc/wiki/doku.php/rapc2013 - "Qualit? et Robustesse pour le web de donn?es (Q&R)" organis?s par Pierre Antoine Champin, Jean Charlet, Nathalie Hernandez, Mouna Kamel et Camille Pradel http://www.irit.fr/QetR/2013/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 09:59:13 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 11:59:13 +0200 Subject: Seminaire: Les reseaux lexicaux pour le TAL, CLLE, Axe TAL, 27 juin 2013 Message-ID: Date: Wed, 19 Jun 2013 09:35:16 +0200 From: Bruno Gaume Message-ID: <51C15F34.9070400 at gmail.com> [Veuillez nous excuser en cas de r?ceptions multiples] Les r?seaux lexicaux pour le TAL Journ?e d'?tude de l'Axe TAL de CLLE-ERSS (ouvert au public) jeudi 27 juin 2013 Les r?seaux lexicaux permettent de repr?senter ? grande ?chelle tout type de relation entre des mots ; ils sont construits ? partir de diverses ressources (corpus, dictionnaires, logs de requ?tes, etc.). Le but de cette journ?e d'?tude est de pr?senter leurs caract?ristiques, et leur usage en Traitement Automatique des Langues. Les diff?rents expos?s, en s'appuyant sur des applications concr?tes, aborderont des questions li?es ? la construction, la comparaison, l'?valuation, l'utilisation et les limites de ces ressources. PROGRAMME : 10H-->10H20 : Bruno Gaume (CLLE) Structure des r?seaux lexicaux 10H20-->10H40 : Yann Desalle (CLLE) SLAM: syst?me robuste pour l'interpr?tation lexicale automatique de m?taphores 10H40-->11H : Yann Desalle (CLLE) De l'exploration automatique des r?seaux de synonymie ? l'?tude de la dynamique d'acquisition lexicale des verbes en fran?ais et en mandarin. 11H-->11H20 : PAUSE 11H20-->11H40 : Benoit Gaillard (CLLE) Tmuse : un outil d'exploration lexicale 11H40-->12H : Emmanuel Navarro (IRIT) Kodex, un syst?me de recherche d'information 12H-->14H : PAUSE 14H-->14H30 : Val?rie Hanoka (ALPAGE) Utilisation d'un graphe de traduction pour la compl?tion d'ontologies l?g?res multilingues 14H30-->16H : Laurent Prevot (LPL) Quelles ressources s?mantiques pour traiter la parole spontan?e? PROGRAMME DETAILLE : Les r?seaux lexicaux pour le TAL Journ?e d'?tude de l'Axe TAL de CLLE-ERSS (ouvert au public) jeudi 27 juin 2013 salle OBM4 (pr?s de la Maison De la Recherche) Universit? Toulouse 2, 5 All?e Antonio Machado 31100 Toulouse M?tro : ligne A, station Mirail Universit? ------------------------------------------------------------------------ 10H-->10H20 TITRE : Structure des r?seaux lexicaux INTERVENANT : Bruno Gaume (CLLE) RESUME : Les grands r?seaux de terrain sont les r?seaux que l'on trouve en pratique, ils sont construits ? partir de donn?es issues de diff?rents domaines d'?tude : La sociologie comme le r?seau d'amis de Facebook, la linguistique comme les r?seaux de synonymie, la webologie comme le r?seau des pages web. Plusieurs ?tudes montrent un fait remarquable qui est que tous ces r?seaux, pourtant d'origines si diverses, poss?dent des propri?t?s identiques bien particuli?res et font partie de la classe des R?seaux Petits Mondes Hi?rarchiques (RPMH). Un autre fait tout aussi remarquable est que cette classe des RPMH est tr?s petite au regard de l'ensemble des r?seaux possibles : la probabilit? de tirer au hasard parmi l'ensemble des r?seaux possibles un RPMH est tr?s proche de z?ro. C'est-?-dire que les r?seaux auxquels nous avons ? faire dans la vraie vie se ressemblent tous par leurs structures communes, bien qu'intrins?quement cette structure soit tr?s rare du point de vue de la th?orie de la mesure. Dans cet expos? je commencerai par pr?senter les quatre propri?t?s fondamentales omnipr?sentes dans les r?seaux lexicaux. Je pr?senterais ensuite la dynamique des trajets d'un marcheur qui se d?place al?atoirement sur les sommets d'un r?seau lexical ? travers les relations lexicales. Nous verrons que l'?tude de ces dynamiques permet de d?finir des outils de m?trologie lexicale. ------------------------------------------------------------------------ 10H20-->10H40 TITRE : SLAM: syst?me robuste pour l'interpr?tation lexicale automatique de m?taphores INTERVENANT : Yann Desalle (CLLE) RESUME : SLAM (Solution Lexicale Automatique pour M?taphores) est un syst?me robuste pour l'interpr?tation automatique de m?taphores par substitution lexicale (par exemple, SLAM("d?shabiller* une pomme") = "peler une pomme" ). Ce syst?me r?alise une substitution lexicale du foyer m?taphorique des m?taphores substitutives non conventionnelles gr?ce ? un indice de tension s?mantique globale entre les candidats-substituts et la m?taphore ? interpr?ter. Cette tension globale est la combinaison de deux tensions primitives: (a) une tension s?mantique paradigmatique entre les candidats-substituts et le foyer m?taphorique ("d?shabiller") et (b) une tension s?mantique syntagmatique entre les candidats-substituts et le contexte m?taphorique (le compl?ment d'objet direct "une pomme"). L'id?e sous-jacente ? cette r?solution est que: (a) plus la tension paradigmatique est faible plus le candidat-substitut conserve le sens du foyer m?taphorique et (b) plus la tension syntagmatique est faible plus la paraphrase obtenue apr?s substitution est conventionnelle. La tension paradigmatique repose sur une mesure de proximit? s?mantique calcul?e sur un graphe de synonymie, et la tension syntagmatique repose sur une mesure de congruence s?mantique de triplets syntaxiques calcul?e sur un corpus. Bien qu'en g?n?ral les graphes de synonymie pr?sentent un faible taux d'accord au niveau des liens, l'?valuation de SLAM montre que le syst?me est robuste, c'est-?-dire que la plupart des dictionnaires de synonymie peuvent ?tre utilis?s pour calculer l'indice de tension paradigmatique. Une d?monstration de l'application suivra la pr?sentation. ------------------------------------------------------------------------ 10H40-->11H TITRE : De l'exploration automatique des r?seaux de synonymie ? l'?tude de la dynamique d'acquisition lexicale des verbes en fran?ais et en mandarin. INTERVENANT : Yann Desalle (CLLE) RESUME : Une exploration automatique des r?seaux lexicaux adapt?e ? leur structure de "r?seau petit monde hi?rarchique" ouvre de nouvelles voies pour l'analyse lexico-s?mantique des productions verbales. Ainsi, nous verrons dans cet expos? comment les r?seaux de synonymie permettent de mod?liser une partie de la dynamique d'acquisition lexicale des verbes. Tout d'abord, l'analyse par exploration automatique des r?seaux de synonymie de verbes produits par des jeunes enfants (2-5 ans) et des adultes natifs du fran?ais et du mandarin en d?nomination d'actions de s?paration/d?t?rioration d'objet a mis au jour deux modes de manifestation de la flexibilit? s?mantique chez les jeunes enfants: (a) manifestation par production de verbes plus g?n?riques et/ou polys?miques que ceux produits par les adultes; (b) manifestation par production de verbes plus "approximatifs" que ceux produits par les adultes. Ensuite, la comparaison des verbes produits en fran?ais et en mandarin a mis en ?vidence une diff?rence linguistique dans la r?partition de ces modes de manifestation de la flexibilit? s?mantique: alors qu'en fran?ais ils privil?gient la production de verbes g?n?riques/polys?miques, en mandarin ils privil?gient la production de verbes approximatifs. Enfin, un indice du degr? d'acquisition du lexique des verbes (indice REFLEX) a ?t? construit sur la base des r?sultats expos?s ci-dessus. Cet indice prend en compte les deux modes de r?alisation de la flexibilit? s?mantique et permet la cat?gorisation diff?rentielle des jeunes enfants vs adultes en fran?ais et en mandarin. ------------------------------------------------------------------------ 11H-->11H20 PAUSE ------------------------------------------------------------------------ 11H20-->11H40 TITRE : Tmuse : un outil d'exploration lexicale INTERVENANT : Benoit Gaillard (CLLE) RESUME : Tmuse est un outil d'exploration lexicale qui propose une visualisation du paysage s?mantique de mots recherch?s par l'utilisateur. Sur la base de r?seaux de synonymes, l'application s?lectionne, par Prox?mie, les mots les plus s?mantiquement proches de la requ?te. Ces mots et leurs liens de synonymie sont repr?sent?s sous la forme d'un graphe interactif en 3 dimensions. Les positions relatives des sommets de ce graphe respectent au mieux leur proximit? s?mantique, et les communaut?s de mots, d?tect?es par des m?thodes de clustering de graphe, sont mises en valeurs par des colorations distinctes. Dans le cas bilingue, l'application propose des traductions par Prox?mie de chacune de ces communaut?s. L'expos? d?taillera les principes sur lesquels l'application s'appuie, et en illustrera les diff?rentes fonctionnalit?s. ------------------------------------------------------------------------ 11H40-->12H TITRE : Kodex, un syst?me de recherche d'information INTERVENANT : Emmanuel Navarro (IRIT) RESUME : Nous allons pr?senter ici Kodex, un syst?me de recherche d'information modulable qui classifie automatiquement les r?sultats d'une recherche de documents. Kodex pr?sente les documents retourn?s pour une recherche, organis?s en plusieurs groupes. Cette pr?sentation rend visible la polys?mie de la requ?te par rapport ? la collection de documents, et aide l'utilisateur ? affiner sa recherche. Pour cela Kodex utilise une m?thode de clustering de graphes bipartis reliant documents et termes. Nous pr?senterons les grandes lignes du fonctionnement de Kodex, ainsi que l'architecture logicielle modulable utilis?e. Une d?monstration de l'application sera faite. ------------------------------------------------------------------------ 12H-->14H PAUSE ------------------------------------------------------------------------ 14H-->14H30 TITRE : Utilisation d'un graphe de traduction pour la compl?tion d'ontologies l?g?res multilingues INTERVENANT : Val?rie Hanoka (ALPAGE) R?SUM? : Nous allons pr?senter ici un outil de compl?tion d'ontologies l?g?res multilingue bas? sur un gros graphe de traduction et de synonymie. Ce graphe contient 9.10^5 noeuds repr?sentant un couple (langue, mot) et 7.10^6 arcs de traduction ou synonymie. Au total, 548 langues sont repr?sent?es, dont 20 langues disposant de plus de 10000 noeuds. Parall?lement, nous disposons d'une ontologie l?g?re multilingue de couverture variable selon la langue. Nous pr?senterons plusieurs algorithmes de compl?tion ? m?me de proposer des candidats pour l'extension d'ontologies dans chacune des langues: un premier algorithme heuristique ayant fait l'objet d'une publication (Hanoka et Sagot, 2012) et une adaptation du clustering local stochastique (Schaeffer, 2005) permettant d'?mettre des candidats y compris pour les langues rares. Enfin, nous ?voquerons le contexte d'utilisation du graphe de traduction et de synonymie dans le cadre de la structuration de terminologies multilingues extraites de corpus comparables dans plusieurs langues. ------------------------------------------------------------------------ 14H30-->16H TITRE : Quelles ressources s?mantiques pour traiter la parole spontan?e? INTERVENANT : Laurent Prevot (LPL) RESUME : Le traitement automatique de l'oral spontan? pose des questions diff?rentes de celui de l'?crit. A l'?crit, le recours aux ressources s?mantiques, comme les r?seaux lexicaux, est maintenant bien ?tabli notamment gr?ce ? l'existence de lexiques de qualit? et de corpus de grande taille. En passant ? l'oral, la taille des corpus et l'ad?quation des lexiques et autres outils deviennent des probl?mes cruciaux. Concernant les corpus, tandis que la faible performance en reconnaissance automatique sur de la parole spontan?e n'autorise pas un traitement classique des sorties de tels syst?mes, le co?t de transcription manuelle resulte en des corpus d'une autre ?chelle que ceux de l'?crit. Par ailleurs, les sp?cificit?s de l'oral spontan? requi?rent dans le meilleur des cas une adaptation des ressources traditionnelles. Dans cet expos?, je montrerai ? quels probl?mes se heurtent des m?thodes utilisant les r?seaux lexicaux utilis?s sur des corpus d'oral spontan?. Dans ce contexte, j'aborderai plus sp?cifiquement les sujets suivants: l'utilisation de ressources s?mantiques pour le traitement des disfluences et la segmentation et la classification des unit?s discursives. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:16:15 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:16:15 +0200 Subject: Seminaire: Alpage, Joakim Nivre, Training Deterministic Parsers Using Non-Deterministic Oracles, 27 juin, 10h30 Message-ID: Date: Thu, 20 Jun 2013 10:04:52 +0200 From: Marie Candito Message-ID: ************** S?minaire de l'?quipe Alpage ********* Il s'agit du s?minaire de recherche en linguistique informatique organis? par l'?quipe Alpage, ?quipe mixte INRIA - Paris Diderot, sp?cialis?e en analyse syntaxique automatique et en traitement du discours. *Le prochain s?minaire se tiendra exceptionnellement : JEUDI 27 juin de 10h30 ? 12h (une demi-heure plus t?t qu'habituellement), en salle 265* B?timent Olympe de Gouges rue Albert Einstein 75013 Paris (dernier b?timent de la rue Albert Einstein, num?ro non attribu?...) Toute personne int?ress?e est la bienvenue. ********************************************************** *Joakim Nivre, Uppsala University* Joint work with Yoav Goldberg, Bar-Ilan University. *Title *: Training Deterministic Parsers Using Non-Deterministic Oracles *Abstract* : Greedy transition-based dependency parsers are among the fastest available systems for natural language parsing but tend to suffer from search errors and subsequent error propagation. This problem is aggravated by the fact that they are normally trained using oracles that are deterministic and incomplete in the sense that they assume a unique canonical derivation and are only valid as long as the parser does not stray from this path. In this talk, I will introduce oracles that are nondeterministic and complete in the sense that they allow different derivations of the same parse tree and make optimal predictions for all parser states, including states from which the gold parse is no longer reachable. Experimental evaluation on a wide range of data sets shows that using these oracles to train greedy parsers gives substantial improvements in accuracy because of reduced error propagation. Moreover, this improvement comes at no cost in terms of efficiency, unlike other techniques like beam search. ********************************************************** ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:12:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:12:24 +0200 Subject: Job: Hiring NLP researchers, SyNTHEMA Message-ID: Date: Wed, 19 Jun 2013 19:15:39 +0200 From: Carlo Aliprandi Message-ID: <51C1E73B.7000809 at synthema.it> X-url: http://www.linkedin.com/groups?viewMemberFeed=&gid=125258&memberID=14086896&goback=%2Egna_125258 X-url: http://www.fp7-savas.eu/sites/default/files/documents/NLP2013.pdf X-url: http://www.fp7-savas.eu/sites/default/files/documents/JunNLP2013.pdf X-url: http://www.synthema.it/index.php/Tecnologia/speechtechnology/ X-url: http://www.linkedin.com/pub/carlo-aliprandi/4/874/180 X-url: http://www.linkedin.com/miniprofile?vieweeID=14086896&context=anet&view" X-url: http://www.linkedin.com/groups?viewMemberFeed=&gid=125258&memberID=14086896&goback=%2Egna_125258" X-url: http://www.fp7-savas.eu/sites/default/files/documents/NLP2013.pdf" X-url: http://www.fp7-savas.eu/sites/default/files/documents/NLP2013.pdf Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:08:07 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:08:07 +0200 Subject: Appel: JSSP2013 - Joint Symposium on Semantic Processing Message-ID: Date: Wed, 19 Jun 2013 16:00:54 +0200 From: Alberto Lavelli Message-ID: <20130619140054.GA5026 at fbk.eu> X-url: http://jssp2013.fbk.eu/ = APOLOGIES FOR MULTIPLE POSTINGS = Joint Symposium on Semantic Processing: Textual Inference and Structures in Corpora FBK, Trento (Italy), November 20-22, 2013 http://jssp2013.fbk.eu/ Preliminary Call for Papers In the last decade, many Natural Language Processing tasks have matured to a point where semantic questions, ranging from paraphrasing to relevance assessment to disambiguation, are coming into the focus of attention. This symposium aims at bringing together researchers from different strands of research on semantic processing, with a focus on two aspects. The first is the textual inference paradigm, proposed as a unifying generic framework that captures major semantic processing needs in different application areas. Textual entailment research has yielded so far a range of inference algorithms, which were mostly developed within individual "in-house" systems. The symposium aims at addressing current bottlenecks by discussing future research directions and perspectives for consolidation and unification of textual inference technology. The second aspect concerns linguistic structures, as identified by empirical work within corpus linguistics, whose benefit for Computational Linguistics has not yet been fully realized. The aim of the symposium is to suggest progress towards models of language that facilitate successful processing of semantic knowledge in natural language applications. The symposium is open to any research topic related to textual inference and structures in corpora. More specifically, topics of interest include, but are not limited to: - Tools for textual inference - Resources for textual inference - Unification and consolidation in textual inference - Textual inference in real-world scenarios - Textual inference and other textual relations - Evaluation methodologies of textual inference - Multilingual and language-independent techniques for textual inference - Cross-lingual textual entailment - Representation of lexical and phrasal meaning: syntax-semantics interface - Syntax-lexical semantics interface - Shallow and deep semantic processing and reasoning: rule-based and probabilistic methods - Learning textual inference rules from data - Pattern extraction from corpus - Grammar inference - Distributional semantics - Semantic parsing - Modeling lexicon and context in semantic interpretation - Semantic roles labeling - Normalization for a broad range of semantic categories - Design decisions in construction of semantic frames - Extension of semantic frames - Representing and resolving semantic ambiguity - Context extraction for word sense disambiguation - Open domain relation extraction - Open domain event extraction - Large scale event extraction and event classification - Dynamic event relationships - Building and using ontologies to model inference - Computational modeling of linguistic theories - Alignment of lexical resources - Applications of textual inference and semantic processing The Symposium is a joint event supported by the EU-funded project EXCITEMENT (http://www.excitement-project.eu/), which aims to set up a generic architecture and a comprehensive open-source platform for multilingual textual inference, and by the B-CROCE project, which is the beneficiary of a Marie Curie Integration grant dedicated to finding regular structures as patterns in corpora. The symposium benefits from the participation of a large number of keynote presentations by people whose research has had a significant impact on semantic processing. The symposium aims at providing a stimulating and intriguing forum for mutual update and discussion of these research directions in semantic processing, and we hope to attract a substantial number of involved senior and junior researchers worldwide. To that end, the symposium will have a special structure, including: - A large number of keynote presentations by people whose research has had a significant impact in semantic processing - Presentations of submitted papers (oral and poster sessions) - Two panel discussions (one on each aspect of the symposium) - Two tutorials: the textual-inference tutorial will present the new open-source platform provided by the EXCITEMENT project (inference engines, modules and knowledge resources); the other tutorial will focus on corpus patterns (theoretical and computational aspects of corpus pattern analysis, chain clarifying relationships, frames, argument structures). Both tutorials include a hands-on session. All the details concerning the event may be found on the Symposium?s web page http://jssp2013.fbk.eu CONFIRMED KEYNOTE SPEAKERS AND PANELISTS Eneko Agirre, University of the Basque Country, Spain Marco Baroni, University of Trento, Italy Johan Bos, University of Groeningen, The Netherlands Philipp Cimiano, University of Bielefeld, Germany Peter Clark, Vulcan Inc., USA Ido Dagan, Bar Ilan University, Israel Patrick Hanks, University of Wolverhampton, UK Elisabetta Jezek, University of Pavia, Italy Mirella Lapata, University of Edinburgh, UK Bernardo Magnini, FBK, Italy G?nter Neumann, DFKI, Germany Sebastian Pado, Heidelberg University, Germany Octavian Popescu, FBK, Italy Dan Roth, University of Illinois at Urbana-Champaign, USA Sabine Schulte im Walde, University of Stuttgart, Germany Roberto Zamparelli, University of Trento, Italy Torsten Zesch, University Darmstadt, Germany IMPORTANT DATES September 15, 2013: Papers due October 15, 2013: Notification of acceptance October 29, 2013: Camera-ready deadline November 20-22, 2013: Symposium SUBMISSIONS Authors are invited to submit papers on work in the topic areas of this workshop. We distinguish two types of papers: * Long papers present completed work and should not exceed 8 pages (plus any number of additional pages with references only) * Short papers present work in progress and should not exceed 4 pages (plus two additional pages of references) Papers are to be submitted via the symposium EasyChair submission page: https://www.easychair.org/conferences/?conf=jssp2013 As reviewing will be blind, please ensure that papers are anonymous. The papers should not include the authors' names and affiliations or any references to web sites, project names etc. revealing the authors' identity. Submissions should follow the two-column format of ACL 2013 proceedings (see the official style files at http://www.acl2013.org/call.html). PROGRAM COMMITTEE (confirmed members) Enrique Alfonseca, Google Research, Switerzland Luisa Bentivogli, FBK, Italy Antonio Horta Branco, Faculdade de Ci?ncias de Lisboa, Portugal Elena Cabrio, INRIA Sophia Antipolis, France Dan Cristea, University of Iasi, Romania Ido Dagan, Bar Ilan University, Israel Rodolfo Delmonte, University "Ca' Foscari", Venice, Italy Liviu Dinu, University of Bucharest, Romania Eduard Hovy, Carnegie Mellon University, USA Elisabetta Jezek, Pavia University, Italy Alberto Lavelli, FBK, Italy Alessandro Lenci, University of Pisa, Italy Bernardo Magnini, FBK, Italy Simonetta Montemagni, Istituto di Linguistica Computazionale, Italy G?nter Neumann, DFKI, Germany Rodney D. Nielsen, University of Colorado, USA Tae-Gil Noh, Heidelberg University, Germany Jan Odijk, Institute of Linguistics OTS, The Netherlands Constantin Orasan, University of Wolverhampton, UK Sebastian Pado, Heidelberg University, Germany Martha Palmer, University of Colorado Boulder, USA Octavian Popescu, FBK, Italy German Rigau, Facultad de Informatica de San Sebastian UPV/EHU, Spain Anne Vilnat, Universite Paris-Sud, France Rui Wang, DFKI, Germany Annie Zaenen, Stanford University, USA Fabio Massimo Zanzotto, University "Tor Vergata", Rome, Italy ORGANIZING COMMITTEE Ido Dagan, Bar Ilan University, Israel Elisabetta Jezek, Pavia University, Italy Alberto Lavelli, FBK, Italy Bernardo Magnini, FBK, Italy G?nter Neumann, DFKI, Germany Sebastian Pado, Heidelberg University, Germany Octavian Popescu, FBK, Italy ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:21:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:21:44 +0200 Subject: Conf: International UDC Seminar 2013 entitled "Classification & Visualization", The Hague, 24-25 October 2013 Message-ID: Date: Thu, 20 Jun 2013 17:07:58 +0200 From: "Widad Mustafa El Hadi " Message-ID: <00e501ce6dc7$f595d580$e0c18080$@mustafa at free.fr> X-url: http://seminar.udcc.org/2013 === INVITATION FOR REGISTRATION === International UDC Seminar 2013 entitled "Classification& Visualization: Interfaces to Knowledge" will take place on Thursday 24 - Friday 25 October in the National Library of the Netherlands (Koninklijke Bibliotheek), The Hague Conference website: http://seminar.udcc.org/2013. The objective of this conference is to explore cutting edge advances and techniques in the visualization of knowledge across various fields of application and their potential impact on developments in the more main stream bibliographic and documentary classifications. Speakers include: W. Boyd Rayward, Lev Manovich, Kathryn La Barre, Fabrice Papy, Marcel Worring, Luca Rosati, Andrea Resmini, Richard Smiraglia, Charles van den Heuvel, Andrea Scharnhorst, Scott Weingart, etc. To learn more about the conference programme and to register go to the conference website http://seminar.udcc.org/2013Early bird registration closes on 30th June: ?180 early bird fee, students ?140 (to 30 June) ?220 regular fee, students ?180 Registration fee covers lunches, refreshments, reception and the conference proceedings book. Contact: seminar2013 at udcc.org We look forward to seeing you in October Dr. Aida Slavic, UDCC, The Hague, Netherlands ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:23:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:23:44 +0200 Subject: These: Enrique Henestroza Anguiano, Efficient Large-Context Dependency Parsing and Correction with Distributional Lexical Resources Message-ID: Date: Thu, 20 Jun 2013 10:27:11 -0700 From: Enrique Henestroza Anguiano Message-ID: Bonjour, J'ai le plaisir de vous inviter ? ma soutenance de th?se, qui s'intitule : "Efficient Large-Context Dependency Parsing and Correction with Distributional Lexical Resources". La soutenance aura lieu le jeudi 27 juin, ? 15h, en salle 147 (1er ?tage) du b?timent Olympe de Gouges 8 rue Albert Einstein, 75013 Paris de l'Universit? Paris Diderot. Vous ?tes ?galement cordialement invit?s au pot qui suivra. Bien cordialement, Enrique Henestroza Anguiano ----- Composition du jury : Bernd Bohnet, University of Birmingham (examinateur) Marie Candito, Universit? Paris Diderot (co-directrice de th?se) Matthieu Constant, Universit? Paris-Est (rapporteur) Laurence Danlos, Universit? Paris Diderot (directrice de th?se) Alexis Nasr, Universit? Aix Marseille (co-directeur de th?se) Joakim Nivre, Uppsala University (rapporteur) ----- R?sum? : Cette th?se pr?sente des m?thodes pour am?liorer l'analyse syntaxique probabiliste en d?pendances. Nous employons l'analyse ? base de transitions avec une mod?lisation effectu?e par des machines ? vecteurs supports (Cortes and Vapnik, 1995), et nos exp?riences sont r?alis?es sur le fran?ais. L'analyse a base de transitions est rapide, de par la faible complexit? des algorithmes sous-jacents, eux m?mes fond?s sur une optimisation locale des d?cisions d'attachement. Ainsi notre premier fil directeur est d'?largir le contexte syntaxique utilis?. Partant du syst?me de transitions arc-eager (Nivre, 2008), nous proposons une variante qui consid?re simultan?ment plusieurs gouverneurs candidats pour les attachements ? droite. Nous testons aussi la correction des analyses, inspir?e par Hall and Nov?k (2005), qui r?vise chaque attachement en choisissant parmi plusieurs gouverneurs alternatifs dans le voisinage syntaxique. Nos approches am?liorent l?g?rement la pr?cision globale ainsi que celles de l'attachement des groupes pr?positionnels et de la coordination. Notre deuxi?me fil explore des approches semi-supervis?es. Nous testons l'auto-entrainement avec un analyseur en deux ?tapes, bas? sur McClosky et al. (2006), pour le domaine journalistique ainsi que pour l'adaptation au domaine m?dical. Nous passons ensuite ? la mod?lisation lexicale ? base de corpus, avec des classes lexicales g?n?ralis?es pour r?duire la dispersion des donn?es, et des pr?f?rences lexicales de l'attachement des groupes pr?positionnels pour aider ? la d?sambigu?sation. Nos approches am?liorent dans certains cas la pr?cision et la couverture de l'analyseur, sans augmenter sa complexit? th?orique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:29:47 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:29:47 +0200 Subject: Job: Jeune Docteur - R&D analyse semantique et reseaux sociaux Message-ID: Date: Thu, 20 Jun 2013 22:30:54 +0200 From: Sylvain Eche Message-ID: Jeune Docteur - R&D analyse s?mantique et r?seaux sociaux Social Moov est une startup qui d?veloppe une technologie innovante dans le marketing sur les r?seaux sociaux. La soci?t? compte aujourd'hui 30 collaborateurs et des bureaux en France et Angleterre. Afin d'acc?l?rer sa R&D, nous recherchons un jeune docteur pour travailler sur les sujets R&D suivants : - Analyses s?mantiques des discussions en cours sur les r?seaux sociaux (tweeter / facebook) afin d'identifier les sujets tendances du moment et d?finir des ciblages publicitaires adapt?s. - Algorithmes d?cisionnels pour identifier le meilleur timing pour poster un message sur une communaut? en fonction des discussions courantes. - Construction de graphes de proximit?s afin d'identifier pour une marque donn?e, les sujets ou centres d'int?r?t les plus proches. - Optimisation des diffusions publicitaire afin de converger rapidement vers le message optimal ? diffuser sur une cible donn?e. Votre mission consistera ? : Structurer l'ensemble de la R&D de la soci?t?. R?aliser des ?tats de l'art. Documenter la R&D. Mettre en place et d?velopper des prototypes fonctionnels. R?aliser des sp?cifications techniques pour les ?quipes de d?veloppeurs. Faire naitre des opportunit?s de partenariat avec le monde universitaire. Profil : Obligatoirement jeune docteur, vous avez r?alis? une th?se dans l'analyse s?mantique, la th?orie des graphes, la fouille de donn?e ou l'analyse des r?seaux sociaux. Vous avez ?galement d?j? utilis? des technologies comme hadoop ou mahout pour analyser des masses importantes de donn?es. Poste ? pourvoir ASAP. R?mun?ration : A n?gocier. Lieu : Paris Bastille. Contact : Sylvain Eche (sylvain at socialmoov.com) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 23 10:04:39 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 23 Jun 2013 12:04:39 +0200 Subject: Sujet de these: Projection interlingue d'annotations linguistiques a partir de corpus paralleles et comparables, CEA LIST Message-ID: Date: Wed, 19 Jun 2013 13:46:08 +0000 From: SEMMAR Nasredine 202247 Message-ID: <50CC12289F0C854FBFF134F270030CD71C3D734E at EXDAG0-B2.intra.cea.fr> [Version fran?aise] (English version below) Le CEA LIST propose une allocation doctorale de recherche pour la rentr?e universitaire 2013. Sujet de th?se : Projection interlingue d?annotations linguistiques ? partir de corpus parall?les et comparables Lieu de la th?se : CEA Saclay Nano-INNOV, Laboratoire Vision et Ing?nierie des Contenus (LVIC), 91191 Gif-sur-Yvette Encadrant : Nasredine Semmar, CEA LIST, Laboratoire Vision et Ing?nierie des Contenus (LVIC) Directeur de th?se: Laurent Besacier, Universit? de Grenoble, Laboratoire d?Informatique de Grenoble (LIG) Le Laboratoire Vision et Ing?nierie des Contenus (LVIC) du CEA LIST est sp?cialis? en extraction et en recherche d?information multim?dia et multilingue. Contexte et objectifs g?n?raux de la th?se : ----------------------------------------------------- L'annotation linguistique de ressources consiste ? ajouter des informations de nature interpr?tative aux donn?es brutes originales [Leech, 1997]. Ces informations peuvent ?tre d'ordre terminologique, lexical, morphologique, syntaxique ou s?mantique et les ressources linguistiques peuvent ?tre des lexiques, dictionnaires, transcriptions de dialogues ou corpus de textes [V?ronis, 2000]. Les applications utilisant les ressources linguistiques annot?es sont nombreuses et diverses : recherche d'information interlingue, fouille de textes, extraction d'informations, aide ? la traduction, traduction automatique, etc. C'est la raison pour laquelle, depuis quelques ann?es, la construction automatique de telles ressources est devenue un champ de recherche important en Traitement Automatique de la Langue (TAL) [Hamon et al., 2007] [Viprey et L?thier, 2008] [Mazziotta, 2010] [Bestgen, 2013]. La plupart des approches d?velopp?es pour la construction de ressources linguistiques annot?es ont un objectif commun : minimiser le co?t de la production de telles ressources en supprimant l'intervention humaine ou en la limitant ? la seule t?che de validation et d'?valuation. Le point commun de ces approches est de trouver et d'explorer des m?canismes non (ou tr?s peu) co?teux pour exploiter des ressources linguistiques annot?es d?j? disponibles pour certaines langues et des corpus parall?les pour produire de nouvelles ressources annot?es pour des langues faiblement dot?es. C'est le cas des approches qui s'appuient sur la projection interlingue d'annotations. Ces approches partent d'un corpus parall?le dont les textes en langue source sont d?j? annot?s, et proposent des annotations pour des textes en langue cible ? l'aide de techniques d'alignement. Ces approches permettent de produire des ressources linguistiques ad?quates ? moindre co?t pour des langues peu dot?es mais elles ouvrent ?galement la voie ? des recherches sur l'extension multilingue d'outils de TAL monolingues. Nous pourrons citer les travaux de Yarowsky et al (2001) qui ont utilis? un corpus parall?le pour adapter des outils monolingues (POS Taggers, chunkers et analyseurs morphologiques) ? de nouvelles langues. La projection entre langues a ?t? r?alis?e en utilisant des techniques d'alignement de mots entre les phrases du corpus parall?le. Cette approche a ?t? adapt?e par Hwa et al. (2002) aux nivaux grammatical et syntaxique pour faire une projection des informations concernant les d?pendances syntaxiques de l'anglais vers le chinois. Feldman et al (2006) ont exp?riment? la projection interlingue ? partir de corpus comparables pour transf?rer des ?tiquettes morpho-syntaxiques entre le russe, le polonais et le tch?que. L'annotation en allemand de r?les s?mantiques par projection interlingue ? partir de la paire de langues anglais-allemand a ?t? d?j? abord?e par Pado et Lapata (2005) (2009). Pado et Pitel (2007) ont ?valu? la g?n?ricit? de cette approche du point de vue des langues en l'appliquant ? la paire anglais-fran?ais. Les r?sultats sont proches de ceux obtenus pour l'allemand. Kim et al (2011) ont utilis? des informations fournies par un aligneur de mots pour transf?rer les entit?s nomm?es et leurs relations de l'anglais vers le cor?en en vue de la construction d'un corpus d'apprentissage pour un syst?me d'extraction d'information ? partir du Web. Abdul Hay (2012) a utilis? les relations s?mantiques extraites par transitivit? traductionnelle ? partir de corpus multilingue align? pour la constitution d'une ressource s?mantique en arabe. Plus r?cemment, Jabaian (2012) s'est int?ress? ? la portabilit? multilingue d'un syst?me de compr?hension de la parole en proposant d'utiliser la traduction automatique afin de minimiser le co?t du d?veloppement d'un nouveau syst?me de compr?hension dans une nouvelle langue (Jabaian et al., 2013). Les approches de projection interlingue par alignement de mots affichent des r?sultats satisfaisants en annotations lexicales et morpho-syntaxiques pour les couples de langues voisines, mais il reste plusieurs d?fis ? relever pour les annotations syntaxiques et s?mantiques des langues ? morphologie riche ou celles poss?dant des syntagmes longs. Cette th?se se situe dans le contexte de l'automatisation du processus de construction de ressources linguistiques multilingues annot?es par projection interlingue. L'objectif est d'identifier des ?quivalences terminologiques, morpho-syntaxiques, syntaxiques ou s?mantiques ? partir de corpus de textes parall?les ou comparables. Deux processus constituent un pr?requis pour la projection interlingue d'annotations ? partir de corpus : un alignement au niveau des paragraphes, des phrases ou d'unit?s lexicales de taille variable, et une analyse linguistique pour l'annotation des textes en langue source. D?roulement de la th?se : ------------------------------- Le sujet de th?se propos? a pour but d'explorer et d'exp?rimenter de nouvelles approches de projection interlingue d'annotations et se propose d'aborder cette probl?matique selon les trois axes suivants, dans le prolongement des travaux d?j? r?alis?s au laboratoire LVIC : - Utilisation d'approches statistiques et de recherche d'information interlingue pour la constitution de corpus de textes parall?les ? partir de corpus comparables. Il s'agit de mesurer une certaine similarit? entre les textes du corpus comparable afin d'identifier les textes contenant les m?mes phrases. - Constitution de lexiques multilingues en d?veloppant de nouvelles approches d'alignement de mots simples, mots compos?s et expressions ? partir de corpus textes comparables. - D?veloppement d'un mod?le de projection interlingue d'annotations terminologiques, morpho-syntaxiques, syntaxiques et s?mantiques ind?pendant de la langue. Le laboratoire LVIC du CEA LIST dispose d'une plate-forme modulaire de traitement des langues, LIMA (Besan?on et al., 2010), permettant de r?aliser une analyse linguistique jusqu'au niveau syntaxique et int?grant certaines analyses s?mantiques et discursives. Le doctorant r?alisera son travail en s'appuyant sur cette plate-forme et b?n?ficiera des travaux d?j? r?alis?s au niveau du laboratoire en alignement de mots simples, mots compos?s et d'expressions multi-mots ? partir de corpus de textes parall?les (Semmar et Laib, 2010) et comparables (Bouamor et al., 2013). R?f?rences bibliographiques : ------------------------------------ - ABDUL HAY A. (2012). Constitution d'une ressource s?mantique arabe ? partir de corpus multilingue align?. Th?se de doctorat en informatique et sciences du langage, Universit? de Grenoble, France. - BESAN?ON R., DE CHALENDAR G., FERRET O., GARA F., LAIB M., MESNARD O., SEMMAR N. (2010). LIMA: A multilingual framework for linguistic analysis and linguistic resources development and evaluation. LREC 2010, Malta. - BESTGEN Y. (2013). Construction automatique de ressources lexicales pour la fouille d'opinion : extension aux n-grammes. Dixi?me ?dition de la COnf?rence en Recherche d'Information et Applications, CORIA 2013. - BOUAMOR D., SEMMAR N., ZWEIGENBAUM P. (2013). Similarit? s?mantique pour l'extraction de lexiques bilingues ? partir de corpus comparables. TALN 2013. - FELDMAN A., HANA J., BREW C. (2006). Experiments in Cross-Language Morphological Annotation Transfer. A. Gelbukh (Ed.): CICLing 2006. - HAMON T., DERIVIERE J., NAZARENKO A. (2007). OGMIOS : une plate-forme d'annotation linguistique de collection de documents issus du Web. TALN 2007. - HWA R., RESNIK P., WEINBERG A., KOLAK O. (2002). Evaluation translational correspondence using annotation projection. ACL 2002, 392?399, Philadelphia, USA. - JABAIAN B. (2012). Syst?mes de compr?hension et de traduction de la parole : vers une approche unifi?e dans le cadre de la portabilit? multilingue des syst?mes de dialogue. Th?se de doctorat en informatique, Universit? d'Avignon et des Pays de Vaucluse, France. - JABAIAN B., BESACIER L., LEFEVRE F. (2013). Comparison and Combination of Lightly Supervised Approaches for Language Portability of a Spoken Language Understanding System. IEEE Transactions on Audio, Speech & Language Processing, 21(3):636-648, 2013. - KIM S., JEONG M., LEE J., LEE G. G. (2011). A Cross-lingual Annotation Projection-based Self-supervision Approach for Open Information Extraction. 5th International Joint Conference on Natural Language Processing, 2011. - LEECH G. (1997). Introduction corpus annotation. Garside, R., Leech, G., McEnery, A., (Eds.), Corpus annotation: Linguistic information from computer text corpora. London: Longman, 1 :18. - PAD? S., LAPATA M. (2005). Cross-lingual projection of role-semantic information. HLT/EMNLP 2005, Vancouver, Canada. - PAD? S., LAPATA M. (2009). Cross-lingual Annotation Projection of Semantic Roles. Journal of Artificial Intelligence Research 36, 307-340. - PAD? S., PITEL G. (2007). Annotation pr?cise du fran?ais en s?mantique de r?les par projection cross-linguistique. TALN 2007, Toulouse, France. - MAZZIOTA N. (2010). Logiciel NotaBene pour l'annotation linguistique Annotations et conceptualisations multiples. RECHERCHES QUALITATIVES, Hors S?rie num?ro 9, pages 83-94. - SEMMAR N., LAIB M. (2010). Using a Hybrid Word Alignment Approach for Automatic Construction and Updating of Arabic to French Lexicons. LREC 2010, Malta. - VERONIS J. (2000). Annotation automatique de corpus : panorama et ?tat de la technique. Chapitre 4, Editions Herm?s, 2000. - VIPREY J. M., LETHIER V. (2008). Annotation linguistique de corpus : vers l'exhaustivit? par la convivialit?. 9es Journ?es internationales d'Analyse statistique des Donn?es Textuelles, JADT 2008. - YAROWSKY D., NGAI G., WICENTOWSKI R. (2001). Inducing multilingual text analysis tools via robust projection across aligned corpora. HLT 2001, pp. 161?168, San Francisco, USA. Conditions sur les candidatures et Profil recherch?: -------------------------------------------------------------- - Age : moins de 26 ans ? la date de recrutement; - Dipl?me de Master Recherche ou ?quivalent en informatique ; - Comp?tences en informatique (Linux, C++, Perl, etc.); - Connaissances en traitement automatique de la langue et en statistique souhait?es. Modalit? de d?p?t de candidature : ------------------------------------------- Les candidatures (CV + Lettre de motivation + Lettres de recommandation + Relev? de notes depuis le Bac) sont ? envoyer le plus rapidement possible ? Nasredine Semmar (nasredine.semmar at cea.fr) et Laurent Besacier (laurent.besacier at imag.fr). Contacts pour plus d'information : Nasredine Semmar, Email: nasredine.semmar at cea.fr, T?l: +33 (0)1 69 08 01 46 [English version] Funded PhD position, CEA LIST, Laboratoire Vision et Ing?nierie des Contenus (LVIC), France The Vision and Content Engineering Laboratory (LVIC) of the CEA LIST, France, is looking for a PhD student to work in the area of building annotated multilingual linguistic resources. The LVIC is specialized in multilingual and multimedia information extraction and retrieval. Thesis title: Cross-language projection of linguistic annotations using parallel and comparable corpora Thesis subject: ------------------ Annotating corpora with linguistic information (part-of-speech tagging, sense tagging, syntactic analysis, named entity identification, semantic role annotation) involves significant human efforts. The availability of parallel corpora and some resource-rich languages (such as English which has large amounts of annotated corpora and several analysis tools available) has recently led to several research works in order to project linguistic annotations from the resource-rich source language to a target language with less resources. The goal of cross-language projection is, on the one hand, to provide all languages with linguistic annotations, and on the other hand, to automatically induce text analysis tools for these languages. Scientific challenges of cross-language projection of linguistic annotations from parallel corpora are related to the results of word alignment tools and the syntactic divergences of the source and target languages. Indeed, each word of the source language can map to single, multiple, or zero words in the target language, and part-of-speech tagsets for source and target language may be different. Many efforts have been developed to project linguistic annotations from resource-rich languages to other languages but most of them have only explored approaches applying one-to-one mapping. This thesis falls within the scope of automating the process of building annotated multilingual linguistic resources. The main purpose in this process is to identify lexical, syntactical and semantic equivalences across parallel or comparable corpora. The proposed subject aims to explore and experiment new approaches for language-independent projection for linguistic resources construction and annotation. It proposes to tackle this issue based on the following areas: - Constitution of aligned sentences and sub-sentences from comparable corpora using statistical and cross-language information retrieval approaches. - Building bilingual lexicons of single words and multiword expressions using word alignment. - Exploring rule-based, heuristic-based and hybrid approaches for mapping linguistic annotations using parallel corpora. Candidate profile: The successful candidate must be at greatest 26 years old by December 2013, will have a Master's degree (or equivalent qualification) in Computer Science with a good background in Computational Linguistics. Please send a CV, a cover letter, letters of recommendation and report card to: Nasredine Semmar (nasredine.semmar at cea.fr) and Laurent Besacier (laurent.besacier at imag.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:35:22 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:35:22 +0200 Subject: Job: Post doc, Semiotics of Image Fraud Detection, Caen Message-ID: Date: Sun, 23 Jun 2013 19:12:42 +0200 From: Nadine Lucas Message-Id: <1E3D314D-0F59-4A5C-AFF0-09F3D3DC732E at unicaen.fr> ########################################################## Postdoctoral Fellowship in Semiotics of Image Fraud Detection Normandy University (UCBN France) CNRS GREYC Laboratory Application deadline: 15.07.2013 (11:59 pm GMT) ########################################################## POSITION ANNOUNCEMENT Post-Doc position in the DOCSCOPE project at the National Center for Scientific Research (CNRS) GREYC Laboratory, Caen, Normandy, France. Duration: 12 months Application deadline: 15.07.2013 (11:59 pm GMT) The Human Language Technology team (HULTECH) proposes a Post-Doc fellowship within the context of the newly started DOCSCOPE project (ANR label) at the CNRS GREYC Laboratory for high standard candidates with a Ph.D. degree in Computer Science or Electronic Engineering. POSITION The DOCSCOPE project aims to contribute to the identification of falsified documents by developing new methods to detect directly visible or hidden visual clues using new technologies of documentary image processing. The exploitation of the results (revealing incoherence, alterations, fraudulent modifications, doctored photographs, etc.) also integrates an interpretation phase, which makes it possible to specify the significance of changes, or the meaning of whatever manipulations have been detected. Research stemming from Semiology (or Semiotics) and particularly work applied to image analysis, document analysis or text as image have obviously their role to play in the global DOCSCOPE procedure. Within this project, the analysis is not dependent on comparison with an annotated database, but relies on careful induction from sets of clues. The successful candidate is expected to work in collaboration with other researchers, programmers, and students involved in the project in an interdisciplinary team, and to collaborate with the research units involved in the project. JOB REQUIREMENTS - Ph.D. degree in Computer Science or Electronic Engineering; - Theoretical background in Natural Language Processing, Text Mining or Information Retrieval; - Ability to carry out a research program and keep deadlines; - Ability to work in a collaborative research environment; - Oral and written proficiency in English. OPTIONAL REQUIREMENTS: - Ph.D. or experience related to forgery / cheating / falsification; - Experience with practical applications; - Soft skill (e.g., communication, team building, problem solving, etc.); - Oral and written proficiency in French; - Background in Linguistics, Philosophy or Semiotics. EMPLOYMENT - Type of contract: Research position - Full time - Number of positions: 1 - Net salary: 1900 euros/month. - Start date: ideally 1st September 2013 - Duration: up to 1 year - Workplace: University of Caen-Basse-Normandie (UCBN), UFR Sciences, Caen, France APPLICATION To apply online, please send your detailed CV including a statement of interest and the contacts of three reference persons. The applicant must also attach his/her Ph.D. Certificate and a list of any publications, certificates or other qualifications (if any) considered relevant for assessing the candidate?s abilities in relation to this Call. IMPORTANT: All these documents must be sent as PDF files in a single zipped folder. Please note the candidate must state the following information clearly, precisely and under his/her own responsibility, in the application: - Personal information: date and place of birth, nationality, residence and contact address during the selection procedure; - Citizenship: applicants who are citizens of a country that is not a European Union Member State must already possess or at least have requested a Work Residence Permit. This requirement is not mandatory for the current application, but if the Residence Permit or related requests are not presented at the time the contract will be stipulated, all the related rights will be forfeited; - Doctoral Degree. Emails should have the following reference code: DOCSCOPE_PostDoc2013 Applications must be sent to Serge Mauger (serge.mauger at unicaen.fr) and Ga?l Dias (gael.dias at unicaen.fr). Application deadline: 15.07.2013 (11:59 pm GMT). Only applications received before the aforementioned deadline will be considered. For further information, please feel free to contact Serge Mauger (serge.mauger at unicaen.fr) or Nadine Lucas (nadine.lucas at unicaen.fr) or Pierre Beust (pierre.beust at unicaen.fr) or Ga?l Dias (gael.dias at unicaen.fr). Nadine Lucas, CR HDR Equipe Human Language Technologies (HULTECH) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:38:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:38:27 +0200 Subject: Appel: JADT2014, 3-6 Juin 2014, Paris Message-ID: Date: Mon, 24 Jun 2013 08:51:13 +0200 From: Serge Fleury Message-ID: X-url: http://tal.univ-paris3.fr/jadt/jadt2014/appels/Appel-JADT-2014-fr.pdf X-url: http://jadt.org *JADT 2014 (Paris) 3-6 juin 2014* (See English Below) *Appel ? communication* http://tal.univ-paris3.fr/jadt/jadt2014/appels/Appel-JADT-2014-fr.pdf Les Journ?es internationales d?Analyse statistique des Donn?es Textuelles (JADT) r?unissent tous les deux ans, depuis 1990, des chercheurs travaillant dans les diff?rents domaines concern?s par les traitements automatiques et statistiques de donn?es textuelles. Elles permettent aux participants de pr?senter leurs r?sultats, de confronter leurs outils et leurs exp?riences. Les JADT 2014 r?uniront ? Paris (France), du *3 au 6 juin 2014*, statisticiens, linguistes, sociologues, sp?cialistes de l?analyse du discours ou de la fouille de texte, informaticiens, lexicographes, chercheurs en TAL, etc. Site du colloque : http://jadt.org *Organisation* ERTIM, Inalco (Institut national des langues et civilisations orientales) CLESTHIA-SYLED, Universit? de la Sorbonne nouvelle ? Paris 3 *Th?mes du colloque* La conf?rence sera centr?e sur les applications des mod?les et des outils statistiques dans les domaines suivants : Textom?trie, statistique textuelle Analyse exploratoire de donn?es textuelles Linguistique de corpus et linguistique quantitative Traitement automatique du langage naturel ?tiquetage, lemmatisation, enrichissement linguistique Analyse statistique des donn?es structur?es et non structur?es Classification de textes, cartographie lexicale et textuelle Recherche documentaire, recherche d?informations Fouille de textes, fouille du web, Web s?mantique Stylom?trie, analyse du discours Logiciels pour l?analyse textuelle Apprentissage automatique pour l?analyse des donn?es textuelles Corpus multilingues et corpus parall?les *Dates importantes* Titre et R?sum? (facultatif / max 20 lignes) 1er octobre 2013 Date limite de soumission: Premi?re version (Texte complet) 1er novembre 2013 Notification aux auteurs 1er f?vrier 2014 Date limite d?inscription 1er mars 2014 Date limite de soumission: Derni?re version 1er mars 2014 Atelier corpus multilingues 3 juin 2014 Dates de la conf?rence JADT2014 4-6 juin 2014 *Langues des articles et des pr?sentations* Les propositions de communication, les communications d?finitives et les pr?sentations orales pourront ?tre faites dans les langues suivantes : anglais, fran?ais, italien, espagnol. Toutes les communications devront ?tre pr?c?d?es d?un r?sum? en anglais. *Propositions de communication* JADT 2014 utilise le syst?me EasyChair pour g?rer les propositions de communication. *Soumission* : https://www.easychair.org/conferences/?conf=jadt2014 Les communications finales doivent correspondre au travail qui aura ?t? ?valu? par les relecteurs. Les articles doivent faire le point sur l??tat de l?art du domaine et/ou des r?f?rences ? des travaux ant?rieurs. Dans le cas o? cette mise en perspective n?apparaitrait pas dans la proposition de communication, les auteurs sont invit?s ? en expliquer les raisons. Nous invitons les auteurs ? souligner, dans leur proposition, les liens qui existent entre leur travail et les th?mes de la conf?rence. *Titre et pr?-soumission (facultatif)* Les participants qui d?sirent pr?senter une contribution ou un poster sont invit?s ? envoyer un titre et un r?sum? (maximum 20 lignes) avant le 1er octobre 2013. *Articles* Les auteurs devront fournir la version compl?te de leur contribution avant le 1er novembre 2013. Les articles seront ?valu?s par le comit? scientifique. Le texte complet de la communication ne devra pas exc?der 12 pages, r?f?rences comprises. Le comit? de programme informera les auteurs de sa d?cision d?acceptation et du classement de la communication (communication orale ou poster) le 1er f?vrier 2014. *Version finale* Les auteurs devront fournir la version finale de leur contribution (12 pages maximum) avant le 1er mars 2014, en utilisant la m?me proc?dure de soumission. La version finale sera relue avant ?dition. *Directives pour les auteurs* Anglais : http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-en.doc http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-en.pdf Fran?ais : http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-fr.doc http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-fr.pdf *Contacts* Pour plus d?informations ou pour toute question, ?crivez ? l?adresse suivante : jadt2014 at gmail.com *Comit? d?organisation* Jean-Michel Daube (ERTIM, INALCO) Serge Fleury (SYLED, Sorbonne nouvelle, Paris 3) Marion Ich? (AFTAL) Marguerite Leenhardt (XiKo ? SYLED, Sorbonne nouvelle, Paris 3) Emilie N?e (CEDITEC, Universit? Paris Est Cr?teil, Paris 12) Mathieu Valette (ERTIM, INALCO) *Comit? scientifique* Ram?n ?lvarez Esteban, Univ. de Le?n, Esp Simona Balbi, Univ. de Naples, It Val?rie Beaudouin, Telecom ParisTech, Fr M?nica B?cue, Univ. Polyt. de Catalunya, Esp Sergio Bolasco, Univ. de Rome ?La Sapienza?, It ?tienne Brunet, Univ. de Nice Sophia Antipolis, Fr Lou Burnard, Univ. d? Oxford, RU Isabella Chiari, Univ. de Rome ?La Sapienza?, It Fran?ois Daoust, UQ?M, Montreal, Ca Anne Dister, FUSL et UCL, Bruxelles et Louvain, Be Jules Duchastel, UQ?M, Montreal, Ca Serge Fleury, Univ. Paris 3, Fr C?drick Fairon, UCL, Louvain, Be Luca Giuliano, Univ. de Rome ?La Sapienza?, It Serge Heiden, ENS-LSH, Lyon, Fr Ludovic Lebart, CNRS, ENST, Paris, Fr Jean-Marc Leblanc, Univ. de Cr?teil, Fr Alain Lelu, Univ. de Franche Comt?, Fr Dominique Longr?e, Universit? de Li?ge, Be Pascal Marchand, Univ. de Toulouse, Fr William Martinez, Univ. de Lisboa, Pt Damon Mayaffre, CNRS, Nice, Fr Sylvie Mellet, CNRS, Nice, Fr Denis Moni?re, Univ. de Montr?al, Ca B?n?dicte Pincemin, CNRS, Lyon, Fr G?rald Purnelle, Universit? de Li?ge, Be Max Reinert, CNRS, Univ. de Versailles SQY, Fr Andr? Salem, Univ. Paris 3, Fr Monique Slodzian, Inalco, Fr Arjuna Tuzzi, Univ. de Padoue, It Mathieu Valette, Inalco, Fr Jean-Marie Viprey, Univ. De Franche Comt?, Fr __________________________________________________ *Call for papers* http://tal.univ-paris3.fr/jadt/jadt2014/appels/call-JADT-2014-en.pdf JADT 2014, the 12th International Conference on the Statistical Analysis of Textual Data, will be held in Paris (France) from *3 to 6 June 2014* (organised by ERTIM (Inalco, Institut national des langues et civilisations orientales), CLESTHIA-SYLED (Universit? Sorbonne nouvelle Paris 3)). This biennial conference, which has constantly been gaining importance since it was first held in Barcelona (1990), is open to all scholars and researchers working in the field of textual data analysis, ranging from lexicography to the analysis of political discourse, from information retrieval to marketing research, from computational linguistics to sociolinguistics, from text mining to content analysis. After the success of the previous meetings (http://lexicometrica.univ-paris3.fr/jadt/), the three-day conference in Paris will continue to offer a workshop-style forum through technical paper sessions, invited talks, and panel discussions. The conference website is http://jadt.org *Conference topics* The themes of interest of the conference concern the application of statistical models and tools in the following domains: Textometry, Statistical Analysis of Textual Data Exploratory Textual Data Analysis Corpus and Quantitative Linguistics Natural Language Processing Text Corpus Encoding Statistical Analysis of Unstructured and Structured Data Text Categorisation, Fuzzy Classification and Visualization Information Retrieval and Information Extraction Text Mining, Web Mining, Semantic Web Stylometry, Discourse analysis Software for Textual Data Analysis Machine Learning for Textual Data Analysis Multilingual and parallel corpora *Languages for the papers and the presentations* Submissions, communications and presentations can be made in any one of the following languages: English, French, Italian, Spanish. All communications and presentations must contain an English abstract. *Important dates* Title and Abstract (optional / max 20 lines) October 1st 2013 Submission Deadline: First Version of Paper (Full-text) November 1st 2013 Notification to Authors February 1st 2014 Deadline for registration March 1st 2014 Final Camera-Ready Paper Delivery March 1st 2014 *Workshop Multilingual Corpora June 3 2014 Conference Dates June 4-6 2014 * JADT 2014 uses the EasyChair system to manage submissions. *Submission* : https://www.easychair.org/conferences/?conf=jadt2014 *Title and pre-submission (optional)* Participants interested in presenting a paper for either an oral or poster presentation, should submit title and abstract (maximum 20 lines) by October 1st, 2013. *Papers* The Authors should submit the full paper by November 1st, 2013. The papers will be peer reviewed. The full text of the communication should be 12 pages at the most, including references. Authors will be notified of the Scientific Committee?s decisions on the acceptance of their proposal and on the presentation format (oral communication or poster) by February 1st, 2014. *Final Papers (for Proceedings publication)* The Authors are invited to submit the final accepted version of paper (12 pages) of their contribution by March 1st, 2014, using the same paper?s submission procedure. The final paper will be subject to a final re-reading. * Authors Guidelines* English : http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-en.doc http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-en.pdf French : http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-fr.doc http://tal.univ-paris3.fr/jadt/jadt2014/feuilles-styles/style-jadt2014-fr.pdf *Contacts* For further information or enquiries write to : jadt2014 at gmail.com * Steering committee* Jean-Michel Daube (ERTIM, INALCO) Serge Fleury (SYLED, Sorbonne nouvelle, Paris 3) Marion Ich? (AFTAL) Marguerite Leenhardt (XiKo ? SYLED, Sorbonne nouvelle, Paris 3) Emilie N?e (CEDITEC, Universit? Paris Est Cr?teil, Paris 12) Mathieu Valette (ERTIM, INALCO) *Scientific committee* Ram?n ?lvarez Esteban, Univ. de Le?n, Esp Simona Balbi, Univ. de Naples, It Val?rie Beaudouin, Telecom ParisTech, Fr M?nica B?cue, Univ. Polyt. de Catalunya, Esp Sergio Bolasco, Univ. de Rome ?La Sapienza?, It ?tienne Brunet, Univ. de Nice Sophia Antipolis, Fr Lou Burnard, Univ. d? Oxford, RU Isabella Chiari, Univ. de Rome ?La Sapienza?, It Fran?ois Daoust, UQ?M, Montreal, Ca Anne Dister, FUSL et UCL, Bruxelles et Louvain, Be Jules Duchastel, UQ?M, Montreal, Ca Serge Fleury, Univ. Paris 3, Fr C?drick Fairon, UCL, Louvain, Be Luca Giuliano, Univ. de Rome ?La Sapienza?, It Serge Heiden, ENS-LSH, Lyon, Fr Ludovic Lebart, CNRS, ENST, Paris, Fr Jean-Marc Leblanc, Univ. de Cr?teil, Fr Alain Lelu, Univ. de Franche Comt?, Fr Dominique Longr?e, Universit? de Li?ge, Be Pascal Marchand, Univ. de Toulouse, Fr William Martinez, Po Damon Mayaffre, CNRS, Nice, Fr Sylvie Mellet, CNRS, Nice, Fr Denis Moni?re, Univ. de Montr?al, Ca B?n?dicte Pincemin, CNRS, Lyon, Fr G?rald Purnelle, Universit? de Li?ge, Be Max Reinert, CNRS, Univ. de Versailles SQY, Fr Andr? Salem, Univ. Paris 3, Fr Monique Slodzian, Inalco, Fr Arjuna Tuzzi, Univ. de Padoue, It Mathieu Valette, Inalco, Fr Jean-Marie Viprey, Univ. De Franche Comt?, Fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:40:07 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:40:07 +0200 Subject: Appel: Deadline extension, Special issue of the ITL journal on readability and text simplification Message-ID: Date: Mon, 24 Jun 2013 13:44:49 +0200 From: Delphine Bernhard Message-ID: <51C83131.7020208 at unistra.fr> X-url: http://poj.peeters-leuven.be/content.php?url=journal&journal_code=itl X-url: http://itl-sirs.sciencesconf.org/ **** EXTENDED DEADLINE: July 15 **** ############################################################# Call for papers "Current research in readability and text simplification" A special issue of the International Journal of Applied Linguistics (ITL) (http://poj.peeters-leuven.be/content.php?url=journal&journal_code=itl) ############################################################# With the rapid growth of the number of online documents, Internet has become a formidable source of information. However, most of the reliable websites are intended for rather experienced readers and can present comprehension difficulties for certain types of readers, such as children, learners of a foreign language, or readers with language deficits. To offer those kind of readers a better access to information, two strategies based on natural language processing (NLP) have been investigated in recent years: readability and text simplification. Readability includes a range of methods targeted at the automatic evaluation of text difficulty in relation to a given population of readers. Throughout the 20th century, various readability formulas have been developped (Dale and Chall, 1948; Flesch, 1948 ; Fry, 1968). They have been recently enhanced using various contributions from NLP, such as language models (Collins-Thompson, 2005, Schwarm and Ostendorf, 2005 ; Heilman et al., 2007, ...), various aspects of discourse (Pitler and Nenkova, 2008; Feng et al., 2010) or multiword expressions (Watrin and Fran?ois, 2011). Moreover, criteria identified by researchers in psycholinguistics or language acquisition are increasingly taken into account. These formulas have also been used within web platforms, such as Read-X (Miltsakaki, 2009) or REAP (Collins-Thompson and Callan, 2004), to help readers find on the web documents matching their level. However, it is sometimes the case that, for a given topic, there are no target documents suitable for a specific user. In this context, automatic text simplification has appeared as a possible way to make existing texts accessible to poorer readers that would normally have trouble processing them. Automatic text simplification indeed aims at generating a simplified version of an input text. Two main types of automatic simplification methods can be distinguished : (i) lexical simplification, which aims at replacing complex words or expressions with simpler synonyms or paraphrases and (ii) syntactic simplification, which modifies the structure of sentences, by deleting, moving or replacing difficult syntactic structures. In recent years, methods for automatic simplification have been largely influenced by other domains of NLP. Lexical simplification, as it consists in finding a suitable synonym or paraphrase for a complex expression, is closely related to the task of lexical substitution, which, in turn, is related to Word Sense Disambiguation (Specia et al., 2012). Statistical Machine Translation methods have also influenced text simplification, as large comparable corpora such as Wikipedia and the Simple English Wikipedia have become available (Zhu et al., 2010 ; Wubben et al., 2012 ; ...). This special issue will therefore address these two areas of increasing importance, with a focus on systems informed by research on language acquisition or used in the context of computer-assisted language learning (CALL). To be more specific, all following contributions are suitable for publication (the list is not exclusive): - readability formulas for L1 or for L2 including some NLP components - readability formulas taking into account some characteristics of a specific population of learners (such as readers with a given L1, etc.) - NLP approaches of text understandability. - lexical, syntactic, or semantic approaches of text simplification in the context of CALL. - contributions of readability to text simplification - tools or techniques providing a more detailed difficulty diagnosis for users (e.g. difficult words or syntactic structures). All contributions should explicitly discuss how they relate to current research in language acquisition, educational linguistics or computer-assisted language learning. MAIN DATES - submission deadline: July 15, 2013 - first notification: August, 31, 2013 - submission of the revised version: October 31, 2013 - final version: December 31, 2013 - publication: 2014 (to be detailed) Papers should be submitted in Word format through the following web site : http://itl-sirs.sciencesconf.org/ Recommendations for authors are available at http://itl-sirs.sciencesconf.org/resource/page/id/1 GUEST EDITORS Thomas Fran?ois (Universit? catholique de Louvain, Belgium) Delphine Bernhard (Universit? de Strasbourg, France) SCIENTIFIC COMMITTEE Kevyn Collins-Thompson (Microsoft Research) Piet Desmet (Katholieke Universiteit Leuven) C?drick Fairon (Universit? catholique de Louvain) Lijun Feng (Standard& Poor's) Michael Heilman (Educational Testing Service) V?ronique Hoste (Hogeschool Gent) Matt Huernerfauth (City University of New York) Anne-Laure Ligozat (LIMSI-CNRS, Orsay) Annie Louis (University of Pennsylvania Aur?lien Max (LIMSI-CNRS, Orsay) Eleni Miltsakaki (University of Pennsylvania) Ruslan Mitkov (University of Wolverhampton) Marie-Francine Moens (Katholieke Universiteit Leuven) Emily Pitler (University of Pennsylvania) Horacio Saggion (Universitat Pompeu Fabra, Barcelona) Advaith Siddhartan (University of Aberdeen) Lucia Specia (University of Sheffield) Kristian Woodsend (University of Edinburgh) Sander Wubben (Tilburg University) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:43:51 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:43:51 +0200 Subject: Seminaire: Alpage, Teresa Lynn, The Irish dependency treebank develop, 2 juillet 2013, Paris Message-ID: Date: Mon, 24 Jun 2013 17:50:37 +0200 From: Marie Candito Message-ID: ************** S?minaire de l'?quipe Alpage ********* Il s'agit du s?minaire de recherche en linguistique informatique organis? par l'?quipe Alpage, ?quipe mixte INRIA - Paris Diderot, sp?cialis?e en analyse syntaxique automatique et en traitement du discours. *Le prochain s?minaire se tiendra exceptionnellement : MARDI 2 JUILLET de 11h ? 12h30, en salle 265* B?timent Olympe de Gouges rue Albert Einstein 75013 Paris (dernier b?timent de la rue Albert Einstein, num?ro non attribu?...) Toute personne int?ress?e est la bienvenue. ********************************************************** Teresa Lynn (Dublin University and Macquarie University) Title : The Irish dependency treebank development Abstract : In this talk I will discuss the ongoing development of the Irish dependency treebank. Irish is an Indo-European language and shares linguistic features with other Celtic languages such as rich morphology and VSO word order. Irish is a minority language of the EU. It is regarded as a low-density language in terms of NLP resources. My PhD research involves the development of the first treebank and statistical parser for Irish. I will discuss details such as the significance of Inter-annotator Agreement, preliminary parsing experiments and the analysis of a bootstrapping approach to the treebank development. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:45:00 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:45:00 +0200 Subject: These: Estelle Delpech, Traduction assistee par ordinateur et corpus comparables Message-ID: Date: Mon, 24 Jun 2013 23:10:13 +0200 (CEST) From: "Estelle DELPECH" Message-ID: <5b7a3b6870e73c2108fdb4db6792c01c.squirrel at webmail.univ-nantes.fr> Bonjour, J'ai le plaisir de vous inviter ? la soutenance de mon travail de th?se r?alis? au sein du Laboratoire d'Informatique de Nantes Atlantique (LINA) et intitul? : "Traduction assist?e par ordinateur et corpus comparables - contributions ? la traduction compositionnelle". La soutenance aura lieu le mardi 2 juillet 2013 ? 14h00 dans la salle 3 du LINA. Vous ?tes ?galement convi?-e-s au pot de th?se qui suivra. Bien cordialement, Estelle Delpech ----- Composition du jury : - Nabil Hathout, Directeur de recherches, CNRS (Examinateur) - ?lisabeth Lavault-Oll?an, Professeure, Universit? Stendhal Grenoble 3 (Rapporteur) - Michel Simard, Senior Research Officer, Centre National de Recherche du Canada (Rapporteur) - B?atrice Daille, Professeure, Universit? de Nantes (Directrice de th?se) - Emmanuel Morin, Professeur, Universit? de Nantes (Co-directeur de th?se) - Emmanuel Planas, Ma?tre de conf?rences, Universit? Catholique de l?Ouest (Invit?) ----- R?sum? : Notre travail concerne l?extraction de lexiques bilingues ? partir de corpus comparables, avec une application ? la traduction sp?cialis?e. Nous avons d?abord ?valu? les m?thodes classiques d?acquisition de lexiques en corpus comparables (bas?es sur l?hypoth?se distributionnelle : plus deux termes apparaissent dans des contextes similaires, plus il y a de chances qu?ils soient des traductions) d?un point de vue applicatif. L??valuation a montr? que les traducteurs sont mal ? l?aise avec les lexiques extraits : la traduction correcte est trop souvent noy?e dans une liste de traductions candidates et ils pr?f?reraient utiliser un lexique plus petit mais plus pr?cis. Partant de ce constat, nous nous sommes orient?s vers une autre approche qui a fait r?cemment ses preuves pour l?exploitation des corpus comparables et produit des lexiques plus adapt?s aux besoins des traducteurs : la traduction compositionnelle (la traduction du terme source est fonction de la traduction de ses parties). Nous nous sommes concentr?s sur la traduction d?unit?s monolexicales : le terme source est d?coup? en morph?mes, les morph?mes sont traduits puis recompos?s en un terme cible. Dans ce cadre, nous avons poursuivi trois axes de recherche : la g?n?ration de traductions fertiles (cas o? le terme cible contient plus de mots lexicaux que le terme source), l?ind?pendance aux structures morphologiques et l?ordonnancement des traductions candidates. Mots-cl?s : traduction assist?e par ordinateur, corpus comparables, compositionnalit?, learning-to-rank, ?valuation centr?e utilisateur, morphologie computationnelle. ----- Abstract: Our work deals with the extraction of bilingual lexicons from comparable corpora with an application to specialized translation. We started by evaluating classical methods based on the distributional hypothesis (the more two terms appear in similar contexts, the more likely they are translations of each other) in a user-oriented fashion. This evaluation raised the fact that translators feel very uncomfortable with this kind of lexicon: they feel correct translations are uneasy to spot in the lists of candidate translations and would rather use a smaller lexicon but with higher precision rates. Based on this observation, we turned to another approach for term translation which has been recently and successfully experimented on comparable corpora and produce lexicons that meet the demands of the translators: compositional translation. In this framework, the translation of a term is composed of the translation of its parts. We concentrated on the translation of monolexical terms: the source term is decomposed into morphemes, morphemes are translated into the target language and recomposed as a target term. We investigated three lines of research: generation of fertile translations (cases in which the target term has more lexical words than the source term), independence to morphological structure and candidate translation ranking. Keywords : computer-aided translation, comparable corpora, compositionality, learningto- rank, user-centered evaluation, computational morphology ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:41:35 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:41:35 +0200 Subject: Job: Ingenieur, 24 mois, Constitution de corpus de langues rares Message-ID: Date: Mon, 24 Jun 2013 14:32:55 +0200 From: guillaume at vjf.cnrs.fr Message-ID: <34a4891e59c5dd9ee90c5548b0dcae08.squirrel at www.vjf.cnrs.fr> X-url: http://himalco.hypotheses.org/ X-url: http://lacito.vjf.cnrs.fr/archivage/index.htm Profil de poste : CDD de 24 mois au laboratoire LACITO-CNRS Niveau : Ing?nieur d??tudes Contribution ? la constitution de corpus de langues rares : textes et dictionnaires en ligne CONTEXTE : Le projet HimalCo, financ? par l?Agence Nationale de la Recherche (2013-2015), porte sur la constitution et l?exploitation de corpus pour dix langues ? tradition orale. Les corpus sont compos?s de ressources sonores (enregistrements audio), textuelles (transcription, annotations) ainsi que de donn?es lexicales (dictionnaires et enregistrements de mots) : http://himalco.hypotheses.org/ Les corpus et les outils issus du projet HimalCo iront ? terme alimenter la plateforme de la collection Pangloss qui regroupe elle-m?me plus de 70 corpus de langues rares : http://lacito.vjf.cnrs.fr/archivage/index.htm MISSIONS : La personne recrut?e en CDD travaillera en ?troite collaboration avec l?ing?nieur responsable de la Collection Pangloss et participant au projet HimalCo. Elle devra rapidement faire preuve d?autonomie dans la r?alisation des t?ches qui lui sont confi?es. Les t?ches ? effectuer pour le projet sont diverses. Voici une liste non exhaustive : - traitement et mise en forme des corpus : suivi des t?ches, gestion des contacts avec les d?posants, alignement texte/son, pr?paration et v?rification de m?tadonn?es... - d?p?t de documents ? l?archivage p?renne et mise ? jour des pages web correspondantes sur le site de la Collection Pangloss - d?veloppement de fonctionnalit?s en ligne pour la consultation des textes parall?les et des dictionnaires - d?veloppement d?outils et mise ? jour d?outils existants pour la mise en forme, la diffusion et la recherche dans les corpus - dialogue avec les partenaires de la Collection Pangloss - d?ploiement d?un outil logiciel de suivi des t?ches (de la prise de contact initiale jusqu?au d?p?t final) si le temps n?cessaire peut ?tre d?gag? COMPETENCES : - Connaissances en structuration de donn?es textuelles (HTML, XML, XSL) et sonores (wav). - PHP - Perl - Java souhait? Capacit? d??coute pour comprendre les besoins et les pratiques des linguistes. Une exp?rience de l??tude et/ou du traitement de donn?es linguistiques serait un plus. DUREE ET DATES : La dur?e totale du contrat est de 24 mois. Les dates pr?vues sont : de novembre 2013 ? octobre 2015 inclus. La date de d?but peut ?tre avanc?e ? septembre ou octobre 2013 si la personne recrut?e le souhaite. Aucun engagement ne peut ?tre pris concernant une prolongation du contrat au-del? de 24 mois : les possibilit?s sont soumises aux contingences des futurs Appels ? projets de recherche (pour les CDD) et des cr?ations de poste (pour les CDI). Contact : guillaume at vjf.cnrs.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:45:58 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:45:58 +0200 Subject: Conf: PFIA, 1 au 5 juillet 2013, Lille Message-ID: Date: Tue, 25 Jun 2013 08:17:55 +0200 From: Maxime MORGE Message-ID: <51C93613.7050208 at univ-lille1.fr> X-url: http://pfia2013.univ-lille1.fr Nos excuses pour les r?ceptions multiples. Ne pas h?siter ? diffuser. PLATE-FORME INTELLIGENCE ARTIFICIELLE 2013 1-5 juillet 2013 Lille http://pfia2013.univ-lille1.fr Vous ?tes cordialement invit?(e)s ? participer ? la Plate-Forme IA (PFIA) organis?e en 2013 ? Lille sur le campus de Villeneuve d'Ascq. Sous l'?gide de l'AFIA, la plate-forme a pour objectif de r?unir chercheurs, industriels et ?tudiants autour de conf?rences et d'ateliers consacr?s ? l'Intelligence Artificielle. Elle accueille cinq conf?rences invit?es : http://pfia2013.univ-lille1.fr/doku.php?id=fr:invite * Serge Abiteboul (INRIA Saclay) From data and information to knowledge: the Web of tomorrow * Antoine Bordes (CNRS Compi?gne) Traiter de grandes masses de donn?es relationnelles gr?ce ? l'apprentissage automatique. * Hans van Ditmarsch (CNRS Nancy) Awareness and Knowledge * Joelle Pineau (Universit? McGill ? Montr?al) L'apprentissage automatique au service de la robotique sociale * Franco Zambonelli (Universit? de Mod?ne et d'?milie-Romagne) Engineering Socio-technical Urban Superorganisms La Plate-Forme IA h?berge les six conf?rences suivantes : * Conf?rence d'Apprentissage (CAp) * Journ?es francophones d'Ing?nierie des Connaissances (IC) * Journ?es Francophones Planification, D?cision, et Apprentissage pour la conduite de syst?mes (JFPDA) * Journ?es Francophones sur les Syst?mes Multi-Agents (JFSMA) * Journ?es francophones sur les Mod?les Formels de l'Interaction (MFI) * Rencontres des Jeunes Chercheurs en Intelligence Artificielle (RJCIA) La Plate-Forme IA int?gre par ailleurs 9 ateliers th?matiques repr?sentatifs des th?mes port?s par les conf?rences : http://pfia2013.univ-lille1.fr/doku.php?id=fr:ateliers ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:49:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:49:31 +0200 Subject: These: Fran=?ISO-8859-1?Q?=E7ois_?=Morlane-Hondere, Evaluation des ressources extraites par analyse distributionnelle automatique Message-ID: Date: Tue, 25 Jun 2013 12:04:31 +0200 From: Fran?ois Morlane-Hond?re Message-ID: X-url: http://w3.erss.univ-tlse2.fr/membre/morlane/ Bonjour, J'ai le plaisir de vous convier ? la soutenance de ma th?se, qui s'intitule "Une approche linguistique de l'?valuation des ressources extraites par analyse distributionnelle automatique". Cette soutenance aura lieu le mercredi 10 juillet 2013 ? 14h ? la salle D29 de la Maison de la Recherche, ? l'Universit? Toulouse II Le Mirail. Elle sera suivie du traditionnel pot de th?se auquel vous ?tes chaleureusement convi?s. Bien cordialement, Fran?ois Morlane-Hond?re ----- Composition du jury : Pierre-Andr? Buvet - Ma?tre de conf?rences HDR, Universit? Paris 13/LDI (examinateur) B?atrice Daille - Professeur, Universit? de Nantes/LINA (rapporteur) C?cile Fabre - Professeur, Universit? de Toulouse II/CLLE-ERSS (directrice) Nabil Hathout - Directeur de recherche, CNRS et Universit? de Toulouse II/CLLE-ERSS (examinateur) Alain Polgu?re - Professeur, Universit? de Lorraine/ATILF (rapporteur) ----- R?sum? : Dans cette th?se, nous abordons du point de vue linguistique la question de l'?valuation des bases lexicales extraites par analyse distributionnelle automatique (ADA). Les m?thodes d'?valuation de ces ressources qui sont actuellement mises en oeuvre (comparaison ? des lexiques de r?f?rence, ?valuation par la t?che, test du TOEFL...) rel?vent en effet d'une approche quantitative des donn?es qui ne laisse que peu de place ? l'interpr?tation des rapprochements g?n?r?s. De ce fait, les conditions qui font que certains couples de mots sont extraits alors que d'autres ne le sont pas restent mal connues. Notre travail vise une meilleure compr?hension des fonctionnements en corpus qui r?gissent les rapprochements distributionnels. Pour cela, nous avons dans un premier temps adopt? une approche quantitative qui a consist? ? comparer plusieurs ressources distributionnelles calcul?es sur des corpus diff?rents ? des lexiques de r?f?rences (le Dictionnaire ?lectronique des synonymes du CRISCO et le r?seau lexical JeuxDeMots). Cette ?tape nous a permis, premi?rement, d'avoir une estimation globale du contenu de nos ressources, et, deuxi?mement, de s?lectionner des ?chantillons de couples de mots ? ?tudier d'un point de vue qualitatif. Cette deuxi?me ?tape constitue le coeur de la th?se. Nous avons choisi de nous focaliser sur les relations lexico-s?mantiques que sont la synonymie, l'antonymie, l'hyperonymie et la m?ronymie, que nous abordons en mettant en place quatre protocoles diff?rents. En nous appuyant sur les relations contenues dans les lexiques de r?f?rence, nous avons compar? les propri?t?s distributionnelles des couples de synonymes/antonymes/hyperonymes/m?ronymes qui ont ?t? extraits par l'ADA avec celles des couples qui ne l'ont pas ?t?. Nous mettons ainsi au jour plusieurs ph?nom?nes qui favorisent ou bloquent la substituabilit? des couples de mots (donc leur extraction par l'ADA). Ces ph?nom?nes sont consid?r?s au regard de param?tres comme la nature du corpus qui a permis de g?n?rer les bases distributionnelles ?tudi?es (corpus encyclop?dique, journalistique ou litt?raire) ou les limites des lexiques de r?f?rence. Ainsi, en m?me temps qu'il questionne les m?thodes d'?valuation des bases distributionnelles actuellement employ?es, ce travail de th?se illustre l'int?r?t qu'il y a ? consid?rer ces ressources comme des objets d'?tudes linguistiques ? part enti?re. Les bases distributionnelles sont en effet le r?sultat d'une mise en oeuvre ? grande ?chelle du principe de substituabilit?, ce qui en fait un mat?riau de choix pour la description des relations lexico-s?mantiques. Fran?ois Morlane-Hond?re Doctorant contractuel Universit? Toulouse II - Le Mirail Laboratoire CLLE-ERSS (UMR 5263) & D?partement de Sciences du Langage http://w3.erss.univ-tlse2.fr/membre/morlane/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:48:09 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:48:09 +0200 Subject: Conf: SIIM'13, PFIA, Lille, 1er juillet 2013 Message-ID: Date: Tue, 25 Jun 2013 11:01:02 +0200 From: Lina Soualmia Message-ID: X-url: http://www.irit.fr/SIIM/2013/ La 2?me ?dition du Symposium sur l'Ing?nierie de l'Information M?dicale aura lieu le 1er juillet ? Lille Elle est associ?e aux 24?mes journ?es francophones d'Ing?nierie des Connaissances au sein de la Plateforme pour l'IA Site web : http://www.irit.fr/SIIM/2013/ ****************************** Pr?sentation ---------------- SIIM 2013 est la seconde ?dition du Symposium sur l?ing?nierie de l?information m?dicale qui r?unit les communaut?s en informatique m?dicale, des syst?mes d'information et de gestion de la connaissance en ciblant des probl?matiques li?es ? l?ing?nierie de l?information m?dicale. L'?dition inaugurale a eu lieu en 2011 ? Toulouse ( http://www.irit.fr/SIIM/2011/index.php) et a ?merg? des journ?es ayant eu lieu ? Rennes en 2003, Rouen en 2004 et de l?atelier qui s?est d?roul? ? N?mes en 2010 autour du web s?mantique m?dical ( http://www-limbio.smbh.univ-paris13.fr/wsm10/). Son objectif majeur est de d?battre des verrous li?s ? la mod?lisation, la structuration, l?extraction, la recherche et la fouille d?informations de tous types et de questions connexes et ce, ? travers la pr?sentation des activit?s de recherche innovantes, des techniques, des technologies et de d?monstrateurs d?velopp?s aussi bien dans le monde acad?mique, dans les laboratoires affili?s aux structures de sant? et par des industriels impliqu?s dans le domaine de l?ing?nierie de l?information qui couvre la mod?lisation, la structuration, l?extraction, la recherche et la fouille d?informations de tous types : structur?e sous forme de donn?e, semi-structur?e ou non structur?e sous forme de texte, d?image, de son, ...etc. Le symposium SIIM cible un public de jeunes chercheurs, chercheurs et industriels impliqu?s dans le domaine de l?usage de l?information m?dicale depuis sa production jusqu?? sa valorisation. Programme : -------------------- Pour plus de d?tails sur le programme : http://www.irit.fr/SIIM/2013/programme.php Th?mes ---------- - Terminologies et Ontologies m?dicales : Interop?rabilit? des syst?mes d?information en sant?, indexation terminologique de la litt?rature m?dicale, de dossiers m?dicaux de patients et de r?cits cliniques, annotations de documents, formalismes de repr?sentation, alignement d?ontologies et de terminologies. - Usage du Web 2.0 en sant? : R?seaux collaboratifs des praticiens de sant?, patients et famille, r?seaux bibliographiques dans le domaine m?dical, annotation sociale de ressources m?dicales. - Traitement d'informations multimodales : Traitement du texte, image et son, classification et int?gration de contenus m?dicaux multimodaux, multi-sources - Extraction de l?information et de connaissances ? partir de contenus m?dicaux : Anonymisation, extraction d?entit?s nomm?es, de variable et/ou indicateurs pathologiques, recherche de corr?lations, fouille de donn?es - Syst?mes d'informations en sant? : Repr?sentation, traitement et acc?s aux informations et des connaissances en sant?, syst?mes d?information d?cisionnels de sant?, gestion des dossiers m?dicaux de patients, personnalisation et sant? Inscriptions : --------------------- Cette ann?e, l'?dition de SIIM est int?gr?e au sein de la plateforme de l'Intelligence Artificielle, les inscriptions sont donc centralis?es. Pour plus de d?tails : http://pfia2013.univ-lille1.fr/ Organisateurs: ------------------- TAMINE LECHANI Lynda, IRIT, Toulouse SOUALMIA Lina, LITIS, Rouen Comit? d'initiative : ---------------------- CHARLET Jean Charlet, ICS, INSERM, Paris JAULENT Marie-Christine, ICS, INSERM, Paris LUENGO Vanda, LIG, Grenoble SOUALMIA Lina, LITIS, Rouen SOUF Nathalie, IRIT, Toulouse TAMINE LECHANI Lynda, IRIT, Toulouse Comit? de Programme : --------------------------- Brigitte Grau, LIMSI, Paris Orsay Catherine Berrut, LIG, Grenoble Fleur Mougin, ISPED, Universit? Bordeaux 2 Jean Charlet, ICS, INSERM, Paris Lina Soualmia, LITIS, Rouen Lynda Tamine Lechani, IRIT, Toulouse Marie-Christine Jaulent, ICS, INSERM, Paris Natalia Grabar, STL, Lille Nathalie Souf, IRIT, Toulouse Sandra Bringay, LIRMM, Universit? Montpellier 2 Vanda Luengo, LIG, Grenoble Pierre Zweigenbaum, LIMSI, Paris Orsay ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:46:47 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:46:47 +0200 Subject: Appel: revue TAL - Note de lecture (DEBAISIEUX) Message-ID: Date: Tue, 25 Jun 2013 10:52:20 +0200 (CEST) From: Denis Maurel Message-ID: <1051527772.19943070.1372150340205.JavaMail.root at mail10> La revue TAL publie r?guli?rement des notes de lecture. Nous recherchons un coll?gue souhaitant lire le livre: "Jeanne-Marie DEBAISIEUX. Analyses linguistiques sur corpus. Subordination et insubordination en fran?ais. Herm?s-Lavoisier. 2013. 503 pages" et pr?t ? en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoy? gracieusement en ?change du service rendu). Cette note de lecture doit ?tre r?dig?e en fran?ais (trois pages maximum, au format de la revue) et envoy?e fin ao?t 2013. D'autres compte-rendu sont possibles si vous avez lu r?cemment un ouvrage qui vous a int?ress? et si vous ?tes pr?t ? partager votre lecture avec la communaut?... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:52:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:52:55 +0200 Subject: These: ERRATUM, Soutenance Enrique Henestroza Anguiano a 14h30 et pas 15h Message-ID: Date: Tue, 25 Jun 2013 19:29:10 +0200 From: Enrique Henestroza Anguiano Message-ID: Bonjour, Veuillez noter qu'une erreur s'est gliss?e dans mon annonce : la soutenance de ma th?se d?butera ? *14h30* et pas 15h le 27 juin. Je vous prie de m'excuser pour la g?ne occasionn?e. Enrique ------------------------------------------------------------------------ Bonjour, J'ai le plaisir de vous inviter ? ma soutenance de th?se, qui s'intitule : "Efficient Large-Context Dependency Parsing and Correction with Distributional Lexical Resources". La soutenance aura lieu le jeudi 27 juin, ? 15h, en salle 147 (1er ?tage) du b?timent Olympe de Gouges 8 rue Albert Einstein, 75013 Paris de l'Universit? Paris Diderot. Vous ?tes ?galement cordialement invit?s au pot qui suivra. Bien cordialement, Enrique Henestroza Anguiano ----- Composition du jury : Bernd Bohnet, University of Birmingham (examinateur) Marie Candito, Universit? Paris Diderot (co-directrice de th?se) Matthieu Constant, Universit? Paris-Est (rapporteur) Laurence Danlos, Universit? Paris Diderot (directrice de th?se) Alexis Nasr, Universit? Aix Marseille (co-directeur de th?se) Joakim Nivre, Uppsala University (rapporteur) ----- R?sum? : Cette th?se pr?sente des m?thodes pour am?liorer l'analyse syntaxique probabiliste en d?pendances. Nous employons l'analyse ? base de transitions avec une mod?lisation effectu?e par des machines ? vecteurs supports (Cortes and Vapnik, 1995), et nos exp?riences sont r?alis?es sur le fran?ais. L'analyse a base de transitions est rapide, de par la faible complexit? des algorithmes sous-jacents, eux m?mes fond?s sur une optimisation locale des d?cisions d'attachement. Ainsi notre premier fil directeur est d'?largir le contexte syntaxique utilis?. Partant du syst?me de transitions arc-eager (Nivre, 2008), nous proposons une variante qui consid?re simultan?ment plusieurs gouverneurs candidats pour les attachements ? droite. Nous testons aussi la correction des analyses, inspir?e par Hall and Nov?k (2005), qui r?vise chaque attachement en choisissant parmi plusieurs gouverneurs alternatifs dans le voisinage syntaxique. Nos approches am?liorent l?g?rement la pr?cision globale ainsi que celles de l'attachement des groupes pr?positionnels et de la coordination. Notre deuxi?me fil explore des approches semi-supervis?es. Nous testons l'auto-entrainement avec un analyseur en deux ?tapes, bas? sur McClosky et al. (2006), pour le domaine journalistique ainsi que pour l'adaptation au domaine m?dical. Nous passons ensuite ? la mod?lisation lexicale ? base de corpus, avec des classes lexicales g?n?ralis?es pour r?duire la dispersion des donn?es, et des pr?f?rences lexicales de l'attachement des groupes pr?positionnels pour aider ? la d?sambigu?sation. Nos approches am?liorent dans certains cas la pr?cision et la couverture de l'analyseur, sans augmenter sa complexit? th?orique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 26 10:51:43 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 26 Jun 2013 12:51:43 +0200 Subject: Job: Research Fellow, Computational / Corpus Linguistics, University of University of Nottingham Message-ID: Date: Tue, 25 Jun 2013 11:43:21 +0000 From: "Rayson, Paul" Message-ID: <7D5C3FC73E33024E9EF70607229B05CC4871CD at EX-0-MB1.lancs.local> X-url: http://www.nottingham.ac.uk/cral X-url: http://www.nottingham.ac.uk/jobs/currentvacancies/ref/ARTS12705 ***** Research Fellow (fixed-term), 2 years, University of Nottingham, UK Closing date: Tuesday, 16th July 2013 Salary: ?27854 to ?36298 per annum, depending on skills and experience, salary progression beyond this scale is subject to performance The Research Fellow will be part of the AHRC-funded project 'CLiC Dickens characterisation in the representation of speech and body language from a corpus stylistic perspective' under the direction of Professor Michaela Mahlberg and Professor Peter Stockwell. The post will be based in the Centre for Research in Applied Linguistics within the School of English (http://www.nottingham.ac.uk/cral). Candidates should have a first degree (or equivalent) in computer science, linguistics, language and literature, or other subject as appropriate and a PhD (or equivalent) in corpus linguistics (with emphasis on programming), computational linguistics or other subject as appropriate. They should also be able to demonstrate programming experience, experience in the development of (interactive) web interfaces and an interest in corpus linguistics and literature. The project will build on previous research that developed a prototype of the search program CLiC (Corpus Linguistics in Cheshire). The post holder will be responsible for the technical development of CLiC, assist Professor Mahlberg and Professor Stockwell with analytical tasks (with the aim to produce co-authored publications), act as main contact for an international end-user panel and will be involved in impact activities. The successful candidate will receive an induction that includes contributions from the University?s Web Technologies team. The interview process will include a short presentation on a task relevant to the post, and a formal interview. Informal enquiries may be addressed to Michaela Mahlberg (michaela.mahlberg at nottingham.ac.uk) Please note that applications sent directly to this email address will not be accepted. For further information please visit http://www.nottingham.ac.uk/jobs/currentvacancies/ref/ARTS12705 Date for interviews: Wed 24 July 2013 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:18:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:18:24 +0200 Subject: Ecole: SSTiC 2013, Tarragona, Spain, July 22-26, 2013 Message-ID: Date: Sat, 29 Jun 2013 16:51:54 +0200 From: "GRLMC" Message-ID: <9B7583D41ABC4212B1FFE856677A2B8D at Carlos1> X-url: http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* 2013 INTERNATIONAL SUMMER SCHOOL ON TRENDS IN COMPUTING SSTiC 2013 Tarragona, Spain July 22-26, 2013 Organized by Rovira i Virgili University http://grammars.grlmc.com/SSTiC2013/ ********************************************************************* AIM: SSTiC 2013 will be an open forum for the convergence of top class well recognized computer scientists and people at the beginning of their research career (typically PhD students) as well as consolidated researchers. SSTiC 2013 will cover the whole spectrum of computer science by means of 54 six-hour courses dealing with hot topics at the frontiers of the field. By actively participating, lecturers and attendees will share the idea of scientific excellence as the main motto of their research work. ADDRESSED TO: Graduate students from around the world. There are no pre-requisites in terms of the academic degree the attendee must hold. However, since there will be several levels among the courses, in the description of some of them reference may be made to specific knowledge background. SSTiC 2013 is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. Finally, senior researchers will find it fruitful to listen and discuss with people who are main references of the diverse branches of computing nowadays. REGIME: 6 parallel sessions will be held during the whole event. Participants will be able to freely choose the courses they will be willing to attend as well as to move from one to another. VENUE: Campus Catalunya Universitat Rovira i Virgili Av. Catalunya, 35 43002 Tarragona COURSES AND PROFESSORS: Shun-ichi Amari (Riken) [introductory] Information Geometry and Its Applications James Anderson (Chapel Hill) [intermediate] Scheduling and Synchronization in Real-Time Multicore Systems Pierre Baldi (Irvine) [intermediate] Big Data Informatics Challenges and Opportunities in the Life Sciences Yoshua Bengio (Montr?al) [introductory/intermediate] Deep Learning of Representations Stephen Brewster (Glasgow) [advanced] Multimodal Human-Computer Interaction Bruno Buchberger (Linz) [introductory] Groebner Bases: An Algorithmic Method for Multivariate Polynomial Systems. Foundations and Applications Rajkumar Buyya (Melbourne) [intermediate] Cloud Computing Jan Camenisch (IBM Zurich) [intermediate] Cryptography for Privacy Larry S. Davis (College Park) [intermediate] Video Analysis of Human Activities Paul De Bra (Eindhoven) [intermediate] Adaptive Systems Paul Dourish (Irvine) [introductory] Ubiquitous Computing in a Social Context Max J. Egenhofer (Maine) [introductory/intermediate] Qualitative Spatial Relations: Formalizations and Inferences Richard M. Fujimoto (Georgia Tech) [introductory] Parallel and Distributed Simulation David Garlan (Carnegie Mellon) [advanced] Software Architecture: Past, Present and Future Mario Gerla (Los Angeles) [intermediate] Vehicle Cloud Computing Ralph Grishman (New York) [intermediate] Information Extraction from Natural Language Francisco Herrera (Granada) [intermediate] Imbalanced Classification: Current Approaches and Open Problems Paul Hudak (Yale) [introductory] Euterpea: From Signals to Symphonies Using Haskell Niraj K. Jha (Princeton) [intermediate] FinFET Circuit Design George Karypis (Minnesota) [introductory] Introduction to Parallel Computing: Architectures, Algorithms, and Programming Aggelos K. Katsaggelos (Northwestern) [intermediate/advanced] Sparsity-based Advances in Image Processing Arie E. Kaufman (Stony Brook) [advanced] Advances in Visualization Hugo Krawczyk (IBM Research) [intermediate] An Introduction to the Design and Analysis of Authenticated Key Exchange Protocols Pierre L'Ecuyer (Montr?al) [intermediate] Quasi-Monte Carlo Methods in Simulation: Theory and Practice Laks Lakshmanan (British Columbia) [intermediate/advanced] Information and Influence Spread in Social Networks Wenke Lee (Georgia Tech) [introductory] DNS-based Monitoring of Malware Activities Maurizio Lenzerini (Roma La Sapienza) [intermediate] Ontology-based Data Integration Ming C. Lin (Chapel Hill) [introductory/intermediate] Physically-based Modeling and Simulation Jane W.S. Liu (Academia Sinica) [intermediate] Critical Information and Communication Technologies for Disaster Preparedness and Response Satoru Miyano (Tokyo) [intermediate] How to Hack Cancer Systems with Computational Methods Aloysius K. Mok (Austin) [intermediate] From Real-time Systems to Cyber-physical Systems Hermann Ney (Aachen) [intermediate/advanced] Probabilistic Modelling for Natural Language Processing - with Applications to Speech Recognition, Handwriting Recognition and Machine Translation Cathleen A. Norris (North Texas) & Elliot Soloway (Ann Arbor) [introductory] Primary & Secondary Educational Computing in the Age of Mobilism Jeff Offutt (George Mason) [intermediate] Cutting Edge Research in Engineering of Web Applications Bijan Parsia (Manchester) [introductory] The Semantic Web: Conceptual and Technical Foundations Charles E. Perkins (FutureWei) [intermediate/advanced] Beyond 4G Prabhakar Raghavan (Google) [introductory/intermediate] Web Search and Advertising Phillip Rogaway (Davis) [introductory/intermediate] Provably Secure Symmetric Encryption Gustavo Rossi (La Plata) [intermediate] Topics in Model Driven Web Engineering Kaushik Roy (Purdue) [introductory/intermediate] Low-energy Computing Robert Sargent (Syracuse) [introductory] Validating Models Douglas C. Schmidt (Vanderbilt) [intermediate] Patterns and Frameworks for Concurrent and Networked Software Bart Selman (Cornell) [intermediate] Fast Large-scale Probabilistic and Logical Inference Methods Mubarak Shah (Central Florida) [intermediate/advanced] Visual Crowd Surveillance Ron Shamir (Tel Aviv) [introductory] Revealing Structure in Disease Regulation and Networks Dawn Xiaodong Song (Berkeley) [introductory] Selected Topics in Computer Security Mike Thelwall (Wolverhampton) [introductory] Sentiment Strength Detection for the Social Web Julita Vassileva (Saskatchewan) [introductory/intermediate] Engaging Users in Social Computing Systems Philip Wadler (Edinburgh) [introductory] Topics in Lambda Calculus and Life Yao Wang (Polytechnic New York) [introductory/advanced] Video Compression: Fundamentals and Recent Development Gio Wiederhold (Stanford) [introductory] Software Economics: How Do the Results of the Intellectual Efforts Enter the Global Market Place Limsoon Wong (National Singapore) [introductory/intermediate] The Use of Context in Gene Expression and Proteomic Profile Analysis Michael Wooldridge (Oxford) [introductory] Autonomous Agents and Multi-Agent Systems Ronald R. Yager (Iona) [introductory/intermediate] Fuzzy Sets and Soft Computing Philip S. Yu (Illinois Chicago) [advanced] Mining Big Data REGISTRATION: It has to be done at http://grammars.grlmc.com/SSTiC2013/Registration.php Since the capacity of the venue is limited, registration requests will be processed on a first come first served basis. The registration period will be closed when the capacity of the venue will be complete. It is highly convenient to register prior to the event. FEES: Fees may be for the whole week (full-time participant) or per blocks of days (part-time participant). They are a flat rate allowing one to attend all courses within the time window set: 5, 4, 3 or 2 days. Fees vary depending on the deadline. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Participants will be delivered a certificate of attendance. QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat POSTAL ADDRESS: SSTiC 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Departament d?Economia i Coneixement, Generalitat de Catalunya Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:27:43 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:27:43 +0200 Subject: Job: Post-doctorat en TALN, Orange Message-ID: Date: Thu, 27 Jun 2013 08:22:08 +0000 From: Message-ID: <5455_1372321329_51CBF631_5455_2314_1_6A3EA12B995B52459CDFCEFF0835C6B10AF9B1 at PEXCVZYM12.corporate.adroot.infra.ftgroup> Chers coll?gues, Orange propose actuellement un post-doctorat. Merci de consulter l'offre ci-dessou et, le cas ?ch?ant, de postuler aupr?s de moi et de laurent.roussarie at orange.com, Cordialement, Romain Laroche ft/nsm/rd/tech/asap/nadia Ing?nieur de recherche sur les syst?mes de dialogue Research engineer on dialogue systems phone: 01 45 29 62 77 romain.laroche at orange-ftgroup.com ------------------------------------------------------------------------ M?thodes d'analyse s?mantique statistique pour l'extraction de connaissances ? partir de corpus semi-annot?s Mots clefs : Analyse s?mantique, Apprentissage actif, Interaction Homme-Machine, Dialogue naturel Contexte : Le sujet de post-doctorat se rapporte ? la probl?matique de l'analyse s?mantique dans les syst?mes dialogue en g?n?ral. L'analyse s?mantique consiste ? transformer un ?nonc? dans une interpr?tation (cat?gorie s?mantique) pour permettre au syst?me de dialogue de poursuivre ses calculs. L'analyseur s?mantique de Disserto s'appuie sur une approche ? base de r?gles. Le traitement s'effectue en deux ?tapes : ?tiqueter les mots en ? tags ?, puis appliquer les r?gles s?mantiques appropri?es aux tags, de telle mani?re qu'une combinaison ou association donn?e de tags fournisse une interpr?tation correcte. Ce principe d'analyse s?mantique ? base de r?gles d'?tiquetage et d'association peut ?tre utilis? dans n'importe quelle langue. Cependant, cette m?thode est manuelle et n?cessite l'intervention d'un d?veloppeur (knowledge engineer). Ce dernier va analyser un corpus de phrases issues d'interactions de diff?rents utilisateurs avec le service de dialogue, afin d'?laborer les r?gles d'analyse s?mantiques les plus pertinentes. Les phrases contenues dans ce type de corpus peuvent ?tre : - non annot?es (par exemple lorsqu'elles sont issues des logs d'un service en exploitation) - annot?es manuellement par un op?rateur : par exemple dans le cas de service mettant en ?uvre des fonctions de magicien d'Oz sur la reconnaissance vocale (on parle alors de Reconnaissance Vocal Assist?e par Op?rateur) ou sur l'analyse s?mantique (illustr?e dans l'application DissertOz). Le r?le du post-doctorant sera de d?velopper de nouveaux algorithmes et de fournir les outils associ?s qui permettent de faciliter et d'optimiser le travail du d?veloppeur lors de l'?laboration des r?gles d'analyse s?mantique de Disserto. ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:41:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:41:37 +0200 Subject: Appel: Revue TAL, TAL et les reseaux sociaux Message-ID: Date: Fri, 28 Jun 2013 14:36:28 -0400 From: "Atefeh Farzindar" Message-ID: <008c01ce742e$66ec4180$34c4c480$@nlptechnologies.ca> X-url: http://www.nlptechnologies.ca/fr/TAL-reseaux-sociaux X-url: http://www.nlptechnologies.ca/en/TAL-Social-media Appel ? proposition d?articles pour un num?ro sp?cial de la revue scientifique internationale traitement automatique du langage naturel pour l'analyse des r?seaux sociaux http://www.nlptechnologies.ca/fr/TAL-reseaux-sociaux La revue TAL et les r?seaux sociaux 2013 ? Volume 54, Num?ro 3 Appel ? proposition d?articles Les r?seaux sociaux, structures dynamiques form?es d'individus et/ou d'organisations, ont toujours jou? un r?le majeur dans nos soci?t?s. Ils se sont d?velopp?s et diversifi?s avec le Web 2.0. qui ouvre la possibilit? aux utilisateurs de cr?er et de partager du contenu par l'interm?diaire de multiples plates-formes (blogs, micro-blogs, wikis, sites de partage, etc.). Dans ce contexte, le volume sans pr?c?dent des donn?es textuelles, leur vari?t? ainsi que le r?seau d'interaction des utilisateurs repr?sentent de nouvelles opportunit?s pour la compr?hension du comportement social. L'?tude des messages ?chang?s constitue un nouveau d?fi pour le Traitement Automatique des Langues. Dans ce cadre, il est int?ressant de discuter la robustesse des m?thodes de TAL (analyseurs morpho-syntaxiques, syst?mes d'extraction de la terminologie et d'entit?s nomm?es, etc.) sur ces donn?es. Dans ce num?ro sp?cial, de nouvelles approches pourront ?tre pr?sent?es dans le but d'analyser ces donn?es textuelles massives, souvent bruit?es et h?t?rog?nes issues des r?seaux sociaux. Dates importantes Soumission des r?sum?s : 15 octobre 2013 Soumission des articles : 29 octobre 2013 ?diteurs Invit?s : Atefeh Farzindar, NLP Technologies et Universit? de Montr?al, Canada Mathieu Roche, LIRMM (CNRS, Universit? Montpellier 2) et TETIS (Cirad, Irstea, AgroParisTech), France Pour plus d'information SVP visiter : http://www.nlptechnologies.ca/fr/TAL-reseaux-sociaux ------------------------------------------------------------------------ Call for papers for a special issue of TAL, an international journal, on natural language processing for social media analysis http://www.nlptechnologies.ca/en/TAL-Social-media TAL journal and social networks 2013 ? Volume 54, Number 3 Call for papers Social networks, dynamic structures comprised of individuals or organizations, have always played a major role in our societies. They have evolved and diversified with the Web 2.0, which offers users the possibility to create and share content through multiple platforms (blogs, micro-blogs, wikis, sharing sites, etc.). In this environment, the unprecedented volume and variety of textual data as well as the users? interaction network give rise to new opportunities to better understand social behavior. The study of messages exchanged represents a new challenge in Natural Language Processing. In this context, it becomes interesting to discuss the strength of NLP methods (morphosyntactic analysers, systems of term extraction and of named entity recognition, etc.) on this data. In this special issue, new approaches will be presented for the purpose of analysing this massive, heterogeneous and usually noisy textual data coming from social networks. Guest Editors: Atefeh Farzindar, NLP Technologies and Universit? de Montr?al, Canada Mathieu Roche, LIRMM (CNRS, Montpellier 2 University) and TETIS (Cirad, Irstea, AgroParisTech), France Important dates Submission of abstracts: October 15, 2013 Submission of articles: October 29, 2013 For further information please visit : http://www.nlptechnologies.ca/en/TAL-Social-media ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:21:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:21:37 +0200 Subject: Job: Open position, Project Manager in Speech and Multimodal Technologies, ELDA Message-ID: Date: Wed, 26 Jun 2013 12:54:49 +0200 From: ELRA ELDA Information Message-ID: <51CAC879.3030402 at elda.org> X-url: http://www.elda.org X-url: http://www.elra.info The European Language resources Distribution Agency (ELDA), a company specialized in Human Language Technologies within an international context, acting as the distribution agency of the European Language Resources Association (ELRA), is currently seeking to fill an immediate vacancy for Technical Engineer/Scientist (Project Manager) position, specialized in Speech and Multimodal technologies. *Technical Engineer / Scientist (Project Manager) in Speech and Multimodal Technologies* Under the supervision of the CEO, the responsibilities of the Technical Engineer/Scientist include designing/specifying language resources, setting up production frameworks and platforms, carrying out quality control and assessment. He/she will be in charge of renovating the current language resources production workflows. This yields excellent opportunities for young, creative, and motivated candidates wishing to participate actively to the Language Engineering field. He/she will be in charge of conducting the activities related to language resources and Natural Language Processing technologies. The task will mostly consist in managing language resources production projects and co-ordinating ELDA's participation in R&D projects while being also hands-on whenever required by the development team. Profile : * PhD in computer science, speech, audiovisual/multimodal technologies * Experience and/or good knowledge in speech data collection, expertise in phonetics, transcription tools * Experience in speech recognition, synthesis, speaker ID and the well-used packages (e.g., HTK, Julius, ...) and the tools to produce, collect and assess quality of resources and datasets * Experience and/or good knowledge of the Language Technology area * Experience with technology transfer projects, industrial projects, collaborative projects within the European Commission or other international frameworks * Ability to work independently and as part of a team, in particular the ability to supervise members of a multidisciplinary team * Dynamic and communicative, flexible to combine and work on different tasks * Good knowledge of Linux and open source software * Proficiency in C++, PhP, Java, Django is a plus * Proficiency in French and English * Citizenship of (or residency papers) a European Union country Applications will be considered until the position is filled. The position is based in Paris. Salary : Commensurate with qualifications and experience. Applicants should email a cover letter addressing the points listed above together with a curriculum vitae to : Khalid Choukri ELRA / ELDA 55-57, rue Brillat-Savarin 75013 Paris FRANCE Fax : 01 43 13 33 30 Mail : job at elda.org ELRA was established in February 1995, with the support of the European Commission, to promote the development and exploitation of Language Resources (LRs). Language Resources include all data necessary for language engineering, such as monolingual and multilingual lexica, text corpora, speech databases and terminology. The role of this non-profit membership Association is to promote the production of LRs, to collect and to validate them and, foremost, make them available to users. The association also gathers information on market needs and trends. For further information about ELDA/ELRA, visit : http://www.elda.org http://www.elra.info ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:24:43 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:24:43 +0200 Subject: Livre: Bender, Linguistic Fundamentals for NLP: 100 Essentials from Morphology and Syntax Message-ID: Date: Wed, 26 Jun 2013 12:12:43 -0400 From: Graeme Hirst Message-Id: <026AB355-7C06-4C6D-94C3-68D2AAC6D695 at cs.toronto.edu> X-url: http://www.morganclaypool.com/doi/abs/10.2200/S00493ED1V01Y201303HLT020 BOOK ANNOUNCEMENT Linguistic Fundamentals for Natural Language Processing: 100 Essentials from Morphology and Syntax by Emily M. Bender, University of Washington Synthesis Lectures on Human Language Technologies #20 (Morgan & Claypool Publishers), 2013, 184 pages Abstract Many NLP tasks have at their core a subtask of extracting the dependencies -- who did what to whom -- from natural language sentences. This task can be understood as the inverse of the problem solved in different ways by diverse human languages, namely, how to indicate the relationship between different parts of a sentence. Understanding how languages solve the problem can be extremely useful in both feature design and error analysis in the application of machine learning to NLP. Likewise, understanding cross-linguistic variation can be important for the design of MT systems and other multilingual applications. The purpose of this book is to present in a succinct and accessible fashion information about the morphological and syntactic structure of human languages that can be useful in creating more linguistically sophisticated, more language-independent, and thus more successful NLP systems. Table of Contents: Acknowledgments / Introduction/motivation / Morphology: Introduction / Morphophonology / Morphosyntax / Syntax: Introduction / Parts of speech / Heads, arguments, and adjuncts / Argument types and grammatical functions / Mismatches between syntactic position and semantic roles / Resources / Bibliography / Author's Biography / General Index / Index of Languages http://www.morganclaypool.com/doi/abs/10.2200/S00493ED1V01Y201303HLT020 This title is available online without charge to members of institutions that have licensed the Synthesis Digital Library of Engineering and Computer Science. Members of licensing institutions have unlimited access to download, save, and print the PDF without restriction; use of the book as a course text is encouraged. To find out whether your institution is a subscriber, visit http://www.morganclaypool.com/page/licensed, or just click on the book's URL above from an institutional IP address and attempt to download the PDF. Others may purchase the book from this URL as a PDF download for US$30 or in print for US$40. Printed copies are also available from Amazon and from booksellers worldwide at approximately US$45 or local currency equivalent. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:22:52 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:22:52 +0200 Subject: Livre: S=?ISO-8859-1?Q?=F8gaard=2C_?=Semi-Supervised Learning and Domain Adaptation in NLP Message-ID: Date: Wed, 26 Jun 2013 12:10:14 -0400 From: Graeme Hirst Message-Id: X-url: http://www.morganclaypool.com/doi/abs/10.2200/S00497ED1V01Y201304HLT021 BOOK ANNOUNCEMENT Semi-Supervised Learning and Domain Adaptation in Natural Language Processing by Anders S?gaard, University of Copenhagen Synthesis Lectures on Human Language Technologies #21 (Morgan & Claypool Publishers), 2013, x+93 pages Abstract This book introduces basic supervised learning algorithms applicable to natural language processing (NLP) and shows how the performance of these algorithms can often be improved by exploiting the marginal distribution of large amounts of unlabeled data. One reason for that is data sparsity, i.e., the limited amounts of data we have available in NLP. However, in most real-world NLP applications our labeled data is also heavily biased. This book introduces extensions of supervised learning algorithms to cope with data sparsity and different kinds of sampling bias. This book is intended to be both readable by first-year students and interesting to the expert audience. My intention was to introduce what is necessary to appreciate the major challenges we face in contemporary NLP related to data sparsity and sampling bias, without wasting too much time on details about supervised learning algorithms or particular NLP applications. I use text classification, part-of-speech tagging, and dependency parsing as running examples, and limit myself to a small set of cardinal learning algorithms. I have worried less about theoretical guarantees ("this algorithm never does too badly") than about useful rules of thumb ("in this case this algorithm may perform really well"). In NLP, data is so noisy, biased, and non-stationary that few theoretical guarantees can be established and we are typically left with our gut feelings and a catalogue of crazy ideas. I hope this book will provide its readers with both. Throughout the book we include snippets of Python code and empirical evaluations, when relevant. Table of Contents: Introduction / Supervised and Unsupervised Prediction / Semi-Supervised Learning / Learning under Bias / Learning under Unknown Bias / Evaluating under Bias http://www.morganclaypool.com/doi/abs/10.2200/S00497ED1V01Y201304HLT021 This title is available online without charge to members of institutions that have licensed the Synthesis Digital Library of Engineering and Computer Science. Members of licensing institutions have unlimited access to download, save, and print the PDF without restriction; use of the book as a course text is encouraged. To find out whether your institution is a subscriber, visit http://www.morganclaypool.com/page/licensed, or just click on the book's URL above from an institutional IP address and attempt to download the PDF. Others may purchase the book from this URL as a PDF download for US$30 or in print for US$40. Printed copies are also available from Amazon and from booksellers worldwide at approximately US$45 or local currency equivalent. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:23:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:23:48 +0200 Subject: Livre: Nastase et al, Semantic Relations Between Nominals Message-ID: Date: Wed, 26 Jun 2013 12:11:25 -0400 From: Graeme Hirst Message-Id: <6194FBE2-322E-4048-9084-9DEFAFC6C3C6 at cs.toronto.edu> X-url: http://www.morganclaypool.com/doi/abs/10.2200/S00489ED1V01Y201303HLT019 BOOK ANNOUNCEMENT Semantic Relations Between Nominals by Vivi Nastase, FBK, Trento, Italy Preslav Nakov, QCRI, Qatar Foundation Diarmuid ? S?aghdha, Computer Laboratory, University of Cambridge, UK Stan Szpakowicz, EECS, University of Ottawa and ICS, Polish Academy of Sciences Synthesis Lectures on Human Language Technologies #19 (Morgan & Claypool Publishers), 2013, 119 pages Abstract People make sense of a text by identifying the semantic relations which connect the entities or concepts described by that text. A system which aspires to human-like performance must also be equipped to identify, and learn from, semantic relations in the texts it processes. Understanding even a simple sentence such as "Opportunity and Curiosity find similar rocks on Mars" requires recognizing relations (rocks are located on Mars, signalled by the word on) and drawing on already known relations (Opportunity and Curiosity are instances of the class of Mars rovers). A language-understanding system should be able to find such relations in documents and progressively build a knowledge base or even an ontology. Resources of this kind assist continuous learning and other advanced language-processing tasks such as text summarization, question answering and machine translation. The book discusses the recognition in text of semantic relations which capture interactions between base noun phrases. After a brief historical background, we introduce a range of relation inventories of varying granularity, which have been proposed by computational linguists. There is also variation in the scale at which systems operate, from snippets all the way to the whole Web, and in the techniques of recognizing relations in texts, from full supervision through weak or distant supervision to self-supervised or completely unsupervised methods. A discussion of supervised learning covers available datasets, feature sets which describe relation instances, and successful algorithms. An overview of weakly supervised and unsupervised learning zooms in on the acquisition of relations from large corpora with hardly any annotated data. We show how bootstrapping from seed examples or patterns scales up to very large text collections on the Web. We also present machine learning techniques in which data redundancy and variability lead to fast and reliable relation extraction. Table of Contents: Introduction / Relations between Nominals, Relations between Concepts / Extracting Semantic Relations with Supervision / Extracting Semantic Relations with Little or No Supervision / Conclusion http://www.morganclaypool.com/doi/abs/10.2200/S00489ED1V01Y201303HLT019 This title is available online without charge to members of institutions that have licensed the Synthesis Digital Library of Engineering and Computer Science. Members of licensing institutions have unlimited access to download, save, and print the PDF without restriction; use of the book as a course text is encouraged. To find out whether your institution is a subscriber, visit http://www.morganclaypool.com/page/licensed, or just click on the book's URL above from an institutional IP address and attempt to download the PDF. Others may purchase the book from this URL as a PDF download for US$30 or in print for US$40. Printed copies are also available from Amazon and from booksellers worldwide at approximately US$45 or local currency equivalent. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:30:50 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:30:50 +0200 Subject: Appel: Final call for demonstrations, SIGDIAL 2013 Conference Message-ID: Date: Thu, 27 Jun 2013 14:44:34 +0000 From: "Jason Williams (MSR)" Message-ID: X-url: http://www.sigdial.org/workshops/conference14/ SIGDIAL 2013 CONFERENCE 14th Annual Meeting of the Special Interest Group on Discourse and Dialogue http://www.sigdial.org/workshops/conference14/ Metz, France 22-24 August 2013 CALL FOR DEMONSTRATIONS The program committee of SigDial 2013 welcomes the submission of demonstration descriptions. Demonstrations will be presented in special sessions, separate from short paper presentations and poster sessions. Accepted demonstration submissions will be published in a dedicated section of the conference proceedings. Demo descriptions should be no longer than 3 pages, including references. Demo submissions should follow the two-column ACL 2013 format. We strongly recommend the use of ACL LaTeX style files or Microsoft Word style files tailored for the ACL 2013 conference. Submissions must conform to the official ACL 2013 style guidelines (http://acl2013.org/site/call.html), and they must be electronic in PDF. Submissions will not be anonymous. Demonstrations which have appeared (or will appear) elsewhere may be presented at SigDial, although this should be noted at the time of submission. Authors are encouraged to submit additional supportive material such as video clips or sound clips and examples of available resources for review purposes. Submission is electronic using paper submission software at https://www.softconf.com/d/sigdial2013/ IMPORTANT DATES Demo Paper Submission Deadline Tuesday, 2 July 2013 (23:59, GMT-11) Demo Paper Notification Wednesday, 10 July 2013 Final Demo Paper Due Wednesday, 24 July 2013 Conference Thursday-Saturday, 22-24 August 2013 (Thu morning - Saturday mid-day) Any questions regarding submissions can be sent to the technical program co-chairs at program-chairs[at]sigdial.org. SigdDial 2013 Technical Program Co-Chairs Barbara Di Eugenio, University of Illinois at Chicago, USA Jason D. Williams, Microsoft Research, USA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:47:51 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:47:51 +0200 Subject: Appel: L'annotation de la subjectivite langagiere Message-ID: Date: Sun, 30 Jun 2013 19:18:35 +0200 From: Agata Jackiewicz Message-ID: <35818286b57dc441a7cf797851cdc713 at bore.paris-sorbonne.fr> APPEL ? COMMUNICATIONS Journ?e d'Etude L'annotation de la subjectivit? langagi?re M?thodes, Mod?lisation, Outils, Retours d'exp?rience 3 octobre 2013 Maison de la Recherche, Universit? Paris-Sorbonne, 28 rue Serpente 75006 Paris F?d?ration de recherche ILF (Institut de la Langue Fran?aise) Consortium Corpus Ecrits, Groupe de travail Annotation de haut niveau Depuis quelques ann?es, le th?me de la recherche d'informations dans de tr?s grands corpus et sur le WEB, tout particuli?rement dans le domaine de l'expression des ?motions et des opinions (sentiment analysis), int?resse de nombreux sp?cialistes tant dans le domaine des sciences du langage que dans celui des industries de la langue. D'autre part, le consortium Corpus Ecrits de l'ILF est impliqu? dans un projet de cr?ation d'un grand corpus de r?f?rence du fran?ais. C'est dans ce contexte que s'inscrit la journ?e d'?tude du Groupe de travail Annotation de haut niveau (consortium Corpus Ecrits de l'ILF) du 3 octobre 2013. Elle sera l'occasion de cibler plus particuli?rement le th?me de l'annotation de la subjectivit? langagi?re, en vue d'un tour d'horizon des premiers r?sultats obtenus et des travaux en cours. Les ?tudes vis?es pourront porter sur : - la linguistique des ?motions et des sentiments - la linguistique des opinions - les ph?nom?nes ?nonciatifs relevant de l'expression de la subjectivit? - ou de mani?re plus cibl?e, sur les aspects et les facettes des jugements ?valuatifs : point de vue (engagement, prise en charge), polarit?, intensit?, identit?, etc. La probl?matique de l'annotation peut ?tre abord?e selon les perspectives suivantes : - la mod?lisation linguistique et informatique de la subjectivit? langagi?re - l'expression en langue et en discours - la construction, l'acquisition et la validation des ressources linguistiques (dictionnaires, corpus...) - les m?thodes et les outils pour identifier, annoter et extraire opinions et sentiments dans des documents textuels ou audiovisuels - la pr?sentation synth?tique de la diversit? des contenus subjectifs. L'annotation des donn?es langagi?res soul?ve de nombreuses questions, touchant par exemple ? la nature de l'objet ? annoter (notion, forme, structure), au choix des corpus et des strat?gies d'annotation (manuelle ou automatique), ? la d?limitation des ph?nom?nes ? annoter, ? la gestion des cas particuliers, aux comp?tences des annotateurs (na?fs ou experts). Il s'agira de d?terminer comment les travaux actuels sur la subjectivit? se saisissent de ces questions, et quelles r?ponses ils apportent. TYPES DE COMMUNICATION Les auteurs peuvent pr?senter leurs travaux sous forme d'une communication orale, d'un poster ou d'une d?monstration informatique. MODALIT?S DE SOUMISSION Les propositions de communications devront se pr?senter sous la forme d'un r?sum? de 2 ? 3 pages, bibliographie incluse (Times New Roman 12, interligne simple). Elles comporteront les indications suivantes : - titre de la communication - auteur(s) et affiliation(s) - 4 ou 5 mots-cl?s - expos? de la probl?matique de l'?tude donnant les d?tails pertinents (type de corpus, m?thodologie, r?sultats, ?cueils et difficult?s ...) - principales r?f?rences bibliographiques - type de communication souhait? : pr?sentation orale, poster, d?monstration. Les propositions de communication devront ?tre envoy?es avant le 2 septembre 2013 aux adresses suivantes : Agata.Jackiewicz at paris-sorbonne.fr, denis.lepesant at orange.fr DATES IMPORTANTES - soumission des r?sum?s : avant le 02/09/2013 - notification d'acceptation : 18/09/2012 - journ?e d'?tude : 03/10/2013 COMIT? D'ORGANISATION - Agata Jackiewicz (STIH, Universit? Paris-Sorbonne), - Denis Le Pesant (MoDyCo, Universit? Paris Ouest Nanterre), - Amalia Todirascu (FDT, LiLPa, Universit? de Strasbourg), - Agn?s Tutin (Lidilem, Universit? Stendhal - Grenoble 3). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:36:38 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:36:38 +0200 Subject: Job: Internship Announcement (4 months), Large-Scale Socio-Semantic Corpus Indexing And Analysis Message-ID: Date: Fri, 28 Jun 2013 12:01:18 +0200 (CEST) From: Pascale Sebillot Message-ID: <717388927.3792745.1372413678721.JavaMail.root at irisa.fr> X-url: http://www.cnrs.fr/mi/spip.php?article53 X-url: http://mastodons.lip6.fr/ Internship Announcement (4 months) LARGE-SCALE SOCIO-SEMANTIC CORPUS INDEXING AND ANALYSIS CNRS MASTODONS / ARESOS ISC-PIF (Paris), LIP6 (Paris), IRISA (Rennes) In the context of the ARESOS project funded by the French national CNRS action MASTODONS (Grandes masses de donn?es scientifiques, http://www.cnrs.fr/mi/spip.php?article53 ), we are proposing a paid internship in the area of large-scale content indexing and analysis. The covered period is 4 months from September 1st to December 31, 2013.. Participating Labs : ISC-PIF (Paris), LIP6 (Paris), IRISA (Rennes) Location : The work will be carried out at Paris and/or Rennes (open for discussion) with some short visits in the other laboratories. Funding : CNRS Mastodons ( http://mastodons.lip6.fr/ ) Contact : bernd.amann at lip6.fr Language : English and/or French Gross salary : to be defined depending on the qualification of the candidate Period : September 1st 2013 - December 31, 2013 (4 months) CONTEXT The starting point of this project is an existing platform for the phylogenetic analysis of evolving text corpora (blog, forum, bibliography) developed by David Chavalarias (CAMS/CNRS) and Jean-Philippe Cointet (INRA-SenS), who are also members of the Institut des Syst?mes Complexes de Paris Ile-de-France ( http://www.iscpif.fr/ ). This platform includes several specialized tools for the extraction, indexing, clustering and alignment of contents which can be combined into complex workflows for the semantic and temporal analysis of evolving text corpora. OBJECTIVES Current workflow implementations are optimized for medium sized corpora (~300k items, ~4000 concepts). Our goal is to develop new techniques and algorithms for processing larger collections and terminologies and which allow for more interactive content analysis user interfaces: * Large-scale phylogenetic analysis of evolving corpora : we propose to explore two directions for extending the platform: 1. define and integrate new data structures and indexing methods for accessing and joining text contents; in particular, explore efficient approximation and compression techniques for reducing processing cost and data size (similarity and co-occurrence matrix). 2. study the parallelization and MapReduce implementation of some key functionalities (extraction, indexing, clustering) * Online analysis of dynamic information: The analysis workflow depends on complex temporal and semantic processing steps which might generate results which are erroneous or useless for the final user. The goal is to adapt the current workflow for following the content evolution online by incrementally updating the generated analytic data model (incrementally maintain the temporal co-occurrence matrix). We propose to study to what extent it is possible to regroup data according to the user interests and to decompose the workflow into independent processes that can be executed in parallel (MapReduce). The development of these techniques and algorithms will build on the experience of two database research teams including B. Amann, C. Constantin and H. Naacke from LIP6-UPMC ( http://www-bd.lip6.fr/ ) and D. Gross-Amblard and Z. Miklos from IRISA-Rennes ( http://people.irisa.fr/David.Gross_Amblard/ and http://people.irisa.fr/Zoltan.Miklos/ ). WORK PLAN The work to be accomplished is decomposed into several steps: 1. Problem analysis and state-of-the art 2. Detailed task specification 3. Implementation and experimentation on large corpora (WebOfScience, GlobalPulse Twitter collection) CANDIDATE PROFILE Candidates should send their CV to bernd.amann at lip6.fr . We are particularly interested in applicants holding at least a Masters diploma with some background covering one or several topics among large-scale data processing, unsupervised / semi-supervised machine learning, text mining and natural language processing (NLP). Due to the near deadline of this proposal, candidates from foreign countries should already have a work permit covering the internship period. BIBLIOGRAPHY Chavalarias D, Cointet J-P (2013) Phylomemetic Patterns in Science Evolution-The Rise and Fall of Scientific Fields. PLoS ONE 8(2): e54847. doi:10.1371/journal.pone.0054847 Kyuseok Shim. MapReduce Algorithms for Big Data Analysis, Tutorial (VLDB12, SWCW13) Richard M. C. McCreadie, Craig Macdonald, and Iadh Ounis. 2009. On single-pass indexing with MapReduce. In Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval (SIGIR '09). ACM, New York, NY, USA, 742-743. DOI=10.1145/1571941.1572106 http://doi.acm.org/10.1145/1571941.1572106 Spiros Papadimitriou and Jimeng Sun. 2008. DisCo: Distributed Co-clustering with Map-Reduce: A Case Study towards Petabyte-Scale End-to-End Mining. In Proceedings of the 2008 Eighth IEEE International Conference on Data Mining (ICDM '08). IEEE Computer Society, Washington, DC, USA, 512-521. DOI=10.1109/ICDM.2008.142 http://dx.doi.org/10.1109/ICDM.2008.142 -- Bernd Amann Universit? Pierre et Marie Curie LIP6 - Boite Courrier 169 4 place Jussieu 75 252 Paris cedex 05 Equipe Base de Donn?es Bureau 25-26/506 M?l : Bernd.Amann at lip6.fr T?l : +33 (0)1 44 27 70 09 Fax : +33 (0)1 44 27 70 00 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Jun 30 17:20:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 30 Jun 2013 19:20:23 +0200 Subject: Info: Transparents du seminaire Alpage, Joakim Nivre, Training Deterministic Parsers Using Non-Deterministic Oracles Message-ID: Date: Fri, 28 Jun 2013 17:01:23 +0200 From: Marie Candito Message-ID: Pour info, les slides du s?minaire de Joakim Nivre sont disponibles sur la page du s?minaire : https://www.rocq.inria.fr/alpage-wiki/tiki-download_wiki_attachment.php?attId=3&download=y Bonne journ?e ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ -------------------------------------------------------------------------