From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 18:55:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 20:55:16 +0200 Subject: Appel: TAG+11 Message-ID: Date: Wed, 30 May 2012 08:55:37 +0200 From: Eric De la clergerie Message-ID: <4FC5C469.7090204 at inria.fr> X-url: http://alpage.inria.fr/tagplus11/doku.php ** Apologies for cross-posting ** SECOND CALL FOR PAPERS The Eleventh International Workshop on Tree Adjoining Grammars and Related Formalisms (TAG+11) 26-28 September 2012 University Paris-Diderot Paris, France http://alpage.inria.fr/tagplus11/doku.php The Workshop on Tree-Adjoining Grammars and related formalisms (TAG+) is a biennial workshop series that fosters exchange of ideas among linguists, psycholinguists and computer scientists interested in modeling natural language using formal grammars. The workshop series, since 1990, has demonstrated productive interactions among researchers and practitioners interested in various aspects of the Tree-Adjoining Grammar formalism and its relationship to other grammar formalisms, such as combinatory categorial grammar, dependency grammars, Minimalist grammars, HPSG, and LFG; hence the "+" in the name of the workshop. Tree-Adjoining Grammars (TAG) and related lexicalized grammar formalisms provide mathematical tools to model natural language and the scaffolding to encode linguistic generalizations in a principled manner. In the past, this workshop has helped identify similarities and differences between the above formalisms, leading to the shared development of broad-coverage grammars, transfer of parsing and machine learning algorithms from one formalism to another and to new insights into the properties of different formalisms and their capacity for linguistic explanation. It is our expectation that this edition of the workshop will continue enabling cross-fertilization of ideas that combine the representational flexibility of TAG-like grammar formalisms with the robustness afforded by machine learning techniques to produce a deeper insight into modeling of natural language. The first day of the meeting will be devoted to a series of tutorial presentations, designed to introduce attendees to a range of TAG-related topics. Invited Speakers: * Kevin Knight, University of Southern California (USA) * Bonnie Webber, University of Edinburgh (Scotland) Tutorial Speakers: * David Chiang – USC Information Sciences Institute (USA) * Laura Kallmeyer – University of Düsseldorf (Germany) * Andreas Maletti – University of Stuttgart (Germany) Topics of Interest: We invite submissions on all aspects of TAG and related grammatical formalisms including the following topics: * syntactic and semantic theory; * mathematical properties; * computational and algorithmic studies of parsing, interpretation and language generation; * machine learning models using TAG-like representations; * corpus-based research and grammar development using TAG; * psycholinguistic modeling; and * applications to natural language processing or biological sequence modeling. Special Session: We plan to organize a special session on formalisms based on synchronous tree rewriting. We especially encourage submissions on topics related to synchronous tree rewriting, including theoretical aspects, applications to machine translation and syntax-semantics interface. Submission Details: Anonymous abstracts may be submitted for two types of presentations at the workshop: oral presentations and poster presentations. Poster presentations are particularly appropriate for brief descriptions of specialized implementations, resources under development and work in progress. Regardless of the type of submission, abstracts may not exceed two pages in length (not including data, figures and references). Both one-column or two-column abstracts are permissible. However do not use a font that is smaller than 11pt. If you are using LaTeX for document preparation, then any recent ACL style file can be used. The final camera ready version of the full paper for the proceedings must be in two-column format conforming to the most recent ACL style file. The abstract must be submitted electronically in PDF format, using the EasyChair electronic submission website at http://www.easychair.org/conferences/?conf=tag11 The submission instructions can be found at http://alpage.inria.fr/tagplus11/doku.php?id=submissions Proceedings including full papers for accepted abstracts (both oral and poster presentations) will be available on-line before the workshop dates. Important dates: * Deadline for submission of abstracts: June 15, 2012. * Notification to authors of decision: July 30, 2012. * Deadline for camera-ready submission: September 7, 2012. * Workshop dates: September 26 to 28, 2012. Contact Information: The workshop website is at http://alpage.inria.fr/tagplus11/doku.php Email contact: tagplus11 at gmail.com Organization: Program Chairs * Chung-hye Han, Simon Fraser University (Canada) * Giorgio Satta, University of Padova (Italy) Program Committee * Srinivas Bangalore, AT&T Research (USA) * Rajesh Bhatt, UMass (USA) * David Chiang, USC Information Sciences Institute (USA) * Benoit Crabbé University Paris-Diderot (France) * Robert Frank, Yale University (USA) * Claire Gardent, CNRS/LORIA, Nancy (France) * Daniel Gildea, University of Rochester (USA) * Julia Hockenmaier, University of Illinois at Urbana-Champaign (USA) * Liang Huang, USC Information Sciences Institute (USA) * Aravind Joshi, University of Pennsylvania (USA) * Laura Kallmeyer, University of Duesseldorf (Germany) * Makoto Kanazawa, National Institute of Informatics (Japan) * Alexander Koller, University of Potsdam (Germany) * Marco Kuhlmann, Uppsala University (Sweden) * Andreas Maletti, University of Stuttgart (Germany) * Yusuke Miyao, University of Tokyo (Japan) * Mark-Jan Nederhof, University of St Andrews (Scotland) * Steve DeNeefe, SDL Language Weaver (USA) * Owen Rambow, Columbia University (USA) * Maribel Romero, University of Konstanz (Germany) * Tatjana Scheffler, DFKI (Germany) * Anoop Sarkar, Simon Fraser University (Canada) * William Schuler, The Ohio State University (USA) * Stuart Shieber, Harvard University (USA) * Mark Steedman, University of Edinburgh (UK) * Matthew Stone, Rutgers University (USA) * Sylvain Salvati, INRIA Bordeaux Sud-Ouest (France) * Bonnie Webber, University of Edinburgh (UK) * Fei Xia, University of Washington (USA) Local Arrangements Chairs * Éric de la Clergerie – INRIA Paris Rocquencourt * Djamé Seddah – University Paris Sorbonne Paris 4 * Laurence Danlos, University Paris-Diderot * Chantal Girodon, INRIA Paris Rocquencourt TAG+ 11 is endorsed by EACL (the European Chapter of the Association for Computational Linguistics), and benefits from the support of Google, University Paris-Diderot, and INRIA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:10:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:10:18 +0200 Subject: Appel: Campaign TRAD 2012, A machine translation evaluation campaign on Arabic-French language pair Message-ID: Date: Wed, 30 May 2012 11:52:24 +0200 From: "Kahn Juliette" Message-ID: <10C58690E5732B47BE9AEC4BF97CA1340168427E at TMSG.intra.lne> X-url: http://www.lne.fr/ X-url: http://www.lne.fr/fr/formation/offre-formation.asp?utm_source=mail&utm_medium=signature&utm_content=offre&utm_campaign=formation_2012 X-url: http://www.lne.fr/fr/formation/catalogue-stages.asp?utm_source=mail&utm_medium=signature&utm_content=cat&utm_campaign=formation_2012 X-url: http://www.lne.fr/fr/formation/E-catalogue-2012/index.html?utm_source=mail&utm_medium=signature&utm_content=e-cat&utm_campaign=formation_2012 X-url: http://www.lne.fr/fr/formation/journees-techniques.asp?utm_source=mail&utm_medium=signature&utm_content=jt&utm_campaign=formation_2012 Machine translation (MT) enjoys a new boom driven by the applications. The goal is to translate sentences in a source language into a target language without human intervention This difficult task need to be regularly assessed to establish the scientific and technical progress. Funded by the French defense procurement agency (DGA), the Laboratoire national de métrologie et d'essais (LNE) and CASSIDIAN conducts the TRAD-campaign 2012 in order to support MT research and help advance the state of art in MT technologies for the Arabic-French language pair. To meet this objective, the LNE provides the following to the participants: * Consistent data for the training sets, the development and the test sets. The data bases contain newspapers articles or broadcast news transcriptions. * An evaluation by automatic metrics. * An evaluation by human judgment for the 4 best systems depending on the results obtained with the automatic metrics. The LNE organizes a workshop at the end of the campaign to account for the results and compare the approaches of the various participants. Tasks The language pair in TRAD 2012 is Arabic to French. Two tasks are offered because of the sources of the elements to be translated. * Text Task : Translation of newspapers articles that come from various newspapers. * H4 Task : Translation of broadcast news transcriptions that come from various radio and television programs. How to participate ? This evaluation is intended to be of interest of all researchers working on the problem of translation. Participation in the evaluation is invited for all researchers who find the tasks and the evaluation of interest. The only requirement is the participation in the follow-up workshop. All the participants must attend the workshop and be prepared to discuss their system(s) and their results in detail. The workshop is restricted to the TRAD-campaigns participants and representatives of supporting government agencies. To participate, simply fill out the registration form available at www.trad-campaign.org. The participants can sign up for both tasks or for only one of two. Important dates Evaluation plan released 15/04/2012 Early registration 01/05/2012 Training data available 01/06/2012 Registration deadline 01/07/2012 Evaluation test data available 23/09/2012 Deadline for submitting the results 01/10/2012 Deadline for submitting system descriptions to the LNE 08/10/2012 Beginning of the adjudication 10/11/2012 End of the adjudication 20/11/2012 Workshop 28/11/2012 Juliette KAHN Ingénieur en évaluation des système de traitement de l'information multimedia Direction des Essais Tél. : 01 30 69 13 62 Laboratoire national de métrologie et d'essais 29, avenue Roger Hennequin - 78197 Trappes cedex Tél. : 01 30 69 10 00 - Fax : 01 30 69 12 34 Site internet : www.lne.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:13:15 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:13:15 +0200 Subject: Appel: workshop on Computational Methods in Pharmacovigilance Message-ID: Date: Wed, 30 May 2012 15:24:03 +0200 From: marie dupuch Message-ID: X-url: http://natalia.grabar.perso.sfr.fr/CMPV/ MIE 2012 workshop http://natalia.grabar.perso.sfr.fr/CMPV/ Computational Methods in Pharmacovigilance Pharmacovigilance is the activity related to the collection, analysis and prevention of adverse drug reactions induced by drugs or biologics. This activity plays the fundamental role in monitoring the patient safety during their healthcare process and beyond it. Although this activity relies on a strong surveillance tradition within the pharmacoepidemiological area, some limitations appear and generate uncomfortable cases widely covered by media (such as those related to Mediator, VIOXX etc). First of all, these are due to the ever increasing amount of the data to collect and to process, and also to the recording and storage of these data in the digital form. Hence, the computational methods may provide with useful and intelligent solutions for a more rapid and systematic management of these data. In this workshop, we favour the submission of various and novel experiments related to the computational methods in pharmacovigilance and describing different aspects of the pharmacovigilance process, as performed by acamedic researchers, institutional or industrial people: – Collection of the pharmacovigilance data: traditionnally, the pharmacovigilance cases are narrative documents spontaneously submitted by medical staff, by pharmacists and sometimes even by patients themselves. The actual concern is that the collection of these cases is far from being complete. In this situation, special efforts are oriented on the computational assistance when collecting and gathering the pharmacovigilance cases from the raw textual sources. Moreover, the reporting standards and frames are also addressed by the researchers. – Analysis of the pharmacovigilance data: this step relies on the encoding of the cases with the dedicated terminologies and then on the semantic and statistical analysis of these cases. The concerns are related to various aspects, such as (1) the semantic correspondence between the cases and the terms; (2) the methods for the encoding of the cases; (3) the managing of semantic ambiguity and relatedness between the terms; (4) exploitation of the SMQs and of the related data; (5) terminological and ontological representation within the dedicated terminologies; (6) computational methods for the signal detection, etc. – Prevention of adverse drug reactions: the prevention step aims at facilitating the exchange of information through the well established national and international networks. It manages specifically the grave adverse drug reactions and the guidelines which help countries to strengthen the pharmaceutical politics and decisions. – etc. The objective of this workshop is to gather people working on various aspects of the pharmacovigilance. Experiments performed within academic, instritutional or industrial contexts are welcome. SUBMISSIONS: The authors are invited to prepare 5 page submissions with the respect of the MIE conference style: - http://www.mie2012.it/documents/fullpaper.dot - http://www.mie2012.it/documents/instruction.pdf For any questions, please contact natalia.grabar at univ-lille3.fr IMPORTANT DATES: May 1, 2012: 1st call for submissions June 15, 2012: Paper due date July 10, 2012: Notifications to Authors July 25, 2012: Camera-ready version Aug 28, 2012: MIE conference and workshop SCIENTIFIC COMMITTEE: - Ismaïl Ahmed, Equipe Biostatistique, CESP, UMRS 1018 Inserm, Université Paris Sud, France - Andrew Bate, Visiting Professor, Department of Information Systems and Computing, Computing and Mathematics, Brunel University, London, UK, Adjunct Associate Professor of Medicine, Division of Clinical Pharmacology NYU School of Medicine, New York, USA and faculty of the NYU Center for Health Informatics and Bioinformatics, USA - Kevin Cohen, University of Colorado School of Medicine and University of Colorado at Boulder, USA - Mélanie Courot, BC Cancer Agency, Vancouver, Canada - Reinhard Fescharek, Behring Inc., Germany - Thierry Hamon, LIM&BIO, Université Paris 13, France - Mikaela Keller, CNRS LIFL UMR8022, Mostrare INRIA, Université Lille 1 and 3, France - Halil Kilicoglu, National Library of Medicine, NIH, USA - Niklas Noren, Uppsala Monitoring Centre, WHO Collaborating Centre for International Drug Monitoring, Uppsala, Sweden - Patrick Ruch, University of Applied Sciences, Geneva, Switzerland - Ozlem Uzuner, University at Albany, SUNY, USA - ... ORGANIZERS: Marie Dupuch, CNRS STL UMR 8163, U Lille 1 et 3, France Frantz Thiessard, ISPED, U Bordeaux Segalen, France Natalia Grabar, CNRS STL UMR 8163, U Lille 1 et 3, France Jim Slattery, European Medicines Agency, London, UK ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:34:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:34:46 +0200 Subject: Conf: Atelier Ingenierie des Connaissances et Sciences Cognitives, IC, 25 au 29 juin 2012, Paris Message-ID: Date: Wed, 30 May 2012 18:44:07 +0200 From: xavier aimé Message-ID: <4FC64E57.4060807 at inserm.fr> X-url: http://ic2012.crc.jussieu.fr/ X-url: http://web-and-philosophy.org/atelier-philosophie-du-web-et-ingenierie-des-connaissances-ic-2012/ Veuillez nous excuser pour les inévitables réceptions multiples. ======================================================================== Appel à Participations Atelier "Ingénierie des Connaissances et Sciences Cognitives. Concevoir des dispositifs capables d’augmenter la pensée" Journée commune AFIA / ARCo 1ere journée « Sciences Cognitives et Intelligence Artificielle » (SCIA’12) https://sites.google.com/site/ateliericsccog/ 23es Conférence en Ingénierie des Connaissances Paris, du 25 au 29 juin 2012 http://ic2012.crc.jussieu.fr/ ========================================================================= L'atelier ICSC (Ingénierie des Connaissances et Sciences Cognitives) se tiendra le lundi 25 juin 2012 dans le cadre de la conférence IC2012. Il est programmé comme la première journée de la thématique « Sciences Cognitives et Intelligence Artificielle » (SCIA’12) orchestrée par l’AFIA. Du mythe d’Icare au projet de la biomimétique de J.M. Benyus, l’homme s’applique à copier la nature pour concevoir ou améliorer ses systèmes techniques. Dans le domaine de l’Intelligence Artificielle, de la robotique et du data-mining, on développe des algorithmes évolutionnaires ou des modèles d’optimisation inspirés du comportement des insectes sociaux. Dans tous les cas, il s’agit de s’inspirer de modélisations de structures existant dans la nature pour concevoir des dispositifs artificiels. L'Ingénierie des Connaissances a-t-elle intérêt à adopter une pareille démarche ? L’étude des mécanismes « naturels » de la cognition peut-elle offrir d’améliorer les performances des dispositifs de manipulation de connaissances ? L’atelier ICSC est également partenaire de l’atelier "Philosophie (du Web) et Ingénierie (des connaissances)" organisé par Alexandre Monnin, qui se déroulera la matinée du 25 juin et porte sur le thème "De l'importance des agencements sur le web" (http://web-and-philosophy.org/atelier-philosophie-du-web-et-ingenierie-des-connaissances-ic-2012/). La session de discussion générale qui clôt la journée réunira les participants des deux événements. Programme : ----------------- * 14h00 : Présentation de l’Atelier par Xavier Aimé (INSERM US 14, UMRS 872 équipe 20) et Gunnar Declerck (INSERM UMRS 872 équipe 20), Isabelle Tapiero (Présidente de l’ARCo) /et Yves Demazeau (Président de l'AFIA). Présentation de la thématique par Gunner Declerck. * 14h30 « Les technologies cognitives numériques pour stimuler et simuler la pensée » par Charles Tijus (CHart, Laboratoire Cognitions Humaine et Artificielle / LUTIN, Laboratoire des Usages en Technologies d’Information Numériques). * 15h00 « L’Intelligence Artificielle : l’approche des sciences de la complexité » par Jean-Claude Heudin (Institut de l’Internet et du Multimédia). * 15h30 « Augmenter l’intelligence d’une équipe avec une plateforme web de travail collaboratif en temps réel et en mode moteur d’innovation massivement parallèle » par Joël Muzard (AIA, Applied Intelligence Atelier, Montréal). *16h00 Pause * 16h15 « Différentes manières de voir le concept de connaissance en sciences cognitives » par Benoit Le Blanc (ENSC- Institut Polytechnique de Bordeaux / Institut des Sciences de la Communication du CNRS). * 16h45 « Gradients de prototypicalité, un apport de la psychologie cognitive à l’ingénierie des ontologies » par Xavier Aimé (INSERM UMRS 872 EQ 20). * 17h15 « Linguistique et principes catégoriels, ou le leurre de l’engagement cognitif » par Jean-Baptiste Guignard (Centre for Cognitive Research, UMS 3327, CNRS / Université de Technologie de Compiègne). * 17h45 « Pour une ingénierie des connaissances dynamiques : prendre en compte la dynamique de l’activité et de ses inscriptions dans les systèmes d’interprétation » par Yannick Prié (LIRIS, UMR 5205, CNRS / Université Lyon 1). *18h15 Pause *18h20 Discussion générale Inscriptions : ----------------- L'atelier ICSC se tient dans le cadre de la conférence IC 2012 (http://ic2012.crc.jussieu.fr/). Les inscriptions se font sur le site de l'atelier ICSC : http://sites.google.com/site/ateliericsccog/ Organisation : ------------------- - Xavier Aimé (INSERM US14, UMRS 872 équipe20) - Gunnar Declerck (INSERM UMRS 872 équipe20) Partenaires : ------------------ * AFIA (Association Française d'Intelligence Artificielle) * ARCo (Association pour la Recherche Cognitive) * Fresco (Fédération française des étudiants et jeunes chercheurs en sciences de la cognition) * GRACQ (Communauté française d’acquisition et d’ingénierie des connaissances) * INSERM UMRS 872 équipe 20 (Ingénierie des Connaissances & Santé) * RISC (Relais d'Information sur les Sciences de la Cognition) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:36:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:36:37 +0200 Subject: Job: Stage, Generation de texte pour le web, Homeloc Message-ID: Date: Wed, 30 May 2012 19:09:27 +0200 From: Guillaume Cabane Message-ID: <2DB60D91B85645C5B143110F2AB73B51 at homeloc.com> X-url: http://www.sparrowmailapp.com/?sig Bonjour, Homeloc, startup Française basée à paris propose aux propriétaires de location de vacances une multidiffusion de leurs annonces. Dans ce cadre, Homeloc a déjà mis en place un système de génération de descriptions en langage naturel à partir des données structurées sur les offres de location de vacances. Pour ce projet Homeloc recrute un/une stagiaire avec des connaissances en traitement automatique des langues et la maîtrise d’au moins un langage dynamique (Python, Ruby, Perl, PHP…). Intégré à l’équipe technique Homeloc, il/elle interviendra sur l’amélioration et l’enrichissement des modèles de génération existants, ainsi que des règles linguistiques associées. Une offre de stage détaillée est disponible ici : https://docs.google.com/document/d/1-HS63xFtmN1siL870qQivJbwm03gvzFzJ9wQVcGRO9s/edit Cordialement, Guillaume Cabane Homeloc Co-fondateur & Directeur Marketing +33 (0) 6 83 93 74 58 Envoyé avec Sparrow (http://www.sparrowmailapp.com/?sig) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:39:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:39:50 +0200 Subject: These: Alexander Pak, Fouille d'opinion Message-ID: Date: Thu, 31 May 2012 18:21:16 +0200 From: Patrick Paroubek Message-ID: <1338481276.3036.17.camel at localhost> X-url: http://www.limsi.fr Alexander Pak soutiendra sa thèse intitulée "Automatic, Adaptive,and Applicative Sentiment Analysis" - Analyse de sentiments automatique, adaptative et applicative, le 13 juin 2012 au LIMSI-CNRS (Université Paris XI, Bat. 508, Orsay, http://www.limsi.fr) Résumé: L'analyse de sentiments est un des nouveaux défis apparus en traitement automatique des langues avec l'avènement des réseaux sociaux sur le WEB. Profitant de la quantité d'information maintenant disponible, la recherche et l'industrie se sont mises en quête de moyens pour analyser automatiquement les opinions exprimées dans les textes. Pour nos travaux, nous nous plaçons dans un contexte multilingue et multi-domaine afin d'explorer la classification automatique et adaptative de polarité. Nous proposons dans un premier temps de répondre au manque de ressources lexicales par une méthode de construction automatique de lexiques affectifs multilingues à partir de microblogs. Pour valider notre approche, nous avons collecté plus de 2 millions de messages de Twitter, la plus grande plate-forme de microblogging et avons construit à partir de ces données des lexiques affectifs pour l'anglais, le français, l'espagnol et le chinois. Pour une meilleure analyse des textes, nous proposons aussi de remplacer le traditionnel modèle n-gramme par une représentation à base d'arbres de dépendances syntaxiques. Dans notre modèle, les n-grammes ne sont plus construits à partir des mots mais des triplets constitutifs des dépendances syntaxiques. Cette manière de procéder permet d'éviter la perte d'information que l'on obtient avec les approches classiques à base de sacs de mots qui supposent que les mots sont indépendants. Finalement, nous étudions l'impact que les traits spécifiques aux entités nommées ont sur la classification des opinions minoritaires et proposons une méthode de normalisation des décomptes d'observables, qui améliore la classification de ce type d'opinion en renforçant le poids des termes affectifs. Nos propositions ont fait l'objet d'évaluations quantitatives pour différents domaines d'applications (les films, les revues de produits commerciaux, les nouvelles et les blogs) et pour plusieurs langues (anglais, français, russe, espagnol et chinois), avec en particulier une participation officielle à plusieurs campagnes d'évaluation internationales (SemEval 2010, ROMIP 2011, I2B2 2011). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:42:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:42:37 +0200 Subject: Appel: Colloque Res per nomen Message-ID: Date: Thu, 31 May 2012 19:30:42 +0200 From: EMILIA HILGERT Message-ID: <3995_1338485439_4FC7AABF_3995_5054_1_20120531193042.doeqo1ju0484gs00 at wmp.univ-reims.fr> X-url: http://www.res-per-nomen.org/respernomen/colloque-2013/Accueil-2013.html Chers collègues, Le quatrième colloque Res per nomen a comme thème « Les théories du sens et de la référence. Hommage à Georges Kleiber » et se déroulera à l?Université de Reims du 30 mai au 1er juin 2013. Vous trouverez l?appel à communications et autres informations utiles sur le site http://www.res-per-nomen.org/respernomen/colloque-2013/Accueil-2013.html Bien cordialement. Les organisateurs, Emilia Hilgert Silvia Palma Pierre Frath René Daval P.S. Il est possible que vous receviez plusieurs fois ce message, parce que certaines listes de diffusion peuvent se recouper. Veuillez nous en excuser. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:44:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:44:57 +0200 Subject: These: Houda Bouamor, Etude de la paraphrase en TAL Message-ID: Date: Fri, 01 Jun 2012 09:30:08 +0200 From: Houda Bouamor Message-ID: <4FC86F80.8070409 at limsi.fr> Bonjour, J'ai l'immense plaisir de vous inviter à la soutenance de ma thèse intitulée /«*Étude de la paraphrase en Traitement Automatique des Langues*»/ qui aura lieu le Lundi 11 Juin 2012 à 14h30 dans la salle de conférence du LIMSI-CNRS. Vous trouverez plus d'informations pour se rendre au CNRS-LIMSI à l'adresse suivante http://www.limsi.fr/Pratique/acces/. Bien évidemment, vous êtes conviés au traditionnel pot qui suivra. J'espère vous y voir nombreux le jour venu. Le jury sera composé de : *Rapporteurs* Yves Lepage, Professeur à l'Université de Waseda Emmanuel Morin, Professeur à l'Université de Nantes *Examinateurs* Adeline Nazarenko, Professeure à l'Université Paris-Nord Philippe Langlais, Professeur à l'Université de Montréal François Yvon, Professeur à l'Université Paris Sud *Directeurs* Anne Vilnat, Professeure à l'Université Paris Sud Aurélien Max, Maître de Conférences à l'Université Paris-Sud *Résumé* La variabilité en langue est une source majeure de difficultés dans la plupart des applications du traitement automatique des langues. Capturer automatiquement des équivalences sémantiques entre des unités de texte ayant des formes différentes est une tâche complexe mais qui s'avère indispensable dans de nombreux contextes. Dans cette thèse, nous proposons une étude détaillée de la tâche d'acquisition de paraphrases sous-phrastiques à partir de paires d'énoncés sémantiquement liés. Nous démontrons empiriquement que les corpus parallèles monolingues, bien qu'extrêmement rares, constituent le type de ressource le plus adapté pour ce genre d'étude. Nos expériences mettent en jeu cinq techniques d'acquisition, représentatives de différentes approches et connaissances, en anglais et en français. Afin d'améliorer la performance en acquisition, nous réalisons la combinaison des paraphrases produites par ces techniques par une validation reposant sur un classifieur automatique à maximum d'entropie bi-classe. Un résultat important de notre étude est l'identification de paraphrases qui défient actuellement les techniques étudiées, lesquelles sont classées et quantifiées en anglais et français. Nous examinons également dans cette thèse l'impact de la langue, du type du corpus et de la comparabilité des paires des énoncés utilisés sur la tâche d'acquisition de paraphrases sous-phrastiques. Nous présentons le résultat d'une analyse de la performance des différentes méthodes testées en fonction des difficultés d'alignement des paires de paraphrases d'énoncés. Nous donnons, ensuite, un compte rendu descriptif et quantitatif des caractéristiques des paraphrases trouvées dans les différents types de corpus étudiés ainsi que celles qui défient les approches actuelles d'identification automatique. Mots clés : Corpus monolingues, Acquisition de paraphrase, Classification automatique de paraphrase, Typologie de paraphrase Houda Bouamor LIMSI-CNRS & Univ. Paris Sud ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:49:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:49:16 +0200 Subject: Sujet de these: Methodes d'adaptation d'un systeme d'extraction d'information, CEA LIST/LVIC, Saclay Message-ID: Date: Fri, 1 Jun 2012 09:50:19 +0000 From: FERRET Olivier 174579 Message-ID: <97E651D22799554F8E83493187BE08C902B5FFA6 at EXDAG0-B3.intra.cea.fr> X-url: http://www-instn.cea.fr/-Theses-Financement-Candidatures-.html?lang=fr X-url: http://www-instn.cea.fr/spip.php?page=Publication_Sujet&idSujet=7697&lang=fr&langue=fr&id_rubrique=70 Offre déjà parue mais toujours ouverte. Nous recherchons des étudiants intéressés par une thèse dans le domaine de l'extraction d'information et désireux de candidater à un financement de thèse CEA CTBU (cf. http://www-instn.cea.fr/-Theses-Financement-Candidatures-.html?lang=fr pour les conditions à remplir par les candidats et les modalités d'une telle candidature). L'objectif de la thèse est plus précisément d'étudier les méthodes permettant d'adapter le plus rapidement possible un système d'extraction d'information défini dans un domaine donné à un autre domaine, voire une autre langue. CONTEXTE La thèse se situe dans le contexte de l'extraction d'information, domaine dont l'objectif est d'identifier des événements ou des faits dans des textes et de structurer les informations retenues. Le plus souvent, cet objectif prend la forme d'une tâche de remplissage de formulaires (templates) prédéfinis à partir de textes. Ainsi, pour un formulaire centré sur les événements sismiques, l'objectif est pour chaque tremblement de terre détecté dans un texte de localiser des informations telles que sa localisation, sa magnitude, sa date et son heure. Un extrait de texte tel que "En visite sur place, le vice-premier ministre Besir Atalay a confirmé que 25 bâtiments s'étaient effondrés à la suite du séisme d'une magnitude de 5,6. Il s'est produit à 20h23 mercredi soir, avec un épicentre localisé dans le district d'Edremit, à 17 kilomètres au sud de Van." doit ainsi permettre à un système d'extraction d'information de remplir un formulaire typique sur les tremblements de terre qui aurait la forme suivante : FORMULAIRE « TREMBLEMENT DE TERRE » lieu : district d'Edremit, à 17 kilomètres au sud de Van magniture : 5,6 heure : 20h23 date : mercredi soir Sa mise en oeuvre demande néanmoins des moyens humains importants, que ce système soit construit sur la base de règles élaborées manuellement ou bien par apprentissage, à partir d'un corpus annoté lui-même manuellement. Un des défis actuels dans le domaine de l'extraction d'information, comme pour beaucoup d'autres applications liées au traitement automatique des langues, est donc de développer des méthodes permettant de réduire, dans la mesure du possible, le coût et le temps de développement de systèmes pour un contexte applicatif donné (domaine, type d'information à extraire et langue). OBJECTIFS DE LA THESE La thèse se propose d'aborder la problématique de l'adaptation à un nouveau domaine selon trois axes, dans le prolongement des travaux déjà réalisés au laboratoire LVIC : - le développement de processus d'extraction d'information génériques. L'idée sous-jacente est de limiter autant que possible l'utilisation d'heuristiques propres aux domaines considérés, utilisation souvent efficace mais dont l'absence de généricité pose problème pour la transposition d'un domaine à un autre. Cette amélioration de la généricité des processus d'extraction, initiée dans (Jean-Louis et al., 2011a), passe en particulier par le recours à des analyses de nature discursive ; - la minimisation de la dépendance vis-à-vis d'un domaine des modèles construits par apprentissage pour implémenter les processus d'extraction. Cette minimisation, elle aussi initiée dans (Jean-Louis et al., 2011a), est obtenue notamment par l'utilisation de caractéristiques excluant le vocabulaire spécifique d'un domaine. L'objectif dans ce cadre est de compenser la perte de performance qui résulte le plus souvent de cette restriction par une certaine stabilité des résultats d'un domaine à un autre ; - l'utilisation d'approches semi-supervisées qui, à l'instar de la supervision distante, permettent de définir l'adaptation à un nouveau domaine par la donnée d'exemples de structures à extraire liées à ce domaine (relations ou templates) plutôt que par l'annotation de corpus. À la suite de (Jean-Louis et al., 2011b), l'idée est ici de conjuguer la projection de ces structures dans des corpus caractéristiques du domaine cible et l'utilisation de techniques d'extraction génériques telles que celles développées par exemple dans (Wang et al., 2011) pour construire des exemples annotés pour ce domaine. Le laboratoire LVIC du CEA LIST dispose d'une plate-forme modulaire de traitement des langues, LIMA, permettant de réaliser une analyse linguistique d'un texte allant jusqu'au niveau syntaxique et intégrant certaines analyses sémantiques et discursives. Le doctorant réalisera son travail en s'appuyant sur cette plate-forme et bénéficiera des travaux en extraction d'information déjà réalisés au sein du laboratoire, dans plusieurs domaines (domaines des événements sismiques et de la finance). Ludovic Jean-Louis, Romaric Besançon and Olivier Ferret. 2011a. Text Segmentation and Graph-based Method for Template Filling in Information Extraction. 5th International Joint Conference on Natural Language Processing (IJCNLP), Chiang Mai, Thailand. Ludovic Jean-Louis, Romaric Besançon, Olivier Ferret and Adrien Durand. 2011b. A weakly supervised approach for large scale relation extraction. 3rd International Joint Conference on Knowledge Discovery and Information Retrieval (KDIR 2011), Paris, France. Wei Wang, Romaric Besançon, Olivier Ferret and Brgitte Grau. 2011. Filtering and Clustering Relations for Unsupervised Information Extraction in Open Domain. 20th ACM Conference on Information and Knowledge Management (CIKM), Glasgow, UK. COMPETENCES REQUISES - niveau M2 recherche (ou ingénieur) en Informatique avec une spécialisation en Traitement Automatique des Langues - familiarité avec les méthodes d'apprentissage statistique - langage C++ ainsi qu'un langage de script de type Perl ou Python ; système d'exploitation Linux La thèse sera rémunérée selon les barèmes du CEA et se déroulera au sein du Laboratoire Vision et Ingénierie des Contenus (LVIC) du CEA LIST, situé dans le centre NanoInnov, sur le plateau de Saclay, à proximité de l'école Polytechnique. Les candidats intéressés par ce sujet de thèse sont invités à prendre contact rapidement avec Olivier Ferret (olivier.ferret__.cea.fr) et Romaric Besançon (romaric.besancon__.cea.fr) en envoyant un CV détaillé et une lettre de motivation. Ce sujet de thèse est également référencé au niveau du site Web du CEA à l'adresse : http://www-instn.cea.fr/spip.php?page=Publication_Sujet&idSujet=7697&lang=fr&langue=fr&id_rubrique=70 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:53:17 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:53:17 +0200 Subject: Cursus: Master Linguistique Informatique, Paris Diderot Message-ID: Date: Fri, 1 Jun 2012 16:45:05 +0200 From: Pascal Amsili Message-ID: <20120601144505.GB30353 at courlis.linguist.jussieu.fr> X-url: http://li.linguist.univ-paris-diderot.fr/ Cursus : Master Linguistique informatique Paris Diderot Site web : http://li.linguist.univ-paris-diderot.fr/ Présentation : Le cursus de Linguistique Informatique de Paris Diderot (Paris 7) a pour objectif de former des spécialistes dans le secteur du "Traitement Automatique des Langues" (TAL). Ce secteur de pointe correspond à l'application de programmes et techniques informatiques à tous les aspects du langage humain depuis la reconnaissance de la parole jusqu'à l'analyse sémantique du contenu d'un texte. Il s'agit à la fois d'un domaine technologique et d'un domaine de recherche. Le domaine technologique est organisé autour d'un certain nombre d'applications, dont les plus connues sont la traduction automatique (historiquement la première application, dès les années 1950), la correction orthographique, la recherche d'information, le résumé de texte, la génération de texte, la synthèse de la parole, la reconnaissance vocale. Du point de vue de la recherche, la linguistique informatique s'appuie sur des résultats en linguistique formelle (mathématique), en informatique fondamentale, et en ingénierie. Le cursus de Linguistique Informatique de Paris Diderot a toujours été caractérisé par l'ambition de proposer, dans un département de linguistique spécialisé en linguistique formelle, une formation de qualité en informatique, avec des exigences comparables à celles des filières scientifiques. Pour mener à bien ce projet, le cursus appuie sa formation sur le département de linguistique, le département d'informatique, et les équipes de recherches associées. Il bénéficie à plein de la pluri-disciplinarité qui caractérise l'université Paris Diderot. Organisation de la formation : Ce cursus offre une formation qui commence dès la troisième année de licence et comporte ensuite deux années de master avec deux orientations (pour la 2e année) : professionnelle ou recherche. - Master 1ère année : Le premier semestre comporte des enseignements en linguistique (communs au master 1 de linguistique), et en informatique (dispensés par des enseignants de l'UFR d'informatique). Les étudiants venant plutôt de filières informatiques suivent des cours d'informatique communs au M1 d'informatique. Les étudiants dont le parcours antérieur est plutôt linguistique ou littéraire reçoivent des cours d'informatique communs avec le L3 d'informatique, ou des cours spécifiques. A ces enseignements "disciplinaires" s'ajoutent des enseignements en traitement automatique des langues et en linguistique computationnelle. - Master 2ème année professionnel : Il s'adresse à des étudiants désireux de s'insérer dans le monde industriel à l'issue du master, en tant qu'ingénieur linguiste informaticien. L'année comporte : - des cours théoriques assurés par des enseignants-chercheurs - 8 cours orientés applications, assurés par des intervenants professionnels - un stage en entreprise (6 mois), validé par mémoire et soutenance Le cursus s'appuie sur sa longue expérience et des contacts soutenus avec des entreprises faisant appel au TAL, qu'il s'agisse de sociétés spécialisées, ou de grands groupes intégrant une équipe d'ingénierie linguistique. - Master 2ème année recherche : Il s'adresse à des étudiants qui envisagent une carrière de chercheur ou d'enseignant-chercheur. Les étudiants choisissent 5 séminaires en accord avec leur directeur de recherche. Ils préparent pendant l'année un mémoire de recherche, dans le cadre d'un stage en laboratoire. Le cursus bénéficie de la présence de plusieurs équipes de recherche (en particulier pour la linguistique informatique, l'équipe Alpage - www.alpage.fr - équipe mixte INRIA / Paris 7). Conditions d'accès et pré-requis : Il est possible d'intégrer le cursus de linguistique informatique à tous les niveaux proposés (L3, M1, M2). L'accès se fait dans tous les cas sur dossier. Niveau L3 : Il n'y a pas de pré-requis pour entrer au niveau L3. Niveau M1 : Pour une entrée directe en M1, il faut de plus satisfaire les pré-requis suivants (validés par une formation de niveau licence ou par examen d'entrée): - linguistique : Morpho-syntaxe, phonétique (niveau licence) - informatique : Algorithmique, Programmation (Java et/ou C/C++) (niveau licence) Des connaissances en mathématiques (langages formels, probabilités) sont un atout important. Niveau M2 : Pour une entrée directe en 2e année (plus rare), les pré-requis sont les mêmes que pour le M1, avec un niveau plus avancé. Une expérience ou une compétence dans le domaine du TAL est indispensable. Détail des conditions d'accès à retrouver sur le site http://li.linguist.univ-paris-diderot.fr/acces.html Contact : linguistique.informatique-A-ENLEVER at linguist.jussieu.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:37:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:37:28 +0200 Subject: Q: Classification performance across languages and language families Message-ID: [th - des réponses ont été envoyées sur la liste corpora] Date: Sat, 02 Jun 2012 13:40:07 +0200 From: Ralf Steinberger Message-id: <025501cd40b4$76198f90$624caeb0$@jrc.ec.europa.eu> X-url: http://langtech.jrc.ec.europa.eu/Documents/2012_LREC-JEX-final.pdf X-url: http://eurovoc.europa.eu/ X-url: http://langtech.jrc.ec.europa.eu/Eurovoc.html A question and an invitation to discussion. We recently carried out multi-label categorisation experiments on a mostly parallel set of documents in 22 languages, covering the language families Germanic, Romance, Slavic, Hellenic, Finno-Ugric, Baltic and Semitic. The document set is reasonably large (22K to 42K documents per language), using the thousands of subject domain categories from the EuroVoc thesaurus . The performance across languages was rather uniform, with the exception of the outlier Maltese, which performed considerably less well. The languages covered are Bulgarian, Czech, Danish, Dutch, English, Estonian, Finnish, French, German, Greek, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovenian, Spanish and Swedish. To my great surprise, the highly inflected agglutinative language Hungarian produced the best results of all. The five Germanic languages ended up in the top ten positions, the five Slavic languages in the bottom half. The results for the other language families were less consistent. Q1: Does anyone have an intuition how these results could be explained? Q2: Has anyone ran similar experiments with other types of classifiers or data? Are the results similar? My initial expectation had been that highly inflected languages would perform less well and that feature space reduction using lemmatisation would improve the results. However, our experiments for Czech, English, Estonian and French (described in Ebrahim et al., forthcoming) showed the contrary, rather consistently for all four languages and language families: (1) lemmatisation reduces the performance and (2) adding part-of-speech (POS) information to the word form and/or to the lemma improves the performance. Q3: Can we conclude that: the scarcer the feature space, the better the classification performance? Q4: If that were the case, why did Slavic languages (and Maltese) perform less well in our experiments? I would be pleased if you could share your own experience and/or your opinions. The classification tool (JRC EuroVoc Indexer JEX http://langtech.jrc.ec.europa.eu/Eurovoc.html ) and the multilingual document set can be downloaded from http://langtech.jrc.ec.europa.eu/Eurovoc.html . Details of our experiments are given in the two papers below. Steinberger Ralf, Mohamed Ebrahim & Marco Turchi (2012). JRC EuroVoc Indexer JEX - A freely available multi-label categorisation tool. Proceedings of the 8th international conference on Language Resources and Evaluation (LREC'2012), Istanbul, 21-27 May 2012. (PDF http://langtech.jrc.ec.europa.eu/Documents/2012_LREC-JEX-final.pdf ) Ebrahim Mohamed, Maud Ehrmann, Marco Turchi & Ralf Steinberger (forthcoming). Multi-label EuroVoc classification for Eastern and Southern EU Languages. In: Cristina Vertan & Walther v. Hahn: Multilingual processing in Eastern and Southern EU languages - Low-resourced technologies and translation. Cambridge Scholars Publishing, Cambridge, UK. Greetings, Ralf Ralf Steinberger European Commission – Joint Research Centre (JRC) URL: http://langtech.jrc.ec.europa.eu/RS.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:40:56 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:40:56 +0200 Subject: Appel: SSLST 2012 Message-ID: Date: Sat, 2 Jun 2012 17:24:59 +0200 From: "GRLMC" Message-ID: <710DDE6B87DA41A29192D929E46FE4BF at Carlos1> X-url: http://grammars.grlmc.com/sslst2012/ ********************************************************************* 2012 INTERNATIONAL SUMMER SCHOOL IN LANGUAGE AND SPEECH TECHNOLOGIES SSLST 2012 (formerly International PhD School in Language and Speech Technologies) Tarragona, Spain July 30 – August 3, 2012 Organized by: Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/sslst2012/ ********************************************************************* AIM: SSLST 2012 offers a broad and intensive series of lectures at different levels on language and speech technologies. The students choose their preferred courses according to their interests and background. Instructors are top names in their respective fields. The School intends to help students initiate and foster their research career. The previous event in this series was WSLST 2012: http://grammars.grlmc.com/wslst2012/ ADDRESSED TO: Graduate (and advanced undergraduate) students from around the world. Most appropriate degrees include: Computer Science and Linguistics. Other students (for instance, from Mathematics, Electrical Engineering, Philosophy, or Cognitive Science) are welcome too. The School is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. There is no overlap in the class schedule. COURSES AND PROFESSORS: - Jont B. Allen (U Illinois Urbana-Champaign), A Parametric Analysis of Speech Perception [introductory, 8 hours] - Hervé Bourlard (Idiap Research Institute, Martigny), Automatic Speech Recognition and Multilingual Speech Processing: HMM, Hybrid HMM/ANN and Posterior-based Systems [introductory/intermediate, 6 hours] - Marcello Federico (Bruno Kessler Foundation, Trento), Statistical Machine Translation [introductory/intermediate, 6 hours] - Giuseppe Riccardi (U Trento), Spoken Language Understanding [intermediate/advanced, 6 hours] - Noah A. Smith (Carnegie Mellon U), Probability and Structure in Natural Language Processing [intermediate, 9 hours] - Bayya Yegnanarayana (International Institute of Information Technology Hyderabad), Speech Signal Processing [introductory/intermediate, 8 hours] REGISTRATION: It has to be done on line at http://grammars.grlmc.com/sslst2012/Registration.php FEES: They are variable, depending on the number of courses each student takes. The rule is: 1 hour = - 10 euros (for payments until May 18, 2012), - 15 euros (for payments after May 18, 2012). PAYMENT PROCEDURE: The fees must be paid to the School's bank account: Uno-e Bank bank’s address: Julian Camarillo 4 C, 28037 Madrid, Spain IBAN: ES3902270001820201823142 BIC/SWIFT code: UNOEESM1 account holder: Carlos Martin-Vide GRLMC account holder’s address: Av. Catalunya 35, 43002 Tarragona, Spain Please mention SSLST 2012 and your name in the subject. A receipt will be provided on site. Remarks: - Bank transfers should not involve any expense for the School. - People claiming early registration will be requested to prove that the bank transfer order was carried out by the deadline. - Students may be refunded only in the case when a course gets cancelled due to the unavailability of the instructor. People registering on site at the beginning of the School must pay in cash. For the sake of local organization, however, it is much recommended to do it earlier. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Students will be delivered a certificate stating the courses attended, their contents, and their duration. IMPORTANT DATES: Announcement of the programme: April 12, 2012 Starting of the registration: April 12, 2012 Early registration deadline: May 18, 2012 Starting of the School: July 30, 2012 End of the School: August 3, 2012 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat WEBSITE: http://grammars.grlmc.com/sslst2012/ POSTAL ADDRESS: SSLST 2012 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Diputació de Tarragona Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:43:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:43:50 +0200 Subject: Soft: New major release of the continuous space LM toolkit for SMT Message-ID: Date: Mon, 04 Jun 2012 01:14:04 +0200 From: Holger Schwenk Message-ID: <4FCBEFBC.2010109 at lium.univ-lemans.fr> X-url: http://www-lium.univ-lemans.fr/cslm/ I'm happy to announce the availability of a new version of the continuous space language model (CSLM) toolkit. Continuous space methods we first introduced by Yoshua Bengio in 2001 [1]. The basic idea of this approach is to project the word indices onto a continuous space and to use a probability estimator operating on this space. Since the resulting probability functions are smooth functions of the word representation, better generalization to unknown events can be expected. A neural network can be used to simultaneously learn the projection of the words onto the continuous space and to estimate the n-gram probabilities. This is still a n-gram approach, but the LM probabilities are interpolated for any possible context of length n-1 instead of backing-off to shorter contexts. CSLM were initially used in large vocabulary speech recognition systems and more recently in statistical machine translation. Improvements in the perplexity between 10 and 20% relative were reported for many languages and tasks. This version of the CSLM toolkit is a major update of the first release. The new features include: - full support for short-lists during training and inference. By these means, the CSLM can be applied to tasks with large vocabularies. - very efficient n-best list rescoring. - support of graphical extension cards (GPU) from Nvidia. This speeds up training by a factor of four with respect to a high-end server with two CPUs. We successfully trained CSLMs on large tasks like NIST OpenMT'12. Training on one billion words takes less than 24 hours. In our experiments, the CSLM achieves improvements in the BLEU score of up to two points with respect to a large unpruned back-off LM. A detailed description of the approach can be found in the following publications: [1] Yoshua Bengio and Rejean Ducharme. A neural probabilistic language model. In NIPS, vol 13, pages 932--938, 2001. [2] Holger Schwenk, Continuous Space Language Models; in Computer Speech and Language, volume 21, pages 492-518, 2007. [3] Holger Schwenk, Continuous Space Language Models For Statistical Machine Translation; The Prague Bulletin of Mathematical Linguistics, number 83, pages 137-146, 2010. [4] Holger Schwenk, Anthony Rousseau and Mohammed Attik; Large, Pruned or Continuous Space Language Models on a GPU for Statistical Machine Translation, in NAACL workshop on the Future of Language Modeling, June 2012. The software is available at http://www-lium.univ-lemans.fr/cslm/. It is distributed under GPL v3. Comments, bug reports, requests for extensions and contributions are welcome. enjoy, Holger Schwenk LIUM University of Le Mans Holger.Schwenk at lium.univ-lemans.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:46:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:46:59 +0200 Subject: Sujet de these: Analyse et caracterisation des Contextes Riches en Connaissances Message-ID: Date: Tue, 05 Jun 2012 17:37:23 +0200 From: Condamines Message-ID: <4FCE27B3.1000109 at univ-tlse2.fr> Proposition de thèse financée : *Analyse et caractérisation des Contextes Riches en Connaissances en corpus multilingue et multigenre pour l'aide à la traduction* Domaine : Linguistique de corpus, terminologie textuelle Laboratoire : CLLE-ERSS, UMR 5263 Toulouse Contexte : - Projet ANR CRISTAL (Contextes RIches en ConnaissanceS pour la TrAduction Terminologique) - Partenaires : LINA (Laboratoire d'Informatique de NAntes),responsable du projet et société Lingua et Machina, Directrice de thèse : Anne Condamines, DR CNRS L'objectif de la thèse consistera à travailler la notion de Contexte Riche en Connaissances (CRC) d'une part afin de décrire et caractériser ces contextes d'un point de vue linguistique et, d'autre part, de voir comment ils peuvent être repérer automatiquement en corpus. La notion de Contexte Riche en Connaissance a été proposée par (Meyer, 2001). Elle concerne des contextes qui, dans les corpus spécialisés, peuvent être utilisés pour définir les termes. Elle rejoint en partie la notion de marqueur de relation qui est utilisée, en terminologie textuelle et en ingénierie des connaissances, pour construire des réseaux terminologiques ou ontologiques. L'originalité de l'étude vient de ce qu'elle se fera à partir de corpus parallèles, organisés d'après le(s) genre(s) dont ils relèvent. Cette double variation : de la langue et du genre, sera prise en compte dans la description des CRC afin d'évaluer en quoi elle permet d'affiner leur description et leur repérage. Les résultats obtenus seront intégrés à un outil d'aide à la traduction afin de mieux cibler les réponses proposées aux utilisateurs. *Diplômes et compétences requises* Master en linguistique de corpus ou terminologie textuelle avec de bonnes connaissances en TAL Ou Master en TAL avec de très bonnes connaissances en linguistique Bon niveau d'anglais Contact : Anne Condamines, anne.condamines at univ-tlse2.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:50:42 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:50:42 +0200 Subject: Appel: Revue "Le discours et la langue", Metalangage et expression du sentiment linguistique "profane" Message-ID: Date: Tue, 05 Jun 2012 20:02:41 +0200 From: michelle lecolle Message-ID: <4FCE49C1.8060404 at univ-lorraine.fr> X-url: http://lediscoursetlalangue.wordpress.com/ APPEL A CONTRIBUTIONS « Le discours et la langue » lance un appel à contributions pour un numéro thématique : "Métalangage et expression du sentiment linguistique « profane »" pour parution en 2014. Le fichier joint contient l'appel à contribution et le calendrier, reproduit ci-dessous : ****Calendrier et modalités de soumission** - remise des résumés (1 page) : 1 septembre 2012 - signification aux auteurs : 1 octobre 2012 - remise des textes (entre 30 000 et 35 000 signes, espaces, notes et bibliographie comprises ) : 1 avril 2013 - signification aux auteurs, commentaires et relecture : 30 juin 2013 - remise des textes définitifs : 1 novembre 2013 Michelle Lecolle, Université de Lorraine, CREM Adresse de la revue ////Le discours et la langue// http://lediscoursetlalangue.wordpress.com/ contact, résumés à envoyer à Michelle Lecolle : Michelle.Lecolle at univ-lorraine.fr ------------------------------------------------------------------------ Appel à contributions pour un numéro de Le discours et la langue à paraître en 2014 Métalangage et expression du sentiment linguistique « profane » Responsable du numéro Michelle Lecolle, Université de Lorraine, CREM Qu’elles soient professionnelles ou privées, les situations de communication favorisant les pratiques explicitement métalinguistiques sont nombreuses : commentaires politiques, critiques de presse, enseignement et apprentissage des langues, traduction, rédaction professionnelle ou amateure... Parallèlement, on constate la vivacité d’une activité éditoriale « grand public » centrée sur la langue et les pratiques discursives, et la présence significative sur le Web de sites dédiés au vocabulaire, à l’histoire des expressions, à la correction grammaticale, aux figures rhétoriques ; les forums qui y sont associés sont souvent fort vivants. Ces activités métalinguistiques, en tant qu’elles sont le fait d’« amateurs » – non linguistes, mais parfois savants –, font l’objet depuis quelques années d’un intérêt accru de la part de linguistes, sociolinguistes, historiens de la langue, dans l’espace francophone (voir Achard- Bayle et Paveau (dir.) 2008, et les références citées ; Achard-Bayle et Lecolle (dir.) 2009 ; Siouffi (dir.) 2012). Qu’elles soient abordées sous l’angle des rapports entre langue et culture, entre langue et sujets parlants, comme des manifestations de purisme (Paveau et Rosier 2008), en termes d’émotion, de jeu, de manipulation ; qu’elles donnent des indications (plus ou moins directes) sur des noeuds de problèmes ou des zones de changements de la langue ellemême, ou encore qu’elles fournissent des outils d’observation de l’apprentissage des langues ; qu’elles constituent, finalement, une source de renouvellement scientifique de la discipline, les activités métalinguistiques amateures possèdent de multiples enjeux, théoriques, méthodologiques ou applicatifs. De son côté, le métalinguistique, comme langage, comme activité, comme vocabulaire, a été étudié sous différents aspects : sémiotique et sémantique avec les travaux fondateurs de Josette Rey-Debove (1978), énonciatif chez Jacqueline Authier-Revuz (1995) et, naturellement, dans une perspective historique (Auroux (dir.) 1989, 1992, 1997). Des ouvrages collectifs (Colombat et Savelli (dir.) 2001 et tout récemment Glikman, Mansour, Weiser (dir.) 2012) se centrent sur le vocabulaire métalinguistique en tant que terminologie de la linguistique. Enfin, la question de la terminologie linguistique et grammaticale parcourt les écrits théoriques de didactique des langues (voir, entre autres, Petitjean (dir.) 1998 ; Paveau et Rosier (dir.) 2005 ; Chiss et David 2011). Dans ce numéro du Discours et la langue, on propose de situer la réflexion à l’intersection des deux problématiques évoquées : il s’agit de se centrer sur l’emploi du métalangage dans le cadre de pratiques métalinguistiques « profanes ». Sous le terme de « métalangage » on entendra ici spécifiquement le vocabulaire spécialisé de la linguistique (dans lequel on englobe celui de la grammaire, de la rhétorique, de la stylistique). Les études sur l’histoire de la terminologie linguistique de tradition latine (B. Colombat) soulignent que cette terminologie, en particulier les termes reçus, est loin d’être cohérente. Il en est de même si l’on envisage les termes en synchronie. Les acceptions spécialisées de vocabulaire courant, sources potentielles d’ambigüité (genre, mode, voix, aspect, mais aussi figure, pour ne citer que des noms du lexique français) côtoient une terminologie réellement spécifique (morphème, lexème, diathèse ou encore zeugme, oxymore…). Des termes sont étendus hors de leur domaine d’application traditionnel, non sans problème (grammaire de phrase/grammaire de texte, voir les travaux de B. Combettes). Cette situation, à laquelle il faut ajouter la trompeuse familiarité avec le vocabulaire de la grammaire scolaire, est sans nul doute facteur de flottements et d’incertitude dans l’apprentissage de la discipline. Dans un cadre scolaire, l’introduction, par le biais des Instructions officielles ou des manuels, des notions et de la terminologie linguistiques occasionne des difficultés spécifiques, sources potentielles de crispations ou de conflits. Mais cette complexité peut aussi, paradoxalement, séduire. On constate en effet que le vocabulaire « savant » de la linguistique et plus encore de la rhétorique apparaît dans des contextes à première vue inattendus – des études systématiques permettraient de préciser ces emplois et leurs contextes. On attend donc de ce numéro qu’il apporte des analyses croisées sur l’appropriation du métalangage dans des énoncés métalinguistiques « profanes », et sur leurs modalités – le point de vue adopté n’étant pas, a priori du moins, celui d’une dégradation ou d’un dévoiement du métalangage dans le discours profane, mais plutôt celui d’une attention spécifique portée à la porosité de la frontière entre pratiques discursives « savantes » et « profanes ». On propose, à titre indicatif, les axes suivants, qui peuvent être abordés isolément ou de manière croisée, et en envisageant leurs enjeux didactiques. Un premier axe permettra d’étudier la terminologie de la linguistique d’un point de vue sémantique, à travers les emplois qui en sont faits dans des activités métalinguistiques amateures : quels termes sont employés, ou privilégiés ? Certains fonctionnent-ils en série ? En système ? Peut-on observer un changement du sens des termes, et ce changement est-il systématisable ? Un deuxième axe abordera la question des contours et des limites de la terminologie linguistique, vus à travers le prisme des discours de non-spécialistes. Ici se trouvera questionnée la distinction entre métalangage savant et métalangage ordinaire, ou encore entre termes de linguistique et lexique susceptible de relever plutôt de disciplines connexes : des mots tels que contradiction, raisonnement/raisonner, voire pensée/penser par exemple peuvent-ils encore être considérés comme métalinguistiques, et peut-on avancer des critères ? La question des variations du métalangage selon les parties du discours (nom, adjectif, verbe, adverbe métalinguistiques) se pose également. Enfin, peut-on, ou doit-on, poser une distinction entre métalangage et « métadiscours » (au sens, ici, d’une terminologie portant sur la pratique discursive : langue de bois, politiquement correct, petite phrase, élément de langage…) ? Un troisième axe abordera le fonctionnement du métalangage en discours à travers les contextes de son apparition : y a-t-il des situations qui privilégient l’emploi profane du métalangage ? Des types de discours ou des genres qui le prescrivent, ou l’évitent ? On s’intéressera ici également aux fonctions discursives de l’emploi du métalangage : prestige ? Rendement argumentatif ? Souci didactique, besoin d’explicitation ? Références Achard-Bayle G. et Lecolle M. (dir.), 2009, « Sentiment linguistique. Discours spontanés sur le lexique », Recherches Linguistiques n°30. Achard-Bayle G., Paveau M.-A. (dir.), 2008, « Linguistique populaire ? », Pratiques 139/140. Auroux S. (dir.), 1989, Histoire des idées linguistiques, tome 1, Liège-Bruxelles, Mardaga. Auroux S. (dir.), 1992, Histoire des idées linguistiques. t. II, Liège, Mardaga. Auroux S. (dir.), 1997, Histoire des idées linguistiques, t. III, Liège, Mardaga. Authier-Revuz J., 1995, Ces mots qui ne vont pas de soi. Boucles réflexives et noncoïncidences du dire, tome 1 et tome 2, Paris, Larousse. Chiss et David, 2011, « Didactique du français et étude de la langue », Le Français aujourd'hui, n°HS01, 2011/5. Colombat B. et Savelli M. (dir.), 2001, Métalangage et terminologie linguistique, Actes du Colloque de Grenoble, mai 1998. Bruxelles, Peeters, coll. « Orbis Supplementa ». Glikman J., Mansour L., Weiser S. (dir.), 2012, Le Vocabulaire Scientifique Et Technique En Sciences Du Langage, actes du colloque Col'Doc 2007. En ligne (cf. site Modyco) http://modyco.fr/fr/event/cat_view/1004-coldoc/1015-actes-de-colloques-en-ligne/1021-actescoldoc- 2007.html Houdebine A.-M. (dir.), 2002, L’imaginaire linguistique, Paris, l’Harmattan. Paveau M.-A. et Rosier L. (dir.), 2005, « Penser, classer. Les Catégories de la discipline », Le Français aujourd'hui 151, 2005/4. Paveau M.-A. et Rosier L., 2008, La langue française, passions et polémiques. Paris, Vuibert. Petitjean A. (dir.), 1998, « La transposition didactique en français », Pratiques 97/98. Rey-Debove J., 1978, Le métalangage : étude linguistique du discours sur le langage. Paris, Le Robert. Siouffi G. (dir.), à paraître en 2012, « Sentiment de la langue et diachronie », Diachroniques 2. Calendrier et modalités de soumission - remise des résumés : 1 septembre 2012 - signification aux auteurs : 1 octobre 2012 - remise des textes : 1 avril 2013 - signification aux auteurs, commentaires et relecture : 30 juin 2013 - remise des textes définitifs : 1 novembre 2013 Les résumés d’article (une page) sont à envoyer à michelle.lecolle at univ-lorraine.fr Attention : l’acception du résumé ne vaut pas engagement pour l’article lui-même. Taille des articles : entre 30 000 et 35 000 signes, espaces, notes et bibliographie comprises. Adresse de la revue Le discours et la langue http://lediscoursetlalangue.wordpress.com/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 09:01:52 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 11:01:52 +0200 Subject: Conf: ACL Workshop Program: Detecting Structure in Scholarly Discourse, Jeju Island, Korea, July 12, 2012 Message-ID: Date: Wed, 06 Jun 2012 10:01:15 +0200 From: "Sandor, Agnes" Message-ID: <4FCF0E4B.2070109 at xrce.xerox.com> X-url: http://www.nactem.ac.uk/dssd/programme.php We are happy to announce that the program for the ACL workshop ' Detecting Structure in Scholarly Discourse' has now been finalized, to be held on Jeju Island, Korea, on July 12, 2012- for an online version, seehttp://www.nactem.ac.uk/dssd/programme.php. Workshop Program: Time Presentation 9:00-10:30 Session 1: Exploiting Discourse Structure 9:00-9:45 Dae Hoon Park and Catherine Blake: "Identifying Comparative Claim Sentences in Full-Text Scientific Articles" 09:45-10:30 Ágnes Sándor and Anita de Waard: "Identifying Claimed Knowledge Updates in Biomedical Research Articles" 10:30-11:00 Coffee break 11:00-12:30 Session 2: Detecting Discourse Elements: 11:00-11:45 Awais Athar and Simone Teufel: "Detection of Implicit Citations for Sentiment Detection" 11:45-12:30 Tomoko Ohta, Sampo Pyysalo, Jun'ichi Tsujii and Sophia Ananiadou: "Open-domain Anatomical Entity Mention Detection" 12:30-14:00 Lunch break 14:00-15:30 Session 3: Taxonomies and Annotation 14:00-14:45 Maria Liakata, Paul Thompson, Anita de Waard, Raheel Nawaz, Henk Pander Maat and Sophia Ananiadou: "A Three-Way Perspective on Scientific Discourse Annotation for Knowledge Extraction" 14:45-15:30 Anita de Waard and Henk Pander Maat: "Epistemic Modality and Knowledge Attribution in Scientific Discourse: A Taxonomy of Types and Overview of Features" 15:30-16:00 Coffee break 16:00-17:00 Panel discussion on detecting and using discourse structure for scholarly text 17:00-17:30 Wrapup and close Discourse structure, as a field of research within computational linguistics, is attracting renewed research interest, due to its increasing relevance to diverse fields such as bio-medical text analysis, ethnography, and scientific publishing. Much effort is directed at detecting and modeling a range of discourse elements at different levels of granularity and for different purposes. Such elements include: the statement of facts, claims, and hypotheses; the identification of methods and protocols; and the detection of novelty in contrast to the re-stating of previous existing work. More ambitious long-term goals include the modeling of argumentation, rhetorical structure, and narrative structure. A broad variety of approaches and of features are used to identify discourse elements, including verb tense/mood/voice, semantic verb class, speculative language or negation, various classes of stance markers, text-structural components, or the location of references. The choice of features is often motivated by linguistic inquiry into the detection of subjectivity, opinion, entailment, inference, as well as author stance, author disagreement, motif and focus. Six submissions were selected for presentation at the workshop. The submissions represent three fundamental perspectives of research concerning discourse structure: taxonomy and annotation, exploiting cross-document structure in text mining, and detecting discourse elements in scholarly texts. Further development of discourse models and of systems is likely to bring together and integrate aspects from all three. At the same time, these three perspectives give rise to interesting contrasts and different research questions, for instance: Are explicit taxonomies and annotation levels necessary for text mining and for the identification of particular types of discourse elements? or, more generally: How do these different perspectives all relate to a central theory of discourse? The workshop aims to be a forum for discussion of these exciting questions. During the panel discussion time, we wish to summarize the state of the art and brainstorm on areas for development pertaining to the three main workshop topics: Exploiting Discourse Structure, Detecting Discourse Elements, and Taxonomies and Annotation. We greatly look forward to seeing you in Korea! The DSSD Organising Committee: Sophia Ananiadou School of Computer Science University of Manchester, UK Antal van den Bosch Centre for Language Studies Radboud University Nijmegen, The Netherlands Ágnes Sándor Xerox Research Europe Grenoble, France Hagit Shatkay Dept. of Computer and Information Sciences, College of Engineering University of Delaware, USA Anita de Waard Disruptive Technologies Director Elsevier Labs, USA Elsevier B.V. Registered Office: Radarweg 29, 1043 NX Amsterdam, The Netherlands, Registration No. 33156677 (The Netherlands) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 09:05:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 11:05:39 +0200 Subject: Appel: Linguistique de corpus a l'heure de la confrontation entre concepts, techniques et applications Message-ID: Date: Wed, 6 Jun 2012 10:16:51 +0200 (CEST) From: "sandra.augendre" Message-ID: <50697309.10432.1338970611212.JavaMail.www at wwinf2210> DEUXIÈME APPEL À COMMUNICATIONS La linguistique de corpus à l’heure de la confrontation entre concepts, techniques et applications 14-15 décembre 2012 Université Bordeaux 3 – EA 4195 TELEM – UMR 5263 CLLE-ERSSàB https://sites.google.com/site/corpus2012bordeaux3/ Date limite de réception des propositions : 20 juin 2012 Langues de communication : français, anglais Ce colloque sera centré autour de trois thèmes : A. comment coder les éléments discursifs à l’écrit et à l’oral ? quelles convergences, quelles divergences dans le codage de l’écrit et de l’oral ? Les logiciels d’annotation des corpus écrits sont déjà anciens et ils ne permettent pas toujours d’aboutir à un balisage robuste ; il reste donc un certain nombre de problèmes que l’on ne sait pas résoudre, tout en entrevoyant une solution (traitement du discours). L’annotation des corpus oraux est plus récente et pose encore de très nombreux problèmes : on peut parfois s’appuyer sur les solutions envisagées pour l’écrit parce que l’oral partage certaines propriétés avec l’écrit. Mais les dissemblances entre oral et écrit sont aussi très prégnantes : corrélation syntaxe / prosodie pour l’oral, cinétique de l’oral (l’oral se structure en se produisant), opposition oral monologal / oral dialogal, etc. Cela entraîne de grandes différences avec l’annotation de l’écrit. Nous nous confronterons à trois questions : comment traiter les phénomènes discursifs ? comment caractériser les convergences entre codage de l’écrit et codage de l’oral ? comment problématiser et caractériser la spécificité du codage de l’oral ? B. coder la multimodalité : enjeux et défis. Le codage des fichiers images et celui des vidéos présentent de nombreuses particularités. Si le son est a priori non parsable et donc rétif à l’emploi de XML, il conserve toutefois des points communs (chaîne linguistique, séquentialité, etc.). En revanche, l’image et l’image animée constituent des documents qui appellent surtout des métadonnées. Comment peut-on dès lors coder les vidéos ? Cette question en entraîne deux autres : comment coder les aspects iconiques de l’oral ? comment lier les codages des différents composants d’une vidéo ? C. de la linguistique de corpus aux digital humanities. La linguistique de corpus est de plus en plus confrontée à des champs connexes auxquels elle est de plus en plus appelée à participer. Le traitement de métadonnées l’expose à un parallélisme avec les grands projets portant sur les métadonnées (par exemple, le Dublin Core). Mais elle entre aussi dans l’élaboration des digital humanities, dans le fait que les Humanités ou SHS sont de plus en plus technologisées, ce qui appelle au moins deux questions : ces technologies agissent-elles sur les concepts des SHS ? comment ces technologies transforment-elles les procédures de traitement en SHS ? Dans ce cadre, nous devrons nous confronter aux questions suivantes. Comment la linguistique de corpus peut-elle jouer un rôle à ce niveau ? quelle part des digital humanities peut-elle assumer ? en quoi la TEI permet-elle d’articuler linguistique de corpus et digital humanities ? Frais d’inscription : universitaires extérieurs à l’université de Bordeaux : 30 € étudiants extérieurs à l’Université de Bordeaux : 20 € étudiants et personnels de l’Université de Bordeaux : gratuité A compter du 1/10/2012 : universitaires extérieurs à l’université de Bordeaux : 50 € étudiants extérieurs à l’Université de Bordeaux : 30 € MODALITÉS DE SOUMISSION D’UNE COMMUNICATION. Envoyer deux fichiers au format pdf à l’adresse suivante : colloque.corpus.bx3 at gmail.com Le premier fichier comportera le nom du ou des auteurs de la communication, le titre de la communication et le thème concerné (A, B ou C) du colloque. Le second fichier comportera le titre de la communication, le thème du colloque concerné et un résumé de deux pages maximum comportant une bibliographie. Le(s) nom(s) du/des auteur(s) ne pourra/pourront apparaître dans ce fichier que dans la bibliographie. COMITÉ SCIENTIFIQUE Guy ACHARD-BAYLE (Univ. de Lorraine & CREM EA 3476), Philippe BLACHE (Aix-Marseille & LPL UMR 7309), Lou BURNARD (Oxford & TGE Adonis), Paul CAPPEAU (Poitiers & FoReLL EA 3816), Thierry CHANIER (Clermont 2 & LRL EA 999), Ray COOKE (Bordeaux – Victor Segalen), Cécile FABRE (Toulouse 2, CLLE-ERSS UMR 5263), Evelyne JACQUEY (Univ. de Lorraine & ATILF UMR 7118), Marie-Noëlle LAMY (Open University & CREET), Benoît LE BLANC (ENSC-IPB & UMR 5218), Damon MAYAFFRE (Nice-Sophia Antipolis & BCL UMR 7320), Sylvie MELLET (Nice-Sophia Antipolis & BCL UMR 7320), Lorenza MONDADA (Bâle & ICAR UMR 5191), Sophie ROSSET (LIMSI UPR 3251), Véronique TRAVERSO (ICAR UMR 5191), Agnès TUTIN (Grenoble 3 & LIDILEM EA 609), Jean-Marie VIPREY (Univ. de Franche-Comté & ELLIADD EA 4661) COMITÉ D’ORGANISATION Sandrine AGUERRE, Sandra AUGENDRE, Jean-Luc BERGEY, Gilles BOYÉ, Jean-Sébastien BRILLEAUD, Marie-Odile HIDDEN, Anna KUPŚĆ, Catherine MATHON, NGUYEN Van Toan, Christelle ROUET-DELARUE, Henri PORTINE CALENDRIER Mi-juin : ouverture des inscriptions au colloque 20 juin : date limite de réception des propositions de communication 15 septembre : envoi des réponses aux auteurs des propositions 14 & 15 décembre : colloque Contact pour information : Henri.Portine at u-bordeaux3.fr ------------------------------------------------------------------------ CALL FOR PAPERS Corpus Linguistics: How to bind concepts, technique and application? 14th – 15th December 2012 Université Bordeaux3 – EA TELEM – UMR 5263 CLLE-ERSSàB https://sites.google.com/site/corpus2012bordeaux3/ Proposal submission deadline: 20th June 2012 Languages: French, English This conference will focus on three topics: A. how to encode discursive features in written and oral corpora? what are the convergences and divergences between encoding written and oral corpora? Software for encoding written corpora have existed for quite a long time and do not always produce a robust tagging. There are still a number of problems that cannot be solved, even though we can foresee solutions (discursive features). Oral corpora tagging is more recent and still presents numerous problems. It is sometimes possible to fall back on solutions worked out for written corpora, because oral language shares some characteristics with written language. But differences between oral and written communication are also significant: correlation between syntax and prosody for oral language, kinetics of the oral language (it is structured as it is being produced), opposition between monologal and dialogical oral language, etc. This means that there are important differences between oral and written tagging. Three questions arise: how to process discursive features? how to characterize the convergences between oral corpus tagging and written corpus tagging? how to characterize and address oral tagging specificities? B. tagging multimodality: issues and challenges Image and video tagging is quite particular. Even though sound a priori cannot be parsed, and therefore resists the use of XML, it still presents similarities with written language? (linguistic chain, sequentiality, etc.). However, images and videos are documents that imply metadata. Consequently, how to tag videos? This question leads to two more questions: how to tag iconic aspects of oral language? and how to match the different types of tagging of a video? C. from Corpus Linguistics to Digital Humanities Corpus Linguistics more and more faces connected fields that needs to be involved in. Its processing of metadata means that it is compared to other projects dealing with metadata (such as Dublin Core Metadata Initiative). Corpus Linguistics also participates in the design of Digital Humanities, since Humanities and Social Sciences become more and more technical, which leads to two questions at least: does technology influence concepts in this field. How does technology transform data processing in this field? Within this framework, we must address the following questions: how can Corpus Linguistics play a part at this level? what part of digital humanities can Corpus Linguistics take in charge? how can TEI be used to connect Corpus Linguistics and digital humanities? Registration fee: Academics: 30€ Students: 20 €From 01/10/2012: Academics: 50€ Students: 30 € SUBMISSION GUIDELINES Send two files in PDF to the following address: Colloque.Corpus.bx3 at gmail.com First file’s content will be: author’s or authors’ name(s), title of paper and relevant conference topic (A, B or C). Second file’s content will be: title of paper, relevant conference topic, and summary (two pages maximum, biography included). Authors’ names cannot appear on this file. SCIENTIFIC COMMITTEE Guy ACHARD-BAYLE (Univ. de Lorraine & CREM EA 3476), Philippe BLACHE (Aix-Marseille & LPL UMR 7309), Lou BURNARD (Oxford & TGE Adonis), Paul CAPPEAU (Poitiers & FoReLL EA 3816), Thierry CHANIER (Clermont 2 & LRL EA 999), Ray COOKE (Bordeaux – Victor Segalen), Cécile FABRE (Toulouse 2, CLLE-ERSS UMR 5263), Evelyne JACQUEY (Univ. de Lorraine & ATILF UMR 7118), Marie-Noëlle LAMY (Open University & CREET), Benoît LE BLANC (ENSC-IPB & UMR 5218), Damon MAYAFFRE (Nice-Sophia Antipolis & BCL UMR 7320), Sylvie MELLET (Nice-Sophia Antipolis & BCL UMR 7320), Lorenza MONDADA (Bâle & ICAR UMR 5191), Sophie ROSSET (LIMSI UPR 3251), Véronique TRAVERSO (ICAR UMR 5191), Agnès TUTIN (Grenoble 3 & LIDILEM EA 609), Jean-Marie VIPREY (Univ. de Franche-Comté & ELLIADD EA 4661) ORGANISING COMMITTEE Sandrine AGUERRE, Sandra AUGENDRE, Jean-Luc BERGEY, Gilles BOYÉ, Jean-Sébastien BRILLEAUD, Marie-Odile HIDDEN, Anna KUPŚĆ, Catherine MATHON, NGUYEN Van Toan, Christelle ROUET-DELARUE, Henri PORTINE KEY DATES Mid-June: registration opens 20th June: deadline for submissions 15th September: notification 14th – 15th December: Conference. Contact for information: Henri.Portine at u-bordeaux3.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 19:15:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 21:15:48 +0200 Subject: Job: Working with Watson, Postdoc positions available at TrentoRise (Italy) Message-ID: Date: Wed, 6 Jun 2012 11:42:13 +0200 From: Alessandro Moschitti Message-Id: <07191D1A-7C2D-4C4F-8863-45F9DAFAC624 at disi.unitn.it> X-url: http://hlt.fbk.eu/en/home Dear candidate, have you been fascinated by the IBM Watson system's achievements? Have you ever thought that you could contribute to it? If yes, there might be two great opportunities for this. TWO Post-doctoral positions for 1 year (with the possibility of extension) are available at the new IBM Language and Knowledge Center for Advanced Studies of TrentoRise - Italy (TrentoRise is a joint research institution including the University of Trento, FBK and other important research institutions of Trento) Position 1: Information Extraction and Question Answering (Ref.Code IBM_PostDoc2012_IEQA) This grant aims at developing a framework for Information Extraction and Retrieval based on deep linguistic analysis. The main idea of the framework is to provide a flexible pipeline of NLP and IR components, which can be used to model state-of-the-art systems, e.g., in the field of Question Answering. Candidate Profile: the candidate must hold a PhD in Computer Science, e.g., Computational Linguistics, Natural Language Processing, Information Retrieval or equivalent, and should be familiar with or willing to learn the following topics: - UIMA (Unstructured Information Management Architecture); - Named Entity Recognition & Normalization / Concept Segmentation and Labeling - Relation Extraction; - Question interpretation, answer classification and extraction - Dependency-based parsing, practice and theory - Semantic role labeling - Question analysis - Search engine design - Text Categorization/Filtering - Document/passage ranking and re-ranking using different sources - Indexing, search and retrieval for unstructured, semi-structured and structured data - Retrieval models for Question Answering - Relational models for sentence, paragraph and document representation Programming skills are important whereas knowledge of the Italian language is not required. Scientific tutors: Bernardo Magnini (FBK, Trento - http://hlt.fbk.eu/en/home) Alessandro Moschitti (University of Trento - http://disi.unitn.it/moschitti/ - http://projects.disi.unitn.it/iKernels/) Position 2: Machine Learning for NLP (Ref.Code IBM_PostDoc2012_LSM) This grant aims at modeling and implementing a machine learning framework, which can be applied for fast system prototyping. Kernel methods are seen as a viable approach to automatic feature engineering, which is a severe bottleneck for the design of real-world applications. The other interesting problem that will be studied concerns domain adaptation. Although the framework is supposed to be general, its primary application domain will be natural language processing. Candidate Profile: the candidate must hold a PhD in Computer Science, e.g., Machine Learning, Computational Linguistics, Natural Language Processing, data mining or equivalent and should be familiar with most of the following topics: - Discriminative models, including Support Vector Machines and other Max-Margin approaches, for tagging, extraction, (shallow) parsing and so on. - Advanced data representation through Kernel Methods and Kernel Machines - Online learning and Active Learning - Supervised, Semi-Supervised, Unsupervised Learning, Domain Adaptation, Multi-task Learning in NLP - Sequence labeling in NLP - Relational Learning - Graphical models, e.g., Conditional Random Fields and LDA, are a plus Scientific tutor: Alessandro Moschitti (University of Trento - http://disi.unitn.it/moschitti/ - http://projects.disi.unitn.it/iKernels/) Prof. Moschitti has been collaborating with the IBM Watson team since 2009. He has received two awards from IBM. The postdocs (if successful in their research) will have the possibility to collaborate with the IBM Watson team and carrying out working stage at IBM Watson of NY. You can directly apply to http://www.trentorise.eu/call-for-participation/bando-di-selezione-call-positions If you want to know more, please send an email to moschitti at disi.unitn.it subject: IBM-POSTDOCS2012 salary net per month: 2k euros The deadline for applications is June 30, 2012 (please note that the deadline indicated in the website above is going to be updated). Your curriculum must show an appropriate record of publications in the areas of ML, NLP/CL or IR. Best Alessandro ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 19:18:10 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 21:18:10 +0200 Subject: Conf: ACL 2012 Joint Workshop SP-Sem-MRL, July 12, 2012, Jeju, Korea Message-ID: Date: Wed, 6 Jun 2012 12:47:15 +0200 From: Marianna Apidianaki Message-Id: <22E56F91-6EF5-490B-BB23-BB9218582C8C at limsi.fr> ** Apologies for multiple postings ** ======================= CALL FOR PARTICIPATION ======================= ACL 2012 Joint Workshop on Statistical Parsing and Semantic Processing of Morphologically-Rich Languages (SP-Sem-MRL 2012) Endorsed by SIGLEX, SIGPARSE and the EU's PASCAL Network of Excellence July 12, 2012 - Jeju, Republic of Korea Registration: http://www.acl2012.org/registration/sub01.asp ------------------------------------------------------------------------ The joint workshop on Statistical Parsing and Semantic Processing of Morphologically Rich Languages (SP-Sem-MRL 2012) aims to build upon the successful first and second SPMRL workshops while extending the overall scope to include semantic processing where MRLs pose challenges for algorithms or models initially designed to process English. In statistical parsing, which has been a cornerstone of research in NLP and has seen great advances due to the widespread availability of syntactically annotated corpora, English parsing performance has reached a high plateau in certain genres, which is however not always indicative of parsing performance in MRLs, dependency-based and constituency-based alike. Semantic processing of natural language has similarly seen much progress in recent years. However, as in parsing, the bulk of the work has concentrated on English, and MRLs present challenges that the community is as of yet unaware of, and which current semantic processing technologies have difficulty coping with. These challenges may lurk in areas where parses are used as input, or where inadequate pre-processing of morphological variation hurts parsing and semantic tasks alike. The goal of this workshop is to encourage cross-fertilization among researchers working on different Morphologically Rich Languages and among those working on different levels of processing. The panel session of the workshop will be devoted to disclosing the data sets and evaluation procedures for the cross-linguistic cross-framework SPMRL 2013 Shared Task. Researchers who are interested in participating in the shared task are encouraged to attend the session and contribute to the discussion. For more information: https://sites.google.com/site/spsemmrl2012/ ** We are pleased to announce financial support in workshop registration fees for students, through the generous sponsorship of PASCAL Network of Excellence.** KEYNOTE SPEAKERS -------------------------------- Pr. Mark Steedman (University of Edinburgh) Title: Parsing with Case, Coordination, and Free Word-Order Ivan Titov (Saarland University) Title: Monolingual and Crosslingual Unsupervised Induction of Shallow Semantic Representations ACCEPTED PAPERS ------------------------------- ASSIGNING DEEP LEXICAL TYPES USING STRUCTURED CLASSIFIER FEATURES FOR GRAMMATICAL DEPENDENCIES João Silva and António Branco BUILDING AN ARABIC MULTIWORD EXPRESSIONS REPOSITORY Abdelati Hawwari, Kfir Bar and Mona Diab COMBINING RULE-BASED AND STATISTICAL SYNTACTIC ANALYZERS Iakes Goenaga, Koldobika Gojenola, María Jesús Aranzabe, Arantza Díaz de Ilarraza and Kepa Bengoetxea GENERATIVE CONSTITUENT PARSING AND DISCRIMINATIVE DEPENDENCY RERANKING: EXPERIMENTS ON ENGLISH AND FRENCH Joseph Le Roux, Benoit Favre, Alexis Nasr and Seyed Abolghasem Mirroshandel KOREAN TREEBANK TRANSFORMATION FOR PARSER TRAINING DongHyun Choi, Jungyeul Park and Key-Sun Choi MACHINE LEARNING OF SYNTACTIC ATTACHMENT FROM MORPHOSYNTACTIC AND SEMANTIC CO-OCCURRENCE STATISTICS Szymon Acedański, Adam Slaski and Adam Przepiórkowski PROBABILISTIC LEXICAL GENERALIZATION FOR FRENCH DEPENDENCY PARSING Enrique Henestroza Anguiano and Marie Candito STATISTICAL PARSING OF SPANISH AND DATA DRIVEN LEMMATIZATION Joseph Le Roux, Benoit Sagot and Djamé Seddah SUPERVISED LEARNING OF GERMAN QUALIA RELATIONS Yannick Versley UNSUPERVISED FRAME BASED SEMANTIC ROLE INDUCTION: APPLICATION TO FRENCH AND ENGLISH Alejandra Lorenzo and Christophe Cerisara USING AN SVM ENSEMBLE SYSTEM FOR IMPROVED TAMIL DEPENDENCY PARSING Nathan Green, Loganathan Ramasamy and Zdeněk Žabokrtský USING SYNTHETIC COMPOUNDS FOR WORD SENSE DISCRIMINATION Yannick Versley and Verena Henrich ORGANIZING COMMITTEE --------------------------------------- General chairs: Marianna Apidianaki (LIMSI-CNRS, France) Ido Dagan (Bar-Ilan University, Israel) Jennifer Foster (Dublin City University, Ireland) Yuval Marton (IBM Watson Research Center, US) Djamé Seddah (University of Paris 4, France) Reut Tsarfaty (Uppsala University, Sweden) Shared session chairs: Katrin Erk (University of Texas at Austin, US) Ines Rehbein (University of Potsdam, Germany) Peter Turney (National Research Council, Canada) Yannick Versley (University of Tuebingen, Germany) CONTACT ---------------- For any inquiries regarding the workshop please send an email to sp.sem.mrl2012 at gmail.com Website: https://sites.google.com/site/spsemmrl2012/ ENDORSMENT AND SPONSORS ------------------------------------------------ This workshop is endorsed by SIGLEX & SIGPARSE ; and sponsored by the PASCAL Network of Excellence & the INRIA's Alpage project. *********************************************************** ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 19:28:36 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 21:28:36 +0200 Subject: Job: Ingenieur en developpement d'applications Equipe SYNALP (CDD 3 mois), LORIA Nancy Message-ID: Date: Wed, 6 Jun 2012 13:45:44 +0200 From: Claire Gardent Message-ID: X-url: http://talc.loria.fr/ALLEGRO-Nancy,254.html *Offre d'Emploi : Ingénieur en développement d'applications Equipe SYNALP, LORIA Nancy (CDD 3 mois) * *Contexte* Le projet Allegro (http://talc.loria.fr/ALLEGRO-Nancy,254.html) est un projet financé par l’Union Européenne qui vise à proposer de nouvelles technologies permettant de faciliter l’apprentissage du français langue étrangère. Au sein de ce projet, l'équipe Synalp a développé un jeu sérieux interfaçant un générateur automatique d'exercices de grammaire avec un univers virtuel. Dans ce jeu (I-FLEG), l'apprenant marque des points en complétant des exercices de grammaires. *Mission* L'ingénieur recruté aura pour mission de développer un service web permettant d'éditer les ressources linguistiques (lexiques) utilisées par le jeu I-FLEG. Les ressources linguistiques sont stockées dans une base de données MySQL. Le service web développé devra permettre l'édition de ces ressources sous une forme interactive et collaborative. *Compétences et profil* Languages de programmation: Javascript and SQL Excellente connaissance des technologies du Web: PHP, GWT, JSP, Rails, Grails, etc Formation en informatique et connaissance du développement logiciel et des outils associés (gestionnaire de versions, etc.) Compétences ou aptitudes appréciées: TAL, Experience avec Java Maîtrise du système d'exploitation Linux Bonne faculté d'apprentissage et d'adaptation. Le goût du travail en équipe. *Lieu de travail, durée du contrat et salaire* Adresse : LORIA Nancy, Equipe Synalp, Bat. B 615, rue du jardin botanique 54600 Villers lès Nancy Type et durée : CDD 3 mois Début : Septembre 2012 Rémunération : Environ 2 300 Euros brut mensuel *Comment postuler* Envoyer CV et lettre de motivation à claire.gardent at loria.fr le plus rapidement possible Claire Gardent, Directrice de Recherche CNRS http://www.loria.fr/~gardent ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 19:45:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 21:45:26 +0200 Subject: Revue: RFLA XVII-1 / Langue parlee, norme et variations Message-ID: Date: Wed, 06 Jun 2012 16:11:45 +0200 From: Rfla Message-ID: <0513a292016df95e862c73fddd2aa4a0 at mwinf5d68.me-wanadoo.net> X-url: http://www.rfla-journal.org/ X-url: http://www.cairn.info/revue-francaise-de-linguistique-appliquee.htm ________________________________________________________________________ Revue Française de Linguistique Appliquée - volume XVII-1 / juin 2012 Langue parlée : norme et variation Les résumés des articles, ainsi que des informations sur les numéros déjà parus, sont disponibles sur le site de la revue : http://www.rfla-journal.org Les articles des différents numéros depuis 2001 sont accessibles en ligne sur le portail CAIRN : http://www.cairn.info/revue-francaise-de-linguistique-appliquee.htm Sommaire Présentation. Langue parlée : norme et variations (p. 5) Julien Eychenne (Groningen, Pays-Bas) & Bernard Laks (Paris Ouest Nanterre) Le programme Phonologie du Français Contemporain : bilan et perspectives (p. 7) Jacques Durand & Anne Przewozny (Toulouse-Le Mirail) (p. 25) La phonologie de l’anglais contemporain : usages, variétés et structure Françoise Gadet (Paris Ouest Nanterre), Ralph Ludwig (Halle, Allemagne), Lorenza Mondada (Basel, Suisse), Stefan Pfänder (Freiburg, Allemagne) & Anne-Catherine Simon (Louvain-la-Neuve, Belgique) Un grand corpus de français parlé : le CIEL-F. Choix épistémologiques et réalisations empiriques (p. 39) Hélène Blondeau (Gainesville, USA) Hors de LA norme point de salut ? La piste montréalaise de la variation des hypothétiques en si (p. 55) Juana Gil Fernández (CSIC, Madrid) L’enseignement de la prononciation : rapport entre théorie et pratique (p. 75) Sylvain Detey (Waseda, Japon) & Isabelle Racine (ELCF, Genève) Les apprenants de français face aux normes de prononciation : Quelle(s) entrée(s) pour quelle(s) sortie(s) ? (p. 81) Philippe Boula de Mareüil, Albert Rilliard & Alexandre Allauzen (LIMSI-CNRS) Variation diachronique dans le style journalistique : le cas de l’accent initial (p. 97) Martine Adda-Decker (Paris 3-LPP), Elisabeth Delais-Roussarie (Paris-Diderot-LFF), Cécile Fougeron (Paris 3-LPP), Cédric Gendrot (Paris 3-LPP) & Lori Lamel (LIMS-CNRS) La liaison dans la parole spontanée familière : une étude sur grand corpus (p. 113) Comptes rendus E. Putska, Einführung in die Phonetik und Phonologie des Französischen C. Salmon, Cent ans de français cadien en Louisiane. Etude sociolinguistique du parler des femmes F. Martineau & T. Nadasdi, Le français en contact. Hommages à Raymond Mougeon S. Garnier & A.D. Savage, Rédiger un texte académique en français D. Luzzati, Le français et son orthographe J. Humbley & O. Torres Vera, La traduction trilingue. Traduire du français vers l’anglais et l’espagnol HEL, volume 33-1 (2011), Linguistique appliquée et disciplinarisation R. Celi Pereira & P. Roca, Linguistica aplicada : un caminho com diferentes acessos C.Michel & M.-L. Nosh, Textile Terminologies in the Ancient Near East and Mediterranean from the Third to the First millennia BC Le numéro est en vente au tarif de 25 € (+ 4 € de frais d’envoi). Pour se le procurer, s’adresser à : Publications Linguistiques, secrétariat administratif, 15 rue Lakanal, 75015 Paris publiling at wanadoo.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:03:02 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:03:02 +0200 Subject: Conf: ACL 2012 3rd Workshop WASSA2012, Jul 12, 2012, Jeju, Korea Message-ID: Date: Wed, 06 Jun 2012 16:34:05 +0200 From: Alexandra Balahur Dobrescu Message-id: <4FCF6A5D.10901 at jrc.ec.europa.eu> X-url: http://gplsi.dlsi.ua.es/congresos/wassa2012/fitxers/WASSA_Program.pdf X-url: http://gplsi.dlsi.ua.es/congresos/wassa2012/ [Apologies for cross-postings. Please distribute. ] The workshop program is now available at: http://gplsi.dlsi.ua.es/congresos/wassa2012/fitxers/WASSA_Program.pdf ************************************************************************ 3rd Workshop on Computational Approaches to Subjectivity and Sentiment Analysis (WASSA 2012) - http://gplsi.dlsi.ua.es/congresos/wassa2012/ ************************************************************************ ************************************************************************ - Satellite workshop to ACL 2012 (Jeju, Korea) - Endorsed by SIGLEX, SIGNLL and SIGSEM - The best papers will be chosen for a Special Issue of the Computer Speech and Language Journal (Elsevier). - Subsequent to the WASSA 2012 acceptance notification, we will also launch an open call for papers for a Special Issue of the Information Sciences Journal (Elsevier). ************************************************************************ AIM OF WORKSHOP Research in automatic Subjectivity and Sentiment Analysis, as subtasks in Affective Computing within Natural Language Processing, has flourished in the past years, as the Social Web made it possible for people all over the world to express, comment or consult opinions on any given topic. The fact that so many people express themselves on these topics makes opinions less biased and more credible; their subjective nature makes them easily understandable by all people and leads to their growing influence on communities worldwide. Due to all these reasons, opinions expressed on the Web are more and more considered as basis for decision-making processes, for recommendation systems, business intelligence processes, image monitoring, and marketing or for obtaining unbiased, massive feedback. In spite of the growing body of research in the area in the past years, dealing with affective phenomena in text has proven to be a complex, interdisciplinary problem that remains far from being solved. Its challenges include the need to address the issue from different perspectives and at different levels, depending on the characteristics of the textual genre, the language(s) treated and the final application for which the analysis is done. Bearing in mind the abovementioned reflections, the aim of the 3rd Workshop on Computational Approaches to Subjectivity and Sentiment Analysis (WASSA 2012) is to continue the line of the previous two editions, bringing together researchers in Computational Linguistics working on Subjectivity and Sentiment Analysis and, more generally, on affect in text. Moreover, taking into account that affect-related phenomena have also been studied by other disciplines, such as Psychology, Philosophy or Economics, the purpose of WASSA 2012 is to facilitate an interdisciplinary dialogue on the analysis, requirements, issues and applications of the study of subjectivity and sentiment in the context of traditional and emerging text types. We envisage WASSA as a forum to discuss the achievements obtained so far and to analyse the different approaches to tackle the difficulties researchers are confronted with in this research area. ************************************************************************ TOPICS OF INTEREST Inspired by the objectives we aimed at in the first two editions of the Workshop on Computational Approaches to Subjectivity Analysis (WASSA 2010 and WASSA 2.011) and the final outcome, the purpose of the proposed 3rd edition of the Workshop on Computational Approaches to Subjectivity and Sentiment Analysis (WASSA 2012) is to create a framework for presenting and discussing the challenges related to subjectivity and sentiment analysis in NLP, from an interdisciplinary theoretical and practical perspective. Researchers are encouraged to submit papers including, but not restricted to the following topics related to subjectivity and sentiment analysis: . Lexical semantic resources, corpora and annotations for subjectivity and sentiment analysis . Subjectivity and opinion retrieval, extraction, categorization, aggregation and summarization . Topic and sentiment studies and applications of topic-sentiment analysis . Mass opinion estimation based on NLP and statistical models. . Domain, topic and genre dependency of sentiment analysis . Ambiguity issues and word sense disambiguation of subjective language . The computational treatment of large amounts of user-generated content . Pragmatic analysis of the opinion mining task . Use of Semantic Web technologies for subjectivity and sentiment analysis . Improvement of NLP tasks using subjectivity and/or sentiment analysis . Intrinsic and extrinsic evaluation methodologies for subjectivity and sentiment analysis . Subjectivity, sentiment and emotion detection in social networks . Trend detection in social media using subjectivity and sentiment analysis techniques . Classification of stance in dialogues . Real-world applications of opinion mining systems We will also encourage participants to provide demos of their systems, thus giving them the opportunity to obtain feedback on their achievements and issues. At the same time, with the help of demos, we aim at enriching the discussion forum with application-specific topics for debate. ************************************************************************ ORGANIZERS . Alexandra Balahur -- European Commission Joint Research Centre, Italy -- alexandra.balahur at jrc.ec.europa.eu . Andrés Montoyo - University of Alicante, Spain -- montoyo at dlsi.ua.es . Patricio Martínez-Barco - University of Alicante, Spain - patricio at dlsi.ua.es . Ester Boldrini - University of Alicante, Spain - eboldrini at dlsi.ua.es ************************************************************************ PROGRAM COMMITTEE . Khurshid Ahmad -- Trinity College Dublin, Ireland . Sivaji Bandyopadhyay - Jadavpur University, India . Nicoletta Calzolari - CNR Pisa, Italy . Erik Cambria -- University of Stirling, U.K. . José Carlos Cortizo - European University Madrid, Spain . Michael Gamon -- Microsoft . Jesús M. Hermida - University of Alicante, Spain . Veronique Hoste - University of Ghent, Belgium . Mijail Kabadjov -- Vicomtech, Spain . Zornitsa Kozareva - Information Sciences Institute California, U.S.A. . Rada Mihalcea - University of North Texas, U.S.A. . Saif Mohammad - National Research Council, Canada . Karo Moilanen -- Oxford University, U.K. . Rafael Muñoz - University of Alicante, Spain . Günter Neumann - DFKI, Germany . Alena Neviarouskaia -- University of Tokyo, Japan . Manabu Okumura -- Tokyo Institute of Technology, Japan . Constantin Orasan - University of Wolverhampton, U.K. . Manuel Palomar - University of Alicante, Spain . Viktor Pekar - University of Wolverhampton, U.K. . Paolo Rosso - Technical University of Valencia, Spain . Josef Steinberger -- EC- Joint Research Centre, Italy . Ralf Steinberger - EC- Joint Research Centre, Italy . Veselin Stoyanov -- John Hopkins University, U.S.A. . Maite Taboada - Simon Fraser University, Canada . Mike Thelwall - University of Wolverhampton, U.K. . José Antonio Troyano - University of Seville, Spain . Dan Tufis - RACAI, Romania . Alfonso Ureña -- University of Jaén, Spain . Erik van der Goot -- EC Joint Research Centre, Italy . Piek Vossen - Vrije Universiteit Amsterdam, The Netherlands . Marilyn Walker - University of California Santa Cruz, U.S.A. . Janyce Wiebe - University of Pittsburgh, U.S.A. . Michael Wiegand -- Saarland University, Germany . Theresa Wilson -- John Hopkins University, U.S.A. . Taras Zagibalov - Brantwatch, U.K. ************************************************************************ INVITED SPEAKERS . Prof. Dr. Rada Mihalcea -- University of North Texas, U.S.A. . Prof. Dr. Janyce Wiebe -- University of Pittsburgh, U.S.A. ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:07:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:07:05 +0200 Subject: Appel: Revue TAL, Gestion des erreurs en traitement automatique des langues Message-ID: Date: Wed, 06 Jun 2012 11:08:41 -0400 From: Francois Yvon Message-ID: <4FCF7279.2030002 at limsi.fr> X-url: http://tal-53-3.sciencesconf.org/ X-url: http://www.atala.org/-Revue-TAL [Nos excuses pour les envois multiples] PREMIER APPEL À CONTRIBUTIONS DU BRUIT DANS LE SIGNAL : GESTION DES ERREURS EN TRAITEMENT AUTOMATIQUE DES LANGUES UN NUMÉRO SPÉCIAL DE LA REVUE 'TRAITEMENT AUTOMATIQUE DES LANGUES' (TAL) La langue que les applications de traitement automatique des langues ont à traiter ressemble assez peu aux exemples parfaitement grammaticaux que l'on rencontre dans les livres de grammaire. Dans l'usage quotidien, les énoncés à traiter se présentent sous une forme imparfaite : les textes dactylographiés contiennent des erreurs de saisie, ainsi que de fautes d'orthographe et de grammaire ; les énoncés oraux correspondent souvent à des phrases incomplètes et contiennent des disfluences; les sorties des systèmes d'OCR contiennent de multiples confusion entre caractères, et celles des systèmes de reconnaissance vocale contiennent des transcriptions inexactes de ce qui a réellement été prononcé. Le bruit est donc inhérent au données langagières et ignorer cette réalité ne peut que nuire à la qualité de nos systèmes de traitement. Pour certaines applications, l'enjeu est de développer des mécanismes robustes vis-à-vis de ces erreurs. Par exemple, un système de dialogue pourra utiliser des mesures de confiance portant sur les hypothèses de reconnaissance vocale pour décider s'il doit demander à l'utilisateur de répéter. Pour d'autres applications, il sera nécessaire de faire appel à des techniques de correction automatique des erreurs; ainsi, par exemple, un système d'OCR pourra post-traiter les textes avec des modèles de correction contextuels pour valider l'orthographe des mots. Ce numéro spécial vise à rassembler des contributions portant sur la gestion des erreurs en traitement des langues. De nombreux sous-domaines du TAL ont besoin de prendre en compte le bruit et les erreurs dans les signaux linguistiques qu'ils considèrent, mais il est rare que des chercheurs issus de ces diverses communautés aient l'occasion de comparer leurs méthodes et leurs résultats. Notre ambition est de mettre en perspective des travaux issus de ces différents domaines de manière à encourager la fertilisation croisée des idées. Pour ce numéro spécial, nous considérons donc comme pertinent tout travail touchant au traitement automatique de données bruitées. Les sous-domaines les plus développés sont probablement la correction orthographique, et, dans une moindre mesure, la correction grammaticale; aucun de ces problèmes n'est pourtant complètement résolu, et la situation est encore moins satisfaisante quand on considère des erreurs plus profondes, touchant par exemple au style ou à l'organisation du discours. Les traitements robustes, qui visent à extraire le maximum d'informations utiles d'entrées potentiellement erronées, seront aussi favorablement considérés, que ces entrées se présentent sous forme écrite ou orale ; plus généralement, les études portant sur les stratégies de réparation d'erreur, par exemple dans les systèmes de dialogue ou d'autres systèmes analogues, sont également pertinentes pour ce numéro. Nous invitons donc les contributions portant sur tout aspect relatif au traitement des erreurs en TAL, et en particulier (liste non exclusive): * correction automatique de l'orthographe et de la grammaire * erreurs sémantiques et logiques * correction d'erreurs dans le style ou l'organisation du discours * correction d'erreurs "artificielles" (OCR, reconnaissance vocale, etc.) * correction automatique de requêtes à des moteurs de recherche * acquisition, annotation et analyse d'erreurs dans les textes réels * corpus d'erreurs * traitement des erreurs dans les langages contrôlés ***** * erreurs en apprentissage des langues * erreurs de performance * normalisation d'écrits non standards * TAL robuste * traitement de parole disfluente * traitement des erreurs en reconnaissance vocale * apprendre avec des données bruitées * mesures de la gravité des erreurs * mesures de confiance * fouille et analyse d'erreurs * auto-évaluation et diagnostic d'erreurs ÉDITEURS INVITÉS - Robert Dale (Macquarie University, Australia) - François Yvon (LIMSI/CNRS and Univ. Paris Sud, France) COMITÉ SCIENTIFIQUE (TBA) DATES IMPORTANTES - soumission des contributions : 15 octobre 2012 - première notification aux auteurs : 15 décembre 2012 - date limite pour les versions révisées : 1er février 2013 - décisions finales : 15 avril 2013 - versions finales : 15 juin 2013 - publication : été 2013 LE JOURNAL Depuis 40 ans, TAL (Traitement Automatique des Langues) est un journal international publié par l'ATALA (Association pour le Traitement Automatique des Langues) avec le soutien du CNRS. Depuis quelques années, il s'agit d'un journal en ligne, des versions papier pouvant être obtenues sur commande. Ceci n'affecte en rien le processus de relecture et de sélection. INFORMATIONS PRATIQUES Les articles (25 pages environ, format PDF) doivent être déposés sur la plateforme http://tal-53-3.sciencesconf.org/ Les feuilles de style sont disponibles sur le site web du journal (http://www.atala.org/-Revue-TAL). Le journal ne publie que des contributions originales, en français ou en anglais. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:12:33 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:12:33 +0200 Subject: Conf: Colloque sur l'annotation du fran=?ISO-8859-1?Q?=E7ais_?=parle, Paris, 19-21 juin 2012 Message-ID: Date: Wed, 6 Jun 2012 18:14:16 +0200 From: Sylvain Kahane Message-Id: <8579F6B2-F39D-44FD-8A8A-734FE40D6BDA at kahane.fr> Ce colloque de trois jours est organisé par Anne Lacheret, Sylvain Kahane et Paola Pietrandrea pour la cloture du projet ANR Rhapsodie commencé en 2008. L'objectif de ce projet est l'étude de l'intonosyntaxe du français parlé. Un corpus très richement annoté, le treebank Rhapsodie, sera présenté pendant les journées et mis en ligne à l'issu des journées (je vous enverrai un message quand ça sera en ligne). Il s'agit de 3h de parole (33 000 mots), formés d'une cinquantaine d'échantillons variés, avec pour la prosodie annotations des proéminences, structure prosodique arborescente, contours prosodiques simplifiés et pour la syntaxe, annotation morphosyntaxique, microsyntaxique en dépendance et annotation macrosyntaxique. L'ensemble du corpus est annoté, y compris les portions disfluentes. Le corpus sera livré avec un système de requètes élaboré et une interface relativement conviviale. L'ensemble du corpus, ainsi qu'une grande partie des outils, seront distribués librement (licence Creative Commons). Annotation syntaxique et prosodique du français parlé Autour du treebank Rhapsodie Mardi 19 juin (Paris 3 Censier, Salle Las Vergnas) Session 1 : Les livrables Rhapsodie 10h30-10h40 Anne Lacheret : Mots de bienvenu 10H40-11h10 Anne Lacheret, Sylvain Kahane, Paola Pietrandrea : Présentation de la chaine de traitement : de l’annotation au corpus annoté en ligne 11h10-11h40 Arthur Truong : Première démo du corpus en ligne 11h40-12h : Pause café 12h-12h20 Atanas Tchobanov : Présentation du site Rhapsodie 12h20-12h40-Anne Lacheret, Sylvain Kahane, Paola Pietrandrea : Présentation de l’ouvrage sur le treebank Rhapsodie 12h40-13h Paola Pietrandrea, Anne Lacheret : Corpus design et métadonnées 13h-14h30 : Déjeuner Session 3 : Outils pour l’annotation prosodique 14h30-14h50 Anne Dister, Jean-Philippe Goldman : Transcription et alignement 14h50- 15h10 Bernard Victorri : Analor : périodes et proéminences 15h10-15h30 Philippe Martin : Winpitch et nettoyage de la F0 15h30-15h50 : Pause café Session 4 : Annotation syntaxique 15h50-16h10 : Christophe Benzitoun, Frédéric Sabio: Structure macrosyntaxique 16h10-16h30 : Kim Gerdes, Sylvain Kahane : Structure microsyntaxique 16h30-16h50 : Kim Gerdes : Annotation semi-automatique avec Arborator Mercredi 20 juin (Salles des conférences, Bât. B, Paris Ouest Nanterre) Session 5 : Annotation syntaxique (outils) 10h00-10h20 : Julie Beliao : Du balisage manuel au treebank 10h20- 10h40 : Eric de la Clergerie : Analyse syntaxique automatique avec FRMG 10h40-11h00 : Pause café Session 6 : Annotation prosodique 11h00-11h20 : Anne Lacheret : Le treebank prosodique de Rhapsodie 11h20-11h40 : Piet Mertens : Annotation prosodique : de la stylisation aux niveaux de hauteur et aux contours de syllabe 11h40-12h00 : Julie Beliao, Nicolas Obin : Contours globaux 12h00-12h20 : Cédric Gendrot : Durée des syllabes 12h20-14h00 : déjeuner Session 7 : Treebank et interrogation 14h00-14h20 : Sylvain Kahane, Arthur Truong : Structure du treebank et de la base Rhapsodie 14h20-14h50 : Arthur Truong : Tutoriel sur le langage de requête 14h50-15h40 : Essai en groupe et discussion 15h40-16h00 : Pause café Session 8 : Exploitation du Treebank 16h00-18h00 : Requêtage sur le Treebank par petits groupes 18h00-19h00 : Retour sur les travaux d’exploitation (10 mn par groupe) 10’ Loiseau, Gerdes, Benzitoun : stats syntaxe 10’ Gendrot, Lacheret, Goldman : stats proso 10’ Martin, Kahane : interface micro-prosodie 10’ Avanzi, Sabio : interface macro-prosodie 10’ Pietrandrea, Beliao : interface prosodie-entassement Jeudi 21 juin (Salles des conférences, Bât. B, Paris Ouest Nanterre) Session 9 : Bilan Rhaspodie 10h00 -10h30 José Deulofeu : Bilan annotation macrosyntaxique : En quoi découpe-t-on un texte ? 10h30- 11h00 Anne Lacheret : Annotation prosodique : bilan et perspectives 11h00-11h30 Pause 11h30-12h30 : Anne Lacheret, Sylvain Kahane, Kim Gerdes, Arthur Truong: Retour sur la chaine de traitement : les réussites et les erreurs à ne pas répéter 12h00-13h30 : Déjeuner Session 10 : Le futur de Rhapsodie 14h00- 14h40 : Atanas Tchobanov, Arthur Truong : Maintenance et mise à jour du site Rhapsodie 14h40-15h00 Pause 15h00-17h00 : Table ronde : Elargissement du treebank Rhapsodie (ajouts d’échantillons, ajouts d’autres couches d’annotation, développement de la plateforme, etc.), dont discussion projet Orfeo (J.-M. Debaisieux) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:17:41 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:17:41 +0200 Subject: Job: Informaticien en Traitement Automatique des Langues, Vision Objects, Nantes Message-ID: Date: Wed, 6 Jun 2012 18:46:05 +0200 From: "Loïs Rigouste" Message-ID: <19e47c50$610a77f5$27765cbd$@com> Vision Objects est leader mondial de la technologie de reconnaissance d'écriture avec plus de 14 millions d'utilisateurs. Disponible dans plus de 85 langues, Vision Objects couvre un large éventail d'applications commerciales dans les domaines de la mobilité (smartphones[1], tablettes), de l’éducation (tableau blanc numérique interactif), de l’entreprise (prise de notes et traitement de formulaires) et de l’automobile (pilotage de GPS par exemple). Le moteur de reconnaissance de Vision Objects se classe régulièrement aux premières places des compétitions scientifiques internationales (cf., par exemple, ICDAR 2011). Dans le cadre de sa forte croissance, Vision Objects (Nantes, France) est à la recherche d'un : Ingénieur Informaticien en Traitement Automatique des Langues (TAL) Dans l'équipe Ressources Linguistiques, et en étroite collaboration avec l'équipe Technologie, vous serez amené à coordonner le développement de nouvelles langues et à être force de proposition sur l'amélioration de l’existant. Votre double compétence informatique et linguistique vous permet d’assumer avec succès vos différentes missions : - Création et maintenance des ressources linguistiques et gestion de leur intégration dans les moteurs de reconnaissance d'écriture manuscrite. - Constitution et traitement de corpus représentatifs. - Analyse des styles d’écritures manuscrites communément utilisés dans différentes langues. - Participation au processus de collecte d'échantillons d'écriture manuscrite. - Recherche et développement sur les modèles de langage (statistiques, syntaxiques ou sémantiques), et leurs applications aux interfaces homme-machine. - En lien avec l’équipe Support, étude et analyse de cas d’usage clients. De formation supérieure (Ingénieur ou Master2 + 3 ans d’expérience, ou Doctorat), vous avez une expérience en TAL ou dans un domaine proche (intelligence artificielle, reconnaissance des formes, apprentissage statistique…). Votre maîtrise d’au moins un langage de programmation utilisé en TAL (par exemple Perl ou Python) vous permet d’être complètement autonome sur toutes les tâches techniques. Rigoureux, dynamique, déterminé et d’un relationnel facile, vous saurez rapidement vous intégrer au sein des équipes et démontrer le leadership et l’expertise nécessaires à la réussite de votre mission. Anglais courant impératif. La maîtrise d'une langue non latine (notamment scripts asiatique, arabe, devanagari, cyrillique) serait un plus important. Contact : job at visionobjects.com ---------- [1] http://www.samsungmobileb2b.com/resource/case/entertainment_2.do ---------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:27:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:27:05 +0200 Subject: Appel: Unitex => Gramlab, Call for beta testers Message-ID: Date: Thu, 07 Jun 2012 09:34:47 +0200 From: Sébastien Paumier Message-ID: <4FD05997.2080804 at univ-mlv.fr> X-url: http://igm.univ-mlv.fr/~unitex X-url: http://www.gramlab.org Dear colleagues, I inform you that the beta version of Gramlab is now available for testing. Gramlab is an integrated development environment dedicated to local grammars automata creation, edition and diffusion. Gramlab allows computational linguists in collective or individual contexts to design or maintain grammar collections. Gramlab was build upon Unitex software and includes Unitex linguistic resources. It keeps most of Unitex features, and adds many ones including: - a project-oriented design allowing the user to work on several projects in parallel - a brand new Eclipse-like interface, remembering the user configuration when restarted - integrated SVN support for data sharing, including facilities for comparing and merging graphs - a workflow approach allowing the user to run with one click a full processing sequence (preprocessing, locate, concordance) - possibility to type some test text without having to edit a new corpus file - new graph edition features to manipulate box groups with a right click - named graph repositories - auto-refresh of opened files that have been modified - utf8 support There is no user documention yet, but if you already know Unitex, Gramlab should be intuitive enough for you. Since it is designed as a collaborative project, feel free to join our wikis and forums on SourceForge and give us inputs and use cases here. In order to test Gramlab, you have to install the latest version of Unitex 3.0beta (http://igm.univ-mlv.fr/~unitex), and run Gramlab.jar instead of Unitex.jar. Please report bugs, comments and questions to Fanny Grandry (grandry at kwaga.com). If you want to become a registered beta tester, you can ask her for an account on the bug tracking system we use. Best regards, Sébastien Paumier -------------------- Gramlab IDE was implemented by the GramLab Project, a FEDER-funded Research supported by Cap Digital. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:32:44 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:32:44 +0200 Subject: Journee: Unitex/Gramlab days, September 26th-27th 2012, University of Marne-la-Vall=?ISO-8859-1?Q?=E9e_?=(France) Message-ID: Date: Thu, 07 Jun 2012 09:35:11 +0200 From: Sébastien Paumier Message-ID: <4FD059AF.9060004 at univ-mlv.fr> X-url: http://www.gramlab.org Dear colleagues, I inform you that the "Unitex/Gramlab days" will take place on September 26th & 27th, at the University of Marne-la-Vallée (France). The first day will be dedicated to Unitex users that want to discover in details Gramlab, an IDE for linguists, that is the successor of Unitex. This is a new platform that keeps most of Unitex features, and adds many ones including: - a project-oriented design allowing the user to work on several projects in parallel - a brand new Eclipse-like interface, remembering the user configuration when restarted - integrated SVN support for data sharing, including facilities for comparing and merging graphs - a workflow approach allowing the user to run with one click a full processing sequence (preprocessing, locate, concordance) - possibility to type some test text without having to edit a new corpus file - new graph edition features to manipulate box groups with a right click - named graph repositories - auto-refresh of opened files that have been modified - utf8 support The second day will be dedicated to developers that want to have an overview of the C/C++/Java code of Unitex/Gramlab. It will include a description of the interaction between Unitex and Gramlab, a guided tour of the core parts of the code, a demo of how to use Unitex as a dynamic library from Java and Python, and a presentation of the persistence and virtualization features that can speed up batch processing. Please register before July 31th by sending to an email to paumier at univ-mlv.fr indicating to which day(s) you want to attend to and whether you speak French or not. Feel free to mention any particular topic or question you would like to be addressed during these days. Best regards, Sébastien Paumier -------------------- Gramlab IDE was implemented by the GramLab (http://www.gramlab.org) Project, a FEDER-funded Research supported by Cap Digital. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:56:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:56:05 +0200 Subject: Seminaire: INFOLINGU, Agata Savary, 11 juin 2012, LIGM, Universite Paris-Est, Marne-la-Vallee Message-ID: Date: Thu, 7 Jun 2012 15:04:11 +0200 From: Myriam RAKHO Message-ID: ************************************************************************ INFOLINGU Le séminaire de l'équipe Informatique Linguistique du Laboratoire d'Informatique Gaspard Monge (LIGM) Université Paris-Est Marne-la-Vallée ************************************************************************ Date : *Le Lundi 11 juin 2012 à 10h30* Lieu : Université Paris-Est Marne-la-Vallée Bâtiment Copernic, 4ème étage, salle de séminaires 4B08R Toute personne intéressée est la bienvenue. ************************************************************************ ------------------------------------------------------------------------ Intervenante : ------------------------------------------------------------------------ *Agata SAVARY* (Université François Rabelais Tours) ------------------------------------------------------------------------ Titre de la présentation : ------------------------------------------------------------------------ * **Annotation d'entités nommées dans le Corpus National du Polonais* ------------------------------------------------------------------------ Résumé de la présentation : ------------------------------------------------------------------------ Le Corpus National du Polonais, développé par l'Académie Polonaise des Sciences, est une grande collection de textes de 1,5 milliard de mots, de différents genres, dans laquelle des objets de différents types sont annotés linguistiquement : les phrases, les segments, les items morphosyntaxiques, les mots syntaxiques, les phrases syntaxiques, les entités nommées et les sens des mots. Un sous ensemble de 1 million de mots de ce corpus a été annoté manuellement. Nous évoquerons la méthodologie générale de construction d'un tel corpus multi-niveau, ainsi que la définition de son format conforme à la norme TEI P5. Ensuite nous présenterons de manière plus détaillée le schéma d'annotation des entités nommées. Seront discutés certains choix méthodologiques novateurs, tels que l'annotation des dérivés (adjectifs relatifs et gentilés des noms propres), ainsi que des unités imbriquées et discontinues. Nous montrerons des exemples de phénomènes linguistiques et extra-linguistiques qui défient le schéma d'annotation pré-établi. Les corpus annotés sont fréquemment utilisés pour l'entraînement d'outils à base d'apprentissage automatique qui peuvent ensuite servir à l'annotation de nouveaux corpus. Cependant, la représentation d'annotations fines selon des méthodes classiques en apprentissage, telles la méthode IOB, n'est pas toujours banale, notamment en ce qui concerne des unités non contiguës ou possédant des composants qui se chevauchent. Nous allons présenter des propositions de solutions à ces problèmes implantées dans un outil d'annotation automatique d'entités nommées NERF, basé sur les CRF (Conditional Random Fields). ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:00:43 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:00:43 +0200 Subject: Revue: TILV n52-53, Linguistique et phenomenologie du langage, ed. P. CADIOT Message-ID: Date: Thu, 7 Jun 2012 15:10:27 +0200 From: "Didier Bottineau" Message-ID: <0EF3D32F4DA04E3A836E8B79507BBADB at R12B0> Florence Lautel-Ribstein, Rédactrice-en-chef de la TILV, La Tribune Internationale des Langues Vivantes me prie d'annoncer la parution du Numéro 52-53 dirigé par Pierre CADIOT et intitulé "LINGUISTIQUE ET PHÉNOMÉNOLOGIE DU LANGAGE". Voici le sommaire : Éditorial Claude ROMANO : Les repères éblouissants. Sur l'antéprédicatif et la phénoménologie du langage David PIOTROWSKI : Sur la « concrétude » du signe : Saussure et Husserl Didier BOTTINEAU : La parole comme technique cognitive incarnée et sociale Franck LEBAS : Langue, perception, énonciation : pour une nouvelle triangulation sémiotique Dominique LEGALLOIS : Penser les relations entre synesthésies perceptuelles et synesthésies linguistiques : quelques repères et notes Julien LONGHI : Phénoménologie du mot calme : d'une lexicalisation des sensations à une phénoménologie discursive Jean-Michel SALANSKIS : Le pour soi et le langage Pierre CADIOT : Dire/montrer, champs phénoménaux et chiasmes interprétatifs Pour tout renseignement s'adresser à : Éditions Anagrammes 15, rue de la Poste 22700 PERROS-GUIREC 02 96 23 06 50 site : www.editions-anagrammes.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:01:55 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:01:55 +0200 Subject: Job: Position as Professor in Computational Linguistics, University of Gothenburg, Sweden Message-ID: Date: Thu, 7 Jun 2012 14:38:09 +0000 From: Åsa Abelin Message-ID: X-url: http://www.gu.se/english/about_the_university/announcements-in-the-job-application-portal/?id=19142&lang=en&tjanstNamn=Teacher%2F+post+doc&?id=19144&Dnr=506411&Type=E The department of Philosophy, Linguistics and Theory of Science at the University of Gothenburg invites applications for a position as Professor in Computational Linguistics: http://www.gu.se/english/about_the_university/announcements-in-the-job-application-portal/?id=19142&lang=en&tjanstNamn=Teacher%2F+post+doc&?id=19144&Dnr=506411&Type=E Please contact: Åsa Abelin Associate professor in General Linguistics Deputy head of department and doctoral studies Department of philosophy, linguistics and theory of science University of Gothenburg Olof Wijksgatan 6 Box 200 405 30 Göteborg, Sweden Tel: +46 31 786 5233 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:03:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:03:26 +0200 Subject: Cursus: Master Recherche linguistique et applications informatiques, Universite Bordeaux 3 Message-ID: Date: Thu, 07 Jun 2012 18:29:29 +0200 From: Anna.Kupsc at u-bordeaux3.fr Message-ID: <20120607182929.87867gpmvlhmoh8o at webmail.u-bordeaux3.fr> X-url: http://www.u-bordeaux3.fr/fr/formations/s_inscrire/inscription_en_1ere_ou_2eme_annee_de_master.html X-url: http://sdlcours.u-bordeaux3.fr/mod/forum/discuss.php?d=4887 Le Département de Sciences du Langage de l'Université Michel de Montaigne Bordeaux 3, propose un Master Recherche linguistique et applications informatiques (ReLAI). Le double objectif de ce Master est de permettre aux étudiants de s'intégrer dans la recherche en linguistique ou dans des équipes pluridisciplinaires de traitement informatique des langues. Cette formation vise à donner aux étudiants des connaissances de haut niveau couvrant tous les domaines constitutifs de la linguistique, avec une ouverture vers leurs applications informatiques. Les compétences développées sont le recueil, la description, et l'analyse des données linguistiques et leur formalisation à l'aide d'outils informatiques et de bases de données. Les enseignements offerts se caractérisent par une triple orientation : descriptive, théorique et appliquée. La diversité des langues (africaines, asiatiques, indo-européennes, entre autres) représentées donne à la formation une orientation résolument multilingue. Le Master ReLAI offre aux étudiants deux types de parcours : Recherche Linguistique ou Linguistique et Applications Informatiques qui se distinguent principalement au quatrième semestre. Durant les trois premiers semestres, la formation est commune aux deux parcours. Ceux-ci sont centrés sur l'approfondissement des connaissances dans les domaines clés de la linguistique ainsi que l'utilisation d'outils, d'applications et ressources informatiques en vue du traitement automatique des langues. Au quatrième semestre, l'étudiant choisit de s'orienter vers le parcours « Recherche Linguistique » avec un mémoire de recherche ou le parcours « Linguistique et Applications Informatiques » avec un stage de 420 heures et un mémoire professionnel. Grâce à la diversité des compétences de l'équipe pédagogique du département, les sujets de mémoires recherche réalisés dans ce master couvrent les différents champs de la recherche en linguistique et un grand nombre de langues. De même, la thématique des stages realisés par les étudiants du parcours « Linguistique et applications informatiques » reste très ouverte par rapport au traitement informatique de données langagières, écrites ou orales, et peut être effectuée dans les organismes d'accueil si différents que des laboratoires de recherche, structures académiques ou des entreprises privées. Ce Master s'adresse aux étudiants intéressés par la linguistique, les applications et outils informatiques associés au traitement de données langagières. Un diplôme en Licence du Sciences du langage n'est pas exigé mais des connaissances de base en linguistique et un intérêt général pour le domaine sont indispensables. Aucun pré-requis dans les domaines de la programmation et du traitement automatique des langues n'est nécessaire pour l'inscription en M1. L'admission sur dossier est ouverte à tous les étudiants titulaires d'une licence. Les candidatures émanant de titulaires de licences de Lettres (langue et littérature françaises) et de Langues (LLCE ou LEA) sont les bienvenues. Pour plus d'information concernant le programme de la formation, contactez les responsables: Pour le parcours « Recherche linguistique »: Laurence Labrune, laurence.labrune at u-bordeaux3.fr Pour le parcours « Linguistique et applications informatiques »: Anna Kupsc, akupsc at u-bordeaux3.fr Informations par rapport aux inscriptions (date limite: 5 septembre 2012): http://www.u-bordeaux3.fr/fr/formations/s_inscrire/inscription_en_1ere_ou_2eme_annee_de_master.html La brochure du Master ReLAI est disponible à l'adresse suivante: http://sdlcours.u-bordeaux3.fr/mod/forum/discuss.php?d=4887 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:05:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:05:08 +0200 Subject: Seminaire: Alpage, Valerie Hanoka, Methodologie de construction/extension de wordnets, 15 juin 2012 Message-ID: Date: Fri, 08 Jun 2012 09:48:17 +0200 From: Marie Candito Message-ID: <4FD1AE41.3040801 at gmail.com> ************** Séminaire Alpage ******************* Séminaire de l'école doctorale de Paris Diderot : Il s'agit du séminaire de recherche en linguistique informatique organisé par l'équipe Alpage, équipe mixte Inria -- Paris Diderot, spécialisée en analyse syntaxique automatique et en traitement du discours. Le prochain séminaire se tiendra : * vendredi 15 juin de 11h à 12h30 * en salle 3E91 à l'UFRL, 16, rue de Clisson, 75013 Paris (3e étage gauche) Toute personne intéressée est la bienvenue. *********************************************************** Valérie Hanoka (doctorante Alpage) : Méthodologie de construction/extension de wordnets Nous proposons une méthodologie pour la construction et/ou l'extension de wordnets. Notre méthode est basée sur l'exploitation d'un large graphe de traductions et de wordnets alignés en plusieurs langues. Des résultats préliminaires obtenus via une évaluation de la méthode pour le français indiquent que cette technique permet d'obtenir des résultats satisfaisants. En particulier, des littéraux fréquents et polysémiques que les précédentes approches d'extension/construction de wordnets ne parvenaient pas à découvrir sont devinés avec succès. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:07:04 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:07:04 +0200 Subject: Cursus: Master Specialite Ingenierie Linguistique, INALCO Message-ID: Date: Fri, 8 Jun 2012 11:57:17 +0200 From: Mathieu Valette Message-Id: <9DCF4C94-48E0-4328-A71D-B7A984A1F7E7 at inalco.fr> X-url: http://www.crim.fr Cursus : Master Spécialité Ingénierie Linguistique de l'INALCO Site : http://www.crim.fr Contact : crim at inalco.fr Le Département Textes, Informatique, Multilinguisme (TIM) de l'INALCO, en cohabilitation avec les Universités Paris Sorbonne Nouvelle (Paris 3) et Paris Ouest Nanterre la Défense (Paris 10), propose le MASTER spécialité "Ingénierie Linguistique" (parcours professionnel et recherche). Le MASTER spécialité "Ingénierie Linguistique" débouche sur les métiers de la société de l'information : secteurs de la veille, agrégation de contenus, formation en ligne et/ou sur mobile, détection et filtrage d'informations sensibles ou de rumeurs, web social, traduction outillée, outils d'aide à la traduction (TAO), gestion électronique de documents (GED)... Crée en 1986, il s'appuie sur les projets menés par l'équipe de recherche associée, ERTIM (EA 2520, anciennement CRIM), ainsi que sur son réseau de professionnels issus de l'industrie et du monde académique, pour offrir une formation alliant finesse de l'analyse linguistique en contexte multilingue et maîtrise des savoir-faire informatiques nécessaires. Le M1 est constitué d'un socle de cours communs aux étudiants de l'INALCO, de la Sorbonne Nouvelle (Paris 3) et de Paris Ouest Nanterre La Défense (Paris 10). Ce socle permet d'acquérir les connaissances nécessaires à la linguistique de corpus outillée : gestion informatique du multilinguisme, algorithmique et programmation, sémantique lexicale et textuelle... Le M2, à l'INALCO, offre 3 parcours différenciés et un socle commun : - le parcours "Ingénierie Multilingue", offre une spécialisation avancée en informatique pour le traitement linguistique : programmation orientée objet, traitement statistique de corpus, outils informatiques pour le TAL, etc. Les étudiants ayant suivi ce parcours travaillent ensuite dans le secteur de la conception de logiciels, la recherche d'information, la veille, le traitement de masses de données textuelles. - le parcours "Traductique et Gestion de l'Information", offre une spécialisation autour des outils de TAO (traduction assistée par ordinateur), de la traduction, des outils de gestion de l'information (bases de données sur le web, langages de script, perl), de la gestion électronique de documents, etc. Les étudiants ayant suivi ce parcours travaillent dans le secteur de la traduction ou de la gestion de l'information multilingue (lexicologie, terminologie, veille, conception de formation en ligne) - le parcours Recherche co-habilité INALCO - Paris 3 - Paris 10 prépare les étudiants à une formation académique en sémantique textuelle, lexicologie textuelle, acquisition et structuration de connaissances à partir de corpus multilingues (parallèles et comparables). - le socle commun permet d'appréhender la complexité de l'analyse linguistique en contexte multilingue et comprend des cours de sémantique de corpus, de dictionnairique, de lexicologie textuelle, de fouille de textes. Pour l'année 2012/2013, inscriptions en ligne sur le site www.crim.fr ou par envoi d'un message à crim at inalco.fr. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:08:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:08:18 +0200 Subject: Appel: Workshop on Web of Linked Entities (WoLE2012) Message-ID: Date: Fri, 8 Jun 2012 13:22:10 -0400 From: eric charton Message-ID: X-url: http://wole2012.eurecom.fr [Apologies for cross-posting] ==================================== Workshop on Web of Linked Entities (WoLE2012) http://wole2012.eurecom.fr In conjunction with the 11th International Semantic Web Conference (ISWC2012), Boston, 11/12 November 2012 ==================================== Most of the knowledge available on the Web is encoded in natural language text or Web documents aimed primarily at human consumption. Providing programmatic access to such knowledge is an interesting prospect. This requires information extraction techniques to extract machine readable structures from free text, from which it is possible to retrieve entities and categories. These entities can potentially be linked to each other, creating a global knowledge graph of linked entities. The WoLE2012 workshop envisions the Web as a Web of Linked Entities (WoLE), which transparently connects the World Wide Web (WWW) and the Giant Global Graph (GGG) using methods from Information Retrieval (IR) and Natural Language Processing (NLP). The focus of this workshop is to bring together the Information Retrieval, Semantic Web and NLP communities. The primary goal is to strengthen research techniques that provide access to textual information published on the Web to further improve the adoption of Semantic Web technology. OBJECTIVES AND TOPICS (but are not limited to): * Text and web mining * Pattern and semantic analysis of natural language, reading the web, learning by reading * Large-scale information extraction * Usage mining * Entity resolution and automatic entities discovery * Frequent pattern analysis of entities * Entity linking, named entity disambiguation, cross-document co-reference resolution * Ontology representation of natural language text * Analysis of ontology models for natural language text * Learning and refinement of ontologies * Natural language taxonomies modeled to Semantic Web ontologies * Disambiguation through knowledge base * Multilingual entity recognition and disambiguation * Use cases of entity recognition for Linked Data applications * Relationship extraction, slot filling * Impact of entity linking on information retrieval, semantic search * Conversion of NLP tools output to RDF (NIF, Lemon, OLiA, NERD) * Usage of LOD data to improve performance of NLP processes * Semantification of Web pages such as blogs, forum, etc. * Evaluation of new and existing tools across different domains and types of discourse SUBMISSION AND PUBLICATION: We invite submissions of regular technical papers (max. 12 pages), position papers (max. 4 pages). All submissions will be reviewed by at least three program committee members, and will be assessed based on their novelty, technical quality, potential impact, and clarity of writing. The workshop proceedings will be published as a volume at CEUR Workshop Proceedings. Please, submit in PDF format to: https://www.easychair.org/conferences/?conf=wole2012. Submissions must be in PDF formatted in the style of the Springer Publications format for Lecture Notes in Computer Science (LNCS). For details on the LNCS style, see Springer’s Author Instructions. IMPORTANT DATES: * Jul 31, 2012: submission deadline technical & position papers * Aug 21, 2012: notifications for research papers * Sep 10, 2012: camera-ready papers due WORKSHOP ORGANIZERS: Giuseppe Rizzo, EURECOM, France; Pablo N. Mendes, Freie Universität Berlin, Germany; Eric Charton, CRIM, Centre de Recherche Informatique de Montréal, Canada; Sebastian Hellmann, AKSW, Universität Leipzig, Germany; Aditya Kalyanpur, IBM T. J. Watson Research Center, USA PROGRAMME COMMITTEE * Caroline Barriere, Centre de Recherche Informatique de Montréal, DETI, Canada * Frédéric Béchet, Université d'Aix-Marseille, LIF, France * Andreas Blumauer, Semantic Web Company * Paul Buitelaar, DERI/National University of Ireland, Galway, Ireland * Philipp Cimiano, CITEC, University of Bielefeld, Germany * Eric de la Clergerie, INRIA, France * Christian Dirschl, Wolters Kluwer, Germany * Benoit Favre, Université d'Aix-Marseille, LIF, France * Michel Gagnon, École Polytechnique de Montréal, Canada * Daniel Gerber, AKSW, Universität Leipzig, Germany * Claudio Giuliano, Fondazione Bruno Kessler, Italy * Daniel Hladky, Ontos AG * Guy Lapalme, Université de Montréal, RALI-DIRO, Canada * Paul McNamee, Johns Hopkins University, USA * Edgar Meij, University of Amsterdam, The Netherlands * Marie-Jean Meurs, Semantic Software Lab, CSFG, Concordia University, Canada * Meenakshi Nagarajan, IBM Research, USA * Axel Ngonga, AKSW, Universität Leipzig, Germany * Cartic Ramakrishnan, ISI, University of Southern California, USA * Harald Sack, HPI, University of Potsdam, Germany * Benoit Sagot, INRIA, France * Felix Sasaki, DFKI-LT, German Research Center for Artificial Intelligence (DFKI), Germany * Tomas Steiner, Universitat de Catalunya, Spain * Fabian Suchanek, Max-Planck Institute for Informatics, Saarbrücken, Germany * Vojtech Svatek, University of Economics, Prague * Krishnaprasad Thirunarayan, Wright State University, USA * Andraz Tori, Zemanta * Marieke Van Erp, VU University Amsterdam * Ruben Verborgh, IBBT, Ghent University, Belgium * Mateja Verlic, Zemanta * Gerhard Weikum, Max-Planck Institute for Informatics, Saarbrücken, Germany * Feiyu Xu, DFKI-LT, German Research Center for Artificial Intelligence (DFKI), Germany For further questions please contact the organizers via wole2012 at easychair.org. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:09:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:09:08 +0200 Subject: Revue; ANAE N118, Troubles du langage ecrit : apports des nouveaux supports de communication Message-ID: Date: Thu, 7 Jun 2012 10:00:59 +0200 From: "Catherine de Gavre" Message-Id: Ce numéro fait partie de l’abonnement 2012, Vol 24. Comprenant également : N° 116 Troubles du langage écrit et ses troubles – Approche cognitive – (coordonné par le Pr B. Pierart) N° 117 L’animal dans le soin (coordonné par le Pr J.-L. Adrien et M. Maurer, Paris-Descartes et Univ de Sherbrook) N° 118 Troubles du langage écrit de l’enfance à l’âge adulte (coordonné par I. Simoës, Toulouse) N° 119 Epilepsie et troubles des Apprentissages (sous réserve) N° 120 L’enfant précoce, forces et faiblesses (coordonné par les Pr J. Grégoire et T. Lubart) N° 121 Autisme - Pecs, ABA... pratiques d'éducation de la théorie à la pratique http://www.anae-revue.com/la-documentation-scientifique-tous-les-n-disponibles/ Acheter le N° 118 http://www.anae-revue.com/abonnement-2012/ S’abonner en ligne Actualités Description : L'émission "C'est pas sorcier" consacrée aux troubles "dys" sera diffusée le Dimanche 24 juin à 10h45 sur France 3. Elle sera ensuite disponible en replay pendant 7 jours sur le site internet de l'émission En savoir plus http://www.anae-revue.org/article-emission-c-est-pas-sorcier-consacree-aux-troubles-dys---24-juin-2012-106123995.html http://www.anae-revue.org/categorie-11342105.html Agenda http://www.anae-revue.org/categorie-11477942.html Lu pour vous http://www.anae-revue.org/categorie-11433771.html Formation - DU http://www.anae-revue.org/categorie-11344612.html Livres ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:38:30 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:38:30 +0200 Subject: Job: Stage, Implementation de l'accord orthographique de la langue portugaise, SYSTRAN Message-ID: Date: Mon, 11 Jun 2012 11:08:30 +0200 From: "BUSCHBECK Bianka" Message-ID: <004e01cd47b1$c5c507a0$514f16e0$@systran.fr> ################### Company: SYSTRAN Department: Linguistic Resources Location: Paris 75002, France Website: www.systran.fr Internship description: SYSTRAN has currently an opening for an internship of 4-6 months that aims at the adaptation of its Portuguese language pairs to the new spelling conventions for Portuguese. The internship project would include the following tasks: - Specification of rules to convert text according to the Portuguese Language Orthographic Agreement - Adaptation of SYSTAN's lexical resources to the new spelling conventions - Work on European Portuguese - Brazilian Portuguese localization of the Portuguese MT input and output - Integration and testing of results Required skills: - Native competence of Portuguese, preferably Brazilian Portuguese, and fluency in English and French - Profound knowledge of the Portuguese spelling reform and ability to specify rules converting text to the new spelling conventions - Good working knowledge of computational lexicography and NLP methods in general - Perl and scripting languages are a plus - Strong communication skills and ability to work in a team Please send your application and cover letter to Bianka Buschbeck: buschbeck AT systran DOT fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:44:22 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:44:22 +0200 Subject: Conf: SCIA 2012, 1ere journee Sciences Cognitives et Intelligence Artificielle, Paris, 25 juin 2012 Message-ID: Date: Mon, 11 Jun 2012 08:16:11 +0200 From: Olivier Boissier Message-Id: <2531C992-9693-4F8A-8AC1-2D5495E57F99 at emse.fr> X-url: http://sites.google.com/site/ateliericsccog/ L'ARCO et l'AFIA vous invite à la première journée SCIENCES COGNITIVES et INTELLIGENCE ARTIFICIELLE (SCIA’12). Une version pdf de l'appel est disponible à : http://www.afia.asso.fr/tiki-download_file.php?fileId=84 Cette journée, organisée par Xavier Aimé et Gunnar Declerck, fait se rencontrer l’Ingénierie des Connaissances et les Sciences Cognitives (ICSC) autour du thème « Concevoir des dispositifs capables d’augmenter la pensée ». Du mythe d’Icare au projet de la biomimétique de J.M. Benyus, l’homme s’applique à copier la nature pour concevoir ou améliorer ses systèmes techniques. Dans le domaine de l’Intelligence Artificielle, de la robotique et de la fouille de données, on développe des algorithmes évolutionnaires ou des modèles d’optimisation inspirés du comportement des insectes sociaux. Dans tous les cas, il s’agit de s’inspirer de modélisations de structures existant dans la nature pour concevoir des dispositifs artificiels. L’Ingénierie des Connaissances a-t-elle intérêt à adopter une pareille démarche ? L’étude des mécanismes « naturels » de la cognition peut-elle offrir d’améliorer les performances des dispositifs de manipulation de connaissances ? SCIA se tient dans le cadre de la conférence IC 2012(http://ic2012.crc.jussieu.fr/). - Date : 25 juin 2012 - Lieu : Centre de recherche des cordeliers, 15 rue de l'école de médecine, 75006 Paris * Inscriptions : Les inscriptions se font sur le site de l’atelier ICSC http://sites.google.com/site/ateliericsccog/ *Programme - 14h00 Présentation de l’Atelier par Xavier Aimé (INSERM US 14, UMRS 872 équipe 20) et Gunnar Declerck (INSERM UMRS 872 équipe 20), Isabelle Tapiero (Présidente de l’ARCo) et Yves Demazeau (Président de l'AFIA). Présentation de la thématique par Gunnar Declerck. - 14h30 « Les technologies cognitives numériques pour stimuler et simuler la pensée » par Charles Tijus (CHart, Laboratoire Cognitions Humaine et Artificielle / LUTIN, Laboratoire des Usages en Technologies d’Information Numériques). - 15h00 « L’Intelligence Artificielle : l’approche des sciences de la complexité » par Jean-Claude Heudin (Institut de l’Internet et du Multimédia). - 15h30 « Augmenter l’intelligence d’une équipe avec une plateforme web de travail collaboratif en temps réel et en mode moteur d’innovation massivement parallèle » par Joël Muzard (AIA, Applied Intelligence Atelier, Montréal). - 16h00 Pause - 16h15 « Différentes manières de voir le concept de connaissance en sciences cognitives » par Benoit Le Blanc (ENSC - Institut Polytechnique de Bordeaux / Institut des Sciences de la Communication du CNRS). - 16h45 « Gradients de prototypicalité, un apport de la psychologie cognitive à l’ingénierie des ontologies » par Xavier Aimé (INSERM UMRS 872 EQ 20). - 17h15 « Linguistique et principes catégoriels, ou le leurre de l’engagement cognitif » par Jean- Baptiste Guignard (Centre for Cognitive Research, UMS 3327, CNRS / Université de Technologie de Compiègne). - 17h45 « Pour une ingénierie des connaissances dynamiques : prendre en compte la dynamique de l’activité et de ses inscriptions dans les systèmes d’interprétation » par Yannick Prié (LIRIS, UMR 5205, CNRS / Université Lyon 1). - 18h15 Pause - 18h20 Discussion générale L’atelier ICSC est également partenaire de l’atelier “Philosophie (du Web) et Ingénierie (des connaissances)” qui se déroulera la matinée du 25 juin et porte sur le thème « De l’importance des agencements sur le web ». La session de discussion générale qui clôt la journée réunira les participants des deux événements. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:53:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:53:08 +0200 Subject: Appel: CSLP 2012, Deadline extension Message-ID: Date: Sun, 10 Jun 2012 15:49:21 +0200 From: Yannick Parmentier Message-ID: <20120610134921.GA2791 at mononoke> X-url: http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ ** apologies for cross-posting ** CALL FOR PAPERS & PARTICIPATION ** NEW: The deadline to submit papers to CSLP 2012 has been extended to 25 June 2012 ** ======================================================== Constraint Solving and Language Processing - CSLP 2012 - Seventh International Workshop Universite d'Orleans, Orleans, France September 13-14, 2012 http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ ======================================================== INTRODUCTION ============ The Constraint Solving and Language Processing (CSLP) workshop considers the role of constraints in the representation of language and the implementation of language processing from an interdisciplinary perspective. This theme should be interpreted inclusively: contributions from linguistics, computer science, psycholinguistics and related areas are welcome, and an interdisciplinary perspective is of particular interest. Constraints are widely used in linguistics, computer science, and psychology. How they are used, however, varies widely according to the research domain: knowledge representation, cognitive modelling, problem solving mechanisms, etc. These different perspectives are complementary, each one adding a piece to the puzzle. For example, linguistics proposes in-depth descriptions implementing constraints in order to filter out structures by means of description languages, constraint ranking, etc. The constraint programming paradigm, on the other hand, shows that constraints have to be taken as a systematic whole and can thus play a role in building the structures (or can even replace structures). Finally, psycholinguistics experiment have been made, investigating the role of constraint systems for cognitive processes in comprehension and production, as well as addressing how they can be acquired. TOPICS ====== CSLP is open to submissions on topics including, but not limited to: * Constraints in human language comprehension and production * Context modelling and discourse interpretation * Acquisition of constraints * Constraints and learning * Cross-theoretical view of the notion of constraint * New advances in constraint-based linguistic theories * Constraint satisfaction (CS) technologies for NLP * Linguistic analysis and linguistic theories biased towards CS or constraint logic programming (CLP) * Application of CS or CLP for NLP * CS and CLP for other than textual or spoken languages, e.g., sign languages and biological, multimodal human-computer interaction, visual languages * Probabilistic constraint-based reasoning for NLP and context comprehension PREVIOUS EDITIONS ================= Six CSLP workshops have been organized in the past in: Karlsruhe, Germany (2011), Hamburg, Germany (2008), Roskilde, Denmark (2007), Sydney, Australia (2006), Sitges, Spain (2005), Roskilde, Denmark (2004). VENUE ===== CSLP 2012 will take place at LIFO, the Computer Science laboratory of the University of Orleans, France. Orleans is located in the northern bend of the Loire river, it belongs to the Vallee de la Loire sector, which was in 2000 inscribed by UNESCO as a World Heritage Site. Orleans is located 120 kilometers south-west of Paris, it is bordered to the north by the Beauce region and the national forest of Orleans (500 km2), and by the Sologne region to the south. IMPORTANT DATES =============== Submission Deadline: June 10, 2012 Notification: August 1st, 2012 Camera-ready Version: September 1st, 2012 Workshop Dates: September 13-14, 2012 SUBMISSIONS =========== Papers must be submitted electronically as PDF files and be prepared using the Springer LNAI/LNCS format. Detailed formatting instructions can be found at: http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0 Papers should present original, unpublished work. Simultaneous submission to other venues with published proceedings is prohibited. CSLP accepts two kinds of submissions: - full papers (12 pages including references) reporting completed, significant research, - short papers (6 pages including references) reporting ongoing work and partial results. Each submission will be reviewed by three program committee members. Accepted long papers will be presented within 20 minutes talks plus 10 minutes for questions. Accepted short papers will be presented within 10 minutes talks plus 5 minutes for questions. Both paper types will be published in the workshop proceedings. Since reviewing will be blind, the submission should not include the authors' names and affiliations. Other identifying information such as obvious self-references (e.g., "We showed in [12] ...") and financial or personal acknowledgements should be omitted in the submitted papers whenever feasible. Papers have to be submitted via the easychair conference management system using the following link: http://www.easychair.org/conferences/?conf=cslp2012 A volume at an international publisher will be considered for selected and revised papers, if number and quality of submissions permits. REGISTRATION ============ Registration is now open, by filling the form available at http://www.univ-orleans.fr/lifo/evenements/CSLP2012/inscription.php The registration fees (50 EUR for students and 100 EUR for researchers until August, 7th) cover the electronic proceedings (USB stick), the participation to the coffee breaks, the lunches, the banquet, and the social event (visit of a Castle of the Vallee de la Loire). KEYNOTE SPEAKERS ================ Ruth Kempson, King's College London Stergios Chatzikyriakidis, Royal Holloway University of London and Open University of Cyprus Title: "Grammars as Mechanisms for Real-Time Tree-Growth: Explaining Clitic Pronouns" Abstract: In this talk, we use the puzzle of clitic pronoun placement and clustering in Modern Greek to argue for a shift of perspective into defining grammars as mechanisms for incremental growth of interpretation, as argued in Dynamic Syntax: Kempson et al. (2001), Cann et al. (2005) Chatzikyriakidis and Kempson (2011). In this framework, the concept of structural underspecification and growth of semantic representation is taken as the core syntactic notion, grounded in the modal Logic of Finite Trees: Blackburn and Meyer-viol (1994). With modal statements expressing an array of more or less fixed tree-node relations, restrictions on tree development are definable in a way not available to grammars lacking such tree-growth dynamics. One of these is the restriction that no more than one underspecified relation of a type can be built at a time, their being indistinguishable with only this weak characterisation, which we use to explain a range of clitic clustering restrictions found in many clitic-pronoun systems – we take the so-called Person-Case Constraint (PCC) as displayed in different ways in dialects of Modern Greek as our case study. PROGRAM COMMITEE ================ Philippe Blache, CNRS - Université de Provence, France Adriane Boyd, Universität Tübingen, Germany Aoife Cahill, ETS Princeton, USA Henning Christiansen, Roskilde University, Denmark Berthold Crysmann, CNRS - Paris 7, France Verónica Dahl, Simon Fraser University, Canada Helen de Hoop, Radboud University Nijmegen, Netherlands Eric De La Clergerie, INRIA - Paris 7, France Denys Duchier, Université d'Orléans, France Claire Gardent, CNRS - LORIA, France Barbara Hemforth, Université Paris Descartes, France Maria Dolores Jiménez-López, Universitat Rovira i Virgili, Spain Laura Kallmeyer, Heinrich Heine Universität, Düsseldorf, Germany Ruth Kempson, King's College London, UK Stephan Kepser, Codecentric AG Düsseldorf, Germany Patrick McCrae, Langtec Hamburg, Germany Wolfgang Menzel, Universität Hamburg, Germany Detmar Meurer, Universität Tübingen, Germany Véronique Moriceau, Université Paris XI, France Jean-Philippe Prost, Université de Montpellier, France Adam Przepiórkowski, IPIPAN, Warsaw, Poland Christian Rétoré, Université de Bordeaux, France Frank Richter, Universität Tübingen, Germany Sylvain Salvati, INRIA - Université de Bordeaux, France Sylvain Schmitz, ENS Cachan, France Kiril Simov, Bulgarian Academy of Sciences, Bulgaria Jesse Tseng, CNRS - Université de Toulouse, France Jørgen Villadsen, Technical University of Denmark LOCAL ORGANIZING COMMITEE ========================= Chairs: Denys Duchier (LIFO - Université d'Orléans) Yannick Parmentier (LIFO - Université d'Orléans) Members: Guillaume Cleuziou (LIFO - Université d'Orléans) Thi-Bich-Hanh Dao (LIFO - Université d'Orléans) Abdelali Ed-Dbali (LIFO - Université d'Orléans) Matthieu Exbrayat (LIFO - Université d'Orléans) Matthieu Lopez (LIFO - Université d'Orléans) Lionel Martin (LIFO - Université d'Orléans) Simon Petitjean (LIFO - Université d'Orléans) Jacques-Henri Sublemontier (LIFO - Université d'Orléans) Information about the Workshop is available at the CSLP workshop website: http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ E-mail:cslp2012 at easychair.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:50:52 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:50:52 +0200 Subject: Sujet de these: Extraction et categorisation de lexiques transdisciplinaires d'articles scientifiques Message-ID: Date: Mon, 11 Jun 2012 18:33:29 +0200 From: Agnès Tutin Message-ID: <000001cd47ef$eef4f840$ccdee8c0$@u-grenoble3.fr> Le laboratoire LIDILEM ( http://w3.u-grenoble3.fr/lidilem/labo/web/presentation.php ) appelle des candidatures pour une thèse financée par allocation doctorale de la région Rhône-Alpes (env. 1700 euros brut / mois). ************************************* Descriptif de la thèse : Titre : Extraction et catégorisation de lexiques transdisciplinaires d’articles scientifiques de sciences humaines en vue de l’indexation automatique Résumé du projet : Dans cette thèse, l’approche proposée portera sur un type de discours scientifique moins analysé au plan linguistique, les articles de recherche en sciences humaines et sociales, sur lesquels une réflexion linguistique et épistémologique sera menée dans une perspective d’analyse du contenu textuel pour l’indexation automatique. Il s’agira de mettre en évidence le lexique et la phraséologie associés aux processus et à la démonstration scientifiques, qu’ils soient propres aux disciplines ou « transdisciplinaires », tout en excluant la terminologie. L’objectif est ici triple : a) il s’agit de repérer les termes qui caractérisent la scientificité des écrits de sciences humaines (Par exemple, quels marqueurs linguistiques pour l’observation scientifique ? quels mécanismes linguistiques pour formuler une preuve ?). Plusieurs études ponctuelles ont été réalisées sur ces aspects (par exemple, étude du fonctionnement de verbe "voir" dans sa fonction évidentielle (Grossmann & Tutin 2010) ou le lexique adjectival évaluatif (Cf Tutin 2010), mais à notre connaissance, il n’y a pas eu d’étude en grandeur réelle avec des techniques lexicométriques ; b) Nous cherchons ensuite à repérer comment les concepts clés, à travers la terminologie, sont introduits dans les discours. Ce n’est pas ici la terminologie du domaine qui est en jeu, mais la façon dont les notions clés sont présentées. Les études dans le domaine mettent au jour la récurrence des patrons phraséologiques qui transcendent les domaines de connaissances et permettent d’exprimer des relations entre termes, d’introduire des définitions et/ou des dénominations (Rebeyrolle 2000, Grabar et Hamon 2004, Gillam, Tariq et Ahmad 2005, Jacques et Aussenac-Gilles 2006, Marshmann et l’Homme 2008). L’analyse ne devra donc pas exclusivement porter sur les unités simples ou complexes mais aussi s’étendre à la phraséologie typique de l’article scientifique, qu’elle s’incarne par des collocations binaires (par exemple "résultats encourageants") ou par des constructions syntaxiques plus complexes (par exemple "les travaux de --- montrent que "), qui acceptent certaines variations. c) Dans un dernier temps, il s’agit de constituer une ressource, le lexique transdisciplinaire, que l’on exploitera dans des applications de sciences de l’information, pour caractériser le contenu du document. Ce lexique sera ici doublement utilisé : à la fois comme un lexique d’exclusion pour l’extraction des mots-clés des thèmes du texte, et dans un deuxième temps, pour permettre une caractérisation du type de discours scientifique (par exemple, l’accent est-il mis sur la méthodologie, l’observation ? ou les aspects plus théoriques ?). Il s’agit ici en quelque sorte de dépasser la terminologie classique en intégrant dans la méthode d’indexation des éléments de la typologie textuelle, ce qui constitue une approche innovante d’analyse de contenu, rendue possible par les techniques de traitement automatique des langues utilisées. Cela suppose une caractérisation fine des ressources lexicales extraites, aux plans sémantique, syntaxique et rhétorique (Cf. Pecman 2004). Ce projet de thèse s’inscrit au carrefour de trois domaines disciplinaires : a) la linguistique, en particulier la sémantique et la linguistique de l’énonciation, b) le traitement automatique des langues, c) les sciences de l’information, en particulier les techniques des langages documentaires. Il s’inscrit dans la continuité de travaux sur la phraséologie des écrits scientifiques, le lexique transdisciplinaire pouvant être conçu comme le lexique métascientifique (par exemple, le lexique des procédures et résultats : "premier résultats", "nous analysons", "hypothèse" et/ou le métadiscours qui inclut le positionnement de l’auteur ("résultats encourageants", "cette méthode apparaît peu adaptée" …) ou les marqueurs métatextuels ("dans un second temps", "nous introduirons ensuite" …) (Phal 1971, Coxhead 2000, Pecman 2004, Hirsh & Coxhead 2007, Tutin 2007 a et b, Da Sylva 2010). Les travaux ont jusqu’à présent peu porté sur le français mais surtout sur l’anglais et dans les sciences « dures », essentiellement dans une perspective didactique, en dehors des travaux encore exploratoires de Drouin (2007) et Da Sylva (2010). Au plan théorique, il s’agira d’analyser l’articulation entre le lexique de spécialité disciplinaire et le lexique de genre, la limite étant particulièrement poreuse dans les écrits de sciences humaines, et de proposer une réflexion sur l’utilisation de telles ressources pour une caractérisation du type de l’écrit scientifique. Références bibliographiques : Aït-Mokhtar S., Chanod J.P. et Roux C. (2002). Robustness beyond shallowness : incremental deep parsing. Nat. Lang. Eng., 8, 121–144. Coxhead A. (2000). A New Academic Word List, TESOL Quaterly, 34 (2), 213-238. Coxhead A. et Hirsh D. (2007). A pilot science word list for EAP, Revue Française de linguistique appliquée, XII, (2), 65-78. DaSylva L. (2010). Extraction semi-automatique d’un vocabulaire savant de base pour l’indexation automatique, TALN’10, Montréal, 19-23 juillet. Daille B. (2010). Terminology Mining, in M.T. Pazienza (ed), Information Extraction in the Web Era, Lectures Notes in Artificial Intelligence, Springer, 29-44. Drouin P. (2007). Identification automatique du lexique scientifique transdisciplinaire, Revue française de linguistique appliquée, 12(2), 45-64. Drouin P., Tutin A. et Reid-Triatanfyllos S. (2007). Identification automatique des collocations transdisciplinaires des écrits scientifiques. Terminologie : approches transdisciplinaires, Gatineau (Québec), 2-4 mai. Gillam L., Tariq M. et Ahmad K. (2005). Terminology and the construction of ontology, Terminology, 11(1), 55-81. Grabar N. et Hamon T. (2004). Les relations dans les terminologies structurées: de la théorie à la pratique, Revue d’intelligence artificielle, 18(1), 57-85. Grossmann F., Tutin A. (2010). Evidential Markers in French Scientific Writing: the Case of the French Verb voir. In Smirnova Elena, Diewald Gabriele Evidentiality in European Languages (pp. 279-307). Empirical Approaches to Language Typology (EALT). Berlin, New York: Mouton de Gruyter. Ibekwe-SanJuan F., SanJuan E. (2004). Mapping the structure of research topics through term variant clustering : the TermWatch system, 7ème Journées internationales d'Analyse statistique des données textuelles (JADT' 2004). Louvain-la-Neuve, Belgium, 10-12 March 2004, 589-600.[jadt2004] [7th International conference on Textual data statistical analysis]. Jacques M.P. et Aussenac-Gilles N. (2006). Variabilité des performances des outils de TAL et genre textuel, TAL, 47(1). Marshmann E. et L’Homme M.C. (2008). Portabilité des marqueurs de la relation causale : étude sur deux corpus spécialisés, in Maniez F., Dury P., Arlin N. et Rougemont C. (eds), Corpus et dictionnaires de langues de spécialité, Presses Universitaires de Grenoble. Paquot, M. et Bestgen Y. (2007). Distinctive words in academic writing: A comparison of three statistical tests for keyword extraction, in Jucker, Andreas H., Daniel Schreier & Marianne Hundt (eds), Corpora:Pragmatics and Discourse, Amsterdam: Rodopi, 247-269. Pecman M. (2004). Phraséologie contrastive anglais-français : analyse et traitement en vue de l’aide à la rédaction scientifique. Thèse de doctorat, Université de Nice-Sophia Antipolis. Phal A. (1971). Vocabulaire général d’orientation scientifique (V.G.O.S.) - Part du lexique commun dans l’expression scientifique. Paris : Didier. Rebeyrolle J. (2000). Forme et fonction de la définition en discours, Université Toulouse II Le Mirail, Equipe de recherche en Syntaxe et Sémantique. Tutin Agnès (2007a). Modélisation linguistique et annotation des collocations : une application au lexique transdiciplinaire des écrits scientifiques. In S. Koeva, D. Maurel & M. Silberztein (eds), Formaliser les langues avec l’ordinateur : de Intex à NooJ, 189-215. Besançon: Presses Universitaires de Franche Comté. Tutin Agnès (ed.) (2007b). Lexique des écrits scientifiques. Revue Française de Linguistique Appliquée. Vol. XII, 2007/2 (http://www.cairn.info/revue-francaise-de-linguistique-appliquee-2007-2.htm). Tutin Agnès (2010). Evaluative adjectives in academic writing in the humanities and social sciences. In Rosa Lores-Sanz, Pilar Mur-Duenas, Enrique Lafuente-Millan Constructing Interpersonality: Multiple Perspectives on Written Academic Genres. Cambridge: Cambridge Scholars Publishing. ************************************* Idéalement, le/la candidat-e aura de solides connaissances linguistiques et de bonnes connaissances du TAL (Master Sciences du langage, master TAL). La thèse s'articule à un projet plus vaste soumis à accord de financement, impliquant d'autres laboratoires de linguistique et d'informatique. Pour renseignements et pour faire acte de candidature, contacter Agnès Tutin et Marie-Paule Jacques le plus rapidement possible. Envoyer un CV, un relevé des notes du master et un exposé des travaux de recherche antérieurs et projetés (mémoires de master, projets de recherche). Marie-Paule Jacques et Agnès Tutin ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 20:10:43 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 22:10:43 +0200 Subject: Conf: IC 2012, Programme, 25-29 juin 2012, Paris Message-ID: Date: Tue, 12 Jun 2012 18:20:30 +0200 From: xavier aimé Message-ID: <4FD76C4E.1020302 at inserm.fr> X-url: http://ic2012.crc.jussieu.fr/ ======================================================== Appel à participation 23es Journées Francophones d'Ingénierie des Connaissances http://ic2012.crc.jussieu.fr/ Centre des Cordeliers - Paris 25-29 juin 2012 ======================================================== La conférence IC réunit la communauté francophone et est un lieu d'échanges et de réflexions sur cette discipline qui doit prendre en compte l'essor des Sciences et Technologies de l'Information et de la Communication, notamment des technologies liées au Web et leurs retombées sur les pratiques individuelles et collectives. Elle est le lieu où la communauté francophone expose et confronte ses théories, ses pratiques, ses méthodes et outils. Un des enjeux récents est la mise en place de standards d'évaluation de ses méthodes et outils. * Programme : - Lundi 25 juin Ateliers "RAPC", "PhiloWeb" et "Ingénierie des Connaissances & Sciences Cognitives" - Mardi 26 juin Ateliers "IC & e-Santé", "MOT" et "Qualité, Robustesse, Ontologies et Jeu de Données" - Mercredi 27 juin Conférence principale, Papiers courts, Posters & démos, Cocktail de bienvenue - Jeudi 28 juin Conférence invitée : Dr. Danièle Bourcier - Le langage du droit peut-il être conceptualisé ? Conférence principale, Posters & démos, Dîner de gala - Vendredi 29 juin Conférence invitée : Dr. Bénédicte Le Grand - Analyse exploratoire de réseaux d'interaction reposant sur leur structure en communautés Conférence principale -> programme détaillé : http://ic2012.crc.jussieu.fr/index.php/prog * Inscriptions : http://ic2012.crc.jussieu.fr/index.php/inscriptions Pensez à vous inscrire avant le ** 18 juin 2012 **, après un supplément de 90€ TTC vous sera compté. * Informations pratiques : http://ic2012.crc.jussieu.fr/index.php/informations-pratiques ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:56:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:56:48 +0200 Subject: Journee: Journees Initiative Corpus de reference du francais, 14-15 juin, Paris Message-ID: Date: Mon, 11 Jun 2012 14:51:18 +0200 From: Stéphanie Girault Message-Id: <5B84E596-F281-403A-AE1A-5C3E5910DB16 at ens.fr> X-url: http://www.ilf.cnrs.fr/spip.php%3Frubrique95.html Initiative Corpus de référence du français 14-15 juin 2012 Amphithéâtre Michelet, Université Paris-Sorbonne 46 rue Saint-Jacques 75005 Paris L'Institut de Linguistique Française (CNRS, 2393 FR) organise deux journées de réflexion et de débats sur le thème « Initiative Corpus de référence du français ». Le comité directeur de l'ILF a jugé qu'il entre effectivement dans les missions de la fédération de lancer une telle initiative au niveau national (corpus de textes écrits, corpus oraux, corpus de référence ouvert à la diachronie longue). La France, contrairement à d'autres pays ne s'est pas dotée d'un tel type de corpus. Or, les avancées scientifiques et technologiques, le développement des programmes et des infrastructures dans le domaine de ce qu'il est convenu d'appeler « Corpus » permettent de considérer que le contexte actuel se prête à l'accueil favorable d'une telle initiative. Les deux journées s’articuleront autour de présentations de 45 minutes suivies de 15 minutes de discussion avec le public portant sur l'opportunité et la faisabilité d'un corpus de référence du français. Deux tables rondes viendront ponctuer chacune de ces journées. Nous serions heureux de vous accueillir à ces journées qui se dérouleront les 14 et 15 juin prochains à l’amphithéâtre Michelet de la Sorbonne à Paris. Stéphanie GIRAULT et Franck NEVEU pour le Comité d'organisation scientifique _____________________________ Important : L’entrée est libre, mais l’inscription est obligatoire. Vous devez impérativement remplir le formulaire d’inscription accessible à cette adresse tout en bas de la page http://www.ilf.cnrs.fr/spip.php%3Frubrique95.html et vous munir de votre pièce d’identité pour accéder aux locaux de la Sorbonne. _____________________________ PROGRAMME Jeudi 14 juin 2012 9H30-10H Franck NEVEU (directeur de l’ILF, porteur du Consortium Corpus-Ecrits) Ouverture 10H-10H30 Xavier NORTH (Délégué Général DGLFLF) Les corpus dans l'élaboration d'une politique linguistique 10H30-11H30 Marie CORNU (CECOJI, Centre de recherche "Droit du patrimoine culturel") Constitution d'un corpus de référence, les enjeux juridiques 11H30-12H30 Pascal CORDEREIX (BNF) Langue et patrimoine : les enjeux de la conservation des corpus de la parole 12H30-14H Pause déjeuner 14H00-15H Gabriel BERGOUNIOUX (Laboratoire Ligérien de Linguistique, Université d’Orléans) L'oral dans les langues à tradition écrite : l'exemple du français (et de la France) 15H-16H Marc Van CAMPENHOUDT (réseau LTT, Institut supérieur de traducteurs et interprètes, Haute École de Bruxelles) Linguistique de corpus et étude de la langue française spécialisée dans un cadre multilingue 16H-17H Lou BURNARD (TGIR ADONIS) : Mais enfin, pourquoi un "corpus"? Essai de définition, retour d'expériences 17H-18H TABLE RONDE 1 Bernard COLOMBAT (HTL), Serge HEIDEN (ICAR), Anne LACHERET (Modyco), Virginie LETHIER (ADCoST-ELLIADD) Vendredi 15 juin 2012 9H30-10H30 Christiane MARCHELLO-NIZIA (ENS Lyon) Sur quels critères construire un Corpus de référence pour l'histoire du français ? 10H-11H Olivier BAUDE (DGLFLF, Laboratoire Ligérien de Linguistique, Université d’Orléans) Corpus de référence : homogénéité, hétérogénéité et représentativité 12H30-11H30 Marie-Luce DEMONET (porteur du Consortium CAHIER de la TGIR-Corpus) : L'ambition générique des transcriptions du corpus Epistemon (textes du XVIe siècle en version d'origine) encodés en TEI 12H30-14H Pause déjeuner 14H00-15H Philippe BLACHE (co-porteur du Consortium IRCOM de la TGIR-Corpus, LPL) Corpus de référence : conception, rôle et usage dans une perspective de traitement automatique 15H-16H Jean-Marie PIERREL (porteur de l’Equipex ORTOLANG, ATILF) Un corpus de référence du français : pour qui, pourquoi et comment ? 16H-17H Benoît HABERT (ENS Lyon) Corpus de référence : avoir ou (savoir) faire ? 17H-18H TABLE RONDE 2 Olivier BAUDE (DGLFLF, Corpus-IR), Laurent DOUSSET (Corpus-IR), Stéphane POUYLLAU (Corpus-IR) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 20:02:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 22:02:37 +0200 Subject: Appel: Atelier IC pour IS eSante, 26 juin, Paris Message-ID: Date: Mon, 11 Jun 2012 20:49:03 +0200 From: Lina Soualmia Message-ID: X-url: http://ic2012.crc.jussieu.fr/ Désolée pour les réceptions multiples. ================================ APPEL A PARTICIPATION ================================ *Atelier IC pour l’Interopérabilité Sémantique dans les applications en e-santé* Paris, Mardi 26 Juin 2012 https://sites.google.com/site/icisante2012/ en conjonction avec les 23èmes Journées francophones d’Ingénierie des Connaissances http://ic2012.crc.jussieu.fr/ avec le soutien du GDR STIC-Santé ------------------------------------------------------------------------ L’Agence des Systèmes d'Information Partagés en Santé (ASIP) définit l’interopérabilité sémantique entre systèmes d’information dans les domaines santé et médico-social de la façon suivante: « La capacité qu’ont plusieurs systèmes d’échanger de l’information entre eux et d’utiliser l’information qui a été échangée, pour que les utilisateurs de ces systèmes puissent en tirer parti dans leurs actes et leurs décisions, pour le mieux-être de leurs patients. » En général, pour y parvenir, le respect de normes et de standards partagés est nécessaire. L’interopérabilité sémantique en santé s’appuie donc sur un ensemble de ressources et de services permettant à un système d’information de lier les données recueillies avec les connaissances générales du domaine et permettant une optimisation des dossiers patients informatisés pour un usage multiple : le soin, la santé publique et la recherche clinique à travers plusieurs systèmes de santé et plusieurs institutions. La question de l’interopérabilité sémantique en santé est en pleine expansion au niveau européen comme en témoigne les nombreux projets financés dans le programme du FP7, mais également en France avec le déploiement du Dossier Médical Personnel mi-Janvier 2012. L’objectif de cet atelier est de réunir les travaux traitant des ressources et bases de connaissances pour l'interopérabilité sémantique en santé (partage et réutilisation) sous divers aspects : leur construction, leur évaluation, les langages et standards pour les représenter. Il s’agit de rassembler des chercheurs issus des mondes académique et industriel pour débattre de la question de l’interopérabilité sémantique en santé à travers la présentation d’activités de recherche innovantes, de techniques, de technologies et de démonstrateurs développés dans le cadre de la mise en œuvre de solutions d’interopérabilité sémantique dans le domaine médical. ============================ PROGRAMME ============================ 9:30 Accueil - Marie-Christine Jaulent, Lina Soualmia. *Session 1 * 9:45 *Conférence invitée* Un patient, combien de dossiers ? Interopérabilité sémantique pour la recherche clinique (projet Européen EHR4CR). *Christel Daniel.* 10:30 Vers une approche d'intégration de données adaptée aux réseaux dégradés : application au système d’information sanitaire camerounais. *Fidèl Jiomekong Azanzi, Moussa Lo et Maurice Tchuente.* 11:00 *Pause café* *Session 2* 11:30 Fédération multi-sources en neurosciences : intégration de données relationnelles et sémantiques. *Alban Gaignard, Johan Montagnat, Catherine Faron Zucker et Olivier Corby*. 12:00 Un SADC intégré et interopérable dans le Système d'Information Clinique. *Bruno Frandji, Marie-Christine Jaulent.* 12:30 Un jeu de données minimum pour faciliter l’interopérabilité des bases de données pour les maladies rares. *Rémy Choquet, Claude Messiaen, Adrien Priouzeau, Albane de Carrara et Paul Landais.* 13:00 *Pause déjeuner* *Session 3 * 14:30 Validation pharmaceutique des prescriptions médicamenteuses à base d’une ontologie OWL et de règles métier. *Amina Chniti, Abdelali Boussadi, Patrice Degoulet, Patrick Albert et Jean Charlet.* 15:00 Ontologie sémiologique biomédicale et sémiologie quantitative. *Valéry Donfack Guefack, Valérie Bertaud-Gounot, Anita Burgun, Adrien Barton, Régis Duvauferrier et Jérémy Lasbleiz.* 15:30 Construction d’une ontologie bilingue de la maladie d’Alzheimer à partir de textes médicaux. *Khadim Dramé, Gayo Diallo et Fleur Mougin.* 16:00 *Pause café* *Session 4* 16:30 Vers une approche automatique pour la maintenance des mappings entre ressources termino-ontologiques du domaine de la santé. *Julio Cesar Dos Reis, Cédric Pruski, Marcos Da Silveira et Chantal Reynaud-Delaître.* 17:00 Méthodes d’alignement de terminologies médicales et leur intégration dans un portail. *Tayeb Merabti, Lina F Soualmia, Julien Grosjean, Michel Joubert et Stefan J Darmoni.* 17:30 – 18:00 Discussion générale - Clôture =================== INSCRIPTIONS =================== L'inscription à l'atelier est centralisée avec celle de la conférence IC2012 : http://ic2012.crc.jussieu.fr/index.php/inscriptions/inscription-a-la-conference-aux-ateliers **Attention, une majoration est appliquée après le 18 juin** ============================ THEMES ============================ ** Terminologies et Ontologies médicales : Interopérabilité sémantique des contenus médicaux, Méthodes d'alignement de terminologies et d'ontologies, Indexation terminologique de dossiers médicaux de patients et de récits cliniques, Formalismes et langages de représentation, Apports de la sémantique dans la pratique médicale ... ** Intégration de données multi-sources : Entrepôts de données biomédicales Partage et réutilisation des données ... ** Extraction de l’information et de connaissances à partir de contenus médicaux : construction de bases de connaissances, fouille de données fouille de textes ... ** Utilisation de l’interopérabilité sémantique : pour l’aide à la décision, la recherche d’information, l'indexation… =================== COMITES =================== *Organisatrices:* Marie-Christine Jaulent, INSERM Equ 20 Lina Soualmia, LIM&Bio, Université Paris 13 *Comité de Programme :* Florence Amardeilh, Mondeca Sandra Bringay, LIRMM, Université Montpellier 2 Rémy Choquet, INSERM Equ20 Marc Cuggia, INSERM U936, Université Rennes 1 Olivier Dameron, INSERM U936, Université Rennes 1 Christel Daniel, INSERM Equ20 Stefan Darmoni, LITIS, CHU Rouen Gayo Diallo, ISPED, Université Bordeaux 2 Catherine Duclos, LIM&Bio, Université Paris 13 Bruno Frandji, Medasys Clément Jonquet, LIRMM, Université Montpellier 2 Michel Joubert, LERTIM, Université Marseille Fleur Mougin, ISPED, Université Bordeaux 2 Chantal Reynaud, LRI, Université Paris 11 Pierre-Yves Vandenbussche, Mondeca et INSERM Equ20 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:42:17 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:42:17 +0200 Subject: Conf: NooJ 2012, Program, June 14-16, 2012, Paris Message-ID: Date: Wed, 13 Jun 2012 09:59:37 +0200 (CEST) From: NOOJ Message-ID: <49e4f085-4775-45ef-900e-a5db2657bf5d at mail11> International NooJ Conference 2012 June 14-16, 2012 INALCO, 65 rue des Grands-Moulins, 75013 Paris Programme Organization Committee: Victoria Khurshudian (INALCO/SEDYL) Anaïd Donabédian (INALCO/SEDYL) Max Silberztein (University of Franche-Comté/ELLIADD) Contact: nooj2012 at inalco.fr Thursday 14 (room 3.05) 9:00-9:40: Registration 9:40 Invited Speaker: Plungian Vladimir (Russian Academy of Science): Corpus linguistics 10:00 Silberztein Max (Univ. de Franche-Comté): NooJ's formalism 10:20 Trouilleux François (Univ. de Clermont-Ferrand): A Description of the French Nucleus Verb Phrase Using Cooccurrence Constraints 10:40-11:00 Coffee Break 11:00 Lagji Klara (INALCO): Automatic processing and analysis of Albanian verbal system 11:20 Vietri Simona (Univ. of Salerno, Italy): The Annotation of the Predicate-Argument Structure of Transfer Nouns 11:40 Pignot Hélène & Lardy Michèle (Univ. Paris 1): Formalising an electronic dictionary of 17th century English with NooJ 12:00 Šojat Krešimir, Bekavac Božo, Tadić Marko (Univ. of Zagreb, Croatia): Recognition of Predicate Complements in Croatian 12:20 Fehri Hela, Haddar Kais, Ben Hamadou Abdelmajid (Univ. of Sfax, Tunisia): Specific NooJ resources for recognizing and translating Arabic sportive organization names 12:40-14:00 Lunch 14:00-15:40 Two tutorials: Fehri Hela (room 7.02) & Mesfar Slim (room 7.04) 15:40-16:00 Coffee Break 16:00 Hetsevich Yury, Lobanov Boris, Hetsevich Sviatlana, Skopinava Alena, Yauheniya Yakubovich, (Minsk Univ., Belarus): Accentual Expansion of the Belarusian and Russian NooJ Dictionaries 16:20 Mersinli Ümit, Erköse Yasemin (Mersin Univ., Turkey): A Deverbal Noun Generator for Turkish 16:40 Wu Mei (Univ. de Franche-Comté): The auxiliary verbs in the French-Chinese MT system of Nooj 17:00 Fon-Sing Guillaume (Univ. Paris 7): Two Corpora Based NooJ Modules for Mauritian Creole and Haitian Creole 17:20 Vučković Kristina, Librenjak Sara, Dovedan Zdravko (Univ. of Zagreb, Croatia): Derivation of Adjectives from Proper Nouns 18:00 Cocktail offered by the president of INALCO Friday 15 (room 3.05) 9:00 Declerck Thierry, Koleva Nikolina, Krieger Hans-Ulrich (DFKI GmBH Language Technology Lab, Germany): Interaction between NooJ and a Domain Ontology for the Detection and Mark-Up of Characters in Folktales 9:20 Gavriilidou Zoe, Papadopoulou Eleni, Chadjipapa Elina (Univ. of Komotini, Greece): Numeral-noun and numeral-adjective construction in Greek 9:40 Bigey Magali (Univ. de Franche-Comté): To Analyze Answers to Surveys witn Co-occurences and Concordances 10:00 Mefteh Mariem, Ben Hamadou Abdelmajid, Knöll Roman (Univ. of Sfax, Tunisia): A NooJ framework for Arabic Naturalistic programming : Ara_Pegasus 10:20 Declerck Thierry, Lendvai Piroska (DFKI GmBH Language Technology Lab, Germany): Multilingual sense tagging in NooJ: the use of Wiktionary resources 10:40-11:00 Coffee Break 11:00-12:00 Poster presentations Boudabbous Mohamed Mahdi, Khedher Nacef, Chaaben Kammoun Nouha, Hadrich Belghith Lamia (Univ. of Sfax, Tunisia): Using NooJ grammar for AWN semantic relation enrichment Stanojević Mladen, Spasić Mirko, Ribarić Marko, Jovanović Jelena (Pupin Institute, Serbia): Porting NooJ to Multiple Platforms: MONO Experience Khachatryan Liana (INALCO): Application of Syntactic Armenian Grammars with NooJ Rhazi Azeddine (Univ. Med Ben Abdellah, Morocco), Lahlal Mohammed (FLSH Univ. Hassan II, Morocco): NooJ processing for Arabic multiword Expressions (MWEs) Charles Faivre (INALCO): A NooJ module for Malagasy language 12:00-13:15 Lunch Excursion & Diner Saturday 16 (auditorium) 9:00 Bogacki Krzysztof (Univ. of Warsaw, Poland), Cholewa Joanna (Univ. of Bialystock, Poland), Gwiazdecka Ewa (Univ. of Warsaw, Poland): Disambiguating Polish verbs of motion: dictionaries and local grammars 9:20 Ehmann Bea, Iszaj Fruzsina, Demetrovics Zsolt, Laszlo Janos (Hungarian Academy of Sciences): Psychometric Content Analysis with NooJ: Long-Term Effects of Substance Use on Language Behavior 9:40 Boujelben Ines, Jamoussi Salma, Ben Hamadou Abdelmajid, (Univ. of Sfax, Tunisia): Rules based approach for semantic relation extraction between named entities applied to Arabic language 10:00 Donabedian Anaid, Khachatryan Liana, (INALCO): Variation de la transcription des noms propres étrangers en arménien occidental et son traitement dans le module arménien de NooJ 10:20 Piroska Lendvai, Walter Ravenek (Hungarian Academy of Sciences): Named Entity Recognition in NooJ for 17th century Multilingual Letters 10:40-11:00 Coffee Break 11:00-12:00: Poster presentations Milošević Uroš, Spasić Mirko, Komarica Siniša, Kovačević Natalija, Mutavdžić Miloš, Stanojević Mladen (Pupin Institute, Serbia): Making NooJ Open Source and Platform Independent: Java Experience Watabe Masako (INALCO): Nooj, a linguistic module for Rromani Keskes Iskandar, Benamara Farah, Belguith Lamia Hadrich (Univ. of Sfac, Tunisia): Discourse Segmentation of Arabic Texts Based on Cascade Grammars Traïdia Bassols Sandrine (INALCO): Designing Nooj grammars for Izafe recognition in Sorani Kurdish NPs Merkler Danijela, Agić Željko (Univ. of Zagreb, Croatia): Sentiscope: A System for Sentiment Analysis in Daily Horoscopes Duran Maximiliano (INALCO): Quechua Nouns inflection 12:00-14:00 Lunch 14:00 Kоeva Svetla (Univ. of Sofia, Bulgaria): Rule based clause splitting 14:20 Stoyanova Ivelina, Dekova Rositsa (Univ. of Sofia, Bulgaria): Using Nooj for Analysis of Translational Asymmetries in Verb Argument Structure 14:40 Bénet Vincent (INALCO): A Russian Module for NooJ: design and implementation 15:00 Váradi Tamás (Hungarian Academy of Sciences, Hungary): NooJ as an open linguistic infrastructure 15:20 Pandžić Ivan, Šabić Juraj, Bekavac Božo (Univ. of Zagreb, Croatia): Processing movie reviews in Croatian using NooJ 15:40-16:00 Coffee Break 16:00 Mörth Karlheinz, Declerck Thierry (DFKI GmBH Language Technology Lab, Germany): Porting Persian Lexical Resources to NooJ 16:20 Mesfar Slim, Ben Kacem Saida (ENSI, Tunisia): Towards an on-line concordancing service of NooJ 16:40 Aoughlis Farida (Mouloud Mammeri Univ., Algeria): Towards a Tamazight Module for NooJ 17:00 Anagnostopoulos Giannis, Papadopoulou Lena (Univ. of Komotini, Greece): Hellenic Parliament Proceedings Corpus: Towards a Comparative Study with Europarl Proceedings. The case of morphological properties and translation equivalence of Greek-French-Spanish adjectives. 17:20 Gálvez Carmen (Univ. of Granada, Spain): A proposal to identify generic drug names in biomedical literature 17:40: ROUND TABLE 18:00 END OF CONFERENCE ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:45:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:45:37 +0200 Subject: Appel: Workshop on Computational Methods in Pharmacovigilance + Drug Safety journal Message-ID: Date: Thu, 14 Jun 2012 15:29:43 +0200 From: marie dupuch Message-ID: X-url: http://natalia.grabar.perso.sfr.fr/CMPV/ MIE 2012 workshop + publication of the proceedings in the Drug Safety journal http://natalia.grabar.perso.sfr.fr/CMPV/ *** Deadline extended up to June 20th *** Computational Methods in Pharmacovigilance Pharmacovigilance is the activity related to the collection, analysis and prevention of adverse drug reactions induced by drugs or biologics. This activity plays the fundamental role in monitoring the patient safety during their healthcare process and beyond it. Although this activity relies on a strong surveillance tradition within the pharmacoepidemiological area, some limitations appear and generate uncomfortable cases widely covered by media (such as those related to Mediator, VIOXX etc). First of all, these are due to the ever increasing amount of the data to collect and to process, and also to the recording and storage of these data in the digital form. Hence, the computational methods may provide with useful and intelligent solutions for a more rapid and systematic management of these data. In this workshop, we favour the submission of various and novel experiments related to the computational methods in pharmacovigilance and describing different aspects of the pharmacovigilance process, as performed by acamedic researchers, institutional or industrial people: – Collection of the pharmacovigilance data: traditionnally, the pharmacovigilance cases are narrative documents spontaneously submitted by medical staff, by pharmacists and sometimes even by patients themselves. The actual concern is that the collection of these cases is far from being complete. In this situation, special efforts are oriented on the computational assistance when collecting and gathering the pharmacovigilance cases from the raw textual sources. Moreover, the reporting standards and frames are also addressed by the researchers. – Analysis of the pharmacovigilance data: this step relies on the encoding of the cases with the dedicated terminologies and then on the semantic and statistical analysis of these cases. The concerns are related to various aspects, such as (1) the semantic correspondence between the cases and the terms; (2) the methods for the encoding of the cases; (3) the managing of semantic ambiguity and relatedness between the terms; (4) exploitation of the SMQs and of the related data; (5) terminological and ontological representation within the dedicated terminologies; (6) computational methods for the signal detection, etc. – Prevention of adverse drug reactions: the prevention step aims at facilitating the exchange of information through the well established national and international networks. It manages specifically the grave adverse drug reactions and the guidelines which help countries to strengthen the pharmaceutical politics and decisions. – etc. The objective of this workshop is to gather people working on various aspects of the pharmacovigilance. Experiments performed within academic, instritutional or industrial contexts are welcome. The proceedings of the workshop will be published in the Drug Safety journal. SUBMISSIONS: The authors are invited to prepare 5 page submissions with the respect of the MIE conference style: - http://www.mie2012.it/documents/fullpaper.dot - http://www.mie2012.it/documents/instruction.pdf For any questions, please contact natalia.grabar at univ-lille3.fr IMPORTANT DATES: May 1, 2012: 1st call for submissions June 20, 2012: Paper due date July 10, 2012: Notifications to Authors July 25, 2012: Camera-ready version Aug 28, 2012: MIE conference and workshop November/December 2012: Publication of the proceedings in the Drug Safety journal SCIENTIFIC COMMITTEE: - Ismaïl Ahmed, Equipe Biostatistique, CESP, UMRS 1018 Inserm, Université Paris Sud, France - Andrew Bate, Visiting Professor, Department of Information Systems and Computing, Computing and Mathematics, Brunel University, London, UK, Adjunct Associate Professor of Medicine, Division of Clinical Pharmacology NYU School of Medicine, New York, USA and faculty of the NYU Center for Health Informatics and Bioinformatics, USA - Kevin Cohen, University of Colorado School of Medicine and University of Colorado at Boulder, USA - Mélanie Courot, BC Cancer Agency, Vancouver, Canada - Reinhard Fescharek, Behring Inc., Germany - Thierry Hamon, LIM&BIO, Université Paris 13, France - Mikaela Keller, CNRS LIFL UMR8022, Mostrare INRIA, Université Lille 1 and 3, France - Halil Kilicoglu, National Library of Medicine, NIH, USA - Niklas Noren, Uppsala Monitoring Centre, WHO Collaborating Centre for International Drug Monitoring, Uppsala, Sweden - Patrick Ruch, University of Applied Sciences, Geneva, Switzerland - Ozlem Uzuner, University at Albany, SUNY, USA ORGANIZERS: Marie Dupuch, CNRS STL UMR 8163, U Lille 1 et 3, France Frantz Thiessard, ISPED, U Bordeaux Segalen, France Natalia Grabar, CNRS STL UMR 8163, U Lille 1 et 3, France Jim Slattery, European Medicines Agency, London, UK ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:49:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:49:59 +0200 Subject: Info: Questionnaire, Collecte un corpus sur l'interaction avec un assistant intelligent Message-ID: Date: Thu, 14 Jun 2012 17:16:33 +0200 From: Sofia Zidane Message-ID: Bonjour, Dans le cadre de mon stage, je collecte un corpus sur l'interaction avec un assistant intelligent en anglais et en français. Pour cela, j'ai mis en point deux petits questionnaires. Je le transfère à la liste LN afin de recevoir un bon nombre de réponses. Voici le lien vers le questionnaire en anglais : https://docs.google.com/spreadsheet/viewform?formkey=dC1ieUlENFVNZzFnRzdCaXZUTTVPZFE6MQ le lien vers le questionnaire en français : https://docs.google.com/spreadsheet/viewform?formkey=dDQxVWE0bVRBNnExSlJMdVo0QW8weVE6MQ Je vous en remercie infiniment ! Bonne journée, Sofia Zidane Chargée du TLN et du transfert technologique Apps4Cars ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:54:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:54:14 +0200 Subject: Conf: FSMNLP 2012, July 23-25, 2012, San Sebastian Message-ID: Date: Thu, 14 Jun 2012 18:50:46 +0200 From: Koldo Gojenola Message-ID: <4FDA1666.50502 at ehu.es> X-url: http://ixa2.si.ehu.es/fsmnlp2012/ ========================================= CALL FOR PARTICIPATION Finite-State Methods and Natural Language Processing - FSMNLP 2012 Tenth International Workshop University of the Basque Country (Miramar Palace), Donostia - San Sebastián July 23-25, 2012 http://ixa2.si.ehu.es/fsmnlp2012/ Early registration, June 20: http://ixa2.si.ehu.es/fsmnlp2012/index.php/en/registration ======================================= PROGRAM July 23 15.00-18.00: TUTORIALS Spelling and grammar correction with FSTs (Tommi Pirinen/University of Helsinki, Iñaki Alegria/University of the Basque Country, Mans Hulden/Ikerbasque (Basque Science Foundation)) Coffee Break Probabilistic parsing with weighted FSTs (Miikka Silfverberg/University of Helsinki) Grapheme-to-phoneme training and conversion with WFSTs (Josef Novak/The University of Tokyo) July 24 9.00: Opening 9.30-10.30: Invited Speaker Kimmo Koskenniemi 10.30-11.00: Coffee Break 11.00-12.00: Long Papers I Effect of Language and Error Models on Efficiency of Finite-State Spell-Checking and Correction (Tommi Pirinen and Sam Hardwick) Practical Finite State Optimality Theory (Dale Gerdemann and Mans Hulden) 12.00-13.00: Short Papers I Handling Unknown Words in Arabic FST Morphology (Khaled Shaalan and Mohammed Attia) Urdu -- Roman Transliteration via Finite State Transducers (Tina Bögel) Integrating Aspectually Relevant Properties of Verbs into a Morphological Analyzer for English (Katina Bontcheva) Finite-State Technology In A Verse-Making Tool (Manex Agirrezabal, Iñaki Alegria, Bertol Arrieta and Mans Hulden) 13.00-14.30: Lunch 14.30-15.30: Short Papers II DAGGER: A Toolkit for Automata on Directed Acyclic Graphs (Daniel Quernheim and Kevin Knight) WFST-Based Grapheme-To-Phoneme Conversion: Open Source Tools for Alignment, Model-Building and Decoding (Josef Novak, Nobuaki Minematsu and Keikichi Hirose) Kleene, A Free and Open-Source Language for Finite-State Programming (Kenneth R Beesley) Implementation of Replace Rules using Preference Operator (Senka Drobac, Miikka Silfverberg and Anssi Yli-Jyrä) 15.30-16.30: Short Papers III First Approaches On Spanish Medical Record Classification Using Diagnostic Term To Class Transduction (Alicia Pérez, Maite Oronoz, Arantza Casillas, Arantza Díaz de Ilarraza and Koldo Gojenola) Developing an Open-Source FST Grammar for Verb Chain Transfer in a Spanish-Basque MT System (Aingeru Mayor, Mans Hulden and Gorka Labaka) Conversion of Procedural Morphologies To Finite-State Morphologies: A Case Study Of Arabic (Mans Hulden and Younes Samih) A Methodology for Obtaining Concept Graphs from Word Graphs (Marcos Calvo, Jon Ander Gómez, Lluís-F Hurtado and Emilio Sanchis) 16.30-18.00: Posters and coffee 20.30: Dinner (in the Old Town) July 25 9.30-11.00: Long Papers II A Finite-State Temporal Ontology and Event-Intervals (Tim Fernando) A Finite-State Approach to Phrase-Based Statistical Machine Translation (Jorge González) Finite-State Acoustic and Translation Model Composition in Statistical Speech Translation: Empirical Assessment (Alicia Pérez, M. Inés Torres and Francisco Casacuberta) 11.00-11.30: Coffee Break 11.30-12.30: Long Papers III Refining the Design of a Contracting Finite-State Dependency Parser (Anssi Yli-Jyrä, Jussi Piitulainen and Atro Voutilainen) Lattice-Based Minimum Error Rate Training using Weighted Finite-State Transducers with Tropical Polynomial Weights (Aurelien Waite, Graeme Blackwood and William Byrne) 12.30-13.30: Business Meeting ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:56:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:56:39 +0200 Subject: Job: Post-doc, Extraction d'information a partir de textes medicaux, LIMSI, Paris Message-ID: Date: Fri, 15 Jun 2012 00:56:23 +0200 From: Pierre Zweigenbaum Message-Id: <201206150056.23773.pz at limsi.fr> Profil de poste : Post-doctorant en traitement automatique des langues Durée : 12 à 16 mois Date de démarrage : septembre ou octobre 2012. THÈME Dans le cadre du projet ANR Accordys, le groupe ILES du LIMSI est à la recherche d'un post-doctorant pour travailler sur l'analyse de textes médicaux. Les documents proviennent de deux sources : des dossiers médicaux (en français) et des résumés d'articles scientifiques indexés dans Medline (en anglais). Le domaine concerné est la foetopathologie. Un dossier médical se compose de plusieurs types de documents dont le document central est le compte rendu d'examen foeto-placentaire qui peut pointer sur d'autres documents (comptes rendus d'examens, avis de médecins, résultats d'analyses, etc.). Il s'agit donc d'analyser des textes relevant de genres différents en en extrayant les informations nécessaires pour instancier un modèle de cas qui sera défini par un autre partenaire du projet. On étudiera en particulier l'apport de méthodes à base linguistique (mise en place et contribution d'une analyse syntaxique robuste) et de méthodes par apprentissage supervisé ou semi-supervisé. La tâche inclut plusieurs dimensions de l'extraction d'informations à partir de textes : * Analyse de la structure des textes. * Détection des entités médicales pertinentes (signes, organes, etc.) et de leurs relations (localisation d'un signe, etc.), avec ancrage référentiel à des ressources terminologiques et ontologiques. Cette détection sera également utilisée pour anonymiser les informations identifiantes (noms, lieux géographiques, etc.). * Détection du cadre temporel et fonctionnel des informations extraites (chronologie, types d'examens rapportant les informations, etc.). Le post-doctorant mettra également en place, en collaboration avec des spécialistes du domaine, un jeu de données de développement et d'évaluation. Missions résumées : - extraction robuste d'informations à partir de textes par méthodes d'apprentissage - application à l'analyse et à l'anonymisation de textes - intégration du module - expérimentation et évaluation Formation attendue : - Doctorat en traitement automatique des langues - Expérience d'analyse de corpus - Connaissances en apprentissage automatique Le poste est à pourvoir à partir du 1er septembre pour une durée de 12 mois extensible à 16 mois. Le salaire correspond aux grilles CNRS et dépend de l'expérience du candidat (de l'ordre de 2000 € net par mois). CONTACTS Envoyer un CV et une lettre de motivation à : Pierre Zweigenbaum (pz at limsi.fr) et Brigitte Grau (bg at limsi.fr) en indiquant une liste d'au moins deux référents pouvant recommander le candidat. L'ÉQUIPE Le groupe ILES du LIMSI-CNRS possède une expérience reconnue dans la recherche d'informations précises (recherche de réponses à des questions), l'extraction d'informations et le traitement de la langue médicale. Ses projets en cours ou récents les plus pertinents pour Accordys sont ceux qui portent sur ces trois thèmes : le projet franco-allemand Quæro (recherche de réponses précises à des questions et reconnaissance d'entités nommées, tâche qu'il coordonne) et les projets ANR Akenaton (extraction d'informations à partir de comptes rendus en cardiologie (Burgun et al., 2011) ; anonymisation de comptes rendus (Grouin & Zweigenbaum, 2011)) et InterSTIS (développement de lexique médical et mise en correspondance de terminologies (Cartoni & Zweigenbaum, 2010)). Le groupe ILES développe également depuis plusieurs années des méthodes d'extraction de relations (Minard et al., 2011 ; Ben Abacha & Zweigenbaum, 2011) et de recherche de réponses précises à des questions médicales sur une base conceptuelle (Ben Abacha & Zweigenbaum, 2012). Il s'intéresse encore aux aspects multilingues, plus particulièrement en français et en anglais, avec transfert entre les deux (Deléger et al., 2009 ; Ben Abacha et al., 2012). Le LIMSI organise l'évaluation annuelle DEFT en fouille de textes depuis 2007, et se positionne chaque année depuis 2009 dans les dix meilleurs systèmes d'extraction d'informations médicales dans les évaluations internationales i2b2 (Deléger et al., 2009 ; Minard et al., 2011). Il a recruté en 2012 deux nouveaux membres permanents sur ce thème. Références Ben Abacha A, Zweigenbaum P. Automatic extraction of semantic relations between medical entities: a rule based approach. Journal of Biomedical Semantics, 2(Suppl 5):S4, 2011. Ben Abacha A, Zweigenbaum P. Medical Question Answering: Translating Medical Questions into SPARQL queries. In ACM SIGHIT International Health Informatics Symposium (IHI 2012), IHI '12, pages 41-50, New York, NY, USA, 2012. ACM. Ben Abacha A, Zweigenbaum P, Max A. Extraction d'information automatique en domaine médical par projection inter-langue : vers un passage à l'échelle. In: TALN 2012 (Traitement automatique des langues naturelles), Grenoble, 2012. ATALA. Burgun A, Rosier A, Temal L, Jacques J, Messai R, Duchemin L, Deléger L, Grouin C, Van Hille P, Zweigenbaum P, Beuscart R, Delerue D, Dameron O, Mabo P, Henry C. Aide à la décision en télécardiologie par une approche basée ontologie et centrée patient. IRBM, 32(2), 2011. Numéro spécial ANR TECSAN, Technologies pour la santé et l'autonomie. B Cartoni, P Zweigenbaum. Semi-automated extension of a specialized medical lexicon for French. In: LREC 2010, Sixth International Conference on Language Resources and Evaluation, pages 1050-1054, 2010. Grouin C, Zweigenbaum P. Une approche à plusieurs étapes pour anonymiser des documents médicaux. RSTI-RIA, 25(4):525-549, 2011. Numéro spécial Intelligence Artificielle et santé. Hermès-Lavoisier. L Deléger, C Grouin, P Zweigenbaum. Extracting medical information from narrative patient records: the case of medication-related information. Journal of the American Medical Informatics Association, 17:555-558, 2010. L Deléger, M Merkel, P Zweigenbaum. Translating medical terminologies through word alignment in parallel text corpora. Journal of Biomedical Informatics, 42(4):692- 701, 2009. Epub 2009 Mar 9. Minard AL, Ligozat AL, Ben Abacha A, Bernhard D, Cartoni B, Deléger L, Grau B, Rosset S, Zweigenbaum P, Grouin C. Hybrid methods for improving information access in clinical documents: Concept, assertion, and relation identification. Journal of the American Medical Informatics Association, 18(5):588-593, 2011. Zweigenbaum P, Demner-Fushman D, Yu H, Cohen KB. Frontiers of biomedical text mining: current progress. Briefings in Bioinformatics. 8(5):358-375, 2007. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 21:01:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 23:01:39 +0200 Subject: Appel: 1st Workshop on Automatic Text Summarization of the Future Message-ID: Date: Fri, 15 Jun 2012 09:15:55 +0200 From: Horacio Saggion Message-ID: X-url: http://www.taln.upf.edu/pages/sepln_ws_2012/ ------------------------------------------------------------------------ 1st Workshop on Automatic Text Summarization of the Future *** Satellite workshop to SEPLN 2012 (Castellón, Spain)*** http://www.taln.upf.edu/pages/sepln_ws_2012/ ------------------------------------------------------------------------ ABOUT THE WORKSHOP: ------------------------------------------------------------------------ Due to the great proliferation of online documents and information, it becomes necessary to develop automatic tools capable of filtering redundant and irrelevant information, thus presenting the most important one in an efficient and effective manner. This is the goal of Automatic Summarization, which aims at producing a concise document, keeping the essential information of a document or set of documents. Research into Automatic Summarization began in the 50s with the purpose of summarizing scientific texts. However, the interest for this type of documents decreased, while the interest in news article summarization grew. Recently, new challenges have appeared in this research area. In the context of the Internet, not only is information being constantly updated, but there is also a lack of quality control of what is being published on the Web. Social networks, blogs, reviews, etc. are non-traditional texts of informal nature, and they therefore constitute a big challenge for the new generation of summaries. High quality documentation such as technical/scientific articles and patents has not received in the past years all the attention that the field deserves. However, given the explosion of technical documentation available on the Web and in intranets, scientific and research and development institutions face a true scientific information deluge. Therefore, summarization should be a key instrument not only for reducing information content in this field but also for measuring information relevance in context, providing users with adequate answers in context. Another challenge for automatic summarization is the generation of abstracts, where it is necessary to take into consideration natural language generation techniques and be able to adapt them from one domain to another. In addition to these, efforts are needed to produce summaries in languages other than English and in multiple languages. Therefore, the main goal of the 1st Workshop on Automatic Text Summarization of the Future is to bring together researchers working on Automatic Summarization, encouraging research into little explored areas such as new textual gentres as well as old, forgotten ones, or summarization in languages other than English (for instance, Spanish). ------------------------------------------------------------------------ IMPORTANT DATES: ------------------------------------------------------------------------ Papers submission deadline (EXTENDED): 29 June 2012 Notification of decisions to authors: 20 July 2012 Workshop date: 7th September 2012 Camera-ready: 25 July 2012 ------------------------------------------------------------------------ SUBMISSIONS: ------------------------------------------------------------------------ We will accept full paper contributions for the workshop. These papers should be written in English, with a maximum length of 8 pages, including references. The submission guidelines can be found on the following page: http://www.sepln.org/?page_id=358 Reviewing for the papers will be blind: reviewers will not be presented with the identity of paper authors. Authors should avoid writing anything that makes their identity obvious in the text. Submissions should be original, and in particular should not have been formally published prior to submission for the workshop. Accepted papers will be published in the Workshop proceedings, with ISBN. We are negotiating the edition of a journal special issue for the best submitted papers. More to be announced. In order to submit your paper use the following link https://www.easychair.org/conferences/?conf=atsf2012. ------------------------------------------------------------------------ TOPICS OF INTEREST: ------------------------------------------------------------------------ Researchers are encouraged to submit papers including, but not restricted to the following topics: - Multi-document summarization - Summarization for new textual genres (blogs, microblogs, social networks, etc.) - Abstractive summarization - Multilingual/crosslingual summarization - Development of resources, corpora, tools, etc. for summary generation - Summarization for facilitating information access - Applications of Summarization and Demos - Summarization for technical and/or scientific documents - Intrinsic and/or Extrinsic Evaluation of Summaries ------------------------------------------------------------------------ ORGANIZERS: ------------------------------------------------------------------------ Horacio Saggion -- Universitat Pompeu Fabra, horacio.saggion at upf.edu Elena Lloret -- Universidad de Alicante, elloret at dlsi.ua.es Manuel Palomar -- Universidad de Alicante, mpalomar at dlsi.ua.es ------------------------------------------------------------------------ PROGRAM COMMITTEE: ------------------------------------------------------------------------ Laura Alonso (Universidad Nacional de Córdoba, Argentina) Ahmet Aker (University of Sheffield, UK) Ester Boldrini (Universidad de Alicante, Spain) Hakan Ceylan (University of North Texas, USA) Javier Couto (Université Paris X, France) Iria da Cunha (Universitat Pompeu Fabra, Spain) Alberto Díaz (Universidad Complutense de Madrid, Spain) Maria Fuentes (Universitat Politècnica de Catalunya, Spain) Robert Gaizauskas (University of Sheffield, UK) George Giannakopoulos (University of Trento, Italy) Nicolas Hernandez (Université de Nantes, France) Leila Kosseim (Concordia University, Canada) Guy Lapalme (Universite de Montreal, Canada) Jean-Luc Minel (Université Paris X, France) Paloma Moreda (Universidad de Alicante, Spain) Rafael Muñoz (Universidad de Alicante, Spain) Ani Nenkova (University of Pennsylvania, USA) Thiago Pardo (Universidade de São Paulo, Brazil) Laura Plaza (Universidad Complutense de Madrid, Spain) Horacio Rodriguez (Universitat Politècnica de Catalunya, Spain) Juan Manuel Torres-Moreno (Universite d'Avignon, France) Jorge Vivaldi (Universitat Pompeu Fabra, Spain) René Witte (Concordia University, Canada) Dina Wonsever (Universidad de la Republique, Uruguay) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 21:03:30 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 23:03:30 +0200 Subject: Seminaire: Alpage, Mark-Jan Nederhof, Input and output restrictions of weighted synchronous grammars, 22 juin 2012 Message-ID: Date: Fri, 15 Jun 2012 09:24:28 +0200 From: Marie Candito Message-ID: <4FDAE32C.2020807 at gmail.com> ************** Séminaire Alpage ******************* Séminaire de l'école doctorale de Paris Diderot : Il s'agit du séminaire de recherche en linguistique informatique organisé par l'équipe Alpage, équipe mixte Inria -- Paris Diderot, spécialisée en analyse syntaxique automatique et en traitement du discours. Le prochain séminaire se tiendra : * vendredi 22 juin de 11h à 12h30 * en salle 3E91 à l'UFRL, 16, rue de Clisson, 75013 Paris (3e étage gauche) Toute personne intéressée est la bienvenue. *********************************************************** Mark-Jan Nederhof (University of St Andrews) : "Input and output restrictions of weighted synchronous grammars" : We consider the problem of restricting the input or output of a synchronous grammar. Whereas solutions are easy to achieve in the unweighted case, complications arise for weighted and probabilistic grammars, especially when a compact representation is required. We also consider the problem of computing prefix probabilities, as a special case of restricting the input of a synchronous grammar to a regular string language. The emphasis will be on synchronous tree adjoining grammars, but also linear context-free rewriting systems will be addressed. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 21:08:04 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 23:08:04 +0200 Subject: Job: Poste d'ATER 27e section au 1er octobre 2012, INSA de Rennes, Date limite pour postuler : 29 juin 2012 midi Message-ID: Date: Fri, 15 Jun 2012 10:11:49 +0200 (CEST) From: Pascale Sebillot Message-ID: <2092155708.4017261.1339747909855.JavaMail.root at irisa.fr> X-url: http://www.insa-rennes.fr/recrutement.html Un poste d'ATER 27e section Rennes est ouvert à l'INSA de Rennes pour un recrutement au 1er octobre 2012 (temps plein, soit 192h d'enseignement). Vous trouverez en fichier joint la fiche de poste qui est consultable sur le site de l'INSA (ou le sera dans quelques jours). Les candidats ont jusqu'au 29 juin 2012 à midi pour transmettre leur dossier (cachet de la poste faisant foi). La fiche et le dossier de candidature sont accessibles (ou le seront dans quelques jours) à http://www.insa-rennes.fr/recrutement.html Cordialement, Pascale Sébillot Service des Ressources humaines Rennes, le 13 juin 2012 Campagne de recrutement - ATER 2012 Identification du poste Nature: ATER Nombre de postes : 1 Quotité : 100 % N° de poste: MCF0034 Section CNU : 27 Composante : Département informatique Laboratoire : IRISA Date de prise de fonction 1er octobre 2012 Durée : 11 mois Enseignement Filières de formation concernées L’ATER interviendra dans le département informatique ainsi que dans les enseignements d’informatique dispensés dans les autres départements de l’INSA, dont le département STPI (1er cycle intégré de l’INSA), auxquels participent activement les enseignants-chercheurs du département informatique. Objectifs pédagogiques et besoin d'encadrement en TP et/ou TD Le candidat devra être en mesure de participer à des enseignements en informatique en dehors de sa spécialité de recherche. En particulier, ces enseignements peuvent concerner, sans que cette liste soit exhaustive : · la programmation (fonctionnelle, objet, impérative, logique, etc.), · les bases de données, · la programmation assembleur, · le test logiciel, · la compilation, · la programmation web, · la logique séquentielle, · etc. Pour plus d’informations : (http://www.insa-rennes.fr/info/ et http://www.insa-rennes.fr/stpi/) Recherche IRISA-INSA est la composante INSA de l’UMR 6074 IRISA (Institut de recherche en informatique et systèmes aléatoires). Cette unité mixte de recherche a pour établissements tutelles le CNRS, l’ENS Cachan (antenne de Bretagne), INRIA, l'INSA de Rennes, l'Université de Bretagne Sud, l'Université de Rennes 1 et Télécom Bretagne. Le concours est ouvert à toute candidature démontrant une intégration claire dans une équipe de l’IRISA. CONTACTS Enseignement : Départements d’enseignement : Informatique et STPI Lieu(x) d’exercice : INSA de RENNES Équipe pédagogique : Département Informatique Nom directeur département : Ivan Leplumey Tél directeur département : 02 23 23 86 74 Email directeur département : Ivan.Leplumey at insa-rennes.fr Recherche : Lieu(x) d’exercice : IRISA Nom directeur laboratoire : Bruno Arnaldi Tél directeur laboratoire : 02 99 84 72 61 Email directeur laboratoire : Bruno.Arnaldi at irisa.fr URL laboratoire : http://www.irisa.fr/ Description du laboratoire : IRISA Remarque : outre les pièces et informations explicitement demandées dans le dossier de candidature, le candidat a la possibilité de présenter un CV détaillé contenant des arguments d’intégration en enseignement et en recherche. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 21:09:38 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 23:09:38 +0200 Subject: Appel: TheoreticAl and Computational MOrphology (TACMO) Message-ID: Date: Fri, 15 Jun 2012 17:18:48 +0200 From: Delphine Tribout Message-ID: <1339773528.4fdb5258e27ed at kmail.linguist.univ-paris-diderot.fr> X-url: http://www.cil19.org/ateliers/theoretical-and-computational-morphology/ **Apologies for cross-posting** Second Call for Papers ========================================================================= TheoreticAl and Computational MOrphology: New Trends and Synergies (TACMO) Workshop to be held in conjunction with the International Congress of Linguists, July 2013, Geneva (CH) www.cil19.org ========================================================================= Nowadays, theoretical morphology witnesses a revival due to the emergence of new formalization frameworks, both for inflectional and lexical morphology: canonical morphology, approaches based on analogy, rule-based approaches, to name just a few. All these approaches can potentially shed new light on computational processing of morphology, either for parsing or generation. In parallel, new computational techniques (such as (un-)supervised morphological acquisition) and formal frameworks bring a fresh look on morphological phenomena. Both domains tackle more or less implicitly the organization of the lexicon in general. The TACMO workshop aims at gathering these two facets of morphology - computational and theoretical formalization - in order to foster interactions and to highlight how both approaches benefit from each other. We mainly expect (but not exclusively) communication proposals on the following topics: - Inflectional, derivational and compositional morphology. - Problems raised by non affixal processes (templatic morphology, reduction and truncation, reduplication, blending and conversion) - Semantics-morphology interface and its role in the organization of the lexicon. - Syntax-morphology interface and its role in NLP systems. - Conception of lexical resources enriched with morphological information. Talk proposals should especially focus on the innovative aspects of the formalization and/or its benefits for automation. For computational approaches, the focus should be put on the new perspective that the implementation can bring on morphological descriptions. SUBMISSIONS: Authors should submit an anonymous extended abstract (3-4 pages) in English, containing the title of the talk, keywords and references. Abstract should be written in usual font (typically Times 12pt) and submitted in pdf format through EasyChair at the following address : https://www.easychair.org/conferences/?conf=tacmo2012 All abstracts will be blind reviewed by two members of the Scientific Committee. A book of abstract will be distributed at the workshop. IMPORTANT DATE: - July 15 2012: Deadline for abstract submission - October 2012: Notification to Authors - July 22-27 2013: Workshop ORGANIZERS: - Bruno Cartoni (University of Geneva) - Delphine Bernhard (University of Strasbourg) - Delphine Tribout (University of Lille 3) WORKSHOP WEBSITE: http://www.cil19.org/ateliers/theoretical-and-computational-morphology/ SUBMISSION WEBSITE: https://www.easychair.org/conferences/?conf=tacmo2012 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:18:54 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:18:54 +0200 Subject: Seminaire: Alpage, Carlos Subirats, Spanish FrameNet and its applications to NLP, 28 juin 2012 Message-ID: Date: Mon, 18 Jun 2012 11:41:34 +0200 From: Marie Candito Message-ID: <4FDEF7CE.7030407 at gmail.com> X-url: http://sfn.uab.es:9080/SFN ************************************************ Attention : horaire inhabituel : le jeudi 28 juin , à 16h ************** Séminaire Alpage ******************* Il s'agit du séminaire de recherche en linguistique informatique organisé par l'équipe Alpage, équipe mixte Inria -- Paris Diderot, spécialisée en analyse syntaxique automatique et en traitement du discours. Le prochain séminaire se tiendra : * jeudi 28 juin à 16h * en salle 3E91 à l'UFRL, 16, rue de Clisson, 75013 Paris (3e étage gauche) Toute personne intéressée est la bienvenue. *********************************************************** Spanish FrameNet and its applications to NLP Carlos Subirats Autonomous University of Barcelona The meanings of lexical units (LUs) are constructed in relation to background knowledge. Frame Semantics is based on the assumption that the structure of this background knowledge can be analyzed in terms of semantic frames (Fillmore 1982, 1985). A frame is a schematic representation of a situation that includes its participants, props, and other conceptual elements. Each LU evokes a particular frame and profiles some element or aspect of that frame. The Spanish FrameNet Project (SFN) is creating an online lexical resource for Spanish based on Frame Semantics (Fillmore and Baker 2010, Ruppenhofer et al. 2010) and supported by corpus evidence. The aim of SFN is to document the range of semantic and syntactic combinatory possibilities (valences) of each word of Spanish in each of its senses by annotating example sentences and automatically organizing the annotation results. The project database is online and can be queried at http://sfn.uab.es:9080/SFN. The SFN corpus of annotated sentences has been used as a training corpus for Shalmaneser (Erk and Padó 2006), a Frame-Semantics based statistical program for automatic semantic-role labeling. SFN has also begun to apply Construction Grammar (Fillmore and LeeGoldman 2011) to specifying the syntactic and semantic characteristics of Spanish grammatical constructions and linking them to semantic frames. SFN is being developed at the Autonomous University of Barcelona (Spain) in cooperation with the FrameNet Project, housed at the International Computer Science Institute (Berkeley, CA). SFN is sponsored by Spain's Ministry of Economy and Competitiveness (Grant Nr. FFI2011-23231). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:27:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:27:08 +0200 Subject: Job: Rectificatif, Poste d'ATER 27e, INSA de Rennes - Date limite pour postuler : 27 juin 2012 midi Message-ID: Date: Mon, 18 Jun 2012 10:17:07 +0200 (CEST) From: Pascale Sebillot Message-ID: <203052607.4552003.1340007427547.JavaMail.root at irisa.fr> X-url: http://www.insa-rennes.fr/recrutement.html Bonjour, la date limite pour postuler au poste d'ATER INSA 27e section a été avancée au 27 juin midi. Veuillez trouver ci-dessous la fiche de poste et le dossier de candidature à renvoyer par mail à recrutement-ater at insa-rennes.fr Cordialement, Pascale Sébillot ------------------------------------------------------------------------ Un poste d'ATER 27e section Rennes est ouvert à l'INSA de Rennes pour un recrutement au 1er octobre 2012 (temps plein, soit 192h d'enseignement). Vous trouverez en fichier joint la fiche de poste qui est consultable sur le site de l'INSA (ou le sera dans quelques jours). Les candidats ont jusqu'au 29 juin 2012 à midi pour transmettre leur dossier (cachet de la poste faisant foi). La fiche et le dossier de candidature sont accessibles (ou le seront dans quelques jours) à http://www.insa-rennes.fr/recrutement.html Cordialement, Pascale Sébillot ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:29:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:29:16 +0200 Subject: Appel: Fourth Workshop on Computational Approaches to Arabic Script-based Languages Message-ID: Date: Sun, 17 Jun 2012 02:02:57 -0400 (EDT) From: jsmith9887 at aol.com Message-Id: <8CF1A65FA1692EF-C84-8ECC at webmail-d133.sysops.aol.com> X-url: http://amta2012.amtaweb.org/CFP Fourth Workshop on Computational Approaches to Arabic Script-based Languages(CAASL4) In conjunction with The tenth biennial conference of the Association for Machine Translation in the Americas (AMTA-2012)San Diego CA, USA Thursday, November 1st, 2012 Three years after CAASL3, this workshop provides an opportunity for developers and researchers in Academia, the industry, and government to present their work, exchange ideas, and demonstrate systems that focus on the challenging task of dealing with all aspects in natural language processing for languages that use the Arabic script. It also provides an opportunity to assess the progress that has been made since the third workshop in 2009. Authors are invited to submit papers on completed original research and research in progress on any aspect of NLP for the Arabic Script-based languages. Papers should relate directly or indirectly to the following themes: Statistical and rule-based machine translation Translation Aids Evaluation Methods and Techniques of machine translation systems Localization and multilingual information retrieval systems Shallow and deep parsing Data driven approaches Entity extraction Tokenization and segmentation, Name matching Speech synthesis and recognition Text to speech systems Semantic analysis Knowledge Bases Information retrieval Semantic web and inferences Topic Detection and text summarization. Workshop Chairs Ali Farghaly Program Chair Farhard Oroumchian Workshop Dates and Deadlines The workshop will be held on Thursday November 1st, 2012 from 9 – 5. Papers submission deadline: August 1st, 2012 Author notification: August 15, 2012 Camera Ready submissions due: September 1st, 2012 Website for submission https://www.softconf.com/amta2012/CAASL4/ Contact Information: alifarghaly at yahoo.com Papers must be submitted in pdf. Papers should not exceed 8 pages including references and tables. and should follow the formatting guidelines at http://amta2012.amtaweb.org/CFP. Papers should present original, previously unpublished or under consideration work. Papers will be anonymously reviewed by three members of the program committee. Organizing Committee Ali Farghaly and Farhard Oroumchian Tentative Program Committee Tim Buckwalter University of Maryland, USA Violetta Cavalli-Sforza AlAkhawayn University, Moroccoa Sherri Condon MITRE, USA Aly Fahmy Cairo University Mona Diab Columbia University, USA Joseph Dichy Lyon University, France Andrew Freeman University of Washington, USA Nizar Habash Columbia University, USA Lamia Hadrich Belguith University of Sfax, Tunisia Sarmad Hussain CRULP, Pakistan Mohamed Maamouri Linguistics Data Consortium, USA Farhad Oroumchian University of Wollongong in Dubai, United Arab Emirates Jean Sennellart SYSTRAN, France Khaled Shaalan The British University in Dubai, United Arab Emirates Ahmed Rafea The American University in Cairo, Egypt Imed Zitouni IBM, USA Azadeh Shakery University of Tehran, Iran Karim Bouzoubaa Mohamed Vth Agdal University, Morocco Abdelhadi Saudi École Nationale de l'Industrie Minérale, Morocco ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:30:23 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:30:23 +0200 Subject: Appel: ESSLLI 2013, Extended deadline (june 29) course/workshop proposals Message-ID: Date: Mon, 18 Jun 2012 14:25:19 +0200 (CEST) From: Johan Bos Message-ID: X-url: http://esslli2013.de/ ------------------------------------------------------------------ Call for Course and Workshop Proposals ESSLLI 2013 25th European Summer School in Logic, Language and Information Duesseldorf, Germany August 5-16, 2013 http://esslli2013.de/ EXTENDED DEADLINE DUE TO POPULAR DEMAND ------------------------------------------------------------------ IMPORTANT DATES =============== 29 June 2012: Proposal submission deadline (extended) 15 September 2012: Notification 1 June 2013: Course material due TOPICS AND FORMAT ================= Proposals for courses and workshops at ESSLLI'2013 are invited in all areas of Logic, Linguistics and Computing and Information Sciences. Cross-disciplinary and innovative topics are particularly encouraged. Each course and workshop will consist of five 90 minute sessions, offered daily (Monday-Friday) in a single week. Proposals for two-week courses should be structured and submitted as two independent one-week courses, e.g. as an introductory course followed by an advanced one. In such cases the ESSLLI programme committee reserves the right to accept just one of the two proposals. All instructional and organizational work at ESSLLI is performed completely on a voluntary basis, so as to keep participation fees to a minimum. However, organizers and instructors have their registration fees waved, and are reimbursed for travel and accommodation expenses up to a level to be determined and communicated with the proposal notification. ESSLLI can only guarantee reimbursement for at most one course/workshop organizer, and can not guarantee full reimbursement of travel costs for lecturers or organizers from outside of Europe. The ESSLLI organizers would appreciate any help in controlling the School's expenses by seeking complete coverage of travel and accommodation expenses from other sources. CATEGORIES ========== Each proposal should fall under one of the following categories. * FUNDAMENTAL COURSES * Such courses are designed to present the basics of a research area, to people with no prior knowledge in that area. They should be of elementary level, without prerequisites in the course's topic, though possibly assuming a level of general scientific maturity in the relevant discipline. They should enable researchers from related disciplines to develop a level of comfort with the fundamental concepts and techniques of the course's topic, thereby contributing to the interdisciplinary nature of our research community. * INTRODUCTORY COURSES * Introductory courses are central to ESSLLI's mission. They are intended to introduce a research field to students, young researchers, and other non-specialists, and to foster a sound understanding of its basic methods and techniques. Such courses should enable researchers from related disciplines to develop some comfort and competence in the topic considered. Introductory courses in a cross-disciplinary area may presuppose general knowledge of the related disciplines. * ADVANCED COURSES * Advanced courses are targeted primarily to graduate students who wish to acquire a level of comfort and understanding in the current research of a field. * WORKSHOPS * Workshops focus on specialised, usually topics of current interest. Workshops organisers are responsible for solliciting papers and selecting the workshop programme. PROPOSAL GUIDELINES =================== Course and workshop proposals should follow closely the following guidelines to ensure full consideration. Each course may have no more than two instructors, and each workshop no more than two organizers. All instructors and organizers must possess a PhD or equivalent degree by the submission deadline. Course proposals should mention explicitly the intended course category. Proposals for introductory courses should indicate the intended level, for example as it relates to standard textbooks and monographs in the area. Proposals for advanced courses should specify the prerequisites in detail. Proposals must be submitted in PDF format via: https://www.easychair.org/conferences/?conf=esslli2013 and include all of the following: o Personal information for each proposer: Name, affiliation, contact address, email, fax, homepage (optional) o General proposal information: Title, category o Contents information * Abstract of up to 150 words * Motivation and description (up to two pages) * Tentative outline * Expected level and pre-requisites * Appropriate references (e.g. textbooks, monographs, proceedings, surveys) o Practical information: * Relevant preceding meetings and events, if applicable * Potential external funding for participants ------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:34:33 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:34:33 +0200 Subject: Revue: L'information grammaticale sur Persee, numero 1 a 103 Message-ID: Date: Mon, 18 Jun 2012 15:57:16 +0200 From: Reza Mir-Samii Message-ID: <4FDF33BC.4040506 at univ-lemans.fr> X-url: http://www.persee.fr/web/revues/home/prescript/revue/igram Veuillez pardonner les envois multiples Nous avons le plaisir d'annoncer que les numéros 1 à 103 (1851 contributions, 1997-2004) de la revue "L'information grammaticale" sont, depuis le jeudi 14 juin 2012, en ligne sur le site Persée http://www.persee.fr/web/revues/home/prescript/revue/igram ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:36:49 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:36:49 +0200 Subject: Appel: L'Information grammaticale Message-ID: Date: Mon, 18 Jun 2012 18:06:20 +0200 From: Reza Mir-Samii Message-ID: <4FDF51FC.2060408 at univ-lemans.fr> X-url: http://www.informationgrammaticale.com/ Veuillez pardonner les envois multiples L'Information grammaticale est ouverte à des propositions de publication pour la rubrique /Varia /de trois de ses quatre numéros annuels (octobre, janvier, mars). Les propositions, accompagnées d'un résumé de 500 à 1000 signes, doivent être adressées à articles_hors_programme at informationgrammaticale.com. Elles seront soumises à une relecture anonyme par au moins deux relecteurs du Comité international de lecture de la revue. L’avis motivé des relecteurs (acceptation / refus) et leurs suggestions (éventuelles) de modifications et corrections seront transmis aux auteurs dans les meilleurs délais. Calendrier des propositions d’article : Dans un premier temps, adressez-nous votre article avec votre adresse courriel *et votre adresse postale*. Calendrier pour la remise de votre article définitif corrigé : - 31 août pour le numéro d'octobre - 15 octobre pour le numéro de janvier - 1er décembre pour le numéro de mars Consignes : Vous devrez : - ne pas dépasser 37 500 signes espaces comprises (c'est-à-dire 6 pages de la revue), faute de quoi l'article vous sera renvoyé ; - proposer une analyse innovante du phénomène étudié ; - respecter la date *annoncée de remise de votre article car celui-ci sera soumis à l'avis du comité de lecture (deux relecteurs par article), qui pourra vous demander des rectifications, et dans tous les cas reste seul juge de l’acceptation ou du refus de votre article par la revue ; - rédiger conjointement un résumé *de cet article (en anglais et en français) de 500 à 1000 signes qui sera mis en ligne sur le site de la revue pour présentation de votre article. Des indications complémentaires se trouvent sur le site de la revue http://www.informationgrammaticale.com/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:38:12 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:38:12 +0200 Subject: Job: Post-doc, Multimedia Processing, CEA LIST Message-ID: Date: Mon, 18 Jun 2012 16:04:23 +0200 From: Adrian Popescu Message-ID: <4FDF3567.6080901 at cea.fr> X-url: http://www.kalisteo.fr/en/index.htm The Vision and Content Engineering Lab (LVIC) of CEA LIST (French Atomic Commission), an interdisciplinary group that works on multimedia and multilingual data analysis and understanding, with a focus on fast growing and large public application domains, announces the availability of a 2-years post doctoral position. The position is associated to the MUCKE project, funded within the CHIST-ERA funding scheme of the FP7, which fosters highly innovative and multidisciplinary collaborative projects in information and communication sciences and technologies. The project will start in October 2012. Its main objective is to devise new and reliable knowledge extraction models designed for multilingual and multimodal data shared on social networks. The post-doctoral researcher will first work on multimodal concept representation and then on user credibility estimation for multimedia flows. The first task will focuson the proposition of innovative language and image processing techniques as well as on their combination using information fusion techniques. Particular attention will be given to the scalability of the methods developed because one important project objective is to model a large number of concepts (hundreds of thousands) and an important volume of textual and visual documents (tens of millions). For textual documents, the objective is to depart from text representations as bags of words (unigrams) to representations as vectors of unambiguous concepts and entities through concept and entity recognition and disambiguation. For images, the main problems tacked in MUCKE are parsimonious local image description, large scale concept detection and concept visualness. Multimodal fusion will be based on probabilistic models that move beyond a scoring of similarity towards providing an actual probability of relevance. The second task will focus on the proposition of a novel model for estimating user credibility for multimedia flows, which combines content and structural features of the user's networked representation. Using results obtained for concept representation, credibility estimation will be cast as an information fusion problem, with a first step that combines textual and visual information and a second step that combines user content and context. Another important credibility related question that will be investigated is whether credibility should be a global characteristic of a user or domain related. Candidates must hold a PhD in Computer Science or expect to complete it before November 2012. Experience in Natural Language Processing, Information Retrieval or Computer Vision is expected, as well as willingness to learn new topics related to the post-doc. The lab is situated in Palaiseau, 20 km south of Paris and is part of the CEA LIST Institute, which focuses its research activities on developing innovative technologies for smart and complex systems. The post-doc will be part of the lab's multimedia team, which consists of researchers in NLP, computer vision and multimedia processing. The working language are English and French. A more detailed description of LVIC's activities is available at _http://www.kalisteo.fr/en/index.htm_. For further information, please send an expression of interest to adrian.popescu at cea.fr, attaching a CV. The position is availablefrom November 2012 and is open until filled. Adrian Popescu CEA LIST Vision and Content Engineering Lab Centre de Saclay - NanoInnov Bât. 861 adrian.popescu at cea.fr http://comupedia.org/adrian ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:42:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:42:48 +0200 Subject: Job: Ingenieur en developpement d'applications, Equipe SYNALP, LORIA Nancy (CDD INRIA 5 mois) Message-ID: Date: Wed, 20 Jun 2012 10:03:48 +0200 From: Claire Gardent Message-ID: X-url: http://talc.loria.fr/ALLEGRO-Nancy,254.html Offre d'Emploi : Ingénieur en développement d'applications Equipe SYNALP, LORIA Nancy (CDD INRIA 5 mois) Contexte Le projet Allegro (http://talc.loria.fr/ALLEGRO-Nancy,254.html) est un projet financé par l’Union Européenne qui vise à proposer de nouvelles technologies permettant de faciliter l’apprentissage du français langue étrangère. Au sein de ce projet, l'équipe Synalp a développé un jeu sérieux interfaçant un générateur automatique d'exercices de grammaire avec un univers virtuel. Dans ce jeu (I-FLEG), l'apprenant marque des points en complétant des exercices de grammaires. Mission L'ingénieur recruté travaillera sur l'interfacage entre les deux versions du jeu I-FLEG (l'une implémentée dans Second Life et l'autre dans OpenSim) avec les modules de Traitement Automatique des Langues développés par l'équipe dont en particulier, un générateur d'exercices et un moteur de dialogue. Il s'agira en particulier, de modifier le système existant selon les besoins du projet, de développer des procédures permettant l'évaluation automatique du système et de développer le monde virtuel. Compétences et profil Formation: Bac+5, Master en informatique ou équivalent Languages de programmation: Java, Javascript and SQL Excellente connaissance des technologies du Web: PHP, GWT, JSP, Rails, Grails, etc Formation en informatique et connaissance du développement logiciel et des outils associés (gestionnaire de versions, etc.) Compétences ou aptitudes appréciées: TAL, Python, LSL, intérêt pour le développement de jeux Maîtrise du système d'exploitation Linux Bonne faculté d'apprentissage et d'adaptation. Le goût du travail en équipe. Lieu de travail, durée du contrat et salaire Adresse : LORIA Nancy, Equipe Synalp, Bat. B 615, rue du jardin botanique 54600 Villers lès Nancy Type et durée : CDD 5 mois Début : Juillet 2012 Rémunération : Environ 2 300 Euros brut mensuel Comment postuler Envoyer CV et lettre de motivation à claire.gardent at loria.fr le plus rapidement possible Claire Gardent, Directrice de Recherche CNRS http://www.loria.fr/~gardent ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:45:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:45:16 +0200 Subject: Appel: Workshop Affect, Compagnon Artificiel, Interaction 2012 (WACAI12) Message-ID: Date: Wed, 20 Jun 2012 17:03:05 +0200 From: Alexandre Pauchet Message-ID: <4FE1E629.4030901 at insa-rouen.fr> X-url: http://wacai2012.imag.fr/ ******************************************************* APPEL A COMMUNICATION Workshop Affect, Compagnon Artificiel, Interaction 2012 (WACAI'12) Grenoble, 15 et 16 Novembre 2012 http://wacai2012.imag.fr/ ******************************************************* L'objectif du workshop *WACAI 2012* est de réunir les recherches et développements en cours autour des thèmes des /Compagnons Artificiels (Agents Conversationnels animés -ACA-//et robots interactifs)/ et de l'/Informatique Affective/, afin que les chercheurs des communautés scientifiques concernées puissent présenter leurs modèles, outils, technologies et résultats de recherche. Le workshop *WACAI 2012* est une ouverture de la communauté de recherche *ACA* vers celle des *robots interactifs* et de l'*Informatique affective*. Après les précédentes éditions du workshop WACA, organisées successivement à Grenoble (2005), à Toulouse (2006), à Paris (2008) et à Lille (2010), cette nouvelle édition ajoute l’*Interaction* comme sujet central en favorisant les rencontres avec les communautés de recherche en robotique, informatique affective mais aussi sciences humaines et sociales. Les thèmes suggérés couvrent pour l'essentiel 4 axes de recherche : 1. Compagnons Artificiels: ACA et robots interactifs 2. Modèles psychologiques et modèles computationnels pour l'interaction affective 3. Signaux affectifs: détection et synthèse de comportements affectifs, annotation et représentation à partir de texte, de son et d'image 4. Étude utilisateurs, ergonomie et évaluation des systèmes affectifs Liste indicative et non exhaustive des thèmes : * Agents conversationnels, agents conversationnels animés * Personnages virtuels * Robots personnels, robots interactifs * Robots domestiques, robots compagnons * Architectures logicielles et technologies des compagnons artificiels * Plateformes d'expérimentation * Modèles cognitifs * Modèles des émotions * Représentation des connaissances et raisonnement * Interaction multimodale * Interaction Humain-comapagnons artificiels * Emotion et communication (expression et reconnaissance) * Construction et traitement de corpus d'interactions * Méthodologies d'évaluation * Applications et retours d'expérience ******************************************************* *** Soumissions Les propositions de communication, articles mi-longs (8 pages) ou résumés de posters ou démonstrations (2 pages) (voir le site de la conférence pour plus de détails sur la mise en page), rédigées en Français ou en Anglais, devront être soumises le *20 septembre 2012* au plus tard sur le site web de la conférence : http://wacai2012.imag.fr/. *** Comité de programme Présidents: Dominique Duhaut (dominique.duhaut at univ-ubs.fr), Alexandre Pauchet (pauchet at insa-rouen.fr) *** Comité d'organisation Présidents: Sylvie Pesty (sylvie.pesty at imag.fr), Carole Adam (carole.adam at imag.fr) *** Calendrier 20 septembre 2012 : Réception des contributions 15 octobre 2012 : Notification d'acceptation 25 octobre 2012 : Réception des versions finales des articles 15 et 16 novembre 2012 : WACAI'12 ******************************************************* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:47:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:47:14 +0200 Subject: Conf: ECAI 2012, Montpellier, France, 27-31 August 2012 Message-ID: Date: Wed, 20 Jun 2012 18:02:32 +0200 From: ECAI 2012 Publicity Message-ID: <4FE1F418.6090703 at lirmm.fr> X-url: http://www2.lirmm.fr/ecai2012/ ###################################################################### ## ECAI-2012 ## Call for participation ## ECAI-2012 ## ###################################################################### ## REGISTRATION IS OPEN ## Early registration until July 10 The Twentieth European Conference on Artificial Intelligence 27-31 August 2012 Montpellier, France http://www2.lirmm.fr/ecai2012/ ###################################################################### ECAI is the biennial European Conference on Artificial Intelligence organized by the European Coordinating Committee for Artificial Intelligence (ECCAI); it is the premier forum for presenting Artificial Intelligence results in Europe. The twentieth conference in this series, ECAI 2012, will take place in Montpellier (France) August 27-31. ECAI 2012 will gather researchers and practitioners of Artificial Intelligence from all over the world; they will present the latest results and identify new trends and challenges in all subfields of Artificial Intelligence as well as demonstrate innovative applications and uses of advanced Artificial Intelligence technology. In addition to the main technical track, ECAI 2012 will feature keynote and invited talks, invited tutorials, an elaborate workshop program, a system demonstration track, a Turing centenary celebration, in which we will celebrate the 100th anniversary of the birth of Alan Turing and his influence on Artificial Intelligence, and a special session on Highlights of European AI, to celebrate the 20th ECAI conference and 25 years of AI Communications. ECAI 2012 will also feature the 6th STAIRS (STarting AI Researcher Symposium) and the 6th PAIS (Conference on Prestigious Applications of Intelligent Systems) as sub-conferences. The 6th RuleML (International Symposium on Rules) will be co-located. ECAI-2012 will be held in the beautiful city of Montpellier, France. With excellent opportunities for sightseeing and gastronomy, Montpellier promises to be a wonderful venue for a memorable conference. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:04:21 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:04:21 +0200 Subject: Job: Researcher in Computational Linguistics, Duesseldorf, Germany Message-ID: Date: Thu, 21 Jun 2012 10:29:06 +0200 From: Laura Kallmeyer Message-ID: X-url: http://www.sfb991.uni-duesseldorf.de/en/sfb991/ X-url: http://www.phil-fak.uni-duesseldorf.de/beyond-cfg/. The Department for Computational Linguistics of the Heinrich-Heine-Universitaet Duesseldorf, Germany (Chair of Computational Linguistics: Prof. Dr. Laura Kallmeyer) offers a position as wissenschaftliche/r Mitarbeiter/in (TV-L E13 100%) for a postdoc or an advanced doctoral student. The position starts in October 2012. Its duration is limited to two years, maybe with the possibility of an extension. It includes 4 hours of teaching per week in computational linguistics. Teaching is supposed to be in German, if not immediately, then after a short time. Therefore, if the candidate does not speak German yet, he/she should be willing to learn and practice it. The candidate should preferably have some teaching experience and should be willing to participate in the research activities conducted at the Department for Computational Linguistics. These cover the following areas: 1. data-driven parsing 2. statistical machine translation 3. syntax-semantics interface, in particular (but not limited to) frame-based (i.e., feature-structure-based) semantic composition 4. grammar formalisms, in particular (but not limited to) Tree Adjoining Grammars The Department for Computational Linguistics offers a rich and stimulating research environment: It participates with several projects in the Collaborative Research Center (CRC) 991 funded by the DFG, http://www.sfb991.uni-duesseldorf.de/en/sfb991/. The CRC is a large collection of research projects; it focusses on the structure of representations in language, cognition and science with a particular emphasis on frames and on lexical semantics. Besides the CRC projects there is also a project on parsing and machine translation, http://www.phil-fak.uni-duesseldorf.de/beyond-cfg/. Salary is on the German scale TV-L E13. The position is for two years. The starting date is October 1, 2012. Applications should include the following: 1. Cover letter outlining interest in the position and academic goals 2. CV 3. Copies of certificates 4. If available, a copy of the PhD thesis and other sample publications. For further questions, please send an email to kallmeyer at phil.uni-duesseldorf.de. Applications should be sent in electronic form to kallmeyer at phil.uni-duesseldorf.de. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:06:44 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:06:44 +0200 Subject: Appel: JapTAL2012, the 8th International Conference on Natural Language Processing (Submission site open) Message-ID: Date: Thu, 21 Jun 2012 13:01:28 +0200 From: Hitoshi ISAHARA (au lieu de Sylviane CARDEY ) Message-Id: <5.0.2.1.2.20120621125626.05ebccd8 at pop.univ-fcomte.fr> X-url: http://lang.cs.tut.ac.jp/japtal2012/ X-url: http://senldogo0039.springer-sbm.com/ocs/home/JapTAL2012 JapTAL2012, the 8th International Conference on Natural Language Processing, will be held in Kanazawa, Japan, in October 2012. http://lang.cs.tut.ac.jp/japtal2012/ The submission page of JapTAL 2012 is now open http://senldogo0039.springer-sbm.com/ocs/home/JapTAL2012 The conference proceedings will be published by Springer Publishers as a volume in the Lecture Notes in Computer Science/Lecture Notes in Artificial Intelligence (LNCS/LNAI) series. Please visit above mentioned web page by Springer and upload your papers. Because of the delay of preparing submission page, we extend paper due until 29th of June, 2012. We look forward to meeting with you in Kanazawa! Best regards, Hitoshi Isahara Conference Chair of JapTAL2012 Professor of Toyohashi University of Technology ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:10:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:10:57 +0200 Subject: Appel: 39th SOFSEM 2013, Data, Information, and Knowledge Engineering Track Message-ID: Date: Thu, 21 Jun 2012 16:48:21 +0200 From: Harald Sack Message-ID: X-url: http://www.sofsem.cz [Apologies for receiving multiple copies] 39TH INTERNATIONAL CONFERENCE ON CURRENT TRENDS IN THEORY AND PRACTICE OF COMPUTER SCIENCE (SOFSEM 2013) Call for Papers January 26-31, 2013 VZ Bedrichov (Spindleruv Mlyn), Czech Republic http://www.sofsem.cz Deadline for Abstracts: June 22, 2012 Conference Proceedings will be published as Springer LNCS. * TRACKS SOFSEM 2013 will consist of four tracks and will be focussed on the following topics: - FOUNDATIONS OF COMPUTER SCIENCE (chaired by Guiseppe F. Italiano) algorithmic game theory, algorithms and data structures, including sequential, parallel, distributed, randomized, online and approximation algorithms, automata theory, grammars, formal languages, rewriting, computational biology, complexity theory, computational geometry, computational learning theory, discrete mathematics related to computer science, quantum computing, logics and semantics of programs, theory of databases, semi-structured data, and finite model theory, theory of programming languages. - SOFTWARE and WEB ENGINEERING (chaired by Jerzy Nawrocki) Application Engineering: engineering methodologies, agile development, modelling and model driven development, requirements engineering, architecture and design, components and reuse, program comprehension and visualization, testing, human-computer interaction, tools and development environments, software dependability, safety and reliability, web service-based architectures and applications, semantic web services, web service composition. Data Engineering: data and information modelling, data and information semantics, data privacy and security, semantics discovery and representation, social web applications, context aware applications, web 2.0 technologies, personalized software and web applications, information extraction, mobile data and Information, future Internet applications. - DATA, INFORMATION and KNOWLEDGE ENGINEERING (chaired by Harald Sack) databases and database architectures, machine learning, knowledge discovery and data mining, provenance and trust in data management and knowledge engineering, data integration, multimedia databases and multimedia retrieval, information retrieval, intelligent agents, multi-agent systems, knowledge engineering and acquisition, knowledge modeling and processing, semantic web technologies, ontology engineering and ontology dynamics, linked data and open data, information and knowledge visualization. - SOCIAL COMPUTING and HUMAN FACTORS (chaired by Frans C. A. Groen) intelligent systems / robotics, computer vision, intelligent vehicles, datamining and logic, visualisation, graphics, virtual reality, security, cryptography, multimedia, human factors, computational science. Moreover, for PhD students there will be the traditional `STUDENT RESEARCH FORUM'. Student papers (with a checked Student Contribution at the Submission System) not accepted for a regular track but of sufficient high quality can be selected for in the Student Research Forum (to be published in a local proceedings). Their authors will have a nice opportunity to present their ideas in front of the main SOFSEM audience. The detailed information about tracks, topics and Program Committee Members is presented at http://www.sofsem.cz/sofsem13/index.php?page=call The submission system is available at: https://www.easychair.org/account/signin.cgi?conf=sofsem2013 IMPORTANT DATES Abstract deadline: June 22, 2012 Full paper deadline: June 29, 2012 Acceptance notification: September 21, 2012 Camera-ready papers: October 5, 2012 Conference: January 26-31, 2013 LOCATION AND VENUE Location, venue and leisure activities of SOFSEM 2013 are presented at: http://www.sofsem.cz/sofsem13/index.php?page=location http://www.sofsem.cz/sofsem13/index.php?page=leisure We hope that you find the tracks for SOFSEM 2013 interesting, and that you will join us and enjoy the traditional, inspiring SOFSEM atmosphere. Please do not hesitate to contact us in case you have any questions. We are looking forward to see you in Spindleruv Mlyn at SOFSEM 2013, Peter van Emde Boas (Program Committee Chair) Martin Rimnac (Organising Committee Chair) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:11:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:11:46 +0200 Subject: Appel: revue TAL, Note de lecture (STEDE) Message-ID: Date: Fri, 22 Jun 2012 09:00:20 +0200 (CEST) From: Denis Maurel Message-ID: <373115763.391567.1340348420651.JavaMail.root at mail10> Appel: revue TAL - Note de lecture (STEDE) La revue TAL publie régulièrement des notes de lecture. Nous recherchons un collègue souhaitant lire le livre: "Manfred STEDE. Discourse Processing. Morgan & Claypool publishers. 2011. 155 pages" et prêt à en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoyé gracieusement en échange du service rendu). Cette note de lecture doit être rédigée en français (trois pages maximum, au format de la revue) et envoyée en septembre 2012. D'autres compte-rendu sont possibles si vous avez lu récemment un ouvrage qui vous a intéressé et si vous êtes prêt à partager votre lecture avec la communauté... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:13:15 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:13:15 +0200 Subject: These: Asma Ben Abacha, Recherche de reponses precises a des questions medicales Message-ID: Date: Fri, 22 Jun 2012 09:24:36 +0200 (CEST) From: "Asma Ben Abacha" Message-ID: X-url: http://perso.limsi.fr/abacha Bonjour, J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée "Recherche de réponses précises à des questions médicales : le système de questions-réponses MEANS". La soutenance aura lieu le jeudi 28 juin à 9h30 dans la salle de conférence du LIMSI, Bât 508, Rue Louis De Broglie, Campus de l'université d'Orsay [http://www.limsi.fr/Pratique/acces/]. Le jury sera composé de : M. Guy Lapalme, Professeur, Université de Montréal (Rapporteur) M. Thierry Poibeau, Directeur de recherche, LATTICE-CNRS (Rapporteur) M. Stéfan Darmoni, Professeur, CHU de Rouen (Examinateur) M. Olivier Ferret, Chercheur, CEA-LIST (Examinateur) M. Joseph Mariani, Directeur de recherche, LIMSI-CNRS (Examinateur) M. Pierre Zweigenbaum, Directeur de recherche, LIMSI-CNRS (Directeur de thèse) Vous êtes aussi cordialement invités au pot qui suivra. Bien cordialement, Asma Ben Abacha http://perso.limsi.fr/abacha ================== Résumé de la thèse ================== La recherche de réponses précises à des questions formulées en langue naturelle renouvelle le champ de la recherche d'information au niveau des objectifs, des problématiques et des méthodes. De nombreux travaux ont eu lieu sur la recherche de réponses à des questions factuelles en domaine ouvert, notamment dans le cadre des campagnes TREC QA. Moins de travaux ont porté sur la recherche de réponses en domaine de spécialité, en particulier dans le domaine médical ou biomédical. Plusieurs conditions différentes sont rencontrées en domaine de spécialité comme les lexiques et terminologies spécialisés, les types particuliers de questions, entités et relations du domaine ou les caractéristiques des documents ciblés. Les travaux entrepris dans cette thèse ont pour but d'étudier les approches permettant de répondre automatiquement aux questions médicales, afin de faciliter la recherche d'informations précises par les patients ou les médecins. Dans une première partie, nous étudions les méthodes permettant d'analyser sémantiquement les questions posées par l'utilisateur ainsi que les textes utilisés pour trouver les réponses. Pour ce faire nous utilisons des méthodes hybrides pour deux tâches principales : (i) la reconnaissance des entités médicales et (ii) l'extraction de relations sémantiques. Ces méthodes combinent des règles et patrons construits manuellement, des connaissances du domaine et des techniques d'apprentissage statistique utilisant différents classifieurs. Ces méthodes hybrides, expérimentées sur différents corpus, permettent de pallier les inconvénients des deux types de méthodes d'extraction d'information, à savoir le manque de couverture potentiel des méthodes à base de règles et la dépendance aux données annotées des méthodes statistiques. Dans une seconde partie, nous étudions l'apport des technologies du web sémantique pour la portabilité et l'expressivité des systèmes de questions-réponses. Dans le cadre de notre approche, nous exploitons ces technologies pour représenter les informations extraites et les interroger sémantiquement. Enfin, nous présentons et évaluons notre système de questions-réponses, appelé MEANS, qui utilise à la fois des techniques de TAL, des connaissances du domaine et les technologies du web sémantique pour répondre automatiquement aux questions médicales. Cette approche permet de rechercher des réponses à partir des annotations sémantiques des corpus cibles. Elle permet de plus d'envisager de compléter les informations manquantes dans ces annotations en interrogeant les bases de connaissances RDF disponibles. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:15:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:15:59 +0200 Subject: Journee: Journee d'etude STIH & PRAXILING, De l'autre cote du media, 2 juillet 2012, Paris Message-ID: Date: Fri, 22 Jun 2012 10:02:15 +0200 From: Agata Jackiewicz Message-ID: <4FE42687.1030903 at paris-sorbonne.fr> *Journée d'étude : "De l'autre côté du média : radiographie d'une matinale dans les coulisses de France Inter"* Coord. : Agata Jackiewicz (STIH, Université -- Sorbonne), Laurent Fauré, François Perea & Arnaud Richard (PRAXILING - UMR 5267 CNRS, Université Montpellier 3) 2 juillet 2012 Université Paris-Sorbonne, Maison de la Recherche, D035 28, rue Serpente, Paris 6e *Objet *: Le 3 mai 2011, au lendemain de la mort d'O. Ben Laden, une équipe de chercheurs a pu enregistrer dans les studios de France Inter le processus de production et de diffusion des émissions d'information de la séquence matinale de la station autour des retombées et commentaires d'un événement à portée internationale. Cette enquête ethnographique s'inscrit dans un programme plus vaste (« Observatoire des pratiques médiatiques émergentes », projet de Praxiling soutenu par la MSH-Montpellier) et vise à examiner les spécificités de la production de l'information radiophonique pour tenter de rendre compte de la vitalité notable de ce média dit « traditionnel », à l'heure du numérique. Il s'agit ainsi d'étudier d'abord en quoi des cours d'action observables dès la conférence de rédaction initiale jusqu'au travail de la régie, en passant par les échanges à micro ouvert ou fermé en studio, tissent une relation dynamique avec la production discursive délivrée sur les ondes. Cet ancrage praxéologique assure l'analyse des observables langagiers et communicationnels orientés vers la publicisation. Un réseau interdisciplinaire de chercheurs en sciences du langage s'est en conséquence employé à examiner systématiquement les données recueillies. L'originalité, la densité et l'hétérogénéité du corpus -- constitué du recueil de données vidéos, audios (émissions diffusées) transcrites, écrites (notes des animateurs/ journalistes, données de la presse du jour, des agences...) -- ont pu ouvrir à de multiples démarches analytiques et à leur croisement. La journée d'étude sera donc consacrée à la déclinaison détaillée de la production discursive journalistique en ses divers états : ressources intonatives, spécificités rythmiques, accompagnements gestuels professionnels internes (avec la régie, notamment) ou communicationnels (qu'ils soient visibles ou non à partir des vidéos téléchargeables sur le site de l'émission), procédures de formatage et de réécriture des énoncés informatifs, dimensions textuelle et rhétorico-discursive. Des spécialistes de l'analyse prosodique, du discours, de la conversation, du traitement automatique du langage, de la logométrie et de sémantique opérationnelle croiseront leurs approches pour rendre compte des processus d'écriture et d'oralisation, de mise en forme, de subjectivation / désubjectivation, de procédures évaluatives, des fonctionnements dialogiques, intersubjectifs et interactionnels, des formats et stratégies d'intégration de la réception, du lien entre micro- et macro- phénomènes dans la structuration de la production médiatique... L'objectif de la rencontre vise en premier lieu à restituer les premiers résultats scientifiques de l'enquête de terrain aux professionnels concernés, au-delà de l'intérêt déjà relativement traditionnel des linguistes pour le discours et l'expression médiatiques. Les partenariats engagés pour l'occasion entre plusieurs laboratoires de recherche francophones mais aussi l'École supérieure de journalisme (ESJ-Lille/Montpellier/Paris) et le Centre de liaison entre l'école et les médias d'information (Clémi) permettent une investigation fouillée des pratiques professionnelles observées. On vise au final, à travers la mise en débat de la praxéologie globalement esquissée, à nourrir un dialogue innovant entre formateurs, journalistes, spécialistes de l'éducation aux médias et chercheurs. *Programme *: 8h45Accueil des participants 9h00 J. DUCOS (directrice de l'équipe STIH, Université Paris-Sorbonne) Mot d'ouverture A. Jackiewicz(STIH, Paris-Sorbonne) et L. Fauré (PRAXILING, Université Paul-Valéry Montpellier III) Présentation de la journée : une approche croisée de données inédites 9h20 L. Fauré (PRAXILING, Université Paul-Valéry Montpellier III) Information radiophonique sous tension : du fil d'actualité à la gestion du direct 10h00 M. Vidak (STIH, Paris-Sorbonne) Le discours médiatique théâtralisé : entre l'objectivité et l'efficacité 10h40 Pause 11h00 F. Perea (PRAXILING, Université Paul-Valéry Montpellier III) Travail de l'interpellation et de l'émotion dans le lancement des journaux radiophoniques 11h40 F. Hailon (Laboratoire ligérien de linguistique,Université de Tours) Evénementialisation et fictionnalisation d'un discours radiophonique : une revue de presse de Bruno Duvic 12h20 Repas 14h30 F. Bilhaut (Noopsis), A. Jackiewicz (STIH, Paris-Sorbonne) Quelques expériences de TAL sur le discours radiophonique : le cas de la revue de presse 15h10 A. Richard (PRAXILING, Université Paul-Valéry Montpellier III) Quotas en équipe de France de football : sources de rebondissements dans une chronique matinale 15h50 Pause 16h10 Y. Soulé (LIRDEF IUFM Montpellier 2 -- CLEMI) La matinale de France Inter, les marques discursives de la professionnalité journalistique 16h50 Table-ronde : Quelle professionnalité pour l'avenir de la radio ? J. Bouvier(Médiateur de France Inter) [pressenti], D. Deloit (Directeur de l'ESJ-Pro), Y. Soulé (LIRDEF & CLEMI). 17h30 Clôture de la journée **** Entrée libre ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:26:24 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:26:24 +0200 Subject: Appel: Workshop on Language Technology for Decision Support Message-ID: Date: Fri, 22 Jun 2012 16:27:01 +0100 From: "Michel Généreux" Message-Id: <20120622152701.M83249 at clul.ul.pt> Workshop on Language Technology for Decision Support October 25, 2012 Lund, Sweden http://www.clul.ul.pt/component/content/article/448-sltc-2012 The workshop is organized as a part of SLTC, the Fourth Swedish LanguageTechnology Conference, which takes place on 24-26 October 2012 in Lund,Sweden. The workshop is held on October 25, 2012. Details about the conference: http://nlp.cs.lth.se/events/sltc_2012/ This workshop will investigate the relation and complementarity betweenfactual and opinionated information for decision-making. Traditionally,natural language processing approaches and tools have segregated the objectiveand subjective treatments of information in two separate fields of expertisewhere the two never met. This workshop is an attempt to fill this gap andexamine the relation and complementarity that exists between the factual andthe speculative in order to build a more subtle representation of the state ofaffairs. In their everyday routine, managers, professionals, even laymen, must dealwith a large amount of textual information to help make their decisions.Without appropriate language technology tools to extract, classify andsynthesize this information, decision-makers would have to read a large numberof so-called objective sources but arguably even more subjective andopinionated material. Facts and opinions would then be combined together tocreate an accurate picture of the entity or issue we seek to understand. Factsare of course crucial to make professional or personal decisions, but opinionsmay sometimes play a key role. For this workshop we have identified twospecific domains where factual and subjective information have an importance:brand management and health (patient empowerment and education), with an eyetowards clinical decision. However, any relevant domains where the factual andthe opinionated co-exist would be considered. We encourage submissions addressing the following questions: * Relevance of the extracted information (certainty, speculation andsubjectivity) in a decision making context * How to combine objective and subjective information in NLP-based decisionmaking to produce a better understanding * Exploitation of the objective and subjective information: * How do managers combine the factual and the less tangible to favour the success of their brand? * How does the patient understand a medical decision given objectiveinformation by the physician and subjective information related to his/herfeelings, as well as discussions with other patients? * How does a physician combine what the data show about a patient withmore subjective information like symptoms or informed opinion from a third party? We would like to invite anyone currently researching in the areas of sentimentanalysis, information extraction, text mining, BioNLP or automaticsummarization to submit apaper, including submissions presenting a discussion of a system. Important dates * September 10th: paper submission by email to genereux at clul.ul.pt * October 1st: notification of acceptance * October 15th: camera-ready papers for publication Submission Papers should be a maximum of 8 pages, all included and follow the SLTC format. Only pdf files are accepted. Style files: The style files will be the same as for SLTC 2010. (Confirmed) Program committee members - Khurshid Ahmad (Trinity College Dublin, Ireland) - Dina Demner-Fushman (NIH/NLM/LHC, USA) - Agata Jackiewicz (Université Paris-Sorbonne, France) - Jonathon Read (University of Oslo, Norway) - Ricardo Ribeiro ((DCTI)/IUL (ISTA) of ISCTE-IUL, Portugal) - Pierre Zweigenbaum (LIMSI, France) Workshop organisation The duration of the workshop is three hours. There will be regular (short)talks and according to the number and the quality of the submissions, posters. Every paper will be reviewed by 2 members of the program committee. Allaccepted papers will be published in the NEALT Proceeding Series. Authors ofthe accepted papers will have to sign an agreement with NEALT publishers. Details on place and time are provided at the conference website. Workshop organizers * Michel Généreux (CLUL, Universidade de Lisboa, Lisboa, Portugal, genereux at clul.ul.pt ) * Thierry Hamon (LIM&BIO, Université Paris 13, Bobigny, France, thierry.hamon at univ-paris13.fr ) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:28:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:28:14 +0200 Subject: Appel: AMTA Workshop on Monolingual Machine Translation (MONOMT 2012) Message-ID: Date: Sat, 23 Jun 2012 11:01:04 +0200 (CEST) From: "Artem Sokolov" Message-ID: <8c72079ac6fb947320d8c267d0cb72f7.squirrel at webmail.limsi.fr> X-url: http://computing.dcu.ie/~tokita/MONOMT/monomt.htm Call for Papers: AMTA 2012 Workshop on Monolingual Machine Translation (MONOMT 2012) Submission deadline: August 3, 2012 Workshop date: November 1, 2012 Location: San Diego, United States http://computing.dcu.ie/~tokita/MONOMT/monomt.htm Description: Due to the increasing demands for high quality translation, monolingual Machine Translation (MT) subtasks are frequently encountered in various occasions, where one MT task is decomposed into several subtasks some of which can be called `monolingual'. Such monolingual MT subtasks include: (1) MT for morphologically rich languages, [Bojar, 08] aimed at dealing with morphologic richness of the target, as is the case with the English-Czech (EN-CZ) language pair. An MT task is thus split into two subtasks: first, English is (`bilingually') translated into simplified Czech and then, the obtained morphologically normalized Czech is (`monolingually') translated into morphologically rich Czech; (2) system combination [Matusov et al., 05], where a source sentence is first translated into the target language by several MT systems, and then, the obtained translations are combined to create / generate the output in the same language; (3) statistical post-editing [Dugast et al., 07; Simard et al., 07], where a source sentence is first translated into the target language by a rule-based MT system and then, the obtained output is `monolingually' translated by an SMT system; (4) domain adaptation using transfer learning [Daume III, 07]: the source side written in a `source' domain (e.g., newswires) is converted into the target side written in a `target' domain (e.g., patents); (5) transliteration between phonemes / alphabets [Knight and Graehl, 98]; (6) considering reordering issues (SVO and SOV) [Katz-Brown et al., 11]; (7) MERT process [Arun et al., 10]; (8) translation memory (TM) and MT integration [Ma et al., 11]; (9) paraphrasing for creating additional training data or for evaluation purposes. A distinction could be established between bilingual MT tools (B-tools) and monolingual MT tools (M-tools) that may be exploited for monolingual MT. Consider, e.g., monolingual subtasks such as MT for morphologically rich languages, statistical post-editing, or transliteration and a task of system combination or domain adaptation as respective representatives. The latter group is often approached with monolingual M-tools like monolingual word alignment [Matusov et al., 05; He et al., 08] and the minimization of Bayes risk [Kumar and Byrne, 02] (on the outputs of combined systems). However, the former usually employs bilingual MT tools, like GIZA++ [Och and Ney, 04] to extract bilingual phrases and MAP decoding on them. The way M-tools and B-tools are used for monolingual MT is an issue of particular interest for this workshop. This workshop is intended to provide the opportunity to discuss ideas and share opinions on the question of the applicability of M-tools or B-tools for monolingual MT subtasks, and on their respective strengths and weaknesses in specific settings. Furthermore we wish to provide opportunity to demonstrate successful usecases of M-tools. Possible questions, that are encouraged to be addressed during the workshop, include: - ways of applying M-tools to monolingual MT subtasks such as MT for morphologically rich languages and statistical post-editing. - investigation of the suitability of B-tools or M-tools for monolingual MT subtasks. - performance improvements of monolingual word alignment tools, since these are necessary for specific monolingual subtasks, such as MT for morphologically rich languages and statistical post-editing. TOPICS OF INTEREST Original papers are invited on different aspects of monolingual MT, such as: MT for morphologically rich languages system combination statistical post-editing domain adaptation MERT process MT for reordering mismatched language pairs (SVO and SOV) MT-Translation Memory integration transliteration MT using textual entailment MT using confidence estimation paraphrasing hybrid MT Papers describing the mechanism of MT tools that may be considered `monolingual' are also encouraged. Some possible topics are listed below: MBR decoding, consensus decoding monolingual word alignment (based on TER, METEOR,...) language models constructed by learning the representation of data data structure related matters ranking algorithms multitask learning (in the context of domain adaptation) SUBMISSION Authors are invited to submit long papers (up to 10 pages) and short papers (2 - 4 pages). Long papers should describe unpublished, substantial and completed research. Short papers should be position papers, papers describing work in progress or short, focused contributions. Papers will be accepted until August 3, 2012 in PDF format via the system. Submitted papers must follow the styles and formatting guidelines available from the AMTA main conference site. As the reviewing will be blind, the papers must not include the authors' names and affiliations. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ..." must be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ..." Papers that do not conform to these requirements will be rejected without review. ORGANIZERS Tsuyoshi Okita (DCU, Ireland) Artem Sokolov (LIMSI, France) Taro Watanabe (NICT, Japan) PROGRAM COMMITTEE (Tentative) Bogdan Babych (University of Leeds, UK) Loic Barrault (LIUM, Universite du Maine, France) Nicola Bertoldi (FBK, Italy) Boxing Chen (NRC Institute for Information Technology, Canada) Trevor Cohn (University of Sheffield, UK) Marta Ruiz Costa-jussa (Barcelona Media, Spain) Josep M. Crego (SYSTRAN, France) John DeNero (Google, USA) Jinhua Du (Xi'an University of Technology, China) Kevin Duh (Nara Institute of Science and Technology, Japan) Chris Dyer (CMU, USA) Christian Federmann (DFKI, Germany) Barry Haddow (University of Edinburgh, UK) Xiadong He (Microsoft, USA) Jagadeesh Jagarlamudi (University of Maryland, USA) Philipp Koehn (University of Edinburgh, UK) Shankar Kumar (Google, USA) Alon Lavie (CMU, USA) Yanjun Ma (Baidu, China) Aurelien Max (LIMSI, University Paris Sud, France) Stefan Riezler (University of Heidelberg, Germany) Lucia Specia (University of Sheffield, UK) Marco Turchi (JRC, Italy) Antal van den Bosch (Radboud University Nijmegen, Netherlands) Xianchao Wu (Baidu, Japan) Dekai Wu (HKUST, Hongkong) Francois Yvon (LIMSI, University Paris Sud, France) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:20:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:20:26 +0200 Subject: Livre: Grammaire des predicats complexes, Pollet Samvelian Message-ID: Date: Fri, 22 Jun 2012 15:49:14 +0200 From: "Ars" Message-ID: <015e01cd507d$cfb59390$6f20bab0$@fr> Bonjour, Je vous prie de trouver ci-joint le communiqué de presse ainsi que le visuel de l'ouvrage que les Éditions Hermes - Lavoisier viennent de publier, et qui ne manquera pas de retenir votre attention. Samvelian Grammaire des prédicats complexes les constructions nom-verbe Collection Langues et syntaxe dirigée par Anne Abeillé Pollet Samvelian La prédication complexe est un phénomène attesté sous diverses formes dans des langues très variées. Elle consiste à former des séquences syntaxiques fonctionnant comme un prédicat, c’est-à-dire un verbe simple. Les données examinées dans cet ouvrage sont les constructions nom-verbe en persan. Ce dernier ne dispose que d’environ 250 verbes simples et son lexique verbal comprend essentiellement des prédicats complexes formés d’un verbe et d’un élément préverbal. Cela mène à une réflexion sur des phénomènes présents dans de nombreuses langues. Grammaire des prédicats complexes expose notamment : - la relation entre la compositionnalité et la productivité ; - la compatibilité entre le stockage des expressions linguistiques complexes par les locuteurs et l’existence de schémas abstraits réguliers permettant d’analyser ou de produire ces mêmes expressions ; - le parallélisme entre les procédés morphologiques et syntaxiques de la construction des lexèmes ainsi que la notion même du verbe lexical par opposition au verbe support. L’auteur Pollet Samvelian est professeur de linguistique à l’Université Sorbonne Nouvelle. Ses recherches portent sur la morphologie, la syntaxe et la typologie linguistique. Elle travaille en particulier sur les langues iraniennes de l’ouest, notamment le persan. Nous espérons que cet ouvrage intéressera vos lecteurs et vous remercions de l'accueil que vous lui réserverez. Pour information : ISBN : 978-2-7462-2365-3 - Format : 15,5 x 23,5 - 336 p. - 70 € Éditeur : Hermes - Lavoisier Vous pouvez vous procurer cet ouvrage dans toutes les librairies spécialisées et sur le site Lavoisier : www.lavoisier.fr Grammaire des prédicats complexes les constructions nom-verbe Sommaire : Avant-propos Abréviations Introduction Chapitre 1. Mots ou syntagmes : un faux problème ? Introduction. « Atome syntaxique » vs « listème ». L’accent lexical unique. Le prédicat complexe comme base de dérivation morphologique. La (non-)séparabilité des membres du prédicat complexe. La formation d’un prédicat sémantique. Conclusion Chapitre 2. Les propriétés syntaxiques des prédicats nom-verbe Introduction. L’ordre respectif par rapport aux autres constituants de la phrase. La position postverbale. L’extraction de l’élément nominal. Les infinitifs. La construction passive. La coordination et l’ellipse du nom et du verbe. Modification et détermination de l’élément nominal. Conclusion sur l’analyse syntaxique de la séquence nom-verbe Chapitre 3. La compositionnalité des prédicats complexes Introduction. Une certaine transparence sémantique. Des régularités dans l’association des verbes et des noms. Les approches projectionnistes basées sur le transfert d’arguments. Les approches constructionnistes. Les problèmes pour une approche compositionnelle. Un autre type compositionnalité. Conclusion Chapitre 4. Vers une approche constructionnelle Introduction. Inventaire malgré la productivité : le cas de la morphologie constructionnelle. L’usage façonne la compétence : les modèles basés sur l’usage. Les approches taxonomiques dans la description des CVS. Vers un inventaire des prédicats complexes du persan. Pourquoi un inventaire est-il insuffisant ? Une approche constructionnelle. Constructions syntaxiques ou assemblage de mots ? Remarques conclusives : perspectives stochastiques Chapitre 5. Etude d’un cas : les prédicats construits avec zadan ‘frapper’ Introduction. Zadan en tant que verbe plein(ou lexical). Les prédicats directement reliés aux emplois lexicaux de zadan. Les prédicats indirectement reliés aux emplois lexicaux de zadan . Les prédicats non reliés aux emplois lexicaux de zadan. Les prédicats dans lesquels zadan a un comportement semi-lexical. Conclusion Bibliographie Index des prédicats complexes par verbe Index des prédicats complexes par élément non verbal Index des auteurs ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:14:09 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:14:09 +0200 Subject: Appel: SSLST 2012 Message-ID: Date: Sun, 24 Jun 2012 18:21:45 +0200 From: "GRLMC" Message-ID: <1D82CD16EE6B4CDE93270459B073FC46 at Carlos1> X-url: http://grammars.grlmc.com/sslst2012/ ********************************************************************* 2012 INTERNATIONAL SUMMER SCHOOL IN LANGUAGE AND SPEECH TECHNOLOGIES SSLST 2012 (formerly International PhD School in Language and Speech Technologies) Tarragona, Spain July 30 – August 3, 2012 Organized by: Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/sslst2012/ ********************************************************************* AIM: SSLST 2012 offers a broad and intensive series of lectures at different levels on language and speech technologies. The students choose their preferred courses according to their interests and background. Instructors are top names in their respective fields. The School intends to help students initiate and foster their research career. The previous event in this series was WSLST 2012: http://grammars.grlmc.com/wslst2012/ ADDRESSED TO: Graduate (and advanced undergraduate) students from around the world. Most appropriate degrees include: Computer Science and Linguistics. Other students (for instance, from Mathematics, Electrical Engineering, Philosophy, or Cognitive Science) are welcome too. The School is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. There is no overlap in the class schedule. COURSES AND PROFESSORS: - Jont B. Allen (U Illinois Urbana-Champaign), A Parametric Analysis of Speech Perception [introductory, 8 hours] - Hervé Bourlard (Idiap Research Institute, Martigny), Automatic Speech Recognition and Multilingual Speech Processing: HMM, Hybrid HMM/ANN and Posterior-based Systems [introductory/intermediate, 6 hours] - Marcello Federico (Bruno Kessler Foundation, Trento), Statistical Machine Translation [introductory/intermediate, 6 hours] - Giuseppe Riccardi (U Trento), Spoken Language Understanding [intermediate/advanced, 6 hours] - Noah A. Smith (Carnegie Mellon U), Probability and Structure in Natural Language Processing [intermediate, 9 hours] - Bayya Yegnanarayana (International Institute of Information Technology Hyderabad), Speech Signal Processing [introductory/intermediate, 8 hours] REGISTRATION: It has to be done on line at http://grammars.grlmc.com/sslst2012/Registration.php FEES: They are variable, depending on the number of courses each student takes. The rule is: 1 hour = - 10 euros (for payments until May 18, 2012), - 15 euros (for payments after May 18, 2012). PAYMENT PROCEDURE: The fees must be paid to the School's bank account: Uno-e Bank bank’s address: Julian Camarillo 4 C, 28037 Madrid, Spain IBAN: ES3902270001820201823142 BIC/SWIFT code: UNOEESM1 account holder: Carlos Martin-Vide GRLMC account holder’s address: Av. Catalunya 35, 43002 Tarragona, Spain Please mention SSLST 2012 and your name in the subject. A receipt will be provided on site. Remarks: - Bank transfers should not involve any expense for the School. - People claiming early registration will be requested to prove that the bank transfer order was carried out by the deadline. - Students may be refunded only in the case when a course gets cancelled due to the unavailability of the instructor. People registering on site at the beginning of the School must pay in cash. For the sake of local organization, however, it is much recommended to do it earlier. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Students will be delivered a certificate stating the courses attended, their contents, and their duration. IMPORTANT DATES: Announcement of the programme: April 12, 2012 Starting of the registration: April 12, 2012 Early registration deadline: May 18, 2012 Starting of the School: July 30, 2012 End of the School: August 3, 2012 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat WEBSITE: http://grammars.grlmc.com/sslst2012/ POSTAL ADDRESS: SSLST 2012 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Diputació de Tarragona Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:16:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:16:57 +0200 Subject: Appel: PAKDD 2013 Message-ID: Date: Sun, 24 Jun 2012 20:19:30 +0200 From: CFP PAKDD2013 Message-ID: X-url: http://pakdd2013.pakdd.org/ Call For Papers PAKDD 2013 The 17th Pacific-Asia Conference on Knowledge Discovery and Data Mining Gold Coast, Australia Conference Website http://pakdd2013.pakdd.org/ Submission System https://cmt.research.microsoft.com/PAKDD2013/ Important Dates Paper submission due: Oct. 1 (Mon). 2012 Notification to author: Dec. 19 (Wed). 2012 Camera ready due: Jan. 6 (Sun). 2013 *[23:59:59 Pacific Time] ============================================================== Conference Scope The Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD) is a leading international conference in the areas of data mining and knowledge discovery (KDD). It provides an international forum for researchers and industry practitioners to share their new ideas, original research results and practical development experiences from all KDD related areas, including data mining, data warehousing, machine learning, artificial intelligence, databases, statistics, knowledge engineering, visualization, and decision-making systems. The conference calls for research papers reporting original investigation results and industrial papers reporting real data mining applications and system development experience. ============================================================== Topics The topics of relevance for the conference papers include but not limited to the following: * Novel models and algorithms * Clustering * Classification * Ranking * Association analysis * Anomaly detection * Data pre-processing * Feature extraction and selection * Mining heterogeneous data * Mining multi-source data * Mining sequential data * Mining spatial and temporal data * Mining unstructured and semi-structured data * Mining graph and network data * Parallel, distributed, and high performance data mining on the cloud platform * Privacy preserving data mining * Mining high dimensional data * Mining uncertain data * Mining imbalanced data * Mining dynamic/streaming data * Statistical methods for data mining * Visual data mining * Interactive and online mining * Mining behavioral data * Mining multimedia data * Mining scientific databases * Ubiquitous knowledge discovery * Agent-based data mining * Mining social networks * Financial data mining * Fraud and risk analysis * Security and intrusion detection * Opinion mining and sentiment analysis * Post-processing including quality assessment and validation * Integration of data warehousing, OLAP and data mining * Human, domain, organizational and social factors in data mining * Applications to healthcare, bioinformatics, computational chemistry, * Eco-informatics, marketing, online gaming, etc All paper submissions will be handled electronically. Detailed instructions are provided on the conference home page. ============================================================== Paper Submission Each submitted paper should include an abstract up to 200 words. It should also adhere to the double-blind review policy and not longer than 12 single-spaced pages with 10pt font size. Authors are strongly encouraged to use Springer LNCS/LNAI manuscript submission guidelines (available at http://www.springer.de/comp/lncs/authors.html) for their initial submissions. All papers must be submitted electronically through Microsoft's Conference Management Service (CMT) in PDF format only. The submitted papers must not be previously published anywhere, and must not be under consideration by any other conferences or journal during the PAKDD review process. Submitting a paper to the conference means that if the paper were accepted, at least one author will attend the conference to present the paper. For no-show authors, their affiliations will receive a notification. The program committee chairs are not allowed to submit papers to the conference for a fair review process. All papers will be double-blind reviewed by the Program Committee on the basis of technical quality, relevance to data mining, originality, significance, and clarity. Papers that do not comply with the Submission Guidelines will be rejected without review. Before submitting your paper, please carefully read and agree with the PAKDD submission policy and no-show policy: http://pakdd.togaware.com/policy.html ============================================================== Conference Officers Honorary Co-chairs * Jiawei Han. University of Illinois at Urbana-Champaign,USA * Ramamohanarao Kotagiri, University of Melbourne, Australia * Graham Williams. Australia Taxation Office, Australia Conference Co-chairs * Hiroshi Motoda, AFOSR/AOARD and Osaka University, Japan * Longbing Cao. University of Technology, Sydney, Australia Program Committee Co-chairs * Jian Pei. Simon Fraser University, Canada * Vincent S. Tseng. National Cheng Kung University, Taiwan Local Arrangement Co-chairs * Vladimir Estivill-Castro. Griffith University (Gold Coast), Australia * Xue Li, University of Queensland, Australia * Richi Nayak, Queensland University of Technology, Australia * Xinhua Zhu, University of Technology, Sydney, Australia Workshop Co-chairs * Jiuyong Li. University of Sourth Australia, Australia * Kay Chen Tan. National University of Singapore, Singapore * Bo Liu. Guangdong University of Technology, China Tutorial Co-chairs * Tu Bao Ho. Japan Advanced Institute of Science and Technology, Japan * Mengjie Zhang. Victoria University of Wellington, New Zealand Award Chair * Chengqi Zhang, University of Technology, Sydney, Australia Sponsorship Co-chair * Yue Xu, Queensland University of Technology, Australia Publicity Co-chairs * P.Krishna Reddy, The International Institute of Information * Technology, Hyderabad, India * Yifeng Zeng, Aalborg University, Denmark * Xin Wang, University of Calgary, Canada * Zhihong Deng, Peking University, China ============================================================== Further Information For further information, please contact the Program Committee Chairs by pakdd13-program at pakdd.org . General inquiries * Longbing Cao University of Technology Sydney, Australia Email: pakdd13 at pakdd.org Phone: (61)2-9514-4477 Fax: (61)2-9514-1807 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:24:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:24:50 +0200 Subject: Appel: Linguistique de corpus, Prolongation de la date de soumission Message-ID: Date: Mon, 25 Jun 2012 14:43:05 +0200 (CEST) From: "sandra.augendre" Message-ID: <1355708946.31058.1340628185427.JavaMail.www at wwinf1g38> COLLOQUE La linguistique de corpus à l'heure de la confrontation entre concepts, techniques et applications / Corpus Linguistics: How to bind concepts, technique and application? 14-15 décembre 2012 Université Bordeaux 3 / EA 4195 TELEM / UMR 5263 CLLE-ERSSàB https://sites.google.com/site/corpus2012bordeaux3/ PROLONGATION DE LA DATE DE SOUMISSION : Les résumés des propositions de communications peuvent être envoyées jusqu'au 1er Juillet 2012. Rappel des thèmes du colloque : A. comment coder les éléments discursifs à l'écrit et à l'oral ? quelles convergences, quelles divergences dans le codage de l'écrit et de l'oral ? Problèmes actuels de l'annotation des corpus écrits et oraux ? Problèmes liés à l'annotation des propriétés de l'oral. B. coder la multimodalité : enjeux et défis. C. de la linguistique de corpus aux digital humanities. Toutes les informations sur le site https://sites.google.com/site/corpus2012bordeaux3/ Envoi des propositions à: colloque.corpus.bx3[at]gmail.com (remplacer "at" par l'arobase) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:27:32 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:27:32 +0200 Subject: Job: Ingenieur d'etude (CDD 12 mois), Projet ANR Chronolines Message-ID: Date: Mon, 25 Jun 2012 14:43:02 +0200 From: minel Message-ID: <4FE85CD6.2040409 at u-paris10.fr> X-url: http://www.chronolines.fr Dans le cadre du projet ANR Chronolines (AppelCONTINT) (www.chronolines.fr), piloté par le laboratoire MoDyCo (UMR 7114) avec comme partenaires l'AFP, Exalead, LIMSI (UPR 3251)et Xerox, nous recherchons un(e) ingénieur d'étude spécialisé(e) dans le développement d'interfaces visuelles innovantes. Il s'agit de développerun outil de type /timeline/ permettant de présenter les résultats d'une recherche par mots clés sur une échelle temporelle « multi-niveaux » (granularité calendaire, degrés de prise en charge énonciative et modale d'évènements). L'interface sera riche et exploitera l'aspect multimédia des données ainsi que les annotations linguistiques (temporelles, modales, énonciatives, ...) produites en amont.Afin de couvrir des besoins professionnels, l'interface graphique sera également dotée d'une fonctionnalité d'édition qui permettra à des utilisateurs experts d'éditer une /timeline/, supprimer des données/événements, corriger certaines données (repositionnement sur l'échelle temporelle par exemple), etc. Le poste nécessite des compétences dans le développement d'interfaces intégrant des outils open source, dans la pratique de langages de programmation (Java et/ou C++), dans celle de la technologie Flash et/ou HTML. Titulaire au minimum d'un Master d'Informatique ou équivalent (diplôme d'ingénieur) Type de poste (CDD) : Ingénieur d'étude type CNRS ( 2031 bruts Euros mensuel) Durée : 12 mois Lieu : laboratoire MoDyCo( www.modyco.fr ) Début des travaux : octobre 2012 contact: Delphine Battistelli, Delphine.Battistelli at paris-sorbonne.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:31:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:31:05 +0200 Subject: These: Nadi Tomeh, Modeles discriminants d'alignement pour la traduction automatique statistique Message-ID: Date: Mon, 25 Jun 2012 15:09:04 +0200 From: Nadi Tomeh Message-ID: <#mml Bonjour, J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée : "modèles discriminants d'alignement pour la traduction automatique statistique". La soutenance aura lieu le mercredi 27 juin à 14h au LIMSI-CNRS (salle de conférences). Vous êtes également conviés au pot qui suivra. Se rendre au LIMSI: http://www.limsi.fr/Pratique/acces/ http://goo.gl/maps/imyY Jury: ----- Eric Gaussier, rapporteur, Université Joseph Fourier Philippe Langlais, rapporteur, Université de Montréal Anne Vilnat, examinatrice, Université Paris-Sud Hermann Ney, examinateur, Universtié RWTH Aachen Nasredine Semmar, invité, LIST CEA François Yvon, directeur, Université Paris-Sud Alexandre Allauzen, co-directeur, Université Paris-Sud Résumé: ------- La tâche d'alignement d'un texte dans une langue source avec sa traduction en langue cible est souvent nommée alignement de bi-textes. Elle a pour but de faire émerger les relations de traduction qui peuvent s'exprimer à différents niveaux de granularité entre les deux faces du bi-texte. De nombreuses applications de traitement automatique des langues naturelles s'appuient sur cette étape afin d'accéder à des connaissances linguistiques de plus haut niveau. Parmi ces applications, nous pouvons citer bien sûr la traduction automatique, mais également l'extraction de lexiques et de terminologies bilingues, la désambigüisation sémantique ou l'apprentissage des langues assisté par ordinateur. La complexité de la tâche d'alignement de bi-textes s'explique par les différences linguistiques entre les langues. Ces différences peuvent être d'ordre sémantique, syntaxique, ou morphologique. Dans le cadre des approches probabilistes, l'alignement de bi-textes est modélisé par un ensemble de variables aléatoires cachés. Afin de réduire la complexité du problème, le processus aléatoire sous-jacent fait l'hypothèse simplificatrice qu'un mot en langue source est lié à au plus un mot en langue cible, ce qui induit une relation de traduction asymétrique. Néanmoins, cette hypothèse est simpliste, puisque les alignements peuvent de manière générale impliquer des groupes de mots dans chacune des langues. Afin de rétablir cette symétrie, chaque langue est considérée tour à tour comme la langue source et les deux alignements asymétriques résultants sont combinés à l'aide d'une heuristique. Cette étape de symétrisation revêt une importance particulière dans l’approche standard en traduction automatique, puisqu'elle précède l'extraction des unités de traduction, à savoir les paires de segments. L'objectif de cette thèse est de proposer de nouvelles approches pour d'une part l'alignement de bi-texte, et d'autre part l'extraction des unités de traduction. La spécificité de notre approche consiste à remplacer les heuristiques utilisées par des modèles d'apprentissage discriminant. Nous présentons un modèle "maximum d'entropie" (ou MaxEnt) pour l'alignement de mot, pour lequel chaque lien d'alignement est prédit de manière indépendante. L'interaction entre les liens d'alignement est alors prise en compte par l'empilement (``stacking'') d'un second modèle prenant en compte la structure à prédire sans pour autant augmenter la complexité globale. Cette formulation peut être vue comme une manière d'apprendre la combinaison de différentes méthodes d'alignement: le modèle considère ainsi l'union des alignements d'entrées pour en sélectionner les liens jugés fiables. Le modèle MaxEnt proposé permet d'améliorer les performances d'un système état de l'art de traduction automatique en considérant le jeu de données de la tâche NIST'09, Arabe vers Anglais. Ces améliorations sont mesurées en terme de taux d'erreur sur les alignements et aussi en terme de qualité de traduction via la métrique automatique BLEU. Nous proposons également un modèle permettant à la fois de sélectionner et d'évaluer les unités de traduction extraites d'un bi texte aligné. Ces deux étapes sont reformulées dans le cadre de l'apprentissage supervisé, afin de modéliser la décision de garder ou pas une paire de segments comme une unité fiable de traduction. Ce cadre permet l'utilisation de caractéristiques riches et nombreuses favorisant ainsi une décision robuste. Nous proposons une méthode simple et efficace pour annoter les paires de segments utiles pour la traduction. Le problème d'apprentissage automatique qui se pose alors est particulier, puisque nous disposons que d'exemples positifs. Nous proposons donc d'utiliser l'approche SVM à une classe afin de modéliser la sélection des unités de traduction. Grâce à cette approche, nous obtenons des améliorations significatives en terme de score BLEU pour un système entrainé avec un petit ensemble de données. Nadi Tomeh Univ. Paris XI, LIMSI-CNRS LIMSI-CNRS Bât 508, Bureau 118 BP 133 F-91403 ORSAY CEDEX Tél : +33/0 1 69 85 80 43 nadi.tomeh at limsi.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:33:01 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:33:01 +0200 Subject: Livre: Sentiment Analysis and Opinion Mining, Bing Liu Message-ID: Date: Mon, 25 Jun 2012 14:55:35 -0400 From: Graeme Hirst Message-Id: X-url: http://www.morganclaypool.com/doi/abs/10.2200/S00416ED1V01Y201204HLT016 New Book by Morgan & Claypool Publishers Sentiment Analysis and Opinion Mining Bing Liu, University of Illinois at Chicago May 2012 Available for download here: http://www.morganclaypool.com/doi/abs/10.2200/S00416ED1V01Y201204HLT016 Sentiment analysis and opinion mining is the field of study that analyzes people's opinions, sentiments, evaluations, attitudes, and emotions from written language. It is one of the most active research areas in natural language processing and is also widely studied in data mining, Web mining, and text mining. In fact, this research has spread outside of computer science to the management sciences and social sciences due to its importance to business and society as a whole. The growing importance of sentiment analysis coincides with the growth of social media such as reviews, forum discussions, blogs, micro-blogs, Twitter, and social networks. For the first time in human history, we now have a huge volume of opinionated data recorded in digital form for analysis. Sentiment analysis systems are being applied in almost every business and social domain because opinions are central to almost all human activities and are key influencers of our behaviors. Our beliefs and perceptions of reality, and the choices we make, are largely conditioned on how others see and evaluate the world. For this reason, when we need to make a decision we often seek out the opinions of others. This is true not only for individuals but also for organizations. This book is a comprehensive introductory and survey text. It covers all important topics and the latest developments in the field with over 400 references. It is suitable for students, researchers and practitioners who are interested in social media analysis in general and sentiment analysis in particular. Lecturers can readily use it in class for courses on natural language processing, social media analysis, text mining, and data mining. Lecture slides are also available online. Table of Contents: Preface / Sentiment Analysis: A Fascinating Problem / The Problem of Sentiment Analysis / Document Sentiment Classification / Sentence Subjectivity and Sentiment Classification / Aspect-Based Sentiment Analysis / Sentiment Lexicon Generation / Opinion Summarization / Analysis of Comparative Opinions / Opinion Search and Retrieval / Opinion Spam Detection / Quality of Reviews / Concluding Remarks / Bibliography / Author Biography ____________________ In the series, Synthesis Lectures on Human Language Technologies, edited by Graeme Hirst, University of Toronto: http://www.morganclaypool.com/toc/hlt/1/1 This title is available online, free of charge to members of institutions that that have licensed the Synthesis Digital Library of Engineering and Computer Science. Use of this book as a course text is encouraged and the text may be downloaded without restriction at licensed institutions or after a one-time fee of $30.00 at non-licensed schools. To find out whether your institution is a licensed, visit or follow the links above and attempt to download the PDF. A print copy of this book can also be purchased directly from the Morgan & Claypool Bookstore (http://secure.aidcvt.com/mcp/) for $40.00 USD or from Amazon and other booksellers worldwide. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:38:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:38:57 +0200 Subject: Sujet de these: PhD positions, KRDB Centre, Free Univ. Bolzano, Italy - Deadline Aug. 31, 2012 Message-ID: Date: Tue, 26 Jun 2012 14:46:31 +0200 From: Alessandro Artale Message-Id: X-url: http://www.inf.unibz.it/krdb/ X-url: http://www.unibz.it/en/public/research/phd/prospectivePhdstudents.html =============================================================== CALL FOR PhD POSITIONS - DEADLINE August 31, 2012 Fully funded PhD positions at the KRDB Research Centre for Knowledge and Data Faculty of Computer Science Free University of Bozen-Bolzano, Italy =============================================================== The Faculty of Computer Science of the Free University of Bozen-Bolzano (Italy) offers regular openings for studentships for its PhD program. The PhD programme has been running since 2004/2005. Since 2011/2012 there has also been a European programme (EPCL) which provides a joint qualification. *** 3 of the PhD positions with studentship are offered by the KRDB Research Centre for Knowledge and Data. *** The 2012/2013 PhD call is now open and the deadline to apply is: ****** 31.August.2012 ****** Up-to-date information about how to apply for the PhD program and the studentship - including deadlines, number of positions and necessary documents - can be found in the university PhD web pages: - http://www.unibz.it/en/public/research/phd/prospectivePhdstudents.html - http://www.unibz.it/en/inf/progs/phdcs/default.html The grant amounts to 51,000 Euro over the three years of the PhD. Substantial extra funding is available for participation in international conferences, schools and workshops. The faculty of Computer Science and its PhD program are entirely based on the English language. RESEARCH TOPICS The KRDB Research Centre for Knowledge and Data (http://www.inf.unibz.it/krdb/) of the Faculty of Computer Science invites applicants to the PhD program to get in touch with the research group (see CONTACT PERSON below), in order to have a better understanding of the possible research activities in which perspective students may be involved. Relevant research topics in the centre are the following: * Computational Logic and Deductive Databases * Computational Logic and Constraint Programming * Description Logics and Ontology Languages * Conceptual Data Modelling and Ontology Design * Ontology Based Data Access * Query Answering in Distributed Environments * Intelligent Access to Web Resources * Semistructured Data Management * Temporal Logics and Temporal Databases * Knowledge-based techniques for Service Access and Composition * Knowledge-based techniques for Business Processing * Evolution and Update of Knowledge Bases * Data Quality and Completeness * Modelling and Accessing Imcomplete Data Other research topics are listed in the personal web pages of the members of the KRDB Centre, see: http://www.inf.unibz.it/krdb/staff.php The research activities in the KRDB research centre require good knowledge of Logic and of Foundations of Databases, and some knowledge of Artificial Intelligence and of Knowledge Representation. Good knowledge of English is also preferred. EUROPEAN PhD PROGRAM IN COMPUTATIONAL LOGIC (EPCL) The Free University of Bozen-Bolzano participates through the KRDB Research Centre to the European PhD Program in Computational Logic (EPCL) Students that are admitted for a PhD position at the KRDB Research Centre may apply to join EPCL. The admission to EPCL is decided by a Joint Commission consisting of representatives of the EPCL partner universities. THE KRDB CENTRE -- http://www.inf.unibz.it/krdb/index.php CONTACT To get in contact with the KRDB Research Centre, send an email to Dr. Alessandro Artale . To get in touch with the current PhD students see: https://www.inf.unibz.it/phd/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:42:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:42:26 +0200 Subject: Appel: CSLP 2012, Final deadline extension: 5 July 2012 Message-ID: Date: Tue, 26 Jun 2012 16:19:37 +0200 From: Yannick Parmentier Message-ID: <20120626141937.GB11375 at mononoke> X-url: http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ ** apologies for cross-posting ** CALL FOR PAPERS & PARTICIPATION ** NEW: Due to several requests, deadline for submission has been extended to July 5. This is the last and final deadline extension. ** ======================================================== Constraint Solving and Language Processing - CSLP 2012 - Seventh International Workshop Universite d'Orleans, Orleans, France September 13-14, 2012 http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ ======================================================== INTRODUCTION ============ The Constraint Solving and Language Processing (CSLP) workshop considers the role of constraints in the representation of language and the implementation of language processing from an interdisciplinary perspective. This theme should be interpreted inclusively: contributions from linguistics, computer science, psycholinguistics and related areas are welcome, and an interdisciplinary perspective is of particular interest. Constraints are widely used in linguistics, computer science, and psychology. How they are used, however, varies widely according to the research domain: knowledge representation, cognitive modelling, problem solving mechanisms, etc. These different perspectives are complementary, each one adding a piece to the puzzle. For example, linguistics proposes in-depth descriptions implementing constraints in order to filter out structures by means of description languages, constraint ranking, etc. The constraint programming paradigm, on the other hand, shows that constraints have to be taken as a systematic whole and can thus play a role in building the structures (or can even replace structures). Finally, psycholinguistics experiment have been made, investigating the role of constraint systems for cognitive processes in comprehension and production, as well as addressing how they can be acquired. TOPICS ====== CSLP is open to submissions on topics including, but not limited to: * Constraints in human language comprehension and production * Context modelling and discourse interpretation * Acquisition of constraints * Constraints and learning * Cross-theoretical view of the notion of constraint * New advances in constraint-based linguistic theories * Constraint satisfaction (CS) technologies for NLP * Linguistic analysis and linguistic theories biased towards CS or constraint logic programming (CLP) * Application of CS or CLP for NLP * CS and CLP for other than textual or spoken languages, e.g., sign languages and biological, multimodal human-computer interaction, visual languages * Probabilistic constraint-based reasoning for NLP and context comprehension PREVIOUS EDITIONS ================= Six CSLP workshops have been organized in the past in: Karlsruhe, Germany (2011), Hamburg, Germany (2008), Roskilde, Denmark (2007), Sydney, Australia (2006), Sitges, Spain (2005), Roskilde, Denmark (2004). VENUE ===== CSLP 2012 will take place at LIFO, the Computer Science laboratory of the University of Orleans, France. Orleans is located in the northern bend of the Loire river, it belongs to the Vallee de la Loire sector, which was in 2000 inscribed by UNESCO as a World Heritage Site. Orleans is located 120 kilometers south-west of Paris, it is bordered to the north by the Beauce region and the national forest of Orleans (500 km2), and by the Sologne region to the south. IMPORTANT DATES =============== Submission Deadline: June 10, 2012 Notification: August 1st, 2012 Camera-ready Version: September 1st, 2012 Workshop Dates: September 13-14, 2012 SUBMISSIONS =========== Papers must be submitted electronically as PDF files and be prepared using the Springer LNAI/LNCS format. Detailed formatting instructions can be found at: http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0 Papers should present original, unpublished work. Simultaneous submission to other venues with published proceedings is prohibited. CSLP accepts two kinds of submissions: - full papers (12 pages including references) reporting completed, significant research, - short papers (6 pages including references) reporting ongoing work and partial results. Each submission will be reviewed by three program committee members. Accepted long papers will be presented within 20 minutes talks plus 10 minutes for questions. Accepted short papers will be presented within 10 minutes talks plus 5 minutes for questions. Both paper types will be published in the workshop proceedings. Since reviewing will be blind, the submission should not include the authors' names and affiliations. Other identifying information such as obvious self-references (e.g., "We showed in [12] ...") and financial or personal acknowledgements should be omitted in the submitted papers whenever feasible. Papers have to be submitted via the easychair conference management system using the following link: http://www.easychair.org/conferences/?conf=cslp2012 A volume at an international publisher will be considered for selected and revised papers, if number and quality of submissions permits. REGISTRATION ============ Registration is now open, by filling the form available at http://www.univ-orleans.fr/lifo/evenements/CSLP2012/inscription.php The registration fees (50 EUR for students and 100 EUR for researchers until August, 7th) cover the electronic proceedings (USB stick), the participation to the coffee breaks, the lunches, the banquet, and the social event (visit of a Castle of the Vallee de la Loire). KEYNOTE SPEAKERS ================ Ruth Kempson, King's College London Stergios Chatzikyriakidis, Royal Holloway University of London and Open University of Cyprus Title: "Grammars as Mechanisms for Real-Time Tree-Growth: Explaining Clitic Pronouns" Abstract: In this talk, we use the puzzle of clitic pronoun placement and clustering in Modern Greek to argue for a shift of perspective into defining grammars as mechanisms for incremental growth of interpretation, as argued in Dynamic Syntax: Kempson et al. (2001), Cann et al. (2005) Chatzikyriakidis and Kempson (2011). In this framework, the concept of structural underspecification and growth of semantic representation is taken as the core syntactic notion, grounded in the modal Logic of Finite Trees: Blackburn and Meyer-viol (1994). With modal statements expressing an array of more or less fixed tree-node relations, restrictions on tree development are definable in a way not available to grammars lacking such tree-growth dynamics. One of these is the restriction that no more than one underspecified relation of a type can be built at a time, their being indistinguishable with only this weak characterisation, which we use to explain a range of clitic clustering restrictions found in many clitic-pronoun systems – we take the so-called Person-Case Constraint (PCC) as displayed in different ways in dialects of Modern Greek as our case study. PROGRAM COMMITEE ================ Philippe Blache, CNRS - Université de Provence, France Adriane Boyd, Universität Tübingen, Germany Aoife Cahill, ETS Princeton, USA Henning Christiansen, Roskilde University, Denmark Berthold Crysmann, CNRS - Paris 7, France Verónica Dahl, Simon Fraser University, Canada Helen de Hoop, Radboud University Nijmegen, Netherlands Eric De La Clergerie, INRIA - Paris 7, France Denys Duchier, Université d'Orléans, France Claire Gardent, CNRS - LORIA, France Barbara Hemforth, Université Paris Descartes, France Maria Dolores Jiménez-López, Universitat Rovira i Virgili, Spain Laura Kallmeyer, Heinrich Heine Universität, Düsseldorf, Germany Ruth Kempson, King's College London, UK Stephan Kepser, Codecentric AG Düsseldorf, Germany Patrick McCrae, Langtec Hamburg, Germany Wolfgang Menzel, Universität Hamburg, Germany Detmar Meurer, Universität Tübingen, Germany Véronique Moriceau, Université Paris XI, France Jean-Philippe Prost, Université de Montpellier, France Adam Przepiórkowski, IPIPAN, Warsaw, Poland Christian Rétoré, Université de Bordeaux, France Frank Richter, Universität Tübingen, Germany Sylvain Salvati, INRIA - Université de Bordeaux, France Sylvain Schmitz, ENS Cachan, France Kiril Simov, Bulgarian Academy of Sciences, Bulgaria Jesse Tseng, CNRS - Université de Toulouse, France Jørgen Villadsen, Technical University of Denmark LOCAL ORGANIZING COMMITEE ========================= Chairs: Denys Duchier (LIFO - Université d'Orléans) Yannick Parmentier (LIFO - Université d'Orléans) Members: Guillaume Cleuziou (LIFO - Université d'Orléans) Thi-Bich-Hanh Dao (LIFO - Université d'Orléans) Abdelali Ed-Dbali (LIFO - Université d'Orléans) Matthieu Exbrayat (LIFO - Université d'Orléans) Matthieu Lopez (LIFO - Université d'Orléans) Lionel Martin (LIFO - Université d'Orléans) Simon Petitjean (LIFO - Université d'Orléans) Jacques-Henri Sublemontier (LIFO - Université d'Orléans) Information about the Workshop is available at the CSLP workshop website: http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ E-mail: cslp2012 at easychair.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 18:55:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 20:55:16 +0200 Subject: Appel: TAG+11 Message-ID: Date: Wed, 30 May 2012 08:55:37 +0200 From: Eric De la clergerie Message-ID: <4FC5C469.7090204 at inria.fr> X-url: http://alpage.inria.fr/tagplus11/doku.php ** Apologies for cross-posting ** SECOND CALL FOR PAPERS The Eleventh International Workshop on Tree Adjoining Grammars and Related Formalisms (TAG+11) 26-28 September 2012 University Paris-Diderot Paris, France http://alpage.inria.fr/tagplus11/doku.php The Workshop on Tree-Adjoining Grammars and related formalisms (TAG+) is a biennial workshop series that fosters exchange of ideas among linguists, psycholinguists and computer scientists interested in modeling natural language using formal grammars. The workshop series, since 1990, has demonstrated productive interactions among researchers and practitioners interested in various aspects of the Tree-Adjoining Grammar formalism and its relationship to other grammar formalisms, such as combinatory categorial grammar, dependency grammars, Minimalist grammars, HPSG, and LFG; hence the "+" in the name of the workshop. Tree-Adjoining Grammars (TAG) and related lexicalized grammar formalisms provide mathematical tools to model natural language and the scaffolding to encode linguistic generalizations in a principled manner. In the past, this workshop has helped identify similarities and differences between the above formalisms, leading to the shared development of broad-coverage grammars, transfer of parsing and machine learning algorithms from one formalism to another and to new insights into the properties of different formalisms and their capacity for linguistic explanation. It is our expectation that this edition of the workshop will continue enabling cross-fertilization of ideas that combine the representational flexibility of TAG-like grammar formalisms with the robustness afforded by machine learning techniques to produce a deeper insight into modeling of natural language. The first day of the meeting will be devoted to a series of tutorial presentations, designed to introduce attendees to a range of TAG-related topics. Invited Speakers: * Kevin Knight, University of Southern California (USA) * Bonnie Webber, University of Edinburgh (Scotland) Tutorial Speakers: * David Chiang ? USC Information Sciences Institute (USA) * Laura Kallmeyer ? University of D?sseldorf (Germany) * Andreas Maletti ? University of Stuttgart (Germany) Topics of Interest: We invite submissions on all aspects of TAG and related grammatical formalisms including the following topics: * syntactic and semantic theory; * mathematical properties; * computational and algorithmic studies of parsing, interpretation and language generation; * machine learning models using TAG-like representations; * corpus-based research and grammar development using TAG; * psycholinguistic modeling; and * applications to natural language processing or biological sequence modeling. Special Session: We plan to organize a special session on formalisms based on synchronous tree rewriting. We especially encourage submissions on topics related to synchronous tree rewriting, including theoretical aspects, applications to machine translation and syntax-semantics interface. Submission Details: Anonymous abstracts may be submitted for two types of presentations at the workshop: oral presentations and poster presentations. Poster presentations are particularly appropriate for brief descriptions of specialized implementations, resources under development and work in progress. Regardless of the type of submission, abstracts may not exceed two pages in length (not including data, figures and references). Both one-column or two-column abstracts are permissible. However do not use a font that is smaller than 11pt. If you are using LaTeX for document preparation, then any recent ACL style file can be used. The final camera ready version of the full paper for the proceedings must be in two-column format conforming to the most recent ACL style file. The abstract must be submitted electronically in PDF format, using the EasyChair electronic submission website at http://www.easychair.org/conferences/?conf=tag11 The submission instructions can be found at http://alpage.inria.fr/tagplus11/doku.php?id=submissions Proceedings including full papers for accepted abstracts (both oral and poster presentations) will be available on-line before the workshop dates. Important dates: * Deadline for submission of abstracts: June 15, 2012. * Notification to authors of decision: July 30, 2012. * Deadline for camera-ready submission: September 7, 2012. * Workshop dates: September 26 to 28, 2012. Contact Information: The workshop website is at http://alpage.inria.fr/tagplus11/doku.php Email contact: tagplus11 at gmail.com Organization: Program Chairs * Chung-hye Han, Simon Fraser University (Canada) * Giorgio Satta, University of Padova (Italy) Program Committee * Srinivas Bangalore, AT&T Research (USA) * Rajesh Bhatt, UMass (USA) * David Chiang, USC Information Sciences Institute (USA) * Benoit Crabb? University Paris-Diderot (France) * Robert Frank, Yale University (USA) * Claire Gardent, CNRS/LORIA, Nancy (France) * Daniel Gildea, University of Rochester (USA) * Julia Hockenmaier, University of Illinois at Urbana-Champaign (USA) * Liang Huang, USC Information Sciences Institute (USA) * Aravind Joshi, University of Pennsylvania (USA) * Laura Kallmeyer, University of Duesseldorf (Germany) * Makoto Kanazawa, National Institute of Informatics (Japan) * Alexander Koller, University of Potsdam (Germany) * Marco Kuhlmann, Uppsala University (Sweden) * Andreas Maletti, University of Stuttgart (Germany) * Yusuke Miyao, University of Tokyo (Japan) * Mark-Jan Nederhof, University of St Andrews (Scotland) * Steve DeNeefe, SDL Language Weaver (USA) * Owen Rambow, Columbia University (USA) * Maribel Romero, University of Konstanz (Germany) * Tatjana Scheffler, DFKI (Germany) * Anoop Sarkar, Simon Fraser University (Canada) * William Schuler, The Ohio State University (USA) * Stuart Shieber, Harvard University (USA) * Mark Steedman, University of Edinburgh (UK) * Matthew Stone, Rutgers University (USA) * Sylvain Salvati, INRIA Bordeaux Sud-Ouest (France) * Bonnie Webber, University of Edinburgh (UK) * Fei Xia, University of Washington (USA) Local Arrangements Chairs * ?ric de la Clergerie ? INRIA Paris Rocquencourt * Djam? Seddah ? University Paris Sorbonne Paris 4 * Laurence Danlos, University Paris-Diderot * Chantal Girodon, INRIA Paris Rocquencourt TAG+ 11 is endorsed by EACL (the European Chapter of the Association for Computational Linguistics), and benefits from the support of Google, University Paris-Diderot, and INRIA ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:10:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:10:18 +0200 Subject: Appel: Campaign TRAD 2012, A machine translation evaluation campaign on Arabic-French language pair Message-ID: Date: Wed, 30 May 2012 11:52:24 +0200 From: "Kahn Juliette" Message-ID: <10C58690E5732B47BE9AEC4BF97CA1340168427E at TMSG.intra.lne> X-url: http://www.lne.fr/ X-url: http://www.lne.fr/fr/formation/offre-formation.asp?utm_source=mail&utm_medium=signature&utm_content=offre&utm_campaign=formation_2012 X-url: http://www.lne.fr/fr/formation/catalogue-stages.asp?utm_source=mail&utm_medium=signature&utm_content=cat&utm_campaign=formation_2012 X-url: http://www.lne.fr/fr/formation/E-catalogue-2012/index.html?utm_source=mail&utm_medium=signature&utm_content=e-cat&utm_campaign=formation_2012 X-url: http://www.lne.fr/fr/formation/journees-techniques.asp?utm_source=mail&utm_medium=signature&utm_content=jt&utm_campaign=formation_2012 Machine translation (MT) enjoys a new boom driven by the applications. The goal is to translate sentences in a source language into a target language without human intervention This difficult task need to be regularly assessed to establish the scientific and technical progress. Funded by the French defense procurement agency (DGA), the Laboratoire national de m?trologie et d'essais (LNE) and CASSIDIAN conducts the TRAD-campaign 2012 in order to support MT research and help advance the state of art in MT technologies for the Arabic-French language pair. To meet this objective, the LNE provides the following to the participants: * Consistent data for the training sets, the development and the test sets. The data bases contain newspapers articles or broadcast news transcriptions. * An evaluation by automatic metrics. * An evaluation by human judgment for the 4 best systems depending on the results obtained with the automatic metrics. The LNE organizes a workshop at the end of the campaign to account for the results and compare the approaches of the various participants. Tasks The language pair in TRAD 2012 is Arabic to French. Two tasks are offered because of the sources of the elements to be translated. * Text Task : Translation of newspapers articles that come from various newspapers. * H4 Task : Translation of broadcast news transcriptions that come from various radio and television programs. How to participate ? This evaluation is intended to be of interest of all researchers working on the problem of translation. Participation in the evaluation is invited for all researchers who find the tasks and the evaluation of interest. The only requirement is the participation in the follow-up workshop. All the participants must attend the workshop and be prepared to discuss their system(s) and their results in detail. The workshop is restricted to the TRAD-campaigns participants and representatives of supporting government agencies. To participate, simply fill out the registration form available at www.trad-campaign.org. The participants can sign up for both tasks or for only one of two. Important dates Evaluation plan released 15/04/2012 Early registration 01/05/2012 Training data available 01/06/2012 Registration deadline 01/07/2012 Evaluation test data available 23/09/2012 Deadline for submitting the results 01/10/2012 Deadline for submitting system descriptions to the LNE 08/10/2012 Beginning of the adjudication 10/11/2012 End of the adjudication 20/11/2012 Workshop 28/11/2012 Juliette KAHN Ing?nieur en ?valuation des syst?me de traitement de l'information multimedia Direction des Essais T?l. : 01 30 69 13 62 Laboratoire national de m?trologie et d'essais 29, avenue Roger Hennequin - 78197 Trappes cedex T?l. : 01 30 69 10 00 - Fax : 01 30 69 12 34 Site internet : www.lne.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:13:15 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:13:15 +0200 Subject: Appel: workshop on Computational Methods in Pharmacovigilance Message-ID: Date: Wed, 30 May 2012 15:24:03 +0200 From: marie dupuch Message-ID: X-url: http://natalia.grabar.perso.sfr.fr/CMPV/ MIE 2012 workshop http://natalia.grabar.perso.sfr.fr/CMPV/ Computational Methods in Pharmacovigilance Pharmacovigilance is the activity related to the collection, analysis and prevention of adverse drug reactions induced by drugs or biologics. This activity plays the fundamental role in monitoring the patient safety during their healthcare process and beyond it. Although this activity relies on a strong surveillance tradition within the pharmacoepidemiological area, some limitations appear and generate uncomfortable cases widely covered by media (such as those related to Mediator, VIOXX etc). First of all, these are due to the ever increasing amount of the data to collect and to process, and also to the recording and storage of these data in the digital form. Hence, the computational methods may provide with useful and intelligent solutions for a more rapid and systematic management of these data. In this workshop, we favour the submission of various and novel experiments related to the computational methods in pharmacovigilance and describing different aspects of the pharmacovigilance process, as performed by acamedic researchers, institutional or industrial people: ? Collection of the pharmacovigilance data: traditionnally, the pharmacovigilance cases are narrative documents spontaneously submitted by medical staff, by pharmacists and sometimes even by patients themselves. The actual concern is that the collection of these cases is far from being complete. In this situation, special efforts are oriented on the computational assistance when collecting and gathering the pharmacovigilance cases from the raw textual sources. Moreover, the reporting standards and frames are also addressed by the researchers. ? Analysis of the pharmacovigilance data: this step relies on the encoding of the cases with the dedicated terminologies and then on the semantic and statistical analysis of these cases. The concerns are related to various aspects, such as (1) the semantic correspondence between the cases and the terms; (2) the methods for the encoding of the cases; (3) the managing of semantic ambiguity and relatedness between the terms; (4) exploitation of the SMQs and of the related data; (5) terminological and ontological representation within the dedicated terminologies; (6) computational methods for the signal detection, etc. ? Prevention of adverse drug reactions: the prevention step aims at facilitating the exchange of information through the well established national and international networks. It manages specifically the grave adverse drug reactions and the guidelines which help countries to strengthen the pharmaceutical politics and decisions. ? etc. The objective of this workshop is to gather people working on various aspects of the pharmacovigilance. Experiments performed within academic, instritutional or industrial contexts are welcome. SUBMISSIONS: The authors are invited to prepare 5 page submissions with the respect of the MIE conference style: - http://www.mie2012.it/documents/fullpaper.dot - http://www.mie2012.it/documents/instruction.pdf For any questions, please contact natalia.grabar at univ-lille3.fr IMPORTANT DATES: May 1, 2012: 1st call for submissions June 15, 2012: Paper due date July 10, 2012: Notifications to Authors July 25, 2012: Camera-ready version Aug 28, 2012: MIE conference and workshop SCIENTIFIC COMMITTEE: - Isma?l Ahmed, Equipe Biostatistique, CESP, UMRS 1018 Inserm, Universit? Paris Sud, France - Andrew Bate, Visiting Professor, Department of Information Systems and Computing, Computing and Mathematics, Brunel University, London, UK, Adjunct Associate Professor of Medicine, Division of Clinical Pharmacology NYU School of Medicine, New York, USA and faculty of the NYU Center for Health Informatics and Bioinformatics, USA - Kevin Cohen, University of Colorado School of Medicine and University of Colorado at Boulder, USA - M?lanie Courot, BC Cancer Agency, Vancouver, Canada - Reinhard Fescharek, Behring Inc., Germany - Thierry Hamon, LIM&BIO, Universit? Paris 13, France - Mikaela Keller, CNRS LIFL UMR8022, Mostrare INRIA, Universit? Lille 1 and 3, France - Halil Kilicoglu, National Library of Medicine, NIH, USA - Niklas Noren, Uppsala Monitoring Centre, WHO Collaborating Centre for International Drug Monitoring, Uppsala, Sweden - Patrick Ruch, University of Applied Sciences, Geneva, Switzerland - Ozlem Uzuner, University at Albany, SUNY, USA - ... ORGANIZERS: Marie Dupuch, CNRS STL UMR 8163, U Lille 1 et 3, France Frantz Thiessard, ISPED, U Bordeaux Segalen, France Natalia Grabar, CNRS STL UMR 8163, U Lille 1 et 3, France Jim Slattery, European Medicines Agency, London, UK ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:34:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:34:46 +0200 Subject: Conf: Atelier Ingenierie des Connaissances et Sciences Cognitives, IC, 25 au 29 juin 2012, Paris Message-ID: Date: Wed, 30 May 2012 18:44:07 +0200 From: xavier aim? Message-ID: <4FC64E57.4060807 at inserm.fr> X-url: http://ic2012.crc.jussieu.fr/ X-url: http://web-and-philosophy.org/atelier-philosophie-du-web-et-ingenierie-des-connaissances-ic-2012/ Veuillez nous excuser pour les in?vitables r?ceptions multiples. ======================================================================== Appel ? Participations Atelier "Ing?nierie des Connaissances et Sciences Cognitives. Concevoir des dispositifs capables d?augmenter la pens?e" Journ?e commune AFIA / ARCo 1ere journ?e ? Sciences Cognitives et Intelligence Artificielle ? (SCIA?12) https://sites.google.com/site/ateliericsccog/ 23es Conf?rence en Ing?nierie des Connaissances Paris, du 25 au 29 juin 2012 http://ic2012.crc.jussieu.fr/ ========================================================================= L'atelier ICSC (Ing?nierie des Connaissances et Sciences Cognitives) se tiendra le lundi 25 juin 2012 dans le cadre de la conf?rence IC2012. Il est programm? comme la premi?re journ?e de la th?matique ? Sciences Cognitives et Intelligence Artificielle ? (SCIA?12) orchestr?e par l?AFIA. Du mythe d?Icare au projet de la biomim?tique de J.M. Benyus, l?homme s?applique ? copier la nature pour concevoir ou am?liorer ses syst?mes techniques. Dans le domaine de l?Intelligence Artificielle, de la robotique et du data-mining, on d?veloppe des algorithmes ?volutionnaires ou des mod?les d?optimisation inspir?s du comportement des insectes sociaux. Dans tous les cas, il s?agit de s?inspirer de mod?lisations de structures existant dans la nature pour concevoir des dispositifs artificiels. L'Ing?nierie des Connaissances a-t-elle int?r?t ? adopter une pareille d?marche ? L??tude des m?canismes ? naturels ? de la cognition peut-elle offrir d?am?liorer les performances des dispositifs de manipulation de connaissances ? L?atelier ICSC est ?galement partenaire de l?atelier "Philosophie (du Web) et Ing?nierie (des connaissances)" organis? par Alexandre Monnin, qui se d?roulera la matin?e du 25 juin et porte sur le th?me "De l'importance des agencements sur le web" (http://web-and-philosophy.org/atelier-philosophie-du-web-et-ingenierie-des-connaissances-ic-2012/). La session de discussion g?n?rale qui cl?t la journ?e r?unira les participants des deux ?v?nements. Programme : ----------------- * 14h00 : Pr?sentation de l?Atelier par Xavier Aim? (INSERM US 14, UMRS 872 ?quipe 20) et Gunnar Declerck (INSERM UMRS 872 ?quipe 20), Isabelle Tapiero (Pr?sidente de l?ARCo) /et Yves Demazeau (Pr?sident de l'AFIA). Pr?sentation de la th?matique par Gunner Declerck. * 14h30 ? Les technologies cognitives num?riques pour stimuler et simuler la pens?e ? par Charles Tijus (CHart, Laboratoire Cognitions Humaine et Artificielle / LUTIN, Laboratoire des Usages en Technologies d?Information Num?riques). * 15h00 ? L?Intelligence Artificielle : l?approche des sciences de la complexit? ? par Jean-Claude Heudin (Institut de l?Internet et du Multim?dia). * 15h30 ? Augmenter l?intelligence d?une ?quipe avec une plateforme web de travail collaboratif en temps r?el et en mode moteur d?innovation massivement parall?le ? par Jo?l Muzard (AIA, Applied Intelligence Atelier, Montr?al). *16h00 Pause * 16h15 ? Diff?rentes mani?res de voir le concept de connaissance en sciences cognitives ? par Benoit Le Blanc (ENSC- Institut Polytechnique de Bordeaux / Institut des Sciences de la Communication du CNRS). * 16h45 ? Gradients de prototypicalit?, un apport de la psychologie cognitive ? l?ing?nierie des ontologies ? par Xavier Aim? (INSERM UMRS 872 EQ 20). * 17h15 ? Linguistique et principes cat?goriels, ou le leurre de l?engagement cognitif ? par Jean-Baptiste Guignard (Centre for Cognitive Research, UMS 3327, CNRS / Universit? de Technologie de Compi?gne). * 17h45 ? Pour une ing?nierie des connaissances dynamiques : prendre en compte la dynamique de l?activit? et de ses inscriptions dans les syst?mes d?interpr?tation ? par Yannick Pri? (LIRIS, UMR 5205, CNRS / Universit? Lyon 1). *18h15 Pause *18h20 Discussion g?n?rale Inscriptions : ----------------- L'atelier ICSC se tient dans le cadre de la conf?rence IC 2012 (http://ic2012.crc.jussieu.fr/). Les inscriptions se font sur le site de l'atelier ICSC : http://sites.google.com/site/ateliericsccog/ Organisation : ------------------- - Xavier Aim? (INSERM US14, UMRS 872 ?quipe20) - Gunnar Declerck (INSERM UMRS 872 ?quipe20) Partenaires : ------------------ * AFIA (Association Fran?aise d'Intelligence Artificielle) * ARCo (Association pour la Recherche Cognitive) * Fresco (F?d?ration fran?aise des ?tudiants et jeunes chercheurs en sciences de la cognition) * GRACQ (Communaut? fran?aise d?acquisition et d?ing?nierie des connaissances) * INSERM UMRS 872 ?quipe 20 (Ing?nierie des Connaissances & Sant?) * RISC (Relais d'Information sur les Sciences de la Cognition) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:36:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:36:37 +0200 Subject: Job: Stage, Generation de texte pour le web, Homeloc Message-ID: Date: Wed, 30 May 2012 19:09:27 +0200 From: Guillaume Cabane Message-ID: <2DB60D91B85645C5B143110F2AB73B51 at homeloc.com> X-url: http://www.sparrowmailapp.com/?sig Bonjour, Homeloc, startup Fran?aise bas?e ? paris propose aux propri?taires de location de vacances une multidiffusion de leurs annonces. Dans ce cadre, Homeloc a d?j? mis en place un syst?me de g?n?ration de descriptions en langage naturel ? partir des donn?es structur?es sur les offres de location de vacances. Pour ce projet Homeloc recrute un/une stagiaire avec des connaissances en traitement automatique des langues et la ma?trise d?au moins un langage dynamique (Python, Ruby, Perl, PHP?). Int?gr? ? l??quipe technique Homeloc, il/elle interviendra sur l?am?lioration et l?enrichissement des mod?les de g?n?ration existants, ainsi que des r?gles linguistiques associ?es. Une offre de stage d?taill?e est disponible ici : https://docs.google.com/document/d/1-HS63xFtmN1siL870qQivJbwm03gvzFzJ9wQVcGRO9s/edit Cordialement, Guillaume Cabane Homeloc Co-fondateur & Directeur Marketing +33 (0) 6 83 93 74 58 Envoy? avec Sparrow (http://www.sparrowmailapp.com/?sig) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:39:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:39:50 +0200 Subject: These: Alexander Pak, Fouille d'opinion Message-ID: Date: Thu, 31 May 2012 18:21:16 +0200 From: Patrick Paroubek Message-ID: <1338481276.3036.17.camel at localhost> X-url: http://www.limsi.fr Alexander Pak soutiendra sa th?se intitul?e "Automatic, Adaptive,and Applicative Sentiment Analysis" - Analyse de sentiments automatique, adaptative et applicative, le 13 juin 2012 au LIMSI-CNRS (Universit? Paris XI, Bat. 508, Orsay, http://www.limsi.fr) R?sum?: L'analyse de sentiments est un des nouveaux d?fis apparus en traitement automatique des langues avec l'av?nement des r?seaux sociaux sur le WEB. Profitant de la quantit? d'information maintenant disponible, la recherche et l'industrie se sont mises en qu?te de moyens pour analyser automatiquement les opinions exprim?es dans les textes. Pour nos travaux, nous nous pla?ons dans un contexte multilingue et multi-domaine afin d'explorer la classification automatique et adaptative de polarit?. Nous proposons dans un premier temps de r?pondre au manque de ressources lexicales par une m?thode de construction automatique de lexiques affectifs multilingues ? partir de microblogs. Pour valider notre approche, nous avons collect? plus de 2 millions de messages de Twitter, la plus grande plate-forme de microblogging et avons construit ? partir de ces donn?es des lexiques affectifs pour l'anglais, le fran?ais, l'espagnol et le chinois. Pour une meilleure analyse des textes, nous proposons aussi de remplacer le traditionnel mod?le n-gramme par une repr?sentation ? base d'arbres de d?pendances syntaxiques. Dans notre mod?le, les n-grammes ne sont plus construits ? partir des mots mais des triplets constitutifs des d?pendances syntaxiques. Cette mani?re de proc?der permet d'?viter la perte d'information que l'on obtient avec les approches classiques ? base de sacs de mots qui supposent que les mots sont ind?pendants. Finalement, nous ?tudions l'impact que les traits sp?cifiques aux entit?s nomm?es ont sur la classification des opinions minoritaires et proposons une m?thode de normalisation des d?comptes d'observables, qui am?liore la classification de ce type d'opinion en renfor?ant le poids des termes affectifs. Nos propositions ont fait l'objet d'?valuations quantitatives pour diff?rents domaines d'applications (les films, les revues de produits commerciaux, les nouvelles et les blogs) et pour plusieurs langues (anglais, fran?ais, russe, espagnol et chinois), avec en particulier une participation officielle ? plusieurs campagnes d'?valuation internationales (SemEval 2010, ROMIP 2011, I2B2 2011). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:42:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:42:37 +0200 Subject: Appel: Colloque Res per nomen Message-ID: Date: Thu, 31 May 2012 19:30:42 +0200 From: EMILIA HILGERT Message-ID: <3995_1338485439_4FC7AABF_3995_5054_1_20120531193042.doeqo1ju0484gs00 at wmp.univ-reims.fr> X-url: http://www.res-per-nomen.org/respernomen/colloque-2013/Accueil-2013.html Chers coll?gues, Le quatri?me colloque Res per nomen a comme th?me ? Les th?ories du sens et de la r?f?rence. Hommage ? Georges Kleiber ? et se d?roulera ? l?Universit? de Reims du 30 mai au 1er juin 2013. Vous trouverez l?appel ? communications et autres informations utiles sur le site http://www.res-per-nomen.org/respernomen/colloque-2013/Accueil-2013.html Bien cordialement. Les organisateurs, Emilia Hilgert Silvia Palma Pierre Frath Ren? Daval P.S. Il est possible que vous receviez plusieurs fois ce message, parce que certaines listes de diffusion peuvent se recouper. Veuillez nous en excuser. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:44:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:44:57 +0200 Subject: These: Houda Bouamor, Etude de la paraphrase en TAL Message-ID: Date: Fri, 01 Jun 2012 09:30:08 +0200 From: Houda Bouamor Message-ID: <4FC86F80.8070409 at limsi.fr> Bonjour, J'ai l'immense plaisir de vous inviter ? la soutenance de ma th?se intitul?e /?*?tude de la paraphrase en Traitement Automatique des Langues*?/ qui aura lieu le Lundi 11 Juin 2012 ? 14h30 dans la salle de conf?rence du LIMSI-CNRS. Vous trouverez plus d'informations pour se rendre au CNRS-LIMSI ? l'adresse suivante http://www.limsi.fr/Pratique/acces/. Bien ?videmment, vous ?tes convi?s au traditionnel pot qui suivra. J'esp?re vous y voir nombreux le jour venu. Le jury sera compos? de : *Rapporteurs* Yves Lepage, Professeur ? l'Universit? de Waseda Emmanuel Morin, Professeur ? l'Universit? de Nantes *Examinateurs* Adeline Nazarenko, Professeure ? l'Universit? Paris-Nord Philippe Langlais, Professeur ? l'Universit? de Montr?al Fran?ois Yvon, Professeur ? l'Universit? Paris Sud *Directeurs* Anne Vilnat, Professeure ? l'Universit? Paris Sud Aur?lien Max, Ma?tre de Conf?rences ? l'Universit? Paris-Sud *R?sum?* La variabilit? en langue est une source majeure de difficult?s dans la plupart des applications du traitement automatique des langues. Capturer automatiquement des ?quivalences s?mantiques entre des unit?s de texte ayant des formes diff?rentes est une t?che complexe mais qui s'av?re indispensable dans de nombreux contextes. Dans cette th?se, nous proposons une ?tude d?taill?e de la t?che d'acquisition de paraphrases sous-phrastiques ? partir de paires d'?nonc?s s?mantiquement li?s. Nous d?montrons empiriquement que les corpus parall?les monolingues, bien qu'extr?mement rares, constituent le type de ressource le plus adapt? pour ce genre d'?tude. Nos exp?riences mettent en jeu cinq techniques d'acquisition, repr?sentatives de diff?rentes approches et connaissances, en anglais et en fran?ais. Afin d'am?liorer la performance en acquisition, nous r?alisons la combinaison des paraphrases produites par ces techniques par une validation reposant sur un classifieur automatique ? maximum d'entropie bi-classe. Un r?sultat important de notre ?tude est l'identification de paraphrases qui d?fient actuellement les techniques ?tudi?es, lesquelles sont class?es et quantifi?es en anglais et fran?ais. Nous examinons ?galement dans cette th?se l'impact de la langue, du type du corpus et de la comparabilit? des paires des ?nonc?s utilis?s sur la t?che d'acquisition de paraphrases sous-phrastiques. Nous pr?sentons le r?sultat d'une analyse de la performance des diff?rentes m?thodes test?es en fonction des difficult?s d'alignement des paires de paraphrases d'?nonc?s. Nous donnons, ensuite, un compte rendu descriptif et quantitatif des caract?ristiques des paraphrases trouv?es dans les diff?rents types de corpus ?tudi?s ainsi que celles qui d?fient les approches actuelles d'identification automatique. Mots cl?s : Corpus monolingues, Acquisition de paraphrase, Classification automatique de paraphrase, Typologie de paraphrase Houda Bouamor LIMSI-CNRS & Univ. Paris Sud ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:49:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:49:16 +0200 Subject: Sujet de these: Methodes d'adaptation d'un systeme d'extraction d'information, CEA LIST/LVIC, Saclay Message-ID: Date: Fri, 1 Jun 2012 09:50:19 +0000 From: FERRET Olivier 174579 Message-ID: <97E651D22799554F8E83493187BE08C902B5FFA6 at EXDAG0-B3.intra.cea.fr> X-url: http://www-instn.cea.fr/-Theses-Financement-Candidatures-.html?lang=fr X-url: http://www-instn.cea.fr/spip.php?page=Publication_Sujet&idSujet=7697&lang=fr&langue=fr&id_rubrique=70 Offre d?j? parue mais toujours ouverte. Nous recherchons des ?tudiants int?ress?s par une th?se dans le domaine de l'extraction d'information et d?sireux de candidater ? un financement de th?se CEA CTBU (cf. http://www-instn.cea.fr/-Theses-Financement-Candidatures-.html?lang=fr pour les conditions ? remplir par les candidats et les modalit?s d'une telle candidature). L'objectif de la th?se est plus pr?cis?ment d'?tudier les m?thodes permettant d'adapter le plus rapidement possible un syst?me d'extraction d'information d?fini dans un domaine donn? ? un autre domaine, voire une autre langue. CONTEXTE La th?se se situe dans le contexte de l'extraction d'information, domaine dont l'objectif est d'identifier des ?v?nements ou des faits dans des textes et de structurer les informations retenues. Le plus souvent, cet objectif prend la forme d'une t?che de remplissage de formulaires (templates) pr?d?finis ? partir de textes. Ainsi, pour un formulaire centr? sur les ?v?nements sismiques, l'objectif est pour chaque tremblement de terre d?tect? dans un texte de localiser des informations telles que sa localisation, sa magnitude, sa date et son heure. Un extrait de texte tel que "En visite sur place, le vice-premier ministre Besir Atalay a confirm? que 25 b?timents s'?taient effondr?s ? la suite du s?isme d'une magnitude de 5,6. Il s'est produit ? 20h23 mercredi soir, avec un ?picentre localis? dans le district d'Edremit, ? 17 kilom?tres au sud de Van." doit ainsi permettre ? un syst?me d'extraction d'information de remplir un formulaire typique sur les tremblements de terre qui aurait la forme suivante : FORMULAIRE ? TREMBLEMENT DE TERRE ? lieu : district d'Edremit, ? 17 kilom?tres au sud de Van magniture : 5,6 heure : 20h23 date : mercredi soir Sa mise en oeuvre demande n?anmoins des moyens humains importants, que ce syst?me soit construit sur la base de r?gles ?labor?es manuellement ou bien par apprentissage, ? partir d'un corpus annot? lui-m?me manuellement. Un des d?fis actuels dans le domaine de l'extraction d'information, comme pour beaucoup d'autres applications li?es au traitement automatique des langues, est donc de d?velopper des m?thodes permettant de r?duire, dans la mesure du possible, le co?t et le temps de d?veloppement de syst?mes pour un contexte applicatif donn? (domaine, type d'information ? extraire et langue). OBJECTIFS DE LA THESE La th?se se propose d'aborder la probl?matique de l'adaptation ? un nouveau domaine selon trois axes, dans le prolongement des travaux d?j? r?alis?s au laboratoire LVIC : - le d?veloppement de processus d'extraction d'information g?n?riques. L'id?e sous-jacente est de limiter autant que possible l'utilisation d'heuristiques propres aux domaines consid?r?s, utilisation souvent efficace mais dont l'absence de g?n?ricit? pose probl?me pour la transposition d'un domaine ? un autre. Cette am?lioration de la g?n?ricit? des processus d'extraction, initi?e dans (Jean-Louis et al., 2011a), passe en particulier par le recours ? des analyses de nature discursive ; - la minimisation de la d?pendance vis-?-vis d'un domaine des mod?les construits par apprentissage pour impl?menter les processus d'extraction. Cette minimisation, elle aussi initi?e dans (Jean-Louis et al., 2011a), est obtenue notamment par l'utilisation de caract?ristiques excluant le vocabulaire sp?cifique d'un domaine. L'objectif dans ce cadre est de compenser la perte de performance qui r?sulte le plus souvent de cette restriction par une certaine stabilit? des r?sultats d'un domaine ? un autre ; - l'utilisation d'approches semi-supervis?es qui, ? l'instar de la supervision distante, permettent de d?finir l'adaptation ? un nouveau domaine par la donn?e d'exemples de structures ? extraire li?es ? ce domaine (relations ou templates) plut?t que par l'annotation de corpus. ? la suite de (Jean-Louis et al., 2011b), l'id?e est ici de conjuguer la projection de ces structures dans des corpus caract?ristiques du domaine cible et l'utilisation de techniques d'extraction g?n?riques telles que celles d?velopp?es par exemple dans (Wang et al., 2011) pour construire des exemples annot?s pour ce domaine. Le laboratoire LVIC du CEA LIST dispose d'une plate-forme modulaire de traitement des langues, LIMA, permettant de r?aliser une analyse linguistique d'un texte allant jusqu'au niveau syntaxique et int?grant certaines analyses s?mantiques et discursives. Le doctorant r?alisera son travail en s'appuyant sur cette plate-forme et b?n?ficiera des travaux en extraction d'information d?j? r?alis?s au sein du laboratoire, dans plusieurs domaines (domaines des ?v?nements sismiques et de la finance). Ludovic Jean-Louis, Romaric Besan?on and Olivier Ferret. 2011a. Text Segmentation and Graph-based Method for Template Filling in Information Extraction. 5th International Joint Conference on Natural Language Processing (IJCNLP), Chiang Mai, Thailand. Ludovic Jean-Louis, Romaric Besan?on, Olivier Ferret and Adrien Durand. 2011b. A weakly supervised approach for large scale relation extraction. 3rd International Joint Conference on Knowledge Discovery and Information Retrieval (KDIR 2011), Paris, France. Wei Wang, Romaric Besan?on, Olivier Ferret and Brgitte Grau. 2011. Filtering and Clustering Relations for Unsupervised Information Extraction in Open Domain. 20th ACM Conference on Information and Knowledge Management (CIKM), Glasgow, UK. COMPETENCES REQUISES - niveau M2 recherche (ou ing?nieur) en Informatique avec une sp?cialisation en Traitement Automatique des Langues - familiarit? avec les m?thodes d'apprentissage statistique - langage C++ ainsi qu'un langage de script de type Perl ou Python ; syst?me d'exploitation Linux La th?se sera r?mun?r?e selon les bar?mes du CEA et se d?roulera au sein du Laboratoire Vision et Ing?nierie des Contenus (LVIC) du CEA LIST, situ? dans le centre NanoInnov, sur le plateau de Saclay, ? proximit? de l'?cole Polytechnique. Les candidats int?ress?s par ce sujet de th?se sont invit?s ? prendre contact rapidement avec Olivier Ferret (olivier.ferret__.cea.fr) et Romaric Besan?on (romaric.besancon__.cea.fr) en envoyant un CV d?taill? et une lettre de motivation. Ce sujet de th?se est ?galement r?f?renc? au niveau du site Web du CEA ? l'adresse : http://www-instn.cea.fr/spip.php?page=Publication_Sujet&idSujet=7697&lang=fr&langue=fr&id_rubrique=70 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 1 19:53:17 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 1 Jun 2012 21:53:17 +0200 Subject: Cursus: Master Linguistique Informatique, Paris Diderot Message-ID: Date: Fri, 1 Jun 2012 16:45:05 +0200 From: Pascal Amsili Message-ID: <20120601144505.GB30353 at courlis.linguist.jussieu.fr> X-url: http://li.linguist.univ-paris-diderot.fr/ Cursus : Master Linguistique informatique Paris Diderot Site web : http://li.linguist.univ-paris-diderot.fr/ Pr?sentation : Le cursus de Linguistique Informatique de Paris Diderot (Paris 7) a pour objectif de former des sp?cialistes dans le secteur du "Traitement Automatique des Langues" (TAL). Ce secteur de pointe correspond ? l'application de programmes et techniques informatiques ? tous les aspects du langage humain depuis la reconnaissance de la parole jusqu'? l'analyse s?mantique du contenu d'un texte. Il s'agit ? la fois d'un domaine technologique et d'un domaine de recherche. Le domaine technologique est organis? autour d'un certain nombre d'applications, dont les plus connues sont la traduction automatique (historiquement la premi?re application, d?s les ann?es 1950), la correction orthographique, la recherche d'information, le r?sum? de texte, la g?n?ration de texte, la synth?se de la parole, la reconnaissance vocale. Du point de vue de la recherche, la linguistique informatique s'appuie sur des r?sultats en linguistique formelle (math?matique), en informatique fondamentale, et en ing?nierie. Le cursus de Linguistique Informatique de Paris Diderot a toujours ?t? caract?ris? par l'ambition de proposer, dans un d?partement de linguistique sp?cialis? en linguistique formelle, une formation de qualit? en informatique, avec des exigences comparables ? celles des fili?res scientifiques. Pour mener ? bien ce projet, le cursus appuie sa formation sur le d?partement de linguistique, le d?partement d'informatique, et les ?quipes de recherches associ?es. Il b?n?ficie ? plein de la pluri-disciplinarit? qui caract?rise l'universit? Paris Diderot. Organisation de la formation : Ce cursus offre une formation qui commence d?s la troisi?me ann?e de licence et comporte ensuite deux ann?es de master avec deux orientations (pour la 2e ann?e) : professionnelle ou recherche. - Master 1?re ann?e : Le premier semestre comporte des enseignements en linguistique (communs au master 1 de linguistique), et en informatique (dispens?s par des enseignants de l'UFR d'informatique). Les ?tudiants venant plut?t de fili?res informatiques suivent des cours d'informatique communs au M1 d'informatique. Les ?tudiants dont le parcours ant?rieur est plut?t linguistique ou litt?raire re?oivent des cours d'informatique communs avec le L3 d'informatique, ou des cours sp?cifiques. A ces enseignements "disciplinaires" s'ajoutent des enseignements en traitement automatique des langues et en linguistique computationnelle. - Master 2?me ann?e professionnel : Il s'adresse ? des ?tudiants d?sireux de s'ins?rer dans le monde industriel ? l'issue du master, en tant qu'ing?nieur linguiste informaticien. L'ann?e comporte : - des cours th?oriques assur?s par des enseignants-chercheurs - 8 cours orient?s applications, assur?s par des intervenants professionnels - un stage en entreprise (6 mois), valid? par m?moire et soutenance Le cursus s'appuie sur sa longue exp?rience et des contacts soutenus avec des entreprises faisant appel au TAL, qu'il s'agisse de soci?t?s sp?cialis?es, ou de grands groupes int?grant une ?quipe d'ing?nierie linguistique. - Master 2?me ann?e recherche : Il s'adresse ? des ?tudiants qui envisagent une carri?re de chercheur ou d'enseignant-chercheur. Les ?tudiants choisissent 5 s?minaires en accord avec leur directeur de recherche. Ils pr?parent pendant l'ann?e un m?moire de recherche, dans le cadre d'un stage en laboratoire. Le cursus b?n?ficie de la pr?sence de plusieurs ?quipes de recherche (en particulier pour la linguistique informatique, l'?quipe Alpage - www.alpage.fr - ?quipe mixte INRIA / Paris 7). Conditions d'acc?s et pr?-requis : Il est possible d'int?grer le cursus de linguistique informatique ? tous les niveaux propos?s (L3, M1, M2). L'acc?s se fait dans tous les cas sur dossier. Niveau L3 : Il n'y a pas de pr?-requis pour entrer au niveau L3. Niveau M1 : Pour une entr?e directe en M1, il faut de plus satisfaire les pr?-requis suivants (valid?s par une formation de niveau licence ou par examen d'entr?e): - linguistique : Morpho-syntaxe, phon?tique (niveau licence) - informatique : Algorithmique, Programmation (Java et/ou C/C++) (niveau licence) Des connaissances en math?matiques (langages formels, probabilit?s) sont un atout important. Niveau M2 : Pour une entr?e directe en 2e ann?e (plus rare), les pr?-requis sont les m?mes que pour le M1, avec un niveau plus avanc?. Une exp?rience ou une comp?tence dans le domaine du TAL est indispensable. D?tail des conditions d'acc?s ? retrouver sur le site http://li.linguist.univ-paris-diderot.fr/acces.html Contact : linguistique.informatique-A-ENLEVER at linguist.jussieu.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:37:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:37:28 +0200 Subject: Q: Classification performance across languages and language families Message-ID: [th - des r?ponses ont ?t? envoy?es sur la liste corpora] Date: Sat, 02 Jun 2012 13:40:07 +0200 From: Ralf Steinberger Message-id: <025501cd40b4$76198f90$624caeb0$@jrc.ec.europa.eu> X-url: http://langtech.jrc.ec.europa.eu/Documents/2012_LREC-JEX-final.pdf X-url: http://eurovoc.europa.eu/ X-url: http://langtech.jrc.ec.europa.eu/Eurovoc.html A question and an invitation to discussion. We recently carried out multi-label categorisation experiments on a mostly parallel set of documents in 22 languages, covering the language families Germanic, Romance, Slavic, Hellenic, Finno-Ugric, Baltic and Semitic. The document set is reasonably large (22K to 42K documents per language), using the thousands of subject domain categories from the EuroVoc thesaurus . The performance across languages was rather uniform, with the exception of the outlier Maltese, which performed considerably less well. The languages covered are Bulgarian, Czech, Danish, Dutch, English, Estonian, Finnish, French, German, Greek, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovenian, Spanish and Swedish. To my great surprise, the highly inflected agglutinative language Hungarian produced the best results of all. The five Germanic languages ended up in the top ten positions, the five Slavic languages in the bottom half. The results for the other language families were less consistent. Q1: Does anyone have an intuition how these results could be explained? Q2: Has anyone ran similar experiments with other types of classifiers or data? Are the results similar? My initial expectation had been that highly inflected languages would perform less well and that feature space reduction using lemmatisation would improve the results. However, our experiments for Czech, English, Estonian and French (described in Ebrahim et al., forthcoming) showed the contrary, rather consistently for all four languages and language families: (1) lemmatisation reduces the performance and (2) adding part-of-speech (POS) information to the word form and/or to the lemma improves the performance. Q3: Can we conclude that: the scarcer the feature space, the better the classification performance? Q4: If that were the case, why did Slavic languages (and Maltese) perform less well in our experiments? I would be pleased if you could share your own experience and/or your opinions. The classification tool (JRC EuroVoc Indexer JEX http://langtech.jrc.ec.europa.eu/Eurovoc.html ) and the multilingual document set can be downloaded from http://langtech.jrc.ec.europa.eu/Eurovoc.html . Details of our experiments are given in the two papers below. Steinberger Ralf, Mohamed Ebrahim & Marco Turchi (2012). JRC EuroVoc Indexer JEX - A freely available multi-label categorisation tool. Proceedings of the 8th international conference on Language Resources and Evaluation (LREC'2012), Istanbul, 21-27 May 2012. (PDF http://langtech.jrc.ec.europa.eu/Documents/2012_LREC-JEX-final.pdf ) Ebrahim Mohamed, Maud Ehrmann, Marco Turchi & Ralf Steinberger (forthcoming). Multi-label EuroVoc classification for Eastern and Southern EU Languages. In: Cristina Vertan & Walther v. Hahn: Multilingual processing in Eastern and Southern EU languages - Low-resourced technologies and translation. Cambridge Scholars Publishing, Cambridge, UK. Greetings, Ralf Ralf Steinberger European Commission ? Joint Research Centre (JRC) URL: http://langtech.jrc.ec.europa.eu/RS.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:40:56 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:40:56 +0200 Subject: Appel: SSLST 2012 Message-ID: Date: Sat, 2 Jun 2012 17:24:59 +0200 From: "GRLMC" Message-ID: <710DDE6B87DA41A29192D929E46FE4BF at Carlos1> X-url: http://grammars.grlmc.com/sslst2012/ ********************************************************************* 2012 INTERNATIONAL SUMMER SCHOOL IN LANGUAGE AND SPEECH TECHNOLOGIES SSLST 2012 (formerly International PhD School in Language and Speech Technologies) Tarragona, Spain July 30 ? August 3, 2012 Organized by: Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/sslst2012/ ********************************************************************* AIM: SSLST 2012 offers a broad and intensive series of lectures at different levels on language and speech technologies. The students choose their preferred courses according to their interests and background. Instructors are top names in their respective fields. The School intends to help students initiate and foster their research career. The previous event in this series was WSLST 2012: http://grammars.grlmc.com/wslst2012/ ADDRESSED TO: Graduate (and advanced undergraduate) students from around the world. Most appropriate degrees include: Computer Science and Linguistics. Other students (for instance, from Mathematics, Electrical Engineering, Philosophy, or Cognitive Science) are welcome too. The School is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. There is no overlap in the class schedule. COURSES AND PROFESSORS: - Jont B. Allen (U Illinois Urbana-Champaign), A Parametric Analysis of Speech Perception [introductory, 8 hours] - Herv? Bourlard (Idiap Research Institute, Martigny), Automatic Speech Recognition and Multilingual Speech Processing: HMM, Hybrid HMM/ANN and Posterior-based Systems [introductory/intermediate, 6 hours] - Marcello Federico (Bruno Kessler Foundation, Trento), Statistical Machine Translation [introductory/intermediate, 6 hours] - Giuseppe Riccardi (U Trento), Spoken Language Understanding [intermediate/advanced, 6 hours] - Noah A. Smith (Carnegie Mellon U), Probability and Structure in Natural Language Processing [intermediate, 9 hours] - Bayya Yegnanarayana (International Institute of Information Technology Hyderabad), Speech Signal Processing [introductory/intermediate, 8 hours] REGISTRATION: It has to be done on line at http://grammars.grlmc.com/sslst2012/Registration.php FEES: They are variable, depending on the number of courses each student takes. The rule is: 1 hour = - 10 euros (for payments until May 18, 2012), - 15 euros (for payments after May 18, 2012). PAYMENT PROCEDURE: The fees must be paid to the School's bank account: Uno-e Bank bank?s address: Julian Camarillo 4 C, 28037 Madrid, Spain IBAN: ES3902270001820201823142 BIC/SWIFT code: UNOEESM1 account holder: Carlos Martin-Vide GRLMC account holder?s address: Av. Catalunya 35, 43002 Tarragona, Spain Please mention SSLST 2012 and your name in the subject. A receipt will be provided on site. Remarks: - Bank transfers should not involve any expense for the School. - People claiming early registration will be requested to prove that the bank transfer order was carried out by the deadline. - Students may be refunded only in the case when a course gets cancelled due to the unavailability of the instructor. People registering on site at the beginning of the School must pay in cash. For the sake of local organization, however, it is much recommended to do it earlier. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Students will be delivered a certificate stating the courses attended, their contents, and their duration. IMPORTANT DATES: Announcement of the programme: April 12, 2012 Starting of the registration: April 12, 2012 Early registration deadline: May 18, 2012 Starting of the School: July 30, 2012 End of the School: August 3, 2012 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat WEBSITE: http://grammars.grlmc.com/sslst2012/ POSTAL ADDRESS: SSLST 2012 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Diputaci? de Tarragona Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:43:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:43:50 +0200 Subject: Soft: New major release of the continuous space LM toolkit for SMT Message-ID: Date: Mon, 04 Jun 2012 01:14:04 +0200 From: Holger Schwenk Message-ID: <4FCBEFBC.2010109 at lium.univ-lemans.fr> X-url: http://www-lium.univ-lemans.fr/cslm/ I'm happy to announce the availability of a new version of the continuous space language model (CSLM) toolkit. Continuous space methods we first introduced by Yoshua Bengio in 2001 [1]. The basic idea of this approach is to project the word indices onto a continuous space and to use a probability estimator operating on this space. Since the resulting probability functions are smooth functions of the word representation, better generalization to unknown events can be expected. A neural network can be used to simultaneously learn the projection of the words onto the continuous space and to estimate the n-gram probabilities. This is still a n-gram approach, but the LM probabilities are interpolated for any possible context of length n-1 instead of backing-off to shorter contexts. CSLM were initially used in large vocabulary speech recognition systems and more recently in statistical machine translation. Improvements in the perplexity between 10 and 20% relative were reported for many languages and tasks. This version of the CSLM toolkit is a major update of the first release. The new features include: - full support for short-lists during training and inference. By these means, the CSLM can be applied to tasks with large vocabularies. - very efficient n-best list rescoring. - support of graphical extension cards (GPU) from Nvidia. This speeds up training by a factor of four with respect to a high-end server with two CPUs. We successfully trained CSLMs on large tasks like NIST OpenMT'12. Training on one billion words takes less than 24 hours. In our experiments, the CSLM achieves improvements in the BLEU score of up to two points with respect to a large unpruned back-off LM. A detailed description of the approach can be found in the following publications: [1] Yoshua Bengio and Rejean Ducharme. A neural probabilistic language model. In NIPS, vol 13, pages 932--938, 2001. [2] Holger Schwenk, Continuous Space Language Models; in Computer Speech and Language, volume 21, pages 492-518, 2007. [3] Holger Schwenk, Continuous Space Language Models For Statistical Machine Translation; The Prague Bulletin of Mathematical Linguistics, number 83, pages 137-146, 2010. [4] Holger Schwenk, Anthony Rousseau and Mohammed Attik; Large, Pruned or Continuous Space Language Models on a GPU for Statistical Machine Translation, in NAACL workshop on the Future of Language Modeling, June 2012. The software is available at http://www-lium.univ-lemans.fr/cslm/. It is distributed under GPL v3. Comments, bug reports, requests for extensions and contributions are welcome. enjoy, Holger Schwenk LIUM University of Le Mans Holger.Schwenk at lium.univ-lemans.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:46:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:46:59 +0200 Subject: Sujet de these: Analyse et caracterisation des Contextes Riches en Connaissances Message-ID: Date: Tue, 05 Jun 2012 17:37:23 +0200 From: Condamines Message-ID: <4FCE27B3.1000109 at univ-tlse2.fr> Proposition de th?se financ?e : *Analyse et caract?risation des Contextes Riches en Connaissances en corpus multilingue et multigenre pour l'aide ? la traduction* Domaine : Linguistique de corpus, terminologie textuelle Laboratoire : CLLE-ERSS, UMR 5263 Toulouse Contexte : - Projet ANR CRISTAL (Contextes RIches en ConnaissanceS pour la TrAduction Terminologique) - Partenaires : LINA (Laboratoire d'Informatique de NAntes),responsable du projet et soci?t? Lingua et Machina, Directrice de th?se : Anne Condamines, DR CNRS L'objectif de la th?se consistera ? travailler la notion de Contexte Riche en Connaissances (CRC) d'une part afin de d?crire et caract?riser ces contextes d'un point de vue linguistique et, d'autre part, de voir comment ils peuvent ?tre rep?rer automatiquement en corpus. La notion de Contexte Riche en Connaissance a ?t? propos?e par (Meyer, 2001). Elle concerne des contextes qui, dans les corpus sp?cialis?s, peuvent ?tre utilis?s pour d?finir les termes. Elle rejoint en partie la notion de marqueur de relation qui est utilis?e, en terminologie textuelle et en ing?nierie des connaissances, pour construire des r?seaux terminologiques ou ontologiques. L'originalit? de l'?tude vient de ce qu'elle se fera ? partir de corpus parall?les, organis?s d'apr?s le(s) genre(s) dont ils rel?vent. Cette double variation : de la langue et du genre, sera prise en compte dans la description des CRC afin d'?valuer en quoi elle permet d'affiner leur description et leur rep?rage. Les r?sultats obtenus seront int?gr?s ? un outil d'aide ? la traduction afin de mieux cibler les r?ponses propos?es aux utilisateurs. *Dipl?mes et comp?tences requises* Master en linguistique de corpus ou terminologie textuelle avec de bonnes connaissances en TAL Ou Master en TAL avec de tr?s bonnes connaissances en linguistique Bon niveau d'anglais Contact : Anne Condamines, anne.condamines at univ-tlse2.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 07:50:42 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 09:50:42 +0200 Subject: Appel: Revue "Le discours et la langue", Metalangage et expression du sentiment linguistique "profane" Message-ID: Date: Tue, 05 Jun 2012 20:02:41 +0200 From: michelle lecolle Message-ID: <4FCE49C1.8060404 at univ-lorraine.fr> X-url: http://lediscoursetlalangue.wordpress.com/ APPEL A CONTRIBUTIONS ? Le discours et la langue ? lance un appel ? contributions pour un num?ro th?matique : "M?talangage et expression du sentiment linguistique ? profane ?" pour parution en 2014. Le fichier joint contient l'appel ? contribution et le calendrier, reproduit ci-dessous : ****Calendrier et modalit?s de soumission** - remise des r?sum?s (1 page) : 1 septembre 2012 - signification aux auteurs : 1 octobre 2012 - remise des textes (entre 30 000 et 35 000 signes, espaces, notes et bibliographie comprises ) : 1 avril 2013 - signification aux auteurs, commentaires et relecture : 30 juin 2013 - remise des textes d?finitifs : 1 novembre 2013 Michelle Lecolle, Universit? de Lorraine, CREM Adresse de la revue ////Le discours et la langue// http://lediscoursetlalangue.wordpress.com/ contact, r?sum?s ? envoyer ? Michelle Lecolle : Michelle.Lecolle at univ-lorraine.fr ------------------------------------------------------------------------ Appel ? contributions pour un num?ro de Le discours et la langue ? para?tre en 2014 M?talangage et expression du sentiment linguistique ? profane ? Responsable du num?ro Michelle Lecolle, Universit? de Lorraine, CREM Qu?elles soient professionnelles ou priv?es, les situations de communication favorisant les pratiques explicitement m?talinguistiques sont nombreuses : commentaires politiques, critiques de presse, enseignement et apprentissage des langues, traduction, r?daction professionnelle ou amateure... Parall?lement, on constate la vivacit? d?une activit? ?ditoriale ? grand public ? centr?e sur la langue et les pratiques discursives, et la pr?sence significative sur le Web de sites d?di?s au vocabulaire, ? l?histoire des expressions, ? la correction grammaticale, aux figures rh?toriques ; les forums qui y sont associ?s sont souvent fort vivants. Ces activit?s m?talinguistiques, en tant qu?elles sont le fait d?? amateurs ? ? non linguistes, mais parfois savants ?, font l?objet depuis quelques ann?es d?un int?r?t accru de la part de linguistes, sociolinguistes, historiens de la langue, dans l?espace francophone (voir Achard- Bayle et Paveau (dir.) 2008, et les r?f?rences cit?es ; Achard-Bayle et Lecolle (dir.) 2009 ; Siouffi (dir.) 2012). Qu?elles soient abord?es sous l?angle des rapports entre langue et culture, entre langue et sujets parlants, comme des manifestations de purisme (Paveau et Rosier 2008), en termes d??motion, de jeu, de manipulation ; qu?elles donnent des indications (plus ou moins directes) sur des noeuds de probl?mes ou des zones de changements de la langue ellem?me, ou encore qu?elles fournissent des outils d?observation de l?apprentissage des langues ; qu?elles constituent, finalement, une source de renouvellement scientifique de la discipline, les activit?s m?talinguistiques amateures poss?dent de multiples enjeux, th?oriques, m?thodologiques ou applicatifs. De son c?t?, le m?talinguistique, comme langage, comme activit?, comme vocabulaire, a ?t? ?tudi? sous diff?rents aspects : s?miotique et s?mantique avec les travaux fondateurs de Josette Rey-Debove (1978), ?nonciatif chez Jacqueline Authier-Revuz (1995) et, naturellement, dans une perspective historique (Auroux (dir.) 1989, 1992, 1997). Des ouvrages collectifs (Colombat et Savelli (dir.) 2001 et tout r?cemment Glikman, Mansour, Weiser (dir.) 2012) se centrent sur le vocabulaire m?talinguistique en tant que terminologie de la linguistique. Enfin, la question de la terminologie linguistique et grammaticale parcourt les ?crits th?oriques de didactique des langues (voir, entre autres, Petitjean (dir.) 1998 ; Paveau et Rosier (dir.) 2005 ; Chiss et David 2011). Dans ce num?ro du Discours et la langue, on propose de situer la r?flexion ? l?intersection des deux probl?matiques ?voqu?es : il s?agit de se centrer sur l?emploi du m?talangage dans le cadre de pratiques m?talinguistiques ? profanes ?. Sous le terme de ? m?talangage ? on entendra ici sp?cifiquement le vocabulaire sp?cialis? de la linguistique (dans lequel on englobe celui de la grammaire, de la rh?torique, de la stylistique). Les ?tudes sur l?histoire de la terminologie linguistique de tradition latine (B. Colombat) soulignent que cette terminologie, en particulier les termes re?us, est loin d??tre coh?rente. Il en est de m?me si l?on envisage les termes en synchronie. Les acceptions sp?cialis?es de vocabulaire courant, sources potentielles d?ambig?it? (genre, mode, voix, aspect, mais aussi figure, pour ne citer que des noms du lexique fran?ais) c?toient une terminologie r?ellement sp?cifique (morph?me, lex?me, diath?se ou encore zeugme, oxymore?). Des termes sont ?tendus hors de leur domaine d?application traditionnel, non sans probl?me (grammaire de phrase/grammaire de texte, voir les travaux de B. Combettes). Cette situation, ? laquelle il faut ajouter la trompeuse familiarit? avec le vocabulaire de la grammaire scolaire, est sans nul doute facteur de flottements et d?incertitude dans l?apprentissage de la discipline. Dans un cadre scolaire, l?introduction, par le biais des Instructions officielles ou des manuels, des notions et de la terminologie linguistiques occasionne des difficult?s sp?cifiques, sources potentielles de crispations ou de conflits. Mais cette complexit? peut aussi, paradoxalement, s?duire. On constate en effet que le vocabulaire ? savant ? de la linguistique et plus encore de la rh?torique appara?t dans des contextes ? premi?re vue inattendus ? des ?tudes syst?matiques permettraient de pr?ciser ces emplois et leurs contextes. On attend donc de ce num?ro qu?il apporte des analyses crois?es sur l?appropriation du m?talangage dans des ?nonc?s m?talinguistiques ? profanes ?, et sur leurs modalit?s ? le point de vue adopt? n??tant pas, a priori du moins, celui d?une d?gradation ou d?un d?voiement du m?talangage dans le discours profane, mais plut?t celui d?une attention sp?cifique port?e ? la porosit? de la fronti?re entre pratiques discursives ? savantes ? et ? profanes ?. On propose, ? titre indicatif, les axes suivants, qui peuvent ?tre abord?s isol?ment ou de mani?re crois?e, et en envisageant leurs enjeux didactiques. Un premier axe permettra d??tudier la terminologie de la linguistique d?un point de vue s?mantique, ? travers les emplois qui en sont faits dans des activit?s m?talinguistiques amateures : quels termes sont employ?s, ou privil?gi?s ? Certains fonctionnent-ils en s?rie ? En syst?me ? Peut-on observer un changement du sens des termes, et ce changement est-il syst?matisable ? Un deuxi?me axe abordera la question des contours et des limites de la terminologie linguistique, vus ? travers le prisme des discours de non-sp?cialistes. Ici se trouvera questionn?e la distinction entre m?talangage savant et m?talangage ordinaire, ou encore entre termes de linguistique et lexique susceptible de relever plut?t de disciplines connexes : des mots tels que contradiction, raisonnement/raisonner, voire pens?e/penser par exemple peuvent-ils encore ?tre consid?r?s comme m?talinguistiques, et peut-on avancer des crit?res ? La question des variations du m?talangage selon les parties du discours (nom, adjectif, verbe, adverbe m?talinguistiques) se pose ?galement. Enfin, peut-on, ou doit-on, poser une distinction entre m?talangage et ? m?tadiscours ? (au sens, ici, d?une terminologie portant sur la pratique discursive : langue de bois, politiquement correct, petite phrase, ?l?ment de langage?) ? Un troisi?me axe abordera le fonctionnement du m?talangage en discours ? travers les contextes de son apparition : y a-t-il des situations qui privil?gient l?emploi profane du m?talangage ? Des types de discours ou des genres qui le prescrivent, ou l??vitent ? On s?int?ressera ici ?galement aux fonctions discursives de l?emploi du m?talangage : prestige ? Rendement argumentatif ? Souci didactique, besoin d?explicitation ? R?f?rences Achard-Bayle G. et Lecolle M. (dir.), 2009, ? Sentiment linguistique. Discours spontan?s sur le lexique ?, Recherches Linguistiques n?30. Achard-Bayle G., Paveau M.-A. (dir.), 2008, ? Linguistique populaire ? ?, Pratiques 139/140. Auroux S. (dir.), 1989, Histoire des id?es linguistiques, tome 1, Li?ge-Bruxelles, Mardaga. Auroux S. (dir.), 1992, Histoire des id?es linguistiques. t. II, Li?ge, Mardaga. Auroux S. (dir.), 1997, Histoire des id?es linguistiques, t. III, Li?ge, Mardaga. Authier-Revuz J., 1995, Ces mots qui ne vont pas de soi. Boucles r?flexives et nonco?ncidences du dire, tome 1 et tome 2, Paris, Larousse. Chiss et David, 2011, ? Didactique du fran?ais et ?tude de la langue ?, Le Fran?ais aujourd'hui, n?HS01, 2011/5. Colombat B. et Savelli M. (dir.), 2001, M?talangage et terminologie linguistique, Actes du Colloque de Grenoble, mai 1998. Bruxelles, Peeters, coll. ? Orbis Supplementa ?. Glikman J., Mansour L., Weiser S. (dir.), 2012, Le Vocabulaire Scientifique Et Technique En Sciences Du Langage, actes du colloque Col'Doc 2007. En ligne (cf. site Modyco) http://modyco.fr/fr/event/cat_view/1004-coldoc/1015-actes-de-colloques-en-ligne/1021-actescoldoc- 2007.html Houdebine A.-M. (dir.), 2002, L?imaginaire linguistique, Paris, l?Harmattan. Paveau M.-A. et Rosier L. (dir.), 2005, ? Penser, classer. Les Cat?gories de la discipline ?, Le Fran?ais aujourd'hui 151, 2005/4. Paveau M.-A. et Rosier L., 2008, La langue fran?aise, passions et pol?miques. Paris, Vuibert. Petitjean A. (dir.), 1998, ? La transposition didactique en fran?ais ?, Pratiques 97/98. Rey-Debove J., 1978, Le m?talangage : ?tude linguistique du discours sur le langage. Paris, Le Robert. Siouffi G. (dir.), ? para?tre en 2012, ? Sentiment de la langue et diachronie ?, Diachroniques 2. Calendrier et modalit?s de soumission - remise des r?sum?s : 1 septembre 2012 - signification aux auteurs : 1 octobre 2012 - remise des textes : 1 avril 2013 - signification aux auteurs, commentaires et relecture : 30 juin 2013 - remise des textes d?finitifs : 1 novembre 2013 Les r?sum?s d?article (une page) sont ? envoyer ? michelle.lecolle at univ-lorraine.fr Attention : l?acception du r?sum? ne vaut pas engagement pour l?article lui-m?me. Taille des articles : entre 30 000 et 35 000 signes, espaces, notes et bibliographie comprises. Adresse de la revue Le discours et la langue http://lediscoursetlalangue.wordpress.com/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 09:01:52 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 11:01:52 +0200 Subject: Conf: ACL Workshop Program: Detecting Structure in Scholarly Discourse, Jeju Island, Korea, July 12, 2012 Message-ID: Date: Wed, 06 Jun 2012 10:01:15 +0200 From: "Sandor, Agnes" Message-ID: <4FCF0E4B.2070109 at xrce.xerox.com> X-url: http://www.nactem.ac.uk/dssd/programme.php We are happy to announce that the program for the ACL workshop ' Detecting Structure in Scholarly Discourse' has now been finalized, to be held on Jeju Island, Korea, on July 12, 2012- for an online version, seehttp://www.nactem.ac.uk/dssd/programme.php. Workshop Program: Time Presentation 9:00-10:30 Session 1: Exploiting Discourse Structure 9:00-9:45 Dae Hoon Park and Catherine Blake: "Identifying Comparative Claim Sentences in Full-Text Scientific Articles" 09:45-10:30 ?gnes S?ndor and Anita de Waard: "Identifying Claimed Knowledge Updates in Biomedical Research Articles" 10:30-11:00 Coffee break 11:00-12:30 Session 2: Detecting Discourse Elements: 11:00-11:45 Awais Athar and Simone Teufel: "Detection of Implicit Citations for Sentiment Detection" 11:45-12:30 Tomoko Ohta, Sampo Pyysalo, Jun'ichi Tsujii and Sophia Ananiadou: "Open-domain Anatomical Entity Mention Detection" 12:30-14:00 Lunch break 14:00-15:30 Session 3: Taxonomies and Annotation 14:00-14:45 Maria Liakata, Paul Thompson, Anita de Waard, Raheel Nawaz, Henk Pander Maat and Sophia Ananiadou: "A Three-Way Perspective on Scientific Discourse Annotation for Knowledge Extraction" 14:45-15:30 Anita de Waard and Henk Pander Maat: "Epistemic Modality and Knowledge Attribution in Scientific Discourse: A Taxonomy of Types and Overview of Features" 15:30-16:00 Coffee break 16:00-17:00 Panel discussion on detecting and using discourse structure for scholarly text 17:00-17:30 Wrapup and close Discourse structure, as a field of research within computational linguistics, is attracting renewed research interest, due to its increasing relevance to diverse fields such as bio-medical text analysis, ethnography, and scientific publishing. Much effort is directed at detecting and modeling a range of discourse elements at different levels of granularity and for different purposes. Such elements include: the statement of facts, claims, and hypotheses; the identification of methods and protocols; and the detection of novelty in contrast to the re-stating of previous existing work. More ambitious long-term goals include the modeling of argumentation, rhetorical structure, and narrative structure. A broad variety of approaches and of features are used to identify discourse elements, including verb tense/mood/voice, semantic verb class, speculative language or negation, various classes of stance markers, text-structural components, or the location of references. The choice of features is often motivated by linguistic inquiry into the detection of subjectivity, opinion, entailment, inference, as well as author stance, author disagreement, motif and focus. Six submissions were selected for presentation at the workshop. The submissions represent three fundamental perspectives of research concerning discourse structure: taxonomy and annotation, exploiting cross-document structure in text mining, and detecting discourse elements in scholarly texts. Further development of discourse models and of systems is likely to bring together and integrate aspects from all three. At the same time, these three perspectives give rise to interesting contrasts and different research questions, for instance: Are explicit taxonomies and annotation levels necessary for text mining and for the identification of particular types of discourse elements? or, more generally: How do these different perspectives all relate to a central theory of discourse? The workshop aims to be a forum for discussion of these exciting questions. During the panel discussion time, we wish to summarize the state of the art and brainstorm on areas for development pertaining to the three main workshop topics: Exploiting Discourse Structure, Detecting Discourse Elements, and Taxonomies and Annotation. We greatly look forward to seeing you in Korea! The DSSD Organising Committee: Sophia Ananiadou School of Computer Science University of Manchester, UK Antal van den Bosch Centre for Language Studies Radboud University Nijmegen, The Netherlands ?gnes S?ndor Xerox Research Europe Grenoble, France Hagit Shatkay Dept. of Computer and Information Sciences, College of Engineering University of Delaware, USA Anita de Waard Disruptive Technologies Director Elsevier Labs, USA Elsevier B.V. Registered Office: Radarweg 29, 1043 NX Amsterdam, The Netherlands, Registration No. 33156677 (The Netherlands) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 6 09:05:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jun 2012 11:05:39 +0200 Subject: Appel: Linguistique de corpus a l'heure de la confrontation entre concepts, techniques et applications Message-ID: Date: Wed, 6 Jun 2012 10:16:51 +0200 (CEST) From: "sandra.augendre" Message-ID: <50697309.10432.1338970611212.JavaMail.www at wwinf2210> DEUXI?ME APPEL ? COMMUNICATIONS La linguistique de corpus ? l?heure de la confrontation entre concepts, techniques et applications 14-15 d?cembre 2012 Universit? Bordeaux 3 ? EA 4195 TELEM ? UMR 5263 CLLE-ERSS?B https://sites.google.com/site/corpus2012bordeaux3/ Date limite de r?ception des propositions : 20 juin 2012 Langues de communication : fran?ais, anglais Ce colloque sera centr? autour de trois th?mes : A. comment coder les ?l?ments discursifs ? l??crit et ? l?oral ? quelles convergences, quelles divergences dans le codage de l??crit et de l?oral ? Les logiciels d?annotation des corpus ?crits sont d?j? anciens et ils ne permettent pas toujours d?aboutir ? un balisage robuste ; il reste donc un certain nombre de probl?mes que l?on ne sait pas r?soudre, tout en entrevoyant une solution (traitement du discours). L?annotation des corpus oraux est plus r?cente et pose encore de tr?s nombreux probl?mes : on peut parfois s?appuyer sur les solutions envisag?es pour l??crit parce que l?oral partage certaines propri?t?s avec l??crit. Mais les dissemblances entre oral et ?crit sont aussi tr?s pr?gnantes : corr?lation syntaxe / prosodie pour l?oral, cin?tique de l?oral (l?oral se structure en se produisant), opposition oral monologal / oral dialogal, etc. Cela entra?ne de grandes diff?rences avec l?annotation de l??crit. Nous nous confronterons ? trois questions : comment traiter les ph?nom?nes discursifs ? comment caract?riser les convergences entre codage de l??crit et codage de l?oral ? comment probl?matiser et caract?riser la sp?cificit? du codage de l?oral ? B. coder la multimodalit? : enjeux et d?fis. Le codage des fichiers images et celui des vid?os pr?sentent de nombreuses particularit?s. Si le son est a priori non parsable et donc r?tif ? l?emploi de XML, il conserve toutefois des points communs (cha?ne linguistique, s?quentialit?, etc.). En revanche, l?image et l?image anim?e constituent des documents qui appellent surtout des m?tadonn?es. Comment peut-on d?s lors coder les vid?os ? Cette question en entra?ne deux autres : comment coder les aspects iconiques de l?oral ? comment lier les codages des diff?rents composants d?une vid?o ? C. de la linguistique de corpus aux digital humanities. La linguistique de corpus est de plus en plus confront?e ? des champs connexes auxquels elle est de plus en plus appel?e ? participer. Le traitement de m?tadonn?es l?expose ? un parall?lisme avec les grands projets portant sur les m?tadonn?es (par exemple, le Dublin Core). Mais elle entre aussi dans l??laboration des digital humanities, dans le fait que les Humanit?s ou SHS sont de plus en plus technologis?es, ce qui appelle au moins deux questions : ces technologies agissent-elles sur les concepts des SHS ? comment ces technologies transforment-elles les proc?dures de traitement en SHS ? Dans ce cadre, nous devrons nous confronter aux questions suivantes. Comment la linguistique de corpus peut-elle jouer un r?le ? ce niveau ? quelle part des digital humanities peut-elle assumer ? en quoi la TEI permet-elle d?articuler linguistique de corpus et digital humanities ? Frais d?inscription : universitaires ext?rieurs ? l?universit? de Bordeaux : 30 ? ?tudiants ext?rieurs ? l?Universit? de Bordeaux : 20 ? ?tudiants et personnels de l?Universit? de Bordeaux : gratuit? A compter du 1/10/2012 : universitaires ext?rieurs ? l?universit? de Bordeaux : 50 ? ?tudiants ext?rieurs ? l?Universit? de Bordeaux : 30 ? MODALIT?S DE SOUMISSION D?UNE COMMUNICATION. Envoyer deux fichiers au format pdf ? l?adresse suivante : colloque.corpus.bx3 at gmail.com Le premier fichier comportera le nom du ou des auteurs de la communication, le titre de la communication et le th?me concern? (A, B ou C) du colloque. Le second fichier comportera le titre de la communication, le th?me du colloque concern? et un r?sum? de deux pages maximum comportant une bibliographie. Le(s) nom(s) du/des auteur(s) ne pourra/pourront appara?tre dans ce fichier que dans la bibliographie. COMIT? SCIENTIFIQUE Guy ACHARD-BAYLE (Univ. de Lorraine & CREM EA 3476), Philippe BLACHE (Aix-Marseille & LPL UMR 7309), Lou BURNARD (Oxford & TGE Adonis), Paul CAPPEAU (Poitiers & FoReLL EA 3816), Thierry CHANIER (Clermont 2 & LRL EA 999), Ray COOKE (Bordeaux ? Victor Segalen), C?cile FABRE (Toulouse 2, CLLE-ERSS UMR 5263), Evelyne JACQUEY (Univ. de Lorraine & ATILF UMR 7118), Marie-No?lle LAMY (Open University & CREET), Beno?t LE BLANC (ENSC-IPB & UMR 5218), Damon MAYAFFRE (Nice-Sophia Antipolis & BCL UMR 7320), Sylvie MELLET (Nice-Sophia Antipolis & BCL UMR 7320), Lorenza MONDADA (B?le & ICAR UMR 5191), Sophie ROSSET (LIMSI UPR 3251), V?ronique TRAVERSO (ICAR UMR 5191), Agn?s TUTIN (Grenoble 3 & LIDILEM EA 609), Jean-Marie VIPREY (Univ. de Franche-Comt? & ELLIADD EA 4661) COMIT? D?ORGANISATION Sandrine AGUERRE, Sandra AUGENDRE, Jean-Luc BERGEY, Gilles BOY?, Jean-S?bastien BRILLEAUD, Marie-Odile HIDDEN, Anna KUP??, Catherine MATHON, NGUYEN Van Toan, Christelle ROUET-DELARUE, Henri PORTINE CALENDRIER Mi-juin : ouverture des inscriptions au colloque 20 juin : date limite de r?ception des propositions de communication 15 septembre : envoi des r?ponses aux auteurs des propositions 14 & 15 d?cembre : colloque Contact pour information : Henri.Portine at u-bordeaux3.fr ------------------------------------------------------------------------ CALL FOR PAPERS Corpus Linguistics: How to bind concepts, technique and application? 14th ? 15th December 2012 Universit? Bordeaux3 ? EA TELEM ? UMR 5263 CLLE-ERSS?B https://sites.google.com/site/corpus2012bordeaux3/ Proposal submission deadline: 20th June 2012 Languages: French, English This conference will focus on three topics: A. how to encode discursive features in written and oral corpora? what are the convergences and divergences between encoding written and oral corpora? Software for encoding written corpora have existed for quite a long time and do not always produce a robust tagging. There are still a number of problems that cannot be solved, even though we can foresee solutions (discursive features). Oral corpora tagging is more recent and still presents numerous problems. It is sometimes possible to fall back on solutions worked out for written corpora, because oral language shares some characteristics with written language. But differences between oral and written communication are also significant: correlation between syntax and prosody for oral language, kinetics of the oral language (it is structured as it is being produced), opposition between monologal and dialogical oral language, etc. This means that there are important differences between oral and written tagging. Three questions arise: how to process discursive features? how to characterize the convergences between oral corpus tagging and written corpus tagging? how to characterize and address oral tagging specificities? B. tagging multimodality: issues and challenges Image and video tagging is quite particular. Even though sound a priori cannot be parsed, and therefore resists the use of XML, it still presents similarities with written language? (linguistic chain, sequentiality, etc.). However, images and videos are documents that imply metadata. Consequently, how to tag videos? This question leads to two more questions: how to tag iconic aspects of oral language? and how to match the different types of tagging of a video? C. from Corpus Linguistics to Digital Humanities Corpus Linguistics more and more faces connected fields that needs to be involved in. Its processing of metadata means that it is compared to other projects dealing with metadata (such as Dublin Core Metadata Initiative). Corpus Linguistics also participates in the design of Digital Humanities, since Humanities and Social Sciences become more and more technical, which leads to two questions at least: does technology influence concepts in this field. How does technology transform data processing in this field? Within this framework, we must address the following questions: how can Corpus Linguistics play a part at this level? what part of digital humanities can Corpus Linguistics take in charge? how can TEI be used to connect Corpus Linguistics and digital humanities? Registration fee: Academics: 30? Students: 20 ?From 01/10/2012: Academics: 50? Students: 30 ? SUBMISSION GUIDELINES Send two files in PDF to the following address: Colloque.Corpus.bx3 at gmail.com First file?s content will be: author?s or authors? name(s), title of paper and relevant conference topic (A, B or C). Second file?s content will be: title of paper, relevant conference topic, and summary (two pages maximum, biography included). Authors? names cannot appear on this file. SCIENTIFIC COMMITTEE Guy ACHARD-BAYLE (Univ. de Lorraine & CREM EA 3476), Philippe BLACHE (Aix-Marseille & LPL UMR 7309), Lou BURNARD (Oxford & TGE Adonis), Paul CAPPEAU (Poitiers & FoReLL EA 3816), Thierry CHANIER (Clermont 2 & LRL EA 999), Ray COOKE (Bordeaux ? Victor Segalen), C?cile FABRE (Toulouse 2, CLLE-ERSS UMR 5263), Evelyne JACQUEY (Univ. de Lorraine & ATILF UMR 7118), Marie-No?lle LAMY (Open University & CREET), Beno?t LE BLANC (ENSC-IPB & UMR 5218), Damon MAYAFFRE (Nice-Sophia Antipolis & BCL UMR 7320), Sylvie MELLET (Nice-Sophia Antipolis & BCL UMR 7320), Lorenza MONDADA (B?le & ICAR UMR 5191), Sophie ROSSET (LIMSI UPR 3251), V?ronique TRAVERSO (ICAR UMR 5191), Agn?s TUTIN (Grenoble 3 & LIDILEM EA 609), Jean-Marie VIPREY (Univ. de Franche-Comt? & ELLIADD EA 4661) ORGANISING COMMITTEE Sandrine AGUERRE, Sandra AUGENDRE, Jean-Luc BERGEY, Gilles BOY?, Jean-S?bastien BRILLEAUD, Marie-Odile HIDDEN, Anna KUP??, Catherine MATHON, NGUYEN Van Toan, Christelle ROUET-DELARUE, Henri PORTINE KEY DATES Mid-June: registration opens 20th June: deadline for submissions 15th September: notification 14th ? 15th December: Conference. Contact for information: Henri.Portine at u-bordeaux3.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 19:15:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 21:15:48 +0200 Subject: Job: Working with Watson, Postdoc positions available at TrentoRise (Italy) Message-ID: Date: Wed, 6 Jun 2012 11:42:13 +0200 From: Alessandro Moschitti Message-Id: <07191D1A-7C2D-4C4F-8863-45F9DAFAC624 at disi.unitn.it> X-url: http://hlt.fbk.eu/en/home Dear candidate, have you been fascinated by the IBM Watson system's achievements? Have you ever thought that you could contribute to it? If yes, there might be two great opportunities for this. TWO Post-doctoral positions for 1 year (with the possibility of extension) are available at the new IBM Language and Knowledge Center for Advanced Studies of TrentoRise - Italy (TrentoRise is a joint research institution including the University of Trento, FBK and other important research institutions of Trento) Position 1: Information Extraction and Question Answering (Ref.Code IBM_PostDoc2012_IEQA) This grant aims at developing a framework for Information Extraction and Retrieval based on deep linguistic analysis. The main idea of the framework is to provide a flexible pipeline of NLP and IR components, which can be used to model state-of-the-art systems, e.g., in the field of Question Answering. Candidate Profile: the candidate must hold a PhD in Computer Science, e.g., Computational Linguistics, Natural Language Processing, Information Retrieval or equivalent, and should be familiar with or willing to learn the following topics: - UIMA (Unstructured Information Management Architecture); - Named Entity Recognition & Normalization / Concept Segmentation and Labeling - Relation Extraction; - Question interpretation, answer classification and extraction - Dependency-based parsing, practice and theory - Semantic role labeling - Question analysis - Search engine design - Text Categorization/Filtering - Document/passage ranking and re-ranking using different sources - Indexing, search and retrieval for unstructured, semi-structured and structured data - Retrieval models for Question Answering - Relational models for sentence, paragraph and document representation Programming skills are important whereas knowledge of the Italian language is not required. Scientific tutors: Bernardo Magnini (FBK, Trento - http://hlt.fbk.eu/en/home) Alessandro Moschitti (University of Trento - http://disi.unitn.it/moschitti/ - http://projects.disi.unitn.it/iKernels/) Position 2: Machine Learning for NLP (Ref.Code IBM_PostDoc2012_LSM) This grant aims at modeling and implementing a machine learning framework, which can be applied for fast system prototyping. Kernel methods are seen as a viable approach to automatic feature engineering, which is a severe bottleneck for the design of real-world applications. The other interesting problem that will be studied concerns domain adaptation. Although the framework is supposed to be general, its primary application domain will be natural language processing. Candidate Profile: the candidate must hold a PhD in Computer Science, e.g., Machine Learning, Computational Linguistics, Natural Language Processing, data mining or equivalent and should be familiar with most of the following topics: - Discriminative models, including Support Vector Machines and other Max-Margin approaches, for tagging, extraction, (shallow) parsing and so on. - Advanced data representation through Kernel Methods and Kernel Machines - Online learning and Active Learning - Supervised, Semi-Supervised, Unsupervised Learning, Domain Adaptation, Multi-task Learning in NLP - Sequence labeling in NLP - Relational Learning - Graphical models, e.g., Conditional Random Fields and LDA, are a plus Scientific tutor: Alessandro Moschitti (University of Trento - http://disi.unitn.it/moschitti/ - http://projects.disi.unitn.it/iKernels/) Prof. Moschitti has been collaborating with the IBM Watson team since 2009. He has received two awards from IBM. The postdocs (if successful in their research) will have the possibility to collaborate with the IBM Watson team and carrying out working stage at IBM Watson of NY. You can directly apply to http://www.trentorise.eu/call-for-participation/bando-di-selezione-call-positions If you want to know more, please send an email to moschitti at disi.unitn.it subject: IBM-POSTDOCS2012 salary net per month: 2k euros The deadline for applications is June 30, 2012 (please note that the deadline indicated in the website above is going to be updated). Your curriculum must show an appropriate record of publications in the areas of ML, NLP/CL or IR. Best Alessandro ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 19:18:10 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 21:18:10 +0200 Subject: Conf: ACL 2012 Joint Workshop SP-Sem-MRL, July 12, 2012, Jeju, Korea Message-ID: Date: Wed, 6 Jun 2012 12:47:15 +0200 From: Marianna Apidianaki Message-Id: <22E56F91-6EF5-490B-BB23-BB9218582C8C at limsi.fr> ** Apologies for multiple postings ** ======================= CALL FOR PARTICIPATION ======================= ACL 2012 Joint Workshop on Statistical Parsing and Semantic Processing of Morphologically-Rich Languages (SP-Sem-MRL 2012) Endorsed by SIGLEX, SIGPARSE and the EU's PASCAL Network of Excellence July 12, 2012 - Jeju, Republic of Korea Registration: http://www.acl2012.org/registration/sub01.asp ------------------------------------------------------------------------ The joint workshop on Statistical Parsing and Semantic Processing of Morphologically Rich Languages (SP-Sem-MRL 2012) aims to build upon the successful first and second SPMRL workshops while extending the overall scope to include semantic processing where MRLs pose challenges for algorithms or models initially designed to process English. In statistical parsing, which has been a cornerstone of research in NLP and has seen great advances due to the widespread availability of syntactically annotated corpora, English parsing performance has reached a high plateau in certain genres, which is however not always indicative of parsing performance in MRLs, dependency-based and constituency-based alike. Semantic processing of natural language has similarly seen much progress in recent years. However, as in parsing, the bulk of the work has concentrated on English, and MRLs present challenges that the community is as of yet unaware of, and which current semantic processing technologies have difficulty coping with. These challenges may lurk in areas where parses are used as input, or where inadequate pre-processing of morphological variation hurts parsing and semantic tasks alike. The goal of this workshop is to encourage cross-fertilization among researchers working on different Morphologically Rich Languages and among those working on different levels of processing. The panel session of the workshop will be devoted to disclosing the data sets and evaluation procedures for the cross-linguistic cross-framework SPMRL 2013 Shared Task. Researchers who are interested in participating in the shared task are encouraged to attend the session and contribute to the discussion. For more information: https://sites.google.com/site/spsemmrl2012/ ** We are pleased to announce financial support in workshop registration fees for students, through the generous sponsorship of PASCAL Network of Excellence.** KEYNOTE SPEAKERS -------------------------------- Pr. Mark Steedman (University of Edinburgh) Title: Parsing with Case, Coordination, and Free Word-Order Ivan Titov (Saarland University) Title: Monolingual and Crosslingual Unsupervised Induction of Shallow Semantic Representations ACCEPTED PAPERS ------------------------------- ASSIGNING DEEP LEXICAL TYPES USING STRUCTURED CLASSIFIER FEATURES FOR GRAMMATICAL DEPENDENCIES Jo?o Silva and Ant?nio Branco BUILDING AN ARABIC MULTIWORD EXPRESSIONS REPOSITORY Abdelati Hawwari, Kfir Bar and Mona Diab COMBINING RULE-BASED AND STATISTICAL SYNTACTIC ANALYZERS Iakes Goenaga, Koldobika Gojenola, Mar?a Jes?s Aranzabe, Arantza D?az de Ilarraza and Kepa Bengoetxea GENERATIVE CONSTITUENT PARSING AND DISCRIMINATIVE DEPENDENCY RERANKING: EXPERIMENTS ON ENGLISH AND FRENCH Joseph Le Roux, Benoit Favre, Alexis Nasr and Seyed Abolghasem Mirroshandel KOREAN TREEBANK TRANSFORMATION FOR PARSER TRAINING DongHyun Choi, Jungyeul Park and Key-Sun Choi MACHINE LEARNING OF SYNTACTIC ATTACHMENT FROM MORPHOSYNTACTIC AND SEMANTIC CO-OCCURRENCE STATISTICS Szymon Aceda?ski, Adam Slaski and Adam Przepi?rkowski PROBABILISTIC LEXICAL GENERALIZATION FOR FRENCH DEPENDENCY PARSING Enrique Henestroza Anguiano and Marie Candito STATISTICAL PARSING OF SPANISH AND DATA DRIVEN LEMMATIZATION Joseph Le Roux, Benoit Sagot and Djam? Seddah SUPERVISED LEARNING OF GERMAN QUALIA RELATIONS Yannick Versley UNSUPERVISED FRAME BASED SEMANTIC ROLE INDUCTION: APPLICATION TO FRENCH AND ENGLISH Alejandra Lorenzo and Christophe Cerisara USING AN SVM ENSEMBLE SYSTEM FOR IMPROVED TAMIL DEPENDENCY PARSING Nathan Green, Loganathan Ramasamy and Zden?k ?abokrtsk? USING SYNTHETIC COMPOUNDS FOR WORD SENSE DISCRIMINATION Yannick Versley and Verena Henrich ORGANIZING COMMITTEE --------------------------------------- General chairs: Marianna Apidianaki (LIMSI-CNRS, France) Ido Dagan (Bar-Ilan University, Israel) Jennifer Foster (Dublin City University, Ireland) Yuval Marton (IBM Watson Research Center, US) Djam? Seddah (University of Paris 4, France) Reut Tsarfaty (Uppsala University, Sweden) Shared session chairs: Katrin Erk (University of Texas at Austin, US) Ines Rehbein (University of Potsdam, Germany) Peter Turney (National Research Council, Canada) Yannick Versley (University of Tuebingen, Germany) CONTACT ---------------- For any inquiries regarding the workshop please send an email to sp.sem.mrl2012 at gmail.com Website: https://sites.google.com/site/spsemmrl2012/ ENDORSMENT AND SPONSORS ------------------------------------------------ This workshop is endorsed by SIGLEX & SIGPARSE ; and sponsored by the PASCAL Network of Excellence & the INRIA's Alpage project. *********************************************************** ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 19:28:36 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 21:28:36 +0200 Subject: Job: Ingenieur en developpement d'applications Equipe SYNALP (CDD 3 mois), LORIA Nancy Message-ID: Date: Wed, 6 Jun 2012 13:45:44 +0200 From: Claire Gardent Message-ID: X-url: http://talc.loria.fr/ALLEGRO-Nancy,254.html *Offre d'Emploi : Ing?nieur en d?veloppement d'applications Equipe SYNALP, LORIA Nancy (CDD 3 mois) * *Contexte* Le projet Allegro (http://talc.loria.fr/ALLEGRO-Nancy,254.html) est un projet financ? par l?Union Europ?enne qui vise ? proposer de nouvelles technologies permettant de faciliter l?apprentissage du fran?ais langue ?trang?re. Au sein de ce projet, l'?quipe Synalp a d?velopp? un jeu s?rieux interfa?ant un g?n?rateur automatique d'exercices de grammaire avec un univers virtuel. Dans ce jeu (I-FLEG), l'apprenant marque des points en compl?tant des exercices de grammaires. *Mission* L'ing?nieur recrut? aura pour mission de d?velopper un service web permettant d'?diter les ressources linguistiques (lexiques) utilis?es par le jeu I-FLEG. Les ressources linguistiques sont stock?es dans une base de donn?es MySQL. Le service web d?velopp? devra permettre l'?dition de ces ressources sous une forme interactive et collaborative. *Comp?tences et profil* Languages de programmation: Javascript and SQL Excellente connaissance des technologies du Web: PHP, GWT, JSP, Rails, Grails, etc Formation en informatique et connaissance du d?veloppement logiciel et des outils associ?s (gestionnaire de versions, etc.) Comp?tences ou aptitudes appr?ci?es: TAL, Experience avec Java Ma?trise du syst?me d'exploitation Linux Bonne facult? d'apprentissage et d'adaptation. Le go?t du travail en ?quipe. *Lieu de travail, dur?e du contrat et salaire* Adresse : LORIA Nancy, Equipe Synalp, Bat. B 615, rue du jardin botanique 54600 Villers l?s Nancy Type et dur?e : CDD 3 mois D?but : Septembre 2012 R?mun?ration : Environ 2 300 Euros brut mensuel *Comment postuler* Envoyer CV et lettre de motivation ? claire.gardent at loria.fr le plus rapidement possible Claire Gardent, Directrice de Recherche CNRS http://www.loria.fr/~gardent ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 19:45:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 21:45:26 +0200 Subject: Revue: RFLA XVII-1 / Langue parlee, norme et variations Message-ID: Date: Wed, 06 Jun 2012 16:11:45 +0200 From: Rfla Message-ID: <0513a292016df95e862c73fddd2aa4a0 at mwinf5d68.me-wanadoo.net> X-url: http://www.rfla-journal.org/ X-url: http://www.cairn.info/revue-francaise-de-linguistique-appliquee.htm ________________________________________________________________________ Revue Fran?aise de Linguistique Appliqu?e - volume XVII-1 / juin 2012 Langue parl?e : norme et variation Les r?sum?s des articles, ainsi que des informations sur les num?ros d?j? parus, sont disponibles sur le site de la revue : http://www.rfla-journal.org Les articles des diff?rents num?ros depuis 2001 sont accessibles en ligne sur le portail CAIRN : http://www.cairn.info/revue-francaise-de-linguistique-appliquee.htm Sommaire Pr?sentation. Langue parl?e : norme et variations (p. 5) Julien Eychenne (Groningen, Pays-Bas) & Bernard Laks (Paris Ouest Nanterre) Le programme Phonologie du Fran?ais Contemporain : bilan et perspectives (p. 7) Jacques Durand & Anne Przewozny (Toulouse-Le Mirail) (p. 25) La phonologie de l?anglais contemporain : usages, vari?t?s et structure Fran?oise Gadet (Paris Ouest Nanterre), Ralph Ludwig (Halle, Allemagne), Lorenza Mondada (Basel, Suisse), Stefan Pf?nder (Freiburg, Allemagne) & Anne-Catherine Simon (Louvain-la-Neuve, Belgique) Un grand corpus de fran?ais parl? : le CIEL-F. Choix ?pist?mologiques et r?alisations empiriques (p. 39) H?l?ne Blondeau (Gainesville, USA) Hors de LA norme point de salut ? La piste montr?alaise de la variation des hypoth?tiques en si (p. 55) Juana Gil Fern?ndez (CSIC, Madrid) L?enseignement de la prononciation : rapport entre th?orie et pratique (p. 75) Sylvain Detey (Waseda, Japon) & Isabelle Racine (ELCF, Gen?ve) Les apprenants de fran?ais face aux normes de prononciation : Quelle(s) entr?e(s) pour quelle(s) sortie(s) ? (p. 81) Philippe Boula de Mare?il, Albert Rilliard & Alexandre Allauzen (LIMSI-CNRS) Variation diachronique dans le style journalistique : le cas de l?accent initial (p. 97) Martine Adda-Decker (Paris 3-LPP), Elisabeth Delais-Roussarie (Paris-Diderot-LFF), C?cile Fougeron (Paris 3-LPP), C?dric Gendrot (Paris 3-LPP) & Lori Lamel (LIMS-CNRS) La liaison dans la parole spontan?e famili?re : une ?tude sur grand corpus (p. 113) Comptes rendus E. Putska, Einf?hrung in die Phonetik und Phonologie des Franz?sischen C. Salmon, Cent ans de fran?ais cadien en Louisiane. Etude sociolinguistique du parler des femmes F. Martineau & T. Nadasdi, Le fran?ais en contact. Hommages ? Raymond Mougeon S. Garnier & A.D. Savage, R?diger un texte acad?mique en fran?ais D. Luzzati, Le fran?ais et son orthographe J. Humbley & O. Torres Vera, La traduction trilingue. Traduire du fran?ais vers l?anglais et l?espagnol HEL, volume 33-1 (2011), Linguistique appliqu?e et disciplinarisation R. Celi Pereira & P. Roca, Linguistica aplicada : un caminho com diferentes acessos C.Michel & M.-L. Nosh, Textile Terminologies in the Ancient Near East and Mediterranean from the Third to the First millennia BC Le num?ro est en vente au tarif de 25 ? (+ 4 ? de frais d?envoi). Pour se le procurer, s?adresser ? : Publications Linguistiques, secr?tariat administratif, 15 rue Lakanal, 75015 Paris publiling at wanadoo.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:03:02 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:03:02 +0200 Subject: Conf: ACL 2012 3rd Workshop WASSA2012, Jul 12, 2012, Jeju, Korea Message-ID: Date: Wed, 06 Jun 2012 16:34:05 +0200 From: Alexandra Balahur Dobrescu Message-id: <4FCF6A5D.10901 at jrc.ec.europa.eu> X-url: http://gplsi.dlsi.ua.es/congresos/wassa2012/fitxers/WASSA_Program.pdf X-url: http://gplsi.dlsi.ua.es/congresos/wassa2012/ [Apologies for cross-postings. Please distribute. ] The workshop program is now available at: http://gplsi.dlsi.ua.es/congresos/wassa2012/fitxers/WASSA_Program.pdf ************************************************************************ 3rd Workshop on Computational Approaches to Subjectivity and Sentiment Analysis (WASSA 2012) - http://gplsi.dlsi.ua.es/congresos/wassa2012/ ************************************************************************ ************************************************************************ - Satellite workshop to ACL 2012 (Jeju, Korea) - Endorsed by SIGLEX, SIGNLL and SIGSEM - The best papers will be chosen for a Special Issue of the Computer Speech and Language Journal (Elsevier). - Subsequent to the WASSA 2012 acceptance notification, we will also launch an open call for papers for a Special Issue of the Information Sciences Journal (Elsevier). ************************************************************************ AIM OF WORKSHOP Research in automatic Subjectivity and Sentiment Analysis, as subtasks in Affective Computing within Natural Language Processing, has flourished in the past years, as the Social Web made it possible for people all over the world to express, comment or consult opinions on any given topic. The fact that so many people express themselves on these topics makes opinions less biased and more credible; their subjective nature makes them easily understandable by all people and leads to their growing influence on communities worldwide. Due to all these reasons, opinions expressed on the Web are more and more considered as basis for decision-making processes, for recommendation systems, business intelligence processes, image monitoring, and marketing or for obtaining unbiased, massive feedback. In spite of the growing body of research in the area in the past years, dealing with affective phenomena in text has proven to be a complex, interdisciplinary problem that remains far from being solved. Its challenges include the need to address the issue from different perspectives and at different levels, depending on the characteristics of the textual genre, the language(s) treated and the final application for which the analysis is done. Bearing in mind the abovementioned reflections, the aim of the 3rd Workshop on Computational Approaches to Subjectivity and Sentiment Analysis (WASSA 2012) is to continue the line of the previous two editions, bringing together researchers in Computational Linguistics working on Subjectivity and Sentiment Analysis and, more generally, on affect in text. Moreover, taking into account that affect-related phenomena have also been studied by other disciplines, such as Psychology, Philosophy or Economics, the purpose of WASSA 2012 is to facilitate an interdisciplinary dialogue on the analysis, requirements, issues and applications of the study of subjectivity and sentiment in the context of traditional and emerging text types. We envisage WASSA as a forum to discuss the achievements obtained so far and to analyse the different approaches to tackle the difficulties researchers are confronted with in this research area. ************************************************************************ TOPICS OF INTEREST Inspired by the objectives we aimed at in the first two editions of the Workshop on Computational Approaches to Subjectivity Analysis (WASSA 2010 and WASSA 2.011) and the final outcome, the purpose of the proposed 3rd edition of the Workshop on Computational Approaches to Subjectivity and Sentiment Analysis (WASSA 2012) is to create a framework for presenting and discussing the challenges related to subjectivity and sentiment analysis in NLP, from an interdisciplinary theoretical and practical perspective. Researchers are encouraged to submit papers including, but not restricted to the following topics related to subjectivity and sentiment analysis: . Lexical semantic resources, corpora and annotations for subjectivity and sentiment analysis . Subjectivity and opinion retrieval, extraction, categorization, aggregation and summarization . Topic and sentiment studies and applications of topic-sentiment analysis . Mass opinion estimation based on NLP and statistical models. . Domain, topic and genre dependency of sentiment analysis . Ambiguity issues and word sense disambiguation of subjective language . The computational treatment of large amounts of user-generated content . Pragmatic analysis of the opinion mining task . Use of Semantic Web technologies for subjectivity and sentiment analysis . Improvement of NLP tasks using subjectivity and/or sentiment analysis . Intrinsic and extrinsic evaluation methodologies for subjectivity and sentiment analysis . Subjectivity, sentiment and emotion detection in social networks . Trend detection in social media using subjectivity and sentiment analysis techniques . Classification of stance in dialogues . Real-world applications of opinion mining systems We will also encourage participants to provide demos of their systems, thus giving them the opportunity to obtain feedback on their achievements and issues. At the same time, with the help of demos, we aim at enriching the discussion forum with application-specific topics for debate. ************************************************************************ ORGANIZERS . Alexandra Balahur -- European Commission Joint Research Centre, Italy -- alexandra.balahur at jrc.ec.europa.eu . Andr?s Montoyo - University of Alicante, Spain -- montoyo at dlsi.ua.es . Patricio Mart?nez-Barco - University of Alicante, Spain - patricio at dlsi.ua.es . Ester Boldrini - University of Alicante, Spain - eboldrini at dlsi.ua.es ************************************************************************ PROGRAM COMMITTEE . Khurshid Ahmad -- Trinity College Dublin, Ireland . Sivaji Bandyopadhyay - Jadavpur University, India . Nicoletta Calzolari - CNR Pisa, Italy . Erik Cambria -- University of Stirling, U.K. . Jos? Carlos Cortizo - European University Madrid, Spain . Michael Gamon -- Microsoft . Jes?s M. Hermida - University of Alicante, Spain . Veronique Hoste - University of Ghent, Belgium . Mijail Kabadjov -- Vicomtech, Spain . Zornitsa Kozareva - Information Sciences Institute California, U.S.A. . Rada Mihalcea - University of North Texas, U.S.A. . Saif Mohammad - National Research Council, Canada . Karo Moilanen -- Oxford University, U.K. . Rafael Mu?oz - University of Alicante, Spain . G?nter Neumann - DFKI, Germany . Alena Neviarouskaia -- University of Tokyo, Japan . Manabu Okumura -- Tokyo Institute of Technology, Japan . Constantin Orasan - University of Wolverhampton, U.K. . Manuel Palomar - University of Alicante, Spain . Viktor Pekar - University of Wolverhampton, U.K. . Paolo Rosso - Technical University of Valencia, Spain . Josef Steinberger -- EC- Joint Research Centre, Italy . Ralf Steinberger - EC- Joint Research Centre, Italy . Veselin Stoyanov -- John Hopkins University, U.S.A. . Maite Taboada - Simon Fraser University, Canada . Mike Thelwall - University of Wolverhampton, U.K. . Jos? Antonio Troyano - University of Seville, Spain . Dan Tufis - RACAI, Romania . Alfonso Ure?a -- University of Ja?n, Spain . Erik van der Goot -- EC Joint Research Centre, Italy . Piek Vossen - Vrije Universiteit Amsterdam, The Netherlands . Marilyn Walker - University of California Santa Cruz, U.S.A. . Janyce Wiebe - University of Pittsburgh, U.S.A. . Michael Wiegand -- Saarland University, Germany . Theresa Wilson -- John Hopkins University, U.S.A. . Taras Zagibalov - Brantwatch, U.K. ************************************************************************ INVITED SPEAKERS . Prof. Dr. Rada Mihalcea -- University of North Texas, U.S.A. . Prof. Dr. Janyce Wiebe -- University of Pittsburgh, U.S.A. ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:07:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:07:05 +0200 Subject: Appel: Revue TAL, Gestion des erreurs en traitement automatique des langues Message-ID: Date: Wed, 06 Jun 2012 11:08:41 -0400 From: Francois Yvon Message-ID: <4FCF7279.2030002 at limsi.fr> X-url: http://tal-53-3.sciencesconf.org/ X-url: http://www.atala.org/-Revue-TAL [Nos excuses pour les envois multiples] PREMIER APPEL ? CONTRIBUTIONS DU BRUIT DANS LE SIGNAL : GESTION DES ERREURS EN TRAITEMENT AUTOMATIQUE DES LANGUES UN NUM?RO SP?CIAL DE LA REVUE 'TRAITEMENT AUTOMATIQUE DES LANGUES' (TAL) La langue que les applications de traitement automatique des langues ont ? traiter ressemble assez peu aux exemples parfaitement grammaticaux que l'on rencontre dans les livres de grammaire. Dans l'usage quotidien, les ?nonc?s ? traiter se pr?sentent sous une forme imparfaite : les textes dactylographi?s contiennent des erreurs de saisie, ainsi que de fautes d'orthographe et de grammaire ; les ?nonc?s oraux correspondent souvent ? des phrases incompl?tes et contiennent des disfluences; les sorties des syst?mes d'OCR contiennent de multiples confusion entre caract?res, et celles des syst?mes de reconnaissance vocale contiennent des transcriptions inexactes de ce qui a r?ellement ?t? prononc?. Le bruit est donc inh?rent au donn?es langagi?res et ignorer cette r?alit? ne peut que nuire ? la qualit? de nos syst?mes de traitement. Pour certaines applications, l'enjeu est de d?velopper des m?canismes robustes vis-?-vis de ces erreurs. Par exemple, un syst?me de dialogue pourra utiliser des mesures de confiance portant sur les hypoth?ses de reconnaissance vocale pour d?cider s'il doit demander ? l'utilisateur de r?p?ter. Pour d'autres applications, il sera n?cessaire de faire appel ? des techniques de correction automatique des erreurs; ainsi, par exemple, un syst?me d'OCR pourra post-traiter les textes avec des mod?les de correction contextuels pour valider l'orthographe des mots. Ce num?ro sp?cial vise ? rassembler des contributions portant sur la gestion des erreurs en traitement des langues. De nombreux sous-domaines du TAL ont besoin de prendre en compte le bruit et les erreurs dans les signaux linguistiques qu'ils consid?rent, mais il est rare que des chercheurs issus de ces diverses communaut?s aient l'occasion de comparer leurs m?thodes et leurs r?sultats. Notre ambition est de mettre en perspective des travaux issus de ces diff?rents domaines de mani?re ? encourager la fertilisation crois?e des id?es. Pour ce num?ro sp?cial, nous consid?rons donc comme pertinent tout travail touchant au traitement automatique de donn?es bruit?es. Les sous-domaines les plus d?velopp?s sont probablement la correction orthographique, et, dans une moindre mesure, la correction grammaticale; aucun de ces probl?mes n'est pourtant compl?tement r?solu, et la situation est encore moins satisfaisante quand on consid?re des erreurs plus profondes, touchant par exemple au style ou ? l'organisation du discours. Les traitements robustes, qui visent ? extraire le maximum d'informations utiles d'entr?es potentiellement erron?es, seront aussi favorablement consid?r?s, que ces entr?es se pr?sentent sous forme ?crite ou orale ; plus g?n?ralement, les ?tudes portant sur les strat?gies de r?paration d'erreur, par exemple dans les syst?mes de dialogue ou d'autres syst?mes analogues, sont ?galement pertinentes pour ce num?ro. Nous invitons donc les contributions portant sur tout aspect relatif au traitement des erreurs en TAL, et en particulier (liste non exclusive): * correction automatique de l'orthographe et de la grammaire * erreurs s?mantiques et logiques * correction d'erreurs dans le style ou l'organisation du discours * correction d'erreurs "artificielles" (OCR, reconnaissance vocale, etc.) * correction automatique de requ?tes ? des moteurs de recherche * acquisition, annotation et analyse d'erreurs dans les textes r?els * corpus d'erreurs * traitement des erreurs dans les langages contr?l?s ***** * erreurs en apprentissage des langues * erreurs de performance * normalisation d'?crits non standards * TAL robuste * traitement de parole disfluente * traitement des erreurs en reconnaissance vocale * apprendre avec des donn?es bruit?es * mesures de la gravit? des erreurs * mesures de confiance * fouille et analyse d'erreurs * auto-?valuation et diagnostic d'erreurs ?DITEURS INVIT?S - Robert Dale (Macquarie University, Australia) - Fran?ois Yvon (LIMSI/CNRS and Univ. Paris Sud, France) COMIT? SCIENTIFIQUE (TBA) DATES IMPORTANTES - soumission des contributions : 15 octobre 2012 - premi?re notification aux auteurs : 15 d?cembre 2012 - date limite pour les versions r?vis?es : 1er f?vrier 2013 - d?cisions finales : 15 avril 2013 - versions finales : 15 juin 2013 - publication : ?t? 2013 LE JOURNAL Depuis 40 ans, TAL (Traitement Automatique des Langues) est un journal international publi? par l'ATALA (Association pour le Traitement Automatique des Langues) avec le soutien du CNRS. Depuis quelques ann?es, il s'agit d'un journal en ligne, des versions papier pouvant ?tre obtenues sur commande. Ceci n'affecte en rien le processus de relecture et de s?lection. INFORMATIONS PRATIQUES Les articles (25 pages environ, format PDF) doivent ?tre d?pos?s sur la plateforme http://tal-53-3.sciencesconf.org/ Les feuilles de style sont disponibles sur le site web du journal (http://www.atala.org/-Revue-TAL). Le journal ne publie que des contributions originales, en fran?ais ou en anglais. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:12:33 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:12:33 +0200 Subject: Conf: Colloque sur l'annotation du fran=?ISO-8859-1?Q?=E7ais_?=parle, Paris, 19-21 juin 2012 Message-ID: Date: Wed, 6 Jun 2012 18:14:16 +0200 From: Sylvain Kahane Message-Id: <8579F6B2-F39D-44FD-8A8A-734FE40D6BDA at kahane.fr> Ce colloque de trois jours est organis? par Anne Lacheret, Sylvain Kahane et Paola Pietrandrea pour la cloture du projet ANR Rhapsodie commenc? en 2008. L'objectif de ce projet est l'?tude de l'intonosyntaxe du fran?ais parl?. Un corpus tr?s richement annot?, le treebank Rhapsodie, sera pr?sent? pendant les journ?es et mis en ligne ? l'issu des journ?es (je vous enverrai un message quand ?a sera en ligne). Il s'agit de 3h de parole (33 000 mots), form?s d'une cinquantaine d'?chantillons vari?s, avec pour la prosodie annotations des pro?minences, structure prosodique arborescente, contours prosodiques simplifi?s et pour la syntaxe, annotation morphosyntaxique, microsyntaxique en d?pendance et annotation macrosyntaxique. L'ensemble du corpus est annot?, y compris les portions disfluentes. Le corpus sera livr? avec un syst?me de requ?tes ?labor? et une interface relativement conviviale. L'ensemble du corpus, ainsi qu'une grande partie des outils, seront distribu?s librement (licence Creative Commons). Annotation syntaxique et prosodique du fran?ais parl? Autour du treebank Rhapsodie Mardi 19 juin (Paris 3 Censier, Salle Las Vergnas) Session 1 : Les livrables Rhapsodie 10h30-10h40 Anne Lacheret : Mots de bienvenu 10H40-11h10 Anne Lacheret, Sylvain Kahane, Paola Pietrandrea : Pr?sentation de la chaine de traitement : de l?annotation au corpus annot? en ligne 11h10-11h40 Arthur Truong : Premi?re d?mo du corpus en ligne 11h40-12h : Pause caf? 12h-12h20 Atanas Tchobanov : Pr?sentation du site Rhapsodie 12h20-12h40-Anne Lacheret, Sylvain Kahane, Paola Pietrandrea : Pr?sentation de l?ouvrage sur le treebank Rhapsodie 12h40-13h Paola Pietrandrea, Anne Lacheret : Corpus design et m?tadonn?es 13h-14h30 : D?jeuner Session 3 : Outils pour l?annotation prosodique 14h30-14h50 Anne Dister, Jean-Philippe Goldman : Transcription et alignement 14h50- 15h10 Bernard Victorri : Analor : p?riodes et pro?minences 15h10-15h30 Philippe Martin : Winpitch et nettoyage de la F0 15h30-15h50 : Pause caf? Session 4 : Annotation syntaxique 15h50-16h10 : Christophe Benzitoun, Fr?d?ric Sabio: Structure macrosyntaxique 16h10-16h30 : Kim Gerdes, Sylvain Kahane : Structure microsyntaxique 16h30-16h50 : Kim Gerdes : Annotation semi-automatique avec Arborator Mercredi 20 juin (Salles des conf?rences, B?t. B, Paris Ouest Nanterre) Session 5 : Annotation syntaxique (outils) 10h00-10h20 : Julie Beliao : Du balisage manuel au treebank 10h20- 10h40 : Eric de la Clergerie : Analyse syntaxique automatique avec FRMG 10h40-11h00 : Pause caf? Session 6 : Annotation prosodique 11h00-11h20 : Anne Lacheret : Le treebank prosodique de Rhapsodie 11h20-11h40 : Piet Mertens : Annotation prosodique : de la stylisation aux niveaux de hauteur et aux contours de syllabe 11h40-12h00 : Julie Beliao, Nicolas Obin : Contours globaux 12h00-12h20 : C?dric Gendrot : Dur?e des syllabes 12h20-14h00 : d?jeuner Session 7 : Treebank et interrogation 14h00-14h20 : Sylvain Kahane, Arthur Truong : Structure du treebank et de la base Rhapsodie 14h20-14h50 : Arthur Truong : Tutoriel sur le langage de requ?te 14h50-15h40 : Essai en groupe et discussion 15h40-16h00 : Pause caf? Session 8 : Exploitation du Treebank 16h00-18h00 : Requ?tage sur le Treebank par petits groupes 18h00-19h00 : Retour sur les travaux d?exploitation (10 mn par groupe) 10? Loiseau, Gerdes, Benzitoun : stats syntaxe 10? Gendrot, Lacheret, Goldman : stats proso 10? Martin, Kahane : interface micro-prosodie 10? Avanzi, Sabio : interface macro-prosodie 10? Pietrandrea, Beliao : interface prosodie-entassement Jeudi 21 juin (Salles des conf?rences, B?t. B, Paris Ouest Nanterre) Session 9 : Bilan Rhaspodie 10h00 -10h30 Jos? Deulofeu : Bilan annotation macrosyntaxique : En quoi d?coupe-t-on un texte ? 10h30- 11h00 Anne Lacheret : Annotation prosodique : bilan et perspectives 11h00-11h30 Pause 11h30-12h30 : Anne Lacheret, Sylvain Kahane, Kim Gerdes, Arthur Truong: Retour sur la chaine de traitement : les r?ussites et les erreurs ? ne pas r?p?ter 12h00-13h30 : D?jeuner Session 10 : Le futur de Rhapsodie 14h00- 14h40 : Atanas Tchobanov, Arthur Truong : Maintenance et mise ? jour du site Rhapsodie 14h40-15h00 Pause 15h00-17h00 : Table ronde : Elargissement du treebank Rhapsodie (ajouts d??chantillons, ajouts d?autres couches d?annotation, d?veloppement de la plateforme, etc.), dont discussion projet Orfeo (J.-M. Debaisieux) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:17:41 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:17:41 +0200 Subject: Job: Informaticien en Traitement Automatique des Langues, Vision Objects, Nantes Message-ID: Date: Wed, 6 Jun 2012 18:46:05 +0200 From: "Lo?s Rigouste" Message-ID: <19e47c50$610a77f5$27765cbd$@com> Vision Objects est leader mondial de la technologie de reconnaissance d'?criture avec plus de 14 millions d'utilisateurs. Disponible dans plus de 85 langues, Vision Objects couvre un large ?ventail d'applications commerciales dans les domaines de la mobilit? (smartphones[1], tablettes), de l??ducation (tableau blanc num?rique interactif), de l?entreprise (prise de notes et traitement de formulaires) et de l?automobile (pilotage de GPS par exemple). Le moteur de reconnaissance de Vision Objects se classe r?guli?rement aux premi?res places des comp?titions scientifiques internationales (cf., par exemple, ICDAR 2011). Dans le cadre de sa forte croissance, Vision Objects (Nantes, France) est ? la recherche d'un : Ing?nieur Informaticien en Traitement Automatique des Langues (TAL) Dans l'?quipe Ressources Linguistiques, et en ?troite collaboration avec l'?quipe Technologie, vous serez amen? ? coordonner le d?veloppement de nouvelles langues et ? ?tre force de proposition sur l'am?lioration de l?existant. Votre double comp?tence informatique et linguistique vous permet d?assumer avec succ?s vos diff?rentes missions : - Cr?ation et maintenance des ressources linguistiques et gestion de leur int?gration dans les moteurs de reconnaissance d'?criture manuscrite. - Constitution et traitement de corpus repr?sentatifs. - Analyse des styles d??critures manuscrites commun?ment utilis?s dans diff?rentes langues. - Participation au processus de collecte d'?chantillons d'?criture manuscrite. - Recherche et d?veloppement sur les mod?les de langage (statistiques, syntaxiques ou s?mantiques), et leurs applications aux interfaces homme-machine. - En lien avec l??quipe Support, ?tude et analyse de cas d?usage clients. De formation sup?rieure (Ing?nieur ou Master2 + 3 ans d?exp?rience, ou Doctorat), vous avez une exp?rience en TAL ou dans un domaine proche (intelligence artificielle, reconnaissance des formes, apprentissage statistique?). Votre ma?trise d?au moins un langage de programmation utilis? en TAL (par exemple Perl ou Python) vous permet d??tre compl?tement autonome sur toutes les t?ches techniques. Rigoureux, dynamique, d?termin? et d?un relationnel facile, vous saurez rapidement vous int?grer au sein des ?quipes et d?montrer le leadership et l?expertise n?cessaires ? la r?ussite de votre mission. Anglais courant imp?ratif. La ma?trise d'une langue non latine (notamment scripts asiatique, arabe, devanagari, cyrillique) serait un plus important. Contact : job at visionobjects.com ---------- [1] http://www.samsungmobileb2b.com/resource/case/entertainment_2.do ---------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:27:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:27:05 +0200 Subject: Appel: Unitex => Gramlab, Call for beta testers Message-ID: Date: Thu, 07 Jun 2012 09:34:47 +0200 From: S?bastien Paumier Message-ID: <4FD05997.2080804 at univ-mlv.fr> X-url: http://igm.univ-mlv.fr/~unitex X-url: http://www.gramlab.org Dear colleagues, I inform you that the beta version of Gramlab is now available for testing. Gramlab is an integrated development environment dedicated to local grammars automata creation, edition and diffusion. Gramlab allows computational linguists in collective or individual contexts to design or maintain grammar collections. Gramlab was build upon Unitex software and includes Unitex linguistic resources. It keeps most of Unitex features, and adds many ones including: - a project-oriented design allowing the user to work on several projects in parallel - a brand new Eclipse-like interface, remembering the user configuration when restarted - integrated SVN support for data sharing, including facilities for comparing and merging graphs - a workflow approach allowing the user to run with one click a full processing sequence (preprocessing, locate, concordance) - possibility to type some test text without having to edit a new corpus file - new graph edition features to manipulate box groups with a right click - named graph repositories - auto-refresh of opened files that have been modified - utf8 support There is no user documention yet, but if you already know Unitex, Gramlab should be intuitive enough for you. Since it is designed as a collaborative project, feel free to join our wikis and forums on SourceForge and give us inputs and use cases here. In order to test Gramlab, you have to install the latest version of Unitex 3.0beta (http://igm.univ-mlv.fr/~unitex), and run Gramlab.jar instead of Unitex.jar. Please report bugs, comments and questions to Fanny Grandry (grandry at kwaga.com). If you want to become a registered beta tester, you can ask her for an account on the bug tracking system we use. Best regards, S?bastien Paumier -------------------- Gramlab IDE was implemented by the GramLab Project, a FEDER-funded Research supported by Cap Digital. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:32:44 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:32:44 +0200 Subject: Journee: Unitex/Gramlab days, September 26th-27th 2012, University of Marne-la-Vall=?ISO-8859-1?Q?=E9e_?=(France) Message-ID: Date: Thu, 07 Jun 2012 09:35:11 +0200 From: S?bastien Paumier Message-ID: <4FD059AF.9060004 at univ-mlv.fr> X-url: http://www.gramlab.org Dear colleagues, I inform you that the "Unitex/Gramlab days" will take place on September 26th & 27th, at the University of Marne-la-Vall?e (France). The first day will be dedicated to Unitex users that want to discover in details Gramlab, an IDE for linguists, that is the successor of Unitex. This is a new platform that keeps most of Unitex features, and adds many ones including: - a project-oriented design allowing the user to work on several projects in parallel - a brand new Eclipse-like interface, remembering the user configuration when restarted - integrated SVN support for data sharing, including facilities for comparing and merging graphs - a workflow approach allowing the user to run with one click a full processing sequence (preprocessing, locate, concordance) - possibility to type some test text without having to edit a new corpus file - new graph edition features to manipulate box groups with a right click - named graph repositories - auto-refresh of opened files that have been modified - utf8 support The second day will be dedicated to developers that want to have an overview of the C/C++/Java code of Unitex/Gramlab. It will include a description of the interaction between Unitex and Gramlab, a guided tour of the core parts of the code, a demo of how to use Unitex as a dynamic library from Java and Python, and a presentation of the persistence and virtualization features that can speed up batch processing. Please register before July 31th by sending to an email to paumier at univ-mlv.fr indicating to which day(s) you want to attend to and whether you speak French or not. Feel free to mention any particular topic or question you would like to be addressed during these days. Best regards, S?bastien Paumier -------------------- Gramlab IDE was implemented by the GramLab (http://www.gramlab.org) Project, a FEDER-funded Research supported by Cap Digital. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 20:56:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 22:56:05 +0200 Subject: Seminaire: INFOLINGU, Agata Savary, 11 juin 2012, LIGM, Universite Paris-Est, Marne-la-Vallee Message-ID: Date: Thu, 7 Jun 2012 15:04:11 +0200 From: Myriam RAKHO Message-ID: ************************************************************************ INFOLINGU Le s?minaire de l'?quipe Informatique Linguistique du Laboratoire d'Informatique Gaspard Monge (LIGM) Universit? Paris-Est Marne-la-Vall?e ************************************************************************ Date : *Le Lundi 11 juin 2012 ? 10h30* Lieu : Universit? Paris-Est Marne-la-Vall?e B?timent Copernic, 4?me ?tage, salle de s?minaires 4B08R Toute personne int?ress?e est la bienvenue. ************************************************************************ ------------------------------------------------------------------------ Intervenante : ------------------------------------------------------------------------ *Agata SAVARY* (Universit? Fran?ois Rabelais Tours) ------------------------------------------------------------------------ Titre de la pr?sentation : ------------------------------------------------------------------------ * **Annotation d'entit?s nomm?es dans le Corpus National du Polonais* ------------------------------------------------------------------------ R?sum? de la pr?sentation : ------------------------------------------------------------------------ Le Corpus National du Polonais, d?velopp? par l'Acad?mie Polonaise des Sciences, est une grande collection de textes de 1,5 milliard de mots, de diff?rents genres, dans laquelle des objets de diff?rents types sont annot?s linguistiquement : les phrases, les segments, les items morphosyntaxiques, les mots syntaxiques, les phrases syntaxiques, les entit?s nomm?es et les sens des mots. Un sous ensemble de 1 million de mots de ce corpus a ?t? annot? manuellement. Nous ?voquerons la m?thodologie g?n?rale de construction d'un tel corpus multi-niveau, ainsi que la d?finition de son format conforme ? la norme TEI P5. Ensuite nous pr?senterons de mani?re plus d?taill?e le sch?ma d'annotation des entit?s nomm?es. Seront discut?s certains choix m?thodologiques novateurs, tels que l'annotation des d?riv?s (adjectifs relatifs et gentil?s des noms propres), ainsi que des unit?s imbriqu?es et discontinues. Nous montrerons des exemples de ph?nom?nes linguistiques et extra-linguistiques qui d?fient le sch?ma d'annotation pr?-?tabli. Les corpus annot?s sont fr?quemment utilis?s pour l'entra?nement d'outils ? base d'apprentissage automatique qui peuvent ensuite servir ? l'annotation de nouveaux corpus. Cependant, la repr?sentation d'annotations fines selon des m?thodes classiques en apprentissage, telles la m?thode IOB, n'est pas toujours banale, notamment en ce qui concerne des unit?s non contigu?s ou poss?dant des composants qui se chevauchent. Nous allons pr?senter des propositions de solutions ? ces probl?mes implant?es dans un outil d'annotation automatique d'entit?s nomm?es NERF, bas? sur les CRF (Conditional Random Fields). ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:00:43 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:00:43 +0200 Subject: Revue: TILV n52-53, Linguistique et phenomenologie du langage, ed. P. CADIOT Message-ID: Date: Thu, 7 Jun 2012 15:10:27 +0200 From: "Didier Bottineau" Message-ID: <0EF3D32F4DA04E3A836E8B79507BBADB at R12B0> Florence Lautel-Ribstein, R?dactrice-en-chef de la TILV, La Tribune Internationale des Langues Vivantes me prie d'annoncer la parution du Num?ro 52-53 dirig? par Pierre CADIOT et intitul? "LINGUISTIQUE ET PH?NOM?NOLOGIE DU LANGAGE". Voici le sommaire : ?ditorial Claude ROMANO : Les rep?res ?blouissants. Sur l'ant?pr?dicatif et la ph?nom?nologie du langage David PIOTROWSKI : Sur la ? concr?tude ? du signe : Saussure et Husserl Didier BOTTINEAU : La parole comme technique cognitive incarn?e et sociale Franck LEBAS : Langue, perception, ?nonciation : pour une nouvelle triangulation s?miotique Dominique LEGALLOIS : Penser les relations entre synesth?sies perceptuelles et synesth?sies linguistiques : quelques rep?res et notes Julien LONGHI : Ph?nom?nologie du mot calme : d'une lexicalisation des sensations ? une ph?nom?nologie discursive Jean-Michel SALANSKIS : Le pour soi et le langage Pierre CADIOT : Dire/montrer, champs ph?nom?naux et chiasmes interpr?tatifs Pour tout renseignement s'adresser ? : ?ditions Anagrammes 15, rue de la Poste 22700 PERROS-GUIREC 02 96 23 06 50 site : www.editions-anagrammes.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:01:55 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:01:55 +0200 Subject: Job: Position as Professor in Computational Linguistics, University of Gothenburg, Sweden Message-ID: Date: Thu, 7 Jun 2012 14:38:09 +0000 From: ?sa Abelin Message-ID: X-url: http://www.gu.se/english/about_the_university/announcements-in-the-job-application-portal/?id=19142&lang=en&tjanstNamn=Teacher%2F+post+doc&?id=19144&Dnr=506411&Type=E The department of Philosophy, Linguistics and Theory of Science at the University of Gothenburg invites applications for a position as Professor in Computational Linguistics: http://www.gu.se/english/about_the_university/announcements-in-the-job-application-portal/?id=19142&lang=en&tjanstNamn=Teacher%2F+post+doc&?id=19144&Dnr=506411&Type=E Please contact: ?sa Abelin Associate professor in General Linguistics Deputy head of department and doctoral studies Department of philosophy, linguistics and theory of science University of Gothenburg Olof Wijksgatan 6 Box 200 405 30 G?teborg, Sweden Tel: +46 31 786 5233 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:03:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:03:26 +0200 Subject: Cursus: Master Recherche linguistique et applications informatiques, Universite Bordeaux 3 Message-ID: Date: Thu, 07 Jun 2012 18:29:29 +0200 From: Anna.Kupsc at u-bordeaux3.fr Message-ID: <20120607182929.87867gpmvlhmoh8o at webmail.u-bordeaux3.fr> X-url: http://www.u-bordeaux3.fr/fr/formations/s_inscrire/inscription_en_1ere_ou_2eme_annee_de_master.html X-url: http://sdlcours.u-bordeaux3.fr/mod/forum/discuss.php?d=4887 Le D?partement de Sciences du Langage de l'Universit? Michel de Montaigne Bordeaux 3, propose un Master Recherche linguistique et applications informatiques (ReLAI). Le double objectif de ce Master est de permettre aux ?tudiants de s'int?grer dans la recherche en linguistique ou dans des ?quipes pluridisciplinaires de traitement informatique des langues. Cette formation vise ? donner aux ?tudiants des connaissances de haut niveau couvrant tous les domaines constitutifs de la linguistique, avec une ouverture vers leurs applications informatiques. Les comp?tences d?velopp?es sont le recueil, la description, et l'analyse des donn?es linguistiques et leur formalisation ? l'aide d'outils informatiques et de bases de donn?es. Les enseignements offerts se caract?risent par une triple orientation : descriptive, th?orique et appliqu?e. La diversit? des langues (africaines, asiatiques, indo-europ?ennes, entre autres) repr?sent?es donne ? la formation une orientation r?solument multilingue. Le Master ReLAI offre aux ?tudiants deux types de parcours : Recherche Linguistique ou Linguistique et Applications Informatiques qui se distinguent principalement au quatri?me semestre. Durant les trois premiers semestres, la formation est commune aux deux parcours. Ceux-ci sont centr?s sur l'approfondissement des connaissances dans les domaines cl?s de la linguistique ainsi que l'utilisation d'outils, d'applications et ressources informatiques en vue du traitement automatique des langues. Au quatri?me semestre, l'?tudiant choisit de s'orienter vers le parcours ? Recherche Linguistique ? avec un m?moire de recherche ou le parcours ? Linguistique et Applications Informatiques ? avec un stage de 420 heures et un m?moire professionnel. Gr?ce ? la diversit? des comp?tences de l'?quipe p?dagogique du d?partement, les sujets de m?moires recherche r?alis?s dans ce master couvrent les diff?rents champs de la recherche en linguistique et un grand nombre de langues. De m?me, la th?matique des stages realis?s par les ?tudiants du parcours ? Linguistique et applications informatiques ? reste tr?s ouverte par rapport au traitement informatique de donn?es langagi?res, ?crites ou orales, et peut ?tre effectu?e dans les organismes d'accueil si diff?rents que des laboratoires de recherche, structures acad?miques ou des entreprises priv?es. Ce Master s'adresse aux ?tudiants int?ress?s par la linguistique, les applications et outils informatiques associ?s au traitement de donn?es langagi?res. Un dipl?me en Licence du Sciences du langage n'est pas exig? mais des connaissances de base en linguistique et un int?r?t g?n?ral pour le domaine sont indispensables. Aucun pr?-requis dans les domaines de la programmation et du traitement automatique des langues n'est n?cessaire pour l'inscription en M1. L'admission sur dossier est ouverte ? tous les ?tudiants titulaires d'une licence. Les candidatures ?manant de titulaires de licences de Lettres (langue et litt?rature fran?aises) et de Langues (LLCE ou LEA) sont les bienvenues. Pour plus d'information concernant le programme de la formation, contactez les responsables: Pour le parcours ? Recherche linguistique ?: Laurence Labrune, laurence.labrune at u-bordeaux3.fr Pour le parcours ? Linguistique et applications informatiques ?: Anna Kupsc, akupsc at u-bordeaux3.fr Informations par rapport aux inscriptions (date limite: 5 septembre 2012): http://www.u-bordeaux3.fr/fr/formations/s_inscrire/inscription_en_1ere_ou_2eme_annee_de_master.html La brochure du Master ReLAI est disponible ? l'adresse suivante: http://sdlcours.u-bordeaux3.fr/mod/forum/discuss.php?d=4887 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:05:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:05:08 +0200 Subject: Seminaire: Alpage, Valerie Hanoka, Methodologie de construction/extension de wordnets, 15 juin 2012 Message-ID: Date: Fri, 08 Jun 2012 09:48:17 +0200 From: Marie Candito Message-ID: <4FD1AE41.3040801 at gmail.com> ************** S?minaire Alpage ******************* S?minaire de l'?cole doctorale de Paris Diderot : Il s'agit du s?minaire de recherche en linguistique informatique organis? par l'?quipe Alpage, ?quipe mixte Inria -- Paris Diderot, sp?cialis?e en analyse syntaxique automatique et en traitement du discours. Le prochain s?minaire se tiendra : * vendredi 15 juin de 11h ? 12h30 * en salle 3E91 ? l'UFRL, 16, rue de Clisson, 75013 Paris (3e ?tage gauche) Toute personne int?ress?e est la bienvenue. *********************************************************** Val?rie Hanoka (doctorante Alpage) : M?thodologie de construction/extension de wordnets Nous proposons une m?thodologie pour la construction et/ou l'extension de wordnets. Notre m?thode est bas?e sur l'exploitation d'un large graphe de traductions et de wordnets align?s en plusieurs langues. Des r?sultats pr?liminaires obtenus via une ?valuation de la m?thode pour le fran?ais indiquent que cette technique permet d'obtenir des r?sultats satisfaisants. En particulier, des litt?raux fr?quents et polys?miques que les pr?c?dentes approches d'extension/construction de wordnets ne parvenaient pas ? d?couvrir sont devin?s avec succ?s. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:07:04 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:07:04 +0200 Subject: Cursus: Master Specialite Ingenierie Linguistique, INALCO Message-ID: Date: Fri, 8 Jun 2012 11:57:17 +0200 From: Mathieu Valette Message-Id: <9DCF4C94-48E0-4328-A71D-B7A984A1F7E7 at inalco.fr> X-url: http://www.crim.fr Cursus : Master Sp?cialit? Ing?nierie Linguistique de l'INALCO Site : http://www.crim.fr Contact : crim at inalco.fr Le D?partement Textes, Informatique, Multilinguisme (TIM) de l'INALCO, en cohabilitation avec les Universit?s Paris Sorbonne Nouvelle (Paris 3) et Paris Ouest Nanterre la D?fense (Paris 10), propose le MASTER sp?cialit? "Ing?nierie Linguistique" (parcours professionnel et recherche). Le MASTER sp?cialit? "Ing?nierie Linguistique" d?bouche sur les m?tiers de la soci?t? de l'information : secteurs de la veille, agr?gation de contenus, formation en ligne et/ou sur mobile, d?tection et filtrage d'informations sensibles ou de rumeurs, web social, traduction outill?e, outils d'aide ? la traduction (TAO), gestion ?lectronique de documents (GED)... Cr?e en 1986, il s'appuie sur les projets men?s par l'?quipe de recherche associ?e, ERTIM (EA 2520, anciennement CRIM), ainsi que sur son r?seau de professionnels issus de l'industrie et du monde acad?mique, pour offrir une formation alliant finesse de l'analyse linguistique en contexte multilingue et ma?trise des savoir-faire informatiques n?cessaires. Le M1 est constitu? d'un socle de cours communs aux ?tudiants de l'INALCO, de la Sorbonne Nouvelle (Paris 3) et de Paris Ouest Nanterre La D?fense (Paris 10). Ce socle permet d'acqu?rir les connaissances n?cessaires ? la linguistique de corpus outill?e : gestion informatique du multilinguisme, algorithmique et programmation, s?mantique lexicale et textuelle... Le M2, ? l'INALCO, offre 3 parcours diff?renci?s et un socle commun : - le parcours "Ing?nierie Multilingue", offre une sp?cialisation avanc?e en informatique pour le traitement linguistique : programmation orient?e objet, traitement statistique de corpus, outils informatiques pour le TAL, etc. Les ?tudiants ayant suivi ce parcours travaillent ensuite dans le secteur de la conception de logiciels, la recherche d'information, la veille, le traitement de masses de donn?es textuelles. - le parcours "Traductique et Gestion de l'Information", offre une sp?cialisation autour des outils de TAO (traduction assist?e par ordinateur), de la traduction, des outils de gestion de l'information (bases de donn?es sur le web, langages de script, perl), de la gestion ?lectronique de documents, etc. Les ?tudiants ayant suivi ce parcours travaillent dans le secteur de la traduction ou de la gestion de l'information multilingue (lexicologie, terminologie, veille, conception de formation en ligne) - le parcours Recherche co-habilit? INALCO - Paris 3 - Paris 10 pr?pare les ?tudiants ? une formation acad?mique en s?mantique textuelle, lexicologie textuelle, acquisition et structuration de connaissances ? partir de corpus multilingues (parall?les et comparables). - le socle commun permet d'appr?hender la complexit? de l'analyse linguistique en contexte multilingue et comprend des cours de s?mantique de corpus, de dictionnairique, de lexicologie textuelle, de fouille de textes. Pour l'ann?e 2012/2013, inscriptions en ligne sur le site www.crim.fr ou par envoi d'un message ? crim at inalco.fr. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:08:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:08:18 +0200 Subject: Appel: Workshop on Web of Linked Entities (WoLE2012) Message-ID: Date: Fri, 8 Jun 2012 13:22:10 -0400 From: eric charton Message-ID: X-url: http://wole2012.eurecom.fr [Apologies for cross-posting] ==================================== Workshop on Web of Linked Entities (WoLE2012) http://wole2012.eurecom.fr In conjunction with the 11th International Semantic Web Conference (ISWC2012), Boston, 11/12 November 2012 ==================================== Most of the knowledge available on the Web is encoded in natural language text or Web documents aimed primarily at human consumption. Providing programmatic access to such knowledge is an interesting prospect. This requires information extraction techniques to extract machine readable structures from free text, from which it is possible to retrieve entities and categories. These entities can potentially be linked to each other, creating a global knowledge graph of linked entities. The WoLE2012 workshop envisions the Web as a Web of Linked Entities (WoLE), which transparently connects the World Wide Web (WWW) and the Giant Global Graph (GGG) using methods from Information Retrieval (IR) and Natural Language Processing (NLP). The focus of this workshop is to bring together the Information Retrieval, Semantic Web and NLP communities. The primary goal is to strengthen research techniques that provide access to textual information published on the Web to further improve the adoption of Semantic Web technology. OBJECTIVES AND TOPICS (but are not limited to): * Text and web mining * Pattern and semantic analysis of natural language, reading the web, learning by reading * Large-scale information extraction * Usage mining * Entity resolution and automatic entities discovery * Frequent pattern analysis of entities * Entity linking, named entity disambiguation, cross-document co-reference resolution * Ontology representation of natural language text * Analysis of ontology models for natural language text * Learning and refinement of ontologies * Natural language taxonomies modeled to Semantic Web ontologies * Disambiguation through knowledge base * Multilingual entity recognition and disambiguation * Use cases of entity recognition for Linked Data applications * Relationship extraction, slot filling * Impact of entity linking on information retrieval, semantic search * Conversion of NLP tools output to RDF (NIF, Lemon, OLiA, NERD) * Usage of LOD data to improve performance of NLP processes * Semantification of Web pages such as blogs, forum, etc. * Evaluation of new and existing tools across different domains and types of discourse SUBMISSION AND PUBLICATION: We invite submissions of regular technical papers (max. 12 pages), position papers (max. 4 pages). All submissions will be reviewed by at least three program committee members, and will be assessed based on their novelty, technical quality, potential impact, and clarity of writing. The workshop proceedings will be published as a volume at CEUR Workshop Proceedings. Please, submit in PDF format to: https://www.easychair.org/conferences/?conf=wole2012. Submissions must be in PDF formatted in the style of the Springer Publications format for Lecture Notes in Computer Science (LNCS). For details on the LNCS style, see Springer?s Author Instructions. IMPORTANT DATES: * Jul 31, 2012: submission deadline technical & position papers * Aug 21, 2012: notifications for research papers * Sep 10, 2012: camera-ready papers due WORKSHOP ORGANIZERS: Giuseppe Rizzo, EURECOM, France; Pablo N. Mendes, Freie Universit?t Berlin, Germany; Eric Charton, CRIM, Centre de Recherche Informatique de Montr?al, Canada; Sebastian Hellmann, AKSW, Universit?t Leipzig, Germany; Aditya Kalyanpur, IBM T. J. Watson Research Center, USA PROGRAMME COMMITTEE * Caroline Barriere, Centre de Recherche Informatique de Montr?al, DETI, Canada * Fr?d?ric B?chet, Universit? d'Aix-Marseille, LIF, France * Andreas Blumauer, Semantic Web Company * Paul Buitelaar, DERI/National University of Ireland, Galway, Ireland * Philipp Cimiano, CITEC, University of Bielefeld, Germany * Eric de la Clergerie, INRIA, France * Christian Dirschl, Wolters Kluwer, Germany * Benoit Favre, Universit? d'Aix-Marseille, LIF, France * Michel Gagnon, ?cole Polytechnique de Montr?al, Canada * Daniel Gerber, AKSW, Universit?t Leipzig, Germany * Claudio Giuliano, Fondazione Bruno Kessler, Italy * Daniel Hladky, Ontos AG * Guy Lapalme, Universit? de Montr?al, RALI-DIRO, Canada * Paul McNamee, Johns Hopkins University, USA * Edgar Meij, University of Amsterdam, The Netherlands * Marie-Jean Meurs, Semantic Software Lab, CSFG, Concordia University, Canada * Meenakshi Nagarajan, IBM Research, USA * Axel Ngonga, AKSW, Universit?t Leipzig, Germany * Cartic Ramakrishnan, ISI, University of Southern California, USA * Harald Sack, HPI, University of Potsdam, Germany * Benoit Sagot, INRIA, France * Felix Sasaki, DFKI-LT, German Research Center for Artificial Intelligence (DFKI), Germany * Tomas Steiner, Universitat de Catalunya, Spain * Fabian Suchanek, Max-Planck Institute for Informatics, Saarbr?cken, Germany * Vojtech Svatek, University of Economics, Prague * Krishnaprasad Thirunarayan, Wright State University, USA * Andraz Tori, Zemanta * Marieke Van Erp, VU University Amsterdam * Ruben Verborgh, IBBT, Ghent University, Belgium * Mateja Verlic, Zemanta * Gerhard Weikum, Max-Planck Institute for Informatics, Saarbr?cken, Germany * Feiyu Xu, DFKI-LT, German Research Center for Artificial Intelligence (DFKI), Germany For further questions please contact the organizers via wole2012 at easychair.org. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 9 21:09:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 9 Jun 2012 23:09:08 +0200 Subject: Revue; ANAE N118, Troubles du langage ecrit : apports des nouveaux supports de communication Message-ID: Date: Thu, 7 Jun 2012 10:00:59 +0200 From: "Catherine de Gavre" Message-Id: Ce num?ro fait partie de l?abonnement 2012, Vol 24. Comprenant ?galement : N? 116 Troubles du langage ?crit et ses troubles ? Approche cognitive ? (coordonn? par le Pr B. Pierart) N? 117 L?animal dans le soin (coordonn? par le Pr J.-L. Adrien et M. Maurer, Paris-Descartes et Univ de Sherbrook) N? 118 Troubles du langage ?crit de l?enfance ? l??ge adulte (coordonn? par I. Simo?s, Toulouse) N? 119 Epilepsie et troubles des Apprentissages (sous r?serve) N? 120 L?enfant pr?coce, forces et faiblesses (coordonn? par les Pr J. Gr?goire et T. Lubart) N? 121 Autisme - Pecs, ABA... pratiques d'?ducation de la th?orie ? la pratique http://www.anae-revue.com/la-documentation-scientifique-tous-les-n-disponibles/ Acheter le N? 118 http://www.anae-revue.com/abonnement-2012/ S?abonner en ligne Actualit?s Description : L'?mission "C'est pas sorcier" consacr?e aux troubles "dys" sera diffus?e le Dimanche 24 juin ? 10h45 sur France 3. Elle sera ensuite disponible en replay pendant 7 jours sur le site internet de l'?mission En savoir plus http://www.anae-revue.org/article-emission-c-est-pas-sorcier-consacree-aux-troubles-dys---24-juin-2012-106123995.html http://www.anae-revue.org/categorie-11342105.html Agenda http://www.anae-revue.org/categorie-11477942.html Lu pour vous http://www.anae-revue.org/categorie-11433771.html Formation - DU http://www.anae-revue.org/categorie-11344612.html Livres ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:38:30 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:38:30 +0200 Subject: Job: Stage, Implementation de l'accord orthographique de la langue portugaise, SYSTRAN Message-ID: Date: Mon, 11 Jun 2012 11:08:30 +0200 From: "BUSCHBECK Bianka" Message-ID: <004e01cd47b1$c5c507a0$514f16e0$@systran.fr> ################### Company: SYSTRAN Department: Linguistic Resources Location: Paris 75002, France Website: www.systran.fr Internship description: SYSTRAN has currently an opening for an internship of 4-6 months that aims at the adaptation of its Portuguese language pairs to the new spelling conventions for Portuguese. The internship project would include the following tasks: - Specification of rules to convert text according to the Portuguese Language Orthographic Agreement - Adaptation of SYSTAN's lexical resources to the new spelling conventions - Work on European Portuguese - Brazilian Portuguese localization of the Portuguese MT input and output - Integration and testing of results Required skills: - Native competence of Portuguese, preferably Brazilian Portuguese, and fluency in English and French - Profound knowledge of the Portuguese spelling reform and ability to specify rules converting text to the new spelling conventions - Good working knowledge of computational lexicography and NLP methods in general - Perl and scripting languages are a plus - Strong communication skills and ability to work in a team Please send your application and cover letter to Bianka Buschbeck: buschbeck AT systran DOT fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:44:22 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:44:22 +0200 Subject: Conf: SCIA 2012, 1ere journee Sciences Cognitives et Intelligence Artificielle, Paris, 25 juin 2012 Message-ID: Date: Mon, 11 Jun 2012 08:16:11 +0200 From: Olivier Boissier Message-Id: <2531C992-9693-4F8A-8AC1-2D5495E57F99 at emse.fr> X-url: http://sites.google.com/site/ateliericsccog/ L'ARCO et l'AFIA vous invite ? la premi?re journ?e SCIENCES COGNITIVES et INTELLIGENCE ARTIFICIELLE (SCIA?12). Une version pdf de l'appel est disponible ? : http://www.afia.asso.fr/tiki-download_file.php?fileId=84 Cette journ?e, organis?e par Xavier Aim? et Gunnar Declerck, fait se rencontrer l?Ing?nierie des Connaissances et les Sciences Cognitives (ICSC) autour du th?me ? Concevoir des dispositifs capables d?augmenter la pens?e ?. Du mythe d?Icare au projet de la biomim?tique de J.M. Benyus, l?homme s?applique ? copier la nature pour concevoir ou am?liorer ses syst?mes techniques. Dans le domaine de l?Intelligence Artificielle, de la robotique et de la fouille de donn?es, on d?veloppe des algorithmes ?volutionnaires ou des mod?les d?optimisation inspir?s du comportement des insectes sociaux. Dans tous les cas, il s?agit de s?inspirer de mod?lisations de structures existant dans la nature pour concevoir des dispositifs artificiels. L?Ing?nierie des Connaissances a-t-elle int?r?t ? adopter une pareille d?marche ? L??tude des m?canismes ? naturels ? de la cognition peut-elle offrir d?am?liorer les performances des dispositifs de manipulation de connaissances ? SCIA se tient dans le cadre de la conf?rence IC 2012(http://ic2012.crc.jussieu.fr/). - Date : 25 juin 2012 - Lieu : Centre de recherche des cordeliers, 15 rue de l'?cole de m?decine, 75006 Paris * Inscriptions : Les inscriptions se font sur le site de l?atelier ICSC http://sites.google.com/site/ateliericsccog/ *Programme - 14h00 Pr?sentation de l?Atelier par Xavier Aim? (INSERM US 14, UMRS 872 ?quipe 20) et Gunnar Declerck (INSERM UMRS 872 ?quipe 20), Isabelle Tapiero (Pr?sidente de l?ARCo) et Yves Demazeau (Pr?sident de l'AFIA). Pr?sentation de la th?matique par Gunnar Declerck. - 14h30 ? Les technologies cognitives num?riques pour stimuler et simuler la pens?e ? par Charles Tijus (CHart, Laboratoire Cognitions Humaine et Artificielle / LUTIN, Laboratoire des Usages en Technologies d?Information Num?riques). - 15h00 ? L?Intelligence Artificielle : l?approche des sciences de la complexit? ? par Jean-Claude Heudin (Institut de l?Internet et du Multim?dia). - 15h30 ? Augmenter l?intelligence d?une ?quipe avec une plateforme web de travail collaboratif en temps r?el et en mode moteur d?innovation massivement parall?le ? par Jo?l Muzard (AIA, Applied Intelligence Atelier, Montr?al). - 16h00 Pause - 16h15 ? Diff?rentes mani?res de voir le concept de connaissance en sciences cognitives ? par Benoit Le Blanc (ENSC - Institut Polytechnique de Bordeaux / Institut des Sciences de la Communication du CNRS). - 16h45 ? Gradients de prototypicalit?, un apport de la psychologie cognitive ? l?ing?nierie des ontologies ? par Xavier Aim? (INSERM UMRS 872 EQ 20). - 17h15 ? Linguistique et principes cat?goriels, ou le leurre de l?engagement cognitif ? par Jean- Baptiste Guignard (Centre for Cognitive Research, UMS 3327, CNRS / Universit? de Technologie de Compi?gne). - 17h45 ? Pour une ing?nierie des connaissances dynamiques : prendre en compte la dynamique de l?activit? et de ses inscriptions dans les syst?mes d?interpr?tation ? par Yannick Pri? (LIRIS, UMR 5205, CNRS / Universit? Lyon 1). - 18h15 Pause - 18h20 Discussion g?n?rale L?atelier ICSC est ?galement partenaire de l?atelier ?Philosophie (du Web) et Ing?nierie (des connaissances)? qui se d?roulera la matin?e du 25 juin et porte sur le th?me ? De l?importance des agencements sur le web ?. La session de discussion g?n?rale qui cl?t la journ?e r?unira les participants des deux ?v?nements. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:53:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:53:08 +0200 Subject: Appel: CSLP 2012, Deadline extension Message-ID: Date: Sun, 10 Jun 2012 15:49:21 +0200 From: Yannick Parmentier Message-ID: <20120610134921.GA2791 at mononoke> X-url: http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ ** apologies for cross-posting ** CALL FOR PAPERS & PARTICIPATION ** NEW: The deadline to submit papers to CSLP 2012 has been extended to 25 June 2012 ** ======================================================== Constraint Solving and Language Processing - CSLP 2012 - Seventh International Workshop Universite d'Orleans, Orleans, France September 13-14, 2012 http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ ======================================================== INTRODUCTION ============ The Constraint Solving and Language Processing (CSLP) workshop considers the role of constraints in the representation of language and the implementation of language processing from an interdisciplinary perspective. This theme should be interpreted inclusively: contributions from linguistics, computer science, psycholinguistics and related areas are welcome, and an interdisciplinary perspective is of particular interest. Constraints are widely used in linguistics, computer science, and psychology. How they are used, however, varies widely according to the research domain: knowledge representation, cognitive modelling, problem solving mechanisms, etc. These different perspectives are complementary, each one adding a piece to the puzzle. For example, linguistics proposes in-depth descriptions implementing constraints in order to filter out structures by means of description languages, constraint ranking, etc. The constraint programming paradigm, on the other hand, shows that constraints have to be taken as a systematic whole and can thus play a role in building the structures (or can even replace structures). Finally, psycholinguistics experiment have been made, investigating the role of constraint systems for cognitive processes in comprehension and production, as well as addressing how they can be acquired. TOPICS ====== CSLP is open to submissions on topics including, but not limited to: * Constraints in human language comprehension and production * Context modelling and discourse interpretation * Acquisition of constraints * Constraints and learning * Cross-theoretical view of the notion of constraint * New advances in constraint-based linguistic theories * Constraint satisfaction (CS) technologies for NLP * Linguistic analysis and linguistic theories biased towards CS or constraint logic programming (CLP) * Application of CS or CLP for NLP * CS and CLP for other than textual or spoken languages, e.g., sign languages and biological, multimodal human-computer interaction, visual languages * Probabilistic constraint-based reasoning for NLP and context comprehension PREVIOUS EDITIONS ================= Six CSLP workshops have been organized in the past in: Karlsruhe, Germany (2011), Hamburg, Germany (2008), Roskilde, Denmark (2007), Sydney, Australia (2006), Sitges, Spain (2005), Roskilde, Denmark (2004). VENUE ===== CSLP 2012 will take place at LIFO, the Computer Science laboratory of the University of Orleans, France. Orleans is located in the northern bend of the Loire river, it belongs to the Vallee de la Loire sector, which was in 2000 inscribed by UNESCO as a World Heritage Site. Orleans is located 120 kilometers south-west of Paris, it is bordered to the north by the Beauce region and the national forest of Orleans (500 km2), and by the Sologne region to the south. IMPORTANT DATES =============== Submission Deadline: June 10, 2012 Notification: August 1st, 2012 Camera-ready Version: September 1st, 2012 Workshop Dates: September 13-14, 2012 SUBMISSIONS =========== Papers must be submitted electronically as PDF files and be prepared using the Springer LNAI/LNCS format. Detailed formatting instructions can be found at: http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0 Papers should present original, unpublished work. Simultaneous submission to other venues with published proceedings is prohibited. CSLP accepts two kinds of submissions: - full papers (12 pages including references) reporting completed, significant research, - short papers (6 pages including references) reporting ongoing work and partial results. Each submission will be reviewed by three program committee members. Accepted long papers will be presented within 20 minutes talks plus 10 minutes for questions. Accepted short papers will be presented within 10 minutes talks plus 5 minutes for questions. Both paper types will be published in the workshop proceedings. Since reviewing will be blind, the submission should not include the authors' names and affiliations. Other identifying information such as obvious self-references (e.g., "We showed in [12] ...") and financial or personal acknowledgements should be omitted in the submitted papers whenever feasible. Papers have to be submitted via the easychair conference management system using the following link: http://www.easychair.org/conferences/?conf=cslp2012 A volume at an international publisher will be considered for selected and revised papers, if number and quality of submissions permits. REGISTRATION ============ Registration is now open, by filling the form available at http://www.univ-orleans.fr/lifo/evenements/CSLP2012/inscription.php The registration fees (50 EUR for students and 100 EUR for researchers until August, 7th) cover the electronic proceedings (USB stick), the participation to the coffee breaks, the lunches, the banquet, and the social event (visit of a Castle of the Vallee de la Loire). KEYNOTE SPEAKERS ================ Ruth Kempson, King's College London Stergios Chatzikyriakidis, Royal Holloway University of London and Open University of Cyprus Title: "Grammars as Mechanisms for Real-Time Tree-Growth: Explaining Clitic Pronouns" Abstract: In this talk, we use the puzzle of clitic pronoun placement and clustering in Modern Greek to argue for a shift of perspective into defining grammars as mechanisms for incremental growth of interpretation, as argued in Dynamic Syntax: Kempson et al. (2001), Cann et al. (2005) Chatzikyriakidis and Kempson (2011). In this framework, the concept of structural underspecification and growth of semantic representation is taken as the core syntactic notion, grounded in the modal Logic of Finite Trees: Blackburn and Meyer-viol (1994). With modal statements expressing an array of more or less fixed tree-node relations, restrictions on tree development are definable in a way not available to grammars lacking such tree-growth dynamics. One of these is the restriction that no more than one underspecified relation of a type can be built at a time, their being indistinguishable with only this weak characterisation, which we use to explain a range of clitic clustering restrictions found in many clitic-pronoun systems ? we take the so-called Person-Case Constraint (PCC) as displayed in different ways in dialects of Modern Greek as our case study. PROGRAM COMMITEE ================ Philippe Blache, CNRS - Universit? de Provence, France Adriane Boyd, Universit?t T?bingen, Germany Aoife Cahill, ETS Princeton, USA Henning Christiansen, Roskilde University, Denmark Berthold Crysmann, CNRS - Paris 7, France Ver?nica Dahl, Simon Fraser University, Canada Helen de Hoop, Radboud University Nijmegen, Netherlands Eric De La Clergerie, INRIA - Paris 7, France Denys Duchier, Universit? d'Orl?ans, France Claire Gardent, CNRS - LORIA, France Barbara Hemforth, Universit? Paris Descartes, France Maria Dolores Jim?nez-L?pez, Universitat Rovira i Virgili, Spain Laura Kallmeyer, Heinrich Heine Universit?t, D?sseldorf, Germany Ruth Kempson, King's College London, UK Stephan Kepser, Codecentric AG D?sseldorf, Germany Patrick McCrae, Langtec Hamburg, Germany Wolfgang Menzel, Universit?t Hamburg, Germany Detmar Meurer, Universit?t T?bingen, Germany V?ronique Moriceau, Universit? Paris XI, France Jean-Philippe Prost, Universit? de Montpellier, France Adam Przepi?rkowski, IPIPAN, Warsaw, Poland Christian R?tor?, Universit? de Bordeaux, France Frank Richter, Universit?t T?bingen, Germany Sylvain Salvati, INRIA - Universit? de Bordeaux, France Sylvain Schmitz, ENS Cachan, France Kiril Simov, Bulgarian Academy of Sciences, Bulgaria Jesse Tseng, CNRS - Universit? de Toulouse, France J?rgen Villadsen, Technical University of Denmark LOCAL ORGANIZING COMMITEE ========================= Chairs: Denys Duchier (LIFO - Universit? d'Orl?ans) Yannick Parmentier (LIFO - Universit? d'Orl?ans) Members: Guillaume Cleuziou (LIFO - Universit? d'Orl?ans) Thi-Bich-Hanh Dao (LIFO - Universit? d'Orl?ans) Abdelali Ed-Dbali (LIFO - Universit? d'Orl?ans) Matthieu Exbrayat (LIFO - Universit? d'Orl?ans) Matthieu Lopez (LIFO - Universit? d'Orl?ans) Lionel Martin (LIFO - Universit? d'Orl?ans) Simon Petitjean (LIFO - Universit? d'Orl?ans) Jacques-Henri Sublemontier (LIFO - Universit? d'Orl?ans) Information about the Workshop is available at the CSLP workshop website: http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ E-mail:cslp2012 at easychair.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:50:52 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:50:52 +0200 Subject: Sujet de these: Extraction et categorisation de lexiques transdisciplinaires d'articles scientifiques Message-ID: Date: Mon, 11 Jun 2012 18:33:29 +0200 From: Agn?s Tutin Message-ID: <000001cd47ef$eef4f840$ccdee8c0$@u-grenoble3.fr> Le laboratoire LIDILEM ( http://w3.u-grenoble3.fr/lidilem/labo/web/presentation.php ) appelle des candidatures pour une th?se financ?e par allocation doctorale de la r?gion Rh?ne-Alpes (env. 1700 euros brut / mois). ************************************* Descriptif de la th?se : Titre : Extraction et cat?gorisation de lexiques transdisciplinaires d?articles scientifiques de sciences humaines en vue de l?indexation automatique R?sum? du projet : Dans cette th?se, l?approche propos?e portera sur un type de discours scientifique moins analys? au plan linguistique, les articles de recherche en sciences humaines et sociales, sur lesquels une r?flexion linguistique et ?pist?mologique sera men?e dans une perspective d?analyse du contenu textuel pour l?indexation automatique. Il s?agira de mettre en ?vidence le lexique et la phras?ologie associ?s aux processus et ? la d?monstration scientifiques, qu?ils soient propres aux disciplines ou ? transdisciplinaires ?, tout en excluant la terminologie. L?objectif est ici triple : a) il s?agit de rep?rer les termes qui caract?risent la scientificit? des ?crits de sciences humaines (Par exemple, quels marqueurs linguistiques pour l?observation scientifique ? quels m?canismes linguistiques pour formuler une preuve ?). Plusieurs ?tudes ponctuelles ont ?t? r?alis?es sur ces aspects (par exemple, ?tude du fonctionnement de verbe "voir" dans sa fonction ?videntielle (Grossmann & Tutin 2010) ou le lexique adjectival ?valuatif (Cf Tutin 2010), mais ? notre connaissance, il n?y a pas eu d??tude en grandeur r?elle avec des techniques lexicom?triques ; b) Nous cherchons ensuite ? rep?rer comment les concepts cl?s, ? travers la terminologie, sont introduits dans les discours. Ce n?est pas ici la terminologie du domaine qui est en jeu, mais la fa?on dont les notions cl?s sont pr?sent?es. Les ?tudes dans le domaine mettent au jour la r?currence des patrons phras?ologiques qui transcendent les domaines de connaissances et permettent d?exprimer des relations entre termes, d?introduire des d?finitions et/ou des d?nominations (Rebeyrolle 2000, Grabar et Hamon 2004, Gillam, Tariq et Ahmad 2005, Jacques et Aussenac-Gilles 2006, Marshmann et l?Homme 2008). L?analyse ne devra donc pas exclusivement porter sur les unit?s simples ou complexes mais aussi s??tendre ? la phras?ologie typique de l?article scientifique, qu?elle s?incarne par des collocations binaires (par exemple "r?sultats encourageants") ou par des constructions syntaxiques plus complexes (par exemple "les travaux de --- montrent que "), qui acceptent certaines variations. c) Dans un dernier temps, il s?agit de constituer une ressource, le lexique transdisciplinaire, que l?on exploitera dans des applications de sciences de l?information, pour caract?riser le contenu du document. Ce lexique sera ici doublement utilis? : ? la fois comme un lexique d?exclusion pour l?extraction des mots-cl?s des th?mes du texte, et dans un deuxi?me temps, pour permettre une caract?risation du type de discours scientifique (par exemple, l?accent est-il mis sur la m?thodologie, l?observation ? ou les aspects plus th?oriques ?). Il s?agit ici en quelque sorte de d?passer la terminologie classique en int?grant dans la m?thode d?indexation des ?l?ments de la typologie textuelle, ce qui constitue une approche innovante d?analyse de contenu, rendue possible par les techniques de traitement automatique des langues utilis?es. Cela suppose une caract?risation fine des ressources lexicales extraites, aux plans s?mantique, syntaxique et rh?torique (Cf. Pecman 2004). Ce projet de th?se s?inscrit au carrefour de trois domaines disciplinaires : a) la linguistique, en particulier la s?mantique et la linguistique de l??nonciation, b) le traitement automatique des langues, c) les sciences de l?information, en particulier les techniques des langages documentaires. Il s?inscrit dans la continuit? de travaux sur la phras?ologie des ?crits scientifiques, le lexique transdisciplinaire pouvant ?tre con?u comme le lexique m?tascientifique (par exemple, le lexique des proc?dures et r?sultats : "premier r?sultats", "nous analysons", "hypoth?se" et/ou le m?tadiscours qui inclut le positionnement de l?auteur ("r?sultats encourageants", "cette m?thode appara?t peu adapt?e" ?) ou les marqueurs m?tatextuels ("dans un second temps", "nous introduirons ensuite" ?) (Phal 1971, Coxhead 2000, Pecman 2004, Hirsh & Coxhead 2007, Tutin 2007 a et b, Da Sylva 2010). Les travaux ont jusqu?? pr?sent peu port? sur le fran?ais mais surtout sur l?anglais et dans les sciences ? dures ?, essentiellement dans une perspective didactique, en dehors des travaux encore exploratoires de Drouin (2007) et Da Sylva (2010). Au plan th?orique, il s?agira d?analyser l?articulation entre le lexique de sp?cialit? disciplinaire et le lexique de genre, la limite ?tant particuli?rement poreuse dans les ?crits de sciences humaines, et de proposer une r?flexion sur l?utilisation de telles ressources pour une caract?risation du type de l??crit scientifique. R?f?rences bibliographiques : A?t-Mokhtar S., Chanod J.P. et Roux C. (2002). Robustness beyond shallowness : incremental deep parsing. Nat. Lang. Eng., 8, 121?144. Coxhead A. (2000). A New Academic Word List, TESOL Quaterly, 34 (2), 213-238. Coxhead A. et Hirsh D. (2007). A pilot science word list for EAP, Revue Fran?aise de linguistique appliqu?e, XII, (2), 65-78. DaSylva L. (2010). Extraction semi-automatique d?un vocabulaire savant de base pour l?indexation automatique, TALN?10, Montr?al, 19-23 juillet. Daille B. (2010). Terminology Mining, in M.T. Pazienza (ed), Information Extraction in the Web Era, Lectures Notes in Artificial Intelligence, Springer, 29-44. Drouin P. (2007). Identification automatique du lexique scientifique transdisciplinaire, Revue fran?aise de linguistique appliqu?e, 12(2), 45-64. Drouin P., Tutin A. et Reid-Triatanfyllos S. (2007). Identification automatique des collocations transdisciplinaires des ?crits scientifiques. Terminologie : approches transdisciplinaires, Gatineau (Qu?bec), 2-4 mai. Gillam L., Tariq M. et Ahmad K. (2005). Terminology and the construction of ontology, Terminology, 11(1), 55-81. Grabar N. et Hamon T. (2004). Les relations dans les terminologies structur?es: de la th?orie ? la pratique, Revue d?intelligence artificielle, 18(1), 57-85. Grossmann F., Tutin A. (2010). Evidential Markers in French Scientific Writing: the Case of the French Verb voir. In Smirnova Elena, Diewald Gabriele Evidentiality in European Languages (pp. 279-307). Empirical Approaches to Language Typology (EALT). Berlin, New York: Mouton de Gruyter. Ibekwe-SanJuan F., SanJuan E. (2004). Mapping the structure of research topics through term variant clustering : the TermWatch system, 7?me Journ?es internationales d'Analyse statistique des donn?es textuelles (JADT' 2004). Louvain-la-Neuve, Belgium, 10-12 March 2004, 589-600.[jadt2004] [7th International conference on Textual data statistical analysis]. Jacques M.P. et Aussenac-Gilles N. (2006). Variabilit? des performances des outils de TAL et genre textuel, TAL, 47(1). Marshmann E. et L?Homme M.C. (2008). Portabilit? des marqueurs de la relation causale : ?tude sur deux corpus sp?cialis?s, in Maniez F., Dury P., Arlin N. et Rougemont C. (eds), Corpus et dictionnaires de langues de sp?cialit?, Presses Universitaires de Grenoble. Paquot, M. et Bestgen Y. (2007). Distinctive words in academic writing: A comparison of three statistical tests for keyword extraction, in Jucker, Andreas H., Daniel Schreier & Marianne Hundt (eds), Corpora:Pragmatics and Discourse, Amsterdam: Rodopi, 247-269. Pecman M. (2004). Phras?ologie contrastive anglais-fran?ais : analyse et traitement en vue de l?aide ? la r?daction scientifique. Th?se de doctorat, Universit? de Nice-Sophia Antipolis. Phal A. (1971). Vocabulaire g?n?ral d?orientation scientifique (V.G.O.S.) - Part du lexique commun dans l?expression scientifique. Paris : Didier. Rebeyrolle J. (2000). Forme et fonction de la d?finition en discours, Universit? Toulouse II Le Mirail, Equipe de recherche en Syntaxe et S?mantique. Tutin Agn?s (2007a). Mod?lisation linguistique et annotation des collocations : une application au lexique transdiciplinaire des ?crits scientifiques. In S. Koeva, D. Maurel & M. Silberztein (eds), Formaliser les langues avec l?ordinateur : de Intex ? NooJ, 189-215. Besan?on: Presses Universitaires de Franche Comt?. Tutin Agn?s (ed.) (2007b). Lexique des ?crits scientifiques. Revue Fran?aise de Linguistique Appliqu?e. Vol. XII, 2007/2 (http://www.cairn.info/revue-francaise-de-linguistique-appliquee-2007-2.htm). Tutin Agn?s (2010). Evaluative adjectives in academic writing in the humanities and social sciences. In Rosa Lores-Sanz, Pilar Mur-Duenas, Enrique Lafuente-Millan Constructing Interpersonality: Multiple Perspectives on Written Academic Genres. Cambridge: Cambridge Scholars Publishing. ************************************* Id?alement, le/la candidat-e aura de solides connaissances linguistiques et de bonnes connaissances du TAL (Master Sciences du langage, master TAL). La th?se s'articule ? un projet plus vaste soumis ? accord de financement, impliquant d'autres laboratoires de linguistique et d'informatique. Pour renseignements et pour faire acte de candidature, contacter Agn?s Tutin et Marie-Paule Jacques le plus rapidement possible. Envoyer un CV, un relev? des notes du master et un expos? des travaux de recherche ant?rieurs et projet?s (m?moires de master, projets de recherche). Marie-Paule Jacques et Agn?s Tutin ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 20:10:43 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 22:10:43 +0200 Subject: Conf: IC 2012, Programme, 25-29 juin 2012, Paris Message-ID: Date: Tue, 12 Jun 2012 18:20:30 +0200 From: xavier aim? Message-ID: <4FD76C4E.1020302 at inserm.fr> X-url: http://ic2012.crc.jussieu.fr/ ======================================================== Appel ? participation 23es Journ?es Francophones d'Ing?nierie des Connaissances http://ic2012.crc.jussieu.fr/ Centre des Cordeliers - Paris 25-29 juin 2012 ======================================================== La conf?rence IC r?unit la communaut? francophone et est un lieu d'?changes et de r?flexions sur cette discipline qui doit prendre en compte l'essor des Sciences et Technologies de l'Information et de la Communication, notamment des technologies li?es au Web et leurs retomb?es sur les pratiques individuelles et collectives. Elle est le lieu o? la communaut? francophone expose et confronte ses th?ories, ses pratiques, ses m?thodes et outils. Un des enjeux r?cents est la mise en place de standards d'?valuation de ses m?thodes et outils. * Programme : - Lundi 25 juin Ateliers "RAPC", "PhiloWeb" et "Ing?nierie des Connaissances & Sciences Cognitives" - Mardi 26 juin Ateliers "IC & e-Sant?", "MOT" et "Qualit?, Robustesse, Ontologies et Jeu de Donn?es" - Mercredi 27 juin Conf?rence principale, Papiers courts, Posters & d?mos, Cocktail de bienvenue - Jeudi 28 juin Conf?rence invit?e : Dr. Dani?le Bourcier - Le langage du droit peut-il ?tre conceptualis? ? Conf?rence principale, Posters & d?mos, D?ner de gala - Vendredi 29 juin Conf?rence invit?e : Dr. B?n?dicte Le Grand - Analyse exploratoire de r?seaux d'interaction reposant sur leur structure en communaut?s Conf?rence principale -> programme d?taill? : http://ic2012.crc.jussieu.fr/index.php/prog * Inscriptions : http://ic2012.crc.jussieu.fr/index.php/inscriptions Pensez ? vous inscrire avant le ** 18 juin 2012 **, apr?s un suppl?ment de 90? TTC vous sera compt?. * Informations pratiques : http://ic2012.crc.jussieu.fr/index.php/informations-pratiques ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 19:56:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 21:56:48 +0200 Subject: Journee: Journees Initiative Corpus de reference du francais, 14-15 juin, Paris Message-ID: Date: Mon, 11 Jun 2012 14:51:18 +0200 From: St?phanie Girault Message-Id: <5B84E596-F281-403A-AE1A-5C3E5910DB16 at ens.fr> X-url: http://www.ilf.cnrs.fr/spip.php%3Frubrique95.html Initiative Corpus de r?f?rence du fran?ais 14-15 juin 2012 Amphith??tre Michelet, Universit? Paris-Sorbonne 46 rue Saint-Jacques 75005 Paris L'Institut de Linguistique Fran?aise (CNRS, 2393 FR) organise deux journ?es de r?flexion et de d?bats sur le th?me ? Initiative Corpus de r?f?rence du fran?ais ?. Le comit? directeur de l'ILF a jug? qu'il entre effectivement dans les missions de la f?d?ration de lancer une telle initiative au niveau national (corpus de textes ?crits, corpus oraux, corpus de r?f?rence ouvert ? la diachronie longue). La France, contrairement ? d'autres pays ne s'est pas dot?e d'un tel type de corpus. Or, les avanc?es scientifiques et technologiques, le d?veloppement des programmes et des infrastructures dans le domaine de ce qu'il est convenu d'appeler ? Corpus ? permettent de consid?rer que le contexte actuel se pr?te ? l'accueil favorable d'une telle initiative. Les deux journ?es s?articuleront autour de pr?sentations de 45 minutes suivies de 15 minutes de discussion avec le public portant sur l'opportunit? et la faisabilit? d'un corpus de r?f?rence du fran?ais. Deux tables rondes viendront ponctuer chacune de ces journ?es. Nous serions heureux de vous accueillir ? ces journ?es qui se d?rouleront les 14 et 15 juin prochains ? l?amphith??tre Michelet de la Sorbonne ? Paris. St?phanie GIRAULT et Franck NEVEU pour le Comit? d'organisation scientifique _____________________________ Important : L?entr?e est libre, mais l?inscription est obligatoire. Vous devez imp?rativement remplir le formulaire d?inscription accessible ? cette adresse tout en bas de la page http://www.ilf.cnrs.fr/spip.php%3Frubrique95.html et vous munir de votre pi?ce d?identit? pour acc?der aux locaux de la Sorbonne. _____________________________ PROGRAMME Jeudi 14 juin 2012 9H30-10H Franck NEVEU (directeur de l?ILF, porteur du Consortium Corpus-Ecrits) Ouverture 10H-10H30 Xavier NORTH (D?l?gu? G?n?ral DGLFLF) Les corpus dans l'?laboration d'une politique linguistique 10H30-11H30 Marie CORNU (CECOJI, Centre de recherche "Droit du patrimoine culturel") Constitution d'un corpus de r?f?rence, les enjeux juridiques 11H30-12H30 Pascal CORDEREIX (BNF) Langue et patrimoine : les enjeux de la conservation des corpus de la parole 12H30-14H Pause d?jeuner 14H00-15H Gabriel BERGOUNIOUX (Laboratoire Lig?rien de Linguistique, Universit? d?Orl?ans) L'oral dans les langues ? tradition ?crite : l'exemple du fran?ais (et de la France) 15H-16H Marc Van CAMPENHOUDT (r?seau LTT, Institut sup?rieur de traducteurs et interpr?tes, Haute ?cole de Bruxelles) Linguistique de corpus et ?tude de la langue fran?aise sp?cialis?e dans un cadre multilingue 16H-17H Lou BURNARD (TGIR ADONIS) : Mais enfin, pourquoi un "corpus"? Essai de d?finition, retour d'exp?riences 17H-18H TABLE RONDE 1 Bernard COLOMBAT (HTL), Serge HEIDEN (ICAR), Anne LACHERET (Modyco), Virginie LETHIER (ADCoST-ELLIADD) Vendredi 15 juin 2012 9H30-10H30 Christiane MARCHELLO-NIZIA (ENS Lyon) Sur quels crit?res construire un Corpus de r?f?rence pour l'histoire du fran?ais ? 10H-11H Olivier BAUDE (DGLFLF, Laboratoire Lig?rien de Linguistique, Universit? d?Orl?ans) Corpus de r?f?rence : homog?n?it?, h?t?rog?n?it? et repr?sentativit? 12H30-11H30 Marie-Luce DEMONET (porteur du Consortium CAHIER de la TGIR-Corpus) : L'ambition g?n?rique des transcriptions du corpus Epistemon (textes du XVIe si?cle en version d'origine) encod?s en TEI 12H30-14H Pause d?jeuner 14H00-15H Philippe BLACHE (co-porteur du Consortium IRCOM de la TGIR-Corpus, LPL) Corpus de r?f?rence : conception, r?le et usage dans une perspective de traitement automatique 15H-16H Jean-Marie PIERREL (porteur de l?Equipex ORTOLANG, ATILF) Un corpus de r?f?rence du fran?ais : pour qui, pourquoi et comment ? 16H-17H Beno?t HABERT (ENS Lyon) Corpus de r?f?rence : avoir ou (savoir) faire ? 17H-18H TABLE RONDE 2 Olivier BAUDE (DGLFLF, Corpus-IR), Laurent DOUSSET (Corpus-IR), St?phane POUYLLAU (Corpus-IR) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 12 20:02:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 12 Jun 2012 22:02:37 +0200 Subject: Appel: Atelier IC pour IS eSante, 26 juin, Paris Message-ID: Date: Mon, 11 Jun 2012 20:49:03 +0200 From: Lina Soualmia Message-ID: X-url: http://ic2012.crc.jussieu.fr/ D?sol?e pour les r?ceptions multiples. ================================ APPEL A PARTICIPATION ================================ *Atelier IC pour l?Interop?rabilit? S?mantique dans les applications en e-sant?* Paris, Mardi 26 Juin 2012 https://sites.google.com/site/icisante2012/ en conjonction avec les 23?mes Journ?es francophones d?Ing?nierie des Connaissances http://ic2012.crc.jussieu.fr/ avec le soutien du GDR STIC-Sant? ------------------------------------------------------------------------ L?Agence des Syst?mes d'Information Partag?s en Sant? (ASIP) d?finit l?interop?rabilit? s?mantique entre syst?mes d?information dans les domaines sant? et m?dico-social de la fa?on suivante: ? La capacit? qu?ont plusieurs syst?mes d??changer de l?information entre eux et d?utiliser l?information qui a ?t? ?chang?e, pour que les utilisateurs de ces syst?mes puissent en tirer parti dans leurs actes et leurs d?cisions, pour le mieux-?tre de leurs patients. ? En g?n?ral, pour y parvenir, le respect de normes et de standards partag?s est n?cessaire. L?interop?rabilit? s?mantique en sant? s?appuie donc sur un ensemble de ressources et de services permettant ? un syst?me d?information de lier les donn?es recueillies avec les connaissances g?n?rales du domaine et permettant une optimisation des dossiers patients informatis?s pour un usage multiple : le soin, la sant? publique et la recherche clinique ? travers plusieurs syst?mes de sant? et plusieurs institutions. La question de l?interop?rabilit? s?mantique en sant? est en pleine expansion au niveau europ?en comme en t?moigne les nombreux projets financ?s dans le programme du FP7, mais ?galement en France avec le d?ploiement du Dossier M?dical Personnel mi-Janvier 2012. L?objectif de cet atelier est de r?unir les travaux traitant des ressources et bases de connaissances pour l'interop?rabilit? s?mantique en sant? (partage et r?utilisation) sous divers aspects : leur construction, leur ?valuation, les langages et standards pour les repr?senter. Il s?agit de rassembler des chercheurs issus des mondes acad?mique et industriel pour d?battre de la question de l?interop?rabilit? s?mantique en sant? ? travers la pr?sentation d?activit?s de recherche innovantes, de techniques, de technologies et de d?monstrateurs d?velopp?s dans le cadre de la mise en ?uvre de solutions d?interop?rabilit? s?mantique dans le domaine m?dical. ============================ PROGRAMME ============================ 9:30 Accueil - Marie-Christine Jaulent, Lina Soualmia. *Session 1 * 9:45 *Conf?rence invit?e* Un patient, combien de dossiers ? Interop?rabilit? s?mantique pour la recherche clinique (projet Europ?en EHR4CR). *Christel Daniel.* 10:30 Vers une approche d'int?gration de donn?es adapt?e aux r?seaux d?grad?s : application au syst?me d?information sanitaire camerounais. *Fid?l Jiomekong Azanzi, Moussa Lo et Maurice Tchuente.* 11:00 *Pause caf?* *Session 2* 11:30 F?d?ration multi-sources en neurosciences : int?gration de donn?es relationnelles et s?mantiques. *Alban Gaignard, Johan Montagnat, Catherine Faron Zucker et Olivier Corby*. 12:00 Un SADC int?gr? et interop?rable dans le Syst?me d'Information Clinique. *Bruno Frandji, Marie-Christine Jaulent.* 12:30 Un jeu de donn?es minimum pour faciliter l?interop?rabilit? des bases de donn?es pour les maladies rares. *R?my Choquet, Claude Messiaen, Adrien Priouzeau, Albane de Carrara et Paul Landais.* 13:00 *Pause d?jeuner* *Session 3 * 14:30 Validation pharmaceutique des prescriptions m?dicamenteuses ? base d?une ontologie OWL et de r?gles m?tier. *Amina Chniti, Abdelali Boussadi, Patrice Degoulet, Patrick Albert et Jean Charlet.* 15:00 Ontologie s?miologique biom?dicale et s?miologie quantitative. *Val?ry Donfack Guefack, Val?rie Bertaud-Gounot, Anita Burgun, Adrien Barton, R?gis Duvauferrier et J?r?my Lasbleiz.* 15:30 Construction d?une ontologie bilingue de la maladie d?Alzheimer ? partir de textes m?dicaux. *Khadim Dram?, Gayo Diallo et Fleur Mougin.* 16:00 *Pause caf?* *Session 4* 16:30 Vers une approche automatique pour la maintenance des mappings entre ressources termino-ontologiques du domaine de la sant?. *Julio Cesar Dos Reis, C?dric Pruski, Marcos Da Silveira et Chantal Reynaud-Dela?tre.* 17:00 M?thodes d?alignement de terminologies m?dicales et leur int?gration dans un portail. *Tayeb Merabti, Lina F Soualmia, Julien Grosjean, Michel Joubert et Stefan J Darmoni.* 17:30 ? 18:00 Discussion g?n?rale - Cl?ture =================== INSCRIPTIONS =================== L'inscription ? l'atelier est centralis?e avec celle de la conf?rence IC2012 : http://ic2012.crc.jussieu.fr/index.php/inscriptions/inscription-a-la-conference-aux-ateliers **Attention, une majoration est appliqu?e apr?s le 18 juin** ============================ THEMES ============================ ** Terminologies et Ontologies m?dicales : Interop?rabilit? s?mantique des contenus m?dicaux, M?thodes d'alignement de terminologies et d'ontologies, Indexation terminologique de dossiers m?dicaux de patients et de r?cits cliniques, Formalismes et langages de repr?sentation, Apports de la s?mantique dans la pratique m?dicale ... ** Int?gration de donn?es multi-sources : Entrep?ts de donn?es biom?dicales Partage et r?utilisation des donn?es ... ** Extraction de l?information et de connaissances ? partir de contenus m?dicaux : construction de bases de connaissances, fouille de donn?es fouille de textes ... ** Utilisation de l?interop?rabilit? s?mantique : pour l?aide ? la d?cision, la recherche d?information, l'indexation? =================== COMITES =================== *Organisatrices:* Marie-Christine Jaulent, INSERM Equ 20 Lina Soualmia, LIM&Bio, Universit? Paris 13 *Comit? de Programme :* Florence Amardeilh, Mondeca Sandra Bringay, LIRMM, Universit? Montpellier 2 R?my Choquet, INSERM Equ20 Marc Cuggia, INSERM U936, Universit? Rennes 1 Olivier Dameron, INSERM U936, Universit? Rennes 1 Christel Daniel, INSERM Equ20 Stefan Darmoni, LITIS, CHU Rouen Gayo Diallo, ISPED, Universit? Bordeaux 2 Catherine Duclos, LIM&Bio, Universit? Paris 13 Bruno Frandji, Medasys Cl?ment Jonquet, LIRMM, Universit? Montpellier 2 Michel Joubert, LERTIM, Universit? Marseille Fleur Mougin, ISPED, Universit? Bordeaux 2 Chantal Reynaud, LRI, Universit? Paris 11 Pierre-Yves Vandenbussche, Mondeca et INSERM Equ20 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:42:17 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:42:17 +0200 Subject: Conf: NooJ 2012, Program, June 14-16, 2012, Paris Message-ID: Date: Wed, 13 Jun 2012 09:59:37 +0200 (CEST) From: NOOJ Message-ID: <49e4f085-4775-45ef-900e-a5db2657bf5d at mail11> International NooJ Conference 2012 June 14-16, 2012 INALCO, 65 rue des Grands-Moulins, 75013 Paris Programme Organization Committee: Victoria Khurshudian (INALCO/SEDYL) Ana?d Donab?dian (INALCO/SEDYL) Max Silberztein (University of Franche-Comt?/ELLIADD) Contact: nooj2012 at inalco.fr Thursday 14 (room 3.05) 9:00-9:40: Registration 9:40 Invited Speaker: Plungian Vladimir (Russian Academy of Science): Corpus linguistics 10:00 Silberztein Max (Univ. de Franche-Comt?): NooJ's formalism 10:20 Trouilleux Fran?ois (Univ. de Clermont-Ferrand): A Description of the French Nucleus Verb Phrase Using Cooccurrence Constraints 10:40-11:00 Coffee Break 11:00 Lagji Klara (INALCO): Automatic processing and analysis of Albanian verbal system 11:20 Vietri Simona (Univ. of Salerno, Italy): The Annotation of the Predicate-Argument Structure of Transfer Nouns 11:40 Pignot H?l?ne & Lardy Mich?le (Univ. Paris 1): Formalising an electronic dictionary of 17th century English with NooJ 12:00 ?ojat Kre?imir, Bekavac Bo?o, Tadi? Marko (Univ. of Zagreb, Croatia): Recognition of Predicate Complements in Croatian 12:20 Fehri Hela, Haddar Kais, Ben Hamadou Abdelmajid (Univ. of Sfax, Tunisia): Specific NooJ resources for recognizing and translating Arabic sportive organization names 12:40-14:00 Lunch 14:00-15:40 Two tutorials: Fehri Hela (room 7.02) & Mesfar Slim (room 7.04) 15:40-16:00 Coffee Break 16:00 Hetsevich Yury, Lobanov Boris, Hetsevich Sviatlana, Skopinava Alena, Yauheniya Yakubovich, (Minsk Univ., Belarus): Accentual Expansion of the Belarusian and Russian NooJ Dictionaries 16:20 Mersinli ?mit, Erk?se Yasemin (Mersin Univ., Turkey): A Deverbal Noun Generator for Turkish 16:40 Wu Mei (Univ. de Franche-Comt?): The auxiliary verbs in the French-Chinese MT system of Nooj 17:00 Fon-Sing Guillaume (Univ. Paris 7): Two Corpora Based NooJ Modules for Mauritian Creole and Haitian Creole 17:20 Vu?kovi? Kristina, Librenjak Sara, Dovedan Zdravko (Univ. of Zagreb, Croatia): Derivation of Adjectives from Proper Nouns 18:00 Cocktail offered by the president of INALCO Friday 15 (room 3.05) 9:00 Declerck Thierry, Koleva Nikolina, Krieger Hans-Ulrich (DFKI GmBH Language Technology Lab, Germany): Interaction between NooJ and a Domain Ontology for the Detection and Mark-Up of Characters in Folktales 9:20 Gavriilidou Zoe, Papadopoulou Eleni, Chadjipapa Elina (Univ. of Komotini, Greece): Numeral-noun and numeral-adjective construction in Greek 9:40 Bigey Magali (Univ. de Franche-Comt?): To Analyze Answers to Surveys witn Co-occurences and Concordances 10:00 Mefteh Mariem, Ben Hamadou Abdelmajid, Kn?ll Roman (Univ. of Sfax, Tunisia): A NooJ framework for Arabic Naturalistic programming : Ara_Pegasus 10:20 Declerck Thierry, Lendvai Piroska (DFKI GmBH Language Technology Lab, Germany): Multilingual sense tagging in NooJ: the use of Wiktionary resources 10:40-11:00 Coffee Break 11:00-12:00 Poster presentations Boudabbous Mohamed Mahdi, Khedher Nacef, Chaaben Kammoun Nouha, Hadrich Belghith Lamia (Univ. of Sfax, Tunisia): Using NooJ grammar for AWN semantic relation enrichment Stanojevi? Mladen, Spasi? Mirko, Ribari? Marko, Jovanovi? Jelena (Pupin Institute, Serbia): Porting NooJ to Multiple Platforms: MONO Experience Khachatryan Liana (INALCO): Application of Syntactic Armenian Grammars with NooJ Rhazi Azeddine (Univ. Med Ben Abdellah, Morocco), Lahlal Mohammed (FLSH Univ. Hassan II, Morocco): NooJ processing for Arabic multiword Expressions (MWEs) Charles Faivre (INALCO): A NooJ module for Malagasy language 12:00-13:15 Lunch Excursion & Diner Saturday 16 (auditorium) 9:00 Bogacki Krzysztof (Univ. of Warsaw, Poland), Cholewa Joanna (Univ. of Bialystock, Poland), Gwiazdecka Ewa (Univ. of Warsaw, Poland): Disambiguating Polish verbs of motion: dictionaries and local grammars 9:20 Ehmann Bea, Iszaj Fruzsina, Demetrovics Zsolt, Laszlo Janos (Hungarian Academy of Sciences): Psychometric Content Analysis with NooJ: Long-Term Effects of Substance Use on Language Behavior 9:40 Boujelben Ines, Jamoussi Salma, Ben Hamadou Abdelmajid, (Univ. of Sfax, Tunisia): Rules based approach for semantic relation extraction between named entities applied to Arabic language 10:00 Donabedian Anaid, Khachatryan Liana, (INALCO): Variation de la transcription des noms propres ?trangers en arm?nien occidental et son traitement dans le module arm?nien de NooJ 10:20 Piroska Lendvai, Walter Ravenek (Hungarian Academy of Sciences): Named Entity Recognition in NooJ for 17th century Multilingual Letters 10:40-11:00 Coffee Break 11:00-12:00: Poster presentations Milo?evi? Uro?, Spasi? Mirko, Komarica Sini?a, Kova?evi? Natalija, Mutavd?i? Milo?, Stanojevi? Mladen (Pupin Institute, Serbia): Making NooJ Open Source and Platform Independent: Java Experience Watabe Masako (INALCO): Nooj, a linguistic module for Rromani Keskes Iskandar, Benamara Farah, Belguith Lamia Hadrich (Univ. of Sfac, Tunisia): Discourse Segmentation of Arabic Texts Based on Cascade Grammars Tra?dia Bassols Sandrine (INALCO): Designing Nooj grammars for Izafe recognition in Sorani Kurdish NPs Merkler Danijela, Agi? ?eljko (Univ. of Zagreb, Croatia): Sentiscope: A System for Sentiment Analysis in Daily Horoscopes Duran Maximiliano (INALCO): Quechua Nouns inflection 12:00-14:00 Lunch 14:00 K?eva Svetla (Univ. of Sofia, Bulgaria): Rule based clause splitting 14:20 Stoyanova Ivelina, Dekova Rositsa (Univ. of Sofia, Bulgaria): Using Nooj for Analysis of Translational Asymmetries in Verb Argument Structure 14:40 B?net Vincent (INALCO): A Russian Module for NooJ: design and implementation 15:00 V?radi Tam?s (Hungarian Academy of Sciences, Hungary): NooJ as an open linguistic infrastructure 15:20 Pand?i? Ivan, ?abi? Juraj, Bekavac Bo?o (Univ. of Zagreb, Croatia): Processing movie reviews in Croatian using NooJ 15:40-16:00 Coffee Break 16:00 M?rth Karlheinz, Declerck Thierry (DFKI GmBH Language Technology Lab, Germany): Porting Persian Lexical Resources to NooJ 16:20 Mesfar Slim, Ben Kacem Saida (ENSI, Tunisia): Towards an on-line concordancing service of NooJ 16:40 Aoughlis Farida (Mouloud Mammeri Univ., Algeria): Towards a Tamazight Module for NooJ 17:00 Anagnostopoulos Giannis, Papadopoulou Lena (Univ. of Komotini, Greece): Hellenic Parliament Proceedings Corpus: Towards a Comparative Study with Europarl Proceedings. The case of morphological properties and translation equivalence of Greek-French-Spanish adjectives. 17:20 G?lvez Carmen (Univ. of Granada, Spain): A proposal to identify generic drug names in biomedical literature 17:40: ROUND TABLE 18:00 END OF CONFERENCE ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:45:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:45:37 +0200 Subject: Appel: Workshop on Computational Methods in Pharmacovigilance + Drug Safety journal Message-ID: Date: Thu, 14 Jun 2012 15:29:43 +0200 From: marie dupuch Message-ID: X-url: http://natalia.grabar.perso.sfr.fr/CMPV/ MIE 2012 workshop + publication of the proceedings in the Drug Safety journal http://natalia.grabar.perso.sfr.fr/CMPV/ *** Deadline extended up to June 20th *** Computational Methods in Pharmacovigilance Pharmacovigilance is the activity related to the collection, analysis and prevention of adverse drug reactions induced by drugs or biologics. This activity plays the fundamental role in monitoring the patient safety during their healthcare process and beyond it. Although this activity relies on a strong surveillance tradition within the pharmacoepidemiological area, some limitations appear and generate uncomfortable cases widely covered by media (such as those related to Mediator, VIOXX etc). First of all, these are due to the ever increasing amount of the data to collect and to process, and also to the recording and storage of these data in the digital form. Hence, the computational methods may provide with useful and intelligent solutions for a more rapid and systematic management of these data. In this workshop, we favour the submission of various and novel experiments related to the computational methods in pharmacovigilance and describing different aspects of the pharmacovigilance process, as performed by acamedic researchers, institutional or industrial people: ? Collection of the pharmacovigilance data: traditionnally, the pharmacovigilance cases are narrative documents spontaneously submitted by medical staff, by pharmacists and sometimes even by patients themselves. The actual concern is that the collection of these cases is far from being complete. In this situation, special efforts are oriented on the computational assistance when collecting and gathering the pharmacovigilance cases from the raw textual sources. Moreover, the reporting standards and frames are also addressed by the researchers. ? Analysis of the pharmacovigilance data: this step relies on the encoding of the cases with the dedicated terminologies and then on the semantic and statistical analysis of these cases. The concerns are related to various aspects, such as (1) the semantic correspondence between the cases and the terms; (2) the methods for the encoding of the cases; (3) the managing of semantic ambiguity and relatedness between the terms; (4) exploitation of the SMQs and of the related data; (5) terminological and ontological representation within the dedicated terminologies; (6) computational methods for the signal detection, etc. ? Prevention of adverse drug reactions: the prevention step aims at facilitating the exchange of information through the well established national and international networks. It manages specifically the grave adverse drug reactions and the guidelines which help countries to strengthen the pharmaceutical politics and decisions. ? etc. The objective of this workshop is to gather people working on various aspects of the pharmacovigilance. Experiments performed within academic, instritutional or industrial contexts are welcome. The proceedings of the workshop will be published in the Drug Safety journal. SUBMISSIONS: The authors are invited to prepare 5 page submissions with the respect of the MIE conference style: - http://www.mie2012.it/documents/fullpaper.dot - http://www.mie2012.it/documents/instruction.pdf For any questions, please contact natalia.grabar at univ-lille3.fr IMPORTANT DATES: May 1, 2012: 1st call for submissions June 20, 2012: Paper due date July 10, 2012: Notifications to Authors July 25, 2012: Camera-ready version Aug 28, 2012: MIE conference and workshop November/December 2012: Publication of the proceedings in the Drug Safety journal SCIENTIFIC COMMITTEE: - Isma?l Ahmed, Equipe Biostatistique, CESP, UMRS 1018 Inserm, Universit? Paris Sud, France - Andrew Bate, Visiting Professor, Department of Information Systems and Computing, Computing and Mathematics, Brunel University, London, UK, Adjunct Associate Professor of Medicine, Division of Clinical Pharmacology NYU School of Medicine, New York, USA and faculty of the NYU Center for Health Informatics and Bioinformatics, USA - Kevin Cohen, University of Colorado School of Medicine and University of Colorado at Boulder, USA - M?lanie Courot, BC Cancer Agency, Vancouver, Canada - Reinhard Fescharek, Behring Inc., Germany - Thierry Hamon, LIM&BIO, Universit? Paris 13, France - Mikaela Keller, CNRS LIFL UMR8022, Mostrare INRIA, Universit? Lille 1 and 3, France - Halil Kilicoglu, National Library of Medicine, NIH, USA - Niklas Noren, Uppsala Monitoring Centre, WHO Collaborating Centre for International Drug Monitoring, Uppsala, Sweden - Patrick Ruch, University of Applied Sciences, Geneva, Switzerland - Ozlem Uzuner, University at Albany, SUNY, USA ORGANIZERS: Marie Dupuch, CNRS STL UMR 8163, U Lille 1 et 3, France Frantz Thiessard, ISPED, U Bordeaux Segalen, France Natalia Grabar, CNRS STL UMR 8163, U Lille 1 et 3, France Jim Slattery, European Medicines Agency, London, UK ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:49:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:49:59 +0200 Subject: Info: Questionnaire, Collecte un corpus sur l'interaction avec un assistant intelligent Message-ID: Date: Thu, 14 Jun 2012 17:16:33 +0200 From: Sofia Zidane Message-ID: Bonjour, Dans le cadre de mon stage, je collecte un corpus sur l'interaction avec un assistant intelligent en anglais et en fran?ais. Pour cela, j'ai mis en point deux petits questionnaires. Je le transf?re ? la liste LN afin de recevoir un bon nombre de r?ponses. Voici le lien vers le questionnaire en anglais : https://docs.google.com/spreadsheet/viewform?formkey=dC1ieUlENFVNZzFnRzdCaXZUTTVPZFE6MQ le lien vers le questionnaire en fran?ais : https://docs.google.com/spreadsheet/viewform?formkey=dDQxVWE0bVRBNnExSlJMdVo0QW8weVE6MQ Je vous en remercie infiniment ! Bonne journ?e, Sofia Zidane Charg?e du TLN et du transfert technologique Apps4Cars ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:54:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:54:14 +0200 Subject: Conf: FSMNLP 2012, July 23-25, 2012, San Sebastian Message-ID: Date: Thu, 14 Jun 2012 18:50:46 +0200 From: Koldo Gojenola Message-ID: <4FDA1666.50502 at ehu.es> X-url: http://ixa2.si.ehu.es/fsmnlp2012/ ========================================= CALL FOR PARTICIPATION Finite-State Methods and Natural Language Processing - FSMNLP 2012 Tenth International Workshop University of the Basque Country (Miramar Palace), Donostia - San Sebasti?n July 23-25, 2012 http://ixa2.si.ehu.es/fsmnlp2012/ Early registration, June 20: http://ixa2.si.ehu.es/fsmnlp2012/index.php/en/registration ======================================= PROGRAM July 23 15.00-18.00: TUTORIALS Spelling and grammar correction with FSTs (Tommi Pirinen/University of Helsinki, I?aki Alegria/University of the Basque Country, Mans Hulden/Ikerbasque (Basque Science Foundation)) Coffee Break Probabilistic parsing with weighted FSTs (Miikka Silfverberg/University of Helsinki) Grapheme-to-phoneme training and conversion with WFSTs (Josef Novak/The University of Tokyo) July 24 9.00: Opening 9.30-10.30: Invited Speaker Kimmo Koskenniemi 10.30-11.00: Coffee Break 11.00-12.00: Long Papers I Effect of Language and Error Models on Efficiency of Finite-State Spell-Checking and Correction (Tommi Pirinen and Sam Hardwick) Practical Finite State Optimality Theory (Dale Gerdemann and Mans Hulden) 12.00-13.00: Short Papers I Handling Unknown Words in Arabic FST Morphology (Khaled Shaalan and Mohammed Attia) Urdu -- Roman Transliteration via Finite State Transducers (Tina B?gel) Integrating Aspectually Relevant Properties of Verbs into a Morphological Analyzer for English (Katina Bontcheva) Finite-State Technology In A Verse-Making Tool (Manex Agirrezabal, I?aki Alegria, Bertol Arrieta and Mans Hulden) 13.00-14.30: Lunch 14.30-15.30: Short Papers II DAGGER: A Toolkit for Automata on Directed Acyclic Graphs (Daniel Quernheim and Kevin Knight) WFST-Based Grapheme-To-Phoneme Conversion: Open Source Tools for Alignment, Model-Building and Decoding (Josef Novak, Nobuaki Minematsu and Keikichi Hirose) Kleene, A Free and Open-Source Language for Finite-State Programming (Kenneth R Beesley) Implementation of Replace Rules using Preference Operator (Senka Drobac, Miikka Silfverberg and Anssi Yli-Jyr?) 15.30-16.30: Short Papers III First Approaches On Spanish Medical Record Classification Using Diagnostic Term To Class Transduction (Alicia P?rez, Maite Oronoz, Arantza Casillas, Arantza D?az de Ilarraza and Koldo Gojenola) Developing an Open-Source FST Grammar for Verb Chain Transfer in a Spanish-Basque MT System (Aingeru Mayor, Mans Hulden and Gorka Labaka) Conversion of Procedural Morphologies To Finite-State Morphologies: A Case Study Of Arabic (Mans Hulden and Younes Samih) A Methodology for Obtaining Concept Graphs from Word Graphs (Marcos Calvo, Jon Ander G?mez, Llu?s-F Hurtado and Emilio Sanchis) 16.30-18.00: Posters and coffee 20.30: Dinner (in the Old Town) July 25 9.30-11.00: Long Papers II A Finite-State Temporal Ontology and Event-Intervals (Tim Fernando) A Finite-State Approach to Phrase-Based Statistical Machine Translation (Jorge Gonz?lez) Finite-State Acoustic and Translation Model Composition in Statistical Speech Translation: Empirical Assessment (Alicia P?rez, M. In?s Torres and Francisco Casacuberta) 11.00-11.30: Coffee Break 11.30-12.30: Long Papers III Refining the Design of a Contracting Finite-State Dependency Parser (Anssi Yli-Jyr?, Jussi Piitulainen and Atro Voutilainen) Lattice-Based Minimum Error Rate Training using Weighted Finite-State Transducers with Tropical Polynomial Weights (Aurelien Waite, Graeme Blackwood and William Byrne) 12.30-13.30: Business Meeting ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 20:56:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 22:56:39 +0200 Subject: Job: Post-doc, Extraction d'information a partir de textes medicaux, LIMSI, Paris Message-ID: Date: Fri, 15 Jun 2012 00:56:23 +0200 From: Pierre Zweigenbaum Message-Id: <201206150056.23773.pz at limsi.fr> Profil de poste : Post-doctorant en traitement automatique des langues Dur?e : 12 ? 16 mois Date de d?marrage : septembre ou octobre 2012. TH?ME Dans le cadre du projet ANR Accordys, le groupe ILES du LIMSI est ? la recherche d'un post-doctorant pour travailler sur l'analyse de textes m?dicaux. Les documents proviennent de deux sources : des dossiers m?dicaux (en fran?ais) et des r?sum?s d'articles scientifiques index?s dans Medline (en anglais). Le domaine concern? est la foetopathologie. Un dossier m?dical se compose de plusieurs types de documents dont le document central est le compte rendu d'examen foeto-placentaire qui peut pointer sur d'autres documents (comptes rendus d'examens, avis de m?decins, r?sultats d'analyses, etc.). Il s'agit donc d'analyser des textes relevant de genres diff?rents en en extrayant les informations n?cessaires pour instancier un mod?le de cas qui sera d?fini par un autre partenaire du projet. On ?tudiera en particulier l'apport de m?thodes ? base linguistique (mise en place et contribution d'une analyse syntaxique robuste) et de m?thodes par apprentissage supervis? ou semi-supervis?. La t?che inclut plusieurs dimensions de l'extraction d'informations ? partir de textes : * Analyse de la structure des textes. * D?tection des entit?s m?dicales pertinentes (signes, organes, etc.) et de leurs relations (localisation d'un signe, etc.), avec ancrage r?f?rentiel ? des ressources terminologiques et ontologiques. Cette d?tection sera ?galement utilis?e pour anonymiser les informations identifiantes (noms, lieux g?ographiques, etc.). * D?tection du cadre temporel et fonctionnel des informations extraites (chronologie, types d'examens rapportant les informations, etc.). Le post-doctorant mettra ?galement en place, en collaboration avec des sp?cialistes du domaine, un jeu de donn?es de d?veloppement et d'?valuation. Missions r?sum?es : - extraction robuste d'informations ? partir de textes par m?thodes d'apprentissage - application ? l'analyse et ? l'anonymisation de textes - int?gration du module - exp?rimentation et ?valuation Formation attendue : - Doctorat en traitement automatique des langues - Exp?rience d'analyse de corpus - Connaissances en apprentissage automatique Le poste est ? pourvoir ? partir du 1er septembre pour une dur?e de 12 mois extensible ? 16 mois. Le salaire correspond aux grilles CNRS et d?pend de l'exp?rience du candidat (de l'ordre de 2000 ? net par mois). CONTACTS Envoyer un CV et une lettre de motivation ? : Pierre Zweigenbaum (pz at limsi.fr) et Brigitte Grau (bg at limsi.fr) en indiquant une liste d'au moins deux r?f?rents pouvant recommander le candidat. L'?QUIPE Le groupe ILES du LIMSI-CNRS poss?de une exp?rience reconnue dans la recherche d'informations pr?cises (recherche de r?ponses ? des questions), l'extraction d'informations et le traitement de la langue m?dicale. Ses projets en cours ou r?cents les plus pertinents pour Accordys sont ceux qui portent sur ces trois th?mes : le projet franco-allemand Qu?ro (recherche de r?ponses pr?cises ? des questions et reconnaissance d'entit?s nomm?es, t?che qu'il coordonne) et les projets ANR Akenaton (extraction d'informations ? partir de comptes rendus en cardiologie (Burgun et al., 2011) ; anonymisation de comptes rendus (Grouin & Zweigenbaum, 2011)) et InterSTIS (d?veloppement de lexique m?dical et mise en correspondance de terminologies (Cartoni & Zweigenbaum, 2010)). Le groupe ILES d?veloppe ?galement depuis plusieurs ann?es des m?thodes d'extraction de relations (Minard et al., 2011 ; Ben Abacha & Zweigenbaum, 2011) et de recherche de r?ponses pr?cises ? des questions m?dicales sur une base conceptuelle (Ben Abacha & Zweigenbaum, 2012). Il s'int?resse encore aux aspects multilingues, plus particuli?rement en fran?ais et en anglais, avec transfert entre les deux (Del?ger et al., 2009 ; Ben Abacha et al., 2012). Le LIMSI organise l'?valuation annuelle DEFT en fouille de textes depuis 2007, et se positionne chaque ann?e depuis 2009 dans les dix meilleurs syst?mes d'extraction d'informations m?dicales dans les ?valuations internationales i2b2 (Del?ger et al., 2009 ; Minard et al., 2011). Il a recrut? en 2012 deux nouveaux membres permanents sur ce th?me. R?f?rences Ben Abacha A, Zweigenbaum P. Automatic extraction of semantic relations between medical entities: a rule based approach. Journal of Biomedical Semantics, 2(Suppl 5):S4, 2011. Ben Abacha A, Zweigenbaum P. Medical Question Answering: Translating Medical Questions into SPARQL queries. In ACM SIGHIT International Health Informatics Symposium (IHI 2012), IHI '12, pages 41-50, New York, NY, USA, 2012. ACM. Ben Abacha A, Zweigenbaum P, Max A. Extraction d'information automatique en domaine m?dical par projection inter-langue : vers un passage ? l'?chelle. In: TALN 2012 (Traitement automatique des langues naturelles), Grenoble, 2012. ATALA. Burgun A, Rosier A, Temal L, Jacques J, Messai R, Duchemin L, Del?ger L, Grouin C, Van Hille P, Zweigenbaum P, Beuscart R, Delerue D, Dameron O, Mabo P, Henry C. Aide ? la d?cision en t?l?cardiologie par une approche bas?e ontologie et centr?e patient. IRBM, 32(2), 2011. Num?ro sp?cial ANR TECSAN, Technologies pour la sant? et l'autonomie. B Cartoni, P Zweigenbaum. Semi-automated extension of a specialized medical lexicon for French. In: LREC 2010, Sixth International Conference on Language Resources and Evaluation, pages 1050-1054, 2010. Grouin C, Zweigenbaum P. Une approche ? plusieurs ?tapes pour anonymiser des documents m?dicaux. RSTI-RIA, 25(4):525-549, 2011. Num?ro sp?cial Intelligence Artificielle et sant?. Herm?s-Lavoisier. L Del?ger, C Grouin, P Zweigenbaum. Extracting medical information from narrative patient records: the case of medication-related information. Journal of the American Medical Informatics Association, 17:555-558, 2010. L Del?ger, M Merkel, P Zweigenbaum. Translating medical terminologies through word alignment in parallel text corpora. Journal of Biomedical Informatics, 42(4):692- 701, 2009. Epub 2009 Mar 9. Minard AL, Ligozat AL, Ben Abacha A, Bernhard D, Cartoni B, Del?ger L, Grau B, Rosset S, Zweigenbaum P, Grouin C. Hybrid methods for improving information access in clinical documents: Concept, assertion, and relation identification. Journal of the American Medical Informatics Association, 18(5):588-593, 2011. Zweigenbaum P, Demner-Fushman D, Yu H, Cohen KB. Frontiers of biomedical text mining: current progress. Briefings in Bioinformatics. 8(5):358-375, 2007. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 21:01:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 23:01:39 +0200 Subject: Appel: 1st Workshop on Automatic Text Summarization of the Future Message-ID: Date: Fri, 15 Jun 2012 09:15:55 +0200 From: Horacio Saggion Message-ID: X-url: http://www.taln.upf.edu/pages/sepln_ws_2012/ ------------------------------------------------------------------------ 1st Workshop on Automatic Text Summarization of the Future *** Satellite workshop to SEPLN 2012 (Castell?n, Spain)*** http://www.taln.upf.edu/pages/sepln_ws_2012/ ------------------------------------------------------------------------ ABOUT THE WORKSHOP: ------------------------------------------------------------------------ Due to the great proliferation of online documents and information, it becomes necessary to develop automatic tools capable of filtering redundant and irrelevant information, thus presenting the most important one in an efficient and effective manner. This is the goal of Automatic Summarization, which aims at producing a concise document, keeping the essential information of a document or set of documents. Research into Automatic Summarization began in the 50s with the purpose of summarizing scientific texts. However, the interest for this type of documents decreased, while the interest in news article summarization grew. Recently, new challenges have appeared in this research area. In the context of the Internet, not only is information being constantly updated, but there is also a lack of quality control of what is being published on the Web. Social networks, blogs, reviews, etc. are non-traditional texts of informal nature, and they therefore constitute a big challenge for the new generation of summaries. High quality documentation such as technical/scientific articles and patents has not received in the past years all the attention that the field deserves. However, given the explosion of technical documentation available on the Web and in intranets, scientific and research and development institutions face a true scientific information deluge. Therefore, summarization should be a key instrument not only for reducing information content in this field but also for measuring information relevance in context, providing users with adequate answers in context. Another challenge for automatic summarization is the generation of abstracts, where it is necessary to take into consideration natural language generation techniques and be able to adapt them from one domain to another. In addition to these, efforts are needed to produce summaries in languages other than English and in multiple languages. Therefore, the main goal of the 1st Workshop on Automatic Text Summarization of the Future is to bring together researchers working on Automatic Summarization, encouraging research into little explored areas such as new textual gentres as well as old, forgotten ones, or summarization in languages other than English (for instance, Spanish). ------------------------------------------------------------------------ IMPORTANT DATES: ------------------------------------------------------------------------ Papers submission deadline (EXTENDED): 29 June 2012 Notification of decisions to authors: 20 July 2012 Workshop date: 7th September 2012 Camera-ready: 25 July 2012 ------------------------------------------------------------------------ SUBMISSIONS: ------------------------------------------------------------------------ We will accept full paper contributions for the workshop. These papers should be written in English, with a maximum length of 8 pages, including references. The submission guidelines can be found on the following page: http://www.sepln.org/?page_id=358 Reviewing for the papers will be blind: reviewers will not be presented with the identity of paper authors. Authors should avoid writing anything that makes their identity obvious in the text. Submissions should be original, and in particular should not have been formally published prior to submission for the workshop. Accepted papers will be published in the Workshop proceedings, with ISBN. We are negotiating the edition of a journal special issue for the best submitted papers. More to be announced. In order to submit your paper use the following link https://www.easychair.org/conferences/?conf=atsf2012. ------------------------------------------------------------------------ TOPICS OF INTEREST: ------------------------------------------------------------------------ Researchers are encouraged to submit papers including, but not restricted to the following topics: - Multi-document summarization - Summarization for new textual genres (blogs, microblogs, social networks, etc.) - Abstractive summarization - Multilingual/crosslingual summarization - Development of resources, corpora, tools, etc. for summary generation - Summarization for facilitating information access - Applications of Summarization and Demos - Summarization for technical and/or scientific documents - Intrinsic and/or Extrinsic Evaluation of Summaries ------------------------------------------------------------------------ ORGANIZERS: ------------------------------------------------------------------------ Horacio Saggion -- Universitat Pompeu Fabra, horacio.saggion at upf.edu Elena Lloret -- Universidad de Alicante, elloret at dlsi.ua.es Manuel Palomar -- Universidad de Alicante, mpalomar at dlsi.ua.es ------------------------------------------------------------------------ PROGRAM COMMITTEE: ------------------------------------------------------------------------ Laura Alonso (Universidad Nacional de C?rdoba, Argentina) Ahmet Aker (University of Sheffield, UK) Ester Boldrini (Universidad de Alicante, Spain) Hakan Ceylan (University of North Texas, USA) Javier Couto (Universit? Paris X, France) Iria da Cunha (Universitat Pompeu Fabra, Spain) Alberto D?az (Universidad Complutense de Madrid, Spain) Maria Fuentes (Universitat Polit?cnica de Catalunya, Spain) Robert Gaizauskas (University of Sheffield, UK) George Giannakopoulos (University of Trento, Italy) Nicolas Hernandez (Universit? de Nantes, France) Leila Kosseim (Concordia University, Canada) Guy Lapalme (Universite de Montreal, Canada) Jean-Luc Minel (Universit? Paris X, France) Paloma Moreda (Universidad de Alicante, Spain) Rafael Mu?oz (Universidad de Alicante, Spain) Ani Nenkova (University of Pennsylvania, USA) Thiago Pardo (Universidade de S?o Paulo, Brazil) Laura Plaza (Universidad Complutense de Madrid, Spain) Horacio Rodriguez (Universitat Polit?cnica de Catalunya, Spain) Juan Manuel Torres-Moreno (Universite d'Avignon, France) Jorge Vivaldi (Universitat Pompeu Fabra, Spain) Ren? Witte (Concordia University, Canada) Dina Wonsever (Universidad de la Republique, Uruguay) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 21:03:30 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 23:03:30 +0200 Subject: Seminaire: Alpage, Mark-Jan Nederhof, Input and output restrictions of weighted synchronous grammars, 22 juin 2012 Message-ID: Date: Fri, 15 Jun 2012 09:24:28 +0200 From: Marie Candito Message-ID: <4FDAE32C.2020807 at gmail.com> ************** S?minaire Alpage ******************* S?minaire de l'?cole doctorale de Paris Diderot : Il s'agit du s?minaire de recherche en linguistique informatique organis? par l'?quipe Alpage, ?quipe mixte Inria -- Paris Diderot, sp?cialis?e en analyse syntaxique automatique et en traitement du discours. Le prochain s?minaire se tiendra : * vendredi 22 juin de 11h ? 12h30 * en salle 3E91 ? l'UFRL, 16, rue de Clisson, 75013 Paris (3e ?tage gauche) Toute personne int?ress?e est la bienvenue. *********************************************************** Mark-Jan Nederhof (University of St Andrews) : "Input and output restrictions of weighted synchronous grammars" : We consider the problem of restricting the input or output of a synchronous grammar. Whereas solutions are easy to achieve in the unweighted case, complications arise for weighted and probabilistic grammars, especially when a compact representation is required. We also consider the problem of computing prefix probabilities, as a special case of restricting the input of a synchronous grammar to a regular string language. The emphasis will be on synchronous tree adjoining grammars, but also linear context-free rewriting systems will be addressed. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 21:08:04 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 23:08:04 +0200 Subject: Job: Poste d'ATER 27e section au 1er octobre 2012, INSA de Rennes, Date limite pour postuler : 29 juin 2012 midi Message-ID: Date: Fri, 15 Jun 2012 10:11:49 +0200 (CEST) From: Pascale Sebillot Message-ID: <2092155708.4017261.1339747909855.JavaMail.root at irisa.fr> X-url: http://www.insa-rennes.fr/recrutement.html Un poste d'ATER 27e section Rennes est ouvert ? l'INSA de Rennes pour un recrutement au 1er octobre 2012 (temps plein, soit 192h d'enseignement). Vous trouverez en fichier joint la fiche de poste qui est consultable sur le site de l'INSA (ou le sera dans quelques jours). Les candidats ont jusqu'au 29 juin 2012 ? midi pour transmettre leur dossier (cachet de la poste faisant foi). La fiche et le dossier de candidature sont accessibles (ou le seront dans quelques jours) ? http://www.insa-rennes.fr/recrutement.html Cordialement, Pascale S?billot Service des Ressources humaines Rennes, le 13 juin 2012 Campagne de recrutement - ATER 2012 Identification du poste Nature: ATER Nombre de postes : 1 Quotit? : 100 % N? de poste: MCF0034 Section CNU : 27 Composante : D?partement informatique Laboratoire : IRISA Date de prise de fonction 1er octobre 2012 Dur?e : 11 mois Enseignement Fili?res de formation concern?es L?ATER interviendra dans le d?partement informatique ainsi que dans les enseignements d?informatique dispens?s dans les autres d?partements de l?INSA, dont le d?partement STPI (1er cycle int?gr? de l?INSA), auxquels participent activement les enseignants-chercheurs du d?partement informatique. Objectifs p?dagogiques et besoin d'encadrement en TP et/ou TD Le candidat devra ?tre en mesure de participer ? des enseignements en informatique en dehors de sa sp?cialit? de recherche. En particulier, ces enseignements peuvent concerner, sans que cette liste soit exhaustive : ? la programmation (fonctionnelle, objet, imp?rative, logique, etc.), ? les bases de donn?es, ? la programmation assembleur, ? le test logiciel, ? la compilation, ? la programmation web, ? la logique s?quentielle, ? etc. Pour plus d?informations : (http://www.insa-rennes.fr/info/ et http://www.insa-rennes.fr/stpi/) Recherche IRISA-INSA est la composante INSA de l?UMR 6074 IRISA (Institut de recherche en informatique et syst?mes al?atoires). Cette unit? mixte de recherche a pour ?tablissements tutelles le CNRS, l?ENS Cachan (antenne de Bretagne), INRIA, l'INSA de Rennes, l'Universit? de Bretagne Sud, l'Universit? de Rennes 1 et T?l?com Bretagne. Le concours est ouvert ? toute candidature d?montrant une int?gration claire dans une ?quipe de l?IRISA. CONTACTS Enseignement : D?partements d?enseignement : Informatique et STPI Lieu(x) d?exercice : INSA de RENNES ?quipe p?dagogique : D?partement Informatique Nom directeur d?partement : Ivan Leplumey T?l directeur d?partement : 02 23 23 86 74 Email directeur d?partement : Ivan.Leplumey at insa-rennes.fr Recherche : Lieu(x) d?exercice : IRISA Nom directeur laboratoire : Bruno Arnaldi T?l directeur laboratoire : 02 99 84 72 61 Email directeur laboratoire : Bruno.Arnaldi at irisa.fr URL laboratoire : http://www.irisa.fr/ Description du laboratoire : IRISA Remarque : outre les pi?ces et informations explicitement demand?es dans le dossier de candidature, le candidat a la possibilit? de pr?senter un CV d?taill? contenant des arguments d?int?gration en enseignement et en recherche. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jun 15 21:09:38 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jun 2012 23:09:38 +0200 Subject: Appel: TheoreticAl and Computational MOrphology (TACMO) Message-ID: Date: Fri, 15 Jun 2012 17:18:48 +0200 From: Delphine Tribout Message-ID: <1339773528.4fdb5258e27ed at kmail.linguist.univ-paris-diderot.fr> X-url: http://www.cil19.org/ateliers/theoretical-and-computational-morphology/ **Apologies for cross-posting** Second Call for Papers ========================================================================= TheoreticAl and Computational MOrphology: New Trends and Synergies (TACMO) Workshop to be held in conjunction with the International Congress of Linguists, July 2013, Geneva (CH) www.cil19.org ========================================================================= Nowadays, theoretical morphology witnesses a revival due to the emergence of new formalization frameworks, both for inflectional and lexical morphology: canonical morphology, approaches based on analogy, rule-based approaches, to name just a few. All these approaches can potentially shed new light on computational processing of morphology, either for parsing or generation. In parallel, new computational techniques (such as (un-)supervised morphological acquisition) and formal frameworks bring a fresh look on morphological phenomena. Both domains tackle more or less implicitly the organization of the lexicon in general. The TACMO workshop aims at gathering these two facets of morphology - computational and theoretical formalization - in order to foster interactions and to highlight how both approaches benefit from each other. We mainly expect (but not exclusively) communication proposals on the following topics: - Inflectional, derivational and compositional morphology. - Problems raised by non affixal processes (templatic morphology, reduction and truncation, reduplication, blending and conversion) - Semantics-morphology interface and its role in the organization of the lexicon. - Syntax-morphology interface and its role in NLP systems. - Conception of lexical resources enriched with morphological information. Talk proposals should especially focus on the innovative aspects of the formalization and/or its benefits for automation. For computational approaches, the focus should be put on the new perspective that the implementation can bring on morphological descriptions. SUBMISSIONS: Authors should submit an anonymous extended abstract (3-4 pages) in English, containing the title of the talk, keywords and references. Abstract should be written in usual font (typically Times 12pt) and submitted in pdf format through EasyChair at the following address : https://www.easychair.org/conferences/?conf=tacmo2012 All abstracts will be blind reviewed by two members of the Scientific Committee. A book of abstract will be distributed at the workshop. IMPORTANT DATE: - July 15 2012: Deadline for abstract submission - October 2012: Notification to Authors - July 22-27 2013: Workshop ORGANIZERS: - Bruno Cartoni (University of Geneva) - Delphine Bernhard (University of Strasbourg) - Delphine Tribout (University of Lille 3) WORKSHOP WEBSITE: http://www.cil19.org/ateliers/theoretical-and-computational-morphology/ SUBMISSION WEBSITE: https://www.easychair.org/conferences/?conf=tacmo2012 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:18:54 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:18:54 +0200 Subject: Seminaire: Alpage, Carlos Subirats, Spanish FrameNet and its applications to NLP, 28 juin 2012 Message-ID: Date: Mon, 18 Jun 2012 11:41:34 +0200 From: Marie Candito Message-ID: <4FDEF7CE.7030407 at gmail.com> X-url: http://sfn.uab.es:9080/SFN ************************************************ Attention : horaire inhabituel : le jeudi 28 juin , ? 16h ************** S?minaire Alpage ******************* Il s'agit du s?minaire de recherche en linguistique informatique organis? par l'?quipe Alpage, ?quipe mixte Inria -- Paris Diderot, sp?cialis?e en analyse syntaxique automatique et en traitement du discours. Le prochain s?minaire se tiendra : * jeudi 28 juin ? 16h * en salle 3E91 ? l'UFRL, 16, rue de Clisson, 75013 Paris (3e ?tage gauche) Toute personne int?ress?e est la bienvenue. *********************************************************** Spanish FrameNet and its applications to NLP Carlos Subirats Autonomous University of Barcelona The meanings of lexical units (LUs) are constructed in relation to background knowledge. Frame Semantics is based on the assumption that the structure of this background knowledge can be analyzed in terms of semantic frames (Fillmore 1982, 1985). A frame is a schematic representation of a situation that includes its participants, props, and other conceptual elements. Each LU evokes a particular frame and profiles some element or aspect of that frame. The Spanish FrameNet Project (SFN) is creating an online lexical resource for Spanish based on Frame Semantics (Fillmore and Baker 2010, Ruppenhofer et al. 2010) and supported by corpus evidence. The aim of SFN is to document the range of semantic and syntactic combinatory possibilities (valences) of each word of Spanish in each of its senses by annotating example sentences and automatically organizing the annotation results. The project database is online and can be queried at http://sfn.uab.es:9080/SFN. The SFN corpus of annotated sentences has been used as a training corpus for Shalmaneser (Erk and Pad? 2006), a Frame-Semantics based statistical program for automatic semantic-role labeling. SFN has also begun to apply Construction Grammar (Fillmore and LeeGoldman 2011) to specifying the syntactic and semantic characteristics of Spanish grammatical constructions and linking them to semantic frames. SFN is being developed at the Autonomous University of Barcelona (Spain) in cooperation with the FrameNet Project, housed at the International Computer Science Institute (Berkeley, CA). SFN is sponsored by Spain's Ministry of Economy and Competitiveness (Grant Nr. FFI2011-23231). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:27:08 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:27:08 +0200 Subject: Job: Rectificatif, Poste d'ATER 27e, INSA de Rennes - Date limite pour postuler : 27 juin 2012 midi Message-ID: Date: Mon, 18 Jun 2012 10:17:07 +0200 (CEST) From: Pascale Sebillot Message-ID: <203052607.4552003.1340007427547.JavaMail.root at irisa.fr> X-url: http://www.insa-rennes.fr/recrutement.html Bonjour, la date limite pour postuler au poste d'ATER INSA 27e section a ?t? avanc?e au 27 juin midi. Veuillez trouver ci-dessous la fiche de poste et le dossier de candidature ? renvoyer par mail ? recrutement-ater at insa-rennes.fr Cordialement, Pascale S?billot ------------------------------------------------------------------------ Un poste d'ATER 27e section Rennes est ouvert ? l'INSA de Rennes pour un recrutement au 1er octobre 2012 (temps plein, soit 192h d'enseignement). Vous trouverez en fichier joint la fiche de poste qui est consultable sur le site de l'INSA (ou le sera dans quelques jours). Les candidats ont jusqu'au 29 juin 2012 ? midi pour transmettre leur dossier (cachet de la poste faisant foi). La fiche et le dossier de candidature sont accessibles (ou le seront dans quelques jours) ? http://www.insa-rennes.fr/recrutement.html Cordialement, Pascale S?billot ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:29:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:29:16 +0200 Subject: Appel: Fourth Workshop on Computational Approaches to Arabic Script-based Languages Message-ID: Date: Sun, 17 Jun 2012 02:02:57 -0400 (EDT) From: jsmith9887 at aol.com Message-Id: <8CF1A65FA1692EF-C84-8ECC at webmail-d133.sysops.aol.com> X-url: http://amta2012.amtaweb.org/CFP Fourth Workshop on Computational Approaches to Arabic Script-based Languages(CAASL4) In conjunction with The tenth biennial conference of the Association for Machine Translation in the Americas (AMTA-2012)San Diego CA, USA Thursday, November 1st, 2012 Three years after CAASL3, this workshop provides an opportunity for developers and researchers in Academia, the industry, and government to present their work, exchange ideas, and demonstrate systems that focus on the challenging task of dealing with all aspects in natural language processing for languages that use the Arabic script. It also provides an opportunity to assess the progress that has been made since the third workshop in 2009. Authors are invited to submit papers on completed original research and research in progress on any aspect of NLP for the Arabic Script-based languages. Papers should relate directly or indirectly to the following themes: Statistical and rule-based machine translation Translation Aids Evaluation Methods and Techniques of machine translation systems Localization and multilingual information retrieval systems Shallow and deep parsing Data driven approaches Entity extraction Tokenization and segmentation, Name matching Speech synthesis and recognition Text to speech systems Semantic analysis Knowledge Bases Information retrieval Semantic web and inferences Topic Detection and text summarization. Workshop Chairs Ali Farghaly Program Chair Farhard Oroumchian Workshop Dates and Deadlines The workshop will be held on Thursday November 1st, 2012 from 9 ? 5. Papers submission deadline: August 1st, 2012 Author notification: August 15, 2012 Camera Ready submissions due: September 1st, 2012 Website for submission https://www.softconf.com/amta2012/CAASL4/ Contact Information: alifarghaly at yahoo.com Papers must be submitted in pdf. Papers should not exceed 8 pages including references and tables. and should follow the formatting guidelines at http://amta2012.amtaweb.org/CFP. Papers should present original, previously unpublished or under consideration work. Papers will be anonymously reviewed by three members of the program committee. Organizing Committee Ali Farghaly and Farhard Oroumchian Tentative Program Committee Tim Buckwalter University of Maryland, USA Violetta Cavalli-Sforza AlAkhawayn University, Moroccoa Sherri Condon MITRE, USA Aly Fahmy Cairo University Mona Diab Columbia University, USA Joseph Dichy Lyon University, France Andrew Freeman University of Washington, USA Nizar Habash Columbia University, USA Lamia Hadrich Belguith University of Sfax, Tunisia Sarmad Hussain CRULP, Pakistan Mohamed Maamouri Linguistics Data Consortium, USA Farhad Oroumchian University of Wollongong in Dubai, United Arab Emirates Jean Sennellart SYSTRAN, France Khaled Shaalan The British University in Dubai, United Arab Emirates Ahmed Rafea The American University in Cairo, Egypt Imed Zitouni IBM, USA Azadeh Shakery University of Tehran, Iran Karim Bouzoubaa Mohamed Vth Agdal University, Morocco Abdelhadi Saudi ?cole Nationale de l'Industrie Min?rale, Morocco ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:30:23 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:30:23 +0200 Subject: Appel: ESSLLI 2013, Extended deadline (june 29) course/workshop proposals Message-ID: Date: Mon, 18 Jun 2012 14:25:19 +0200 (CEST) From: Johan Bos Message-ID: X-url: http://esslli2013.de/ ------------------------------------------------------------------ Call for Course and Workshop Proposals ESSLLI 2013 25th European Summer School in Logic, Language and Information Duesseldorf, Germany August 5-16, 2013 http://esslli2013.de/ EXTENDED DEADLINE DUE TO POPULAR DEMAND ------------------------------------------------------------------ IMPORTANT DATES =============== 29 June 2012: Proposal submission deadline (extended) 15 September 2012: Notification 1 June 2013: Course material due TOPICS AND FORMAT ================= Proposals for courses and workshops at ESSLLI'2013 are invited in all areas of Logic, Linguistics and Computing and Information Sciences. Cross-disciplinary and innovative topics are particularly encouraged. Each course and workshop will consist of five 90 minute sessions, offered daily (Monday-Friday) in a single week. Proposals for two-week courses should be structured and submitted as two independent one-week courses, e.g. as an introductory course followed by an advanced one. In such cases the ESSLLI programme committee reserves the right to accept just one of the two proposals. All instructional and organizational work at ESSLLI is performed completely on a voluntary basis, so as to keep participation fees to a minimum. However, organizers and instructors have their registration fees waved, and are reimbursed for travel and accommodation expenses up to a level to be determined and communicated with the proposal notification. ESSLLI can only guarantee reimbursement for at most one course/workshop organizer, and can not guarantee full reimbursement of travel costs for lecturers or organizers from outside of Europe. The ESSLLI organizers would appreciate any help in controlling the School's expenses by seeking complete coverage of travel and accommodation expenses from other sources. CATEGORIES ========== Each proposal should fall under one of the following categories. * FUNDAMENTAL COURSES * Such courses are designed to present the basics of a research area, to people with no prior knowledge in that area. They should be of elementary level, without prerequisites in the course's topic, though possibly assuming a level of general scientific maturity in the relevant discipline. They should enable researchers from related disciplines to develop a level of comfort with the fundamental concepts and techniques of the course's topic, thereby contributing to the interdisciplinary nature of our research community. * INTRODUCTORY COURSES * Introductory courses are central to ESSLLI's mission. They are intended to introduce a research field to students, young researchers, and other non-specialists, and to foster a sound understanding of its basic methods and techniques. Such courses should enable researchers from related disciplines to develop some comfort and competence in the topic considered. Introductory courses in a cross-disciplinary area may presuppose general knowledge of the related disciplines. * ADVANCED COURSES * Advanced courses are targeted primarily to graduate students who wish to acquire a level of comfort and understanding in the current research of a field. * WORKSHOPS * Workshops focus on specialised, usually topics of current interest. Workshops organisers are responsible for solliciting papers and selecting the workshop programme. PROPOSAL GUIDELINES =================== Course and workshop proposals should follow closely the following guidelines to ensure full consideration. Each course may have no more than two instructors, and each workshop no more than two organizers. All instructors and organizers must possess a PhD or equivalent degree by the submission deadline. Course proposals should mention explicitly the intended course category. Proposals for introductory courses should indicate the intended level, for example as it relates to standard textbooks and monographs in the area. Proposals for advanced courses should specify the prerequisites in detail. Proposals must be submitted in PDF format via: https://www.easychair.org/conferences/?conf=esslli2013 and include all of the following: o Personal information for each proposer: Name, affiliation, contact address, email, fax, homepage (optional) o General proposal information: Title, category o Contents information * Abstract of up to 150 words * Motivation and description (up to two pages) * Tentative outline * Expected level and pre-requisites * Appropriate references (e.g. textbooks, monographs, proceedings, surveys) o Practical information: * Relevant preceding meetings and events, if applicable * Potential external funding for participants ------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:34:33 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:34:33 +0200 Subject: Revue: L'information grammaticale sur Persee, numero 1 a 103 Message-ID: Date: Mon, 18 Jun 2012 15:57:16 +0200 From: Reza Mir-Samii Message-ID: <4FDF33BC.4040506 at univ-lemans.fr> X-url: http://www.persee.fr/web/revues/home/prescript/revue/igram Veuillez pardonner les envois multiples Nous avons le plaisir d'annoncer que les num?ros 1 ? 103 (1851 contributions, 1997-2004) de la revue "L'information grammaticale" sont, depuis le jeudi 14 juin 2012, en ligne sur le site Pers?e http://www.persee.fr/web/revues/home/prescript/revue/igram ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:36:49 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:36:49 +0200 Subject: Appel: L'Information grammaticale Message-ID: Date: Mon, 18 Jun 2012 18:06:20 +0200 From: Reza Mir-Samii Message-ID: <4FDF51FC.2060408 at univ-lemans.fr> X-url: http://www.informationgrammaticale.com/ Veuillez pardonner les envois multiples L'Information grammaticale est ouverte ? des propositions de publication pour la rubrique /Varia /de trois de ses quatre num?ros annuels (octobre, janvier, mars). Les propositions, accompagn?es d'un r?sum? de 500 ? 1000 signes, doivent ?tre adress?es ? articles_hors_programme at informationgrammaticale.com. Elles seront soumises ? une relecture anonyme par au moins deux relecteurs du Comit? international de lecture de la revue. L?avis motiv? des relecteurs (acceptation / refus) et leurs suggestions (?ventuelles) de modifications et corrections seront transmis aux auteurs dans les meilleurs d?lais. Calendrier des propositions d?article : Dans un premier temps, adressez-nous votre article avec votre adresse courriel *et votre adresse postale*. Calendrier pour la remise de votre article d?finitif corrig? : - 31 ao?t pour le num?ro d'octobre - 15 octobre pour le num?ro de janvier - 1er d?cembre pour le num?ro de mars Consignes : Vous devrez : - ne pas d?passer 37 500 signes espaces comprises (c'est-?-dire 6 pages de la revue), faute de quoi l'article vous sera renvoy? ; - proposer une analyse innovante du ph?nom?ne ?tudi? ; - respecter la date *annonc?e de remise de votre article car celui-ci sera soumis ? l'avis du comit? de lecture (deux relecteurs par article), qui pourra vous demander des rectifications, et dans tous les cas reste seul juge de l?acceptation ou du refus de votre article par la revue ; - r?diger conjointement un r?sum? *de cet article (en anglais et en fran?ais) de 500 ? 1000 signes qui sera mis en ligne sur le site de la revue pour pr?sentation de votre article. Des indications compl?mentaires se trouvent sur le site de la revue http://www.informationgrammaticale.com/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:38:12 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:38:12 +0200 Subject: Job: Post-doc, Multimedia Processing, CEA LIST Message-ID: Date: Mon, 18 Jun 2012 16:04:23 +0200 From: Adrian Popescu Message-ID: <4FDF3567.6080901 at cea.fr> X-url: http://www.kalisteo.fr/en/index.htm The Vision and Content Engineering Lab (LVIC) of CEA LIST (French Atomic Commission), an interdisciplinary group that works on multimedia and multilingual data analysis and understanding, with a focus on fast growing and large public application domains, announces the availability of a 2-years post doctoral position. The position is associated to the MUCKE project, funded within the CHIST-ERA funding scheme of the FP7, which fosters highly innovative and multidisciplinary collaborative projects in information and communication sciences and technologies. The project will start in October 2012. Its main objective is to devise new and reliable knowledge extraction models designed for multilingual and multimodal data shared on social networks. The post-doctoral researcher will first work on multimodal concept representation and then on user credibility estimation for multimedia flows. The first task will focuson the proposition of innovative language and image processing techniques as well as on their combination using information fusion techniques. Particular attention will be given to the scalability of the methods developed because one important project objective is to model a large number of concepts (hundreds of thousands) and an important volume of textual and visual documents (tens of millions). For textual documents, the objective is to depart from text representations as bags of words (unigrams) to representations as vectors of unambiguous concepts and entities through concept and entity recognition and disambiguation. For images, the main problems tacked in MUCKE are parsimonious local image description, large scale concept detection and concept visualness. Multimodal fusion will be based on probabilistic models that move beyond a scoring of similarity towards providing an actual probability of relevance. The second task will focus on the proposition of a novel model for estimating user credibility for multimedia flows, which combines content and structural features of the user's networked representation. Using results obtained for concept representation, credibility estimation will be cast as an information fusion problem, with a first step that combines textual and visual information and a second step that combines user content and context. Another important credibility related question that will be investigated is whether credibility should be a global characteristic of a user or domain related. Candidates must hold a PhD in Computer Science or expect to complete it before November 2012. Experience in Natural Language Processing, Information Retrieval or Computer Vision is expected, as well as willingness to learn new topics related to the post-doc. The lab is situated in Palaiseau, 20 km south of Paris and is part of the CEA LIST Institute, which focuses its research activities on developing innovative technologies for smart and complex systems. The post-doc will be part of the lab's multimedia team, which consists of researchers in NLP, computer vision and multimedia processing. The working language are English and French. A more detailed description of LVIC's activities is available at _http://www.kalisteo.fr/en/index.htm_. For further information, please send an expression of interest to adrian.popescu at cea.fr, attaching a CV. The position is availablefrom November 2012 and is open until filled. Adrian Popescu CEA LIST Vision and Content Engineering Lab Centre de Saclay - NanoInnov B?t. 861 adrian.popescu at cea.fr http://comupedia.org/adrian ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:42:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:42:48 +0200 Subject: Job: Ingenieur en developpement d'applications, Equipe SYNALP, LORIA Nancy (CDD INRIA 5 mois) Message-ID: Date: Wed, 20 Jun 2012 10:03:48 +0200 From: Claire Gardent Message-ID: X-url: http://talc.loria.fr/ALLEGRO-Nancy,254.html Offre d'Emploi : Ing?nieur en d?veloppement d'applications Equipe SYNALP, LORIA Nancy (CDD INRIA 5 mois) Contexte Le projet Allegro (http://talc.loria.fr/ALLEGRO-Nancy,254.html) est un projet financ? par l?Union Europ?enne qui vise ? proposer de nouvelles technologies permettant de faciliter l?apprentissage du fran?ais langue ?trang?re. Au sein de ce projet, l'?quipe Synalp a d?velopp? un jeu s?rieux interfa?ant un g?n?rateur automatique d'exercices de grammaire avec un univers virtuel. Dans ce jeu (I-FLEG), l'apprenant marque des points en compl?tant des exercices de grammaires. Mission L'ing?nieur recrut? travaillera sur l'interfacage entre les deux versions du jeu I-FLEG (l'une impl?ment?e dans Second Life et l'autre dans OpenSim) avec les modules de Traitement Automatique des Langues d?velopp?s par l'?quipe dont en particulier, un g?n?rateur d'exercices et un moteur de dialogue. Il s'agira en particulier, de modifier le syst?me existant selon les besoins du projet, de d?velopper des proc?dures permettant l'?valuation automatique du syst?me et de d?velopper le monde virtuel. Comp?tences et profil Formation: Bac+5, Master en informatique ou ?quivalent Languages de programmation: Java, Javascript and SQL Excellente connaissance des technologies du Web: PHP, GWT, JSP, Rails, Grails, etc Formation en informatique et connaissance du d?veloppement logiciel et des outils associ?s (gestionnaire de versions, etc.) Comp?tences ou aptitudes appr?ci?es: TAL, Python, LSL, int?r?t pour le d?veloppement de jeux Ma?trise du syst?me d'exploitation Linux Bonne facult? d'apprentissage et d'adaptation. Le go?t du travail en ?quipe. Lieu de travail, dur?e du contrat et salaire Adresse : LORIA Nancy, Equipe Synalp, Bat. B 615, rue du jardin botanique 54600 Villers l?s Nancy Type et dur?e : CDD 5 mois D?but : Juillet 2012 R?mun?ration : Environ 2 300 Euros brut mensuel Comment postuler Envoyer CV et lettre de motivation ? claire.gardent at loria.fr le plus rapidement possible Claire Gardent, Directrice de Recherche CNRS http://www.loria.fr/~gardent ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:45:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:45:16 +0200 Subject: Appel: Workshop Affect, Compagnon Artificiel, Interaction 2012 (WACAI12) Message-ID: Date: Wed, 20 Jun 2012 17:03:05 +0200 From: Alexandre Pauchet Message-ID: <4FE1E629.4030901 at insa-rouen.fr> X-url: http://wacai2012.imag.fr/ ******************************************************* APPEL A COMMUNICATION Workshop Affect, Compagnon Artificiel, Interaction 2012 (WACAI'12) Grenoble, 15 et 16 Novembre 2012 http://wacai2012.imag.fr/ ******************************************************* L'objectif du workshop *WACAI 2012* est de r?unir les recherches et d?veloppements en cours autour des th?mes des /Compagnons Artificiels (Agents Conversationnels anim?s -ACA-//et robots interactifs)/ et de l'/Informatique Affective/, afin que les chercheurs des communaut?s scientifiques concern?es puissent pr?senter leurs mod?les, outils, technologies et r?sultats de recherche. Le workshop *WACAI 2012* est une ouverture de la communaut? de recherche *ACA* vers celle des *robots interactifs* et de l'*Informatique affective*. Apr?s les pr?c?dentes ?ditions du workshop WACA, organis?es successivement ? Grenoble (2005), ? Toulouse (2006), ? Paris (2008) et ? Lille (2010), cette nouvelle ?dition ajoute l?*Interaction* comme sujet central en favorisant les rencontres avec les communaut?s de recherche en robotique, informatique affective mais aussi sciences humaines et sociales. Les th?mes sugg?r?s couvrent pour l'essentiel 4 axes de recherche : 1. Compagnons Artificiels: ACA et robots interactifs 2. Mod?les psychologiques et mod?les computationnels pour l'interaction affective 3. Signaux affectifs: d?tection et synth?se de comportements affectifs, annotation et repr?sentation ? partir de texte, de son et d'image 4. ?tude utilisateurs, ergonomie et ?valuation des syst?mes affectifs Liste indicative et non exhaustive des th?mes : * Agents conversationnels, agents conversationnels anim?s * Personnages virtuels * Robots personnels, robots interactifs * Robots domestiques, robots compagnons * Architectures logicielles et technologies des compagnons artificiels * Plateformes d'exp?rimentation * Mod?les cognitifs * Mod?les des ?motions * Repr?sentation des connaissances et raisonnement * Interaction multimodale * Interaction Humain-comapagnons artificiels * Emotion et communication (expression et reconnaissance) * Construction et traitement de corpus d'interactions * M?thodologies d'?valuation * Applications et retours d'exp?rience ******************************************************* *** Soumissions Les propositions de communication, articles mi-longs (8 pages) ou r?sum?s de posters ou d?monstrations (2 pages) (voir le site de la conf?rence pour plus de d?tails sur la mise en page), r?dig?es en Fran?ais ou en Anglais, devront ?tre soumises le *20 septembre 2012* au plus tard sur le site web de la conf?rence : http://wacai2012.imag.fr/. *** Comit? de programme Pr?sidents: Dominique Duhaut (dominique.duhaut at univ-ubs.fr), Alexandre Pauchet (pauchet at insa-rouen.fr) *** Comit? d'organisation Pr?sidents: Sylvie Pesty (sylvie.pesty at imag.fr), Carole Adam (carole.adam at imag.fr) *** Calendrier 20 septembre 2012 : R?ception des contributions 15 octobre 2012 : Notification d'acceptation 25 octobre 2012 : R?ception des versions finales des articles 15 et 16 novembre 2012 : WACAI'12 ******************************************************* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jun 20 18:47:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 20 Jun 2012 20:47:14 +0200 Subject: Conf: ECAI 2012, Montpellier, France, 27-31 August 2012 Message-ID: Date: Wed, 20 Jun 2012 18:02:32 +0200 From: ECAI 2012 Publicity Message-ID: <4FE1F418.6090703 at lirmm.fr> X-url: http://www2.lirmm.fr/ecai2012/ ###################################################################### ## ECAI-2012 ## Call for participation ## ECAI-2012 ## ###################################################################### ## REGISTRATION IS OPEN ## Early registration until July 10 The Twentieth European Conference on Artificial Intelligence 27-31 August 2012 Montpellier, France http://www2.lirmm.fr/ecai2012/ ###################################################################### ECAI is the biennial European Conference on Artificial Intelligence organized by the European Coordinating Committee for Artificial Intelligence (ECCAI); it is the premier forum for presenting Artificial Intelligence results in Europe. The twentieth conference in this series, ECAI 2012, will take place in Montpellier (France) August 27-31. ECAI 2012 will gather researchers and practitioners of Artificial Intelligence from all over the world; they will present the latest results and identify new trends and challenges in all subfields of Artificial Intelligence as well as demonstrate innovative applications and uses of advanced Artificial Intelligence technology. In addition to the main technical track, ECAI 2012 will feature keynote and invited talks, invited tutorials, an elaborate workshop program, a system demonstration track, a Turing centenary celebration, in which we will celebrate the 100th anniversary of the birth of Alan Turing and his influence on Artificial Intelligence, and a special session on Highlights of European AI, to celebrate the 20th ECAI conference and 25 years of AI Communications. ECAI 2012 will also feature the 6th STAIRS (STarting AI Researcher Symposium) and the 6th PAIS (Conference on Prestigious Applications of Intelligent Systems) as sub-conferences. The 6th RuleML (International Symposium on Rules) will be co-located. ECAI-2012 will be held in the beautiful city of Montpellier, France. With excellent opportunities for sightseeing and gastronomy, Montpellier promises to be a wonderful venue for a memorable conference. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:04:21 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:04:21 +0200 Subject: Job: Researcher in Computational Linguistics, Duesseldorf, Germany Message-ID: Date: Thu, 21 Jun 2012 10:29:06 +0200 From: Laura Kallmeyer Message-ID: X-url: http://www.sfb991.uni-duesseldorf.de/en/sfb991/ X-url: http://www.phil-fak.uni-duesseldorf.de/beyond-cfg/. The Department for Computational Linguistics of the Heinrich-Heine-Universitaet Duesseldorf, Germany (Chair of Computational Linguistics: Prof. Dr. Laura Kallmeyer) offers a position as wissenschaftliche/r Mitarbeiter/in (TV-L E13 100%) for a postdoc or an advanced doctoral student. The position starts in October 2012. Its duration is limited to two years, maybe with the possibility of an extension. It includes 4 hours of teaching per week in computational linguistics. Teaching is supposed to be in German, if not immediately, then after a short time. Therefore, if the candidate does not speak German yet, he/she should be willing to learn and practice it. The candidate should preferably have some teaching experience and should be willing to participate in the research activities conducted at the Department for Computational Linguistics. These cover the following areas: 1. data-driven parsing 2. statistical machine translation 3. syntax-semantics interface, in particular (but not limited to) frame-based (i.e., feature-structure-based) semantic composition 4. grammar formalisms, in particular (but not limited to) Tree Adjoining Grammars The Department for Computational Linguistics offers a rich and stimulating research environment: It participates with several projects in the Collaborative Research Center (CRC) 991 funded by the DFG, http://www.sfb991.uni-duesseldorf.de/en/sfb991/. The CRC is a large collection of research projects; it focusses on the structure of representations in language, cognition and science with a particular emphasis on frames and on lexical semantics. Besides the CRC projects there is also a project on parsing and machine translation, http://www.phil-fak.uni-duesseldorf.de/beyond-cfg/. Salary is on the German scale TV-L E13. The position is for two years. The starting date is October 1, 2012. Applications should include the following: 1. Cover letter outlining interest in the position and academic goals 2. CV 3. Copies of certificates 4. If available, a copy of the PhD thesis and other sample publications. For further questions, please send an email to kallmeyer at phil.uni-duesseldorf.de. Applications should be sent in electronic form to kallmeyer at phil.uni-duesseldorf.de. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:06:44 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:06:44 +0200 Subject: Appel: JapTAL2012, the 8th International Conference on Natural Language Processing (Submission site open) Message-ID: Date: Thu, 21 Jun 2012 13:01:28 +0200 From: Hitoshi ISAHARA (au lieu de Sylviane CARDEY ) Message-Id: <5.0.2.1.2.20120621125626.05ebccd8 at pop.univ-fcomte.fr> X-url: http://lang.cs.tut.ac.jp/japtal2012/ X-url: http://senldogo0039.springer-sbm.com/ocs/home/JapTAL2012 JapTAL2012, the 8th International Conference on Natural Language Processing, will be held in Kanazawa, Japan, in October 2012. http://lang.cs.tut.ac.jp/japtal2012/ The submission page of JapTAL 2012 is now open http://senldogo0039.springer-sbm.com/ocs/home/JapTAL2012 The conference proceedings will be published by Springer Publishers as a volume in the Lecture Notes in Computer Science/Lecture Notes in Artificial Intelligence (LNCS/LNAI) series. Please visit above mentioned web page by Springer and upload your papers. Because of the delay of preparing submission page, we extend paper due until 29th of June, 2012. We look forward to meeting with you in Kanazawa! Best regards, Hitoshi Isahara Conference Chair of JapTAL2012 Professor of Toyohashi University of Technology ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:10:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:10:57 +0200 Subject: Appel: 39th SOFSEM 2013, Data, Information, and Knowledge Engineering Track Message-ID: Date: Thu, 21 Jun 2012 16:48:21 +0200 From: Harald Sack Message-ID: X-url: http://www.sofsem.cz [Apologies for receiving multiple copies] 39TH INTERNATIONAL CONFERENCE ON CURRENT TRENDS IN THEORY AND PRACTICE OF COMPUTER SCIENCE (SOFSEM 2013) Call for Papers January 26-31, 2013 VZ Bedrichov (Spindleruv Mlyn), Czech Republic http://www.sofsem.cz Deadline for Abstracts: June 22, 2012 Conference Proceedings will be published as Springer LNCS. * TRACKS SOFSEM 2013 will consist of four tracks and will be focussed on the following topics: - FOUNDATIONS OF COMPUTER SCIENCE (chaired by Guiseppe F. Italiano) algorithmic game theory, algorithms and data structures, including sequential, parallel, distributed, randomized, online and approximation algorithms, automata theory, grammars, formal languages, rewriting, computational biology, complexity theory, computational geometry, computational learning theory, discrete mathematics related to computer science, quantum computing, logics and semantics of programs, theory of databases, semi-structured data, and finite model theory, theory of programming languages. - SOFTWARE and WEB ENGINEERING (chaired by Jerzy Nawrocki) Application Engineering: engineering methodologies, agile development, modelling and model driven development, requirements engineering, architecture and design, components and reuse, program comprehension and visualization, testing, human-computer interaction, tools and development environments, software dependability, safety and reliability, web service-based architectures and applications, semantic web services, web service composition. Data Engineering: data and information modelling, data and information semantics, data privacy and security, semantics discovery and representation, social web applications, context aware applications, web 2.0 technologies, personalized software and web applications, information extraction, mobile data and Information, future Internet applications. - DATA, INFORMATION and KNOWLEDGE ENGINEERING (chaired by Harald Sack) databases and database architectures, machine learning, knowledge discovery and data mining, provenance and trust in data management and knowledge engineering, data integration, multimedia databases and multimedia retrieval, information retrieval, intelligent agents, multi-agent systems, knowledge engineering and acquisition, knowledge modeling and processing, semantic web technologies, ontology engineering and ontology dynamics, linked data and open data, information and knowledge visualization. - SOCIAL COMPUTING and HUMAN FACTORS (chaired by Frans C. A. Groen) intelligent systems / robotics, computer vision, intelligent vehicles, datamining and logic, visualisation, graphics, virtual reality, security, cryptography, multimedia, human factors, computational science. Moreover, for PhD students there will be the traditional `STUDENT RESEARCH FORUM'. Student papers (with a checked Student Contribution at the Submission System) not accepted for a regular track but of sufficient high quality can be selected for in the Student Research Forum (to be published in a local proceedings). Their authors will have a nice opportunity to present their ideas in front of the main SOFSEM audience. The detailed information about tracks, topics and Program Committee Members is presented at http://www.sofsem.cz/sofsem13/index.php?page=call The submission system is available at: https://www.easychair.org/account/signin.cgi?conf=sofsem2013 IMPORTANT DATES Abstract deadline: June 22, 2012 Full paper deadline: June 29, 2012 Acceptance notification: September 21, 2012 Camera-ready papers: October 5, 2012 Conference: January 26-31, 2013 LOCATION AND VENUE Location, venue and leisure activities of SOFSEM 2013 are presented at: http://www.sofsem.cz/sofsem13/index.php?page=location http://www.sofsem.cz/sofsem13/index.php?page=leisure We hope that you find the tracks for SOFSEM 2013 interesting, and that you will join us and enjoy the traditional, inspiring SOFSEM atmosphere. Please do not hesitate to contact us in case you have any questions. We are looking forward to see you in Spindleruv Mlyn at SOFSEM 2013, Peter van Emde Boas (Program Committee Chair) Martin Rimnac (Organising Committee Chair) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:11:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:11:46 +0200 Subject: Appel: revue TAL, Note de lecture (STEDE) Message-ID: Date: Fri, 22 Jun 2012 09:00:20 +0200 (CEST) From: Denis Maurel Message-ID: <373115763.391567.1340348420651.JavaMail.root at mail10> Appel: revue TAL - Note de lecture (STEDE) La revue TAL publie r?guli?rement des notes de lecture. Nous recherchons un coll?gue souhaitant lire le livre: "Manfred STEDE. Discourse Processing. Morgan & Claypool publishers. 2011. 155 pages" et pr?t ? en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoy? gracieusement en ?change du service rendu). Cette note de lecture doit ?tre r?dig?e en fran?ais (trois pages maximum, au format de la revue) et envoy?e en septembre 2012. D'autres compte-rendu sont possibles si vous avez lu r?cemment un ouvrage qui vous a int?ress? et si vous ?tes pr?t ? partager votre lecture avec la communaut?... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:13:15 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:13:15 +0200 Subject: These: Asma Ben Abacha, Recherche de reponses precises a des questions medicales Message-ID: Date: Fri, 22 Jun 2012 09:24:36 +0200 (CEST) From: "Asma Ben Abacha" Message-ID: X-url: http://perso.limsi.fr/abacha Bonjour, J'ai le plaisir de vous inviter ? ma soutenance de th?se intitul?e "Recherche de r?ponses pr?cises ? des questions m?dicales : le syst?me de questions-r?ponses MEANS". La soutenance aura lieu le jeudi 28 juin ? 9h30 dans la salle de conf?rence du LIMSI, B?t 508, Rue Louis De Broglie, Campus de l'universit? d'Orsay [http://www.limsi.fr/Pratique/acces/]. Le jury sera compos? de : M. Guy Lapalme, Professeur, Universit? de Montr?al (Rapporteur) M. Thierry Poibeau, Directeur de recherche, LATTICE-CNRS (Rapporteur) M. St?fan Darmoni, Professeur, CHU de Rouen (Examinateur) M. Olivier Ferret, Chercheur, CEA-LIST (Examinateur) M. Joseph Mariani, Directeur de recherche, LIMSI-CNRS (Examinateur) M. Pierre Zweigenbaum, Directeur de recherche, LIMSI-CNRS (Directeur de th?se) Vous ?tes aussi cordialement invit?s au pot qui suivra. Bien cordialement, Asma Ben Abacha http://perso.limsi.fr/abacha ================== R?sum? de la th?se ================== La recherche de r?ponses pr?cises ? des questions formul?es en langue naturelle renouvelle le champ de la recherche d'information au niveau des objectifs, des probl?matiques et des m?thodes. De nombreux travaux ont eu lieu sur la recherche de r?ponses ? des questions factuelles en domaine ouvert, notamment dans le cadre des campagnes TREC QA. Moins de travaux ont port? sur la recherche de r?ponses en domaine de sp?cialit?, en particulier dans le domaine m?dical ou biom?dical. Plusieurs conditions diff?rentes sont rencontr?es en domaine de sp?cialit? comme les lexiques et terminologies sp?cialis?s, les types particuliers de questions, entit?s et relations du domaine ou les caract?ristiques des documents cibl?s. Les travaux entrepris dans cette th?se ont pour but d'?tudier les approches permettant de r?pondre automatiquement aux questions m?dicales, afin de faciliter la recherche d'informations pr?cises par les patients ou les m?decins. Dans une premi?re partie, nous ?tudions les m?thodes permettant d'analyser s?mantiquement les questions pos?es par l'utilisateur ainsi que les textes utilis?s pour trouver les r?ponses. Pour ce faire nous utilisons des m?thodes hybrides pour deux t?ches principales : (i) la reconnaissance des entit?s m?dicales et (ii) l'extraction de relations s?mantiques. Ces m?thodes combinent des r?gles et patrons construits manuellement, des connaissances du domaine et des techniques d'apprentissage statistique utilisant diff?rents classifieurs. Ces m?thodes hybrides, exp?riment?es sur diff?rents corpus, permettent de pallier les inconv?nients des deux types de m?thodes d'extraction d'information, ? savoir le manque de couverture potentiel des m?thodes ? base de r?gles et la d?pendance aux donn?es annot?es des m?thodes statistiques. Dans une seconde partie, nous ?tudions l'apport des technologies du web s?mantique pour la portabilit? et l'expressivit? des syst?mes de questions-r?ponses. Dans le cadre de notre approche, nous exploitons ces technologies pour repr?senter les informations extraites et les interroger s?mantiquement. Enfin, nous pr?sentons et ?valuons notre syst?me de questions-r?ponses, appel? MEANS, qui utilise ? la fois des techniques de TAL, des connaissances du domaine et les technologies du web s?mantique pour r?pondre automatiquement aux questions m?dicales. Cette approche permet de rechercher des r?ponses ? partir des annotations s?mantiques des corpus cibles. Elle permet de plus d'envisager de compl?ter les informations manquantes dans ces annotations en interrogeant les bases de connaissances RDF disponibles. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:15:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:15:59 +0200 Subject: Journee: Journee d'etude STIH & PRAXILING, De l'autre cote du media, 2 juillet 2012, Paris Message-ID: Date: Fri, 22 Jun 2012 10:02:15 +0200 From: Agata Jackiewicz Message-ID: <4FE42687.1030903 at paris-sorbonne.fr> *Journ?e d'?tude : "De l'autre c?t? du m?dia : radiographie d'une matinale dans les coulisses de France Inter"* Coord. : Agata Jackiewicz (STIH, Universit? -- Sorbonne), Laurent Faur?, Fran?ois Perea & Arnaud Richard (PRAXILING - UMR 5267 CNRS, Universit? Montpellier 3) 2 juillet 2012 Universit? Paris-Sorbonne, Maison de la Recherche, D035 28, rue Serpente, Paris 6e *Objet *: Le 3 mai 2011, au lendemain de la mort d'O. Ben Laden, une ?quipe de chercheurs a pu enregistrer dans les studios de France Inter le processus de production et de diffusion des ?missions d'information de la s?quence matinale de la station autour des retomb?es et commentaires d'un ?v?nement ? port?e internationale. Cette enqu?te ethnographique s'inscrit dans un programme plus vaste (? Observatoire des pratiques m?diatiques ?mergentes ?, projet de Praxiling soutenu par la MSH-Montpellier) et vise ? examiner les sp?cificit?s de la production de l'information radiophonique pour tenter de rendre compte de la vitalit? notable de ce m?dia dit ? traditionnel ?, ? l'heure du num?rique. Il s'agit ainsi d'?tudier d'abord en quoi des cours d'action observables d?s la conf?rence de r?daction initiale jusqu'au travail de la r?gie, en passant par les ?changes ? micro ouvert ou ferm? en studio, tissent une relation dynamique avec la production discursive d?livr?e sur les ondes. Cet ancrage prax?ologique assure l'analyse des observables langagiers et communicationnels orient?s vers la publicisation. Un r?seau interdisciplinaire de chercheurs en sciences du langage s'est en cons?quence employ? ? examiner syst?matiquement les donn?es recueillies. L'originalit?, la densit? et l'h?t?rog?n?it? du corpus -- constitu? du recueil de donn?es vid?os, audios (?missions diffus?es) transcrites, ?crites (notes des animateurs/ journalistes, donn?es de la presse du jour, des agences...) -- ont pu ouvrir ? de multiples d?marches analytiques et ? leur croisement. La journ?e d'?tude sera donc consacr?e ? la d?clinaison d?taill?e de la production discursive journalistique en ses divers ?tats : ressources intonatives, sp?cificit?s rythmiques, accompagnements gestuels professionnels internes (avec la r?gie, notamment) ou communicationnels (qu'ils soient visibles ou non ? partir des vid?os t?l?chargeables sur le site de l'?mission), proc?dures de formatage et de r??criture des ?nonc?s informatifs, dimensions textuelle et rh?torico-discursive. Des sp?cialistes de l'analyse prosodique, du discours, de la conversation, du traitement automatique du langage, de la logom?trie et de s?mantique op?rationnelle croiseront leurs approches pour rendre compte des processus d'?criture et d'oralisation, de mise en forme, de subjectivation / d?subjectivation, de proc?dures ?valuatives, des fonctionnements dialogiques, intersubjectifs et interactionnels, des formats et strat?gies d'int?gration de la r?ception, du lien entre micro- et macro- ph?nom?nes dans la structuration de la production m?diatique... L'objectif de la rencontre vise en premier lieu ? restituer les premiers r?sultats scientifiques de l'enqu?te de terrain aux professionnels concern?s, au-del? de l'int?r?t d?j? relativement traditionnel des linguistes pour le discours et l'expression m?diatiques. Les partenariats engag?s pour l'occasion entre plusieurs laboratoires de recherche francophones mais aussi l'?cole sup?rieure de journalisme (ESJ-Lille/Montpellier/Paris) et le Centre de liaison entre l'?cole et les m?dias d'information (Cl?mi) permettent une investigation fouill?e des pratiques professionnelles observ?es. On vise au final, ? travers la mise en d?bat de la prax?ologie globalement esquiss?e, ? nourrir un dialogue innovant entre formateurs, journalistes, sp?cialistes de l'?ducation aux m?dias et chercheurs. *Programme *: 8h45Accueil des participants 9h00 J. DUCOS (directrice de l'?quipe STIH, Universit? Paris-Sorbonne) Mot d'ouverture A. Jackiewicz(STIH, Paris-Sorbonne) et L. Faur? (PRAXILING, Universit? Paul-Val?ry Montpellier III) Pr?sentation de la journ?e : une approche crois?e de donn?es in?dites 9h20 L. Faur? (PRAXILING, Universit? Paul-Val?ry Montpellier III) Information radiophonique sous tension : du fil d'actualit? ? la gestion du direct 10h00 M. Vidak (STIH, Paris-Sorbonne) Le discours m?diatique th??tralis? : entre l'objectivit? et l'efficacit? 10h40 Pause 11h00 F. Perea (PRAXILING, Universit? Paul-Val?ry Montpellier III) Travail de l'interpellation et de l'?motion dans le lancement des journaux radiophoniques 11h40 F. Hailon (Laboratoire lig?rien de linguistique,Universit? de Tours) Ev?nementialisation et fictionnalisation d'un discours radiophonique : une revue de presse de Bruno Duvic 12h20 Repas 14h30 F. Bilhaut (Noopsis), A. Jackiewicz (STIH, Paris-Sorbonne) Quelques exp?riences de TAL sur le discours radiophonique : le cas de la revue de presse 15h10 A. Richard (PRAXILING, Universit? Paul-Val?ry Montpellier III) Quotas en ?quipe de France de football : sources de rebondissements dans une chronique matinale 15h50 Pause 16h10 Y. Soul? (LIRDEF IUFM Montpellier 2 -- CLEMI) La matinale de France Inter, les marques discursives de la professionnalit? journalistique 16h50 Table-ronde : Quelle professionnalit? pour l'avenir de la radio ? J. Bouvier(M?diateur de France Inter) [pressenti], D. Deloit (Directeur de l'ESJ-Pro), Y. Soul? (LIRDEF & CLEMI). 17h30 Cl?ture de la journ?e **** Entr?e libre ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:26:24 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:26:24 +0200 Subject: Appel: Workshop on Language Technology for Decision Support Message-ID: Date: Fri, 22 Jun 2012 16:27:01 +0100 From: "Michel G?n?reux" Message-Id: <20120622152701.M83249 at clul.ul.pt> Workshop on Language Technology for Decision Support October 25, 2012 Lund, Sweden http://www.clul.ul.pt/component/content/article/448-sltc-2012 The workshop is organized as a part of SLTC, the Fourth Swedish LanguageTechnology Conference, which takes place on 24-26 October 2012 in Lund,Sweden. The workshop is held on October 25, 2012. Details about the conference: http://nlp.cs.lth.se/events/sltc_2012/ This workshop will investigate the relation and complementarity betweenfactual and opinionated information for decision-making. Traditionally,natural language processing approaches and tools have segregated the objectiveand subjective treatments of information in two separate fields of expertisewhere the two never met. This workshop is an attempt to fill this gap andexamine the relation and complementarity that exists between the factual andthe speculative in order to build a more subtle representation of the state ofaffairs. In their everyday routine, managers, professionals, even laymen, must dealwith a large amount of textual information to help make their decisions.Without appropriate language technology tools to extract, classify andsynthesize this information, decision-makers would have to read a large numberof so-called objective sources but arguably even more subjective andopinionated material. Facts and opinions would then be combined together tocreate an accurate picture of the entity or issue we seek to understand. Factsare of course crucial to make professional or personal decisions, but opinionsmay sometimes play a key role. For this workshop we have identified twospecific domains where factual and subjective information have an importance:brand management and health (patient empowerment and education), with an eyetowards clinical decision. However, any relevant domains where the factual andthe opinionated co-exist would be considered. We encourage submissions addressing the following questions: * Relevance of the extracted information (certainty, speculation andsubjectivity) in a decision making context * How to combine objective and subjective information in NLP-based decisionmaking to produce a better understanding * Exploitation of the objective and subjective information: * How do managers combine the factual and the less tangible to favour the success of their brand? * How does the patient understand a medical decision given objectiveinformation by the physician and subjective information related to his/herfeelings, as well as discussions with other patients? * How does a physician combine what the data show about a patient withmore subjective information like symptoms or informed opinion from a third party? We would like to invite anyone currently researching in the areas of sentimentanalysis, information extraction, text mining, BioNLP or automaticsummarization to submit apaper, including submissions presenting a discussion of a system. Important dates * September 10th: paper submission by email to genereux at clul.ul.pt * October 1st: notification of acceptance * October 15th: camera-ready papers for publication Submission Papers should be a maximum of 8 pages, all included and follow the SLTC format. Only pdf files are accepted. Style files: The style files will be the same as for SLTC 2010. (Confirmed) Program committee members - Khurshid Ahmad (Trinity College Dublin, Ireland) - Dina Demner-Fushman (NIH/NLM/LHC, USA) - Agata Jackiewicz (Universit? Paris-Sorbonne, France) - Jonathon Read (University of Oslo, Norway) - Ricardo Ribeiro ((DCTI)/IUL (ISTA) of ISCTE-IUL, Portugal) - Pierre Zweigenbaum (LIMSI, France) Workshop organisation The duration of the workshop is three hours. There will be regular (short)talks and according to the number and the quality of the submissions, posters. Every paper will be reviewed by 2 members of the program committee. Allaccepted papers will be published in the NEALT Proceeding Series. Authors ofthe accepted papers will have to sign an agreement with NEALT publishers. Details on place and time are provided at the conference website. Workshop organizers * Michel G?n?reux (CLUL, Universidade de Lisboa, Lisboa, Portugal, genereux at clul.ul.pt ) * Thierry Hamon (LIM&BIO, Universit? Paris 13, Bobigny, France, thierry.hamon at univ-paris13.fr ) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:28:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:28:14 +0200 Subject: Appel: AMTA Workshop on Monolingual Machine Translation (MONOMT 2012) Message-ID: Date: Sat, 23 Jun 2012 11:01:04 +0200 (CEST) From: "Artem Sokolov" Message-ID: <8c72079ac6fb947320d8c267d0cb72f7.squirrel at webmail.limsi.fr> X-url: http://computing.dcu.ie/~tokita/MONOMT/monomt.htm Call for Papers: AMTA 2012 Workshop on Monolingual Machine Translation (MONOMT 2012) Submission deadline: August 3, 2012 Workshop date: November 1, 2012 Location: San Diego, United States http://computing.dcu.ie/~tokita/MONOMT/monomt.htm Description: Due to the increasing demands for high quality translation, monolingual Machine Translation (MT) subtasks are frequently encountered in various occasions, where one MT task is decomposed into several subtasks some of which can be called `monolingual'. Such monolingual MT subtasks include: (1) MT for morphologically rich languages, [Bojar, 08] aimed at dealing with morphologic richness of the target, as is the case with the English-Czech (EN-CZ) language pair. An MT task is thus split into two subtasks: first, English is (`bilingually') translated into simplified Czech and then, the obtained morphologically normalized Czech is (`monolingually') translated into morphologically rich Czech; (2) system combination [Matusov et al., 05], where a source sentence is first translated into the target language by several MT systems, and then, the obtained translations are combined to create / generate the output in the same language; (3) statistical post-editing [Dugast et al., 07; Simard et al., 07], where a source sentence is first translated into the target language by a rule-based MT system and then, the obtained output is `monolingually' translated by an SMT system; (4) domain adaptation using transfer learning [Daume III, 07]: the source side written in a `source' domain (e.g., newswires) is converted into the target side written in a `target' domain (e.g., patents); (5) transliteration between phonemes / alphabets [Knight and Graehl, 98]; (6) considering reordering issues (SVO and SOV) [Katz-Brown et al., 11]; (7) MERT process [Arun et al., 10]; (8) translation memory (TM) and MT integration [Ma et al., 11]; (9) paraphrasing for creating additional training data or for evaluation purposes. A distinction could be established between bilingual MT tools (B-tools) and monolingual MT tools (M-tools) that may be exploited for monolingual MT. Consider, e.g., monolingual subtasks such as MT for morphologically rich languages, statistical post-editing, or transliteration and a task of system combination or domain adaptation as respective representatives. The latter group is often approached with monolingual M-tools like monolingual word alignment [Matusov et al., 05; He et al., 08] and the minimization of Bayes risk [Kumar and Byrne, 02] (on the outputs of combined systems). However, the former usually employs bilingual MT tools, like GIZA++ [Och and Ney, 04] to extract bilingual phrases and MAP decoding on them. The way M-tools and B-tools are used for monolingual MT is an issue of particular interest for this workshop. This workshop is intended to provide the opportunity to discuss ideas and share opinions on the question of the applicability of M-tools or B-tools for monolingual MT subtasks, and on their respective strengths and weaknesses in specific settings. Furthermore we wish to provide opportunity to demonstrate successful usecases of M-tools. Possible questions, that are encouraged to be addressed during the workshop, include: - ways of applying M-tools to monolingual MT subtasks such as MT for morphologically rich languages and statistical post-editing. - investigation of the suitability of B-tools or M-tools for monolingual MT subtasks. - performance improvements of monolingual word alignment tools, since these are necessary for specific monolingual subtasks, such as MT for morphologically rich languages and statistical post-editing. TOPICS OF INTEREST Original papers are invited on different aspects of monolingual MT, such as: MT for morphologically rich languages system combination statistical post-editing domain adaptation MERT process MT for reordering mismatched language pairs (SVO and SOV) MT-Translation Memory integration transliteration MT using textual entailment MT using confidence estimation paraphrasing hybrid MT Papers describing the mechanism of MT tools that may be considered `monolingual' are also encouraged. Some possible topics are listed below: MBR decoding, consensus decoding monolingual word alignment (based on TER, METEOR,...) language models constructed by learning the representation of data data structure related matters ranking algorithms multitask learning (in the context of domain adaptation) SUBMISSION Authors are invited to submit long papers (up to 10 pages) and short papers (2 - 4 pages). Long papers should describe unpublished, substantial and completed research. Short papers should be position papers, papers describing work in progress or short, focused contributions. Papers will be accepted until August 3, 2012 in PDF format via the system. Submitted papers must follow the styles and formatting guidelines available from the AMTA main conference site. As the reviewing will be blind, the papers must not include the authors' names and affiliations. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ..." must be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ..." Papers that do not conform to these requirements will be rejected without review. ORGANIZERS Tsuyoshi Okita (DCU, Ireland) Artem Sokolov (LIMSI, France) Taro Watanabe (NICT, Japan) PROGRAM COMMITTEE (Tentative) Bogdan Babych (University of Leeds, UK) Loic Barrault (LIUM, Universite du Maine, France) Nicola Bertoldi (FBK, Italy) Boxing Chen (NRC Institute for Information Technology, Canada) Trevor Cohn (University of Sheffield, UK) Marta Ruiz Costa-jussa (Barcelona Media, Spain) Josep M. Crego (SYSTRAN, France) John DeNero (Google, USA) Jinhua Du (Xi'an University of Technology, China) Kevin Duh (Nara Institute of Science and Technology, Japan) Chris Dyer (CMU, USA) Christian Federmann (DFKI, Germany) Barry Haddow (University of Edinburgh, UK) Xiadong He (Microsoft, USA) Jagadeesh Jagarlamudi (University of Maryland, USA) Philipp Koehn (University of Edinburgh, UK) Shankar Kumar (Google, USA) Alon Lavie (CMU, USA) Yanjun Ma (Baidu, China) Aurelien Max (LIMSI, University Paris Sud, France) Stefan Riezler (University of Heidelberg, Germany) Lucia Specia (University of Sheffield, UK) Marco Turchi (JRC, Italy) Antal van den Bosch (Radboud University Nijmegen, Netherlands) Xianchao Wu (Baidu, Japan) Dekai Wu (HKUST, Hongkong) Francois Yvon (LIMSI, University Paris Sud, France) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jun 23 20:20:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Jun 2012 22:20:26 +0200 Subject: Livre: Grammaire des predicats complexes, Pollet Samvelian Message-ID: Date: Fri, 22 Jun 2012 15:49:14 +0200 From: "Ars" Message-ID: <015e01cd507d$cfb59390$6f20bab0$@fr> Bonjour, Je vous prie de trouver ci-joint le communiqu? de presse ainsi que le visuel de l'ouvrage que les ?ditions Hermes - Lavoisier viennent de publier, et qui ne manquera pas de retenir votre attention. Samvelian Grammaire des pr?dicats complexes les constructions nom-verbe Collection Langues et syntaxe dirig?e par Anne Abeill? Pollet Samvelian La pr?dication complexe est un ph?nom?ne attest? sous diverses formes dans des langues tr?s vari?es. Elle consiste ? former des s?quences syntaxiques fonctionnant comme un pr?dicat, c?est-?-dire un verbe simple. Les donn?es examin?es dans cet ouvrage sont les constructions nom-verbe en persan. Ce dernier ne dispose que d?environ 250 verbes simples et son lexique verbal comprend essentiellement des pr?dicats complexes form?s d?un verbe et d?un ?l?ment pr?verbal. Cela m?ne ? une r?flexion sur des ph?nom?nes pr?sents dans de nombreuses langues. Grammaire des pr?dicats complexes expose notamment : - la relation entre la compositionnalit? et la productivit? ; - la compatibilit? entre le stockage des expressions linguistiques complexes par les locuteurs et l?existence de sch?mas abstraits r?guliers permettant d?analyser ou de produire ces m?mes expressions ; - le parall?lisme entre les proc?d?s morphologiques et syntaxiques de la construction des lex?mes ainsi que la notion m?me du verbe lexical par opposition au verbe support. L?auteur Pollet Samvelian est professeur de linguistique ? l?Universit? Sorbonne Nouvelle. Ses recherches portent sur la morphologie, la syntaxe et la typologie linguistique. Elle travaille en particulier sur les langues iraniennes de l?ouest, notamment le persan. Nous esp?rons que cet ouvrage int?ressera vos lecteurs et vous remercions de l'accueil que vous lui r?serverez. Pour information : ISBN : 978-2-7462-2365-3 - Format : 15,5 x 23,5 - 336 p. - 70 ? ?diteur : Hermes - Lavoisier Vous pouvez vous procurer cet ouvrage dans toutes les librairies sp?cialis?es et sur le site Lavoisier : www.lavoisier.fr Grammaire des pr?dicats complexes les constructions nom-verbe Sommaire : Avant-propos Abr?viations Introduction Chapitre 1. Mots ou syntagmes : un faux probl?me ? Introduction. ? Atome syntaxique ? vs ? list?me ?. L?accent lexical unique. Le pr?dicat complexe comme base de d?rivation morphologique. La (non-)s?parabilit? des membres du pr?dicat complexe. La formation d?un pr?dicat s?mantique. Conclusion Chapitre 2. Les propri?t?s syntaxiques des pr?dicats nom-verbe Introduction. L?ordre respectif par rapport aux autres constituants de la phrase. La position postverbale. L?extraction de l??l?ment nominal. Les infinitifs. La construction passive. La coordination et l?ellipse du nom et du verbe. Modification et d?termination de l??l?ment nominal. Conclusion sur l?analyse syntaxique de la s?quence nom-verbe Chapitre 3. La compositionnalit? des pr?dicats complexes Introduction. Une certaine transparence s?mantique. Des r?gularit?s dans l?association des verbes et des noms. Les approches projectionnistes bas?es sur le transfert d?arguments. Les approches constructionnistes. Les probl?mes pour une approche compositionnelle. Un autre type compositionnalit?. Conclusion Chapitre 4. Vers une approche constructionnelle Introduction. Inventaire malgr? la productivit? : le cas de la morphologie constructionnelle. L?usage fa?onne la comp?tence : les mod?les bas?s sur l?usage. Les approches taxonomiques dans la description des CVS. Vers un inventaire des pr?dicats complexes du persan. Pourquoi un inventaire est-il insuffisant ? Une approche constructionnelle. Constructions syntaxiques ou assemblage de mots ? Remarques conclusives : perspectives stochastiques Chapitre 5. Etude d?un cas : les pr?dicats construits avec zadan ?frapper? Introduction. Zadan en tant que verbe plein(ou lexical). Les pr?dicats directement reli?s aux emplois lexicaux de zadan. Les pr?dicats indirectement reli?s aux emplois lexicaux de zadan . Les pr?dicats non reli?s aux emplois lexicaux de zadan. Les pr?dicats dans lesquels zadan a un comportement semi-lexical. Conclusion Bibliographie Index des pr?dicats complexes par verbe Index des pr?dicats complexes par ?l?ment non verbal Index des auteurs ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:14:09 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:14:09 +0200 Subject: Appel: SSLST 2012 Message-ID: Date: Sun, 24 Jun 2012 18:21:45 +0200 From: "GRLMC" Message-ID: <1D82CD16EE6B4CDE93270459B073FC46 at Carlos1> X-url: http://grammars.grlmc.com/sslst2012/ ********************************************************************* 2012 INTERNATIONAL SUMMER SCHOOL IN LANGUAGE AND SPEECH TECHNOLOGIES SSLST 2012 (formerly International PhD School in Language and Speech Technologies) Tarragona, Spain July 30 ? August 3, 2012 Organized by: Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/sslst2012/ ********************************************************************* AIM: SSLST 2012 offers a broad and intensive series of lectures at different levels on language and speech technologies. The students choose their preferred courses according to their interests and background. Instructors are top names in their respective fields. The School intends to help students initiate and foster their research career. The previous event in this series was WSLST 2012: http://grammars.grlmc.com/wslst2012/ ADDRESSED TO: Graduate (and advanced undergraduate) students from around the world. Most appropriate degrees include: Computer Science and Linguistics. Other students (for instance, from Mathematics, Electrical Engineering, Philosophy, or Cognitive Science) are welcome too. The School is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. There is no overlap in the class schedule. COURSES AND PROFESSORS: - Jont B. Allen (U Illinois Urbana-Champaign), A Parametric Analysis of Speech Perception [introductory, 8 hours] - Herv? Bourlard (Idiap Research Institute, Martigny), Automatic Speech Recognition and Multilingual Speech Processing: HMM, Hybrid HMM/ANN and Posterior-based Systems [introductory/intermediate, 6 hours] - Marcello Federico (Bruno Kessler Foundation, Trento), Statistical Machine Translation [introductory/intermediate, 6 hours] - Giuseppe Riccardi (U Trento), Spoken Language Understanding [intermediate/advanced, 6 hours] - Noah A. Smith (Carnegie Mellon U), Probability and Structure in Natural Language Processing [intermediate, 9 hours] - Bayya Yegnanarayana (International Institute of Information Technology Hyderabad), Speech Signal Processing [introductory/intermediate, 8 hours] REGISTRATION: It has to be done on line at http://grammars.grlmc.com/sslst2012/Registration.php FEES: They are variable, depending on the number of courses each student takes. The rule is: 1 hour = - 10 euros (for payments until May 18, 2012), - 15 euros (for payments after May 18, 2012). PAYMENT PROCEDURE: The fees must be paid to the School's bank account: Uno-e Bank bank?s address: Julian Camarillo 4 C, 28037 Madrid, Spain IBAN: ES3902270001820201823142 BIC/SWIFT code: UNOEESM1 account holder: Carlos Martin-Vide GRLMC account holder?s address: Av. Catalunya 35, 43002 Tarragona, Spain Please mention SSLST 2012 and your name in the subject. A receipt will be provided on site. Remarks: - Bank transfers should not involve any expense for the School. - People claiming early registration will be requested to prove that the bank transfer order was carried out by the deadline. - Students may be refunded only in the case when a course gets cancelled due to the unavailability of the instructor. People registering on site at the beginning of the School must pay in cash. For the sake of local organization, however, it is much recommended to do it earlier. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATE: Students will be delivered a certificate stating the courses attended, their contents, and their duration. IMPORTANT DATES: Announcement of the programme: April 12, 2012 Starting of the registration: April 12, 2012 Early registration deadline: May 18, 2012 Starting of the School: July 30, 2012 End of the School: August 3, 2012 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at urv.cat WEBSITE: http://grammars.grlmc.com/sslst2012/ POSTAL ADDRESS: SSLST 2012 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Diputaci? de Tarragona Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:16:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:16:57 +0200 Subject: Appel: PAKDD 2013 Message-ID: Date: Sun, 24 Jun 2012 20:19:30 +0200 From: CFP PAKDD2013 Message-ID: X-url: http://pakdd2013.pakdd.org/ Call For Papers PAKDD 2013 The 17th Pacific-Asia Conference on Knowledge Discovery and Data Mining Gold Coast, Australia Conference Website http://pakdd2013.pakdd.org/ Submission System https://cmt.research.microsoft.com/PAKDD2013/ Important Dates Paper submission due: Oct. 1 (Mon). 2012 Notification to author: Dec. 19 (Wed). 2012 Camera ready due: Jan. 6 (Sun). 2013 *[23:59:59 Pacific Time] ============================================================== Conference Scope The Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD) is a leading international conference in the areas of data mining and knowledge discovery (KDD). It provides an international forum for researchers and industry practitioners to share their new ideas, original research results and practical development experiences from all KDD related areas, including data mining, data warehousing, machine learning, artificial intelligence, databases, statistics, knowledge engineering, visualization, and decision-making systems. The conference calls for research papers reporting original investigation results and industrial papers reporting real data mining applications and system development experience. ============================================================== Topics The topics of relevance for the conference papers include but not limited to the following: * Novel models and algorithms * Clustering * Classification * Ranking * Association analysis * Anomaly detection * Data pre-processing * Feature extraction and selection * Mining heterogeneous data * Mining multi-source data * Mining sequential data * Mining spatial and temporal data * Mining unstructured and semi-structured data * Mining graph and network data * Parallel, distributed, and high performance data mining on the cloud platform * Privacy preserving data mining * Mining high dimensional data * Mining uncertain data * Mining imbalanced data * Mining dynamic/streaming data * Statistical methods for data mining * Visual data mining * Interactive and online mining * Mining behavioral data * Mining multimedia data * Mining scientific databases * Ubiquitous knowledge discovery * Agent-based data mining * Mining social networks * Financial data mining * Fraud and risk analysis * Security and intrusion detection * Opinion mining and sentiment analysis * Post-processing including quality assessment and validation * Integration of data warehousing, OLAP and data mining * Human, domain, organizational and social factors in data mining * Applications to healthcare, bioinformatics, computational chemistry, * Eco-informatics, marketing, online gaming, etc All paper submissions will be handled electronically. Detailed instructions are provided on the conference home page. ============================================================== Paper Submission Each submitted paper should include an abstract up to 200 words. It should also adhere to the double-blind review policy and not longer than 12 single-spaced pages with 10pt font size. Authors are strongly encouraged to use Springer LNCS/LNAI manuscript submission guidelines (available at http://www.springer.de/comp/lncs/authors.html) for their initial submissions. All papers must be submitted electronically through Microsoft's Conference Management Service (CMT) in PDF format only. The submitted papers must not be previously published anywhere, and must not be under consideration by any other conferences or journal during the PAKDD review process. Submitting a paper to the conference means that if the paper were accepted, at least one author will attend the conference to present the paper. For no-show authors, their affiliations will receive a notification. The program committee chairs are not allowed to submit papers to the conference for a fair review process. All papers will be double-blind reviewed by the Program Committee on the basis of technical quality, relevance to data mining, originality, significance, and clarity. Papers that do not comply with the Submission Guidelines will be rejected without review. Before submitting your paper, please carefully read and agree with the PAKDD submission policy and no-show policy: http://pakdd.togaware.com/policy.html ============================================================== Conference Officers Honorary Co-chairs * Jiawei Han. University of Illinois at Urbana-Champaign,USA * Ramamohanarao Kotagiri, University of Melbourne, Australia * Graham Williams. Australia Taxation Office, Australia Conference Co-chairs * Hiroshi Motoda, AFOSR/AOARD and Osaka University, Japan * Longbing Cao. University of Technology, Sydney, Australia Program Committee Co-chairs * Jian Pei. Simon Fraser University, Canada * Vincent S. Tseng. National Cheng Kung University, Taiwan Local Arrangement Co-chairs * Vladimir Estivill-Castro. Griffith University (Gold Coast), Australia * Xue Li, University of Queensland, Australia * Richi Nayak, Queensland University of Technology, Australia * Xinhua Zhu, University of Technology, Sydney, Australia Workshop Co-chairs * Jiuyong Li. University of Sourth Australia, Australia * Kay Chen Tan. National University of Singapore, Singapore * Bo Liu. Guangdong University of Technology, China Tutorial Co-chairs * Tu Bao Ho. Japan Advanced Institute of Science and Technology, Japan * Mengjie Zhang. Victoria University of Wellington, New Zealand Award Chair * Chengqi Zhang, University of Technology, Sydney, Australia Sponsorship Co-chair * Yue Xu, Queensland University of Technology, Australia Publicity Co-chairs * P.Krishna Reddy, The International Institute of Information * Technology, Hyderabad, India * Yifeng Zeng, Aalborg University, Denmark * Xin Wang, University of Calgary, Canada * Zhihong Deng, Peking University, China ============================================================== Further Information For further information, please contact the Program Committee Chairs by pakdd13-program at pakdd.org . General inquiries * Longbing Cao University of Technology Sydney, Australia Email: pakdd13 at pakdd.org Phone: (61)2-9514-4477 Fax: (61)2-9514-1807 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:24:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:24:50 +0200 Subject: Appel: Linguistique de corpus, Prolongation de la date de soumission Message-ID: Date: Mon, 25 Jun 2012 14:43:05 +0200 (CEST) From: "sandra.augendre" Message-ID: <1355708946.31058.1340628185427.JavaMail.www at wwinf1g38> COLLOQUE La linguistique de corpus ? l'heure de la confrontation entre concepts, techniques et applications / Corpus Linguistics: How to bind concepts, technique and application? 14-15 d?cembre 2012 Universit? Bordeaux 3 / EA 4195 TELEM / UMR 5263 CLLE-ERSS?B https://sites.google.com/site/corpus2012bordeaux3/ PROLONGATION DE LA DATE DE SOUMISSION : Les r?sum?s des propositions de communications peuvent ?tre envoy?es jusqu'au 1er Juillet 2012. Rappel des th?mes du colloque : A. comment coder les ?l?ments discursifs ? l'?crit et ? l'oral ? quelles convergences, quelles divergences dans le codage de l'?crit et de l'oral ? Probl?mes actuels de l'annotation des corpus ?crits et oraux ? Probl?mes li?s ? l'annotation des propri?t?s de l'oral. B. coder la multimodalit? : enjeux et d?fis. C. de la linguistique de corpus aux digital humanities. Toutes les informations sur le site https://sites.google.com/site/corpus2012bordeaux3/ Envoi des propositions ?: colloque.corpus.bx3[at]gmail.com (remplacer "at" par l'arobase) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:27:32 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:27:32 +0200 Subject: Job: Ingenieur d'etude (CDD 12 mois), Projet ANR Chronolines Message-ID: Date: Mon, 25 Jun 2012 14:43:02 +0200 From: minel Message-ID: <4FE85CD6.2040409 at u-paris10.fr> X-url: http://www.chronolines.fr Dans le cadre du projet ANR Chronolines (AppelCONTINT) (www.chronolines.fr), pilot? par le laboratoire MoDyCo (UMR 7114) avec comme partenaires l'AFP, Exalead, LIMSI (UPR 3251)et Xerox, nous recherchons un(e) ing?nieur d'?tude sp?cialis?(e) dans le d?veloppement d'interfaces visuelles innovantes. Il s'agit de d?velopperun outil de type /timeline/ permettant de pr?senter les r?sultats d'une recherche par mots cl?s sur une ?chelle temporelle ? multi-niveaux ? (granularit? calendaire, degr?s de prise en charge ?nonciative et modale d'?v?nements). L'interface sera riche et exploitera l'aspect multim?dia des donn?es ainsi que les annotations linguistiques (temporelles, modales, ?nonciatives, ...) produites en amont.Afin de couvrir des besoins professionnels, l'interface graphique sera ?galement dot?e d'une fonctionnalit? d'?dition qui permettra ? des utilisateurs experts d'?diter une /timeline/, supprimer des donn?es/?v?nements, corriger certaines donn?es (repositionnement sur l'?chelle temporelle par exemple), etc. Le poste n?cessite des comp?tences dans le d?veloppement d'interfaces int?grant des outils open source, dans la pratique de langages de programmation (Java et/ou C++), dans celle de la technologie Flash et/ou HTML. Titulaire au minimum d'un Master d'Informatique ou ?quivalent (dipl?me d'ing?nieur) Type de poste (CDD) : Ing?nieur d'?tude type CNRS ( 2031 bruts Euros mensuel) Dur?e : 12 mois Lieu : laboratoire MoDyCo( www.modyco.fr ) D?but des travaux : octobre 2012 contact: Delphine Battistelli, Delphine.Battistelli at paris-sorbonne.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:31:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:31:05 +0200 Subject: These: Nadi Tomeh, Modeles discriminants d'alignement pour la traduction automatique statistique Message-ID: Date: Mon, 25 Jun 2012 15:09:04 +0200 From: Nadi Tomeh Message-ID: <#mml Bonjour, J'ai le plaisir de vous inviter ? la soutenance de ma th?se intitul?e : "mod?les discriminants d'alignement pour la traduction automatique statistique". La soutenance aura lieu le mercredi 27 juin ? 14h au LIMSI-CNRS (salle de conf?rences). Vous ?tes ?galement convi?s au pot qui suivra. Se rendre au LIMSI: http://www.limsi.fr/Pratique/acces/ http://goo.gl/maps/imyY Jury: ----- Eric Gaussier, rapporteur, Universit? Joseph Fourier Philippe Langlais, rapporteur, Universit? de Montr?al Anne Vilnat, examinatrice, Universit? Paris-Sud Hermann Ney, examinateur, Universti? RWTH Aachen Nasredine Semmar, invit?, LIST CEA Fran?ois Yvon, directeur, Universit? Paris-Sud Alexandre Allauzen, co-directeur, Universit? Paris-Sud R?sum?: ------- La t?che d'alignement d'un texte dans une langue source avec sa traduction en langue cible est souvent nomm?e alignement de bi-textes. Elle a pour but de faire ?merger les relations de traduction qui peuvent s'exprimer ? diff?rents niveaux de granularit? entre les deux faces du bi-texte. De nombreuses applications de traitement automatique des langues naturelles s'appuient sur cette ?tape afin d'acc?der ? des connaissances linguistiques de plus haut niveau. Parmi ces applications, nous pouvons citer bien s?r la traduction automatique, mais ?galement l'extraction de lexiques et de terminologies bilingues, la d?sambig?isation s?mantique ou l'apprentissage des langues assist? par ordinateur. La complexit? de la t?che d'alignement de bi-textes s'explique par les diff?rences linguistiques entre les langues. Ces diff?rences peuvent ?tre d'ordre s?mantique, syntaxique, ou morphologique. Dans le cadre des approches probabilistes, l'alignement de bi-textes est mod?lis? par un ensemble de variables al?atoires cach?s. Afin de r?duire la complexit? du probl?me, le processus al?atoire sous-jacent fait l'hypoth?se simplificatrice qu'un mot en langue source est li? ? au plus un mot en langue cible, ce qui induit une relation de traduction asym?trique. N?anmoins, cette hypoth?se est simpliste, puisque les alignements peuvent de mani?re g?n?rale impliquer des groupes de mots dans chacune des langues. Afin de r?tablir cette sym?trie, chaque langue est consid?r?e tour ? tour comme la langue source et les deux alignements asym?triques r?sultants sont combin?s ? l'aide d'une heuristique. Cette ?tape de sym?trisation rev?t une importance particuli?re dans l?approche standard en traduction automatique, puisqu'elle pr?c?de l'extraction des unit?s de traduction, ? savoir les paires de segments. L'objectif de cette th?se est de proposer de nouvelles approches pour d'une part l'alignement de bi-texte, et d'autre part l'extraction des unit?s de traduction. La sp?cificit? de notre approche consiste ? remplacer les heuristiques utilis?es par des mod?les d'apprentissage discriminant. Nous pr?sentons un mod?le "maximum d'entropie" (ou MaxEnt) pour l'alignement de mot, pour lequel chaque lien d'alignement est pr?dit de mani?re ind?pendante. L'interaction entre les liens d'alignement est alors prise en compte par l'empilement (``stacking'') d'un second mod?le prenant en compte la structure ? pr?dire sans pour autant augmenter la complexit? globale. Cette formulation peut ?tre vue comme une mani?re d'apprendre la combinaison de diff?rentes m?thodes d'alignement: le mod?le consid?re ainsi l'union des alignements d'entr?es pour en s?lectionner les liens jug?s fiables. Le mod?le MaxEnt propos? permet d'am?liorer les performances d'un syst?me ?tat de l'art de traduction automatique en consid?rant le jeu de donn?es de la t?che NIST'09, Arabe vers Anglais. Ces am?liorations sont mesur?es en terme de taux d'erreur sur les alignements et aussi en terme de qualit? de traduction via la m?trique automatique BLEU. Nous proposons ?galement un mod?le permettant ? la fois de s?lectionner et d'?valuer les unit?s de traduction extraites d'un bi texte align?. Ces deux ?tapes sont reformul?es dans le cadre de l'apprentissage supervis?, afin de mod?liser la d?cision de garder ou pas une paire de segments comme une unit? fiable de traduction. Ce cadre permet l'utilisation de caract?ristiques riches et nombreuses favorisant ainsi une d?cision robuste. Nous proposons une m?thode simple et efficace pour annoter les paires de segments utiles pour la traduction. Le probl?me d'apprentissage automatique qui se pose alors est particulier, puisque nous disposons que d'exemples positifs. Nous proposons donc d'utiliser l'approche SVM ? une classe afin de mod?liser la s?lection des unit?s de traduction. Gr?ce ? cette approche, nous obtenons des am?liorations significatives en terme de score BLEU pour un syst?me entrain? avec un petit ensemble de donn?es. Nadi Tomeh Univ. Paris XI, LIMSI-CNRS LIMSI-CNRS B?t 508, Bureau 118 BP 133 F-91403 ORSAY CEDEX T?l : +33/0 1 69 85 80 43 nadi.tomeh at limsi.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:33:01 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:33:01 +0200 Subject: Livre: Sentiment Analysis and Opinion Mining, Bing Liu Message-ID: Date: Mon, 25 Jun 2012 14:55:35 -0400 From: Graeme Hirst Message-Id: X-url: http://www.morganclaypool.com/doi/abs/10.2200/S00416ED1V01Y201204HLT016 New Book by Morgan & Claypool Publishers Sentiment Analysis and Opinion Mining Bing Liu, University of Illinois at Chicago May 2012 Available for download here: http://www.morganclaypool.com/doi/abs/10.2200/S00416ED1V01Y201204HLT016 Sentiment analysis and opinion mining is the field of study that analyzes people's opinions, sentiments, evaluations, attitudes, and emotions from written language. It is one of the most active research areas in natural language processing and is also widely studied in data mining, Web mining, and text mining. In fact, this research has spread outside of computer science to the management sciences and social sciences due to its importance to business and society as a whole. The growing importance of sentiment analysis coincides with the growth of social media such as reviews, forum discussions, blogs, micro-blogs, Twitter, and social networks. For the first time in human history, we now have a huge volume of opinionated data recorded in digital form for analysis. Sentiment analysis systems are being applied in almost every business and social domain because opinions are central to almost all human activities and are key influencers of our behaviors. Our beliefs and perceptions of reality, and the choices we make, are largely conditioned on how others see and evaluate the world. For this reason, when we need to make a decision we often seek out the opinions of others. This is true not only for individuals but also for organizations. This book is a comprehensive introductory and survey text. It covers all important topics and the latest developments in the field with over 400 references. It is suitable for students, researchers and practitioners who are interested in social media analysis in general and sentiment analysis in particular. Lecturers can readily use it in class for courses on natural language processing, social media analysis, text mining, and data mining. Lecture slides are also available online. Table of Contents: Preface / Sentiment Analysis: A Fascinating Problem / The Problem of Sentiment Analysis / Document Sentiment Classification / Sentence Subjectivity and Sentiment Classification / Aspect-Based Sentiment Analysis / Sentiment Lexicon Generation / Opinion Summarization / Analysis of Comparative Opinions / Opinion Search and Retrieval / Opinion Spam Detection / Quality of Reviews / Concluding Remarks / Bibliography / Author Biography ____________________ In the series, Synthesis Lectures on Human Language Technologies, edited by Graeme Hirst, University of Toronto: http://www.morganclaypool.com/toc/hlt/1/1 This title is available online, free of charge to members of institutions that that have licensed the Synthesis Digital Library of Engineering and Computer Science. Use of this book as a course text is encouraged and the text may be downloaded without restriction at licensed institutions or after a one-time fee of $30.00 at non-licensed schools. To find out whether your institution is a licensed, visit or follow the links above and attempt to download the PDF. A print copy of this book can also be purchased directly from the Morgan & Claypool Bookstore (http://secure.aidcvt.com/mcp/) for $40.00 USD or from Amazon and other booksellers worldwide. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:38:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:38:57 +0200 Subject: Sujet de these: PhD positions, KRDB Centre, Free Univ. Bolzano, Italy - Deadline Aug. 31, 2012 Message-ID: Date: Tue, 26 Jun 2012 14:46:31 +0200 From: Alessandro Artale Message-Id: X-url: http://www.inf.unibz.it/krdb/ X-url: http://www.unibz.it/en/public/research/phd/prospectivePhdstudents.html =============================================================== CALL FOR PhD POSITIONS - DEADLINE August 31, 2012 Fully funded PhD positions at the KRDB Research Centre for Knowledge and Data Faculty of Computer Science Free University of Bozen-Bolzano, Italy =============================================================== The Faculty of Computer Science of the Free University of Bozen-Bolzano (Italy) offers regular openings for studentships for its PhD program. The PhD programme has been running since 2004/2005. Since 2011/2012 there has also been a European programme (EPCL) which provides a joint qualification. *** 3 of the PhD positions with studentship are offered by the KRDB Research Centre for Knowledge and Data. *** The 2012/2013 PhD call is now open and the deadline to apply is: ****** 31.August.2012 ****** Up-to-date information about how to apply for the PhD program and the studentship - including deadlines, number of positions and necessary documents - can be found in the university PhD web pages: - http://www.unibz.it/en/public/research/phd/prospectivePhdstudents.html - http://www.unibz.it/en/inf/progs/phdcs/default.html The grant amounts to 51,000 Euro over the three years of the PhD. Substantial extra funding is available for participation in international conferences, schools and workshops. The faculty of Computer Science and its PhD program are entirely based on the English language. RESEARCH TOPICS The KRDB Research Centre for Knowledge and Data (http://www.inf.unibz.it/krdb/) of the Faculty of Computer Science invites applicants to the PhD program to get in touch with the research group (see CONTACT PERSON below), in order to have a better understanding of the possible research activities in which perspective students may be involved. Relevant research topics in the centre are the following: * Computational Logic and Deductive Databases * Computational Logic and Constraint Programming * Description Logics and Ontology Languages * Conceptual Data Modelling and Ontology Design * Ontology Based Data Access * Query Answering in Distributed Environments * Intelligent Access to Web Resources * Semistructured Data Management * Temporal Logics and Temporal Databases * Knowledge-based techniques for Service Access and Composition * Knowledge-based techniques for Business Processing * Evolution and Update of Knowledge Bases * Data Quality and Completeness * Modelling and Accessing Imcomplete Data Other research topics are listed in the personal web pages of the members of the KRDB Centre, see: http://www.inf.unibz.it/krdb/staff.php The research activities in the KRDB research centre require good knowledge of Logic and of Foundations of Databases, and some knowledge of Artificial Intelligence and of Knowledge Representation. Good knowledge of English is also preferred. EUROPEAN PhD PROGRAM IN COMPUTATIONAL LOGIC (EPCL) The Free University of Bozen-Bolzano participates through the KRDB Research Centre to the European PhD Program in Computational Logic (EPCL) Students that are admitted for a PhD position at the KRDB Research Centre may apply to join EPCL. The admission to EPCL is decided by a Joint Commission consisting of representatives of the EPCL partner universities. THE KRDB CENTRE -- http://www.inf.unibz.it/krdb/index.php CONTACT To get in contact with the KRDB Research Centre, send an email to Dr. Alessandro Artale . To get in touch with the current PhD students see: https://www.inf.unibz.it/phd/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jun 26 20:42:26 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Jun 2012 22:42:26 +0200 Subject: Appel: CSLP 2012, Final deadline extension: 5 July 2012 Message-ID: Date: Tue, 26 Jun 2012 16:19:37 +0200 From: Yannick Parmentier Message-ID: <20120626141937.GB11375 at mononoke> X-url: http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ ** apologies for cross-posting ** CALL FOR PAPERS & PARTICIPATION ** NEW: Due to several requests, deadline for submission has been extended to July 5. This is the last and final deadline extension. ** ======================================================== Constraint Solving and Language Processing - CSLP 2012 - Seventh International Workshop Universite d'Orleans, Orleans, France September 13-14, 2012 http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ ======================================================== INTRODUCTION ============ The Constraint Solving and Language Processing (CSLP) workshop considers the role of constraints in the representation of language and the implementation of language processing from an interdisciplinary perspective. This theme should be interpreted inclusively: contributions from linguistics, computer science, psycholinguistics and related areas are welcome, and an interdisciplinary perspective is of particular interest. Constraints are widely used in linguistics, computer science, and psychology. How they are used, however, varies widely according to the research domain: knowledge representation, cognitive modelling, problem solving mechanisms, etc. These different perspectives are complementary, each one adding a piece to the puzzle. For example, linguistics proposes in-depth descriptions implementing constraints in order to filter out structures by means of description languages, constraint ranking, etc. The constraint programming paradigm, on the other hand, shows that constraints have to be taken as a systematic whole and can thus play a role in building the structures (or can even replace structures). Finally, psycholinguistics experiment have been made, investigating the role of constraint systems for cognitive processes in comprehension and production, as well as addressing how they can be acquired. TOPICS ====== CSLP is open to submissions on topics including, but not limited to: * Constraints in human language comprehension and production * Context modelling and discourse interpretation * Acquisition of constraints * Constraints and learning * Cross-theoretical view of the notion of constraint * New advances in constraint-based linguistic theories * Constraint satisfaction (CS) technologies for NLP * Linguistic analysis and linguistic theories biased towards CS or constraint logic programming (CLP) * Application of CS or CLP for NLP * CS and CLP for other than textual or spoken languages, e.g., sign languages and biological, multimodal human-computer interaction, visual languages * Probabilistic constraint-based reasoning for NLP and context comprehension PREVIOUS EDITIONS ================= Six CSLP workshops have been organized in the past in: Karlsruhe, Germany (2011), Hamburg, Germany (2008), Roskilde, Denmark (2007), Sydney, Australia (2006), Sitges, Spain (2005), Roskilde, Denmark (2004). VENUE ===== CSLP 2012 will take place at LIFO, the Computer Science laboratory of the University of Orleans, France. Orleans is located in the northern bend of the Loire river, it belongs to the Vallee de la Loire sector, which was in 2000 inscribed by UNESCO as a World Heritage Site. Orleans is located 120 kilometers south-west of Paris, it is bordered to the north by the Beauce region and the national forest of Orleans (500 km2), and by the Sologne region to the south. IMPORTANT DATES =============== Submission Deadline: June 10, 2012 Notification: August 1st, 2012 Camera-ready Version: September 1st, 2012 Workshop Dates: September 13-14, 2012 SUBMISSIONS =========== Papers must be submitted electronically as PDF files and be prepared using the Springer LNAI/LNCS format. Detailed formatting instructions can be found at: http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0 Papers should present original, unpublished work. Simultaneous submission to other venues with published proceedings is prohibited. CSLP accepts two kinds of submissions: - full papers (12 pages including references) reporting completed, significant research, - short papers (6 pages including references) reporting ongoing work and partial results. Each submission will be reviewed by three program committee members. Accepted long papers will be presented within 20 minutes talks plus 10 minutes for questions. Accepted short papers will be presented within 10 minutes talks plus 5 minutes for questions. Both paper types will be published in the workshop proceedings. Since reviewing will be blind, the submission should not include the authors' names and affiliations. Other identifying information such as obvious self-references (e.g., "We showed in [12] ...") and financial or personal acknowledgements should be omitted in the submitted papers whenever feasible. Papers have to be submitted via the easychair conference management system using the following link: http://www.easychair.org/conferences/?conf=cslp2012 A volume at an international publisher will be considered for selected and revised papers, if number and quality of submissions permits. REGISTRATION ============ Registration is now open, by filling the form available at http://www.univ-orleans.fr/lifo/evenements/CSLP2012/inscription.php The registration fees (50 EUR for students and 100 EUR for researchers until August, 7th) cover the electronic proceedings (USB stick), the participation to the coffee breaks, the lunches, the banquet, and the social event (visit of a Castle of the Vallee de la Loire). KEYNOTE SPEAKERS ================ Ruth Kempson, King's College London Stergios Chatzikyriakidis, Royal Holloway University of London and Open University of Cyprus Title: "Grammars as Mechanisms for Real-Time Tree-Growth: Explaining Clitic Pronouns" Abstract: In this talk, we use the puzzle of clitic pronoun placement and clustering in Modern Greek to argue for a shift of perspective into defining grammars as mechanisms for incremental growth of interpretation, as argued in Dynamic Syntax: Kempson et al. (2001), Cann et al. (2005) Chatzikyriakidis and Kempson (2011). In this framework, the concept of structural underspecification and growth of semantic representation is taken as the core syntactic notion, grounded in the modal Logic of Finite Trees: Blackburn and Meyer-viol (1994). With modal statements expressing an array of more or less fixed tree-node relations, restrictions on tree development are definable in a way not available to grammars lacking such tree-growth dynamics. One of these is the restriction that no more than one underspecified relation of a type can be built at a time, their being indistinguishable with only this weak characterisation, which we use to explain a range of clitic clustering restrictions found in many clitic-pronoun systems ? we take the so-called Person-Case Constraint (PCC) as displayed in different ways in dialects of Modern Greek as our case study. PROGRAM COMMITEE ================ Philippe Blache, CNRS - Universit? de Provence, France Adriane Boyd, Universit?t T?bingen, Germany Aoife Cahill, ETS Princeton, USA Henning Christiansen, Roskilde University, Denmark Berthold Crysmann, CNRS - Paris 7, France Ver?nica Dahl, Simon Fraser University, Canada Helen de Hoop, Radboud University Nijmegen, Netherlands Eric De La Clergerie, INRIA - Paris 7, France Denys Duchier, Universit? d'Orl?ans, France Claire Gardent, CNRS - LORIA, France Barbara Hemforth, Universit? Paris Descartes, France Maria Dolores Jim?nez-L?pez, Universitat Rovira i Virgili, Spain Laura Kallmeyer, Heinrich Heine Universit?t, D?sseldorf, Germany Ruth Kempson, King's College London, UK Stephan Kepser, Codecentric AG D?sseldorf, Germany Patrick McCrae, Langtec Hamburg, Germany Wolfgang Menzel, Universit?t Hamburg, Germany Detmar Meurer, Universit?t T?bingen, Germany V?ronique Moriceau, Universit? Paris XI, France Jean-Philippe Prost, Universit? de Montpellier, France Adam Przepi?rkowski, IPIPAN, Warsaw, Poland Christian R?tor?, Universit? de Bordeaux, France Frank Richter, Universit?t T?bingen, Germany Sylvain Salvati, INRIA - Universit? de Bordeaux, France Sylvain Schmitz, ENS Cachan, France Kiril Simov, Bulgarian Academy of Sciences, Bulgaria Jesse Tseng, CNRS - Universit? de Toulouse, France J?rgen Villadsen, Technical University of Denmark LOCAL ORGANIZING COMMITEE ========================= Chairs: Denys Duchier (LIFO - Universit? d'Orl?ans) Yannick Parmentier (LIFO - Universit? d'Orl?ans) Members: Guillaume Cleuziou (LIFO - Universit? d'Orl?ans) Thi-Bich-Hanh Dao (LIFO - Universit? d'Orl?ans) Abdelali Ed-Dbali (LIFO - Universit? d'Orl?ans) Matthieu Exbrayat (LIFO - Universit? d'Orl?ans) Matthieu Lopez (LIFO - Universit? d'Orl?ans) Lionel Martin (LIFO - Universit? d'Orl?ans) Simon Petitjean (LIFO - Universit? d'Orl?ans) Jacques-Henri Sublemontier (LIFO - Universit? d'Orl?ans) Information about the Workshop is available at the CSLP workshop website: http://www.univ-orleans.fr/lifo/evenements/CSLP2012/ E-mail: cslp2012 at easychair.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ -------------------------------------------------------------------------