From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:11:47 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:11:47 +0200 Subject: These: Matthieu Vernier, Analyse a granularite fine de la subjectivite Message-ID: Date: Thu, 30 Jun 2011 10:33:25 +0200 From: Matthieu Vernier Message-ID: <4E0C34D5.80504 at> Bonjour, j'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée "Analyse à granularité fine de la subjectivité". La soutenance se déroulera le lundi 4 juillet à 9h30 dans la salle 3 du bâtiment LINA à la faculté des sciences et techniques. Le jury sera composé de : Nicholas ASHER, Directeur de recherche CNRS à l'IRIT (rapporteur) Yves BESTGEN, Professeur FNRS à l'Université Catholique de Louvain (rapporteur) Marc EL-BEZE, Professeur à l'Université d'Avignon et des Pays de Vaucluse (examinateur) Béatrice DAILLE, Professeur à l'Université de Nantes (directrice de thèse) Laura MONCEAUX, Maître de Conférences à l'Université de Nantes (co-encadrante de thèse) Résumé : Avec l'essor du web social, les internautes sont davantage enclins à partager et affirmer leurs opinions. Devant l'ampleur du phénomène, les opinions exprimées sur internet sont devenues des données stratégiques qu'il faut pouvoir suivre en temps réel et caractériser finement. Notre démarche nous amène à recadrer le terme d'opinion dans les théories linguistiques sur la subjectivité et l'évaluation. Nous nous intéressons à délimiter automatiquement les passages subjectifs d'un texte et à en catégoriser plusieurs aspects sémantiques et énonciatifs : ont-ils une modalité logique ou axiologique ? quelle est leur polarité ? le locuteur dissimule t-il sa subjectivité ? quel est l'objet ciblé ? Notre première contribution pour aborder ces questions consiste en la distribution de deux ressources : le corpus Blogoscopie contient 5 900 passages évaluatifs et 6 900 objets annotés. Il est le premier corpus francophone de ce type ; le lexique de l'évaluation représente 4 000 mots ou expressions évaluatifs du français structurés gramaticalement et sémantiquement. A partir de ces ressources, nous proposons des méthodes pour résoudre trois problématiques liées à l'analyse de la subjectivité. La première méthode combine des caractéristiques lexicales, grammaticales et sémantiques pour délimiter et désambiguïser les évaluations d'un texte. Puis, nous évaluons deux méthodes s'appuyant sur des hypothèses sémantiques et morphologiques pour apprendre du vocabulaire évaluatif habituellement absent des ressources existantes. Enfin, nous expérimentons une nouvelle méthode, fondée sur la saillance d'un objet, améliorant l'existant sur la tâche d'identification de la cible d'une évaluation. Mots-clés : analyse de la subjectivité, fouille d'opinions, ressources lexicales, approche à granularité fine, identification de la cible évaluée == english version == I am honored to invite you to my PhD defense on "Fine-grained Subjectivity Analysis ". The defense will take place Monday, July 4th 2011 at 9:30 in Room 3 at LINA, faculté des sciences et techniques. Abstract: With the rise of the social web, users are more likely to affirm and share their opinions. Given the magnitude of the phenomenon, opinions express on the Internet are critical data that must be followed in real time and categorised cleverly. Our approach leads us to refocus the term of opinion in the linguistic theories of subjectivity and appraisal. We are interested in detecting subjective phrases in texts and in categorizing various semantic and enunciative aspects: do they express a logical or an axiological evaluation? what is their polarity? does the speaker try to conceal his subjectivity? what is the target object? Our first contribution is the distribution of two resources : the Blogoscopy corpus contains about 5900 evaluations and 6900 annotated objects. It is the first francophone corpus of this type. The evaluation lexicon contains 4000 French words or expressions. Each lexical entry is structured grammatically and semantically. From these resources, we experiment several methods to address three issues related to subjectivity analysis. The first method combines lexical, grammatical and semantic features to delineate and to disambiguate evaluative phrases in texts. We rely on semantic and morphological assumptions to learn evaluative vocabulary usually missing from resources. Finally, we propose a new method based on the salience of an object to identify the evaluated target. Keywords: subjectivity analysis, opinion mining, lexical resources, fine-grained approach, opinion target identification ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:23:22 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:23:22 +0200 Subject: Conf: Workshop in the frame of CLMPS14, 21st of July 2011, Nancy Message-ID: Date: Thu, 30 Jun 2011 10:35:23 +0200 (CEST) From: alain.lecomte at Message-ID: X-url: X-url: X-url: We inform you that in the frame of the 14th Congress of Logic, Methodology and Philosophy of Sciences which will be held in Nancy from the 19th to the 26th of July ( there will be an affiliated workshop on Ludics and applications on the 21st of July (see: the name of which is: rebuilding logic and rethinking language in interaction terms The workshop will be held at: amphithéâtre Geny, rez-de-chaussée de la Faculté de Droit (13 place Carnot, 54000 Nancy) from 10:30 to 18:30, Thursday, July 21st Program: 10h 30 : Presentation of the LOCI project (Alain Lecomte) 11h : Tutorial on Ludics (Lionel Vaux) 12h30 : pause lunch 14h : Towards Formal Pragmatics based on Ludics (Alain Lecomte and Myriam Quatrini) 15h : Applications to the web and the problem of ontologies (Christophe Fouqueré) 16h: pause 16h 30 : Quantifiers from an interactive perspective (Christian Retoré and Michele Abrusci) 17h 30 : Proto-logical origins of logic (Jean-Baptiste Joinet) 18h30 : END ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:25:46 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:25:46 +0200 Subject: Revue: CORELA, vol. 9, num. 1 Message-ID: Date: Thu, 30 Jun 2011 19:31:56 +0200 From: Gilles Col Message-Id: X-url: X-url: X-url: X-url: X-url: Chers collègues, L'équipe éditoriale de la revue CORELA - Cognition / Représentation / Langages ( a le plaisir de vous annoncer la publication de son dernier numéro (vol. 9, num. 1). Les propositions de publication pour le prochain numéro de la revue (vol. 9, num. 2) sont à envoyer à Gilles Col (col at ext.univ-poitiers) avant le 15 septembre 2011. Sommaire du numéro Tatsiana VAVULA : Représentation idéographique des prépositions russes /v/ et /na/ Pierre-Yves KERSULEC : La sous-spécification flexionnelle des bases de dérivation en question à la lumière de la morphologie bretonne Par Laurence KISTER , Evelyne JACQUEY et Bertrand GAIFFE : Du thesaurus à l'onto-terminologie : relations sémantiques vs relations ontologiques. Compte-rendu de lecture : « Les Nombres » (Presses Universitaires de Rennes, 2010) de Sophie Saulnier, par Benjamin FAGARD ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:27:54 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:27:54 +0200 Subject: Seminaire: INFOLINGU, Djame SEDDAH (ISHA/Paris 4 Sorbonne), 4 juillet 2011, 10h30 Message-ID: Date: Fri, 1 Jul 2011 11:02:02 +0200 From: Myriam RAKHO Message-ID: ************************************************************************ INFOLINGU Le séminaire de l'équipe Informatique Linguistique de l'Institut Gaspard Monge (LIGM) ************************************************************************ Date : Le Lundi 4 juillet 2011 à 10h30 Lieu : Université Paris-Est Marne-la-Vallée Bâtiment Copernic, 4ème étage, salle 4B08R Toute personne intéressée est la bienvenue. ************************************************************************ ------------------------------------------------------------------------ Intervenant : ------------------------------------------------------------------------ Djamé SEDDAH ------------------------------------------------------------------------ Titre de la présentation : ------------------------------------------------------------------------ Lemmatisation et analyse syntaxique probabiliste du français Djamé Seddah, projet Inria Alpage & Université Paris-Sorbonne ------------------------------------------------------------------------ Résumé : ------------------------------------------------------------------------ L'analyse syntaxique probabiliste des langues à morphologie riche (MRLs) a longtemps été sous-représentée dans la littérature, cependant la récente disponibilité de corpus arborés pour des langues comme l'allemand, l'arabe, l'hébreu ou le français, a permis de faire émerger des problématiques communes aux MRLs. Ainsi, on note que la taille réduite des données annotées associés à des langues à la flexion plus ou moins riches conduit à une dispersion des données lexicales préjudiciables aux performances des analyseurs. La variabilité de l'ordre des mots de certaines MRLs voire les idiosyncrasies de certains schémas d'annotations sont d'autres paramètres permettant d'expliquer pourquoi les performances des modèles d'analyses, ayant le plus souvent été conçus pour l'anglais particulier des sections Wall Street Journal du Penn Treebank, proposent des performances sous optimales quand ceux-ci sont adaptés sur d'autres langues. Pour certains, le français peut difficilement être vu comme une langue à morphologie riche, surtout comparé à l'arabe ou l'allemand. Cependant, les caractéristiques de sa morphologie en font un bon candidat pour explorer différentes techniques d'optimisation du lexique propres aux MRLs. Dans ce séminaire, basé sur des travaux réalisés conjointement avec Marie Candito, Ozlem Cetinoglu, Grzegorz Chrupala et Josef van Genabith, nous étudierons l'impact de la lemmatisation automatique du français sur le modèle d'analyse syntaxique d'E.Charniak. Nous montrerons que le "clustering" morphologique induit par la lemmatisation accroît les performances du modèle mais que ses effets sont atténués par l'augmentation mécanique du taux de mots inconnus. Nous présenterons aussi les résultats d'une étude contrastive consacrée aux performances des modèles lexicalisés et non lexicalisés avec annotation latente entraînés sur différentes instances de schémas d'annotation du corpus arboré de Paris 7. ------------------------------------------------------------------------ Anthony SIGOGNE, Myriam RAKHO Équipe Linguistique Informatique Laboratoire d'Informatique de l'Institut Gaspard Monge (LIGM) Université Paris-Est Marne-la-Vallée Tél. : 06 23 05 66 06 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:30:58 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:30:58 +0200 Subject: Livre: La sphere semantique 1, Pierre Levy Message-ID: Date: Fri, 1 Jul 2011 11:35:13 +0200 From: "Ars" Message-Id: <20110701095353.45F18C00A at> La sphère sémantique 1 Computation, cognition, économie de l’information Collection information, hypermédias et communication dirigée par Imad Saleh Pierre Lévy Le médium numérique nous offre désormais un environnement de communication mondial, ubiquitaire et participatif qui mobilise une puissance de mémoire et de calcul sans précédent. Comment exploiter ce nouveau médium pour augmenter les processus de cognition sociale et piloter le développement humain ? Alliant les sciences humaines traditionnelles avec l’informatique et les sciences cognitives, cet ouvrage expose un modèle original de la cognition humaine qui intègre pleinement ses dimensions symbolique et sociale. La sphère sémantique est un système de coordonnées mathématico-linguistique de l’esprit basé sur le métalangage IEML. Elle fonde la construction collaborative d’un Hypercortex permettant l’observation réflexive de nos intelligences collectives. L’auteur Pierre Lévy est titulaire de la Chaire de Recherche du Canada en Intelligence Collective à l’Université d’Ottawa et membre de la Société Royale du Canada. Pionnier des études sur la cyberculture, l’intelligence collective et la gestion des connaissances, ses ouvrages ont été traduits dans une quinzaine de langues. Nous sommes persuadés que cet ouvrage ne manquera pas d'intéresser vos lecteurs et vous remercions par avance de l'accueil que vous saurez lui réserver. Pour information : ISBN : 978-2-7462-2506-0 - Format : 15,5 x 23,5 cm - 415 p. - 89 € Éditeur : Hermes - Lavoisier Vous pouvez vous procurer cet ouvrage dans toutes les librairies spécialisées et à la librairie Lavoisier : La sphère sémantique 1 Computation, cognition, économie de l’information Sommaire : Chapitre 1. Introduction générale Première partie - Philosophie de l’information Chapitre 2. La nature de l’information Chapitre 3. La cognition symbolique Chapitre 4. La conversation créatrice Chapitre 5. Pour une mutation épistémologique des sciences de l’homme Chapitre 6. L’économie de l’information Deuxième partie - Modéliser la cognition Chapitre 7. Introduction à une connaissance scientifique de l’esprit Chapitre 8. Perspective informatique : vers une intelligence réflexive Chapitre 9. Présentation générale de la sphère sémantique IEML Chapitre 10. Le métalangage IEML Chapitre 11. La machine sémantique IEML Chapitre 12. L’Hypercortex Chapitre 13. La mémoire herméneutique Chapitre 14. Perspective humaniste : vers une connaissance explicite Chapitre 15. Observer l’intelligence collective Bibliographie Index Ana ARS Service de Presse LAVOISIER SAS Éditions Tec & Doc / EM Inter / Hermes / Synthèse Agricole / Médecine Sciences Publications 14 rue de Provigny 94236 Cachan Cedex ars at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:35:41 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:35:41 +0200 Subject: Appel: LREC 2012 Message-ID: Date: Fri, 01 Jul 2011 15:09:09 +0200 From: info at Message-ID: <4E0DC6F5.20709 at> [Apologies for cross-postings] ***FIRST CALL FOR PAPERS*** LREC 2012 8th ELRA Conference on Language Resources and Evaluation Istanbul Convention & Exhibition Centre (ICEC, Lütfi Kirdar Centre) ISTANBUL, TURKEY MAIN CONFERENCE: 23-24-25 MAY 2012 WORKSHOPS and TUTORIALS: 21-22 MAY and 26-27 MAY 2012 Conference web site: http// The eighth international conference on Language Resources and Evaluation (LREC) will be organised in 2012 by ELRA with the support of a wide range of international associations and organisations. CONFERENCE AIMS Since the first LREC held in Granada in 1998, LREC has become the major event on Language Resources (LRs) and Evaluation for Language Technologies (LT). The aim of LREC is to provide an overview of the state-of-the-art, explore new R&D directions and emerging trends, exchange information regarding LRs and their applications, evaluation methodologies and tools, ongoing and planned activities, industrial uses and needs, requirements coming from the e-society, both with respect to policy issues and to technological and organisational ones. LREC provides a unique forum for researchers, industrials and funding agencies from across a wide spectrum of areas to discuss problems and opportunities, find new synergies and promote initiatives for international cooperation, in support to investigations in language sciences, progress and innovation in language technologies and development of corresponding products, services and applications, and standards. CONFERENCE TOPICS Issues in the design, construction and use of Language Resources (LRs): text, speech, multimodality . Guidelines, standards, best practices and models for LRs interoperability . Methodologies and tools for LRs construction and annotation . Methodologies and tools for the extraction and acquisition of knowledge . Ontologies and knowledge representation . Terminology . Integration between (multilingual) LRs, ontologies and Semantic Web technologies . Integration between (multilingual) LRs and multimedia technologies . Metadata descriptions of LRs and metadata for semantic/content markup Exploitation of LRs in different types of systems and applications . Sign language, multimedia information and multimodal communication . LRs in systems and applications such as: information extraction, information retrieval, audio-visual and multimedia search, speech dictation, meeting transcription, Computer Aided Language Learning, training and education, mobile communication, machine translation, speech translation, summarisation, web services, semantic search, text mining, inferencing, reasoning, etc. . Different types of interfaces: (speech-based) dialogue systems, natural language and multimodal/multisensorial interactions, voice activated services, etc. . Use of (multilingual) LRs in various fields of application, like e-government, e-culture, e-health, e-participation, mobile applications, etc. . Industrial LRs requirements, user needs Issues in Language Technologies evaluation . LT Evaluation methodologies, protocols and measures . Validation, quality assurance, evaluation of LRs . Benchmarking of systems and products . Usability evaluation of LT-based user interfaces, interactions and dialogue systems . Usability and user satisfaction evaluation General issues regarding LRs & Evaluation . National and international activities and projects . International collaboration and co-operation . Multilingual issues . Priorities, perspectives, strategies in national and international policies for LRs . Language coverage and diversity, Less Resourced languages, Endangered languages . Open, linked and shared data and tools, Open and collaborative architectures . Organisational, economical, ethical and legal issues Hot Topic: Speech & Multimodal Resources Speech and Multimodal Resources are the special topics for LREC 2012, and submissions dedicated to these modalities are encouraged! Also papers integrating speech and/or multimodal with written resources are particularly welcome. Special Highlight: Contribute to building the LREC Language Library! After the success of the LRE Map introduced in LREC 2010 -- now used in many Conferences as a normal step in the submission procedure -- LREC 2012 recognises that time is ripe to launch another important initiative, the LREC Language Library! The LREC Language Library will also be a collaborative enterprise of the LREC Community, an important contribution to the community-built Open Resource Infrastructure. ELRA will prepare an LREC Repository, part of the META-SHARE network, hosting a number of resources on all modalities (speech, text, images, etc.) in as many languages as possible. When submitting a paper, you will be invited to process some pieces of this data, in the appropriate language(s) for you, in one or more of the possible dimensions that your submission addresses (e.g. POS-tag the data, extract/annotate named entities, annotate temporal information, disambiguate word senses, transcribe audio, etc.) and put the processed data back in the LREC Repository. The processed data will be made available to all the LREC participants before the conference, to be compared and analysed, and at LREC we will organise some event around them with your help! This collaborative work on annotation/transcription/extraction/... over the same data and on a large number of processing dimensions will set the ground for a large Language Library, linked to the LRE Map for the description of the data, where everyone can deposit/create processed data of any sort -- all our "knowledge" about language. PROGRAMME The Scientific Programme will include invited talks, oral presentations, poster and demo presentations, and panels, in addition to a keynote address by the winner of the Antonio Zampolli Prize. As usual, there is no difference in quality between oral and poster presentations. Only the appropriateness of the type of communication (more or less interactive) to the content of the paper will be considered. SUBMISSIONS AND DATES Submitted abstracts of papers for oral and poster or demo presentations should consist of about 1500-2000 words. * Submission of proposals for oral and poster/demo papers: 15 October 2011 Proposals for panels, workshops and tutorials will be reviewed by the Programme Committee. * Submission of proposals for panels, workshops and tutorials: 15 October 2011 PROCEEDINGS The Proceedings will include both oral and poster papers, in the same format. In addition a Book of Abstracts will be printed. CONFERENCE PROGRAMME COMMITTEE Nicoletta Calzolari -- CNR, Istituto di Linguistica Computazionale "Antonio Zampolli", Pisa -- Italy (Conference chair) Khalid Choukri -- ELRA, Paris -- France Thierry Declerck -- DFKI GmbH, Saarbrücken -- Germany Mehmet Ugur Dogan -- TÜBITAK-BILGEM, SLTC, Kocaeli -- Turkey Bente Maegaard -- CST, University of Copenhagen -- Denmark Joseph Mariani -- LIMSI-CNRS & IMMI, Orsay -- France Asuncion Moreno -- Universitat Politècnica de Catalunya, Barcelona -- Spain Jan Odijk -- UIL-OTS, Utrecht -- The Netherlands Stelios Piperidis -- Athena Research Center/ILSP, Athens -- Greece ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 6 07:42:20 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jul 2011 09:42:20 +0200 Subject: Habilitation: Kais Haddar, Ressources lexico-syntaxiques normalisees et analyse de phenomenes linguistiques pour la langue arabe Message-ID: Date: Sun, 3 Jul 2011 17:11:19 +0100 (BST) From: Kais Haddar Message-ID: <1309709479.55417.YahooMailRC at> Boujour à tous, j'ai le plaisir de vous inviter à la soutenance de mon Habilitation Universitaire en Informatique intitulée "Spécification et implémentation des ressources lexico-syntaxiques normalisées et analyse de phénomènes linguistiques pour la langue arabe". La soutenance aura lieu le jeudi 07 juillet 2011 à 10h dans la salle des thèses de la FSEGS, Tunisie. M. Abdelmajid BEN HAMADOU, Professeur Président M. Denis MAUREL, Professeur Rapporteur Mme. Lamia HADRICH BELGUITH, Maître de Conférences Rapporteur M. Laurent ROMARY, Professeur Examinateur M. Abdelhamid ABDELWAHED, Professeur Examinateur Cordialement Kais Haddar ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 6 07:45:02 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jul 2011 09:45:02 +0200 Subject: Job: Researcher position, Statistical Machine Translation Message-ID: Date: Tue, 05 Jul 2011 11:36:54 +0200 From: Nicola Cancedda Message-ID: <4E12DB36.5080709 at> X-url: Researcher, Statistical Machine Translation The Machine Learning for Document Access and Translation group of the Xerox Research Centre Europe conducts research in Statistical Machine Translation and Information Retrieval, Categorization and Clustering using advanced machine learning methods. The team is part of the PASCAL 2 European Network of Excellence, ensuring a strong network of academic collaboration. We are opening a position for a researcher with a background in Statistical Machine Translation to support our participation in the EU-funded project TransLectures. Required experience and qualifications: - PhD in computer science or computational linguistics with focus on SMT or statistical NLP. - Good publication record and evidence of implementing systems. - A good command of English, as well as open-mindedness and the will to collaborate within a team. - Acquaintance with Spoken Language Translation is a plus. Preferred starting date: November 2011 Contract duration: 18 months Application instructions Please email your CV and covering letter, with message subject "Statistical Machine Translation Researcher" to xrce-candidates and to Nicola.Cancedda at Inquiries can be sent to Nicola.Cancedda at XRCE is a highly innovative place and we strongly encourage publication and interaction with the scientific community. Job announcement URL: ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 6 07:51:08 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jul 2011 09:51:08 +0200 Subject: Job: CDD (niveau post-doc) sur l'analyse semantique, CEA LIST Message-ID: Date: Tue, 5 Jul 2011 13:31:04 +0200 From: Gaël de Chalendar Message-Id: < at> Le département DIASI du CEA LIST propose un CDD de niveau post-doctoral sur un projet de recherche. Sujet : Génération Automatique de Scénarios à partir de Procédures Écrites Contexte ======== L'exploitation de la Réalité Augmentée pour la maintenance ainsi que l'utilisation de robots dans ce type de tâches ou pour l'aide à la personne nécessitent de disposer de modèles 3D de l'environnement et des objets. Il faut aussi exprimer les scénarios de maintenance (RA) ou d'action (robotique) en termes de ces modèles. Mais la réalisation manuelle de tels modèles est extrêmement couteuse. Or, les documentations techniques et les scénarios de maintenance sont très souvent décrits en langage naturel, et ce la plupart du temps avec un langage contrôlé ou du moins très spécifique. De même, les scénarios d'action des robots peuvent être énoncés à voix haute par les utilisateurs. Il serait donc souhaitable de pouvoir convertir (semi-)automatiquement l'ensemble de ces productions langagières en éléments de modèles et en plans d'actions exprimés dans le langage formel utilisé par l'application. Les travaux proposés dans ce post-doc sont une collaboration entre trois laboratoires du Département Intelligence Ambiante et Systèmes Interactifs (DIASI) du CEA LIST. Ils consistent à exploiter les outils d'analyse linguistique et sémantique développés au LVIC pour développer de nouvelles méthodes de conversion du texte en modèles et les appliquer aux besoins en RA et robotique des laboratoires LRI et LSI. Etat de l’art et verrous technologiques ======== Même si des travaux existent sur ces sujets (Cf. références ci-dessous), les verrous sont encore très nombreux. De nombreuses technologies qui sont nécessaires dans le cadre de ce post-doc restent très expérimentales : outils d'analyse sémantique (Word Sense Disambiguation, Semantic Role Labeling,...) , exploitation de connaissances sur le monde/pragmatique, lien sémantique lexicale / sémantique formelle, interfaces homme-machine pour la mise a point des modèles (corrections, évolutions). Description des travaux ======= Le post-doc recruté commencera son contrat par une rapide imprégnation des technologies et des outils de Traitement Automatique des Langues du LVIC, puis des technologies et outils cibles: modélisation 3D, RA, robotique. Il poursuivra par une exploration approfondie de l'état de l'art. Puis, il proposera un plan de travail incluant la réalisation de deux prototypes et d'un plan d'évaluation. Si le planning le permet et qu'une campagne d'évaluation adaptée existe, il participera à cette campagne. Il devra en permanence rester en contact avec des membres spécifiques des divers laboratoires, de façon à s'assurer que son travail est bien cohérent avec les objectifs de tous. Pour ce faire, des réunions de coordinations mensuelles seront organisées avec des représentants des trois laboratoires. Les prototypes développés devront permettre de convertir des documents techniques en modèles et scénarios utilisables de façon semi-automatique. Ils utiliseront les outils de traitement automatique des langues et inclueront une interface graphique permettant de passer du texte au modèle avec le moins de manipulations manuelle des données possible. Profil recherché ======= Le candidat recherché est un docteur en informatique, spécialité traitement automatique des langues ou technologies du Web sémantique (ontologies, raisonnement). Il devra posséder une expérience de la réalisation d'interfaces graphiques, si possible en Qt. Une connaissance de la modélisation 3D faciliterait le commencement du post-doc. Lieu, durée et rémunération ======= Le CDD se déroulera au sein du laboratoire LVIC, dans ses nouveaux locaux (à partir d'octobre 2011) de Nano'Innov à Palaiseau sur le plateau de Saclay en Région Parisienne. La durée est de 12 mois et la rémunération selon les grilles du CEA (environ 2200 € net, variable selon le parcours) Comment candidater ======= Les candidatures sont à envoyer dès que possible et seront étudiées jusqu'à ce que le poste soit pourvu. Envoyer un CV et une lettre de motivation, ainsi que d'éventuelles recommandations, par courrier électronique à at Gaël de Chalendar +33 1 46 54 80 18 CEA LIST Centre de Fontenay-aux-Roses Laboratoire Vision et Ingénierie des Contenus (Vision and Content Engineering Laboratory) Bat. 38-2 ; 18, rue du Panorama ; BP 6 92265 Fontenay aux Roses Cedex ; France Références ======= - Romaric Besançon, Gaël de Chalendar, Olivier Ferret, Faiza Gara, Olivier Mesnard, Meriama Laïb and Nasredine Semmar. LIMA : A Multilingual Framework for Linguistic Analysis and Linguistic Resources Development and Evaluation. Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10). May 2010. - Eva Hanser. SceneMaker: Intelligent Multimodal Visualisation of Natural Language Scripts. Confirmation Report. June, 2009 - Minhua Ma. Automatic Conversion of Natural Language to 3D Animation. Thesis. University of Ulster. July 2006 - Lee M. Seversky. Real-time Automatic 3D Scene Generation from Natural Language Voice and Text Descriptions. State University of New York at Binghamton - Stéphane S. Somé and Xu Cheng. 2008. An approach for supporting system-level test scenarios generation from textual use cases. In Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 724-729. - Hans Svensson & Ola Åkerberg. Development and Integration of Linguistic Components for an Automatic Text-to-Scene Conversion System. Lund Institute of Technology. August 2002. - Patrick Ye. Natural Language Understanding in Controlled Virtual Environments. PhD thesis. University of Melbourne. Melbourne, Australia. June 2009 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 6 07:54:44 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jul 2011 09:54:44 +0200 Subject: Appel: Revue TAL - Note de lecture (GAUSSIER) Message-ID: Date: Tue, 5 Jul 2011 17:46:12 +0200 (CEST) From: Denis Maurel Message-ID: <526799459.70080.1309880772017.JavaMail.root at mail10> X-url: X-url: Appel: revue TAL - Note de lecture (GAUSSIER) La revue TAL publie régulièrement des notes de lecture. Nous recherchons un collègue souhaitant lire le livre: "Éric GAUSSIER, François YVON, Modèles statistiques pour l’accès à l’information textuelle, Hermès-Lavoisier, 2011, 482 pages" et prêt à en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoyé gracieusement en échange du service rendu). Cette note de lecture doit être rédigée en français (trois pages maximum, au format de la revue) et envoyée fin septembre 2011. D'autres compte-rendu sont possibles si vous avez lu récemment un ouvrage qui vous a intéressé et si vous êtes prêt à partager votre lecture avec la communauté... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 8 20:35:40 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Jul 2011 22:35:40 +0200 Subject: Appel: colloque Cooccurrence (Precisions sur modalites de soumission) Message-ID: Date: Wed, 06 Jul 2011 14:54:11 +0200 From: Sylvie Mellet Message-ID: <4E145AF3.9040806 at> *Modalités de soumission pour le colloque "La cooccurrence : du fait statistique au fait textuel" (Besançon, 8-10 février 2012) - Appel complet ci-dessous. * La proposition de communication prendra la forme d'un résumé long (deux pages) accompagné d'une bibliographie de référence. Elle sera présentée dans un fichier anonymé et sera envoyée avant le 10 septembre 2011 à sylvie.mellet at et jmviprey at *Submission for the conference "**Co-occurrence: from a statistical to a textual phenomeno**n" (Besançon, 8-10 february 2012) - Conference call below. * Proposals on papers including an abstract of 2 pages (references not included) should be submitted in French or English. All submitted manuscripts must be original papers of scientific quality in regard to theoretical and methodological criteria and will be peer-reviewed anonymously by an international selection committee. Abstracts should be sent by 10th September 2011 to the following addresses: sylvie.mellet at and jmviprey at *Appel à communications* */La cooccurrence : du fait statistique au fait textuel/* Besançon, 8-9-10 février 2012 (/english version below/) Depuis 60 ans et l'historique affirmation de Firth «you shall judge a word by the company it keeps », les travaux sur la cooccurrence se sont multipliés dans le monde pour devenir un champ à part entière de la linguistique de corpus et de la linguistique textuelle. Au-delà des perspectives très diverses (études phraséologiques, extraction d'expressions idiomatiques, traduction automatique, désambiguïsation sémantique d'homographes, fouille de textes, description et modélisation textuelles, mise à jour des thématiques du discours, etc.), au-delà aussi des variantes terminologiques pas uniquement imputables à des effets de traduction (/cooccurrence/, /collocation/, /colligation/, /corrélats/, /associations/, etc.), ces travaux foisonnants reposent sur une posture contextualisante commune et sur une approche probabiliste du langage partagée [London school (Firth et Halliday) puis Birmingham school (Sinclair), Laboratoire de Saint-Cloud (Tournier), etc.]. Le postulat est en effet ici que le sens naît toujours en contexte, qu'il se construit à partir du co-texte, et la cooccurrence représente la seule forme objectivable, minimale mais calculable, de ce co-texte. Le colloque « La cooccurrence : du fait statistique au fait textuel » (Besançon, 8-10 février 2012) veut aujourd'hui faire le point sur les études en cours, confronter les méthodologies, analyser les enjeux. Sans exclure les études lexicologiques, phraséologiques ou le traitement automatique de la langue dont les avancées théoriques aussi bien que les nouveaux algorithmes de calcul, les outils d'extraction et de représentation des réalités cooccurrentielles pourront être présentés, on portera une attention particulière, dans la voie lointainement initiée par Halliday & Hasan, à *la cooccurrence comme facteur primordial de la textualité*. Partant du simple calcul des paires de mots statistiquement cooccurrentes dans le corpus ou du simple repérage des mots statistiquement associés à un mot-pôle donné, les contributions devront chercher à apporter un éclairage novateur sur des phénomènes cooccurrentiels plus complexes comme les réseaux cooccurrentiels intriqués qui structurent un texte, la cooccurrence généralisée (Viprey) ou la poly-cooccurrence (Martinez) qui construisent des structures d'équivalence, ou de résonance, non obvies, ou encore sur les cooccurrences indirectes (A => B => C) ou de deuxième génération qui à force d'itération prétendent épuiser le texte. Si le texte est aujourd'hui perçu comme une entité réticulaire avec ses récurrences, ses échos, ses rhizomes, la cooccurrence doit permettre de le décrire et le modéliser. L'axe syntagmatique et la linéarité orientée du texte pourront aussi être problématisés. D'abord purement statistique, la définition de la cooccurrence comme coprésence régulière de deux unités linguistiques dans une fenêtre textuelle donnée pourra être enrichie par des contraintes distributionnelles dans la tradition harrissienne ou des contraintes de contiguïté, d'orientation, de place ou d'enchaînement pour rejoindre la notion de /pattern/, de /segment répété/ (Salem) ou de /motif/ (Longrée et Mellet). Enfin, une attention particulière pourra être portée aux cooccurrences sur des niveaux linguistiques étagés, c'est-à-dire à celles qui concernent non pas seulement deux mots comme c'est habituellement le cas dans le cadre du traitement du vocabulaire, mais deux éléments grammaticaux, ou, de manière croisée, des éléments lexicaux et grammaticaux, des lemmes et des étiquettes morphosyntaxiques, etc. Certaines commnications pourront porter sur l'histoire proprement dite de cette dimension dans la constitution et l'évolution de la linguistique textuelle, dans les domaines francophone, anglo-saxon, scandinave, mais aussi dans le reste du monde. A l'exception de ces dernières, les propositions de communication devront prendre appui sur l'étude de corpus précisément définis et, par delà le traitement et l'analyse des données, mettre fortement en évidence l'apport méthodologique et/ou théorique de la contribution. Les langues du colloque seront le français et l'anglais. *Mots clés :* Cooccurrence Segment répété Collocation Colligation Corrélats Association lexicale Contextualisation sémantique Linguistique de corpus Textualité *Calendrier :* -Colloque : 8-10 février 2012 -Date limite de soumission : 10 septembre 2011 -Avis d'acceptation aux auteurs : 15 octobre 2011 *Modalités de soumission :* La proposition de communication prendra la forme d'un résumé long (deux pages) accompagné d'une bibliographie de référence, et sera envoyée dans un fichier anonymé à sylvie.mellet at et jmviprey at Les */actes du colloque/* seront publiés, après un nouveau processus de soumission, relecture et sélection, dans le numéro 11 de la revue /CORPUS/, à paraître en novembre 2012. *Conference**call* */Co-occurrence: from a statistical to a textual phenomenon/* *Besançon, 8-9-10 February 2012* ** *Call for **papers*** 60 years ago, Firth declared, "you shall judge a word by the company it keeps." Since he made that historic statement, studies on co-occurrence patterns have multiplied in the world and have now become a field in their own right, existing within the larger fields of corpus linguistics and text linguistics. Work focusing on co-occurrence patterns has adopted a great variety of perspectives, focusing on, for example, phraseological phenomena, automatic extraction of idioms, automatic translation, homograph disambiguation, text mining, textual description and modelling, and retrieval of discourse themes. Also, the terminology used has displayed a notable diversity (which may not be entirely explained by translation effects): indeed, the phenomena examined have been referred to as co-occurrence patterns, collocations, colligations, correlates, associations, and other terms. However, one should not be puzzled, because, in spite of these visible differences, studies on co-occurrence patterns all share a common postulate regarding the essential role of context in the elaboration of word meaning, and they all bring a probabilistic approach to the study of language [see London school (Firth and Halliday), Birmingham school (Sinclair), Laboratoire Saint-Cloud (Tournier), etc]. In brief, they assume that (i) meaning is always a contextual phenomenon and is elaborated on the basis of the co-text; and (ii) co-occurrence patterns are to be considered as the only objectified units of the context, a minimal yet calculable form. The colloquium "Co-occurrence: from a statistical to a textual phenomenon", to be held in Besançon from 8-10 February 2012, intends to take stock of current studies, to compare methodologies, and to analyse the scientific stakes involved. Lexicological and phraseological studies, as well as work on natural language processing, may be submitted. Contributions may also present new logarithms, or new tools for extracting and modelling co-occurrence phenomena. Work that would embrace the path opened long ago by Halliday and Hasan, /i.e. /to//consider *textuality as being primarily built by co-occurrence facts*,**would be most appreciated. Whether the contributions rely on the simple computation of word pairs that statistically co-occur within a given corpus, or on the simple identification of words that are statistically associated with a word-pole, it is expected that they will shed light on more complex structures such as the intricate co-occurrence networks organizing a text, generalised co-occurrences (Viprey), or polyco-occurrences (Martinez), which contribute to the establishment of underlyingequivalence or resonance structures. Contributions may also address indirect co-occurrence patterns A => B => C (also called second-generation co-occurrence patterns) which, if repeated several times, help reveal the content of a text. Indeed, since a text is now widely considered as a reticular entity formed by recurrent patterns, echoes, and rhizomes, then co-occurrence patterns should make text description and modelling possible. The issues of the syntagmatic axis and the linear orientation of a text may also be debated. Co-occurrence patterns have been defined, first, as a purely statistical phenomenon,/i.e/. as the regular co-presence of two linguistic units within a given textual window; but it may be improved by identifying distributional constraints (following the tradition of Harris's work) or constraints affecting adjacency relations, or the orientation, position and/or sequencing of given units; work of this kind would then meet the notions of/pattern/, /repeated segments/ (Salem) or /motifs/ (Longrée and Mellet). Finally, special attention may also be given to multi-level co-occurrence patterns /i.e./ patterns connecting two grammatical units (and not two lexical items as is usually the case when one analyses the vocabulary of a given corpus); studies may also cross linguistic levels and focus on the co-occurrence of lexical units with grammatical units, lemmas with morpho-syntactic tags, etc. A certain number of submissions concerned with the history of the notion of /co-occurrence/ and its role in the emergence and evolution of textual linguistics will be accepted; the tradition may be investigated in French-speaking countries, in the Anglo-Saxon and Scandinavian areas, or in the rest of the world. With the exception of this last (historical) orientation, submissions must rely on precisely defined corpora, and, beyond the processing and analysis of the data, they must emphasize the methodological and/or theoretical contribution to the field. The languages of the conference are French and English. *Key words* Co-occurrences Repeated segments Collocations Lexical associations Semantic contextualization Corpus linguistics Textuality *Calendar* Conference: 8-9-10 February 2012 Deadline for paper submission: 10 September 2011 Notification of acceptance: 15 October 2011 *Submission* Proposals on papers including an abstract of 2 pages (references not included) should be submitted in French or English. All submitted manuscripts must be original papers of scientific quality in regard to theoretical and methodological criteria and will be peer-reviewed anonymously by an international selection committee. Abstracts should be sent by 10th September 2011 to the following addresses: sylvie.mellet at and jmviprey at *Conference proceedings *will be published, after a new process of submission, review and selection, in /Corpus/ (11) to appear in November 2012. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 8 20:41:35 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Jul 2011 22:41:35 +0200 Subject: Job: Programming Position, ELDA Message-ID: Date: Thu, 07 Jul 2011 14:12:00 +0200 From: info at Message-ID: <4E15A290.8020306 at> [English version below] *Programmeur dans le département d'évaluation des technologies de la langue* ELDA propose un poste de programmeur pour ses activités de production de ressources linguistiques et d'évaluation, dans le cadre de projets européens. Il/elle aura la charge de développer des architectures orientées service Web pour la production automatique et la distribution de ressources linguistiques. Il/elle sera aussi impliqué dans la création de dépôts de ressources linguistiques, du développement d'application de TAL ou pour l'évaluation, etc. Profil recherché : - De formation ou niveau ingénieur en informatique, traitement automatique des langues ou tout autre domaine affilié. - Bonne compétences de programmation Python - Bonne connaissance de Django et de la gestion de base de données (MySQL) - Bonne connaissance de Linux et des outils Open Source - Expérience et/ou connaissance des services Web - Français et anglais exigés - Aptitude à travailler tant de façon indépendante au sein d'une équipe - Connaissances en PHP, Perl, C++ ou Java sont un plus - Expérience et/ou connaissance du TAL est un plus Salaire: en fonction des qualifications et expériences. Toute candidature sera étudiée jusqu'à ce que le poste soit pourvu. Le poste est basé à Paris. Les candidats doivent avoir la citoyenneté d'un pays de l'Union Européenne ou en possession d'un titre de séjour. Les candidatures doivent être adressées (de préférence au format PDF et par e-mail) à : Olivier Hamon ELRA / ELDA 55-57, rue Brillat Savarin 75013 Paris FRANCE Fax : +33 1 43 13 33 30 Email : hamon at ------------------------------------------------------------------------ Programming position ELDA offers a position for its Language Resource Production and Evaluation activities working in the framework of European projects. The position is related to the development of web-service architectures for the automatic production and distribution of language resources. The candidate may also be involved in the creation of LR repositories, NLP applications development and/or evaluation, etc. Profile: - Degree or MSc in computer science, computational linguistics, natural language processing or similar fields - Good programming skills in Python - Good knowledge of Django and database management (MySQL) - Good knowledge of Linux and open source software - Experience and/or knowledge of web services - Proficiency in French and English - Ability to work independently and as part of a team, in particular to collaborate with members of a multidisciplinary and multilingual team - Programming skills in PHP, Perl, C++ or Java are a plus - Experience and/or knowledge on NLP is a plus Salary: Commensurate with qualifications and experience. Applications will be considered until the position is filled. The position is based in Paris, France and candidates should have the citizenship (or residency papers) of a European Union country. Applicants should send (preferably in PDF format and via email) a cover letter addressing the points listed above together with a curriculum vitae to: Olivier HAMON ELRA / ELDA 55-57, rue Brillat Savarin 75013 Paris FRANCE Fax : +33 1 43 13 33 30 Email : hamon at The European Language Resources Association (ELRA) is a non-profit making organisation founded by the European Commission in 1995, with the mission of providing a clearing house for language resources and promoting Human Language Technologies. The Evaluations and Language resources Distribution Agency (ELDA) is ELRA's operational body. ELDA identifies, collects, distributes and evaluates language resources. It also organises evaluation activities and campaigns in HLT, as well as disseminates general information in the HLT field. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 8 20:44:00 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Jul 2011 22:44:00 +0200 Subject: Conf: SFC 2011, 28-30 septembre 2011, Orleans Message-ID: Date: Fri, 08 Jul 2011 17:52:47 +0200 From: Guillaume Cleuziou Message-ID: <4E1727CF.2020909 at> X-url: ============ Appel à Inscription et Participation ============ Pour vous inscrire et participer à la conférence SFC'2011 : XVIIIèmes Rencontres de la Société Francophone de Classification du 28 au 30 septembre 2011 à Orléans Contact email : sfc2011 at Site Web : ----------------- Dates importantes ----------------- Inscription : dès maintenant Après le 31 juillet 2011 : augmentation des tarifs de 10% ----------------- Chercheurs invités ----------------- Radim Belohlavek : Prof. Université de Palacky (République Tchèque) Gérard Govaert : Prof. Université de Technologie de Compiègne (France) Christian Sohler : Prof. Université de Dortmund (Allemagne) ----------------- Programme ----------------- La liste des articles sélectionnés par le comité de programme est disponible sur le site des rencontres : Au plaisir de vous accueillir prochainement à Orléans. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:25:44 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:25:44 +0200 Subject: Job: Junior Research Assistant Position in NLP, University of Beira Interior, Portugal Message-ID: Date: Sat, 09 Jul 2011 11:37:57 +0100 From: Gaël Dias Message-ID: <4E182F85.5000501 at> X-url: [Apologize for cross-posting] ***************************************************************** Junior Research Assistant Position in Natural Language Processing Centre of Human Language Technology and Bioinformatics University of Beira Interior Portugal ***************************************************************** The Centre of Human Language Technology and Bioinformatics (HULTIG) of the University of Beira Interior ( is advertising a 9 months scholarship (980 euros/month) for an outstanding Master student in Informatics, Computer Science or Applied Mathematics in the domain of the construction of Medical Ontologies. The selected candidate will work on the MEDON project funded by the Portuguese Foundation for Science and Technology. The work will mainily consist in developping new research in the fields of Lexical Semantics and Ontology Construction with a motivated and motivating team of Senior Researchers and PhD Students. In particular, the candidate will have to work on two interlinked topics: 1. Extraction of medical terminological resources from medical corpora. 2. Construction of prototype-based ontologies by investigating multi-view clustering and sequential clustering using level of generality and similarity features. The HULTIG Centre is principaly concerned in developing high reasearch in the domains of Natural Language Processing, Text Mining, Information Retrieval and Knowledge Engineering. It fosters inter-disciplinary research and applied research. A great deal of National and International Instituitions are working in partnership with the HULTIG Centre. In particular, this research will be carried out with the University of Evora (Portugal), University of Orléans (France) and University of Caen Basse-Normandie (France). To apply, the interested applicants must send a Curriculum Vitae, the list of subjects and marks of their Bachelor and Master degrees and a letter of motivation by email to the Head of the Centre of Human Language Technology and Bioinformatics, Prof. Gaël Dias at ddg at Latest day for receipt of applications is Monday, 27th July, 2011. Best Regards, Gaël Dias. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:29:55 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:29:55 +0200 Subject: Appel: CSLP 2011, deadline extension to July 17th Message-ID: Date: Mon, 11 Jul 2011 21:50:57 +0200 From: Denys Duchier Message-ID: <87oc10d2am.fsf at> X-url: *** DEADLINE EXTENSION! *** The CSLP at Context'11 workshop considers the role of constraints in the representation of language and the implementation of language processing from an interdisciplinary perspective. This theme should be interpreted inclusively: contributions from linguistics, computer science, psycholinguistics and related areas are very welcome, and an interdisciplinary perspective is of particular interest. Constraints are widely used in linguistics, computer science, and psychology. How they are used, however, varies widely according to the research domain: knowledge representation, cognitive modelling, problem solving mechanisms, etc. These different perspectives are complementary, each one adding a piece to the puzzle. For example, linguistics proposes in-depth descriptions implementing constraints in order to filter out structures by means of description languages, constraint ranking, etc. The constraint programming paradigm, on the other hand, shows that constraints have to be taken as a systematic whole and can thus play a role in building the structures (or can even replace structures). Finally, psycholinguistics experiment have been made, investigating the role of constraint systems for cognitive processes in comprehension and production, as well as addressing how they can be acquired. The topics include, but are not limited to - Constraints in human language comprehension and production - Context modelling and discourse interpretation - Acquisition of constraints - Constraints and learning - Cross-theoretical view of the notion of constraint - New advances in constraint-based linguistic theories - Constraint satisfaction (CS) technologies for NLP - Linguistic analysis and linguistic theories biased towards CS or constraint logic programming (CLP) - Application of CS or CLP for NLP - CS and CLP for other than textual or spoken languages, e.g., sign languages and biological, multimodal human-computer interaction, visual languages - Probabilistic constraint-based reasoning for NLP and context comprehension Previously published papers cannot be accepted. The submissions will be reviewed by the international program committee. One author for each accepted paper must attend the workshop in order to present the paper. Cheers, --Denys ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:33:28 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:33:28 +0200 Subject: Appel: JADT 2012 Message-ID: Date: Tue, 12 Jul 2011 08:59:01 +0200 From: Anne Dister Message-Id: X-url: X-url: ------------------------------------------------------------------------ APPEL A COMMUNICATIONS JADT 2012 - Journées d'Analyse des Données Textuelles 13-15 juin 2012, Liège, Belgique ------------------------------------------------------------------------ Chers collègues, Les journées internationales d’analyse statistique des données textuelles (JADT) réunissent tous les deux ans, depuis 1990, des chercheurs travaillant dans les différents domaines concernés par les traitements automatiques et statistiques de données textuelles. Elles permettent aux participants de présenter leurs résultats, de confronter leurs outils et leurs expériences. Les JADT 2012, organisées par le LASLA – Laboratoire d’Analyse statistique des Langues anciennes de l’Université de Liège et par le SeSLA – Séminaire des Sciences du Langage des Facultés universitaires Saint-Louis —, réuniront à Liège (Belgique), du 13 au 15 juin 2012, des chercheurs travaillant dans le domaine de l’analyse des données textuelles : de la lexicographie à l’analyse du discours politique, de la recherche d’information aux recherches qui concernent le marketing, de la linguistique computationnelle à la sociolinguistique, de la fouille de données textuelles à l’analyse de contenu. Dans la lignée des précédentes conférences JADT (, la conférence de Liège proposera, durant trois jours, des ateliers, des présentations scientifiques, des conférences invitées et des sessions de discussion entre les participants. Le site du colloque se trouve à l’adresse suivante : Thèmes du colloque La conférence sera centrée sur les applications des modèles et des outils statistiques dans les domaines suivants: - Textométrie, statistique textuelle - Analyse exploratoire de données textuelles - Linguistique de corpus et linguistique quantitative - Traitement automatique du langage naturel - Étiquetage, lemmatisation, enrichissement linguistique - Analyse statistique des données structurées et non structurées - Classification de textes, cartographie lexicale et textuelle - Recherche documentaire, recherche d’informations - Fouille de textes, fouille du web, Web sémantique - Stylométrie, analyse du discours - Logiciels pour l’analyse textuelle - Apprentissage automatique pour l’analyse des données textuelles - Corpus multilingues et corpus parallèles Dates importantes Dates limites Titre et Résumé (max 20 lignes) 1er octobre 2011 Date limite de soumission: Première version (Texte complet) 1er décembre 2011 Notification aux auteurs 1er février 2012 Date limite d’inscription 1er mars 2012 Date limite de soumission: Dernière version (camera ready) 1er mars 2012 Dates de la conférence 13-15 juin 2012 Langues des articles et des présentations Les propositions de communication, les communications définitives et les présentations orales pourront être faites dans les langues suivantes : anglais, français, italien, espagnol. Toutes les communications devront être précédées d’un résumé en anglais. Titre et pré-soumission Les participants qui désirent présenter une contribution ou un poster sont invités à envoyer un titre et un résumé (maximum 20 lignes) avant le 1er octobre 2011. JADT 2012 utilisera le système EasyChair pour gérer les propositions de communication. Cette procédure est accessible sur le site de la conférence qui est d’ores et déjà accessible. Articles Les auteurs devront fournir la version complète de leur contribution avant le 1er décembre 2011. Les articles seront évalués par le comité scientifique. Le texte complet de la communication ne devra pas excéder 12 pages, références comprises, en respectant la feuille de style JADT. Le comité de programme informera les auteurs de sa décision d’acceptation et du classement de la communication (communication orale ou poster) le 1er février 2012. Version finale Les auteurs devront fournir la version finale de leur contribution (12 pages maximum) avant le 1er mars 2012, en utilisant la même procédure de soumission. La version finale sera relue avant édition. Contacts Pour plus d’informations ou toute question, écrivez à l’adresse suivante : jadt2012 at En espérant votr participation aux prochaines JADT, avec nos sentiments les plus cordiaux. ---Anne Dister, Dominique Longrée et Gérald Purnelle ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:39:02 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:39:02 +0200 Subject: Job: Post-Doctorat, TAL et ontologies pour la recherche semantique d'information Message-ID: Date: Tue, 12 Jul 2011 10:26:09 +0200 From: Nathalie Aussenac-Gilles Message-ID: <4E1C0521.4090705 at> X-url: Proposition de post-doctorat en collaboration avec l'Université Paul Sabatier (Toulouse)/laboratoire IRIT et l'Université de Pau et des Pays de l'Adour/laboratoire LIUPPA ============== Projet ANR MOANO ============== ============== Le projet MOANO "Modèles et Outils pour Applications NOmades de découverte de territoire" est un projet soutenu par l'ANR (2010-2014) - Programme CONTINT. Ce projet consiste à mettre en commun les avancées dans les domaines de la conception d'applications exploitant des données spatio-temporelles, de la recherche d'informations à caractère également spatio-temporel, ainsi que la production d'information de ce même type. Afin d'être totalement transversal, le projet vise la définition d'une infrastructure logicielle (plateforme) permettant à tout type de périphérique mobile de capturer des informations contextuelles de nature spatio-temporelles ou pouvant enrichir ces dernières afin d'augmenter leur pouvoir sémantique ou de faciliter leur indexation en vue d'une exploitation/recherche ultérieure par les applications. Sujet ============== Ce post-doctorat se situe dans le cadre du Lot 1 et des travaux sur l'annotation sémantique et la recherche d'informations. L'objectif du travail de post-doc est de construire et d'exploiter des représentations sémantiques pour faciliter l'accès à l'information dans des documents textuels. Le domaine d'application visé est la botanique ; le cas d'étude sera l'aide à la gestion du jardin MOSAIC dans l'agglomération de Lille. Les problématiques visent, d'une part, le repérage de fragments d'ontologie en corpus, et d'autre part, l'exploitation d'une ontologie à des fins d'indexation et de recherche d'information. Le travail comprend plusieurs tâches : - construction et exploitation d'outils informatiques de Traitement Automatique de la Langue (TAL) et de patrons structurels, lexicaux ou grammaticaux, pour identifier des fragments d'ontologie. - élaboration d'une ontologie botanique, notamment à l'aide de ces fragments - construction et exploitation d'outils informatiques d'indexation et de recherche d'information basés sur l'ontologie dans des documents textuels. Compétences attendues du post-doctorant ========================== Nous recherchons un docteur en informatique ayant, si possible, des compétences en traitement automatique des langues, en ontologies, en utilisation de technologies sémantiques pour l'indexation et la recherche d'information. Environnement de travail ============== Le post-doc sera accueilli dans les deux laboratoires. Il travaillera en collaboration avec Nathalie Aussenac-Gilles (IC3, IRIT) et Marie-Noelle Bessagnet (T2I/LIUPPA). La durée du contrat est de 12 mois (démarrage prévu en septembre 2011). Salaire : environ 2000 euros nets Contacts : Nathalie Aussenac-Gilles (IC3, IRIT) et Marie-Noelle Bessagnet (T2I/LIUPPA) ============== Comment candidater : ============== Les candidatures sont à envoyer dès que possible et seront étudiées jusqu'à ce que le poste soit pourvu. Envoyer un CV et une lettre de motivation, ainsi que des lettres de recommandation (ou deux noms de personnes susceptibles de recommander le candidat), par courrier électronique à : aussenac at et : marie-noelle.bessagnet at Nathalie Aussenac-Gilles +33 5 61 55 82 93 IRIT, UPS, 118 Route de Narbonne F-31062 Toulouse Cedex 9 - France Marie-Noelle Bessagnet +33 5 59 40 80 67 LIUPPA - IAE, UPPA, F-64012 Pau Cedex - France ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:45:47 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:45:47 +0200 Subject: Job: Poste d'ATER, 27e section, INSA de Rennes, Date limite pour postuler : 12 septembre 2011 midi Message-ID: Date: Tue, 12 Jul 2011 14:31:35 +0200 (CEST) From: Pascale Sebillot Message-ID: <948726209.1735114.1310473895169.JavaMail.root at> X-url: Un poste d'ATER 27e section Rennes est ouvert à l'INSA de Rennes pour un recrutement au 1er octobre 2011 (temps plein, soit 192h d'enseignement). Les candidats ont jusqu'au 12 septembre 2011 à midi pour transmettre leur dossier (cachet de la poste faisant foi). La fiche et le dossier de candidature sont accessibles à Cordialement, Pascale Sébillot ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:52:58 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:52:58 +0200 Subject: Appel: Special issue of Applied Ontology, Ontologies and Terminologies: Continuum or Dichotomy Message-ID: Date: Tue, 12 Jul 2011 17:28:52 +0200 From: Thierry Hamon Message-ID: X-url: X-url: X-url: *** New information on the submission process *** Special issue of Applied Ontology ONTOLOGIES AND TERMINOLOGIES: CONTINUUM OR DICHOTOMY The semantic content of terminologies and ontologies is similar, and so are their applicational contexts, which may introduce a confusion between these two types of resources. Usually, a terminology is defined as a set of terms, which represents the system of concepts for an area and for an application. These terms remain linguistic entities and linguistic information may be associated with them. Term organization is usually not constrained by any formal logics or description, which may lead to problems like cyclicity and redundancy within a terminology. As for ontologies, they are built upon formal specification and constraints and describe also a system of concepts and associated properties for a specific area. They are intended to be used by computers and automatic applications. One may ask whether, in a specific situation, a terminology is sufficient, or whether an ontology is always required. In that respect, terminology and ontology are two complementary resources. However a weak definition of their similarities and differences may confuse the users. The objectives of this special issue is to address various issues related to differences and similarities between ontologies and terminologies, such as: - What are the differences and similarities between ontologies and terminologies? - How various (formal, structural and content) differences between terminologies and ontologies may impact their use, as well as the results provided by automatic systems? - Are terminologies suitable for populating ontologies and to which extent? - Are terminologies the first step when building ontologies? - How should the reuse of terminologies be operated? - What are the various kinds of semantic resources going from dictionaries and terminologies to ontologies, through taxonomies and classifications? - How to decide whether a terminology or an ontology should be exploited in a given situation? - How can multilingual terminologies contribute to the localization of ontologies? - Whether the same approaches may be used for the building of terminologies and ontologies? - Whether ontologies can be (re)used for improving the contents of a terminology and vice versa? - What are model representations and algorithms for the best reuse of terminologies for ontology building? - Are automated approaches suitable for this? This Special Issue of AO addresses these various questions, but is not limited to them. Authors defending various positions and points of view are encouraged to submit to this special issue. IMPORTANT DATES Submissions Deadline September 1st, 2011 Notification to Authors December 15th, 2011 Second Submission Deadline February 15th, 2012 Second Notification March 15th, 2012 Camera-ready Version April 15th, 2012 Special Issue Publication Summer 2012 SUBMISSION PROCESS Submissions should respect the AO format ( Submission site You can find there: * the templates and specifications for the submissions * the submission form In the cover letter, please indicate that you submit to the special issue ONTOLOGIES AND TERMINOLOGIES: CONTINUUM OR DICHOTOMY. GUEST EDITORS Natalia Grabar, CNRS STL UMR 8163, Lille, France Thierry Hamon, LIM&BIO, University Paris 13, Bobigny, France Olivier Bodenreider, NLM/NIH, Bethesda, Maryland, USA SCIENTIFIC COMMITY Nathalie Aussenac, University of Toulouse, France Paul Buitelaar, National University of Ireland, Galway, Ireland Sylvie Després, University Paris 13, Bobigny, France Christiane D. Fellbaum, Princeton University, Princeton, USA Marie-Claude l'Homme, OLST, Université de Montreal, Canada Véronique Malaisé, Elsevier, Content Enrichment Center, Amsterdam, the Netherlands Alessandro Oltramari, Carnegie Mellon University, Department of Psychology, USA Chantal Reynaud, LRI Université Paris-Sud & INRIA Saclay Ile-de-France, France Stefan Schulz, Medical University of Graz, Austria Dagobert Sörgel, Library and Information Studies, University at Buffalo, Buffalo, USA Rita Temmerman, Centre for Terminology and Communication, Departement of Applied Linguistics, Erasmus University College Brussels, Belgium Maria Teresa Pazienza, Dept. of Enterprise Engineering/CERTIA, Università degli Studi di Roma Tor Vergata, Italy Hanne E. Thomsen, Copenhagen Business School, Denmark Susan Thomas, SAP, AG, Germany Anna Tordai, VU University, Amsterdam, the Netherlands Karin Verspoor, University of Colorado School of Medicine, USA Kewen Wang, Griffith University, Australia ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:50:49 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:50:49 +0200 Subject: Appel: Revue TAL, Numero non thematique 53-1 Message-ID: Date: Tue, 12 Jul 2011 15:03:22 +0200 From: Jean-Luc Minel Message-ID: <4E1C461A.9060900 at> X-url: APPEL À CONTRIBUTIONS REVUE TRAITEMENT AUTOMATIQUE DES LANGUES Numéro non thématique 2012 Volume 53 Numéro 1 Date limite de soumission : 20/11/2011 RÉDACTEURS EN CHEF Éric de la Clergerie (Alpage, INRIA& Université Paris 7) Béatrice Daille (LINA, Université de Nantes) Yves Lepage (Université Waseda, Japon), Jean-Luc Minel (MoDyCo, Université Paris Ouest Nanterre La Défense) THÈMES La revue Traitement automatique des langues lance un appel à contributions ouvert. Des propositions de soumissions sont encouragées sur tous les aspects du traitement automatique des langues, y compris (mais non exclusivement) : - pragmatique, discours, sémantique, syntaxe et lexique ; - phonétique, phonologie et morphologie ; - analyse et génération du langage parlé et écrit ; - modèles logiques, symboliques et statistiques du langage ; - extraction d'information et fouille de données textuelles ; - traitement multilingue, traduction automatique et aides à la traduction ; - interfaces en langue naturelle et systèmes de dialogue ; - interfaces multi-modales à composantes linguistiques ; - outils et ressources linguistiques ; - évaluation de systèmes ; - terminologie, acquisition de connaissances à partir de textes ; - recherche documentaire ; - linguistique de corpus ; - utilisation d'outils de TAL pour la modélisation linguistique ; - enseignement assisté, enseignement des langues ; - applications du TAL. Il est bien sûr important, quel que soit le thème, que les aspects liés au traitement automatique des langues soient mis en valeur. LANGUE Les articles sont écrits en français ou en anglais. Les soumissions en anglais ne sont acceptées que pour les auteurs non francophones. LA REVUE La revue TAL (Traitement Automatique des Langues, est une revue internationale éditée depuis 1960 par l'ATALA (Association pour le Traitement Automatique des Langues) avec le concours du CNRS. Elle est maintenant publiée en format électronique, avec accès gratuit immédiat aux articles publiés, et impression annuelle à la demande. Cela ne change aucunement son processus de relecture et de sélection. DATES IMPORTANTES - 15/11/2011 Date limite pour les résumés - 20/11/2011 Date limite de soumission - 15/02/2012 Décision du comité - 15/03/2012 Version révisée Publication à l'automne 2012 FORMAT Les chercheurs ayant l'intention de soumettre une contribution sont invités à prendre contact avec : Jean-Luc Minel jean-luc.minel at Le processus de dépôt des articles (25 pages environ, format PDF) sera précisé au cours du mois de septembre 2011 Les feuilles de style sont disponibles en ligne sur le site de la revue : COMITÉ DE RÉDACTION ------------------------------------------------------------------------ CALL FOR PAPERS JOURNAL "TRAITEMENT AUTOMATIQUE DES LANGUES" (TAL) REGULAR ISSUE 2012 Volume 53 Number 1 Deadline for submission: 20th November 2011 CHIEF EDITORS Éric de la Clergerie (Alpage, INRIA& Université Paris 7) Béatrice Daille (LINA, Université de Nantes) Yves Lepage (Université Waseda, Japon), Jean-Luc Minel (MoDyCo, Université Paris Ouest Nanterre La Défense) CALL FOR PAPERS The TAL journal launches a call for papers for an open issue of the journal. We invite papers in any field of natural language processing, including: - lexicon, syntax, semantics, discourse and pragmatics; - morphology, phonology and phonetics; - spoken and written language analysis and generation; - logical, symbolic and statistical models of language; - information extraction and text mining; - multilingual processing, machine translation and translation tools; - natural language interfaces and dialogue systems; - multimodal interfaces with language components; - language tools and resources; - system evaluation; - terminology, knowledge acquisition from texts; - information retrieval; - corpus linguistics; - use of NLP tools for linguistic modeling; - computer assisted language learning; - applications of natural language processing. Whatever the topic, papers must stress the natural language processing aspects. LANGUAGE Manuscripts may be submitted in English or French. French-speaking authors are requested to submit in French. THE JOURNAL TAL (Traitement Automatique des Langues / Natural Language Processing, ) is a forty year old international journal published by ATALA (French Association for Natural Language Processing) with the support of CNRS (National Centre for Scientific Research). It has moved to an electronic mode of publication, with printing on demand. This affects in no way its reviewing and selection process. IMPORTANT DATES 15/11/2011 Deadline for abstracts 20/11/2011 Deadline for submission 15/02/2012 Notification to authors 15/03/2012 Deadline for submission of revised version Fall 2012 Publication PAPER SUBMISSION Authors who intend to submit a paper are encouraged to contact the chief editors of the journal: Jean-Luc Minel jean-luc.minel at The process to upload contributions (approximately 25 pages, PDF format) will be notify in mid September 2011 Style sheets are available for download at EDITORIAL BOARD ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:58:05 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:58:05 +0200 Subject: ATALA: Attribution du prix de these ATALA Message-ID: Date: Wed, 13 Jul 2011 14:18:27 +0200 From: Anne Vilnat Message-ID: <4E1D8D13.8060107 at> Nous avons le plaisir de vous informer que le premier prix de thèse de l'ATALA a été décerné à Alexandre Patry, pour sa thèse intitulée "Intégration du contexte en traduction statistique à l’aide d’un perceptron à plusieurs couches", soutenue le 26 Août 2010 à l'Université de Montréal, préparée sous la direction de Philippe Langlais. Vous trouverez en pièce jointe le discours prononcé par Frédérique Segond à l'occasion de la remise officielle du prix lors de TALN à Montpellier. Les modalités d'attribution y sont détaillées. N'hésitez pas à soumettre votre (ou à faire soumettre un) travail de thèse l'an prochain! Frédérique Segond et Anne Vilnat, co-présidentes du jury. ------------------------------------------------------------------------ C'est un véritable honneur et un vrai plaisir pour moi, que de décerner aujourd´hui ce qui est le premier prix de thèse de l´histoire de l´ATALA. Avant d´aller plus loin et afin de vous tenir en haleine, permettez-moi une petite pause mathématico publicitaire. Cette Edition de taln a vu plus de 200 inscrits c´est un record pour TALN seul. Un grand merci donc à Mathieu,à Violaine, au LIRMM et a tout le comité d´organisation pour une si belle réussite. On s´en réjouit tous. J´en viens maintenant aux mathématiques. Parmi les 250 inscrits la moitié seulement sont adhérents de l´Atala. Je vous invite donc fortement à renouveler votre adhésion a l Atala. L´Atala est l´association structurante de notre communauté, elle permet l´organisation de TALN, la publication de la revue TAL, les journées thématiques, les bourses pour les étudiants, l'Atala prend aussi position sur des sujets qui concernent des décisions stratégiques quant à la recherche et là enseignement. Oui, l´Atala se bat aussi pour que vous ayez des postes. Et l´Atala a créé son prix de thèse. Bref vous avez tous compris qu´adhérer à l´Atala c´est pas cher et ça peut rapporter gros ! La boucle est bouclée et je reviens à mes moutons : le premier prix de thèse de l'Atala Il y a des expériences, des moments dans la vie qui nous font réaliser que nous avons vieilli. L'attribution d'un prix en est un. On se retrouve du jour au lendemain debout sur l´estrade mais cette fois on est celui qui décerne le prix, pas celui qui reçoit le prix. Souvent, pour être a nouveau celui qui reçoit le prix, il faut attendre encore quelques années pour, dans le meilleur des cas, obtenir le prix pour le couronnement d´une carrière. Comme la roue tourne, c´est aujourd´hui à mon tour d'avoir l´honneur d'être sur l´estrade pour décerner le prix de thèse de l'Atala. Nous avons reçu pour ce nouveau prix 9 candidatures, toutes d´excellente qualité ce qui a rendu le choix encore plus difficile. Ces thèses abordaient des thèmes aussi divers que les campagnes d´évaluation, le e-learning, la traduction automatique, le traitement de la parole, l´analyse de discours, l anaphore, le résumé automatique, la génération, et proposaient des approches variées, allant de la symbolique aux statistiques en passant par les méthodes hybrides. Une très bonne représentation en quelques sortes du paysage du TAL actuel. Pour attribuer le prix de cette première édition le conseil d´administration de l´ATALA a élu un comite de sélection de 14 personnalités du monde scientifique francophone, regroupant, dans la mesure du possible les différentes facettes du TAL et ces différents courants actuels. Chaque thèse, ainsi que les rapports qui l´accompagnaient, a été relue par deux membres du comité de sélection, un en étant le rapporteur principal. Toutes les thèses ont ensuite été présentées et discutées lors d´une réunion d´une demi-journée regroupant tous les membres du comité de sélection. De façon très générale le comité de sélection a jugé les thèses du point de vue de leur lien avec le TAL, de leur l'originalité, de la qualité de la démarche scientifique de son caractère novateur de l´importance des retombées qu´elles soient méthodologiques ou pratiques. Ont aussi été pris en considération bien entendu la qualité des publications auxquelles la thèse a donné lieu ainsi que la qualité du document de thèse. Aucun poids n´a été affecté à ces critères et bonne place a également été faite à la discussion. Sélection oh combien difficile mais il faut designer un gagnant. Gagnant qui je l'espère est prêt à se lever et courir nous rejoindre Anne et moi-même sur le podium. Ainsi, le lauréat du prix de thèse de l´Atala 2011 est Alexandre Patry, de l´université de .Montréal. Pour sa thèse intitulée « Intégration du contexte en traduction statistique à l´aide d´un perceptron à plusieurs couches » Les rapporteurs ont noté que la modélisation du contexte en traduction automatique statistique, sujet principal de votre travail, est un problème délicat et relativement peu étudié. Les modèles de traduction standard ignorent en effet le contexte en langue source pour choisir la traduction d'un mot ou d'un groupe de mot. La solution d´utiliser un perceptron à plusieurs couches pour prédire les mots de la phrase cible étant donné la phrase source entière a été jugée très originale. En effet, votre approche se distingue des travaux connexes récents qui reposent soit sur des modèles de régression essentiellement linéaires, soit sur des modèles de désambiguïsation lexicale plus complexes et donc plus lourds à mettre en oeuvre. Votre souci de valider votre approche par une évaluation empirique poussée, in vitro sur une tâche de sélection lexicale, et in vivo sur plusieurs tâches de traduction automatique, a été mise en avant. Par ailleurs, le comité de sélection a également noté que vos travaux ont donné lieu à de nombreuses publications dans des conférences internationales, revues et ateliers et que le système de traduction développé a été mis à la disposition de la communauté scientifique en code source ouvert. Enfin, le comité de sélection a souligné le souci pédagogique qui sous-tend l'ensemble de votre thèse. La démarche est décrite clairement aussi bien au niveau intuitif que formel, et elle est très bien située dans le vaste panorama des travaux actuels en traduction automatique. Je vous remets donc le prix et vous informe qu´en plus vous avez gagné le droit, le devoir et l honneur de faire partie du comité de sélection du prochain prix de thèse de l Atala ! Au nom du comité de sélection du prix de thèse de l´Atala ainsi qu´au nom de tout l´ATALA je vous félicite chaleureusement et vous souhaite une merveilleuse carrière de recherche. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:59:35 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:59:35 +0200 Subject: Revue: Texto ! Textes et Cultures Message-ID: Date: Wed, 13 Jul 2011 15:39:14 +0200 From: "Carine DUTEIL-MOUGEL" Message-ID: <44238743c2641b0ac99d459c54d3dbcd.squirrel at> X-url: Bonjour, La revue Texto ! Textes et Cultures publie son nouveau numéro coordonné par Céline POUDAT. Vous trouverez ci-après une petite sélection. L'intégralité des articles est consultable sur : Volume XVI - n°2 (2011). Coordonné par Céline POUDAT ÉTIENNE BRUNET Les bases de données en texte intégral. Réalisation et diffusion CHARLOTTE DILKS Approches théoriques : la métaphore, la sémantique interprétative et la sémantique cognitive ALAIN HERREMAN Analyser l’analyse, décrire la description. Une introduction au Résumé d’une théorie du langage de L. Hjelmslev BERNARD VOUILLOUX Soupçons sur l'indice : le syndrome de Benito KATARZYNA WOLOWSKA La virtualisation contextuelle de traits sémantiques non-actualisation, délétion ou suspension ? Bonne consultation ! CDM ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 20:01:26 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 22:01:26 +0200 Subject: Appel: 8th Workshop on Syntax & Semantics (WoSS8) Message-ID: Date: Wed, 13 Jul 2011 15:42:56 +0200 From: Géraldine Walther Message-Id: X-url: [Apologies for cross-postings] ***FIRST CALL FOR PAPERS*** 8th Workshop on Syntax & Semantics (WoSS) November 17th-18th, 2011 Paris, France ***** We invite PhD students to send abstracts for twenty-minute talks followed by a ten-minute discussion or poster presentations on any aspect of theoretical linguistics for the 8th Workshop on Syntax & Semantics (WoSS). WoSS is a series of rotating workshops organized by PhD students from 'neighbouring' universities (see list below) for PhD students working in different domains of generative linguistics, in a broad sense, e.g. syntax, semantics, pragmatics, morphology, phonetics, phonology, language acquisition, computational linguistics, etc. The institutions behind WoSS are: The University of Nantes The University of the Basque Country in Vitoria-Gasteiz (EHU) The Universities of Catalonia (UAB, UB, UPF, URV) The Universities of Paris 3, Paris 7, Paris 8 The Universities of Madrid (IUOG, UAM, UCM) The University of Sienna This year's WoSS is co-organized by University Paris Diderot (Paris 7) and University Paris Vincennes St-Denis (Paris 8), and will take place at the CNRS `Pouchet' building, 59 rue Pouchet, 75017 Paris, on November 17th-18th, 2011. Submission instructions Abstracts must be anonymous and at most two pages long, examples and references included, on an A4 sheet with one-inch (2.54 cm) margins and 12-point Times New Roman font, single spacing. Submissions are limited to one individual and one joint abstract per author, or two joint abstracts per author. The abstracts must be submitted over EasyChair as PDF attachment by the 31th of August. Accepted papers will be presented orally or as posters depending on nature and quality of the work., you may however specifically indicate whether you would like to present your paper rather as an oral presentation or a poster. INVITED SPEAKERS We have the pleasure to announce that the following speakers will be giving an invited talk at WoSS8: Paolo Acquaviva (University College Dublin) Bob Borsley (Univerity of Essex) Philippe Schlenker (ENS-NYU) Important dates: Deadline for submission: August 31, 2011 Notification of acceptance: October 7, 2011 Scientific Committee: Xiaoliang HUANG, Paris 7. Christophe ONAMBELE, Paris 8. Marie PHILIPPE, Paris 8. Géraldine WALTHER, Paris 7. Grégoire WINTERSTEIN, Paris 7. A WoSS8 website is currently under construction and will be available soon. More informations about previous WoSS can be found at: If you have any questions, please contact us at: woss8paris at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 15 18:19:44 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jul 2011 20:19:44 +0200 Subject: Appel: Document numerique, Resume Automatique de Documents, extension de la date de soumission Message-ID: Date: Wed, 13 Jul 2011 23:53:08 +0200 From: Abdelmajid BEN HAMADOU Message-ID: X-url: X-url: ------------------------------------------------------------------------ Appel à publication pour un numéro spécial de *Document numérique* sur le thème : Résumé Automatique de Documents Date limite de soumission étendue au : 15/09/2011 Thématique Dans ce numéro nous souhaitons particulièrement investir les thèmes suivants (liste non exhaustive) : - Résumé automatique de documents simples - Résumé automatique de documents multiples - Approches statistiques pour le résumé - Approches linguistiques pour le résumé - Résumé de documents multimédia - Techniques de révision des résumés - Évaluation des systèmes de résumé - Résumé multilingue Objectif A l’heure où les documents numériques disponibles et échangés entre les individus prolifèrent, il devient impossible d’accéder aux contenus sans disposer d’outils informatiques qui les résument tout en préservant les idées qu’ils véhiculent. Ce numéro spécial vise à regrouper des recherches qui traitent la problématique du résumé automatique sous toutes ses facettes. Il vise à apporter un éclairage sur les questions : · Comment peut-on repérer les idées clés dans un document ? · Comment peut-on synthétiser l'information répartie sur de multiples documents ? · Comment peut-on préserver la cohérence et la cohésion du résumé produit ? · Peut-on appliquer les mêmes approches utilisées pour résumer les textes aux documents multimédias (vidéo et audio) ? · Comment évaluer la qualité d’un résumé automatique?… Comité de rédaction du numéro Delphine Battistelli, Université Paris Sorbonne Lamia Belguith, FSEG-Sfax, Tunisie *Abdelmajid Ben Hamadou,* ISIM, Sfax, Tunisie Philippe Blache, Université de Provence, Aix-en-Provence Rim Faiz, IHEC, Tunis, Tunisie Brigitte Grau, ENSIIE, Ivry, France Guy Lapalme, Université de Montréal Abderrafih Lehmam, Minng Essential, France Jean-Luc Minel, MoDyCo, Université Paris Ouest Nanterre La Défense - CNRS Thierry Poibeau – LaTTiCe-CNRS, France Horacio Saggon, Universitat Pompeu Fabra, Barcelona Juan-Manuel Torres Moreno – Université d’Avignon Calendrier - date limite remise contributions : 15/09/2011 - réponse aux auteurs : 15/11/2011 - version finale auteurs : 31/12/2011 - livraison éditeur : 15/01/2012 - parution du numéro spécial : Février 2012 L'éditeur et la revue : Recommandations aux auteurs · Les soumissions sont à envoyer à Revue.ResumeAutomatique atées ci-dessous) et devront respecter la feuille de style de la revue disponible sur le serveur (ou sur demande à : dn at · Les articles ne devront pas dépasser les 20-30 pages. Ils sont acceptés en français (ou en anglais pour les auteurs non francophones). · les soumissions peuvent être envoyées sous forme de fichiers PDF (de préférence). · les versions finales seront acceptées sous format word ou PDF. Dans ce dernier cas, les corrections ortho-typographiques seront faites par les auteurs à la demande de l’éditeur. Contact Abdelmajid BEN HAMADOU ISIMS, Laboratoire MIRACL, Pôle technologique, Sakiet-EZZIT BP 242, Sfax 3021, Tunisie Tél. : 0021698608919, e-mail : Abdelmajid.benhamadou at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 15 18:30:00 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jul 2011 20:30:00 +0200 Subject: Livre: Logic and Grammar (A. Lecomte Festchrift) Message-ID: Date: Fri, 15 Jul 2011 19:05:28 +0200 From: retore Message-Id: <8BDFAB67-B40E-4511-903D-FD222BD36F18 at> X-url: Logic and grammar Essays Dedicated to Alain Lecomte on the Occasion of His 60th Birthday Pogodalla, Sylvain; Quatrini, Myriam; Retoré, Christian (Eds.) Springer LNCS 6700 This book contains selected papers from the Colloquium in Honor of Alain Lecomte, held in Pauillac, France, in November 2007. The event was part of the ANR project "Prélude" (Towards Theoretical Pragmatics Based on Ludics and Continuation Theory), the proceedings of which were published in another FoLLI-LNAI volume (LNAI 6505) edited by Alain Lecomte and Samuel Tronçon. The selected papers of this Festschrift volume focus on the scientific areas in which Alain Lecomte has worked and to which he has contributed: formal linguistics, computational linguistics, logic, and cognition. Preface by the editors Bare Nouns in Predicate Position in French Claire Beyssade Covert Movement in Logical Grammar Carl Pollard Categorial Grammars and Minimalist Grammars Richard Moot Minimalist Grammars and Minimalist Categorial Grammars: Toward Inclusion of Generated Languages Maxime Amblard Minimalist Grammars in the Light of Logic Sylvain Salvati Good Types Are Useful for Learning Isabelle Tellier and Daniela Dudau-Sofronie Dialogues in Ludics Marie-Renée Fleury, Myriam Quatrini, and Samuel Tronçon ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 15 18:25:55 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jul 2011 20:25:55 +0200 Subject: Revue: Discours 8, 2011, Approches fonctionnelles de la structuration des textes Message-ID: Date: Thu, 14 Jul 2011 12:16:58 +0200 From: "laure.sarda at" Message-ID: X-url: Sorry for multiple posting (English version below) ****************************************** Nous sommes très heureux d’annoncer la publication de DISCOURS 8 |2011 * * *Approches fonctionnelles de la structuration des textes* Numéro thématique Coordination scientifique : Laure Sarda, Shirley Carter-Thomas & Benjamin Fagard. Coordination éditoriale : Mai Ho-Dac & Catherine Bolly Le numéro propose une sélection d'articles présentés au colloque LPTS’09 (Linguistic and Psycholinguistic approaches to Text Structuring), organisé à Paris en septembre 2009. Au sommaire : - *Laure Sarda, Shirley Carter-Thomas et Benjamin Fagard* Présentation du numéro [Texte intégral] - *Graham Ranger* *Surely not!* Between certainty and disbelief [Texte intégral] - *Paul Isambert* What’s on the left? [Texte intégral] - *Evelyne Oppermann-Marsaux* Les emplois du marqueur discursif « di va » en ancien français [Texte intégral] - *Constanze Armbrecht* Les structures argumentatives de la locution adverbiale polyvalente *jusqu’à un certain point* [Texte intégral] - *Christiane Marque-Pucheu* Contribution des trois emplois de *à la fin* à la structuration du discours : le temporel, l’aspectuel, le « reformulatif » [Texte intégral] - *Tuija Virtanen* Discourse-level structuring of information in narrative: Signalling structural, interactional and cognitive shifts [Texte intégral] - *Aurélie Welcomme* Marqueurs cadratifs temporels et argumentatifs dans les récits d’apprenants néerlandophones de français L2 [Texte intégral] *Temporal framing and argumentative markers in the narratives of Dutch learners of French as a second language* Nous vous souhaitons une bonne lecture et nous vous invitons par ailleurs à soumettre à tout moment pour les numéros à paraître. Consultez les modalités de soumission . Le comité de rédaction ************************************************************************ We are pleased to announce the publication of the 8th issue of DISCOURS : DISCOURS 8 |2011 *Functional Approaches to Text Structuring/ Approches fonctionnelles de la structuration des textes* Special issue, edited by: Laure Sarda, Shirley Carter-Thomas & Benjamin Fagard. Coordination : Mai Ho-Dac & Catherine Bolly This special issue offers a selection of papers presented at the LPTS’09 conference (Psycholinguistics and Linguistic Approaches to Text Structuring), held in Paris in September 2009. - You can read the following articles: *Laure Sarda, Shirley Carter-Thomas et Benjamin Fagard* Présentation du numéro [Texte intégral] - *Graham Ranger* *Surely not!* Between certainty and disbelief [Texte intégral] - *Paul Isambert* What’s on the left? [Texte intégral] - *Evelyne Oppermann-Marsaux* Les emplois du marqueur discursif « di va » en ancien français [Texte intégral] - *Constanze Armbrecht* Les structures argumentatives de la locution adverbiale polyvalente *jusqu’à un certain point* [Texte intégral] - *Christiane Marque-Pucheu* Contribution des trois emplois de *à la fin* à la structuration du discours : le temporel, l’aspectuel, le « reformulatif » [Texte intégral] - *Tuija Virtanen* Discourse-level structuring of information in narrative: Signalling structural, interactional and cognitive shifts [Texte intégral] - *Aurélie Welcomme* Marqueurs cadratifs temporels et argumentatifs dans les récits d’apprenants néerlandophones de français L2 [Texte intégral] *Temporal framing and argumentative markers in the narratives of Dutch learners of French as a second language* We hope you enjoy the issue. For information on submission procedures see The editorial board ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 15 18:33:42 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jul 2011 20:33:42 +0200 Subject: Appel: Special Issue of the I3 Journal on Information Mining and Retrieval on the Web Message-ID: Date: Fri, 15 Jul 2011 18:14:07 +0100 From: "Rim FAIZ" Message-ID: <002501cc4312$9b0af280$d120d780$@Faiz at> X-url: Call for papers – Special issue of the “Information Intelligence and Interaction” I3 Journal ------------------------------------------------------------------------ Special issue on “Information Mining and Retrieval on the Web” ------------------------------------------------------------------------ Important dates: --------------------- Submission deadline: September 15, 2011 Notification date: October 31, 2011 Authors final version: November 25, 2011 Publication of special issue: December 2011 Focus of the special issue -------------------------------- This special issue aims to bring together researchers from both communities, Information Retrieval and Data Mining, working around the problems of Information mining and retrieval on the web. The development of Web 2.0 has led to the proliferation of tools for internet users to interact directly on the Web content through, annotations, reviews, comments, opinions.... The content of Web pages is no longer a static text or a fixed image, but also a user-generated data (blogs, twitter…). This fact has led to the emergence of new problems related to the analysis, mining, searching and visualizing information. The objective of this special issue is to provide a framework for researchers from both communities to exchange views and experiences on Information mining and retrieval issues (web page, annotations, blogs, queries). Papers describing theoretical aspects, prototype systems, tools and techniques and applications, as well as future directions are welcome. Topics may include, but are not limited to the following list: - Information mining and retrieval on the web - Queries Analysis and Mining on the Web - Search and Mining in blogs - Opinion Detection on the Web - Folksonomy (annotation/social indexing) - Social information mining and retrieval - Temporal information retrieval, mining and extraction Submission details ----------------------- Manuscripts should be written in English and prepared for publication in accordance with the following instructions: The length of the paper is limited to 30 pages. Submissions should be sent in pdf format to Rim.Faiz at Papers will be evaluated based on their originality, presentation as well as relevance and contribution to the field of Information mining and retrieval on the web. All papers will be rigorously refereed by 3 peer reviewers. Submission of a manuscript to this special issue implies that no similar paper is already accepted or will be submitted to any other conference or journal. Guest Editor ---------------- Rim Faiz, University of Carthage, IHEC, LARODEC, Tunisia E-mail : Rim.Faiz at Program Committee -------------------------- Abdelmajid Ben Hamadou, University of Sfax, ISIMS, MIRACL, Tunisia Mohand Boughanem, University of Paul Sabatier, IRIT, France Sylvie Calabretto, INSA of Lyon, LIRIS, France Rim Faiz, University of Carthage, IHEC, LARODEC, Tunisia Patrick Gallinari, University of Paris 6, Lip6, France Faiez Gargouri, University of Sfax, ISIMS, Tunisia Eric Gaussier, University of Joseph Fourrier Grenoble, LIG, France Mathias Géry, University of Saint Etienne, Laboratory Hubert Curien, France Mohand-Said Hacid, University Claude Bernard of Lyon 1, LIRIS, France Lamia Hadrich Belguith, University of Sfax, FSEGS, MIRACL, Tunisia Gabriella Pasi, University of Milan Bicocca, Italy Jean-Marc Petit, LIRIS, INSA of Lyon, France Philippe Mulhem, Ecole Nationale Supérieure des Mines de Saint-Étienne, CNRS, LIG, France Maguelonne Teisseire, TETIS, Maison de la Télédétection, Montpellier, France Mohamed Tmar, Université de Sfax, ISIMS, MIRACL, Tunisia ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 19:59:34 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 21:59:34 +0200 Subject: Appel: LATA 2012 Message-ID: Date: Sun, 17 Jul 2011 09:43:02 +0200 From: "Carlos Martín Vide" Message-ID: X-url: ********************************************************************* 1st Call for Papers 6th INTERNATIONAL CONFERENCE ON LANGUAGE AND AUTOMATA THEORY AND APPLICATIONS LATA 2012 A Coruña, Spain March 5-9, 2012 ********************************************************************* AIMS: LATA is a yearly conference in theoretical computer science and its applications. Following the tradition of the International Schools in Formal Languages and Applications developed at Rovira i Virgili University in Tarragona since 2002, LATA 2012 will reserve significant room for young scholars at the beginning of their career. It will aim at attracting contributions from both classical theory fields and application areas (bioinformatics, systems biology, language technology, artificial intelligence, etc.). VENUE: LATA 2012 will take place in A Coruña, at the northwest of Spain. The venue will be the Faculty of Computer Science, University of A Coruña. SCOPE: Topics of either theoretical or applied interest include, but are not limited to: - algebraic language theory - algorithms for semi-structured data mining - algorithms on automata and words - automata and logic - automata for system analysis and programme verification - automata, concurrency and Petri nets - automatic structures - cellular automata - combinatorics on words - computability - computational complexity - computational linguistics - data and image compression - decidability questions on words and languages - descriptional complexity - DNA and other models of bio-inspired computing - document engineering - foundations of finite state technology - foundations of XML - fuzzy and rough languages - grammars (Chomsky hierarchy, contextual, multidimensional, unification, categorial, etc.) - grammars and automata architectures - grammatical inference and algorithmic learning - graphs and graph transformation - language varieties and semigroups - language-based cryptography - language-theoretic foundations of artificial intelligence and artificial life - parallel and regulated rewriting - parsing - pattern recognition - patterns and codes - power series - quantum, chemical and optical computing - semantics - string and combinatorial issues in computational biology and bioinformatics - string processing algorithms - symbolic dynamics - symbolic neural networks - term rewriting - transducers - trees, tree languages and tree automata - weighted automata STRUCTURE: LATA 2012 will consist of: - 3 invited talks - 2 invited tutorials - peer-reviewed contributions INVITED SPEAKERS: To be announced PROGRAMME COMMITTEE: Eric Allender (Rutgers) Miguel Á. Alonso (A Coruña) Amihood Amir (Bar-Ilan) Dana Angluin (Yale) Franz Baader (Dresden) Patricia Bouyer (Cachan) John Case (Delaware) Volker Diekert (Stuttgart) Paul Gastin (Cachan) Reiko Heckel (Leicester) Sanjay Jain (Singapore) Janusz Kacprzyk (Warsaw) Victor Khomenko (Newcastle) Bakhadyr Khoussainov (Auckland) Claude Kirchner (Paris) Maciej Koutny (Newcastle) Salvador Lucas (Valencia) Sebastian Maneth (Sydney) Carlos Martín-Vide (Tarragona, chair) Giancarlo Mauri (Milano Bicocca) Aart Middeldorp (Innsbruck) Faron Moller (Swansea) Angelo Montanari (Udine) Joachim Niehren (Lille) Mitsunori Ogihara (Miami) Enno Ohlebusch (Ulm) Dominique Perrin (Marne-la-Vallée) Alberto Policriti (Udine) Alexander Rabinovich (Tel Aviv) Mathieu Raffinot (Paris) Jörg Rothe (Düsseldorf) Olivier H. Roux (Nantes) Yasubumi Sakakibara (Keio) Eljas Soisalon-Soininen (Aalto) Frank Stephan (Singapore) Jens Stoye (Bielefeld) Howard Straubing (Boston) Masayuki Takeda (Kyushu) Wolfgang Thomas (Aachen) Sophie Tison (Lille) Jacobo Torán (Ulm) Tayssir Touili (Paris) Esko Ukkonen (Helsinki) Frits Vaandrager (Nijmegen) Manuel Vilares (Vigo) Todd Wareham (Newfoundland) Pierre Wolper (Liège) Hans Zantema (Eindhoven) Thomas Zeugmann (Sapporo) ORGANIZING COMMITTEE: Miguel Á. Alonso (A Coruña, co-chair) Adrian Horia Dediu (Tarragona) Carlos Gómez Rodríguez (A Coruña) Jorge Graña (A Coruña) Carlos Martín-Vide (Tarragona, co-chair) Bianca Truthe (Magdeburg) Jesús Vilares (A Coruña) Florentina Lilica Voicu (Tarragona) SUBMISSIONS: Authors are invited to submit papers presenting original and unpublished research. Papers should not exceed 12 single-spaced pages (including eventual appendices) and should be formatted according to the standard format for Springer Verlag's LNCS series (see Submissions have to be uploaded at: PUBLICATIONS: A volume of proceedings published by Springer in the LNCS series will be available by the time of the conference. A special issue of a major journal will be later published containing peer-reviewed extended versions of some of the papers contributed to the conference. Submissions to it will be by invitation. REGISTRATION: The period for registration will be open since July 16, 2011 until March 5, 2012. The registration form can be found at the website of the conference: Early registration fees: 500 Euro Early registration fees (PhD students): 400 Euro Late registration fees: 540 Euro Late registration fees (PhD students): 440 Euro On-site registration fees: 580 Euro On-site registration fees (PhD students): 480 Euro At least one author per paper should register. Papers that do not have a registered author who paid the fees by December 5, 2011 will be excluded from the proceedings. Fees comprise access to all sessions, one copy of the proceedings volume, coffee breaks and lunches. PhD students will need to prove their status on site. PAYMENT: Early (resp. late) registration fees must be paid by bank transfer before December 5, 2011 (resp. February 24, 2012) to the conference series account at Uno-e Bank (Julián Camarillo 4 C, 28037 Madrid, Spain): IBAN: ES3902270001820201823142 – Swift/BIC code: UNOEESM1 (account holder: Carlos Martin-Vide – LATA 2012; address: Av. Catalunya, 35, 43002 Tarragona, Spain). Please write the participant’s name in the subject of the bank form. Transfers should not involve any expense for the conference. People claiming early registration will be requested to prove that they gave the transfer order to the bank by the deadline. On-site registration fees can be paid only in cash. A receipt for payments will be provided on site. Besides paying the registration fees, it is required to fill in the registration form at the website of the conference. IMPORTANT DATES: Paper submission: October 7, 2011 (23:59h, CET) Notification of paper acceptance or rejection: November 18, 2011 Final version of the paper for the LNCS proceedings: November 27, 2011 Early registration: December 5, 2011 Late registration: February 24, 2012 Starting of the conference: March 5, 2012 Submission to the post-conference special issue: June 9, 2012 FURTHER INFORMATION: florentinalilica.voicu at POSTAL ADDRESS: LATA 2012 Research Group on Mathematical Linguistics Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 20:01:41 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 22:01:41 +0200 Subject: Appel: 7th Asian Information Retrieval Societies (AIRS2011) Message-ID: Date: Mon, 18 Jul 2011 10:38:53 +0200 From: info at Message-ID: <4E23F11D.6080804 at> X-url: **Apologies for cross postings. Please redistribute to other interested parties** ------------------------------------------------------------------------ SECOND CALL FOR PAPERS The Seventh Asia Information Retrieval Societies Conference (AIRS 2011) December 18th -20th, 2011 Dubai (United Arab Emirates) NEW SUBMISSION DUE: July 27th, 2011 ------------------------------------------------------------------------ The Asia Information Retrieval Societies Conference (AIRS) aims to bring together researchers and developers to exchange new ideas and latest achievements in the field of information retrieval (IR). The scope of the conference covers applications, systems, technologies and theory aspects of information retrieval in text, audio, image, video, and multimedia data. The AIRS 2011 welcomes submissions of original papers in the broad field of information retrieval. Technical issues covered include, but are not limited to the following: 1. IR Models and Theories 2. User Study, IR Evaluation, and Interactive IR 3. Web IR, Scalability, and Adversarial IR 4. Multimedia IR 5. NLP for IR (eg. Cross-/Multi- Language IR, Question Answering, Summarization, Information Extraction) 6. Machine Learning and Data Mining for IR (eg. Learning to Rank, Classification, Clustering) 7. IR Applications (eg. Digital Libraries, Vertical Search, Mobile IR) 8. Arabic-Script based IR 9. Cross Language IR IMPORTANT DATES * Submission Due: July 27th, 2011 * Notification of acceptance: Sept 1st, 2011 * Camera-ready due: Sept 17th , 2011 * Registration: November 1st, 2011 * AIRS2011: December 18th-20th SUBMISSION INSTRUCTIONS The AIRS 2011 proceedings will be published as an LNCS volume, so please follow the default author instructions available at . In addition, please anonymize your paper to facilitate blind reviewing, and make sure your paper is no longer than 12 pages in the LNCS format. Submissions that do not follow these guidelines will be rejected unconditionally. Duplicate submissions (the same paper being submitted to AIRS 2011 and to another conference at the same time) are strictly forbidden; if detected, these submissions will be unconditionally rejected. Program Committee Chair Khaled Shaalan, British University in Dubai khaled.shaalan at Conference Co-Chairs Mohamed Val Salem, University of Wollongong in Dubai MohamedSalem at Farhad Oroumchian, University of Wollongong in Dubai FarhadOroumchian at Publicity Chair Asma Damankesh, University of Wollongong in Dubai AsmaDamankesh at Abolfazl AleAhmad, University of Tehran a.aleahmad at Publication Chair Kathy Shen, University of Wollongong in Dubai Dr. Azadeh Shakery, University of Tehran AREA CHAIRS Arabic Script text Processing and Retrieval Ali Farghaly, Oracle, USA IR Models and Theories Minjie Zhang, University of Wollongong, Australia Multimedia IR Joemon M Jose, University of Glasgow, UK User Study, IR Evaluation, and Interactive IR Tetsuya Sakai, Microsoft Research Asia Web IR, scalability and adversarial IR Min Zhang, Tsinghua University, China IR Applications Kazunari Sugiyama, National University of Singapore, Singapore Machine learning for IR Tie-Yan Liu, Microsoft Research Asia Natural Language Processing for Information retrieval Chia-Hui Chang, National Central University, Taiwan ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 20:02:50 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 22:02:50 +0200 Subject: Info: ELRA receives the META Prize at the META-FORUM 2011 in Budapest Message-ID: Date: Mon, 18 Jul 2011 14:37:19 +0200 From: info at Message-ID: <4E2428FF.3050704 at> X-url: X-url: Press Release - Immediate Paris, France, July 18, 2011 *ELRA receives the META Prize at the META-FORUM 2011 in Budapest* During the META-FORUM 2011 which took place in Budapest (Hungary) on June 27-28, 2011, ELRA, a world-wide leading player providing Language Resources-related services to the HLT community, has received the META Prize for "Outstanding long-term commitment to the preparation and distribution of language resources and technologies". The Prize is shared with Linguistic Data Consortium (LDC). The META-NET Prize is awarded by the META-NET Technology Council, a 30 members committee from HLT R&D and industry executives and managers. *** About ELRA *** The European Language Resources Association (ELRA) is a world-wide leading player in language resource distribution, sharing and production. ELRA provides services to the language communities related to distribution and production of resources, including production on demand, technology evaluation and benchmarking. ELRA organizes LREC, the major international conference devoted to language resources and evaluation, with over 1,200 attendees from academia and industry. The next LREC edition will be held in Istanbul in 2012. To find out more about ELRA, please visit our web site: *** About Meta *** META, the Multilingual Europe Technology Alliance brings together researchers, commercial technology providers, private and corporate language technology users, language professionals and other information society stakeholders. To find out more about META, please visit the web site: Contact : Helene Mazo, mazo at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 20:08:37 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 22:08:37 +0200 Subject: Appel: TALN'2012 (JEP-TALN-RECITAL), 4 au 8 juin, Grenoble Message-ID: Date: Mon, 18 Jul 2011 11:54:23 +0200 From: Hervé Blanchon Message-Id: <1E2DF3F0-7552-4D6E-824A-6836B045D6BE at> PREMIER APPEL À COMMUNICATIONS TALN'2012 19e conférence sur le Traitement Automatique des Langues Naturelles Grenoble du 4 au 8 juin 2012 CALENDRIER - Articles LONGs : - Date limite de soumission : 24 janvier 2012 - Notification aux auteurs : 1 mars 2012 - Date limite de soumission des versions définitives : 15 avril 2012 - Articles COURTs et Démonstrations : - Date limite de soumission : 15 mars 2012 - Notification aux auteurs : 15 avril 2012 - Date limite de soumission des versions définitives : 20 avril 2012 PRÉSENTATION Organisée par l'équipe GETALP du LIG (Laboratoire Informatique de Grenoble), le LIDILEM (Laboratoire de linguistique et didactique des langues étrangères et maternelles) et le département DPC du Gipsa-lab, la conférence TALN'2012 se tiendra du 4 au 8 juin 2012 à Grenoble à l'occasion de la conférence jointe JEP-TALN-RECITAL'2012. JEP-TALN-RECITAL'2012 regroupe la 29ème édition des Journées d'Étude sur la Parole (JEP'2012), la 19ème édition de la conférence sur le Traitement Automatique des Langues Naturelles (TALN'2012) et la 14ème édition des Rencontres des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL'2012). Pour la quatrième fois, après Nancy en 2002, Fès en 2004, et Avignon en 2008, l'AFCP (Association Francophone pour la Communication Parlée) et l'ATALA (Association pour le Traitement Automatique des Langues) organisent conjointement leur principale conférence afin de réunir en un seul lieu les deux communautés du traitement de la langue orale et écrite. La conférence TALN'2012 comprendra des communications orales et affichées, des conférences invitées et des ateliers. La langue officielle de la conférence est le français. Les communications en anglais sont acceptées pour les participants non-francophones. TYPES DE COMMUNICATIONS Deux formats de communications sont prévus : les articles longs (de 10 à 12 pages) et les articles courts (de 4 à 6 pages). Les auteurs sont invités à présenter deux types de communications : - des articles présentant des travaux de recherche originaux, - des prises de position présentant un point de vue sur l'état des recherches en TAL (traitement automatique de la langue), fondées sur une solide expérience du domaine. Les articles longs seront présentés sous forme de communication orale, les articles courts sous forme de poster. THÈMES Les communications pourront porter sur tous les thèmes habituels du TAL, incluant, de façon non limitative : - Analyse et génération dans les domaines suivants : - Phonétique - Phonologie - Morphologie - Syntaxe - Sémantique - Discours - Développement de ressources linguistiques pour le TAL : - Bases de données comportant des informations morphologiques, syntaxiques, sémantiques, et/ou phonologiques - Grammaires - Lexiques - Ontologies - Linguistique de corpus - Applications du TAL : - Analyse de sentiments ou d'opinions - Catégorisation ou classification automatique - Désambiguïsation lexicale - Dialogue homme-machine en langage naturel - Enseignement assisté par ordinateur - Indexation automatique - Recherche et extraction d'information - Résumé automatique - Résolution d'anaphores - Systèmes de question-réponse - Traduction automatique - Web sémantique - Approches: - Linguistiques formelles destinées à soutenir les traitements automatiques - Symboliques - Logiques - Statistiques - Basées sur l'apprentissage automatique -Prises de position présentant un point de vue sur le TAL CRITÈRES DE SÉLECTION Les soumissions seront examinées par au moins deux spécialistes du domaine. Pour les travaux de recherches, seront considérées en particulier : - l'adéquation aux thèmes de la conférence. - l'importance et l'originalité de la contribution, - la correction du contenu scientifique et technique, - la discussion critique des résultats, en particulier par rapport aux autres travaux du domaine, - la situation des travaux dans le contexte de la recherche internationale, - l'organisation et la clarté de la présentation, Pour les prises de position, seront privilégiées : - la largeur de vue et la prise en compte de l'état de l'art, - l'originalité et l'impact du point de vue présenté. Les articles sélectionnés seront publiés dans les actes de la conférence. Le comité de programme sélectionnera parmi les communications acceptées un article (prix TALN) pour recommandation à publication (dans une version étendue) dans la revue Traitement Automatique des Langues (Revue TAL). MODALITÉS DE SOUMISSION Les articles seront rédigés en français pour les francophones, en anglais pour ceux qui ne maîtrisent pas le français. Une feuille de style LaTeX et un modèle Word seront disponibles sur le site web (à venir) de la conférence. Contact : herve.blanchon at et Georges.Antoniadis at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 20:13:15 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 22:13:15 +0200 Subject: Journee: Ateliers de formation, reeducation orthophonique LSVT, Rappel Message-ID: Date: Tue, 19 Jul 2011 17:32:27 +0200 From: Joëlle Lavaud Message-Id: < at> X-url: Cher(e) collègue, La prochaine formation à la technique de rééducation orthophonique LSVT (Lee Silvermann Voice Treatment) aura lieu à Aix-en-Provence, les 29 et 30 août 2011 prochains, à la Maison Méditerranéenne des Sciences de l'Homme (5 rue du Château de l'Horloge, BP 647, 13094 Aix-en-Provence). Pour vous inscrire et télécharger le formulaire de présentation, veuillez cliquez le lien suivant : la participation à cette formation vous permettra d'obtenir le certificat validant votre future pratique de la LSVT. Pour plus d'informations, n'hésitez pas à nous contacter: serge.pinto at A très bientôt à Aix-en-Provence, ------------------------------------------------------------------------ Serge Pinto Laboratoire Parole et Langage 5 avenue Pasteur - BP 80975 F - 13604 Aix-en-Provence cedex 1 Tél: +33 (0)4 42 95 36 23 Mob: +33 (0)6 50 56 87 13 email: serge.pinto at email2: serge.pinto at ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 22 20:01:44 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Jul 2011 22:01:44 +0200 Subject: Ecole: FSFLA 2011 Message-ID: Date: Thu, 21 Jul 2011 13:33:49 +0200 From: "Carlos Martín Vide" Message-ID: X-url: ********************************************************************* 2011 INTERNATIONAL FALL SCHOOL IN FORMAL LANGUAGES AND APPLICATIONS FSFLA 2011 (formerly International PhD School in Formal Languages and Applications) Tarragona, Spain October 31 – November 4, 2011 Organized by: Research Group on Mathematical Linguistics Rovira i Virgili University ********************************************************************* ADDRESSED TO: Undergraduate and graduate students from around the world. Most appropriate degrees include: Computer Science and Mathematics. Other students (for instance, from Linguistics, Electrical Engineering, Molecular Biology or Logic) are welcome too provided they have a good background in discrete mathematics. The School is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. There will be no overlap in the schedule of the courses. The previous event was SSFLA 2011 ( COURSES AND PROFESSORS: - Franz Baader (Technische Dresden), Reasoning in Description Logics [intermediate, 6 hours] - Manfred Droste (Leipzig), Weighted Automata and Weighted Logic [introductory/advanced, 8 hours] - Max H. Garzon (Memphis), DNA Codeword Design and DNA Languages [introductory/intermediate, 10 hours] - Venkatesan Guruswami (Carnegie Mellon), The Complexity of Approximate Constraint Satisfaction [intermediate, 6 hours] - Tao Jiang (California Riverside), Average-case Analysis and Lower Bounds by the Incompressibility Method [intermediate, 6 hours] - Michael Moortgat (Utrecht), Type-logical Grammars: Expressivity, Parsing Complexity [introductory/advanced, 8 hours] - Helmut Seidl (Technische München), Macro Treetransducers for XML Processing [intermediate, 6 hours] - Alan Selman (Buffalo), Probabilistic Complexity Classes [intermediate, 10 hours] - Jeffrey Shallit (Waterloo), Automatic Sequences, Decidability, and Enumeration [intermediate, 6 hours] SCHOOL PAPER: On a voluntary basis, within 6 months after the end of the School, students will be expected to draft an individual or jointly-authored research paper on a topic covered during the classes under the guidance of the lecturing staff. REGISTRATION: It has to be done on line at FEES: They are variable, depending on the number of courses each student takes. The rule is: 1 hour = - 10 euros (for payments until July 31, 2011), - 15 euros (for payments after July 31, 2011). The fees must be paid to the School's bank account: Uno-e Bank (Julian Camarillo 4 C, 28037 Madrid, Spain): IBAN: ES3902270001820201823142 – Swift/BIC code: UNOEESM1 (account holder: Carlos Martin-Vide GRLMC; account holder's address: Av. Catalunya, 35, 43002 Tarragona, Spain) Please mention FSFLA 2011 and your full name in the subject. A receipt will be provided on site. Bank transfers should not involve any expense for the School. For early reduced rates, please notice that the date that counts is the date of the arrival of the fees to the School’s account. People registering on site at the beginning of the School must pay in cash. For the sake of local organization, however, it is much recommended to complete the registration and the payment earlier. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATES: Students will be delivered a certificate stating the courses attended, their contents, and their duration. Those participants who will choose to be involved in a research paper will receive an additional certificate at the completion of the task, independently on whether the paper will finally get published or not. IMPORTANT DATES: Announcement of the programme: June 4, 2011 Starting of the registration: June 4, 2011 Early registration deadline: July 31, 2011 Starting of the School: October 31, 2011 End of the School: November 4, 2011 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at WEBSITE: POSTAL ADDRESS: FSFLA 2011 Research Group on Mathematical Linguistics Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Diputació de Tarragona Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 22 20:05:26 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Jul 2011 22:05:26 +0200 Subject: Info: Journee ATALA entites nommees, Communications en ligne Message-ID: Date: Wed, 20 Jul 2011 10:10:16 +0200 (CEST) From: Denis Maurel Message-ID: <1652971701.157841.1311149416249.JavaMail.root at mail10> X-url: Journée ATALA sur les entités nommées : Les communications (orales et posters) présentées le lundi 20 juin 2011, lors de la journée ATALA sur les Entités Nommées (Nouvelles Frontières et Nouvelles Approches), sont disponibles à l'adresse suivante : Cette journée a été organisée par le LI, Université François Rabelais Tours, avec le soutien de l'Université Paris Sorbonne (Institut des Sciences Humaines Appliquées). Jean-Yves Antoine Nathalie Friburger Denis Maurel Damien Nouvel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 22 20:13:00 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Jul 2011 22:13:00 +0200 Subject: Sujet de these: These CIFRE, Construction d'ontologies et de reseaux semantiques types Message-ID: Date: Wed, 20 Jul 2011 10:32:51 +0200 From: Guillaume Cleuziou Message-ID: <4E2692B3.3030800 at> X-url: Bonjour, Vous trouverez ci-dessous une proposition de sujet de thèse sur la construction d'ontologies et de réseaux sémantiques typés à partir d'analyse de corpus textuels et application à l'analyse et la construction de représentation sémantique du texte applicatif. Il s'agit d'un contrat CIFRE entre l'entreprise Orange R&D (Lannion) et le LIFO (université d'Orléans) à partir du mois d'octobre 2011. Envoyer les candidatures (CV+lettre de motivation+notes) dès maintenant à : edmond.lassalle at et guillaume.cleuziou at Merci de diffuser cette annonce largement. Cordialement, Guillaume Cleuziou Maître de Conférences --- Assistant Professor IUT d'Orléans, Département Informatique LIFO Tel LIFO : (+33) (0)2 38 49 25 91 Tel IUT : (+33) (0)2 38 49 44 59 guillaume.cleuziou at ------------------------------------------------------------------------ Thèse (h/f) : Construction d'ontologies et de réseaux sémantiques typés à partir d'analyse de corpus textuels et application à l'analyse et la construction de représentation sémantique du texte applicatif Lannion France département France Télécom Orange est un des principaux opérateurs de télécommunications au monde. Le Groupe sert ainsi plus de 182 millions de clients sur les cinq continents, dont les deux tiers sous la marque Orange. Les Orange Labs constituent le réseau mondial d'innovation du Groupe France Telecom Orange. Crées en 2006, ils regroupent 3800 chercheurs répartis au sein de 18 laboratoires sur 4 continents. La R&D est source principale d'innovation pour le Groupe avec plus de 8500 brevets à son actif, contribuant à développer la nouvelle génération de services de communications intégrés, innovants et simples d'utilisation. Le Centre de R&D Technologies a pour mission de permettre à Orange de faire en avance de phase les bons choix technologiques en s'appuyant sur sa forte expertise et sur sa connaissance de l'écosystème industriel et académique. Votre rôle La qualité des données sémantiques et leur utilité en Recherche d'Informations dépendent du type d'applications, de la granularité des informations traitées. Pour des applications de moteur de recherche classique, où la granularité d'information correspond au document, les techniques de mot-clés associés à des mesures de fréquence d'occurrence ont fait la preuve d'un bon compromis entre la performance, la robustesse et la précision. Pour des fonctionnalités à granularité plus fine (reformulation, Question/Réponse, titrage, recherche agrégé, pervasivité...), une représentation appropriée de l'information traitée est plutôt de nature sémantique. La thèse se place dans le domaine de l'extraction d'informations fines à partir de données textuelles. Il s'agit d'une étude exploratoire traitant les difficultés citées précédemment et de montrer qu'une fois résolues, il est possible de réaliser des applications de recherche d'informations avancées, ce très rapidement et à un faible coût, et corrélativement de pourvoir en déployer à plus grande échelle. L'objectif de la thèse porte sur la technologie avancée en apprentissage et sur les modèles de calcul permettant d'exploiter le résultat de l'apprentissage. Il s'agit d'acquérir les données sémantiques et linguistiques à partir de corpus de texte et donc d'extraire de ces corpus d'apprentissage le maximum d'informations sémantiques et linguistiques tout en minimisant l'apport initial de connaissances (approche hybride). Il s'agira aussi de définir la technologie d'analyse de dépendance en aval et de ne s'intéresser à des données linguistiques et sémantiques apprises en adéquation avec le mécanisme d'analyse de phrases. Le résultat «proof of concept» (PoC) attendu est la conception et la réalisation d'une maquette incluant des technologies permettant l'acquisition de données sémantiques et linguistiques, la mise en œuvre d'une mécanique d'analyse et de construction de structures de dépendance, la mise en œuvre d'une application de recherche d'informations fines et, à travers l'application, la preuve de la facilité de réaliser toute fonctionnalité applicative, lors que les deux difficultés citées ont été traitées. Il s'agit essentiellement de faire converger les technologies de traitement linguistique traditionnel et celles d'apprentissage statistique, ce de manière fine pour éviter les problèmes de biais statistique constatés trop souvent dans les modèles hybrides connus. L'approche envisagée s'articule en deux parties. La première, en terme d'apprentissage hybride, vise à extraire automatiquement des relations sémantiques typées à partir d'une analyse de dépendance dans les phrases, et d'une structuration des groupes nominaux autour des verbes. Pour ce faire, l'obstacle majeur est de mettre en œuvre des grammaires de chunking développées en interne (outil de traitement linguistique des textes) mais adaptées à des analyses de grands volumes de données avec des performances correctes dans ce contexte d'analyse (travail hors thèse). Une structuration des syntagmes autour des verbes, une analyse de régularité des verbes visent ensuite une abstraction de ces derniers dans un comportement prédicatif uniforme (par exemple regrouper les notions acheter, acquérir ...) Dans la seconde partie de construction de la structure de dépendance, l'analyse elle-même ne serait pas réalisée par des règles de grammaires de dépendance mais plutôt sur un calcul d'entropie à partir des distributions probabilistes observées pour chaque mot dans l'étape d'analyse de coccurrences. Elle consiste à définir une construction de l'arbre de dépendance. Une démarche pressentie est de recourir à l'extraction d'un arbre maximal recouvrant à partir d'un graphe de relations sémantiques représentant potentiellement la phrase analysée. Ce type d'analyse nécessite d'avoir des données sémantiques annotées de poids probabilistes. Un dernier volet dans la structuration du réseau est relatif à la construction d'ontologie. Les travaux du LIFO à partir de structuration prétopologique présente à ce titre un axe de recherche prometteur et à explorer dans le cadre de la thèse. Le travail prendra aussi en compte la possibilité d'alimenter le système par des connaissances sémantiques a priori et devra évaluer leur impact sur la qualité des résultats. Dans une optique de supervision humaine a posteriori, ces connaissances pourraient provenir d'une session antérieure d'apprentissage et auraient été révisées manuellement avant d'être réinjectées dans le système. votre profil Etudiant niveau Bac+5 – Master 2 Compétences souhaitées : - Apprentissage, acquisition automatique de données par des modèles hybrides - Traitement automatique du langage naturel - Recherche d'informations - Programmation en C/C++ Contrat Thèse Localisation du poste : Lannion (22307) Contact : edmond.lassalle at Contact : regine.angoujard at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 22 20:15:16 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Jul 2011 22:15:16 +0200 Subject: Appel: SPMRL2011, 2nd Workshop on Statistical Parsing of Morphologically-Rich Languages Message-ID: Date: Wed, 20 Jul 2011 11:36:54 +0200 From: DJamé Seddah Message-Id: <094FEB4B-EF3C-4009-9CFB-BF4AC1B7E12D at> X-url: ** Apologies for cross-posting ** ====================================================================== FINAL CALL FOR PAPER: Second Workshop on Statistical Parsing of Morphologically Rich Languages (SPMRL 2011) ( Collocated with IWPT 2011, October 5-7, 2011, ( ) ====================================================================== IMPORTANT DATES ------------ Submission deadline: July 31, 2011 (PDT, GMT-8) . Notification to authors: September 5, 2011 Camera ready copy: September 20, 2011 Workshop: October 6, 2011 ====================================================================== IMPORTANT NOTE ------------ Alongside the usual themes of the SPMRL workshop, this year's event will feature a special theme on the objective and the design of a shared task on parsing MRLs. See further details below. ====================================================================== PRESENTATION --------- Since the advent of large syntactically annotated corpora, statistical parsing has been a cornerstone of research in NLP. While Penn Treebank parsing performance, be it dependency-based or constituency-based, seems to have reached a high plateau, the same cannot be said of other languages, data sets and domains. Statistical parsing of morphologically-rich languages (MRLs) has repeatedly been shown to exhibit a plethora of nontrivial challenges, including sparse lexica in the face of rich inflectional systems, parsing deficiency in the face of free word order and tree- bank annotation idiosyncrasies in the face of morphosyntactic interactions. Recent studies on parsing languages such as German, Arabic, Hebrew or French using newly available treebanks contribute to our understanding of the extent of the difficulty that such phenomena pose when reusing parsing models initially designed to parse English. Beyond the technical and linguistic difficulties, the lack of communication between researchers working on different MRLs can lead to a reinventing the wheel syndrome. Following the warm reception of the first SPMRL workshop at NAACL-HLT 2010, the second SPMRL workshop aims to build upon the success of the first and offer a platform to this growing community of interests. We solicit papers describing parsing experiments with models and architectures for languages with morphological structure richer than English, or studies that address the lexical sparseness challenges (for any language). In order to provide a realistic indication of the performance of parsing systems on unstructured and unanalyzed data, we particularly encourage contributions reporting parsing results for non-gold as well as gold morphological analysis of the test data, before or jointly with the parser. The areas of interest of the second SPMRL workshop include, but are not limited to, the following list of topics: * Parsing models and architectures that explicitly integrate morphological analysis and parsing * Parsing models and architectures that focus on lexical coverage and the handling of OOV words either by incorporating linguistic knowledge or through the use of unsupervised/semi-supervised learning techniques * Cross-language and cross-model comparison of models' strength and weaknesses in the face of particular linguistic phenomena (e.g. morphosyntactic characteristics, degree of word-order freedom ...) * Comprehensive analyses of the strengths and weaknesses of various parsing models on particular linguistic (e.g. morphosyntactic) phenomena with respect to variation in tagsets, annotation schemes and additional data transformations This year's SPMRL workshop will feature a special theme concerning the Shared Task on Statistical Parsing of MRLs. Following the panel discussion in previous events we intend the first shared task on parsing MRLs to take place in 2012 and we now solicit position papers that aim to discuss the goals, scope, design, expected contributions and desired outcomes of such a shared task. The accepted papers will be included in the SPMRL proceedings. In addition we plan to hold a panel discussion in which we expect to discuss a range of relevant topics including (but not limited to) cross-language parse representation, cross-annotation evaluation, MRLs-specific architectural concerns, and so on. We aim to use this panel discussion to help us devise a set of clearly defined objectives for the 2012 shared task and to make concrete decisions about practicalities such as scope, size, representation, languages, evaluation, etc. SUBMISSION ------ Authors are invited to submit long papers (up to 9 pages + references) and short papers (up to 5 pages + references). Long papers should describe unpublished, substantial and completed research. Short papers should be position papers, papers describing work in progress or short, focused contributions. Papers will be accepted until July 25, 2011, (PDT, GMT-8) in PDF format via the START system : Submitted papers must follow the styles and the formating guidelines available from the last ACL-HLT recommendations ( As the reviewing will be blind, the paper must not include the authors' names and affiliations. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ..." must be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ..." Papers that do not conform to these requirements will be rejected without review. In addition, please do not post your submissions on the web until after the review process is complete. PROGRAM COMMITTEE ---------- Marie Candito, Yoav Goldberg, Jennifer Foster, Ines Rehbein, Djamé Seddah, Lamia Tounsi, Reut Tsarfaty, Yannick Versley REVIEW COMMITTEE ---------------- Mohammed Attia (Dublin City University, Ireland) Bernd Bohnet (University of Stuttgart, Germany) Adriane Boyd (Ohio State University, US) Marie Candito (University of Paris 7, France) Ozlem Cetinoglu (Dublin City University, Ireland) Grzegorz Chrupala (Saarland University, Germany) Benoit Crabbé (University of Paris 7, France) Jennifer Foster (Dublin City University, Ireland) Josef van Genabith (Dublin City University, Ireland) Yoav Goldberg (Ben Gurion University, Israel) Deirdre Hogan (Dublin City University, Ireland) Samar Husan (Inter. Institute of Information Technology, India) Sandra Kübler (Indiana University, US) Jonas Kuhn (University of Stuttgart, Germany) Alberto Lavelli (FBK-irst, Italy) Joseph Le Roux (Université de la Méditérranée, France) Wolfgang Maier (University of Tübingen, Germany) Yuval Marton (IBM Watson Resarch Center, US) Takuya Matsuzaki (University of Toyko, Japan) Yusuke Miyao (University of Toyko, Japan) Joakim Nivre (Uppsala University, Sweden) Owen Rambow (Columbia University) Ines Rehbein (Saarland University, Germany) Kenji Sagae (University of Southern California, US) Benoit Sagot (Inria Rocquencourt, France) Djamé Seddah (University of Paris Sorbonne, France) Nicolas Stroppa (Google Research Zurich, Switzerland) Lamia Tounsi (Dublin City University, Ireland) Reut Tsarfaty (Uppsala University, Sweden) Yannick Versley (University of Tübingen, Germany) ORGANIZERS ------- Djamé Seddah, Université Paris-Sorbonne Reut Tsarfaty, Uppsala University Jennifer Foster, Dublin City University DISCUSSION PANEL ----- Topic: Designing a MRL parsing shared task CONTACTS ------- website: mail: spmrl2011 at SPONSORS ----- This workshop is sponsored by SIGPARSE and by the INRIA's Alpage project. ====================================================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 27 10:02:34 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 27 Jul 2011 12:02:34 +0200 Subject: Conf: SFC 2011, 28-30 septembre 2011, Orleans Message-ID: Date: Sun, 24 Jul 2011 19:20:46 +0200 From: Guillaume Cleuziou Message-ID: <4E2C546E.6050504 at> X-url: ================= Appel à Inscription et Participation ================= Pour vous inscrire et participer à la conférence SFC'2011 : XVIIIèmes Rencontres de la Société Francophone de Classification du 28 au 30 septembre 2011 à Orléans Contact email : sfc2011 at Site Web : ----------------- Dates importantes ----------------- Inscription : dès maintenant Après le 31 juillet 2011 : augmentation des tarifs de 10% ----------------- Chercheurs invités ----------------- Radim Belohlavek : Prof. Université de Palacky (République Tchèque) Gérard Govaert : Prof. Université de Technologie de Compiègne (France) Christian Sohler : Prof. Université de Dortmund (Allemagne) ----------------- Programme ----------------- La liste des articles sélectionnés par le comité de programme est disponible sur le site des rencontres : Au plaisir de vous accueillir prochainement à Orléans. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 27 10:07:05 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 27 Jul 2011 12:07:05 +0200 Subject: Job: CDD, Ingenierie dans la thematique TAL, CEA List Message-ID: Date: Tue, 26 Jul 2011 04:10:17 +0000 From: CANET Geraud 200968 Message-ID: <637ECBE01CC9AA4FB94B408CCE98AEE5015583 at> Bonjour, Veuillez trouver ci-dessous une offre d'emploi pour le CEA List. Les activités du CEA LIST sont centrées sur les systèmes à logiciel prépondérant. Ces activités s’articulent autour de trois thématiques présentant de forts enjeux sociétaux et économiques : les Systèmes Embarqués (architectures et conception de systèmes, méthodes et outils pour la sûreté des logiciels et des systèmes, systèmes de vision intelligents), les Systèmes Interactifs (ingénierie de la connaissance, robotique, réalité virtuelle et interfaces sensorielles) et les Capteurs et le traitement du signal (instrumentation et métrologie des rayonnements ionisants, capteurs à fibre optique, contrôle non destructif). Le CEA LIST mène ses recherches en partenariat avec les grands acteurs industriels du nucléaire, de l’automobile, de l’aéronautique, de la défense et du médical pour étudier et développer des solutions innovantes adaptées à leurs besoins. Il réalise une recherche qui va du concept de système jusqu’au démonstrateur, contribuant au transfert de technologies et à l’innovation par l’émergence de nouvelles entreprises. Le Laboratoire Vision et Ingénierie des Contenus du CEA LIST mène des recherche sur l'analyse et l'interprétation de données multimédia. Ses 50 ingénieurs et chercheurs couvrent quatre thématiques scientifiques permettant d’aborder des domaines en pleine croissance et à large diffusion : - Fusion Multimédia pour l’indexation et la recherche de données multimédia - Traitement Automatique des Langues pour la recherche d'informations et les applications OSINT ( Watch and Open Source Intelligence) - La perception 3D pour les application de contrôle industriel (reconstruction 3D) et les applications de réalité augmentée (Localisation 3D) - Analyse Vidéo pour les systèmes d’assistance vidéo (monitoring de personnes fragiles, systèmes d'aide à la conduite, vidéo-protection) Dans le cadre de plusieurs projets en cours dans la thématique "Traitement Automatique des Langues", le laboratoire recherche un ingénieur pour assister les chercheurs du laboratoire dans la conception et l'implémentation de divers modules logiciels, dont notamment un outil d'étude de similarité entre des textes écrits en plusieurs langues. Le candidat devra posséder une bonne maîtrise du développement en C++ sous Linux (base de code installée de plusieurs centaines de milliers de lignes). Par ailleurs, une connaissance des techniques du TAL (Traitement Automatique des Langues) ou des techniques d'apprentissage et de classification (SVM, CRF, etc.) sera considérée comme un point positif. Le poste offert est un CDD de 18 mois basé sur le plateau de Palaiseau-Saclay (91) -- Géraud Canet CEA List 01 46 54 82 59 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 27 10:04:49 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 27 Jul 2011 12:04:49 +0200 Subject: Appel: LTC 2011 Message-ID: Date: Sun, 24 Jul 2011 00:20:39 +0200 (CEST) From: ltc at (Language and Technology Conference) Message-Id: <20110723222039.3620DA0001 at> Dear Colleagues, We kindly remind you that the deadline for submissions to the 5th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, November 25-27, 2011, PoznaÅ„, Poland (LTC'2011) is <<>>. The complete updated information about this event is to be found at In case of further questions, please do not hesitate to write an e-mail to ltc at (The deadline for the LTC satellite workshop on Less-Resourced Languages (LRL 2011) is September 5.) Best regards LTC Organizers ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:11:47 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:11:47 +0200 Subject: These: Matthieu Vernier, Analyse a granularite fine de la subjectivite Message-ID: Date: Thu, 30 Jun 2011 10:33:25 +0200 From: Matthieu Vernier Message-ID: <4E0C34D5.80504 at> Bonjour, j'ai le plaisir de vous inviter ? la soutenance de ma th?se intitul?e "Analyse ? granularit? fine de la subjectivit?". La soutenance se d?roulera le lundi 4 juillet ? 9h30 dans la salle 3 du b?timent LINA ? la facult? des sciences et techniques. Le jury sera compos? de : Nicholas ASHER, Directeur de recherche CNRS ? l'IRIT (rapporteur) Yves BESTGEN, Professeur FNRS ? l'Universit? Catholique de Louvain (rapporteur) Marc EL-BEZE, Professeur ? l'Universit? d'Avignon et des Pays de Vaucluse (examinateur) B?atrice DAILLE, Professeur ? l'Universit? de Nantes (directrice de th?se) Laura MONCEAUX, Ma?tre de Conf?rences ? l'Universit? de Nantes (co-encadrante de th?se) R?sum? : Avec l'essor du web social, les internautes sont davantage enclins ? partager et affirmer leurs opinions. Devant l'ampleur du ph?nom?ne, les opinions exprim?es sur internet sont devenues des donn?es strat?giques qu'il faut pouvoir suivre en temps r?el et caract?riser finement. Notre d?marche nous am?ne ? recadrer le terme d'opinion dans les th?ories linguistiques sur la subjectivit? et l'?valuation. Nous nous int?ressons ? d?limiter automatiquement les passages subjectifs d'un texte et ? en cat?goriser plusieurs aspects s?mantiques et ?nonciatifs : ont-ils une modalit? logique ou axiologique ? quelle est leur polarit? ? le locuteur dissimule t-il sa subjectivit? ? quel est l'objet cibl? ? Notre premi?re contribution pour aborder ces questions consiste en la distribution de deux ressources : le corpus Blogoscopie contient 5 900 passages ?valuatifs et 6 900 objets annot?s. Il est le premier corpus francophone de ce type ; le lexique de l'?valuation repr?sente 4 000 mots ou expressions ?valuatifs du fran?ais structur?s gramaticalement et s?mantiquement. A partir de ces ressources, nous proposons des m?thodes pour r?soudre trois probl?matiques li?es ? l'analyse de la subjectivit?. La premi?re m?thode combine des caract?ristiques lexicales, grammaticales et s?mantiques pour d?limiter et d?sambigu?ser les ?valuations d'un texte. Puis, nous ?valuons deux m?thodes s'appuyant sur des hypoth?ses s?mantiques et morphologiques pour apprendre du vocabulaire ?valuatif habituellement absent des ressources existantes. Enfin, nous exp?rimentons une nouvelle m?thode, fond?e sur la saillance d'un objet, am?liorant l'existant sur la t?che d'identification de la cible d'une ?valuation. Mots-cl?s : analyse de la subjectivit?, fouille d'opinions, ressources lexicales, approche ? granularit? fine, identification de la cible ?valu?e == english version == I am honored to invite you to my PhD defense on "Fine-grained Subjectivity Analysis ". The defense will take place Monday, July 4th 2011 at 9:30 in Room 3 at LINA, facult? des sciences et techniques. Abstract: With the rise of the social web, users are more likely to affirm and share their opinions. Given the magnitude of the phenomenon, opinions express on the Internet are critical data that must be followed in real time and categorised cleverly. Our approach leads us to refocus the term of opinion in the linguistic theories of subjectivity and appraisal. We are interested in detecting subjective phrases in texts and in categorizing various semantic and enunciative aspects: do they express a logical or an axiological evaluation? what is their polarity? does the speaker try to conceal his subjectivity? what is the target object? Our first contribution is the distribution of two resources : the Blogoscopy corpus contains about 5900 evaluations and 6900 annotated objects. It is the first francophone corpus of this type. The evaluation lexicon contains 4000 French words or expressions. Each lexical entry is structured grammatically and semantically. From these resources, we experiment several methods to address three issues related to subjectivity analysis. The first method combines lexical, grammatical and semantic features to delineate and to disambiguate evaluative phrases in texts. We rely on semantic and morphological assumptions to learn evaluative vocabulary usually missing from resources. Finally, we propose a new method based on the salience of an object to identify the evaluated target. Keywords: subjectivity analysis, opinion mining, lexical resources, fine-grained approach, opinion target identification ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:23:22 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:23:22 +0200 Subject: Conf: Workshop in the frame of CLMPS14, 21st of July 2011, Nancy Message-ID: Date: Thu, 30 Jun 2011 10:35:23 +0200 (CEST) From: alain.lecomte at Message-ID: X-url: X-url: X-url: We inform you that in the frame of the 14th Congress of Logic, Methodology and Philosophy of Sciences which will be held in Nancy from the 19th to the 26th of July ( there will be an affiliated workshop on Ludics and applications on the 21st of July (see: the name of which is: rebuilding logic and rethinking language in interaction terms The workshop will be held at: amphith??tre Geny, rez-de-chauss?e de la Facult? de Droit (13 place Carnot, 54000 Nancy) from 10:30 to 18:30, Thursday, July 21st Program: 10h 30 : Presentation of the LOCI project (Alain Lecomte) 11h : Tutorial on Ludics (Lionel Vaux) 12h30 : pause lunch 14h : Towards Formal Pragmatics based on Ludics (Alain Lecomte and Myriam Quatrini) 15h : Applications to the web and the problem of ontologies (Christophe Fouquer?) 16h: pause 16h 30 : Quantifiers from an interactive perspective (Christian Retor? and Michele Abrusci) 17h 30 : Proto-logical origins of logic (Jean-Baptiste Joinet) 18h30 : END ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:25:46 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:25:46 +0200 Subject: Revue: CORELA, vol. 9, num. 1 Message-ID: Date: Thu, 30 Jun 2011 19:31:56 +0200 From: Gilles Col Message-Id: X-url: X-url: X-url: X-url: X-url: Chers coll?gues, L'?quipe ?ditoriale de la revue CORELA - Cognition / Repr?sentation / Langages ( a le plaisir de vous annoncer la publication de son dernier num?ro (vol. 9, num. 1). Les propositions de publication pour le prochain num?ro de la revue (vol. 9, num. 2) sont ? envoyer ? Gilles Col (col at ext.univ-poitiers) avant le 15 septembre 2011. Sommaire du num?ro Tatsiana VAVULA : Repr?sentation id?ographique des pr?positions russes /v/ et /na/ Pierre-Yves KERSULEC : La sous-sp?cification flexionnelle des bases de d?rivation en question ? la lumi?re de la morphologie bretonne Par Laurence KISTER , Evelyne JACQUEY et Bertrand GAIFFE : Du thesaurus ? l'onto-terminologie : relations s?mantiques vs relations ontologiques. Compte-rendu de lecture : ? Les Nombres ? (Presses Universitaires de Rennes, 2010) de Sophie Saulnier, par Benjamin FAGARD ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:27:54 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:27:54 +0200 Subject: Seminaire: INFOLINGU, Djame SEDDAH (ISHA/Paris 4 Sorbonne), 4 juillet 2011, 10h30 Message-ID: Date: Fri, 1 Jul 2011 11:02:02 +0200 From: Myriam RAKHO Message-ID: ************************************************************************ INFOLINGU Le s?minaire de l'?quipe Informatique Linguistique de l'Institut Gaspard Monge (LIGM) ************************************************************************ Date : Le Lundi 4 juillet 2011 ? 10h30 Lieu : Universit? Paris-Est Marne-la-Vall?e B?timent Copernic, 4?me ?tage, salle 4B08R Toute personne int?ress?e est la bienvenue. ************************************************************************ ------------------------------------------------------------------------ Intervenant : ------------------------------------------------------------------------ Djam? SEDDAH ------------------------------------------------------------------------ Titre de la pr?sentation : ------------------------------------------------------------------------ Lemmatisation et analyse syntaxique probabiliste du fran?ais Djam? Seddah, projet Inria Alpage & Universit? Paris-Sorbonne ------------------------------------------------------------------------ R?sum? : ------------------------------------------------------------------------ L'analyse syntaxique probabiliste des langues ? morphologie riche (MRLs) a longtemps ?t? sous-repr?sent?e dans la litt?rature, cependant la r?cente disponibilit? de corpus arbor?s pour des langues comme l'allemand, l'arabe, l'h?breu ou le fran?ais, a permis de faire ?merger des probl?matiques communes aux MRLs. Ainsi, on note que la taille r?duite des donn?es annot?es associ?s ? des langues ? la flexion plus ou moins riches conduit ? une dispersion des donn?es lexicales pr?judiciables aux performances des analyseurs. La variabilit? de l'ordre des mots de certaines MRLs voire les idiosyncrasies de certains sch?mas d'annotations sont d'autres param?tres permettant d'expliquer pourquoi les performances des mod?les d'analyses, ayant le plus souvent ?t? con?us pour l'anglais particulier des sections Wall Street Journal du Penn Treebank, proposent des performances sous optimales quand ceux-ci sont adapt?s sur d'autres langues. Pour certains, le fran?ais peut difficilement ?tre vu comme une langue ? morphologie riche, surtout compar? ? l'arabe ou l'allemand. Cependant, les caract?ristiques de sa morphologie en font un bon candidat pour explorer diff?rentes techniques d'optimisation du lexique propres aux MRLs. Dans ce s?minaire, bas? sur des travaux r?alis?s conjointement avec Marie Candito, Ozlem Cetinoglu, Grzegorz Chrupala et Josef van Genabith, nous ?tudierons l'impact de la lemmatisation automatique du fran?ais sur le mod?le d'analyse syntaxique d'E.Charniak. Nous montrerons que le "clustering" morphologique induit par la lemmatisation accro?t les performances du mod?le mais que ses effets sont att?nu?s par l'augmentation m?canique du taux de mots inconnus. Nous pr?senterons aussi les r?sultats d'une ?tude contrastive consacr?e aux performances des mod?les lexicalis?s et non lexicalis?s avec annotation latente entra?n?s sur diff?rentes instances de sch?mas d'annotation du corpus arbor? de Paris 7. ------------------------------------------------------------------------ Anthony SIGOGNE, Myriam RAKHO ?quipe Linguistique Informatique Laboratoire d'Informatique de l'Institut Gaspard Monge (LIGM) Universit? Paris-Est Marne-la-Vall?e T?l. : 06 23 05 66 06 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:30:58 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:30:58 +0200 Subject: Livre: La sphere semantique 1, Pierre Levy Message-ID: Date: Fri, 1 Jul 2011 11:35:13 +0200 From: "Ars" Message-Id: <20110701095353.45F18C00A at> La sph?re s?mantique 1 Computation, cognition, ?conomie de l?information Collection information, hyperm?dias et communication dirig?e par Imad Saleh Pierre L?vy Le m?dium num?rique nous offre d?sormais un environnement de communication mondial, ubiquitaire et participatif qui mobilise une puissance de m?moire et de calcul sans pr?c?dent. Comment exploiter ce nouveau m?dium pour augmenter les processus de cognition sociale et piloter le d?veloppement humain ? Alliant les sciences humaines traditionnelles avec l?informatique et les sciences cognitives, cet ouvrage expose un mod?le original de la cognition humaine qui int?gre pleinement ses dimensions symbolique et sociale. La sph?re s?mantique est un syst?me de coordonn?es math?matico-linguistique de l?esprit bas? sur le m?talangage IEML. Elle fonde la construction collaborative d?un Hypercortex permettant l?observation r?flexive de nos intelligences collectives. L?auteur Pierre L?vy est titulaire de la Chaire de Recherche du Canada en Intelligence Collective ? l?Universit? d?Ottawa et membre de la Soci?t? Royale du Canada. Pionnier des ?tudes sur la cyberculture, l?intelligence collective et la gestion des connaissances, ses ouvrages ont ?t? traduits dans une quinzaine de langues. Nous sommes persuad?s que cet ouvrage ne manquera pas d'int?resser vos lecteurs et vous remercions par avance de l'accueil que vous saurez lui r?server. Pour information : ISBN : 978-2-7462-2506-0 - Format : 15,5 x 23,5 cm - 415 p. - 89 ? ?diteur : Hermes - Lavoisier Vous pouvez vous procurer cet ouvrage dans toutes les librairies sp?cialis?es et ? la librairie Lavoisier : La sph?re s?mantique 1 Computation, cognition, ?conomie de l?information Sommaire : Chapitre 1. Introduction g?n?rale Premi?re partie - Philosophie de l?information Chapitre 2. La nature de l?information Chapitre 3. La cognition symbolique Chapitre 4. La conversation cr?atrice Chapitre 5. Pour une mutation ?pist?mologique des sciences de l?homme Chapitre 6. L??conomie de l?information Deuxi?me partie - Mod?liser la cognition Chapitre 7. Introduction ? une connaissance scientifique de l?esprit Chapitre 8. Perspective informatique : vers une intelligence r?flexive Chapitre 9. Pr?sentation g?n?rale de la sph?re s?mantique IEML Chapitre 10. Le m?talangage IEML Chapitre 11. La machine s?mantique IEML Chapitre 12. L?Hypercortex Chapitre 13. La m?moire herm?neutique Chapitre 14. Perspective humaniste : vers une connaissance explicite Chapitre 15. Observer l?intelligence collective Bibliographie Index Ana ARS Service de Presse LAVOISIER SAS ?ditions Tec & Doc / EM Inter / Hermes / Synth?se Agricole / M?decine Sciences Publications 14 rue de Provigny 94236 Cachan Cedex ars at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Jul 2 08:35:41 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 2 Jul 2011 10:35:41 +0200 Subject: Appel: LREC 2012 Message-ID: Date: Fri, 01 Jul 2011 15:09:09 +0200 From: info at Message-ID: <4E0DC6F5.20709 at> [Apologies for cross-postings] ***FIRST CALL FOR PAPERS*** LREC 2012 8th ELRA Conference on Language Resources and Evaluation Istanbul Convention & Exhibition Centre (ICEC, L?tfi Kirdar Centre) ISTANBUL, TURKEY MAIN CONFERENCE: 23-24-25 MAY 2012 WORKSHOPS and TUTORIALS: 21-22 MAY and 26-27 MAY 2012 Conference web site: http// The eighth international conference on Language Resources and Evaluation (LREC) will be organised in 2012 by ELRA with the support of a wide range of international associations and organisations. CONFERENCE AIMS Since the first LREC held in Granada in 1998, LREC has become the major event on Language Resources (LRs) and Evaluation for Language Technologies (LT). The aim of LREC is to provide an overview of the state-of-the-art, explore new R&D directions and emerging trends, exchange information regarding LRs and their applications, evaluation methodologies and tools, ongoing and planned activities, industrial uses and needs, requirements coming from the e-society, both with respect to policy issues and to technological and organisational ones. LREC provides a unique forum for researchers, industrials and funding agencies from across a wide spectrum of areas to discuss problems and opportunities, find new synergies and promote initiatives for international cooperation, in support to investigations in language sciences, progress and innovation in language technologies and development of corresponding products, services and applications, and standards. CONFERENCE TOPICS Issues in the design, construction and use of Language Resources (LRs): text, speech, multimodality . Guidelines, standards, best practices and models for LRs interoperability . Methodologies and tools for LRs construction and annotation . Methodologies and tools for the extraction and acquisition of knowledge . Ontologies and knowledge representation . Terminology . Integration between (multilingual) LRs, ontologies and Semantic Web technologies . Integration between (multilingual) LRs and multimedia technologies . Metadata descriptions of LRs and metadata for semantic/content markup Exploitation of LRs in different types of systems and applications . Sign language, multimedia information and multimodal communication . LRs in systems and applications such as: information extraction, information retrieval, audio-visual and multimedia search, speech dictation, meeting transcription, Computer Aided Language Learning, training and education, mobile communication, machine translation, speech translation, summarisation, web services, semantic search, text mining, inferencing, reasoning, etc. . Different types of interfaces: (speech-based) dialogue systems, natural language and multimodal/multisensorial interactions, voice activated services, etc. . Use of (multilingual) LRs in various fields of application, like e-government, e-culture, e-health, e-participation, mobile applications, etc. . Industrial LRs requirements, user needs Issues in Language Technologies evaluation . LT Evaluation methodologies, protocols and measures . Validation, quality assurance, evaluation of LRs . Benchmarking of systems and products . Usability evaluation of LT-based user interfaces, interactions and dialogue systems . Usability and user satisfaction evaluation General issues regarding LRs & Evaluation . National and international activities and projects . International collaboration and co-operation . Multilingual issues . Priorities, perspectives, strategies in national and international policies for LRs . Language coverage and diversity, Less Resourced languages, Endangered languages . Open, linked and shared data and tools, Open and collaborative architectures . Organisational, economical, ethical and legal issues Hot Topic: Speech & Multimodal Resources Speech and Multimodal Resources are the special topics for LREC 2012, and submissions dedicated to these modalities are encouraged! Also papers integrating speech and/or multimodal with written resources are particularly welcome. Special Highlight: Contribute to building the LREC Language Library! After the success of the LRE Map introduced in LREC 2010 -- now used in many Conferences as a normal step in the submission procedure -- LREC 2012 recognises that time is ripe to launch another important initiative, the LREC Language Library! The LREC Language Library will also be a collaborative enterprise of the LREC Community, an important contribution to the community-built Open Resource Infrastructure. ELRA will prepare an LREC Repository, part of the META-SHARE network, hosting a number of resources on all modalities (speech, text, images, etc.) in as many languages as possible. When submitting a paper, you will be invited to process some pieces of this data, in the appropriate language(s) for you, in one or more of the possible dimensions that your submission addresses (e.g. POS-tag the data, extract/annotate named entities, annotate temporal information, disambiguate word senses, transcribe audio, etc.) and put the processed data back in the LREC Repository. The processed data will be made available to all the LREC participants before the conference, to be compared and analysed, and at LREC we will organise some event around them with your help! This collaborative work on annotation/transcription/extraction/... over the same data and on a large number of processing dimensions will set the ground for a large Language Library, linked to the LRE Map for the description of the data, where everyone can deposit/create processed data of any sort -- all our "knowledge" about language. PROGRAMME The Scientific Programme will include invited talks, oral presentations, poster and demo presentations, and panels, in addition to a keynote address by the winner of the Antonio Zampolli Prize. As usual, there is no difference in quality between oral and poster presentations. Only the appropriateness of the type of communication (more or less interactive) to the content of the paper will be considered. SUBMISSIONS AND DATES Submitted abstracts of papers for oral and poster or demo presentations should consist of about 1500-2000 words. * Submission of proposals for oral and poster/demo papers: 15 October 2011 Proposals for panels, workshops and tutorials will be reviewed by the Programme Committee. * Submission of proposals for panels, workshops and tutorials: 15 October 2011 PROCEEDINGS The Proceedings will include both oral and poster papers, in the same format. In addition a Book of Abstracts will be printed. CONFERENCE PROGRAMME COMMITTEE Nicoletta Calzolari -- CNR, Istituto di Linguistica Computazionale "Antonio Zampolli", Pisa -- Italy (Conference chair) Khalid Choukri -- ELRA, Paris -- France Thierry Declerck -- DFKI GmbH, Saarbr?cken -- Germany Mehmet Ugur Dogan -- T?BITAK-BILGEM, SLTC, Kocaeli -- Turkey Bente Maegaard -- CST, University of Copenhagen -- Denmark Joseph Mariani -- LIMSI-CNRS & IMMI, Orsay -- France Asuncion Moreno -- Universitat Polit?cnica de Catalunya, Barcelona -- Spain Jan Odijk -- UIL-OTS, Utrecht -- The Netherlands Stelios Piperidis -- Athena Research Center/ILSP, Athens -- Greece ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 6 07:42:20 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jul 2011 09:42:20 +0200 Subject: Habilitation: Kais Haddar, Ressources lexico-syntaxiques normalisees et analyse de phenomenes linguistiques pour la langue arabe Message-ID: Date: Sun, 3 Jul 2011 17:11:19 +0100 (BST) From: Kais Haddar Message-ID: <1309709479.55417.YahooMailRC at> Boujour ? tous, j'ai le plaisir de vous inviter ? la soutenance de mon Habilitation Universitaire en Informatique intitul?e "Sp?cification et impl?mentation des ressources lexico-syntaxiques normalis?es et analyse de ph?nom?nes linguistiques pour la langue arabe". La soutenance aura lieu le jeudi 07 juillet 2011 ? 10h dans la salle des th?ses de la FSEGS, Tunisie. M. Abdelmajid BEN HAMADOU, Professeur Pr?sident M. Denis MAUREL, Professeur Rapporteur Mme. Lamia HADRICH BELGUITH, Ma?tre de Conf?rences Rapporteur M. Laurent ROMARY, Professeur Examinateur M. Abdelhamid ABDELWAHED, Professeur Examinateur Cordialement Kais Haddar ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 6 07:45:02 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jul 2011 09:45:02 +0200 Subject: Job: Researcher position, Statistical Machine Translation Message-ID: Date: Tue, 05 Jul 2011 11:36:54 +0200 From: Nicola Cancedda Message-ID: <4E12DB36.5080709 at> X-url: Researcher, Statistical Machine Translation The Machine Learning for Document Access and Translation group of the Xerox Research Centre Europe conducts research in Statistical Machine Translation and Information Retrieval, Categorization and Clustering using advanced machine learning methods. The team is part of the PASCAL 2 European Network of Excellence, ensuring a strong network of academic collaboration. We are opening a position for a researcher with a background in Statistical Machine Translation to support our participation in the EU-funded project TransLectures. Required experience and qualifications: - PhD in computer science or computational linguistics with focus on SMT or statistical NLP. - Good publication record and evidence of implementing systems. - A good command of English, as well as open-mindedness and the will to collaborate within a team. - Acquaintance with Spoken Language Translation is a plus. Preferred starting date: November 2011 Contract duration: 18 months Application instructions Please email your CV and covering letter, with message subject "Statistical Machine Translation Researcher" to xrce-candidates and to Nicola.Cancedda at Inquiries can be sent to Nicola.Cancedda at XRCE is a highly innovative place and we strongly encourage publication and interaction with the scientific community. Job announcement URL: ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 6 07:51:08 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jul 2011 09:51:08 +0200 Subject: Job: CDD (niveau post-doc) sur l'analyse semantique, CEA LIST Message-ID: Date: Tue, 5 Jul 2011 13:31:04 +0200 From: Ga?l de Chalendar Message-Id: < at> Le d?partement DIASI du CEA LIST propose un CDD de niveau post-doctoral sur un projet de recherche. Sujet : G?n?ration Automatique de Sc?narios ? partir de Proc?dures ?crites Contexte ======== L'exploitation de la R?alit? Augment?e pour la maintenance ainsi que l'utilisation de robots dans ce type de t?ches ou pour l'aide ? la personne n?cessitent de disposer de mod?les 3D de l'environnement et des objets. Il faut aussi exprimer les sc?narios de maintenance (RA) ou d'action (robotique) en termes de ces mod?les. Mais la r?alisation manuelle de tels mod?les est extr?mement couteuse. Or, les documentations techniques et les sc?narios de maintenance sont tr?s souvent d?crits en langage naturel, et ce la plupart du temps avec un langage contr?l? ou du moins tr?s sp?cifique. De m?me, les sc?narios d'action des robots peuvent ?tre ?nonc?s ? voix haute par les utilisateurs. Il serait donc souhaitable de pouvoir convertir (semi-)automatiquement l'ensemble de ces productions langagi?res en ?l?ments de mod?les et en plans d'actions exprim?s dans le langage formel utilis? par l'application. Les travaux propos?s dans ce post-doc sont une collaboration entre trois laboratoires du D?partement Intelligence Ambiante et Syst?mes Interactifs (DIASI) du CEA LIST. Ils consistent ? exploiter les outils d'analyse linguistique et s?mantique d?velopp?s au LVIC pour d?velopper de nouvelles m?thodes de conversion du texte en mod?les et les appliquer aux besoins en RA et robotique des laboratoires LRI et LSI. Etat de l?art et verrous technologiques ======== M?me si des travaux existent sur ces sujets (Cf. r?f?rences ci-dessous), les verrous sont encore tr?s nombreux. De nombreuses technologies qui sont n?cessaires dans le cadre de ce post-doc restent tr?s exp?rimentales : outils d'analyse s?mantique (Word Sense Disambiguation, Semantic Role Labeling,...) , exploitation de connaissances sur le monde/pragmatique, lien s?mantique lexicale / s?mantique formelle, interfaces homme-machine pour la mise a point des mod?les (corrections, ?volutions). Description des travaux ======= Le post-doc recrut? commencera son contrat par une rapide impr?gnation des technologies et des outils de Traitement Automatique des Langues du LVIC, puis des technologies et outils cibles: mod?lisation 3D, RA, robotique. Il poursuivra par une exploration approfondie de l'?tat de l'art. Puis, il proposera un plan de travail incluant la r?alisation de deux prototypes et d'un plan d'?valuation. Si le planning le permet et qu'une campagne d'?valuation adapt?e existe, il participera ? cette campagne. Il devra en permanence rester en contact avec des membres sp?cifiques des divers laboratoires, de fa?on ? s'assurer que son travail est bien coh?rent avec les objectifs de tous. Pour ce faire, des r?unions de coordinations mensuelles seront organis?es avec des repr?sentants des trois laboratoires. Les prototypes d?velopp?s devront permettre de convertir des documents techniques en mod?les et sc?narios utilisables de fa?on semi-automatique. Ils utiliseront les outils de traitement automatique des langues et inclueront une interface graphique permettant de passer du texte au mod?le avec le moins de manipulations manuelle des donn?es possible. Profil recherch? ======= Le candidat recherch? est un docteur en informatique, sp?cialit? traitement automatique des langues ou technologies du Web s?mantique (ontologies, raisonnement). Il devra poss?der une exp?rience de la r?alisation d'interfaces graphiques, si possible en Qt. Une connaissance de la mod?lisation 3D faciliterait le commencement du post-doc. Lieu, dur?e et r?mun?ration ======= Le CDD se d?roulera au sein du laboratoire LVIC, dans ses nouveaux locaux (? partir d'octobre 2011) de Nano'Innov ? Palaiseau sur le plateau de Saclay en R?gion Parisienne. La dur?e est de 12 mois et la r?mun?ration selon les grilles du CEA (environ 2200 ? net, variable selon le parcours) Comment candidater ======= Les candidatures sont ? envoyer d?s que possible et seront ?tudi?es jusqu'? ce que le poste soit pourvu. Envoyer un CV et une lettre de motivation, ainsi que d'?ventuelles recommandations, par courrier ?lectronique ? at Ga?l de Chalendar +33 1 46 54 80 18 CEA LIST Centre de Fontenay-aux-Roses Laboratoire Vision et Ing?nierie des Contenus (Vision and Content Engineering Laboratory) Bat. 38-2 ; 18, rue du Panorama ; BP 6 92265 Fontenay aux Roses Cedex ; France R?f?rences ======= - Romaric Besan?on, Ga?l de Chalendar, Olivier Ferret, Faiza Gara, Olivier Mesnard, Meriama La?b and Nasredine Semmar. LIMA : A Multilingual Framework for Linguistic Analysis and Linguistic Resources Development and Evaluation. Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10). May 2010. - Eva Hanser. SceneMaker: Intelligent Multimodal Visualisation of Natural Language Scripts. Confirmation Report. June, 2009 - Minhua Ma. Automatic Conversion of Natural Language to 3D Animation. Thesis. University of Ulster. July 2006 - Lee M. Seversky. Real-time Automatic 3D Scene Generation from Natural Language Voice and Text Descriptions. State University of New York at Binghamton - St?phane S. Som? and Xu Cheng. 2008. An approach for supporting system-level test scenarios generation from textual use cases. In Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 724-729. - Hans Svensson & Ola ?kerberg. Development and Integration of Linguistic Components for an Automatic Text-to-Scene Conversion System. Lund Institute of Technology. August 2002. - Patrick Ye. Natural Language Understanding in Controlled Virtual Environments. PhD thesis. University of Melbourne. Melbourne, Australia. June 2009 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 6 07:54:44 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 6 Jul 2011 09:54:44 +0200 Subject: Appel: Revue TAL - Note de lecture (GAUSSIER) Message-ID: Date: Tue, 5 Jul 2011 17:46:12 +0200 (CEST) From: Denis Maurel Message-ID: <526799459.70080.1309880772017.JavaMail.root at mail10> X-url: X-url: Appel: revue TAL - Note de lecture (GAUSSIER) La revue TAL publie r?guli?rement des notes de lecture. Nous recherchons un coll?gue souhaitant lire le livre: "?ric GAUSSIER, Fran?ois YVON, Mod?les statistiques pour l?acc?s ? l?information textuelle, Herm?s-Lavoisier, 2011, 482 pages" et pr?t ? en faire un compte-rendu pour la revue TAL (cet ouvrage sera envoy? gracieusement en ?change du service rendu). Cette note de lecture doit ?tre r?dig?e en fran?ais (trois pages maximum, au format de la revue) et envoy?e fin septembre 2011. D'autres compte-rendu sont possibles si vous avez lu r?cemment un ouvrage qui vous a int?ress? et si vous ?tes pr?t ? partager votre lecture avec la communaut?... Denis Maurel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 8 20:35:40 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Jul 2011 22:35:40 +0200 Subject: Appel: colloque Cooccurrence (Precisions sur modalites de soumission) Message-ID: Date: Wed, 06 Jul 2011 14:54:11 +0200 From: Sylvie Mellet Message-ID: <4E145AF3.9040806 at> *Modalit?s de soumission pour le colloque "La cooccurrence : du fait statistique au fait textuel" (Besan?on, 8-10 f?vrier 2012) - Appel complet ci-dessous. * La proposition de communication prendra la forme d'un r?sum? long (deux pages) accompagn? d'une bibliographie de r?f?rence. Elle sera pr?sent?e dans un fichier anonym? et sera envoy?e avant le 10 septembre 2011 ? sylvie.mellet at et jmviprey at *Submission for the conference "**Co-occurrence: from a statistical to a textual phenomeno**n" (Besan?on, 8-10 february 2012) - Conference call below. * Proposals on papers including an abstract of 2 pages (references not included) should be submitted in French or English. All submitted manuscripts must be original papers of scientific quality in regard to theoretical and methodological criteria and will be peer-reviewed anonymously by an international selection committee. Abstracts should be sent by 10th September 2011 to the following addresses: sylvie.mellet at and jmviprey at *Appel ? communications* */La cooccurrence : du fait statistique au fait textuel/* Besan?on, 8-9-10 f?vrier 2012 (/english version below/) Depuis 60 ans et l'historique affirmation de Firth ?you shall judge a word by the company it keeps ?, les travaux sur la cooccurrence se sont multipli?s dans le monde pour devenir un champ ? part enti?re de la linguistique de corpus et de la linguistique textuelle. Au-del? des perspectives tr?s diverses (?tudes phras?ologiques, extraction d'expressions idiomatiques, traduction automatique, d?sambigu?sation s?mantique d'homographes, fouille de textes, description et mod?lisation textuelles, mise ? jour des th?matiques du discours, etc.), au-del? aussi des variantes terminologiques pas uniquement imputables ? des effets de traduction (/cooccurrence/, /collocation/, /colligation/, /corr?lats/, /associations/, etc.), ces travaux foisonnants reposent sur une posture contextualisante commune et sur une approche probabiliste du langage partag?e [London school (Firth et Halliday) puis Birmingham school (Sinclair), Laboratoire de Saint-Cloud (Tournier), etc.]. Le postulat est en effet ici que le sens na?t toujours en contexte, qu'il se construit ? partir du co-texte, et la cooccurrence repr?sente la seule forme objectivable, minimale mais calculable, de ce co-texte. Le colloque ? La cooccurrence : du fait statistique au fait textuel ? (Besan?on, 8-10 f?vrier 2012) veut aujourd'hui faire le point sur les ?tudes en cours, confronter les m?thodologies, analyser les enjeux. Sans exclure les ?tudes lexicologiques, phras?ologiques ou le traitement automatique de la langue dont les avanc?es th?oriques aussi bien que les nouveaux algorithmes de calcul, les outils d'extraction et de repr?sentation des r?alit?s cooccurrentielles pourront ?tre pr?sent?s, on portera une attention particuli?re, dans la voie lointainement initi?e par Halliday & Hasan, ? *la cooccurrence comme facteur primordial de la textualit?*. Partant du simple calcul des paires de mots statistiquement cooccurrentes dans le corpus ou du simple rep?rage des mots statistiquement associ?s ? un mot-p?le donn?, les contributions devront chercher ? apporter un ?clairage novateur sur des ph?nom?nes cooccurrentiels plus complexes comme les r?seaux cooccurrentiels intriqu?s qui structurent un texte, la cooccurrence g?n?ralis?e (Viprey) ou la poly-cooccurrence (Martinez) qui construisent des structures d'?quivalence, ou de r?sonance, non obvies, ou encore sur les cooccurrences indirectes (A => B => C) ou de deuxi?me g?n?ration qui ? force d'it?ration pr?tendent ?puiser le texte. Si le texte est aujourd'hui per?u comme une entit? r?ticulaire avec ses r?currences, ses ?chos, ses rhizomes, la cooccurrence doit permettre de le d?crire et le mod?liser. L'axe syntagmatique et la lin?arit? orient?e du texte pourront aussi ?tre probl?matis?s. D'abord purement statistique, la d?finition de la cooccurrence comme copr?sence r?guli?re de deux unit?s linguistiques dans une fen?tre textuelle donn?e pourra ?tre enrichie par des contraintes distributionnelles dans la tradition harrissienne ou des contraintes de contigu?t?, d'orientation, de place ou d'encha?nement pour rejoindre la notion de /pattern/, de /segment r?p?t?/ (Salem) ou de /motif/ (Longr?e et Mellet). Enfin, une attention particuli?re pourra ?tre port?e aux cooccurrences sur des niveaux linguistiques ?tag?s, c'est-?-dire ? celles qui concernent non pas seulement deux mots comme c'est habituellement le cas dans le cadre du traitement du vocabulaire, mais deux ?l?ments grammaticaux, ou, de mani?re crois?e, des ?l?ments lexicaux et grammaticaux, des lemmes et des ?tiquettes morphosyntaxiques, etc. Certaines commnications pourront porter sur l'histoire proprement dite de cette dimension dans la constitution et l'?volution de la linguistique textuelle, dans les domaines francophone, anglo-saxon, scandinave, mais aussi dans le reste du monde. A l'exception de ces derni?res, les propositions de communication devront prendre appui sur l'?tude de corpus pr?cis?ment d?finis et, par del? le traitement et l'analyse des donn?es, mettre fortement en ?vidence l'apport m?thodologique et/ou th?orique de la contribution. Les langues du colloque seront le fran?ais et l'anglais. *Mots cl?s :* Cooccurrence Segment r?p?t? Collocation Colligation Corr?lats Association lexicale Contextualisation s?mantique Linguistique de corpus Textualit? *Calendrier :* -Colloque : 8-10 f?vrier 2012 -Date limite de soumission : 10 septembre 2011 -Avis d'acceptation aux auteurs : 15 octobre 2011 *Modalit?s de soumission :* La proposition de communication prendra la forme d'un r?sum? long (deux pages) accompagn? d'une bibliographie de r?f?rence, et sera envoy?e dans un fichier anonym? ? sylvie.mellet at et jmviprey at Les */actes du colloque/* seront publi?s, apr?s un nouveau processus de soumission, relecture et s?lection, dans le num?ro 11 de la revue /CORPUS/, ? para?tre en novembre 2012. *Conference**call* */Co-occurrence: from a statistical to a textual phenomenon/* *Besan?on, 8-9-10 February 2012* ** *Call for **papers*** 60 years ago, Firth declared, "you shall judge a word by the company it keeps." Since he made that historic statement, studies on co-occurrence patterns have multiplied in the world and have now become a field in their own right, existing within the larger fields of corpus linguistics and text linguistics. Work focusing on co-occurrence patterns has adopted a great variety of perspectives, focusing on, for example, phraseological phenomena, automatic extraction of idioms, automatic translation, homograph disambiguation, text mining, textual description and modelling, and retrieval of discourse themes. Also, the terminology used has displayed a notable diversity (which may not be entirely explained by translation effects): indeed, the phenomena examined have been referred to as co-occurrence patterns, collocations, colligations, correlates, associations, and other terms. However, one should not be puzzled, because, in spite of these visible differences, studies on co-occurrence patterns all share a common postulate regarding the essential role of context in the elaboration of word meaning, and they all bring a probabilistic approach to the study of language [see London school (Firth and Halliday), Birmingham school (Sinclair), Laboratoire Saint-Cloud (Tournier), etc]. In brief, they assume that (i) meaning is always a contextual phenomenon and is elaborated on the basis of the co-text; and (ii) co-occurrence patterns are to be considered as the only objectified units of the context, a minimal yet calculable form. The colloquium "Co-occurrence: from a statistical to a textual phenomenon", to be held in Besan?on from 8-10 February 2012, intends to take stock of current studies, to compare methodologies, and to analyse the scientific stakes involved. Lexicological and phraseological studies, as well as work on natural language processing, may be submitted. Contributions may also present new logarithms, or new tools for extracting and modelling co-occurrence phenomena. Work that would embrace the path opened long ago by Halliday and Hasan, /i.e. /to//consider *textuality as being primarily built by co-occurrence facts*,**would be most appreciated. Whether the contributions rely on the simple computation of word pairs that statistically co-occur within a given corpus, or on the simple identification of words that are statistically associated with a word-pole, it is expected that they will shed light on more complex structures such as the intricate co-occurrence networks organizing a text, generalised co-occurrences (Viprey), or polyco-occurrences (Martinez), which contribute to the establishment of underlyingequivalence or resonance structures. Contributions may also address indirect co-occurrence patterns A => B => C (also called second-generation co-occurrence patterns) which, if repeated several times, help reveal the content of a text. Indeed, since a text is now widely considered as a reticular entity formed by recurrent patterns, echoes, and rhizomes, then co-occurrence patterns should make text description and modelling possible. The issues of the syntagmatic axis and the linear orientation of a text may also be debated. Co-occurrence patterns have been defined, first, as a purely statistical phenomenon,/i.e/. as the regular co-presence of two linguistic units within a given textual window; but it may be improved by identifying distributional constraints (following the tradition of Harris's work) or constraints affecting adjacency relations, or the orientation, position and/or sequencing of given units; work of this kind would then meet the notions of/pattern/, /repeated segments/ (Salem) or /motifs/ (Longr?e and Mellet). Finally, special attention may also be given to multi-level co-occurrence patterns /i.e./ patterns connecting two grammatical units (and not two lexical items as is usually the case when one analyses the vocabulary of a given corpus); studies may also cross linguistic levels and focus on the co-occurrence of lexical units with grammatical units, lemmas with morpho-syntactic tags, etc. A certain number of submissions concerned with the history of the notion of /co-occurrence/ and its role in the emergence and evolution of textual linguistics will be accepted; the tradition may be investigated in French-speaking countries, in the Anglo-Saxon and Scandinavian areas, or in the rest of the world. With the exception of this last (historical) orientation, submissions must rely on precisely defined corpora, and, beyond the processing and analysis of the data, they must emphasize the methodological and/or theoretical contribution to the field. The languages of the conference are French and English. *Key words* Co-occurrences Repeated segments Collocations Lexical associations Semantic contextualization Corpus linguistics Textuality *Calendar* Conference: 8-9-10 February 2012 Deadline for paper submission: 10 September 2011 Notification of acceptance: 15 October 2011 *Submission* Proposals on papers including an abstract of 2 pages (references not included) should be submitted in French or English. All submitted manuscripts must be original papers of scientific quality in regard to theoretical and methodological criteria and will be peer-reviewed anonymously by an international selection committee. Abstracts should be sent by 10th September 2011 to the following addresses: sylvie.mellet at and jmviprey at *Conference proceedings *will be published, after a new process of submission, review and selection, in /Corpus/ (11) to appear in November 2012. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 8 20:41:35 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Jul 2011 22:41:35 +0200 Subject: Job: Programming Position, ELDA Message-ID: Date: Thu, 07 Jul 2011 14:12:00 +0200 From: info at Message-ID: <4E15A290.8020306 at> [English version below] *Programmeur dans le d?partement d'?valuation des technologies de la langue* ELDA propose un poste de programmeur pour ses activit?s de production de ressources linguistiques et d'?valuation, dans le cadre de projets europ?ens. Il/elle aura la charge de d?velopper des architectures orient?es service Web pour la production automatique et la distribution de ressources linguistiques. Il/elle sera aussi impliqu? dans la cr?ation de d?p?ts de ressources linguistiques, du d?veloppement d'application de TAL ou pour l'?valuation, etc. Profil recherch? : - De formation ou niveau ing?nieur en informatique, traitement automatique des langues ou tout autre domaine affili?. - Bonne comp?tences de programmation Python - Bonne connaissance de Django et de la gestion de base de donn?es (MySQL) - Bonne connaissance de Linux et des outils Open Source - Exp?rience et/ou connaissance des services Web - Fran?ais et anglais exig?s - Aptitude ? travailler tant de fa?on ind?pendante au sein d'une ?quipe - Connaissances en PHP, Perl, C++ ou Java sont un plus - Exp?rience et/ou connaissance du TAL est un plus Salaire: en fonction des qualifications et exp?riences. Toute candidature sera ?tudi?e jusqu'? ce que le poste soit pourvu. Le poste est bas? ? Paris. Les candidats doivent avoir la citoyennet? d'un pays de l'Union Europ?enne ou en possession d'un titre de s?jour. Les candidatures doivent ?tre adress?es (de pr?f?rence au format PDF et par e-mail) ? : Olivier Hamon ELRA / ELDA 55-57, rue Brillat Savarin 75013 Paris FRANCE Fax : +33 1 43 13 33 30 Email : hamon at ------------------------------------------------------------------------ Programming position ELDA offers a position for its Language Resource Production and Evaluation activities working in the framework of European projects. The position is related to the development of web-service architectures for the automatic production and distribution of language resources. The candidate may also be involved in the creation of LR repositories, NLP applications development and/or evaluation, etc. Profile: - Degree or MSc in computer science, computational linguistics, natural language processing or similar fields - Good programming skills in Python - Good knowledge of Django and database management (MySQL) - Good knowledge of Linux and open source software - Experience and/or knowledge of web services - Proficiency in French and English - Ability to work independently and as part of a team, in particular to collaborate with members of a multidisciplinary and multilingual team - Programming skills in PHP, Perl, C++ or Java are a plus - Experience and/or knowledge on NLP is a plus Salary: Commensurate with qualifications and experience. Applications will be considered until the position is filled. The position is based in Paris, France and candidates should have the citizenship (or residency papers) of a European Union country. Applicants should send (preferably in PDF format and via email) a cover letter addressing the points listed above together with a curriculum vitae to: Olivier HAMON ELRA / ELDA 55-57, rue Brillat Savarin 75013 Paris FRANCE Fax : +33 1 43 13 33 30 Email : hamon at The European Language Resources Association (ELRA) is a non-profit making organisation founded by the European Commission in 1995, with the mission of providing a clearing house for language resources and promoting Human Language Technologies. The Evaluations and Language resources Distribution Agency (ELDA) is ELRA's operational body. ELDA identifies, collects, distributes and evaluates language resources. It also organises evaluation activities and campaigns in HLT, as well as disseminates general information in the HLT field. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 8 20:44:00 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Jul 2011 22:44:00 +0200 Subject: Conf: SFC 2011, 28-30 septembre 2011, Orleans Message-ID: Date: Fri, 08 Jul 2011 17:52:47 +0200 From: Guillaume Cleuziou Message-ID: <4E1727CF.2020909 at> X-url: ============ Appel ? Inscription et Participation ============ Pour vous inscrire et participer ? la conf?rence SFC'2011 : XVIII?mes Rencontres de la Soci?t? Francophone de Classification du 28 au 30 septembre 2011 ? Orl?ans Contact email : sfc2011 at Site Web : ----------------- Dates importantes ----------------- Inscription : d?s maintenant Apr?s le 31 juillet 2011 : augmentation des tarifs de 10% ----------------- Chercheurs invit?s ----------------- Radim Belohlavek : Prof. Universit? de Palacky (R?publique Tch?que) G?rard Govaert : Prof. Universit? de Technologie de Compi?gne (France) Christian Sohler : Prof. Universit? de Dortmund (Allemagne) ----------------- Programme ----------------- La liste des articles s?lectionn?s par le comit? de programme est disponible sur le site des rencontres : Au plaisir de vous accueillir prochainement ? Orl?ans. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:25:44 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:25:44 +0200 Subject: Job: Junior Research Assistant Position in NLP, University of Beira Interior, Portugal Message-ID: Date: Sat, 09 Jul 2011 11:37:57 +0100 From: Ga?l Dias Message-ID: <4E182F85.5000501 at> X-url: [Apologize for cross-posting] ***************************************************************** Junior Research Assistant Position in Natural Language Processing Centre of Human Language Technology and Bioinformatics University of Beira Interior Portugal ***************************************************************** The Centre of Human Language Technology and Bioinformatics (HULTIG) of the University of Beira Interior ( is advertising a 9 months scholarship (980 euros/month) for an outstanding Master student in Informatics, Computer Science or Applied Mathematics in the domain of the construction of Medical Ontologies. The selected candidate will work on the MEDON project funded by the Portuguese Foundation for Science and Technology. The work will mainily consist in developping new research in the fields of Lexical Semantics and Ontology Construction with a motivated and motivating team of Senior Researchers and PhD Students. In particular, the candidate will have to work on two interlinked topics: 1. Extraction of medical terminological resources from medical corpora. 2. Construction of prototype-based ontologies by investigating multi-view clustering and sequential clustering using level of generality and similarity features. The HULTIG Centre is principaly concerned in developing high reasearch in the domains of Natural Language Processing, Text Mining, Information Retrieval and Knowledge Engineering. It fosters inter-disciplinary research and applied research. A great deal of National and International Instituitions are working in partnership with the HULTIG Centre. In particular, this research will be carried out with the University of Evora (Portugal), University of Orl?ans (France) and University of Caen Basse-Normandie (France). To apply, the interested applicants must send a Curriculum Vitae, the list of subjects and marks of their Bachelor and Master degrees and a letter of motivation by email to the Head of the Centre of Human Language Technology and Bioinformatics, Prof. Ga?l Dias at ddg at Latest day for receipt of applications is Monday, 27th July, 2011. Best Regards, Ga?l Dias. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:29:55 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:29:55 +0200 Subject: Appel: CSLP 2011, deadline extension to July 17th Message-ID: Date: Mon, 11 Jul 2011 21:50:57 +0200 From: Denys Duchier Message-ID: <87oc10d2am.fsf at> X-url: *** DEADLINE EXTENSION! *** The CSLP at Context'11 workshop considers the role of constraints in the representation of language and the implementation of language processing from an interdisciplinary perspective. This theme should be interpreted inclusively: contributions from linguistics, computer science, psycholinguistics and related areas are very welcome, and an interdisciplinary perspective is of particular interest. Constraints are widely used in linguistics, computer science, and psychology. How they are used, however, varies widely according to the research domain: knowledge representation, cognitive modelling, problem solving mechanisms, etc. These different perspectives are complementary, each one adding a piece to the puzzle. For example, linguistics proposes in-depth descriptions implementing constraints in order to filter out structures by means of description languages, constraint ranking, etc. The constraint programming paradigm, on the other hand, shows that constraints have to be taken as a systematic whole and can thus play a role in building the structures (or can even replace structures). Finally, psycholinguistics experiment have been made, investigating the role of constraint systems for cognitive processes in comprehension and production, as well as addressing how they can be acquired. The topics include, but are not limited to - Constraints in human language comprehension and production - Context modelling and discourse interpretation - Acquisition of constraints - Constraints and learning - Cross-theoretical view of the notion of constraint - New advances in constraint-based linguistic theories - Constraint satisfaction (CS) technologies for NLP - Linguistic analysis and linguistic theories biased towards CS or constraint logic programming (CLP) - Application of CS or CLP for NLP - CS and CLP for other than textual or spoken languages, e.g., sign languages and biological, multimodal human-computer interaction, visual languages - Probabilistic constraint-based reasoning for NLP and context comprehension Previously published papers cannot be accepted. The submissions will be reviewed by the international program committee. One author for each accepted paper must attend the workshop in order to present the paper. Cheers, --Denys ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:33:28 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:33:28 +0200 Subject: Appel: JADT 2012 Message-ID: Date: Tue, 12 Jul 2011 08:59:01 +0200 From: Anne Dister Message-Id: X-url: X-url: ------------------------------------------------------------------------ APPEL A COMMUNICATIONS JADT 2012 - Journ?es d'Analyse des Donn?es Textuelles 13-15 juin 2012, Li?ge, Belgique ------------------------------------------------------------------------ Chers coll?gues, Les journ?es internationales d?analyse statistique des donn?es textuelles (JADT) r?unissent tous les deux ans, depuis 1990, des chercheurs travaillant dans les diff?rents domaines concern?s par les traitements automatiques et statistiques de donn?es textuelles. Elles permettent aux participants de pr?senter leurs r?sultats, de confronter leurs outils et leurs exp?riences. Les JADT 2012, organis?es par le LASLA ? Laboratoire d?Analyse statistique des Langues anciennes de l?Universit? de Li?ge et par le SeSLA ? S?minaire des Sciences du Langage des Facult?s universitaires Saint-Louis ?, r?uniront ? Li?ge (Belgique), du 13 au 15 juin 2012, des chercheurs travaillant dans le domaine de l?analyse des donn?es textuelles : de la lexicographie ? l?analyse du discours politique, de la recherche d?information aux recherches qui concernent le marketing, de la linguistique computationnelle ? la sociolinguistique, de la fouille de donn?es textuelles ? l?analyse de contenu. Dans la lign?e des pr?c?dentes conf?rences JADT (, la conf?rence de Li?ge proposera, durant trois jours, des ateliers, des pr?sentations scientifiques, des conf?rences invit?es et des sessions de discussion entre les participants. Le site du colloque se trouve ? l?adresse suivante : Th?mes du colloque La conf?rence sera centr?e sur les applications des mod?les et des outils statistiques dans les domaines suivants: - Textom?trie, statistique textuelle - Analyse exploratoire de donn?es textuelles - Linguistique de corpus et linguistique quantitative - Traitement automatique du langage naturel - ?tiquetage, lemmatisation, enrichissement linguistique - Analyse statistique des donn?es structur?es et non structur?es - Classification de textes, cartographie lexicale et textuelle - Recherche documentaire, recherche d?informations - Fouille de textes, fouille du web, Web s?mantique - Stylom?trie, analyse du discours - Logiciels pour l?analyse textuelle - Apprentissage automatique pour l?analyse des donn?es textuelles - Corpus multilingues et corpus parall?les Dates importantes Dates limites Titre et R?sum? (max 20 lignes) 1er octobre 2011 Date limite de soumission: Premi?re version (Texte complet) 1er d?cembre 2011 Notification aux auteurs 1er f?vrier 2012 Date limite d?inscription 1er mars 2012 Date limite de soumission: Derni?re version (camera ready) 1er mars 2012 Dates de la conf?rence 13-15 juin 2012 Langues des articles et des pr?sentations Les propositions de communication, les communications d?finitives et les pr?sentations orales pourront ?tre faites dans les langues suivantes : anglais, fran?ais, italien, espagnol. Toutes les communications devront ?tre pr?c?d?es d?un r?sum? en anglais. Titre et pr?-soumission Les participants qui d?sirent pr?senter une contribution ou un poster sont invit?s ? envoyer un titre et un r?sum? (maximum 20 lignes) avant le 1er octobre 2011. JADT 2012 utilisera le syst?me EasyChair pour g?rer les propositions de communication. Cette proc?dure est accessible sur le site de la conf?rence qui est d?ores et d?j? accessible. Articles Les auteurs devront fournir la version compl?te de leur contribution avant le 1er d?cembre 2011. Les articles seront ?valu?s par le comit? scientifique. Le texte complet de la communication ne devra pas exc?der 12 pages, r?f?rences comprises, en respectant la feuille de style JADT. Le comit? de programme informera les auteurs de sa d?cision d?acceptation et du classement de la communication (communication orale ou poster) le 1er f?vrier 2012. Version finale Les auteurs devront fournir la version finale de leur contribution (12 pages maximum) avant le 1er mars 2012, en utilisant la m?me proc?dure de soumission. La version finale sera relue avant ?dition. Contacts Pour plus d?informations ou toute question, ?crivez ? l?adresse suivante : jadt2012 at En esp?rant votr participation aux prochaines JADT, avec nos sentiments les plus cordiaux. ---Anne Dister, Dominique Longr?e et G?rald Purnelle ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:39:02 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:39:02 +0200 Subject: Job: Post-Doctorat, TAL et ontologies pour la recherche semantique d'information Message-ID: Date: Tue, 12 Jul 2011 10:26:09 +0200 From: Nathalie Aussenac-Gilles Message-ID: <4E1C0521.4090705 at> X-url: Proposition de post-doctorat en collaboration avec l'Universit? Paul Sabatier (Toulouse)/laboratoire IRIT et l'Universit? de Pau et des Pays de l'Adour/laboratoire LIUPPA ============== Projet ANR MOANO ============== ============== Le projet MOANO "Mod?les et Outils pour Applications NOmades de d?couverte de territoire" est un projet soutenu par l'ANR (2010-2014) - Programme CONTINT. Ce projet consiste ? mettre en commun les avanc?es dans les domaines de la conception d'applications exploitant des donn?es spatio-temporelles, de la recherche d'informations ? caract?re ?galement spatio-temporel, ainsi que la production d'information de ce m?me type. Afin d'?tre totalement transversal, le projet vise la d?finition d'une infrastructure logicielle (plateforme) permettant ? tout type de p?riph?rique mobile de capturer des informations contextuelles de nature spatio-temporelles ou pouvant enrichir ces derni?res afin d'augmenter leur pouvoir s?mantique ou de faciliter leur indexation en vue d'une exploitation/recherche ult?rieure par les applications. Sujet ============== Ce post-doctorat se situe dans le cadre du Lot 1 et des travaux sur l'annotation s?mantique et la recherche d'informations. L'objectif du travail de post-doc est de construire et d'exploiter des repr?sentations s?mantiques pour faciliter l'acc?s ? l'information dans des documents textuels. Le domaine d'application vis? est la botanique ; le cas d'?tude sera l'aide ? la gestion du jardin MOSAIC dans l'agglom?ration de Lille. Les probl?matiques visent, d'une part, le rep?rage de fragments d'ontologie en corpus, et d'autre part, l'exploitation d'une ontologie ? des fins d'indexation et de recherche d'information. Le travail comprend plusieurs t?ches : - construction et exploitation d'outils informatiques de Traitement Automatique de la Langue (TAL) et de patrons structurels, lexicaux ou grammaticaux, pour identifier des fragments d'ontologie. - ?laboration d'une ontologie botanique, notamment ? l'aide de ces fragments - construction et exploitation d'outils informatiques d'indexation et de recherche d'information bas?s sur l'ontologie dans des documents textuels. Comp?tences attendues du post-doctorant ========================== Nous recherchons un docteur en informatique ayant, si possible, des comp?tences en traitement automatique des langues, en ontologies, en utilisation de technologies s?mantiques pour l'indexation et la recherche d'information. Environnement de travail ============== Le post-doc sera accueilli dans les deux laboratoires. Il travaillera en collaboration avec Nathalie Aussenac-Gilles (IC3, IRIT) et Marie-Noelle Bessagnet (T2I/LIUPPA). La dur?e du contrat est de 12 mois (d?marrage pr?vu en septembre 2011). Salaire : environ 2000 euros nets Contacts : Nathalie Aussenac-Gilles (IC3, IRIT) et Marie-Noelle Bessagnet (T2I/LIUPPA) ============== Comment candidater : ============== Les candidatures sont ? envoyer d?s que possible et seront ?tudi?es jusqu'? ce que le poste soit pourvu. Envoyer un CV et une lettre de motivation, ainsi que des lettres de recommandation (ou deux noms de personnes susceptibles de recommander le candidat), par courrier ?lectronique ? : aussenac at et : marie-noelle.bessagnet at Nathalie Aussenac-Gilles +33 5 61 55 82 93 IRIT, UPS, 118 Route de Narbonne F-31062 Toulouse Cedex 9 - France Marie-Noelle Bessagnet +33 5 59 40 80 67 LIUPPA - IAE, UPPA, F-64012 Pau Cedex - France ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:45:47 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:45:47 +0200 Subject: Job: Poste d'ATER, 27e section, INSA de Rennes, Date limite pour postuler : 12 septembre 2011 midi Message-ID: Date: Tue, 12 Jul 2011 14:31:35 +0200 (CEST) From: Pascale Sebillot Message-ID: <948726209.1735114.1310473895169.JavaMail.root at> X-url: Un poste d'ATER 27e section Rennes est ouvert ? l'INSA de Rennes pour un recrutement au 1er octobre 2011 (temps plein, soit 192h d'enseignement). Les candidats ont jusqu'au 12 septembre 2011 ? midi pour transmettre leur dossier (cachet de la poste faisant foi). La fiche et le dossier de candidature sont accessibles ? Cordialement, Pascale S?billot ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:52:58 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:52:58 +0200 Subject: Appel: Special issue of Applied Ontology, Ontologies and Terminologies: Continuum or Dichotomy Message-ID: Date: Tue, 12 Jul 2011 17:28:52 +0200 From: Thierry Hamon Message-ID: X-url: X-url: X-url: *** New information on the submission process *** Special issue of Applied Ontology ONTOLOGIES AND TERMINOLOGIES: CONTINUUM OR DICHOTOMY The semantic content of terminologies and ontologies is similar, and so are their applicational contexts, which may introduce a confusion between these two types of resources. Usually, a terminology is defined as a set of terms, which represents the system of concepts for an area and for an application. These terms remain linguistic entities and linguistic information may be associated with them. Term organization is usually not constrained by any formal logics or description, which may lead to problems like cyclicity and redundancy within a terminology. As for ontologies, they are built upon formal specification and constraints and describe also a system of concepts and associated properties for a specific area. They are intended to be used by computers and automatic applications. One may ask whether, in a specific situation, a terminology is sufficient, or whether an ontology is always required. In that respect, terminology and ontology are two complementary resources. However a weak definition of their similarities and differences may confuse the users. The objectives of this special issue is to address various issues related to differences and similarities between ontologies and terminologies, such as: - What are the differences and similarities between ontologies and terminologies? - How various (formal, structural and content) differences between terminologies and ontologies may impact their use, as well as the results provided by automatic systems? - Are terminologies suitable for populating ontologies and to which extent? - Are terminologies the first step when building ontologies? - How should the reuse of terminologies be operated? - What are the various kinds of semantic resources going from dictionaries and terminologies to ontologies, through taxonomies and classifications? - How to decide whether a terminology or an ontology should be exploited in a given situation? - How can multilingual terminologies contribute to the localization of ontologies? - Whether the same approaches may be used for the building of terminologies and ontologies? - Whether ontologies can be (re)used for improving the contents of a terminology and vice versa? - What are model representations and algorithms for the best reuse of terminologies for ontology building? - Are automated approaches suitable for this? This Special Issue of AO addresses these various questions, but is not limited to them. Authors defending various positions and points of view are encouraged to submit to this special issue. IMPORTANT DATES Submissions Deadline September 1st, 2011 Notification to Authors December 15th, 2011 Second Submission Deadline February 15th, 2012 Second Notification March 15th, 2012 Camera-ready Version April 15th, 2012 Special Issue Publication Summer 2012 SUBMISSION PROCESS Submissions should respect the AO format ( Submission site You can find there: * the templates and specifications for the submissions * the submission form In the cover letter, please indicate that you submit to the special issue ONTOLOGIES AND TERMINOLOGIES: CONTINUUM OR DICHOTOMY. GUEST EDITORS Natalia Grabar, CNRS STL UMR 8163, Lille, France Thierry Hamon, LIM&BIO, University Paris 13, Bobigny, France Olivier Bodenreider, NLM/NIH, Bethesda, Maryland, USA SCIENTIFIC COMMITY Nathalie Aussenac, University of Toulouse, France Paul Buitelaar, National University of Ireland, Galway, Ireland Sylvie Despr??s, University Paris 13, Bobigny, France Christiane D. Fellbaum, Princeton University, Princeton, USA Marie-Claude l'Homme, OLST, Universit?? de Montreal, Canada V??ronique Malais??, Elsevier, Content Enrichment Center, Amsterdam, the Netherlands Alessandro Oltramari, Carnegie Mellon University, Department of Psychology, USA Chantal Reynaud, LRI Universit?? Paris-Sud & INRIA Saclay Ile-de-France, France Stefan Schulz, Medical University of Graz, Austria Dagobert S??rgel, Library and Information Studies, University at Buffalo, Buffalo, USA Rita Temmerman, Centre for Terminology and Communication, Departement of Applied Linguistics, Erasmus University College Brussels, Belgium Maria Teresa Pazienza, Dept. of Enterprise Engineering/CERTIA, Universit?? degli Studi di Roma Tor Vergata, Italy Hanne E. Thomsen, Copenhagen Business School, Denmark Susan Thomas, SAP, AG, Germany Anna Tordai, VU University, Amsterdam, the Netherlands Karin Verspoor, University of Colorado School of Medicine, USA Kewen Wang, Griffith University, Australia ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:50:49 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:50:49 +0200 Subject: Appel: Revue TAL, Numero non thematique 53-1 Message-ID: Date: Tue, 12 Jul 2011 15:03:22 +0200 From: Jean-Luc Minel Message-ID: <4E1C461A.9060900 at> X-url: APPEL ? CONTRIBUTIONS REVUE TRAITEMENT AUTOMATIQUE DES LANGUES Num?ro non th?matique 2012 Volume 53 Num?ro 1 Date limite de soumission : 20/11/2011 R?DACTEURS EN CHEF ?ric de la Clergerie (Alpage, INRIA& Universit? Paris 7) B?atrice Daille (LINA, Universit? de Nantes) Yves Lepage (Universit? Waseda, Japon), Jean-Luc Minel (MoDyCo, Universit? Paris Ouest Nanterre La D?fense) TH?MES La revue Traitement automatique des langues lance un appel ? contributions ouvert. Des propositions de soumissions sont encourag?es sur tous les aspects du traitement automatique des langues, y compris (mais non exclusivement) : - pragmatique, discours, s?mantique, syntaxe et lexique ; - phon?tique, phonologie et morphologie ; - analyse et g?n?ration du langage parl? et ?crit ; - mod?les logiques, symboliques et statistiques du langage ; - extraction d'information et fouille de donn?es textuelles ; - traitement multilingue, traduction automatique et aides ? la traduction ; - interfaces en langue naturelle et syst?mes de dialogue ; - interfaces multi-modales ? composantes linguistiques ; - outils et ressources linguistiques ; - ?valuation de syst?mes ; - terminologie, acquisition de connaissances ? partir de textes ; - recherche documentaire ; - linguistique de corpus ; - utilisation d'outils de TAL pour la mod?lisation linguistique ; - enseignement assist?, enseignement des langues ; - applications du TAL. Il est bien s?r important, quel que soit le th?me, que les aspects li?s au traitement automatique des langues soient mis en valeur. LANGUE Les articles sont ?crits en fran?ais ou en anglais. Les soumissions en anglais ne sont accept?es que pour les auteurs non francophones. LA REVUE La revue TAL (Traitement Automatique des Langues, est une revue internationale ?dit?e depuis 1960 par l'ATALA (Association pour le Traitement Automatique des Langues) avec le concours du CNRS. Elle est maintenant publi?e en format ?lectronique, avec acc?s gratuit imm?diat aux articles publi?s, et impression annuelle ? la demande. Cela ne change aucunement son processus de relecture et de s?lection. DATES IMPORTANTES - 15/11/2011 Date limite pour les r?sum?s - 20/11/2011 Date limite de soumission - 15/02/2012 D?cision du comit? - 15/03/2012 Version r?vis?e Publication ? l'automne 2012 FORMAT Les chercheurs ayant l'intention de soumettre une contribution sont invit?s ? prendre contact avec : Jean-Luc Minel jean-luc.minel at Le processus de d?p?t des articles (25 pages environ, format PDF) sera pr?cis? au cours du mois de septembre 2011 Les feuilles de style sont disponibles en ligne sur le site de la revue : COMIT? DE R?DACTION ------------------------------------------------------------------------ CALL FOR PAPERS JOURNAL "TRAITEMENT AUTOMATIQUE DES LANGUES" (TAL) REGULAR ISSUE 2012 Volume 53 Number 1 Deadline for submission: 20th November 2011 CHIEF EDITORS ?ric de la Clergerie (Alpage, INRIA& Universit? Paris 7) B?atrice Daille (LINA, Universit? de Nantes) Yves Lepage (Universit? Waseda, Japon), Jean-Luc Minel (MoDyCo, Universit? Paris Ouest Nanterre La D?fense) CALL FOR PAPERS The TAL journal launches a call for papers for an open issue of the journal. We invite papers in any field of natural language processing, including: - lexicon, syntax, semantics, discourse and pragmatics; - morphology, phonology and phonetics; - spoken and written language analysis and generation; - logical, symbolic and statistical models of language; - information extraction and text mining; - multilingual processing, machine translation and translation tools; - natural language interfaces and dialogue systems; - multimodal interfaces with language components; - language tools and resources; - system evaluation; - terminology, knowledge acquisition from texts; - information retrieval; - corpus linguistics; - use of NLP tools for linguistic modeling; - computer assisted language learning; - applications of natural language processing. Whatever the topic, papers must stress the natural language processing aspects. LANGUAGE Manuscripts may be submitted in English or French. French-speaking authors are requested to submit in French. THE JOURNAL TAL (Traitement Automatique des Langues / Natural Language Processing, ) is a forty year old international journal published by ATALA (French Association for Natural Language Processing) with the support of CNRS (National Centre for Scientific Research). It has moved to an electronic mode of publication, with printing on demand. This affects in no way its reviewing and selection process. IMPORTANT DATES 15/11/2011 Deadline for abstracts 20/11/2011 Deadline for submission 15/02/2012 Notification to authors 15/03/2012 Deadline for submission of revised version Fall 2012 Publication PAPER SUBMISSION Authors who intend to submit a paper are encouraged to contact the chief editors of the journal: Jean-Luc Minel jean-luc.minel at The process to upload contributions (approximately 25 pages, PDF format) will be notify in mid September 2011 Style sheets are available for download at EDITORIAL BOARD ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:58:05 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:58:05 +0200 Subject: ATALA: Attribution du prix de these ATALA Message-ID: Date: Wed, 13 Jul 2011 14:18:27 +0200 From: Anne Vilnat Message-ID: <4E1D8D13.8060107 at> Nous avons le plaisir de vous informer que le premier prix de th?se de l'ATALA a ?t? d?cern? ? Alexandre Patry, pour sa th?se intitul?e "Int?gration du contexte en traduction statistique ? l?aide d?un perceptron ? plusieurs couches", soutenue le 26 Ao?t 2010 ? l'Universit? de Montr?al, pr?par?e sous la direction de Philippe Langlais. Vous trouverez en pi?ce jointe le discours prononc? par Fr?d?rique Segond ? l'occasion de la remise officielle du prix lors de TALN ? Montpellier. Les modalit?s d'attribution y sont d?taill?es. N'h?sitez pas ? soumettre votre (ou ? faire soumettre un) travail de th?se l'an prochain! Fr?d?rique Segond et Anne Vilnat, co-pr?sidentes du jury. ------------------------------------------------------------------------ C'est un v?ritable honneur et un vrai plaisir pour moi, que de d?cerner aujourd?hui ce qui est le premier prix de th?se de l?histoire de l?ATALA. Avant d?aller plus loin et afin de vous tenir en haleine, permettez-moi une petite pause math?matico publicitaire. Cette Edition de taln a vu plus de 200 inscrits c?est un record pour TALN seul. Un grand merci donc ? Mathieu,? Violaine, au LIRMM et a tout le comit? d?organisation pour une si belle r?ussite. On s?en r?jouit tous. J?en viens maintenant aux math?matiques. Parmi les 250 inscrits la moiti? seulement sont adh?rents de l?Atala. Je vous invite donc fortement ? renouveler votre adh?sion a l Atala. L?Atala est l?association structurante de notre communaut?, elle permet l?organisation de TALN, la publication de la revue TAL, les journ?es th?matiques, les bourses pour les ?tudiants, l'Atala prend aussi position sur des sujets qui concernent des d?cisions strat?giques quant ? la recherche et l? enseignement. Oui, l?Atala se bat aussi pour que vous ayez des postes. Et l?Atala a cr?? son prix de th?se. Bref vous avez tous compris qu?adh?rer ? l?Atala c?est pas cher et ?a peut rapporter gros ! La boucle est boucl?e et je reviens ? mes moutons : le premier prix de th?se de l'Atala Il y a des exp?riences, des moments dans la vie qui nous font r?aliser que nous avons vieilli. L'attribution d'un prix en est un. On se retrouve du jour au lendemain debout sur l?estrade mais cette fois on est celui qui d?cerne le prix, pas celui qui re?oit le prix. Souvent, pour ?tre a nouveau celui qui re?oit le prix, il faut attendre encore quelques ann?es pour, dans le meilleur des cas, obtenir le prix pour le couronnement d?une carri?re. Comme la roue tourne, c?est aujourd?hui ? mon tour d'avoir l?honneur d'?tre sur l?estrade pour d?cerner le prix de th?se de l'Atala. Nous avons re?u pour ce nouveau prix 9 candidatures, toutes d?excellente qualit? ce qui a rendu le choix encore plus difficile. Ces th?ses abordaient des th?mes aussi divers que les campagnes d??valuation, le e-learning, la traduction automatique, le traitement de la parole, l?analyse de discours, l anaphore, le r?sum? automatique, la g?n?ration, et proposaient des approches vari?es, allant de la symbolique aux statistiques en passant par les m?thodes hybrides. Une tr?s bonne repr?sentation en quelques sortes du paysage du TAL actuel. Pour attribuer le prix de cette premi?re ?dition le conseil d?administration de l?ATALA a ?lu un comite de s?lection de 14 personnalit?s du monde scientifique francophone, regroupant, dans la mesure du possible les diff?rentes facettes du TAL et ces diff?rents courants actuels. Chaque th?se, ainsi que les rapports qui l?accompagnaient, a ?t? relue par deux membres du comit? de s?lection, un en ?tant le rapporteur principal. Toutes les th?ses ont ensuite ?t? pr?sent?es et discut?es lors d?une r?union d?une demi-journ?e regroupant tous les membres du comit? de s?lection. De fa?on tr?s g?n?rale le comit? de s?lection a jug? les th?ses du point de vue de leur lien avec le TAL, de leur l'originalit?, de la qualit? de la d?marche scientifique de son caract?re novateur de l?importance des retomb?es qu?elles soient m?thodologiques ou pratiques. Ont aussi ?t? pris en consid?ration bien entendu la qualit? des publications auxquelles la th?se a donn? lieu ainsi que la qualit? du document de th?se. Aucun poids n?a ?t? affect? ? ces crit?res et bonne place a ?galement ?t? faite ? la discussion. S?lection oh combien difficile mais il faut designer un gagnant. Gagnant qui je l'esp?re est pr?t ? se lever et courir nous rejoindre Anne et moi-m?me sur le podium. Ainsi, le laur?at du prix de th?se de l?Atala 2011 est Alexandre Patry, de l?universit? de .Montr?al. Pour sa th?se intitul?e ? Int?gration du contexte en traduction statistique ? l?aide d?un perceptron ? plusieurs couches ? Les rapporteurs ont not? que la mod?lisation du contexte en traduction automatique statistique, sujet principal de votre travail, est un probl?me d?licat et relativement peu ?tudi?. Les mod?les de traduction standard ignorent en effet le contexte en langue source pour choisir la traduction d'un mot ou d'un groupe de mot. La solution d?utiliser un perceptron ? plusieurs couches pour pr?dire les mots de la phrase cible ?tant donn? la phrase source enti?re a ?t? jug?e tr?s originale. En effet, votre approche se distingue des travaux connexes r?cents qui reposent soit sur des mod?les de r?gression essentiellement lin?aires, soit sur des mod?les de d?sambigu?sation lexicale plus complexes et donc plus lourds ? mettre en oeuvre. Votre souci de valider votre approche par une ?valuation empirique pouss?e, in vitro sur une t?che de s?lection lexicale, et in vivo sur plusieurs t?ches de traduction automatique, a ?t? mise en avant. Par ailleurs, le comit? de s?lection a ?galement not? que vos travaux ont donn? lieu ? de nombreuses publications dans des conf?rences internationales, revues et ateliers et que le syst?me de traduction d?velopp? a ?t? mis ? la disposition de la communaut? scientifique en code source ouvert. Enfin, le comit? de s?lection a soulign? le souci p?dagogique qui sous-tend l'ensemble de votre th?se. La d?marche est d?crite clairement aussi bien au niveau intuitif que formel, et elle est tr?s bien situ?e dans le vaste panorama des travaux actuels en traduction automatique. Je vous remets donc le prix et vous informe qu?en plus vous avez gagn? le droit, le devoir et l honneur de faire partie du comit? de s?lection du prochain prix de th?se de l Atala ! Au nom du comit? de s?lection du prix de th?se de l?Atala ainsi qu?au nom de tout l?ATALA je vous f?licite chaleureusement et vous souhaite une merveilleuse carri?re de recherche. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 19:59:35 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 21:59:35 +0200 Subject: Revue: Texto ! Textes et Cultures Message-ID: Date: Wed, 13 Jul 2011 15:39:14 +0200 From: "Carine DUTEIL-MOUGEL" Message-ID: <44238743c2641b0ac99d459c54d3dbcd.squirrel at> X-url: Bonjour, La revue Texto ! Textes et Cultures publie son nouveau num?ro coordonn? par C?line POUDAT. Vous trouverez ci-apr?s une petite s?lection. L'int?gralit? des articles est consultable sur : Volume XVI - n?2 (2011). Coordonn? par C?line POUDAT ?TIENNE BRUNET Les bases de donn?es en texte int?gral. R?alisation et diffusion CHARLOTTE DILKS Approches th?oriques : la m?taphore, la s?mantique interpr?tative et la s?mantique cognitive ALAIN HERREMAN Analyser l?analyse, d?crire la description. Une introduction au R?sum? d?une th?orie du langage de L. Hjelmslev BERNARD VOUILLOUX Soup?ons sur l'indice : le syndrome de Benito KATARZYNA WOLOWSKA La virtualisation contextuelle de traits s?mantiques non-actualisation, d?l?tion ou suspension ? Bonne consultation ! CDM ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 13 20:01:26 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Jul 2011 22:01:26 +0200 Subject: Appel: 8th Workshop on Syntax & Semantics (WoSS8) Message-ID: Date: Wed, 13 Jul 2011 15:42:56 +0200 From: G?raldine Walther Message-Id: X-url: [Apologies for cross-postings] ***FIRST CALL FOR PAPERS*** 8th Workshop on Syntax & Semantics (WoSS) November 17th-18th, 2011 Paris, France ***** We invite PhD students to send abstracts for twenty-minute talks followed by a ten-minute discussion or poster presentations on any aspect of theoretical linguistics for the 8th Workshop on Syntax & Semantics (WoSS). WoSS is a series of rotating workshops organized by PhD students from 'neighbouring' universities (see list below) for PhD students working in different domains of generative linguistics, in a broad sense, e.g. syntax, semantics, pragmatics, morphology, phonetics, phonology, language acquisition, computational linguistics, etc. The institutions behind WoSS are: The University of Nantes The University of the Basque Country in Vitoria-Gasteiz (EHU) The Universities of Catalonia (UAB, UB, UPF, URV) The Universities of Paris 3, Paris 7, Paris 8 The Universities of Madrid (IUOG, UAM, UCM) The University of Sienna This year's WoSS is co-organized by University Paris Diderot (Paris 7) and University Paris Vincennes St-Denis (Paris 8), and will take place at the CNRS `Pouchet' building, 59 rue Pouchet, 75017 Paris, on November 17th-18th, 2011. Submission instructions Abstracts must be anonymous and at most two pages long, examples and references included, on an A4 sheet with one-inch (2.54 cm) margins and 12-point Times New Roman font, single spacing. Submissions are limited to one individual and one joint abstract per author, or two joint abstracts per author. The abstracts must be submitted over EasyChair as PDF attachment by the 31th of August. Accepted papers will be presented orally or as posters depending on nature and quality of the work., you may however specifically indicate whether you would like to present your paper rather as an oral presentation or a poster. INVITED SPEAKERS We have the pleasure to announce that the following speakers will be giving an invited talk at WoSS8: Paolo Acquaviva (University College Dublin) Bob Borsley (Univerity of Essex) Philippe Schlenker (ENS-NYU) Important dates: Deadline for submission: August 31, 2011 Notification of acceptance: October 7, 2011 Scientific Committee: Xiaoliang HUANG, Paris 7. Christophe ONAMBELE, Paris 8. Marie PHILIPPE, Paris 8. G?raldine WALTHER, Paris 7. Gr?goire WINTERSTEIN, Paris 7. A WoSS8 website is currently under construction and will be available soon. More informations about previous WoSS can be found at: If you have any questions, please contact us at: woss8paris at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 15 18:19:44 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jul 2011 20:19:44 +0200 Subject: Appel: Document numerique, Resume Automatique de Documents, extension de la date de soumission Message-ID: Date: Wed, 13 Jul 2011 23:53:08 +0200 From: Abdelmajid BEN HAMADOU Message-ID: X-url: X-url: ------------------------------------------------------------------------ Appel ? publication pour un num?ro sp?cial de *Document num?rique* sur le th?me : R?sum? Automatique de Documents Date limite de soumission ?tendue au : 15/09/2011 Th?matique Dans ce num?ro nous souhaitons particuli?rement investir les th?mes suivants (liste non exhaustive) : - R?sum? automatique de documents simples - R?sum? automatique de documents multiples - Approches statistiques pour le r?sum? - Approches linguistiques pour le r?sum? - R?sum? de documents multim?dia - Techniques de r?vision des r?sum?s - ?valuation des syst?mes de r?sum? - R?sum? multilingue Objectif A l?heure o? les documents num?riques disponibles et ?chang?s entre les individus prolif?rent, il devient impossible d?acc?der aux contenus sans disposer d?outils informatiques qui les r?sument tout en pr?servant les id?es qu?ils v?hiculent. Ce num?ro sp?cial vise ? regrouper des recherches qui traitent la probl?matique du r?sum? automatique sous toutes ses facettes. Il vise ? apporter un ?clairage sur les questions : ? Comment peut-on rep?rer les id?es cl?s dans un document ? ? Comment peut-on synth?tiser l'information r?partie sur de multiples documents ? ? Comment peut-on pr?server la coh?rence et la coh?sion du r?sum? produit ? ? Peut-on appliquer les m?mes approches utilis?es pour r?sumer les textes aux documents multim?dias (vid?o et audio) ? ? Comment ?valuer la qualit? d?un r?sum? automatique?? Comit? de r?daction du num?ro Delphine Battistelli, Universit? Paris Sorbonne Lamia Belguith, FSEG-Sfax, Tunisie *Abdelmajid Ben Hamadou,* ISIM, Sfax, Tunisie Philippe Blache, Universit? de Provence, Aix-en-Provence Rim Faiz, IHEC, Tunis, Tunisie Brigitte Grau, ENSIIE, Ivry, France Guy Lapalme, Universit? de Montr?al Abderrafih Lehmam, Minng Essential, France Jean-Luc Minel, MoDyCo, Universit? Paris Ouest Nanterre La D?fense - CNRS Thierry Poibeau ? LaTTiCe-CNRS, France Horacio Saggon, Universitat Pompeu Fabra, Barcelona Juan-Manuel Torres Moreno ? Universit? d?Avignon Calendrier - date limite remise contributions : 15/09/2011 - r?ponse aux auteurs : 15/11/2011 - version finale auteurs : 31/12/2011 - livraison ?diteur : 15/01/2012 - parution du num?ro sp?cial : F?vrier 2012 L'?diteur et la revue : Recommandations aux auteurs ? Les soumissions sont ? envoyer ? Revue.ResumeAutomatique at ci-dessous) et devront respecter la feuille de style de la revue disponible sur le serveur (ou sur demande ? : dn at ? Les articles ne devront pas d?passer les 20-30 pages. Ils sont accept?s en fran?ais (ou en anglais pour les auteurs non francophones). ? les soumissions peuvent ?tre envoy?es sous forme de fichiers PDF (de pr?f?rence). ? les versions finales seront accept?es sous format word ou PDF. Dans ce dernier cas, les corrections ortho-typographiques seront faites par les auteurs ? la demande de l??diteur. Contact Abdelmajid BEN HAMADOU ISIMS, Laboratoire MIRACL, P?le technologique, Sakiet-EZZIT BP 242, Sfax 3021, Tunisie T?l. : 0021698608919, e-mail : Abdelmajid.benhamadou at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 15 18:30:00 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jul 2011 20:30:00 +0200 Subject: Livre: Logic and Grammar (A. Lecomte Festchrift) Message-ID: Date: Fri, 15 Jul 2011 19:05:28 +0200 From: retore Message-Id: <8BDFAB67-B40E-4511-903D-FD222BD36F18 at> X-url: Logic and grammar Essays Dedicated to Alain Lecomte on the Occasion of His 60th Birthday Pogodalla, Sylvain; Quatrini, Myriam; Retor?, Christian (Eds.) Springer LNCS 6700 This book contains selected papers from the Colloquium in Honor of Alain Lecomte, held in Pauillac, France, in November 2007. The event was part of the ANR project "Pr?lude" (Towards Theoretical Pragmatics Based on Ludics and Continuation Theory), the proceedings of which were published in another FoLLI-LNAI volume (LNAI 6505) edited by Alain Lecomte and Samuel Tron?on. The selected papers of this Festschrift volume focus on the scientific areas in which Alain Lecomte has worked and to which he has contributed: formal linguistics, computational linguistics, logic, and cognition. Preface by the editors Bare Nouns in Predicate Position in French Claire Beyssade Covert Movement in Logical Grammar Carl Pollard Categorial Grammars and Minimalist Grammars Richard Moot Minimalist Grammars and Minimalist Categorial Grammars: Toward Inclusion of Generated Languages Maxime Amblard Minimalist Grammars in the Light of Logic Sylvain Salvati Good Types Are Useful for Learning Isabelle Tellier and Daniela Dudau-Sofronie Dialogues in Ludics Marie-Ren?e Fleury, Myriam Quatrini, and Samuel Tron?on ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 15 18:25:55 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jul 2011 20:25:55 +0200 Subject: Revue: Discours 8, 2011, Approches fonctionnelles de la structuration des textes Message-ID: Date: Thu, 14 Jul 2011 12:16:58 +0200 From: "laure.sarda at" Message-ID: X-url: Sorry for multiple posting (English version below) ****************************************** Nous sommes tr?s heureux d?annoncer la publication de DISCOURS 8 |2011 * * *Approches fonctionnelles de la structuration des textes* Num?ro th?matique Coordination scientifique : Laure Sarda, Shirley Carter-Thomas & Benjamin Fagard. Coordination ?ditoriale : Mai Ho-Dac & Catherine Bolly Le num?ro propose une s?lection d'articles pr?sent?s au colloque LPTS?09 (Linguistic and Psycholinguistic approaches to Text Structuring), organis? ? Paris en septembre 2009. Au sommaire : - *Laure Sarda, Shirley Carter-Thomas et Benjamin Fagard* Pr?sentation du num?ro [Texte int?gral] - *Graham Ranger* *Surely not!* Between certainty and disbelief [Texte int?gral] - *Paul Isambert* What?s on the left? [Texte int?gral] - *Evelyne Oppermann-Marsaux* Les emplois du marqueur discursif ? di va ? en ancien fran?ais [Texte int?gral] - *Constanze Armbrecht* Les structures argumentatives de la locution adverbiale polyvalente *jusqu?? un certain point* [Texte int?gral] - *Christiane Marque-Pucheu* Contribution des trois emplois de *? la fin* ? la structuration du discours : le temporel, l?aspectuel, le ? reformulatif ? [Texte int?gral] - *Tuija Virtanen* Discourse-level structuring of information in narrative: Signalling structural, interactional and cognitive shifts [Texte int?gral] - *Aur?lie Welcomme* Marqueurs cadratifs temporels et argumentatifs dans les r?cits d?apprenants n?erlandophones de fran?ais L2 [Texte int?gral] *Temporal framing and argumentative markers in the narratives of Dutch learners of French as a second language* Nous vous souhaitons une bonne lecture et nous vous invitons par ailleurs ? soumettre ? tout moment pour les num?ros ? para?tre. Consultez les modalit?s de soumission . Le comit? de r?daction ************************************************************************ We are pleased to announce the publication of the 8th issue of DISCOURS : DISCOURS 8 |2011 *Functional Approaches to Text Structuring/ Approches fonctionnelles de la structuration des textes* Special issue, edited by: Laure Sarda, Shirley Carter-Thomas & Benjamin Fagard. Coordination : Mai Ho-Dac & Catherine Bolly This special issue offers a selection of papers presented at the LPTS?09 conference (Psycholinguistics and Linguistic Approaches to Text Structuring), held in Paris in September 2009. - You can read the following articles: *Laure Sarda, Shirley Carter-Thomas et Benjamin Fagard* Pr?sentation du num?ro [Texte int?gral] - *Graham Ranger* *Surely not!* Between certainty and disbelief [Texte int?gral] - *Paul Isambert* What?s on the left? [Texte int?gral] - *Evelyne Oppermann-Marsaux* Les emplois du marqueur discursif ? di va ? en ancien fran?ais [Texte int?gral] - *Constanze Armbrecht* Les structures argumentatives de la locution adverbiale polyvalente *jusqu?? un certain point* [Texte int?gral] - *Christiane Marque-Pucheu* Contribution des trois emplois de *? la fin* ? la structuration du discours : le temporel, l?aspectuel, le ? reformulatif ? [Texte int?gral] - *Tuija Virtanen* Discourse-level structuring of information in narrative: Signalling structural, interactional and cognitive shifts [Texte int?gral] - *Aur?lie Welcomme* Marqueurs cadratifs temporels et argumentatifs dans les r?cits d?apprenants n?erlandophones de fran?ais L2 [Texte int?gral] *Temporal framing and argumentative markers in the narratives of Dutch learners of French as a second language* We hope you enjoy the issue. For information on submission procedures see The editorial board ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 15 18:33:42 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Jul 2011 20:33:42 +0200 Subject: Appel: Special Issue of the I3 Journal on Information Mining and Retrieval on the Web Message-ID: Date: Fri, 15 Jul 2011 18:14:07 +0100 From: "Rim FAIZ" Message-ID: <002501cc4312$9b0af280$d120d780$@Faiz at> X-url: Call for papers ? Special issue of the ?Information Intelligence and Interaction? I3 Journal ------------------------------------------------------------------------ Special issue on ?Information Mining and Retrieval on the Web? ------------------------------------------------------------------------ Important dates: --------------------- Submission deadline: September 15, 2011 Notification date: October 31, 2011 Authors final version: November 25, 2011 Publication of special issue: December 2011 Focus of the special issue -------------------------------- This special issue aims to bring together researchers from both communities, Information Retrieval and Data Mining, working around the problems of Information mining and retrieval on the web. The development of Web 2.0 has led to the proliferation of tools for internet users to interact directly on the Web content through, annotations, reviews, comments, opinions.... The content of Web pages is no longer a static text or a fixed image, but also a user-generated data (blogs, twitter?). This fact has led to the emergence of new problems related to the analysis, mining, searching and visualizing information. The objective of this special issue is to provide a framework for researchers from both communities to exchange views and experiences on Information mining and retrieval issues (web page, annotations, blogs, queries). Papers describing theoretical aspects, prototype systems, tools and techniques and applications, as well as future directions are welcome. Topics may include, but are not limited to the following list: - Information mining and retrieval on the web - Queries Analysis and Mining on the Web - Search and Mining in blogs - Opinion Detection on the Web - Folksonomy (annotation/social indexing) - Social information mining and retrieval - Temporal information retrieval, mining and extraction Submission details ----------------------- Manuscripts should be written in English and prepared for publication in accordance with the following instructions: The length of the paper is limited to 30 pages. Submissions should be sent in pdf format to Rim.Faiz at Papers will be evaluated based on their originality, presentation as well as relevance and contribution to the field of Information mining and retrieval on the web. All papers will be rigorously refereed by 3 peer reviewers. Submission of a manuscript to this special issue implies that no similar paper is already accepted or will be submitted to any other conference or journal. Guest Editor ---------------- Rim Faiz, University of Carthage, IHEC, LARODEC, Tunisia E-mail : Rim.Faiz at Program Committee -------------------------- Abdelmajid Ben Hamadou, University of Sfax, ISIMS, MIRACL, Tunisia Mohand Boughanem, University of Paul Sabatier, IRIT, France Sylvie Calabretto, INSA of Lyon, LIRIS, France Rim Faiz, University of Carthage, IHEC, LARODEC, Tunisia Patrick Gallinari, University of Paris 6, Lip6, France Faiez Gargouri, University of Sfax, ISIMS, Tunisia Eric Gaussier, University of Joseph Fourrier Grenoble, LIG, France Mathias G?ry, University of Saint Etienne, Laboratory Hubert Curien, France Mohand-Said Hacid, University Claude Bernard of Lyon 1, LIRIS, France Lamia Hadrich Belguith, University of Sfax, FSEGS, MIRACL, Tunisia Gabriella Pasi, University of Milan Bicocca, Italy Jean-Marc Petit, LIRIS, INSA of Lyon, France Philippe Mulhem, Ecole Nationale Sup?rieure des Mines de Saint-?tienne, CNRS, LIG, France Maguelonne Teisseire, TETIS, Maison de la T?l?d?tection, Montpellier, France Mohamed Tmar, Universit? de Sfax, ISIMS, MIRACL, Tunisia ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 19:59:34 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 21:59:34 +0200 Subject: Appel: LATA 2012 Message-ID: Date: Sun, 17 Jul 2011 09:43:02 +0200 From: "Carlos Mart?n Vide" Message-ID: X-url: ********************************************************************* 1st Call for Papers 6th INTERNATIONAL CONFERENCE ON LANGUAGE AND AUTOMATA THEORY AND APPLICATIONS LATA 2012 A Coru?a, Spain March 5-9, 2012 ********************************************************************* AIMS: LATA is a yearly conference in theoretical computer science and its applications. Following the tradition of the International Schools in Formal Languages and Applications developed at Rovira i Virgili University in Tarragona since 2002, LATA 2012 will reserve significant room for young scholars at the beginning of their career. It will aim at attracting contributions from both classical theory fields and application areas (bioinformatics, systems biology, language technology, artificial intelligence, etc.). VENUE: LATA 2012 will take place in A Coru?a, at the northwest of Spain. The venue will be the Faculty of Computer Science, University of A Coru?a. SCOPE: Topics of either theoretical or applied interest include, but are not limited to: - algebraic language theory - algorithms for semi-structured data mining - algorithms on automata and words - automata and logic - automata for system analysis and programme verification - automata, concurrency and Petri nets - automatic structures - cellular automata - combinatorics on words - computability - computational complexity - computational linguistics - data and image compression - decidability questions on words and languages - descriptional complexity - DNA and other models of bio-inspired computing - document engineering - foundations of finite state technology - foundations of XML - fuzzy and rough languages - grammars (Chomsky hierarchy, contextual, multidimensional, unification, categorial, etc.) - grammars and automata architectures - grammatical inference and algorithmic learning - graphs and graph transformation - language varieties and semigroups - language-based cryptography - language-theoretic foundations of artificial intelligence and artificial life - parallel and regulated rewriting - parsing - pattern recognition - patterns and codes - power series - quantum, chemical and optical computing - semantics - string and combinatorial issues in computational biology and bioinformatics - string processing algorithms - symbolic dynamics - symbolic neural networks - term rewriting - transducers - trees, tree languages and tree automata - weighted automata STRUCTURE: LATA 2012 will consist of: - 3 invited talks - 2 invited tutorials - peer-reviewed contributions INVITED SPEAKERS: To be announced PROGRAMME COMMITTEE: Eric Allender (Rutgers) Miguel ?. Alonso (A Coru?a) Amihood Amir (Bar-Ilan) Dana Angluin (Yale) Franz Baader (Dresden) Patricia Bouyer (Cachan) John Case (Delaware) Volker Diekert (Stuttgart) Paul Gastin (Cachan) Reiko Heckel (Leicester) Sanjay Jain (Singapore) Janusz Kacprzyk (Warsaw) Victor Khomenko (Newcastle) Bakhadyr Khoussainov (Auckland) Claude Kirchner (Paris) Maciej Koutny (Newcastle) Salvador Lucas (Valencia) Sebastian Maneth (Sydney) Carlos Mart?n-Vide (Tarragona, chair) Giancarlo Mauri (Milano Bicocca) Aart Middeldorp (Innsbruck) Faron Moller (Swansea) Angelo Montanari (Udine) Joachim Niehren (Lille) Mitsunori Ogihara (Miami) Enno Ohlebusch (Ulm) Dominique Perrin (Marne-la-Vall?e) Alberto Policriti (Udine) Alexander Rabinovich (Tel Aviv) Mathieu Raffinot (Paris) J?rg Rothe (D?sseldorf) Olivier H. Roux (Nantes) Yasubumi Sakakibara (Keio) Eljas Soisalon-Soininen (Aalto) Frank Stephan (Singapore) Jens Stoye (Bielefeld) Howard Straubing (Boston) Masayuki Takeda (Kyushu) Wolfgang Thomas (Aachen) Sophie Tison (Lille) Jacobo Tor?n (Ulm) Tayssir Touili (Paris) Esko Ukkonen (Helsinki) Frits Vaandrager (Nijmegen) Manuel Vilares (Vigo) Todd Wareham (Newfoundland) Pierre Wolper (Li?ge) Hans Zantema (Eindhoven) Thomas Zeugmann (Sapporo) ORGANIZING COMMITTEE: Miguel ?. Alonso (A Coru?a, co-chair) Adrian Horia Dediu (Tarragona) Carlos G?mez Rodr?guez (A Coru?a) Jorge Gra?a (A Coru?a) Carlos Mart?n-Vide (Tarragona, co-chair) Bianca Truthe (Magdeburg) Jes?s Vilares (A Coru?a) Florentina Lilica Voicu (Tarragona) SUBMISSIONS: Authors are invited to submit papers presenting original and unpublished research. Papers should not exceed 12 single-spaced pages (including eventual appendices) and should be formatted according to the standard format for Springer Verlag's LNCS series (see Submissions have to be uploaded at: PUBLICATIONS: A volume of proceedings published by Springer in the LNCS series will be available by the time of the conference. A special issue of a major journal will be later published containing peer-reviewed extended versions of some of the papers contributed to the conference. Submissions to it will be by invitation. REGISTRATION: The period for registration will be open since July 16, 2011 until March 5, 2012. The registration form can be found at the website of the conference: Early registration fees: 500 Euro Early registration fees (PhD students): 400 Euro Late registration fees: 540 Euro Late registration fees (PhD students): 440 Euro On-site registration fees: 580 Euro On-site registration fees (PhD students): 480 Euro At least one author per paper should register. Papers that do not have a registered author who paid the fees by December 5, 2011 will be excluded from the proceedings. Fees comprise access to all sessions, one copy of the proceedings volume, coffee breaks and lunches. PhD students will need to prove their status on site. PAYMENT: Early (resp. late) registration fees must be paid by bank transfer before December 5, 2011 (resp. February 24, 2012) to the conference series account at Uno-e Bank (Juli?n Camarillo 4 C, 28037 Madrid, Spain): IBAN: ES3902270001820201823142 ? Swift/BIC code: UNOEESM1 (account holder: Carlos Martin-Vide ? LATA 2012; address: Av. Catalunya, 35, 43002 Tarragona, Spain). Please write the participant?s name in the subject of the bank form. Transfers should not involve any expense for the conference. People claiming early registration will be requested to prove that they gave the transfer order to the bank by the deadline. On-site registration fees can be paid only in cash. A receipt for payments will be provided on site. Besides paying the registration fees, it is required to fill in the registration form at the website of the conference. IMPORTANT DATES: Paper submission: October 7, 2011 (23:59h, CET) Notification of paper acceptance or rejection: November 18, 2011 Final version of the paper for the LNCS proceedings: November 27, 2011 Early registration: December 5, 2011 Late registration: February 24, 2012 Starting of the conference: March 5, 2012 Submission to the post-conference special issue: June 9, 2012 FURTHER INFORMATION: florentinalilica.voicu at POSTAL ADDRESS: LATA 2012 Research Group on Mathematical Linguistics Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 20:01:41 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 22:01:41 +0200 Subject: Appel: 7th Asian Information Retrieval Societies (AIRS2011) Message-ID: Date: Mon, 18 Jul 2011 10:38:53 +0200 From: info at Message-ID: <4E23F11D.6080804 at> X-url: **Apologies for cross postings. Please redistribute to other interested parties** ------------------------------------------------------------------------ SECOND CALL FOR PAPERS The Seventh Asia Information Retrieval Societies Conference (AIRS 2011) December 18th -20th, 2011 Dubai (United Arab Emirates) NEW SUBMISSION DUE: July 27th, 2011 ------------------------------------------------------------------------ The Asia Information Retrieval Societies Conference (AIRS) aims to bring together researchers and developers to exchange new ideas and latest achievements in the field of information retrieval (IR). The scope of the conference covers applications, systems, technologies and theory aspects of information retrieval in text, audio, image, video, and multimedia data. The AIRS 2011 welcomes submissions of original papers in the broad field of information retrieval. Technical issues covered include, but are not limited to the following: 1. IR Models and Theories 2. User Study, IR Evaluation, and Interactive IR 3. Web IR, Scalability, and Adversarial IR 4. Multimedia IR 5. NLP for IR (eg. Cross-/Multi- Language IR, Question Answering, Summarization, Information Extraction) 6. Machine Learning and Data Mining for IR (eg. Learning to Rank, Classification, Clustering) 7. IR Applications (eg. Digital Libraries, Vertical Search, Mobile IR) 8. Arabic-Script based IR 9. Cross Language IR IMPORTANT DATES * Submission Due: July 27th, 2011 * Notification of acceptance: Sept 1st, 2011 * Camera-ready due: Sept 17th , 2011 * Registration: November 1st, 2011 * AIRS2011: December 18th-20th SUBMISSION INSTRUCTIONS The AIRS 2011 proceedings will be published as an LNCS volume, so please follow the default author instructions available at . In addition, please anonymize your paper to facilitate blind reviewing, and make sure your paper is no longer than 12 pages in the LNCS format. Submissions that do not follow these guidelines will be rejected unconditionally. Duplicate submissions (the same paper being submitted to AIRS 2011 and to another conference at the same time) are strictly forbidden; if detected, these submissions will be unconditionally rejected. Program Committee Chair Khaled Shaalan, British University in Dubai khaled.shaalan at Conference Co-Chairs Mohamed Val Salem, University of Wollongong in Dubai MohamedSalem at Farhad Oroumchian, University of Wollongong in Dubai FarhadOroumchian at Publicity Chair Asma Damankesh, University of Wollongong in Dubai AsmaDamankesh at Abolfazl AleAhmad, University of Tehran a.aleahmad at Publication Chair Kathy Shen, University of Wollongong in Dubai Dr. Azadeh Shakery, University of Tehran AREA CHAIRS Arabic Script text Processing and Retrieval Ali Farghaly, Oracle, USA IR Models and Theories Minjie Zhang, University of Wollongong, Australia Multimedia IR Joemon M Jose, University of Glasgow, UK User Study, IR Evaluation, and Interactive IR Tetsuya Sakai, Microsoft Research Asia Web IR, scalability and adversarial IR Min Zhang, Tsinghua University, China IR Applications Kazunari Sugiyama, National University of Singapore, Singapore Machine learning for IR Tie-Yan Liu, Microsoft Research Asia Natural Language Processing for Information retrieval Chia-Hui Chang, National Central University, Taiwan ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 20:02:50 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 22:02:50 +0200 Subject: Info: ELRA receives the META Prize at the META-FORUM 2011 in Budapest Message-ID: Date: Mon, 18 Jul 2011 14:37:19 +0200 From: info at Message-ID: <4E2428FF.3050704 at> X-url: X-url: Press Release - Immediate Paris, France, July 18, 2011 *ELRA receives the META Prize at the META-FORUM 2011 in Budapest* During the META-FORUM 2011 which took place in Budapest (Hungary) on June 27-28, 2011, ELRA, a world-wide leading player providing Language Resources-related services to the HLT community, has received the META Prize for "Outstanding long-term commitment to the preparation and distribution of language resources and technologies". The Prize is shared with Linguistic Data Consortium (LDC). The META-NET Prize is awarded by the META-NET Technology Council, a 30 members committee from HLT R&D and industry executives and managers. *** About ELRA *** The European Language Resources Association (ELRA) is a world-wide leading player in language resource distribution, sharing and production. ELRA provides services to the language communities related to distribution and production of resources, including production on demand, technology evaluation and benchmarking. ELRA organizes LREC, the major international conference devoted to language resources and evaluation, with over 1,200 attendees from academia and industry. The next LREC edition will be held in Istanbul in 2012. To find out more about ELRA, please visit our web site: *** About Meta *** META, the Multilingual Europe Technology Alliance brings together researchers, commercial technology providers, private and corporate language technology users, language professionals and other information society stakeholders. To find out more about META, please visit the web site: Contact : Helene Mazo, mazo at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 20:08:37 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 22:08:37 +0200 Subject: Appel: TALN'2012 (JEP-TALN-RECITAL), 4 au 8 juin, Grenoble Message-ID: Date: Mon, 18 Jul 2011 11:54:23 +0200 From: Herv? Blanchon Message-Id: <1E2DF3F0-7552-4D6E-824A-6836B045D6BE at> PREMIER APPEL ? COMMUNICATIONS TALN'2012 19e conf?rence sur le Traitement Automatique des Langues Naturelles Grenoble du 4 au 8 juin 2012 CALENDRIER - Articles LONGs : - Date limite de soumission : 24 janvier 2012 - Notification aux auteurs : 1 mars 2012 - Date limite de soumission des versions d?finitives : 15 avril 2012 - Articles COURTs et D?monstrations : - Date limite de soumission : 15 mars 2012 - Notification aux auteurs : 15 avril 2012 - Date limite de soumission des versions d?finitives : 20 avril 2012 PR?SENTATION Organis?e par l'?quipe GETALP du LIG (Laboratoire Informatique de Grenoble), le LIDILEM (Laboratoire de linguistique et didactique des langues ?trang?res et maternelles) et le d?partement DPC du Gipsa-lab, la conf?rence TALN'2012 se tiendra du 4 au 8 juin 2012 ? Grenoble ? l'occasion de la conf?rence jointe JEP-TALN-RECITAL'2012. JEP-TALN-RECITAL'2012 regroupe la 29?me ?dition des Journ?es d'?tude sur la Parole (JEP'2012), la 19?me ?dition de la conf?rence sur le Traitement Automatique des Langues Naturelles (TALN'2012) et la 14?me ?dition des Rencontres des ?tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL'2012). Pour la quatri?me fois, apr?s Nancy en 2002, F?s en 2004, et Avignon en 2008, l'AFCP (Association Francophone pour la Communication Parl?e) et l'ATALA (Association pour le Traitement Automatique des Langues) organisent conjointement leur principale conf?rence afin de r?unir en un seul lieu les deux communaut?s du traitement de la langue orale et ?crite. La conf?rence TALN'2012 comprendra des communications orales et affich?es, des conf?rences invit?es et des ateliers. La langue officielle de la conf?rence est le fran?ais. Les communications en anglais sont accept?es pour les participants non-francophones. TYPES DE COMMUNICATIONS Deux formats de communications sont pr?vus : les articles longs (de 10 ? 12 pages) et les articles courts (de 4 ? 6 pages). Les auteurs sont invit?s ? pr?senter deux types de communications : - des articles pr?sentant des travaux de recherche originaux, - des prises de position pr?sentant un point de vue sur l'?tat des recherches en TAL (traitement automatique de la langue), fond?es sur une solide exp?rience du domaine. Les articles longs seront pr?sent?s sous forme de communication orale, les articles courts sous forme de poster. TH?MES Les communications pourront porter sur tous les th?mes habituels du TAL, incluant, de fa?on non limitative : - Analyse et g?n?ration dans les domaines suivants : - Phon?tique - Phonologie - Morphologie - Syntaxe - S?mantique - Discours - D?veloppement de ressources linguistiques pour le TAL : - Bases de donn?es comportant des informations morphologiques, syntaxiques, s?mantiques, et/ou phonologiques - Grammaires - Lexiques - Ontologies - Linguistique de corpus - Applications du TAL : - Analyse de sentiments ou d'opinions - Cat?gorisation ou classification automatique - D?sambigu?sation lexicale - Dialogue homme-machine en langage naturel - Enseignement assist? par ordinateur - Indexation automatique - Recherche et extraction d'information - R?sum? automatique - R?solution d'anaphores - Syst?mes de question-r?ponse - Traduction automatique - Web s?mantique - Approches: - Linguistiques formelles destin?es ? soutenir les traitements automatiques - Symboliques - Logiques - Statistiques - Bas?es sur l'apprentissage automatique -Prises de position pr?sentant un point de vue sur le TAL CRIT?RES DE S?LECTION Les soumissions seront examin?es par au moins deux sp?cialistes du domaine. Pour les travaux de recherches, seront consid?r?es en particulier : - l'ad?quation aux th?mes de la conf?rence. - l'importance et l'originalit? de la contribution, - la correction du contenu scientifique et technique, - la discussion critique des r?sultats, en particulier par rapport aux autres travaux du domaine, - la situation des travaux dans le contexte de la recherche internationale, - l'organisation et la clart? de la pr?sentation, Pour les prises de position, seront privil?gi?es : - la largeur de vue et la prise en compte de l'?tat de l'art, - l'originalit? et l'impact du point de vue pr?sent?. Les articles s?lectionn?s seront publi?s dans les actes de la conf?rence. Le comit? de programme s?lectionnera parmi les communications accept?es un article (prix TALN) pour recommandation ? publication (dans une version ?tendue) dans la revue Traitement Automatique des Langues (Revue TAL). MODALIT?S DE SOUMISSION Les articles seront r?dig?s en fran?ais pour les francophones, en anglais pour ceux qui ne ma?trisent pas le fran?ais. Une feuille de style LaTeX et un mod?le Word seront disponibles sur le site web (? venir) de la conf?rence. Contact : herve.blanchon at et Georges.Antoniadis at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Jul 19 20:13:15 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Jul 2011 22:13:15 +0200 Subject: Journee: Ateliers de formation, reeducation orthophonique LSVT, Rappel Message-ID: Date: Tue, 19 Jul 2011 17:32:27 +0200 From: Jo?lle Lavaud Message-Id: < at> X-url: Cher(e) coll?gue, La prochaine formation ? la technique de r??ducation orthophonique LSVT (Lee Silvermann Voice Treatment) aura lieu ? Aix-en-Provence, les 29 et 30 ao?t 2011 prochains, ? la Maison M?diterran?enne des Sciences de l'Homme (5 rue du Ch?teau de l'Horloge, BP 647, 13094 Aix-en-Provence). Pour vous inscrire et t?l?charger le formulaire de pr?sentation, veuillez cliquez le lien suivant : la participation ? cette formation vous permettra d'obtenir le certificat validant votre future pratique de la LSVT. Pour plus d'informations, n'h?sitez pas ? nous contacter: serge.pinto at A tr?s bient?t ? Aix-en-Provence, ------------------------------------------------------------------------ Serge Pinto Laboratoire Parole et Langage 5 avenue Pasteur - BP 80975 F - 13604 Aix-en-Provence cedex 1 T?l: +33 (0)4 42 95 36 23 Mob: +33 (0)6 50 56 87 13 email: serge.pinto at email2: serge.pinto at ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 22 20:01:44 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Jul 2011 22:01:44 +0200 Subject: Ecole: FSFLA 2011 Message-ID: Date: Thu, 21 Jul 2011 13:33:49 +0200 From: "Carlos Mart?n Vide" Message-ID: X-url: ********************************************************************* 2011 INTERNATIONAL FALL SCHOOL IN FORMAL LANGUAGES AND APPLICATIONS FSFLA 2011 (formerly International PhD School in Formal Languages and Applications) Tarragona, Spain October 31 ? November 4, 2011 Organized by: Research Group on Mathematical Linguistics Rovira i Virgili University ********************************************************************* ADDRESSED TO: Undergraduate and graduate students from around the world. Most appropriate degrees include: Computer Science and Mathematics. Other students (for instance, from Linguistics, Electrical Engineering, Molecular Biology or Logic) are welcome too provided they have a good background in discrete mathematics. The School is appropriate also for people more advanced in their career who want to keep themselves updated on developments in the field. There will be no overlap in the schedule of the courses. The previous event was SSFLA 2011 ( COURSES AND PROFESSORS: - Franz Baader (Technische Dresden), Reasoning in Description Logics [intermediate, 6 hours] - Manfred Droste (Leipzig), Weighted Automata and Weighted Logic [introductory/advanced, 8 hours] - Max H. Garzon (Memphis), DNA Codeword Design and DNA Languages [introductory/intermediate, 10 hours] - Venkatesan Guruswami (Carnegie Mellon), The Complexity of Approximate Constraint Satisfaction [intermediate, 6 hours] - Tao Jiang (California Riverside), Average-case Analysis and Lower Bounds by the Incompressibility Method [intermediate, 6 hours] - Michael Moortgat (Utrecht), Type-logical Grammars: Expressivity, Parsing Complexity [introductory/advanced, 8 hours] - Helmut Seidl (Technische M?nchen), Macro Treetransducers for XML Processing [intermediate, 6 hours] - Alan Selman (Buffalo), Probabilistic Complexity Classes [intermediate, 10 hours] - Jeffrey Shallit (Waterloo), Automatic Sequences, Decidability, and Enumeration [intermediate, 6 hours] SCHOOL PAPER: On a voluntary basis, within 6 months after the end of the School, students will be expected to draft an individual or jointly-authored research paper on a topic covered during the classes under the guidance of the lecturing staff. REGISTRATION: It has to be done on line at FEES: They are variable, depending on the number of courses each student takes. The rule is: 1 hour = - 10 euros (for payments until July 31, 2011), - 15 euros (for payments after July 31, 2011). The fees must be paid to the School's bank account: Uno-e Bank (Julian Camarillo 4 C, 28037 Madrid, Spain): IBAN: ES3902270001820201823142 ? Swift/BIC code: UNOEESM1 (account holder: Carlos Martin-Vide GRLMC; account holder's address: Av. Catalunya, 35, 43002 Tarragona, Spain) Please mention FSFLA 2011 and your full name in the subject. A receipt will be provided on site. Bank transfers should not involve any expense for the School. For early reduced rates, please notice that the date that counts is the date of the arrival of the fees to the School?s account. People registering on site at the beginning of the School must pay in cash. For the sake of local organization, however, it is much recommended to complete the registration and the payment earlier. ACCOMMODATION: Information about accommodation is available on the website of the School. CERTIFICATES: Students will be delivered a certificate stating the courses attended, their contents, and their duration. Those participants who will choose to be involved in a research paper will receive an additional certificate at the completion of the task, independently on whether the paper will finally get published or not. IMPORTANT DATES: Announcement of the programme: June 4, 2011 Starting of the registration: June 4, 2011 Early registration deadline: July 31, 2011 Starting of the School: October 31, 2011 End of the School: November 4, 2011 QUESTIONS AND FURTHER INFORMATION: Lilica Voicu: florentinalilica.voicu at WEBSITE: POSTAL ADDRESS: FSFLA 2011 Research Group on Mathematical Linguistics Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34-977-559543 Fax: +34-977-558386 ACKNOWLEDGEMENTS: Diputaci? de Tarragona Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 22 20:05:26 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Jul 2011 22:05:26 +0200 Subject: Info: Journee ATALA entites nommees, Communications en ligne Message-ID: Date: Wed, 20 Jul 2011 10:10:16 +0200 (CEST) From: Denis Maurel Message-ID: <1652971701.157841.1311149416249.JavaMail.root at mail10> X-url: Journ?e ATALA sur les entit?s nomm?es : Les communications (orales et posters) pr?sent?es le lundi 20 juin 2011, lors de la journ?e ATALA sur les Entit?s Nomm?es (Nouvelles Fronti?res et Nouvelles Approches), sont disponibles ? l'adresse suivante : Cette journ?e a ?t? organis?e par le LI, Universit? Fran?ois Rabelais Tours, avec le soutien de l'Universit? Paris Sorbonne (Institut des Sciences Humaines Appliqu?es). Jean-Yves Antoine Nathalie Friburger Denis Maurel Damien Nouvel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 22 20:13:00 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Jul 2011 22:13:00 +0200 Subject: Sujet de these: These CIFRE, Construction d'ontologies et de reseaux semantiques types Message-ID: Date: Wed, 20 Jul 2011 10:32:51 +0200 From: Guillaume Cleuziou Message-ID: <4E2692B3.3030800 at> X-url: Bonjour, Vous trouverez ci-dessous une proposition de sujet de th?se sur la construction d'ontologies et de r?seaux s?mantiques typ?s ? partir d'analyse de corpus textuels et application ? l'analyse et la construction de repr?sentation s?mantique du texte applicatif. Il s'agit d'un contrat CIFRE entre l'entreprise Orange R&D (Lannion) et le LIFO (universit? d'Orl?ans) ? partir du mois d'octobre 2011. Envoyer les candidatures (CV+lettre de motivation+notes) d?s maintenant ? : edmond.lassalle at et guillaume.cleuziou at Merci de diffuser cette annonce largement. Cordialement, Guillaume Cleuziou Ma?tre de Conf?rences --- Assistant Professor IUT d'Orl?ans, D?partement Informatique LIFO Tel LIFO : (+33) (0)2 38 49 25 91 Tel IUT : (+33) (0)2 38 49 44 59 guillaume.cleuziou at ------------------------------------------------------------------------ Th?se (h/f) : Construction d'ontologies et de r?seaux s?mantiques typ?s ? partir d'analyse de corpus textuels et application ? l'analyse et la construction de repr?sentation s?mantique du texte applicatif Lannion France d?partement France T?l?com Orange est un des principaux op?rateurs de t?l?communications au monde. Le Groupe sert ainsi plus de 182 millions de clients sur les cinq continents, dont les deux tiers sous la marque Orange. Les Orange Labs constituent le r?seau mondial d'innovation du Groupe France Telecom Orange. Cr?es en 2006, ils regroupent 3800 chercheurs r?partis au sein de 18 laboratoires sur 4 continents. La R&D est source principale d'innovation pour le Groupe avec plus de 8500 brevets ? son actif, contribuant ? d?velopper la nouvelle g?n?ration de services de communications int?gr?s, innovants et simples d'utilisation. Le Centre de R&D Technologies a pour mission de permettre ? Orange de faire en avance de phase les bons choix technologiques en s'appuyant sur sa forte expertise et sur sa connaissance de l'?cosyst?me industriel et acad?mique. Votre r?le La qualit? des donn?es s?mantiques et leur utilit? en Recherche d'Informations d?pendent du type d'applications, de la granularit? des informations trait?es. Pour des applications de moteur de recherche classique, o? la granularit? d'information correspond au document, les techniques de mot-cl?s associ?s ? des mesures de fr?quence d'occurrence ont fait la preuve d'un bon compromis entre la performance, la robustesse et la pr?cision. Pour des fonctionnalit?s ? granularit? plus fine (reformulation, Question/R?ponse, titrage, recherche agr?g?, pervasivit?...), une repr?sentation appropri?e de l'information trait?e est plut?t de nature s?mantique. La th?se se place dans le domaine de l'extraction d'informations fines ? partir de donn?es textuelles. Il s'agit d'une ?tude exploratoire traitant les difficult?s cit?es pr?c?demment et de montrer qu'une fois r?solues, il est possible de r?aliser des applications de recherche d'informations avanc?es, ce tr?s rapidement et ? un faible co?t, et corr?lativement de pourvoir en d?ployer ? plus grande ?chelle. L'objectif de la th?se porte sur la technologie avanc?e en apprentissage et sur les mod?les de calcul permettant d'exploiter le r?sultat de l'apprentissage. Il s'agit d'acqu?rir les donn?es s?mantiques et linguistiques ? partir de corpus de texte et donc d'extraire de ces corpus d'apprentissage le maximum d'informations s?mantiques et linguistiques tout en minimisant l'apport initial de connaissances (approche hybride). Il s'agira aussi de d?finir la technologie d'analyse de d?pendance en aval et de ne s'int?resser ? des donn?es linguistiques et s?mantiques apprises en ad?quation avec le m?canisme d'analyse de phrases. Le r?sultat ?proof of concept? (PoC) attendu est la conception et la r?alisation d'une maquette incluant des technologies permettant l'acquisition de donn?es s?mantiques et linguistiques, la mise en ?uvre d'une m?canique d'analyse et de construction de structures de d?pendance, la mise en ?uvre d'une application de recherche d'informations fines et, ? travers l'application, la preuve de la facilit? de r?aliser toute fonctionnalit? applicative, lors que les deux difficult?s cit?es ont ?t? trait?es. Il s'agit essentiellement de faire converger les technologies de traitement linguistique traditionnel et celles d'apprentissage statistique, ce de mani?re fine pour ?viter les probl?mes de biais statistique constat?s trop souvent dans les mod?les hybrides connus. L'approche envisag?e s'articule en deux parties. La premi?re, en terme d'apprentissage hybride, vise ? extraire automatiquement des relations s?mantiques typ?es ? partir d'une analyse de d?pendance dans les phrases, et d'une structuration des groupes nominaux autour des verbes. Pour ce faire, l'obstacle majeur est de mettre en ?uvre des grammaires de chunking d?velopp?es en interne (outil de traitement linguistique des textes) mais adapt?es ? des analyses de grands volumes de donn?es avec des performances correctes dans ce contexte d'analyse (travail hors th?se). Une structuration des syntagmes autour des verbes, une analyse de r?gularit? des verbes visent ensuite une abstraction de ces derniers dans un comportement pr?dicatif uniforme (par exemple regrouper les notions acheter, acqu?rir ...) Dans la seconde partie de construction de la structure de d?pendance, l'analyse elle-m?me ne serait pas r?alis?e par des r?gles de grammaires de d?pendance mais plut?t sur un calcul d'entropie ? partir des distributions probabilistes observ?es pour chaque mot dans l'?tape d'analyse de coccurrences. Elle consiste ? d?finir une construction de l'arbre de d?pendance. Une d?marche pressentie est de recourir ? l'extraction d'un arbre maximal recouvrant ? partir d'un graphe de relations s?mantiques repr?sentant potentiellement la phrase analys?e. Ce type d'analyse n?cessite d'avoir des donn?es s?mantiques annot?es de poids probabilistes. Un dernier volet dans la structuration du r?seau est relatif ? la construction d'ontologie. Les travaux du LIFO ? partir de structuration pr?topologique pr?sente ? ce titre un axe de recherche prometteur et ? explorer dans le cadre de la th?se. Le travail prendra aussi en compte la possibilit? d'alimenter le syst?me par des connaissances s?mantiques a priori et devra ?valuer leur impact sur la qualit? des r?sultats. Dans une optique de supervision humaine a posteriori, ces connaissances pourraient provenir d'une session ant?rieure d'apprentissage et auraient ?t? r?vis?es manuellement avant d'?tre r?inject?es dans le syst?me. votre profil Etudiant niveau Bac+5 ? Master 2 Comp?tences souhait?es : - Apprentissage, acquisition automatique de donn?es par des mod?les hybrides - Traitement automatique du langage naturel - Recherche d'informations - Programmation en C/C++ Contrat Th?se Localisation du poste : Lannion (22307) Contact : edmond.lassalle at Contact : regine.angoujard at ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Jul 22 20:15:16 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Jul 2011 22:15:16 +0200 Subject: Appel: SPMRL2011, 2nd Workshop on Statistical Parsing of Morphologically-Rich Languages Message-ID: Date: Wed, 20 Jul 2011 11:36:54 +0200 From: DJam? Seddah Message-Id: <094FEB4B-EF3C-4009-9CFB-BF4AC1B7E12D at> X-url: ** Apologies for cross-posting ** ====================================================================== FINAL CALL FOR PAPER: Second Workshop on Statistical Parsing of Morphologically Rich Languages (SPMRL 2011) ( Collocated with IWPT 2011, October 5-7, 2011, ( ) ====================================================================== IMPORTANT DATES ------------ Submission deadline: July 31, 2011 (PDT, GMT-8) . Notification to authors: September 5, 2011 Camera ready copy: September 20, 2011 Workshop: October 6, 2011 ====================================================================== IMPORTANT NOTE ------------ Alongside the usual themes of the SPMRL workshop, this year's event will feature a special theme on the objective and the design of a shared task on parsing MRLs. See further details below. ====================================================================== PRESENTATION --------- Since the advent of large syntactically annotated corpora, statistical parsing has been a cornerstone of research in NLP. While Penn Treebank parsing performance, be it dependency-based or constituency-based, seems to have reached a high plateau, the same cannot be said of other languages, data sets and domains. Statistical parsing of morphologically-rich languages (MRLs) has repeatedly been shown to exhibit a plethora of nontrivial challenges, including sparse lexica in the face of rich inflectional systems, parsing deficiency in the face of free word order and tree- bank annotation idiosyncrasies in the face of morphosyntactic interactions. Recent studies on parsing languages such as German, Arabic, Hebrew or French using newly available treebanks contribute to our understanding of the extent of the difficulty that such phenomena pose when reusing parsing models initially designed to parse English. Beyond the technical and linguistic difficulties, the lack of communication between researchers working on different MRLs can lead to a reinventing the wheel syndrome. Following the warm reception of the first SPMRL workshop at NAACL-HLT 2010, the second SPMRL workshop aims to build upon the success of the first and offer a platform to this growing community of interests. We solicit papers describing parsing experiments with models and architectures for languages with morphological structure richer than English, or studies that address the lexical sparseness challenges (for any language). In order to provide a realistic indication of the performance of parsing systems on unstructured and unanalyzed data, we particularly encourage contributions reporting parsing results for non-gold as well as gold morphological analysis of the test data, before or jointly with the parser. The areas of interest of the second SPMRL workshop include, but are not limited to, the following list of topics: * Parsing models and architectures that explicitly integrate morphological analysis and parsing * Parsing models and architectures that focus on lexical coverage and the handling of OOV words either by incorporating linguistic knowledge or through the use of unsupervised/semi-supervised learning techniques * Cross-language and cross-model comparison of models' strength and weaknesses in the face of particular linguistic phenomena (e.g. morphosyntactic characteristics, degree of word-order freedom ...) * Comprehensive analyses of the strengths and weaknesses of various parsing models on particular linguistic (e.g. morphosyntactic) phenomena with respect to variation in tagsets, annotation schemes and additional data transformations This year's SPMRL workshop will feature a special theme concerning the Shared Task on Statistical Parsing of MRLs. Following the panel discussion in previous events we intend the first shared task on parsing MRLs to take place in 2012 and we now solicit position papers that aim to discuss the goals, scope, design, expected contributions and desired outcomes of such a shared task. The accepted papers will be included in the SPMRL proceedings. In addition we plan to hold a panel discussion in which we expect to discuss a range of relevant topics including (but not limited to) cross-language parse representation, cross-annotation evaluation, MRLs-specific architectural concerns, and so on. We aim to use this panel discussion to help us devise a set of clearly defined objectives for the 2012 shared task and to make concrete decisions about practicalities such as scope, size, representation, languages, evaluation, etc. SUBMISSION ------ Authors are invited to submit long papers (up to 9 pages + references) and short papers (up to 5 pages + references). Long papers should describe unpublished, substantial and completed research. Short papers should be position papers, papers describing work in progress or short, focused contributions. Papers will be accepted until July 25, 2011, (PDT, GMT-8) in PDF format via the START system : Submitted papers must follow the styles and the formating guidelines available from the last ACL-HLT recommendations ( As the reviewing will be blind, the paper must not include the authors' names and affiliations. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ..." must be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ..." Papers that do not conform to these requirements will be rejected without review. In addition, please do not post your submissions on the web until after the review process is complete. PROGRAM COMMITTEE ---------- Marie Candito, Yoav Goldberg, Jennifer Foster, Ines Rehbein, Djam? Seddah, Lamia Tounsi, Reut Tsarfaty, Yannick Versley REVIEW COMMITTEE ---------------- Mohammed Attia (Dublin City University, Ireland) Bernd Bohnet (University of Stuttgart, Germany) Adriane Boyd (Ohio State University, US) Marie Candito (University of Paris 7, France) Ozlem Cetinoglu (Dublin City University, Ireland) Grzegorz Chrupala (Saarland University, Germany) Benoit Crabb? (University of Paris 7, France) Jennifer Foster (Dublin City University, Ireland) Josef van Genabith (Dublin City University, Ireland) Yoav Goldberg (Ben Gurion University, Israel) Deirdre Hogan (Dublin City University, Ireland) Samar Husan (Inter. Institute of Information Technology, India) Sandra K?bler (Indiana University, US) Jonas Kuhn (University of Stuttgart, Germany) Alberto Lavelli (FBK-irst, Italy) Joseph Le Roux (Universit? de la M?dit?rran?e, France) Wolfgang Maier (University of T?bingen, Germany) Yuval Marton (IBM Watson Resarch Center, US) Takuya Matsuzaki (University of Toyko, Japan) Yusuke Miyao (University of Toyko, Japan) Joakim Nivre (Uppsala University, Sweden) Owen Rambow (Columbia University) Ines Rehbein (Saarland University, Germany) Kenji Sagae (University of Southern California, US) Benoit Sagot (Inria Rocquencourt, France) Djam? Seddah (University of Paris Sorbonne, France) Nicolas Stroppa (Google Research Zurich, Switzerland) Lamia Tounsi (Dublin City University, Ireland) Reut Tsarfaty (Uppsala University, Sweden) Yannick Versley (University of T?bingen, Germany) ORGANIZERS ------- Djam? Seddah, Universit? Paris-Sorbonne Reut Tsarfaty, Uppsala University Jennifer Foster, Dublin City University DISCUSSION PANEL ----- Topic: Designing a MRL parsing shared task CONTACTS ------- website: mail: spmrl2011 at SPONSORS ----- This workshop is sponsored by SIGPARSE and by the INRIA's Alpage project. ====================================================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 27 10:02:34 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 27 Jul 2011 12:02:34 +0200 Subject: Conf: SFC 2011, 28-30 septembre 2011, Orleans Message-ID: Date: Sun, 24 Jul 2011 19:20:46 +0200 From: Guillaume Cleuziou Message-ID: <4E2C546E.6050504 at> X-url: ================= Appel ? Inscription et Participation ================= Pour vous inscrire et participer ? la conf?rence SFC'2011 : XVIII?mes Rencontres de la Soci?t? Francophone de Classification du 28 au 30 septembre 2011 ? Orl?ans Contact email : sfc2011 at Site Web : ----------------- Dates importantes ----------------- Inscription : d?s maintenant Apr?s le 31 juillet 2011 : augmentation des tarifs de 10% ----------------- Chercheurs invit?s ----------------- Radim Belohlavek : Prof. Universit? de Palacky (R?publique Tch?que) G?rard Govaert : Prof. Universit? de Technologie de Compi?gne (France) Christian Sohler : Prof. Universit? de Dortmund (Allemagne) ----------------- Programme ----------------- La liste des articles s?lectionn?s par le comit? de programme est disponible sur le site des rencontres : Au plaisir de vous accueillir prochainement ? Orl?ans. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 27 10:07:05 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 27 Jul 2011 12:07:05 +0200 Subject: Job: CDD, Ingenierie dans la thematique TAL, CEA List Message-ID: Date: Tue, 26 Jul 2011 04:10:17 +0000 From: CANET Geraud 200968 Message-ID: <637ECBE01CC9AA4FB94B408CCE98AEE5015583 at> Bonjour, Veuillez trouver ci-dessous une offre d'emploi pour le CEA List. Les activit?s du CEA LIST sont centr?es sur les syst?mes ? logiciel pr?pond?rant. Ces activit?s s?articulent autour de trois th?matiques pr?sentant de forts enjeux soci?taux et ?conomiques : les Syst?mes Embarqu?s (architectures et conception de syst?mes, m?thodes et outils pour la s?ret? des logiciels et des syst?mes, syst?mes de vision intelligents), les Syst?mes Interactifs (ing?nierie de la connaissance, robotique, r?alit? virtuelle et interfaces sensorielles) et les Capteurs et le traitement du signal (instrumentation et m?trologie des rayonnements ionisants, capteurs ? fibre optique, contr?le non destructif). Le CEA LIST m?ne ses recherches en partenariat avec les grands acteurs industriels du nucl?aire, de l?automobile, de l?a?ronautique, de la d?fense et du m?dical pour ?tudier et d?velopper des solutions innovantes adapt?es ? leurs besoins. Il r?alise une recherche qui va du concept de syst?me jusqu?au d?monstrateur, contribuant au transfert de technologies et ? l?innovation par l??mergence de nouvelles entreprises. Le Laboratoire Vision et Ing?nierie des Contenus du CEA LIST m?ne des recherche sur l'analyse et l'interpr?tation de donn?es multim?dia. Ses 50 ing?nieurs et chercheurs couvrent quatre th?matiques scientifiques permettant d?aborder des domaines en pleine croissance et ? large diffusion : - Fusion Multim?dia pour l?indexation et la recherche de donn?es multim?dia - Traitement Automatique des Langues pour la recherche d'informations et les applications OSINT ( Watch and Open Source Intelligence) - La perception 3D pour les application de contr?le industriel (reconstruction 3D) et les applications de r?alit? augment?e (Localisation 3D) - Analyse Vid?o pour les syst?mes d?assistance vid?o (monitoring de personnes fragiles, syst?mes d'aide ? la conduite, vid?o-protection) Dans le cadre de plusieurs projets en cours dans la th?matique "Traitement Automatique des Langues", le laboratoire recherche un ing?nieur pour assister les chercheurs du laboratoire dans la conception et l'impl?mentation de divers modules logiciels, dont notamment un outil d'?tude de similarit? entre des textes ?crits en plusieurs langues. Le candidat devra poss?der une bonne ma?trise du d?veloppement en C++ sous Linux (base de code install?e de plusieurs centaines de milliers de lignes). Par ailleurs, une connaissance des techniques du TAL (Traitement Automatique des Langues) ou des techniques d'apprentissage et de classification (SVM, CRF, etc.) sera consid?r?e comme un point positif. Le poste offert est un CDD de 18 mois bas? sur le plateau de Palaiseau-Saclay (91) -- G?raud Canet CEA List 01 46 54 82 59 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Jul 27 10:04:49 2011 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 27 Jul 2011 12:04:49 +0200 Subject: Appel: LTC 2011 Message-ID: Date: Sun, 24 Jul 2011 00:20:39 +0200 (CEST) From: ltc at (Language and Technology Conference) Message-Id: <20110723222039.3620DA0001 at> Dear Colleagues, We kindly remind you that the deadline for submissions to the 5th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, November 25-27, 2011, Pozna??, Poland (LTC'2011) is <<>>. The complete updated information about this event is to be found at In case of further questions, please do not hesitate to write an e-mail to ltc at (The deadline for the LTC satellite workshop on Less-Resourced Languages (LRL 2011) is September 5.) Best regards LTC Organizers ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : English version : Archives : La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : -------------------------------------------------------------------------