From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:06:49 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:06:49 +0100 Subject: Appel: MULTICONF-09 Message-ID: Date: Sat, 1 Nov 2008 13:31:10 -0400 From: "Henry Dawson" Message-ID: <71ed09fa0811011031j51fea1b4p31672140905c0f70 at mail.gmail.com> X-url: http://www.PromoteResearch.org MULTICONF-09 call for papers The 2009 Multi Conference in Computer Science, Information Technology and Control systems and Computational Science and Computer Engineering (MULTICONF-09) (website: http://www.PromoteResearch.org ) will be held during July 13-16 2009 in Orlando, FL, USA. We invite draft paper submissions. The event consists of the following conferences: · International Conference on Artificial Intelligence and Pattern Recognition (AIPR-09) · International Conference on Automation, Robotics and Control Systems (ARCS-09) · International Conference on Bioinformatics, Computational Biology, Genomics and Chemoinformatics (BCBGC-09) · International Conference on Enterprise Information Systems and Web Technologies (EISWT-09) · International Conference on High Performance Computing, Networking and Communication Systems (HPCNCS-09) · International Conference on Information Security and Privacy (ISP-09) · International Conference on Recent Advances in Information Technology and Applications (RAITA-09) · International Conference on Software Engineering Theory and Practice (SETP-09) · International Conference on Theory and Applications of Computational Science (TACS-09) · International Conference on Theoretical and Mathematical Foundations of Computer Science (TMFCS-09) The website http://www.PromoteResearch.org contains more details. Sincerely Henry Dawson Publicity committee ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:09:04 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:09:04 +0100 Subject: Habilitation: Thierry Poibeau, Des mots au texte. Analyse semantique pour l'acces a l'information Message-ID: Date: Mon, 03 Nov 2008 22:31:36 +0100 From: Thierry.Poibeau at lipn.univ-paris13.fr Message-ID: <20081103223136.0tyeqdh4wccgsg44 at intranet.lipn.univ-paris13.fr> X-url: http://www.univ-paris13.fr/upn/accesv.htm# X-url: http://www-lipn.univ-paris13.fr/~poibeau/ Bonjour, J'ai le plaisir de vous inviter à la soutenance de mon Habilitation à Diriger des Recherches intitulée "Des mots au texte. Analyse sémantique pour l'accès à l'information" (résumé ci-dessous), ainsi qu'au pot qui suivra. La soutenance aura lieu le mercredi 26 novembre 2008 à partir de 10h15, dans la salle L322 de l'université Paris 13 (pour se rendre à l'université Paris 13 : cf. http://www.univ-paris13.fr/upn/accesv.htm# ; la salle se trouve dans le bâtiment numéroté L2 sur le plan accessible depuis le site de l'Université -- attention : la salle L322 est située au sein du laboratoire LPMTM et non au LIPN) Cordialement, Thierry Poibeau ------ Laboratoire d'Informatique de Paris-Nord CNRS UMR 7030 et Université Paris 13 99, avenue Jean-Baptiste Clément 93430 Villetaneuse http://www-lipn.univ-paris13.fr/~poibeau/ Tel. +33 (0)1 49 40 28 26 Fax. +33 (0)1 48 26 07 12 ______________ Composition du jury : Catherine Fuchs (CNRS-Lattice, rapporteur) Benoît Habert (ENS-LSH, rapporteur) Maria Teresa Pazienza (U. Rome tor Vergata, rapporteur) Michel Denis (CNRS-LIMSI) Daniel Kayser (U. Paris 13) Adeline Nazarenko (U. Paris 13) Pierre Zweigenbaum (CNRS-LIMSI) ______________ Des mots au texte Analyse sémantique pour l'accès à l'information Résumé Pourquoi est-il si difficile de comprendre une langue de manière automatique, même si on ne vise qu'une compréhension limitée, factuelle et orientée vers des faits connus ? La langue, telle qu'elle s'offre à nous, semble trop malléable pour être directement appréhendable par ordinateur. C'est pourtant à ce problème que je me suis intéressé : comment identifier du semblable dans des productions langagières si variées, comment repérer des fragments de signification au milieu d'un océan de textes ? Mon mémoire d'Habilitation se compose de quatre chapitres. Je reviens tout d'abord sur certains développements récents de la linguistique informatique, pour montrer que la disponibilité de gros corpus a entraîné une forte opérationnalisation du domaine. Cette évolution n'est pas neutre théoriquement : je pense que l'apport des corpus et des techniques d'acquisition dynamique de connaissances (notamment par les techniques d'apprentissage) rend tout à fait plausible l'idée d'une sémantique fondée sur l'usage. Les trois chapitres suivants portent chacun sur un niveau d'analyse différent (niveau lexical pour l'annotation sémantique, niveau prédicatif pour l'extraction de relations, niveau textuel pour la modélisation de documents spécialisés). Je défends l'idée d'un continuum entre ces niveaux, du fait notamment que tous partagent des similarités fondamentales, ce qui peut se manifester parfois de manière très visible et influer sur les techniques utilisées. Je reviens, dans la conclusion, sur les similitudes observées entre ces différents paliers : la question de la relation entre mots et concepts, les bords flous des catégories envisagées, leur grande variabilité sur le plan linguistique. Je m'interroge sur le lien entre traitement automatique des langues (TAL) et linguistique, avant de proposer quelques perspectives permettant de poursuivre ce travail par d'autres chemins. ------ >From Words to Text, Semantic Analysis for Information Access Abstract Why is it so difficult to automatically understand a language even when what is targeted is only a limited kind of understanding, based on known facts? A key reason is the great variability in language, which is too challenging for a computer. This is the problem I try to tackle: how to identify similar meanings among different expressions? How to identify fragments of meaning in a sea of texts? This thesis consists of four chapters. I first consider recent developments in computational linguistics: I show that the availability of large corpora has resulted in more functional Natural Language Processing (NLP). This evolution carries the potential of a major impact on theory: corpora and automatic acquisition of knowledge from corpora (especially using machine learning techniques) makes it possible to get semantics based on language use. Each of the next three chapters deals with a different level of analysis (lexical semantics for semantic annotation, predicative semantics for relation extraction, and text semantics for technical document modelling). I suggest the idea of a continuum between these levels, since they all share fundamental similarities that affect the techniques used. I emphasize, in the conclusion, the similarities between these three different levels: the complex problem of the relations between words and concepts, the fuzziness of linguistic categories, the great variability of language. I conclude with a discussion on the relationship between NLP and linguistics, before proposing future research through alternative routes. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:11:13 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:11:13 +0100 Subject: Seminaire: Alpage (P. Muller), 10 novembre 2008 Message-ID: Date: Tue, 4 Nov 2008 12:39:41 +0100 From: Benoit Crabbé Message-Id: X-url: http://alpage.inria.fr/seminaire.fr.html X-url: http://li.linguist.jussieu.fr ******************* Séminaire Alpage ******************* Séminaire de l'école doctorale de Paris 7 Il s'agit du séminaire de recherche en linguistique informatique organisé par l'équipe Alpage, Alpage est une nouvelle équipe mixte Inria -- Paris 7 issue de la fusion des équipes Atoll et Talana. L'équipe centre ses intérêts scientifiques autour de l'analyse syntaxique automatique et du traitement du discours pour la langue française. Ce séminaire remplace l'ancien séminaire Talana. Il se tient le lundi de ***14.00*** à ***16.00*** tous les 15 jours. Il a lieu en salle 131 au 30 rue du Chateau des Rentiers 75013 Paris (premier étage) Toute personne intéressée est la bienvenue. ************************************************************* Lundi 10 novembre 2008, Philippe Muller (Irit) nous parlera de : "La cérémonie de commémoration du 11 novembre aura lieu le dimanche 12 novembre" Méthodologies pour une étude empirique de l'information temporelle en langage naturel Résumé : --------------------- Les informations de nature temporelle jouent un rôle important dans la compréhension d'un texte en langage naturel. Après avoir mobilisé beaucoup de chercheurs sur le plan théorique, ce n'est que récemment que ce problème a suscité des travaux visant à son automatisation dans des cadres empiriques plus systématiques. Le développement de la norme TimeML pour l'annotation de l'anglais a entraîné un effort dans la spécification des représentations de cette information. Cela concerne l'identification des dates et des événements d'un texte, établir une date et une durée pour les événements, l'ordonnancement des événements, et la résolution en contexte de références sous-spécifiées. L'information temporelle pose cependant un certain nombre de problèmes méthodologiques au-delà d'un simple problème d'extraction d'information. Nous présenterons notamment les problèmes que pose l'évaluation des liens entre événements, une information qui concerne un texte dans son ensemble, et les moyens de l'aborder. ----------------------- Page web du séminaire : http://alpage.inria.fr/seminaire.fr.html Cursus Linguistique informatique de Paris 7 : http://li.linguist.jussieu.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:14:20 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:14:20 +0100 Subject: Appel: EACL 2009 Workshop on Cognitive Aspects of Computational Language Acquisition Message-ID: Date: 04 Nov 2008 11:56:12 +0000 From: Thierry Poibeau Message-ID: X-url: http://www.cam.ac.uk/cs/email/scanner/ X-url: http://www-lipn.univ-paris13.fr/~poibeau/cognitive/ X-url: http://www.eacl2009.gr/conference/authors 2nd Call for Papers EACL 2009 Workshop on COGNITIVE ASPECTS OF COMPUTATIONAL LANGUAGE ACQUISITION 30 or 31 March 2009 Athens, Greece http://www-lipn.univ-paris13.fr/~poibeau/cognitive/ ----------------------------------------------- Workshop Description ==================== This workshop is focused on the relevance of computational learning methods for research on human language acquisition. Developing and applying such computational techniques that can improve our understanding of human language acquisition will not only benefit cognitive sciences in general, but will also reflect back to NLP and place us in a better position to develop useful language models. The workshop aims to bring together researchers from the diverse fields of NLP, machine learning, artificial intelligence, (psycho)linguistics, etc. who are interested in the relevance of computational techniques for understanding human language learning. The workshop is intended to bridge the gap between the computational and cognitive communities, promote knowledge and resource sharing, and help initiate interdisciplinary research projects. Success in this type of research requires close collaboration between NLP and cognitive scientists. To this end, interdisciplinary workshops can play a key role in advancing existing and initiating new research. This was demonstrated by some successful events like the previous edition of this workshop held at ACL 2007. Areas of interest ================= Papers are invited on, but not limited to, the following topics: - Computational learning theory and analysis of language learning - Computational models of human (first, second and bilingual) language acquisition - Computational models of various aspects of language acquisition, and their interaction with each other - Computational models of the evolution of language - Data resources and tools for investigating computational models of human language acquisition - Empirical and theoretical comparisons of the learning environment and its impact on the acquisition task - Computational methods for acquiring various linguistic information (related to e.g. speech, morphology, lexicon, syntax, semantics, and discourse) and their relevance to research on human language acquisition - Investigations and comparisons of supervised, unsupervised and weakly-supervised methods for learning (e.g. machine learning, statistical, symbolic, biologically-inspired, active learning, various hybrid models) from the cognitive aspect Papers can cover one or more of these areas. Submission Information ====================== Papers should describe original work and should indicate the state of completion of the reported results. In particular, any overlap with previously published work should be clearly mentioned. Submissions will be judged on correctness, novelty, technical strength, clarity of presentation, usability, and significance/relevance to the workshop. Submissions should follow the two-column format of the EACL 2009 main-conference proceedings and should not exceed eight (8) pages, including references. We strongly recommend the use of either the LaTeX style file or the Microsoft-Word Style file, which can be found at http://www.eacl2009.gr/conference/authors. The reviewing will be blind. Therefore, the paper should not include the authors' names and affiliations. Furthermore, self- citations and other references that could reveal the author's identity should be avoided. Submission will be electronic. The only accepted format for submitted papers is Adobe PDF. Papers must be submitted no later than December 19, 2008 using the submission webpage that will be available soon. Submissions will be reviewed by 3 members of the Program Committee. Authors of accepted papers will receive guidelines regarding how to produce camera-ready versions of their papers for inclusion in the EACL workshop proceedings. Notification of receipt will be emailed to the contact author. Important Dates =============== - Paper submission deadline: 19 December 2008 - Acceptance notification sent: 30 January 2009 - Final version deadline: 13 February 2009 - Workshop date: 30 or 31 March 2009 Workshop Chairs =============== - Thierry Poibeau (CNRS and University Paris 13, France) - Afra Alishahi (University of Saarland, Germany)) - Aline Villavicencio (Federal University of Rio Grande do Sul, Brazil and University of Bath, UK) Address any queries regarding the workshop to: cognitive2009 at gmail.com Program Committee ================= - Colin J Bannard (Max Planck Institute for Evolutionary Anthropology, Germany) - Marco Baroni (University of Trento, Italy) - Robert C. Berwick (Massachusetts Institute of Technology, USA) - Jim Blevins (University of Cambridge, UK) - Rens Bod (University of Amsterdam, Netherlands) - Antal van den Bosch (Tilburg University, The Netherlands) - Chris Brew (Ohio State University, USA) - Ted Briscoe (University of Cambridge, UK) - Robin Clark (University of Pennsylvania, USA) - Stephen Clark (University of Oxford, UK) - Matthew W. Crocker (Saarland University, Germany) - James Cussens (University of York, UK) - Walter Daelemans (University of Antwerp, Belgium and Tilburg University, The Netherlands) - Ted Gibson (Massachusetts Institute of Technology, USA) - Henriette Hendriks (University of Cambridge, UK) - Julia Hockenmaier (University of Illinois at Urbana-Champaign, USA) - Marco Idiart (Federal University of Rio Grande do Sul, Brazil) - Mark Johnson (Brown University, USA) - Aravind Joshi (University of Pennsylvania, USA) - Anna Korhonen (University of Cambridge, UK) - Alessandro Lenci (University of Pisa, Italy) - Massimo Poesio (University of Trento, Italy) - Brechtje Post (University of Cambridge, UK) - Ari Rappoport (The Hebrew University of Jerusalem, Israel) - Dan Roth (University of Illinois at Urbana-Champaign, USA) - Kenji Sagae (University of Southern California, USA) - Sabine Schulte im Walde (University of Stuttgart, Germany) - Mark Steedman (University of Edinburgh, UK) - Suzanne Stevenson (University of Toronto, Canada) - Patrick Sturt (University of Edinburgh, UK) - Bert Vaux (University of Wisconsin, USA) - Charles Yang (University of Pennsylvania, USA) - Menno van Zaanen (Macquarie University, Australia) - Michael Zock (LIF, CNRS, Marseille, France) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:04:31 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:04:31 +0100 Subject: Job: Stage post-doctoral, projet PICARTEXT Message-ID: Date: Sat, 01 Nov 2008 13:27:22 +0100 From: christophe rey Message-Id: <7.0.1.0.1.20081101132225.06e25528 at u-picardie.fr> X-url: http://www.u-picardie.fr/LESCLaP/ X-url: http://www.u-picardie.fr/LESCLaP/rey/index.html OFFRE D'EMPLOI : STAGE POST-DOCTORAL Intitulé du poste : Stage post-doctoral pour le projet PICARTEXT Début du contrat : Janvier 2009 Annonceur : LESCLaP, Université de Picardie Jules Verne Type de poste proposé : Stage Post Doctoral, Université de Picardie, Amiens (France) Employeur : LESCLaP, Université de Picardie Jules Verne http://www.u-picardie.fr/LESCLaP/ Lieu du stage post-doctoral : Amiens, France Durée du stage proposé : 1 an, renouvelable 2 fois Thématiques de recherches du stage : Linguistique générale et Linguistique informatique Salaire : 1800 euros net Description de l'emploi : Dans le cadre du projet de recherche PICARTEXT financé par le Conseil Régional de Picardie, le laboratoire LESCLaP dirigé par le Professeur Jean-Michel Eloy souhaite recruter sous la forme d'un stage post-doctoral d'une durée d'un an renouvelable deux fois, une personne titulaire d'un doctorat en Linguistique. Le projet mentionné vise la création, le développement, l'implémentation et la préparation à l'exploitation d'une base de données textuelle en langue picarde avoisinant les 20 millions de mots. La personne recrutée dans le cadre de ce stage aura à sa charge les aspects structuration, implémentation et préparation à l'exploitation de la base. Elle devra ainsi disposer d'une formation en Linguistique avec une solide expérience dans le traitement automatique de la langue. Les compétences exigées pour cet emploi relèvent donc de l'informatique linguistique et se traduisent à la fois par une bonne culture linguistique et une expérience indispensable de la manipulation de langages de programmation (C++, PHP, etc.), des bases de données (SQL, ACCES) et des langages de modélisation (XML, CSS, etc.). Adresse d'envoi des candidatures : Les candidats intéressés doivent adresser un curriculum vitae et un dossier de candidature à l'adresse suivante : LESCLaP, Faculté des Lettres- chemin du Thil - 80025 Amiens (France) Toute candidature doit être accompagnée de l'envoi d'un courrier électronique aux adresses suivantes : jean-michel.eloy at u-picardie.fr christophe.rey at u-picardie.fr RECAPITULATIF : Date de début du contrat : Janvier 2009 Adresse : LESCLaP, Faculté des Lettres - chemin du Thil - 80025 Amiens (France) Contact : Jean-Michel Eloy, Directeur du LESCLaP jean-michel.eloy at u-picardie.fr Christophe Rey christophe.rey at u-picardie.fr Téléphone : 03 22 95 10 81 Fax : 03 22 33 11 51 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:07:56 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:07:56 +0100 Subject: Appel: CICLing 2009 + Lexicom 2009: NLP & Computational Linguistics, Springer LNCS, Mexico City (reminder) Message-ID: Date: Wed, 5 Nov 2008 04:20:58 -0600 From: "Alexander Gelbukh \(CICLing-2009\)" Message-ID: <21B23C93351843AA8EB8B8A2C838AB73 at micron> Dear colleague, This is just a gentle reminder of the deadline for the CICLing-2009 conference with Lexicom 2009, in case if you are interested. Below I repeat the CFP. Please contact us for late submissions if needed (while the system is open, please just go ahead and upload your abstract). Thank you! Alexander - - - - - - - - - - - - - - - - - - CICLing 2009 + Lexicom 2009 10th International Conference on Intelligent Text Processing and Computational Linguistics; pre-conf event: Lexicom-Americas 2009 workshop Mexico City, Mexico CICLing: March 1-7, 2009 Lexicom: February 24-28 www.CICLing.org/2009 PUBLICATION: LNCS: Springer Lecture Notes in Computer Science, separate processings of poster session KEYNOTE SPEAKERS: Jill Burstein, ETS, Ken Church, Microsoft, Dekang Lin, Google. TOURS: Monarch Butterfly wintering site, Indian pyramids, cave, and more. AWARDS: Best paper, best student paper, best presentation, best poster. SUBMISSION DEADLINES: NOW: registration of tentative abstract, November 10: uploading of full papers (contact us for late submissions) TOPICS: All topics related with computational linguistics, natural language processing, human language technologies, information retrieval, etc. See complete CFP and contact on www.CICLing.org/2009. This message is sent in good faith of its usefulness for you as an NLP researcher. If this is an error, kindly let me know. Alexander Gelbukh www.Gelbukh.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:12:53 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:12:53 +0100 Subject: Seminaire: K. Gabor (Inst. Ling. de Budapest), LIPN, selection de features pour le clustering de verbes Message-ID: Date: Fri, 07 Nov 2008 11:37:28 +0100 From: Antoine Rozenknop Message-ID: <49141A68.4010404 at lipn.univ-paris13.fr> X-url: http://www-lipn.univ-paris13.fr/ X-url: http://www-lipn.univ-paris13.fr/actualites/post/Feature-Selection-for-Semantic-Clustering-of-Hungarian-Verbs X-url: http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN Le LIPN accueillera Kata Gábor, de l'Institut Linguistique de Budapest, pour un séminaire qui portera sur des techniques de clustering appliquées à des données linguistiques. Le séminaire aura lieu au LIPN (Univ.Paris 13, campus de Villetaneuse) en salle B311, le MERCREDI 12 NOVEMBRE 2008 à 14 heures. Pour venir au LIPN, voir les informations sur : http://www-lipn.univ-paris13.fr/ Cordialement, Antoine Rozenknop - --- Notes : L'objectif des techniques présentées est d'obtenir des listes de données lexicales cohérentes (ici, des verbes). Il s'agit d'un enjeu important pour un certain nombre d'applications d'ingénierie linguistique comme les systèmes de questions-réponses, d'extraction d'information ou de traduction automatique. L'exposé montrera des exemples tirés du hongrois mais concerne potentiellement d'autres langues dont, évidemment, le français. - ------------------------ Title : Feature Selection for Semantic Clustering of Hungarian Verbs http://www-lipn.univ-paris13.fr/actualites/post/Feature-Selection-for-Semantic-Clustering-of-Hungarian-Verbs - ------------------------ Summary : The presentation will focus on current issues in semantic verb classification, with a particular emphasis on the choice of the feature set which represent verbal syntactic distribution. Experiments on supervised semantic verb classification generally aim at obtaining verb classes equivalent to Beth Levins English verb classification or WordNet synsets. For languages which lack such hand-made resources, verb classes can be obtained by unsupervised clustering. In either case, the underlying hypothesis is that syntactically similar verbs share one or more meaning components, and an adequate representation of verbs distributional context is crucial to the succes of the experiment. The first experiments for clustering Hungarian verbs were carried out using data from a manually annotated treebank. The 150 most frequent verbs were categorized according to the complementation patterns they exhibit in the treebank. There was no limit on the length of the patterns, and adjuncts were also included. As Hungarian is a highly inflective language (with 19 different case suffixes), a huge quantity of different patterns, i.e., a large feature set was used. Despite the fact that the large number of features scatter frequency data, the results were promising. However, in order to extend the clustering to less freqent verbs, one needs a bigger and, consequently, automatically parsed corpus. As the parser introduces more noise, which is an even more sensitive issue when dealing with medium or low frequency verbs, the question raises of how the feature set can be tuned in order to achieve a more precise description of the syntactic distribution of verbs. An obvious solution would be to filter complementation patterns according to their frequency, but this could yield misleading reults for low frequency verbs. A more sophisticated method would be to use a manually built verbal valency dictionary to filter out longer and/or less relevant distributional contexts. On the other hand, this method would imply losing the information carried by adjuncts (e.g. temporal andjuncts reveal aspectual properties of verbs). After presenting the results of the first clustering experiment, I will outline future research directions with respect to feature set reduction, and discuss the advantages and disadvantages of the particular methods. - ---- Séminaires RCLN : http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN - ---- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:15:05 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:15:05 +0100 Subject: These: Pierre Loustau, Interpretation automatique d'itineraires dans des recits de voyages Message-ID: Date: Wed, 05 Nov 2008 14:57:18 +0100 From: Pierre LOUSTAU Message-ID: <4911A63E.9020806 at univ-pau.fr> Bonjour à tous, J'ai le plaisir de vous annoncer que ma soutenance de thèse intitulée "/Interprétation automatique d'itinéraires dans des récits de voyages. D'une information géographique du syntagme à une information géographique du discours./" aura lieu le 14 novembre à 14h à Pau dans l'amphithéâtre D de l'UFR Sciences de l'Université de Pau et des Pays de l'Adour. Veuillez m'excuser pour les réceptions multiples. Pierre Loustau. *Titre : * Interprétation automatique d'itinéraires dans des récits de voyages.. D'une information géographique du syntagme à une information géographique du discours. *Composition du jury :* Patrice Enjalbert, Professeur des Universités (GREYC, Université de Caen), Rapporteur Andrew U. Frank, Professeur des Universités (Technical University of Vienna), Rapporteur Thierry Joliveau, Professeur des Universités ( CRENAM-ISIG, Université Jean Monnet de Saint-Etienne), Examinateur Hervé Martin, Professeur des Universités (LSR - IMAG, Université Joseph Fourier, Grenoble 1), Examinateur Philippe Muller, Maître de Conférences (IRIT, Université Paul Sabatier, Toulouse), Examinateur Mauro Gaio, Professeur des Universités (LIUPPA, Université de Pau et des Pays de l'Adour), Directeur de thèse Thierry Nodenot, Maître de Conférences (LIUPPA, Université de Pau et des Pays de l'Adour), Directeur de thèse *Résumé : * Cette thèse s'inscrit à la croisée du Traitement Automatique du Langage, de l'Extraction d'Information, de la Recherche d'Information, des Sciences Cognitives dans un contexte de Géomatique. Dans ce contexte, nos travaux visent à traiter automatiquement des textes relatant des récits de voyage avec pour objectif d'interpréter l'information géographique qu'ils contiennent et plus particulièrement les itinéraires qu'ils décrivent. L'approche que nous proposons est une méthode incrémentale de découverte du sens : partant d'une sémantique du niveau du syntagme nominal simple, et passant par une sémantique du niveau de la proposition, nous atteignons une sémantique du niveau du texte. Très schématiquement, notre parcours dans la découverte du sens est donc le suivant : interprétation des évocations de lieux, interprétation des déplacements du narrateur basée sur les verbes de déplacements et le critère de polarité aspectuelle spatiale qui leur est attaché, et enfin interprétation de cette séquence de déplacements pour construire l'itinéraire. Notre contribution réside donc dans la proposition d'un modèle du concept d'itinéraire adapté à des usages ciblés (pour la RI et pour des usages de conception d'activités pédagogiques), la proposition d'une approche pour caractériser l'itinéraire dans le texte et enfin la proposition d'un mode opératoire automatisée et entièrement implémenté permettant de relier la caractérisation de l'itinéraire dans le texte à son modèle du concept. Notre démarche étant clairement expérimentale, nous nous sommes appuyés tout au long de nos travaux sur un prototype que nous avons mis au point. Ce prototype (PIIR pour Prototype pour l'Interprétation d'Itinéraires dans des Récits) nous permet de mettre face au traitement automatique les analyses et les algorithmes que nous proposons. Nous avons également évalué les résultats de nos traitements automatisés afin de pointer les problèmes qui restent en suspend après ces travaux de thèse. Ces problèmes ouvrent des perspectives intéressantes que nous avons discutées en fin de mémoire. *Mots-Clefs :* Extraction d'Information, TAL, Recherche d'Information, Géomatique ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:11:12 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:11:12 +0100 Subject: Seminaire: A. Vlachos (Univ. de Cambridge), LIPN, Dirichlet Process Mixture Models for Verb Clustering Message-ID: Date: Fri, 07 Nov 2008 11:33:00 +0100 From: Antoine Rozenknop Message-ID: <4914195C.2070306 at lipn.univ-paris13.fr> X-url: http://www-lipn.univ-paris13.fr/ X-url: http://www-lipn.univ-paris13.fr/actualites/post/Unsupervised-and-Constrained-Dirichlet-Process-Mixture-Models-for-Verb-Clustering Le LIPN accueillera Andreas Vachlos, de l'Université de Cambridge, pour un séminaire qui portera sur des techniques de clustering, contraintes et non supervisées, appliquées au clustering lexical-sémantique des verbes. Le séminaire aura lieu au LIPN (Univ.Paris 13, campus de Villetaneuse) en salle B311, le jeudi 20 novembre à 13 heures. Pour venir au LIPN, voir les informations sur : http://www-lipn.univ-paris13.fr/ Cordialement, Antoine Rozenknop - ------------------------ Title : Unsupervised and Constrained Dirichlet Process Mixture Models for Verb Clustering http://www-lipn.univ-paris13.fr/actualites/post/Unsupervised-and-Constrained-Dirichlet-Process-Mixture-Models-for-Verb-Clustering - ------------------------ Summary : In this work we apply Dirichlet Process Mixture Models (DPMMs) to a learning task in natural language processing (NLP): lexical-semantic verb clustering. Furthermore, we propose a novel method of guiding the DPMM towards a particular clustering solution using pairwise constraints. The quantitative and qualitative evaluation performed highlights the benefits of both standard and constrained DPMMs compared to previously used approaches. Results on datasets from general English and the biomedical domain are presented. - ---- Séminaires des équipes RCLN et A3: http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20A3 - ---- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:23:35 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:23:35 +0100 Subject: Job: Postdoc CLIR, France Telecom Orange Labs, Lannion Message-ID: Date: Thu, 6 Nov 2008 14:51:50 +0100 From: Message-ID: <6CF039C5B32037498B02251E11CDE6B00775CABA at ftrdmel3> Offre de postdoc à France Telecom Orange Labs dans le domaine de la recherche d'information cross-lingue (CLIR). Lieu : France Telecom Orange Labs à Lannion (Bretagne). Date : dès que possible en 2008. Durée : 12 mois (avec possibilité d'extension à 18 mois). Projet : Le postdoc s'inscrit dans le cadre d'un projet de R&D dans le domaine de la recherche d'information multimédia et multilingue. Activités du postdoc : Les activités envisagées pour ce postdoc concernent la recherche d'information cross-lingue pour l'accès à des contenus disponibles dans d'autres langues que celle des requêtes de l'utilisateur. L'un des objectifs de ce travail est de mener une réflexion de fond et proposer une approche visant à rendre le processus de recherche d'information inter-lingue aussi transparent que possible pour l'utilisateur en minimisant sa contribution pour la désambiguïsation et la traduction de ses requêtes. Un autre objectif consiste à optimiser les hypothèses de traduction des requêtes sur la base de traitements linguistiques et/ou stochastiques. Le candidat retenu aura pour mission de contribuer aux activités suivantes : - Etude des travaux existants, des méthodes utilisées et des usages du CLIR. - Evaluation d'outils de recherche intégrant une dimension cross-lingue. - Réflexion et proposition d'une approche visant à optimiser les hypothèses de traduction des requêtes et à rendre le processus de CLIR aussi transparent que possible pour l'utilisateur. - Intégration d'un prototype de CLIR à un moteur existant et évaluation des résultats. Profil recherché : - Doctorat en informatique ou en linguistique. - Bonnes connaissances du TALN et des différentes approches en traduction. - Bonnes connaissances de la recherche d'information et du CLIR. - Maîtriser Linux, Python ou Java, langage de script (bash), C++ serait un plus. - Langues : français et anglais (la connaissance de l'espagnol serait un plus). - Motivation pour la R&D dans un milieu industriel. Contact : Malek Boualem France Telecom Orange Labs Tél. 02 96 05 29 83 Email. malek.boualem at orange-ftgroup.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:26:54 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:26:54 +0100 Subject: These: Davy Weissenbacher, Influence des annotations imparfaites sur les systemes de TAL Message-ID: Date: Fri, 07 Nov 2008 00:33:25 +0100 From: Davy.Weissenbacher at lipn.univ-paris13.fr Message-ID: <20081107003325.lt159w26t7kgkwg0 at intranet.lipn.univ-paris13.fr> X-url: http://www-lipn.univ-paris13.fr/planfac/?lang=fr) J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée "Influence des annotations imparfaites sur les systèmes de Traitement Automatique des Langues, un cadre applicatif: la résolution de l'anaphore pronominale", ainsi qu'au pot qui suivra. La soutenance aura lieu le Jeudi 20 Novembre à 15h30, salle B311 du Laboratoire d'Informatique de Paris Nord, Institut Galilée, Université Paris 13, 99 avenue jean-Baptiste Clément, 93430 Villetaneuse (Pour se rendre au LIPN: http://www-lipn.univ-paris13.fr/planfac/?lang=fr) Le jury sera composé de: M. Bernard Victorri, directeur de recherche CNRS, LATTICE, université Paris VII, rapporteur M. Philippe Leray, professeur, Laboratoire d'informatique de Nantes Atlantique, université de Nantes, rapporteur M. Jean-Gabriel Ganascia, professeur, LIP6, université Paris VI, examinateur M. Sophia Ananiadou, Reader, NaCTeM, university of Manchester, examinateur M. Christophe Fouqueré, professeur, LIPN, université Paris XIII, directeur de thèse M. Adeline Nazarenko, professeur, LIPN, université Paris XIII, codirectrice de thèse Cordialement, Davy Weissenbacher Résumé ---------------------------------- Un système informatique ne peut traiter automatiquement un texte sans qu'un certain nombre d'informations contenues dans ce texte, comme les mots ou les phrases, ne soient annotées. Pour ajouter un nouveau niveau d'annotation un système exploite des annotations d'entrée, plus 'simples', produites par les systèmes qui ont été appliqués précédemment au texte. Or aucun système d'annotation, à ce jour, ne réalise automatiquement une annotation parfaite d'un texte. En raison de la complexité de la langue naturelle, il est difficile d'isoler les annotations d'entrée qui sont nécessaires à l'algorithme pour annoter un texte. De plus, ces annotations d'entrée, résultant elles-même d'un calcul automatique, sont imparfaites i.e. imprécises, bruitées et parfois manquantes. En'n, le corpus sur lequel ont été choisies les annotations d'entrée est un rassemblement artificiel de textes d'un même domaine qui donne une vue partielle de la langue. Cette construction implique une variation importante de la 'abilité de ces annotations lorsque le système est appliqué sur un corpus d'un autre domaine. L'imperfection des annotations d'entrée et de sortie des systèmes de traitement automatique des langues (TAL) semble être une fatalité avec laquelle nous devons composer plutôt qu'un désagrément passager dû à la maturité naissante des techniques de TAL. L'imperfection des annotations se transmet et augmente à chaque niveau d'annotation du traitement d'un document. Ce constat fait, une question s'impose. Quel système de TAL obtient les meilleures performances: un système qui intègre l'imperfection des informations d'entrée dans son processus de raisonnement ou un système prévu pour raisonner à partir d'informations d'entrée parfaites mais travaillant avec des informations imparfaites' Nous avons proposé un modèle d'inférence probabiliste reposant sur les réseaux bayésiens (RB), un formalisme adapté pour raisonner sur les données de la langue naturelle. Ce modèle permet d'intégrer dans une représentation unique un ensemble d'annotations hétérogènes. Lors de l'inférence toutes les annotations d'entrée pertinentes sont exploitées pour réaliser une tâche donnée. Les probabilités conditionnelles a priori associées au réseau expriment un ensemble de contraintes dont nous nous servons pour estimer les valeurs inconnues des attributs et renforcer la 'abilité des attributs les plus bruités. De plus, leur apprentissage automatique permet de les adapter aux corpus et garantit que les annotations engagés dans l'inférence sont toujours pertinentes. Nous avons validé notre modèle sur le problème de la résolution du pronom it anaphorique dans les textes anglais. Nous avons conçu un RB pour l'exclusion des pronoms impersonnels et un RB pour le choix de l'antécédent. Nous avons évalué ces deux RB sur des corpus différents. L'analyse des résultats du RB pour l'exclusion des pronoms impersonnels a mis en évidence l'intérêt de notre approche, les résultats de notre RB sont meilleurs que ceux des systèmes de l'état de l'art concurrents. Sur la tâche plus difficile du choix de l'antécédent, les résultats de notre second RB sont moins satisfaisants mais ils restent comparables aux résultats des systèmes de l'état de l'art: lorsque l'imperfection des annotations est prise en compte dans l'inférence, l'emploi d'annotations de mauvaise qualité ne dégrade que très faiblement les performances du système; si, sans être parfaits, les annotations sont de meilleure qualité, leur utilisation améliore significativement les performances du système. De plus, notre RB modélise encore imparfaitement le problème du choix de l'antécédent. Pour corriger ces défauts, nous proposons, en dernière partie de cette thèse, le prototype d'un nouveau système reposant sur une extension des réseaux bayésiens dynamiques. Mots clés: Traitement Automatique des Langues, résolution d'anaphores pronominales, annotation, Incertitude, probabilités, réseaux bayésiens Abstract ---------------------------------- It is not possible for a science computing system to process a text when sequences, like words or sentences, are not annotated. However, to date, no system has been able to automatically produce a perfect annotation of a text. This report poses the following question; which is the better natural language processing system: a system designed to integrate imperfect annotations in its reasoning process or a system designed to work with perfect annotation but dealing with imperfect annotations' To answer this, we have proposed a probabilistic inference model based on Bayesian Networks (BN), a formalism well adapted to reasoning from imperfect data. We have worked on the resolution of the anaphoric pronoun it and validate our model in evaluating two BN on different corpora: a BN dedicated to the impersonal pronoun recognition problem and a BN dealing with the choice of the antecedent problem. The performance of the first BN achieves better results than competing state of the art systems thus highlighting the strengths of our model. The performance of the second BN on the choice of the antecedent problem, which is known to be a difficult task, is not as good. However, the results are still comparable with the performance achieved by the state of the art systems and lead to an interesting outcome: when the imperfection of the annotation is taken into account in the inference process, using bad quality annotations slightly worsens the overall performances of the system; when using better quality annotations, yet still not perfect, the results achieved are significantly better. Key Words: Natural Language Processing, pronominal anaphora resolution, annotations, uncertainty, probability, Bayesian networks ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:22:28 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:22:28 +0100 Subject: Conf: ISUC 2008, 2nd International Symposium on Universal Communication, Dec. 15-16, 2008 Osaka, Japan Message-ID: Date: Thu, 06 Nov 2008 09:41:04 +0100 From: info at elda.org Message-ID: <4912ADA0.6010609 at elda.org> X-url: http://www.is-uc.org/2008/index.html X-url: http://www.is-uc.org/2008/regist/index.html X-url: http://www.is-uc.org/2008/program/index.html [Apologies if you receive this more than once] ============================================= CALL FOR PARTICIPATION ISUC 2008 2nd International Symposium on Universal Communication December 15-16, 2008 Osaka, Japan http://www.is-uc.org/2008/index.html ============================================= * On-line registration http://www.is-uc.org/2008/regist/index.html Registration due date: November 28, 2008 * Program http://www.is-uc.org/2008/program/index.html * Contact Email: isuc2008 at khn.nict.go.jp TEL: +81-6-6372-3053 FAX: +81-6-6376-2362 The development of information network systems enables us to communicate with people in remote places "anytime and anywhere", enriching human knowledge, affection and sensibility. However, there are various barriers which stand in our way to using these systems freely and flexibly. In order to discuss how to overcome these barriers and create a more human-centered communication environment, in 2007 the first International Symposium on Universal Communication was held in Kyoto, Japan featuring discussions with well-known researchers from around the world. Following its success, the Second International Symposium on Universal Communication (ISUC 2008) will be held at the Osaka International Convention Center, 5-3-51, Nakanoshima Kita-ku, Osaka 530-0005 Japan on December 15-16, 2008. Symposium highlights include the following. * Keynote Speech Dec. 15, 2008 1. Overcoming the Language Barrier: Makoto Nagao (National Diet Library) 2. The UCSD/Calit2 GreenLight Project: Thomas DeFanti (University of California, San Diego, USA) 3. Very Large Information Integration and Application Platform - CSTP Coordination Program of Science and Technology Projects - Shojiro Nishio (Osaka University) * Invited Talks Dec. 15, 2008 Speech Processing in Support of Human-Human Communication Alex Waibel Carnegie Mellon University, USA and University of Karlsruhe, Germany Wave Field Synthesis: History, State-of-the-Art and Future Diemer de Vries Delft University of Technology, the Netherlands On Distributed Run-Time Software Evolution Driven by Stakeholders of Smart Home Development Carl K. Chang Iowa State University, USA Dec. 16, 2008 The Maximum Entropy based Rule Selection Model for Statistical Machine Translation Qun Liu Chinese Academy of Sciences, China Depth Estimation and Object Recognition using Integral Imaging Seokwon Yeom Daegu University, Korea DISG: A DIStributed Graph Repository for Web Infrastructure Aoying Zhou East China Normal University, China Compilation of the Balanced Corpus of Contemporary Written Japanese in the KOTONOHA Initiative Kikuo Maekawa The National Institute for Japanese Language Perception of Depth, Motion, and Stability with Motion Parallax Hiroshi Ono York University, Canada Understanding Events Relationally and Temporally Related: Context Assessment Strategies for a Smart Home Fulvio Mastrogiovanni University of Genova, Italy Wireless Sensor Network and Sensor Fusion Technology for Ubiquitous Smart Living Space Applications Ming-Whei Feng Institute for Information Industry, Taiwan We are looking forward to your participation. ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:28:01 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:28:01 +0100 Subject: Appel: EvalECD'09 Message-ID: Date: Fri, 07 Nov 2008 14:32:47 +0100 From: Nicolas Béchet Message-ID: <4914437F.1010702 at lirmm.fr> X-url: http://www.lirmm.fr/~bechet/EvalECD X-url: http://www.lirmm.fr/~bechet/EvalECD/atelier_egc.cls [Veuillez nous excuser en cas de réceptions multiples] Second appel à communications ============================= 1er atelier sur l'Évaluation des méthodes d'Extraction de Connaissances dans les Données (EvalECD) organisé dans le cadre de la conférence EGC 2009. le 27 janvier 2009, Strasbourg, France. Site web de l'atelier : http://www.lirmm.fr/~bechet/EvalECD Contact : evalecd09 at lirmm.fr L'objectif de cet atelier est de discuter des techniques d'évaluation utilisées dans différents domaines et de montrer leurs qualités et leurs limites. Un tel atelier ouvert aux différentes communautés d'EGC permet de compléter et/ou généraliser les travaux présentés dans des ateliers très spécifiques (par exemple, ateliers de TIA'05, COLING'08 en Traitement Automatique des Langues). Cet atelier permettra ainsi de proposer un début de solutions aux problèmes occasionnés par la diversité des évaluations en ECD. Thèmes développés (liste non limitative) ======================================= * Protocoles d'évaluation (automatiques, semi-automatiques, manuels) * Mesures d'évaluation (Précision, Rappel, F-Mesure, Courbes ROC, ...) * Tuning : spécifications des paramètres * Construction de benchmarks * Validation de connaissances en ECD * Expertise humaine en TAL et en IC * Évaluation en Intégration de Données et en Réconciliation de Données * Évaluation des outils d'IHM (ergonomie, visualisation) Dates importantes ================= * Soumission des articles : 25 novembre 2008 * Notification aux auteurs : 22 décembre 2008 * Soumission de la version finale : 5 janvier 2009 * EvalECD 2009 : 27 janvier 2009 Modalités de soumission ======================= Les articles soumis peuvent être rédigés en français ou en anglais, sur environ 12 pages incluant toutes les références et les figures. Les articles pourront être beaucoup plus courts, en particulier pour les articles présentant un travail qui débute. Les soumissions se feront au format PDF. Le format requis pour les actes de l'atelier EvalECD'09 (latex uniquement) est le suivant : http://www.lirmm.fr/~bechet/EvalECD/atelier_egc.cls Les soumissions devront être envoyées à l'adresse ci-après avant le 25 novembre 2008 : evalecd09 at lirmm.fr Organisateurs ============= - Nicolas Bechet (LIRMM) - Mathieu Roche (LIRMM) - Fatiha Saïs (LRI/INRIA-Saclay-Île-de-France) Comité de Programme =================== - Bernd Amann (LIP6) - Jean-Yves Antoine (LI) - Jérôme Azé (LRI) - Zohra Bellahsène (LIRMM) - Catherine Berrut (LIG) - Patrice Buche (INRA - Unité Mét at risk) - Bich-Liên Doan (Supélec) - Stéphane Lallich (ERIC) - Anne Laurent (LIRMM) - Nathalie Pernelle (LRI, INRIA Saclay-Île-de-France) - Pascal Poncelet (LIRMM) - Chantal Reynaud (LRI, INRIA Saclay-Île-de-France) - Christophe Roche (LISTIC) - Bernard Rothenburger (IRIT) - Laurent Simon (LRI, INRIA Saclay-Île-de-France) - Maguelonne Teisseire (LIRMM) - Alexandre Termier (LIG) - Fabien Torre (LIFL) - Juan Manuel Torres-Moreno (LIA) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Wed Nov 12 11:40:02 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Nov 2008 12:40:02 +0100 Subject: Appel: Journal of Natural Language Engineering, Call for special issue proposals Message-ID: Date: Sat, 08 Nov 2008 17:53:38 +0000 From: Ruslan Mitkov Message-Id: <20081108175731.CA08422BA01 at hygia.cines.fr> Journal of Natural Language Engineering *** Call for special issue proposals *** The area of Natural Language Engineering is following the trend of many other areas, becoming highly specialised with a number of application-orientated and narrow-domain topics emerging or growing in importance. These developments, often coincident with a lack of related literature, necessitate and warrant the publication of specialised volumes focusing on a specific topic of interest to the Natural Language Processing (NLP) research community. The journal of Natural Language Engineering (NLE) invites proposals for special issues on a competitive basis on any topics about applied NLP which have emerged as important developments in Natural Language Engineering and which have attracted the attention of a number of researchers or research groups. After the Call for Proposals for special issues in 2006 which has resulted in two very high quality special issues, we are pleased to announce another such call this year. Topics could cover a variety of NLP methods, tasks and resources as well as NLP-related applications but should focus on the practical implications of operation on the large scale. Topics covering NLP methods, tasks and resources could include but are not limited to POS tagging, parsing, semantic role labelling, word sense disambiguation, anaphora and coreference resolution, named entity recognition, natural language generation, speech recognition, speech synthesis, multimodal processing, statistical methods in Natural Language Engineering, machine learning, evaluation methodologies, corpora and ontologies. Topics covering NLP applications could include but are not limited to machine translation, translation memory and translation tools, summarisation, information retrieval, information extraction, question answering, text and web mining, opinion mining and NLP for biomedical texts. Calls for special issue proposals may be based on a successful workshop or a body of work associated with a particular group or section of the community. In all cases, however, the reviewing process of the accepted proposals will be rigorous and all submissions must be reviewed by at least 3 members of the Guest Editorial Board or other suitable reviewers agreed by the NLE Editors. In the case of papers previously submitted to workshops, the Guest Editors will not be able to re-use previous workshop reviews. In addition, the call for papers of the accepted proposals must be open to all interested parties and all authors will be given equal treatment; in the case of proposals based on previous workshops, submissions cannot be limited to workshop participants only. Interested editors have the option of preliminary feedback by emailing expressions of interest accompanied by a brief description of the intended special issue to the Executive Editor (R.Mitkov at wlv.ac.uk). He will give a brief indication of whether the topic is appropriate to Natural Language Engineering. In the case of initial positive feedback, the prospective Guest Editors will be asked to submit a proposal for a special issue which will be reviewed by the Editors of the journal and by other members of the Journal Editorial Board. At least one proposal will be selected on a competitive basis for each call with the envisaged publication date for the successful proposal(s) from this call on or after October 2009. The proposal for a special issue should include a brief outline of the field and rationale as to why it is important to launch a special issue on the particular topic of interest. It should include a relevant literature survey (related previous special issues, volumes, workshop and conference proceedings) and should explain the added value of the proposed special issue against the background of other relevant or competing publications and volumes (if applicable). It is desirable that a rough estimate on expected submissions to the special issue be provided. The proposals should also include a tentative Guest Editorial Board (it is desirable that one of the members of the Guest Editorial Board be a member of the journal Editorial Board), tentative time-scale for the production of the special issue and information about the prospective Guest Editors (relevant experience, publications etc.). Time-scale - Deadline for submission of special issue proposals: 15 December 2008 (proposals to be emailed to R.Mitkov at wlv.ac.uk) - Notification of acceptance/rejection: 15 January 2009 - Final version of the successful proposal(s) and call for papers: 31 January 2009 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Wed Nov 12 11:42:19 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Nov 2008 12:42:19 +0100 Subject: These: Remi Bove, Analyse syntaxique automatique de l'oral : etude des disfluences Message-ID: Date: Mon, 10 Nov 2008 13:55:33 +0100 (CET) From: Remi BOVE Message-ID: <20282761.29777.1226321735256.JavaMail.root at frontal2> Bonjour à tous, J'ai le plaisir de vous annoncer que ma soutenance de thèse intitulée "Analyse syntaxique automatique de l'oral : étude des disfluences" aura lieu le 25 novembre à 14h à Aix-en-Provence dans la salle C212 (2e étage) de l'Université de Provence (Aix-Marseille I). Rémi BOVE Jury : Martine ADDA-DECKER (LIMSI, Université Paris-Sud, Rapporteur) Jean-Yves ANTOINE (LI, Université François Rabelais de Tours, Rapporteur) Jacques VERGNE (GREYC, Université de Caen, Examinateur) José DEULOFEU (TALEP, Université de Provence, Examinateur) Jean VERONIS (TALEP, Université de Provence, Directeur) Résumé : Le but de cette thèse est d'étudier de façon détaillée l'impact des disfluences en français parlé (répétitions, auto-corrections, amorces, etc.) sur l'analyse syntaxique automatique de l'oral, et de proposer un modèle théorique permettant de les intégrer dans cette analyse. Notre axe de recherche se fonde sur l'hypothèse selon laquelle une analyse détaillée des énoncés oraux (principalement en termes morphosyntaxiques) peut permettre un traitement efficace pour ce type de données, et s'avère incontournable dans une optique de développement d'applications génériques dans le domaine des technologies de la parole. Dans ce travail, nous proposons à la fois une étude linguistique détaillée et une stratégie d'analyse syntaxique automatique partielle des disfluences (en syntagmes minimaux non récursifs ou "chunk"). Le corpus final obtenu est ainsi segmenté en chunks non-disfluents d'une part, à côté des chunks disfluents d'autre part, après prise en compte des régularités observées dans notre corpus. Les résultats de l'analyse automatique sont finalement évalués de façon quantitative sur le corpus permettant ainsi de valider le modèle théorique de façon empirique. Mots-Clefs : TAL, Analyse Syntaxique Automatique, Disfluences, Oral, Français Parlé, Étiquetage Automatique, Grammaire de Chunking, Linguistique de Corpus ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Wed Nov 12 11:41:01 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Nov 2008 12:41:01 +0100 Subject: These: Francois Lareau, Vers une GUST du francais: le temps verbal Message-ID: Date: Mon, 10 Nov 2008 11:40:20 +0900 From: François Lareau Message-Id: Bonjour, J'ai le plaisir de vous inviter à la soutenance de ma thèse, intitulée: "Vers une grammaire d'unification Sens-Texte du français: le temps verbal dans l’interface sémantique-syntaxe" Il s'agit d'une thèse en linguistique effectuée en cotutelle dans les laboratoires OLST (Université de Montréal) et Lattice (Université Paris 7). La soutenance aura lieu le 25 novembre 2008 à 9h30 au local C-9019 du pavillon Lionel-Groulx (3150 rue Jean-Brillant) de l'Université de Montréal. Le jury sera composé des personnes suivantes: Alain Polguère, U. de Montréal, Président-rapporteur Igor Mel'cuk, U. de Montréal, Directeur UdeM Sylvain Kahane, U. Paris 10, Directeur UP7 Laurence Danlos, U. Paris 7, Membre du jury Owen Rambow, U. Columbia, Examinateur externe Antoine Soare, U. de Montréal, Représentant du doyen Résumé: Cette thèse vise d’une part à décrire la flexion verbale en français, plus particulièrement celle en temps dans l’interface sémantique- syntaxe, et d’autre part à développer le formalisme de la grammaire d’unification Sens-Texte (GUST) et à en vérifier l’utilité pour la description des langues. Pour atteindre notre premier objectif, nous proposons une méthodologie qui met l’accent sur les signes dans leur ensemble. Au niveau descriptif, notre thèse principale est que le français possède non pas une, mais bien deux catégories flexionnelles de temps complémentaires. La catégorie de décalage regroupe les grammèmes DÉCALÉ et NON-DÉCALÉ, qui situent un point de repère par rapport au moment d’élocution. La catégorie de temps comme tel regroupe les grammèmes ANTÉRIEUR, SIMULTANÉ et POSTÉRIEUR, qui situent les faits par rapport à ce point de repère. Au niveau formel, nos principaux apports au formalisme de GUST sont la représentation des structures en termes d’objets et de fonctions, ainsi que la modélisation des décompositions sémantiques. La formalisation de notre modèle de la flexion verbale s’avère un moyen intéressant de vérifier l’utilité de GUST puisqu’elle met en jeu des signes variés. Elle nous donne également l’occasion d’observer le mécanisme d’articulation des modules de la grammaire. Un PDF de la thèse est disponible ici: https://www.webdepot.umontreal.ca/Usagers/lareauf/these/lareau-these.pdf ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Wed Nov 12 11:43:49 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Nov 2008 12:43:49 +0100 Subject: Appel: Genericity: Interpreation and Uses (Conference I) Message-ID: Date: Mon, 10 Nov 2008 15:04:24 +0100 From: David NICOLAS Message-ID: X-url: http://www.genericity.ens.fr/ CFP: Genericity: Interpreation and Uses (Conference I) May 11-12-13, 2009 ENS (Ecole Normale Supérieure) Paris - France http://www.genericity.ens.fr Invited Speakers Nicholas Asher (IRIT / University of Texas at Austin) Ariel Cohen (Ben Gurion University) Francis Corblin (Université Paris Sorbonne) Veneeta Dayal (Rutgers University) Carmen Dobrovie-Sorin (CNRS / Paris VII) Manfred Krifka (ZAS Berlin) Christopher Piñón (Université Lille III) Call for Papers Since the publication of the collective work 'The Generic Book' (Carlson & Pelletier (ed.), 1995), research on genericity has developed in various directions. The principal merit of 'The Generic Book' was to establish a unified terminology, which paved the way for very detailed and specific studies, whose results are intended to be cumulative. Since then, much of the research has focused on syntactic, semantic and pragmatic issues and important advances have been made in each of these fields and at their interfaces. The goal of the conference is to bring together theoreticians of different horizons articulating linguistic issues with logical and philosophical ones. The conference welcomes papers on different languages clearly articulating empirical and formal issues, including but not limited to the following topics: - ILP SLP distinction - Kind terms - Generic Determiners - Generic Quantification - Focus - Frequency Adverbs - GEN / HAB distinction - Dispositions - Tense and Aspect in generic sentences - Free choiceness and genericity - Genericity and modality Selection Committee Nicholas Asher (CNRS/Austin Texas) Claire Beyssade (Institut Jean Nicod CNRS/ENS/EHESS) Ariel Cohen (Ben-Gurion University) Francis Corblin (Paris IV Sorbonne) Veneeta Dayal (Rutgers University) Carmen Dobrovie-Sorin (LLF Paris VII) Brenda Laca (Université Paris VIII) Alda Mari (Institut Jean Nicod CNRS/ENS/EHESS) David Nicolas (Institut Jean Nicod CNRS/ENS/EHESS) Christopher Piñón (Université Lille III) Benjamin Spector (Institut Jean Nicod CNRS/ENS/EHESS) Isidora Stojanovic (Institut Jean Nicod CNRS/ENS/EHESS) Organization Committee Claire Beyssade (Institut Jean Nicod CNRS/ENS/EHESS) Alda Mari – Chair - (Institut Jean Nicod CNRS/ENS/EHESS) David Nicolas (Institut Jean Nicod CNRS/ENS/EHESS) Abstract Submission Anonymous abstracts in pdf format not exceeding 2 pages with standard 1 inch margins on all sides, including examples, figures and references, are to be sent to GenerictyConference at gmail.com One single authored and a co-authored abstract can be submitted. Please include in the body of the mail the following information: - Author(s) - Title of the abstract - Affiliation(s) - E-mail Address Important Dates Submission Deadline: January 31st Notification: March 1st Sponsors This conference opens the ANR Project ‘Genius: Genericity Interpretation and Uses’. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 14 15:04:32 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Nov 2008 16:04:32 +0100 Subject: Revue: Lexis numero 2, Submorphemique lexicale Message-ID: Date: Thu, 13 Nov 2008 10:05:27 +0100 From: didier.bottineau at free.fr Message-ID: <1226567127.491bedd756655 at imp.free.fr> X-url: http://screcherche.univ-lyon3.fr/lexis/spip.php?article96 Vient de paraître : le n°2 de LEXIS sur la "submorphémique lexicale" coordonné par Dennis Philps. La submorphémique lexicale / Lexical Submorphemics Dennis Philps, Université Toulouse-Le Mirail (France) : Préface / Foreword • Dennis Philps, Université Toulouse-Le Mirail (France) : Introduction • Didier Bottineau, CNRS, MoDyCo – Université Paris 10 Nanterre (France) : “The submorphemic conjecture in English : towards a distributed model of the cognitive dynamics of submorphemes” • Line Argoud, doctorante agrégée – Grenoble - Université de Toulouse-Le Mirail (France) : « Les ‘mots en bl-’ du lexique anglais : étude de la structuration des données dans une optique lexico-cognitive » • Jean-Marc Chadelat, IUFM de Paris (France) : « Le symbolisme phonétique à l’initiale des mots anglais : l’exemple du marqueur sub-lexical < Cr- > » • Ingrid Fandrych, National University of Lesotho (Lésotho) : “Submorphemic elements in the formation of acronyms, blends and clippings” • Dennis Philps, Université Toulouse-Le Mirail (France) : “Submorphemic iconicity in the lexicon : a diachronic approach to English ‘gn- words’” Le numéro est accessible à l'adresse suivante : http://screcherche.univ-lyon3.fr/lexis/spip.php?article96 Les articles peuvent être téléchargés en .pdf, soit individuellement, soit pour le numéro complet. Le prochain numéro sur l'emprunt sera coordonné par Aurélie Paulin et Jennifer Vince. --------------------------------- Didier Bottineau CNRS, UMR 7114 MoDyCO (Modèles, Dynamiques, Corpus) Université Paris Ouest Nanterre - La Défense (ex Université Paris 10) didier.bottineau at u-paris10.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 14 15:07:18 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Nov 2008 16:07:18 +0100 Subject: These: Zoubeir Mouelhi, Essai de lexicometrie d'une oeuvre arabe classique Message-ID: Date: Thu, 13 Nov 2008 23:25:12 +0100 (CET) From: Zoubeir Mouelhi Message-ID: <7460345.25040.1226615114726.JavaMail.root at co7> Bonjour à tous, J'ai le plaisir de vous annoncer la soutenance de ma thèse intitulée "Essai de lexicométrie d'une oeuvre arabe classique : Al-'Imtâ' wa-l-Mu'ânasa de Tawhîdî" pour le 22 novembre à 9h à l'Université Lumière-Lyon2, dans la salle "Jean-René Derré" au 18 Quai Claude Bernard (1er étage) à Lyon 7ème. Cordialement, Zoubeir mouelhi Jury : M. DICHY Joseph (Université Lyon 2, Directeur) M. SAHLOUL Hassan (Université Lyon 3, Rapporteur) M. BRAHAM Abdelfattah (Université de la Manouba TUNISIE, Rapporteur) M. LELUBRE Xavier (Université Lyon 2, Examinateur) M. HASSOUN Mohamed (ENSSIB, Examinateur) Résumé : S'inscrivant dans la perspective générale de l'approche quantitative de l'étude des textes, à la l'intersection de plusieurs disciplines, notamment la linguistique, l'informatique et la statistique, l'approche lexicométrique trouve plusieurs applications eu égard aux textes, qu'ils soient pris isolément (préoccupations d'ordre stylistique, didactique, historique, etc.), comparés entre eux (typologies de textes, approche contrastive, etc.), considérés dans leur relation aux auteurs (homogénéité d'auteur, attribution d'auteurs, etc.) ou dans leur relation au temps (séries textuelles chronologiques, spécificité chronologique, etc.). Dans cette perspective lexicométrique, notre travail qui porte sur un ouvrage célèbre de la pensée arabe médiévale, l'Imtâ' wa-l-Mu'ânasa de Tawhîdî (IVe/Xe siècle) se fixe un triple objectif : En premier lieu, l'élaboration, pour l'arabe, de ce que l'on appelle une norme lexicologique, donnant une assise théorique et méthodologique aux travaux lexicométriques futurs sur les textes arabes. Deux volets composent la norme lexicologique que nous proposons : une norme de saisie et d'harmonisation et une norme de dépouillement. En deuxième lieu, la confection du dictionnaire de fréquences de notre corpus. Fruit naturel de toute étude lexicométrique globale de cette nature, le dictionnaire de fréquences traduit et synthétise les réorganisations formelles opérées sur la séquence textuelle d'origine, ainsi que le résultat des différentes analyses statistiques qui ont porté sur le vocabulaire du texte. En troisième et dernier lieu, soumettre ce corpus à un certain nombre de méthodes d'analyse et de traitement statistiques propres à la lexicométrie en vue d'en étudier, principalement, la structure lexicale mais aussi la trame radicale. Ainsi, la richesse lexicale, l'accroissement du vocabulaire, la répartition des catégories lexicales, la connexion lexicale, etc., qui représentent tant d'éléments et d'indices pouvant caractériser le style d'un auteur, d'un genre ou d'une époque, ont-ils donc été étudiés et analysés. Il est nécessaire dans ce type d'entreprise, que des opérations de dépouillement préalables soient opérées selon des règles claires et stables assorties d'une réflexion minutieuse autour des notions de segmentation, de lemmatisation, de désambiguïsation, de catégorisation, etc. Les décomptes obtenus suite à ces étapes de dépouillement et de quantification, sont soumis aux traitements statistiques et à l'interprétation pour juger in fine des variations des différentes unités linguistiques du corpus et en décrire la structure lexicale. Mots-Clefs : Lexicométrie arabe, norme lexicologique, dépouillement lexical, TAL arabe, segmentation, lemmatisation, désambiguïsation, catégorisation, structure lexicale, richesse lexicale, catégories lexicales, textes arabes classiques, linguistique de corpus. Abstract : Lexicometry belongs to the general field of quantitative textual study and is situated at the intersection of various subjects, among which linguistics, computer science and statistics ; it is concerned with several types of applications in relationship to texts, whether they are considered separately (and studied for their stylistic, didactic or historical properties), compared to one another (as in textual typology, contrastive studies, etc.), considered in their relationship to their authors (studying homogeneity in a given author or automatically attributing texts to specific authors) or to their place in time (textual chronological series, chronological specificity, etc.). In this lexicometrical framework, our dissertation, which is based on a famous work of Arabic medieval thinking, ImtâÝ wa-l-MuÞânasa de TawÎîdî (4th –10th centuries), has a threefold objective: - first, elaborating for Arabic what is known as a lexicological norm that provides a theoretical and methodological foundation for future work in lexicometry based on Arabic texts. There are two components to the lexicological norm that we propose: one for data collection and harmonization and one for data retrieval. - second, building a frequency dictionary for our corpus. The natural outcome of any general lexicometical work of this kind, the frequency dictionary reproduces and synthesizes the formal reorganizations that have been carried out on the original text sequences, as well as the results of various statistical analyses of the text's vocabulary. - finally, submitting the corpus to various statistical analysis and processing methods that are typical of lexicometry in order to mostly study its lexical structure but also its “radical weft”. Thus, lexical richness, vocabulary increase, the distribution of lexical categories, lexical connectivity, etc., which are as many clues or elements that may characterize an author's style, a genre or a given time period, have been studied and analyzed. In this type of endeavor, it is essential that data retrieval be carried out in accordance with stable and precise procedures following careful deliberation about such notions as segmentation, lemmatization, disambiguation, categorization, etc. The figures that have been arrived at following the retrieval and quantification stages are then submitted to statistical processing and human interpretation in order to observe variation as measured in the various linguistic units of the corpus and describe its lexical structure. Key words : Arabic lexicometry, lexicological norm, lexical data retrieval, Arabic NLP, segmentation, lemmatization, disambiguation, categorisation, lexical structure, lexical richness, lexical categories, classic Arabic texts, corpus linguistics. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 14 15:09:48 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Nov 2008 16:09:48 +0100 Subject: Livres: Parutions diverses Message-ID: Date: Fri, 14 Nov 2008 07:14:09 +0100 From: marc arabyan Message-ID: www.lambert-lucas.com editeur en sciences du langage ******************** Viennent de paraitre (septembre et octobre 2008) ******************** (1) Cecile CANUT: LE SPECTRE IDENTITAIRE, ENTRE LANGUE ET POUVOIR AU MALI; ISBN 978-2-915806-47-2; 230 pages (ouvrage publie avec le concours de l'Universite Montpellier 3). ******************** (2) Paul JOUISON (1948-1991): COURS DE GESTES 1977-1978, preface de Brigitte GARCIA; collection "Archives de la langue des signes francaise"; ISBN 978-2-915806-24-3; 110 pages. ******************** (3) Jean-Marie ZEMB (1928-2007), ARISTOTE (traduction de Francois MULLER avec la collaboration de Robert MULLER); ISBN: 978-2-915806-59-5; 140 pages. ******************** (4) Coordonne par Pascal SINGY et Patrice GUEX, COMMUNICATION ET MEDECINE : LA PREVENTION DU SIDA AUPRES DES POPULATIONS MIGRANTES D'ORIGINE SUBSAHARIENNE; ISBN: 978-2-915806-83-0; 156 pages (ouvrage publie avec le concours de l'Universite de Lausanne). ******************** (5) Henri BOYER, LANGUE ET IDENTITE: SUR LE NATIONALISME LINGUISTIQUE; ISBN : 978-2-915806-87-8; 100 pages. ******************** (6) Jean-Francois JEANDILLOU, EFFETS DE TEXTES; ISBN: 978-2-915806-10-6; 340 pages (ouvrage publie avec le concours de l¹IUF). ******************** (7) Coordonne par Jean-Pierre SAUTOT, LE FILM DE CLASSE: ETUDE SEMIOTIQUE ET ENJEUX DIDACTIQUES; ISBN 978-2-915806-54-0; 200 pages (ouvrage publie avec le concours des Universites Lyon 1, Lyon 2 et Grenoble 3). ******************** (8) Coordonne par Ursula BAEHLER, Ruth GANTERT et Rita Catrina IMBODEN, PENSER LES METAPHORES (collection "Semiotique"); ISBN 978-2-915806-84-7; 120 pages (ouvrage publie avec le concours de l¹Académie Suisse des Sciences Sociales et Humaines). ******************** Pour recevoir regulierement nos informations, abonnez-vous a la newsletter en cliquant sur la commande ci-dessous et en envoyant le message sans rien changer: mailto:lambertlucas-request at ml.free.fr?subject=subscribe ******************** Marc Arabyan ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Mon Nov 17 11:24:41 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Mon, 17 Nov 2008 12:24:41 +0100 Subject: Info: Session intensive NooJ, Inalco, Clichy Message-ID: Date: Sat, 15 Nov 2008 12:16:33 +0100 From: Anaid Donabedian Message-ID: <491EAF91.4030606 at inalco.fr> X-url: http://www.nooj4nlp.net *Stage intensif : traiter un corpus avec NooJ* Formation organisée par le Cercle de linguistique de l’Inalco *26-30 janvier 2009 de 9h30 à 17h30* Centre Clichy 104, quai de Clichy 92110 CLICHY – Salle d’informatique de Clichy Ouvert aux étudiants de Master et de doctorat, ainsi qu’aux enseignants chercheurs (pour les étudiants de Master 1 ou 2, inscription pédagogique recommandée sous les codes LGE07115 et LGE08115 pour un total de 6 ECTS en ouverture) Animé par : Max Silberztein, INALCO, Université de Franche-Comté www.nooj4nlp.net NooJ est un environnement de développement linguistique qui propose des méthodologies et des outils pour annoter et étudier des corpus linguistiques dans des langues de tous types. Il permet de construire des ressources linguistiques, les tester en les appliquant à des textes de taille importante, et d’explorer un corpus en élaborant des requêtes adaptées à l’objectif et au cadre théorique de l’utilisateur. NooJ est un outil puissant, permettant de traiter des corpus de très grande taille. Son utilisation ne requiert pas de connaissances en programmation ou traitement automatique des langues. Au cours de ce séminaire intensif, je présenterai les points suivants : 1. Traitement de corpus : ouvrir un texte, gérer des corpus, lancer des requêtes et construire des concordances 2. Formalisation de la morphologie : morphologie flexionnelle (ex. conjugaison des verbes), morphologie dérivationnelle (ex. nominalisation d’un verbe), morphologie productive (ex. néologismes) 3. Construction d’un lexique NooJ : mots simples, mots composés et expressions figées 4. Syntaxe : requêtes syntaxiques, grammaires locales, le groupe nominal 5. Sémantique : extraction d’entités nommées, construction de paraphrases, analyse sémantique Les atouts de NooJ : NooJ permet de formaliser cinq niveaux de phénomènes linguistiques : orthographe, morphologie, lexique, syntaxe et sémantique. Pour chacun de ces niveaux, NooJ propose une méthodologie, un ou plusieurs formalismes adaptés, des outils-logiciels de développement et un ou plusieurs analyseurs automatiques de textes. Par exemple, au niveau morphologique, NooJ fournit deux formalismes pour décrire la flexion et la dérivation, un formalisme pour décrire la morphologie lexicale (par ex. pour représenter les familles de mots) et un formalisme pour entrer des règles de morphologie productive (par ex. pour formaliser la création de néologismes). Les outils et formalismes de NooJ sont tous compatibles entre eux de façon ascendante, et sont graduellement plus puissants au fur et à mesure qu’on monte dans la hiérarchie linguistique. Par exemple, le niveau orthographique utilise des machines à états finis ; le niveau syntaxique utilise des grammaires hors contexte ; le niveau sémantique utilise des réseaux de transition augmentés (Augmented Transition Networks ou ATN) dont la puissance est équivalente à celle d’une machine de Turing. Cette approche « multiple » apporte de nombreux avantages pour les travaux de description linguistique car chaque niveau de formalisation est décrit de la façon la plus naturelle possible : les linguistes disposent donc d’outils de développement et d’analyse parfaitement adaptés à leurs besoins de formalisation. Par ailleurs, des phénomènes très spécifiques à des langues très différentes, comme par exemple la variation orthographique (massive) en chinois, le traitement des voyelles absentes en arabe, la morphologie massive en hongrois etc. sont traités avec des outils parfaitement adaptés. NooJ fournit un environnement unifié à l’intérieur duquel ces outils communiquent entre eux grâce à une structure d’annotations (« Text Annotation Structure » ou TAS). Au-delà de la possibilité d’intégrer des ressources linguistiques de niveaux différents, la TAS permet de formaliser des phénomènes à cheval sur plusieurs niveaux linguistiques. Dans la limite des places disponibles Inscription : INALCO – École Doctorale Sandrine WONG (e-mail: sandrine.wong at inalco.fr ) 49 bis, avenue de la Belle Gabrielle 75012 PARIS Tél.: 01 80 51 95 06 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Mon Nov 17 11:25:46 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Mon, 17 Nov 2008 12:25:46 +0100 Subject: Seminaire: A. Vlachos - report au 21 novembre 10h30 Message-ID: Date: Fri, 14 Nov 2008 18:51:44 +0100 From: Antoine Rozenknop Message-ID: <491DBAB0.8030406 at lipn.univ-paris13.fr> X-url: http://www-lipn.univ-paris13.fr/ X-url: http://www-lipn.univ-paris13.fr/actualites/post/Unsupervised-and-Constrained-Dirichlet-Process-Mixture-Models-for-Verb-Clustering X-url: http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN X-url: http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20A3 Bonjour, En raison des grèves du 20 nov., *** le séminaire d'Andreas Vlachos est déplacé au 21 novembre à 10h30 en salle B311 *** . Merci de prévenir les personnes intéressées autour de vous et désolé pour les personnes qui ne pourront pas y assister. - ------------------- Le LIPN accueillera Andreas Vachlos, de l'Université de Cambridge, pour un séminaire qui portera sur des techniques de clustering, contraintes et non supervisées, appliquées au clustering lexical-sémantique des verbes. Le séminaire aura lieu au LIPN (Univ.Paris 13, campus de Villetaneuse) en salle B311, le vendredi 21 novembre à 10h30. Pour venir au LIPN, voir les informations sur : http://www-lipn.univ-paris13.fr/ Cordialement, Antoine Rozenknop - ------------------------ Title : Unsupervised and Constrained Dirichlet Process Mixture Models for Verb Clustering http://www-lipn.univ-paris13.fr/actualites/post/Unsupervised-and-Constrained-Dirichlet-Process-Mixture-Models-for-Verb-Clustering - ------------------------ Summary : In this work we apply Dirichlet Process Mixture Models (DPMMs) to a learning task in natural language processing (NLP): lexical-semantic verb clustering. Furthermore, we propose a novel method of guiding the DPMM towards a particular clustering solution using pairwise constraints. The quantitative and qualitative evaluation performed highlights the benefits of both standard and constrained DPMMs compared to previously used approaches. Results on datasets from general English and the biomedical domain are presented. - ---- Séminaires des équipes RCLN et A3 (pas encore mis-à-jour sur ce changement) : http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20A3 - ---- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Mon Nov 17 11:27:47 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Mon, 17 Nov 2008 12:27:47 +0100 Subject: Appel: RNTI, Fouille de Donnees d'Opinions (2eme appel) Message-ID: Date: Sat, 15 Nov 2008 11:43:16 +0100 (CET) From: Mathieu.Roche at lirmm.fr Message-ID: <3793.84.98.226.207.1226745796.squirrel at kirkenes.lirmm.fr> X-url: http://www.lirmm.fr/~mroche/FODOP08/Appel_RevueRNTI_opinions.pdf X-url: http://www.lirmm.fr/~mroche/FODOP08/ X-url: http://www.antsearch.univ-tours.fr/rnti/ ################### ########## ####### 2ème appel à soumissions pour ##### un numéro spécial de la Revue RNTI ### ## FOUILLE DES DONNEES D'OPINIONS # http://www.lirmm.fr/~mroche/FODOP08/Appel_RevueRNTI_opinions.pdf Objectifs de ce numéro spécial : ------------------------------ Pour faire suite à l'atelier FODOP'08 (http://www.lirmm.fr/~mroche/FODOP08/) sur la problématique de la fouille des données d'opinions, un numéro spécial est proposé sur cette même thématique. De plus en plus de documents contenant des informations exprimant des opinions ou des sentiments apparaissent sur le Web (i.e. commentaires ou évaluations de produits par des clients, forums, groupe de discussion, blogs). Aujourd’hui, la détection ou l'extraction automatique d'opinions devient un domaine de recherche particulièrement prometteur notamment avec le développement du Web 2.0. Elle devient essentielle pour de très nombreux domaines d'applications. Nous pouvons citer, par exemple, le développement de tâches de veille (technologique, marketing, concurrentielle, sociétale), l'évaluation d'un produit par la communauté avant un achat, l'image que les clients peuvent se faire d'une entreprise, la détection de rumeurs (buzz) sur le web, détection d'opinions émergentes et/ou significatives dans les forums, etc. Ainsi, les approches traditionnelles de fouille de données doivent être adaptées à un contexte dans lequel il faut appréhender de gros volumes de données particulièrement hétérogènes. L'objectif principal de ce numéro spécial est alors de décrire les différents traitements des données d'opinions. Thèmes développés (liste non exhaustive) : ---------------------------------------- – Catégorisation automatique de textes d'opinion – Ontologies et données d'opinion – Aide à la décision pour les données d'opinion – Visualisation pour une analyse des données d'opinion – Interrogation des données d'opinion – Acquisition de bases de données d'opinion – Veille technologique pour l'analyse des opinions – Détection de tendances dans les opinions – Fouille du Web pour acquérir et/ou analyser des textes d'opinion – TAL à partir de textes d'opinion - Analyse de discours Coordinateurs : ------------- - Mathieu Roche (LIRMM, Univ. Montpellier 2) - Pascal Poncelet (LIRMM, Univ. Montpellier 2) Comité de Rédaction : ------------------- – Nathalie Aussenac-Gilles (IRIT) – Catherine Berrut (LIG) – Vincent Claveau (IRISA) – Béatrice Daille (LINA) – Gérard Dray (LGI2P) – Marc El-Bèze (LIA) – Stéphane Ferrari (GREYC) – Patrick Gallinari (LIP6) – Jean-Gabriel Ganascia (LIP6) – Eric Gaussier (LIG) – Martine Hurault Plantet (LIMSI) – Anne Laurent (LIRMM) – Sigrid Maurel (CELI France) – Elisabeth Métais (Cedric CNAM) – Josiane Mothe (IRIT) – Patrick Paroubeck (LIMSI) – Michel Plantié (LGI2P) – Violaine Prince (LIRMM) – Christophe Roche (LISTIC) – Ludovic Tanguy (CLLE-ERSS) – Maguelonne Teisseire (LIRMM) - Anne Vilnat (LIMSI) Calendrier : ---------- ---------------------------------------------------------------- | 15 décembre 2008 : Soumission d'un résumé d'une page | 16 janvier 2009 : Soumission des articles | 13 mars 2009 : Notification aux auteurs | 10 avril 2009 : Envoi de la version finale des articles ---------------------------------------------------------------- Recommandations aux auteurs : --------------------------- Dans un premier temps, Une déclaration d'intention avec un résumé d'une page est à envoyer avant le 15 décembre 2008 à Mathieu Roche et Pascal Poncelet (mroche at lirmm.fr et poncelet at lirmm.fr). Les articles complets au format pdf devront êtres soumis avant le 16 janvier 2009. Ils devront respecter la feuille de style de la revue RNTI disponible sur le site http://www.antsearch.univ-tours.fr/rnti/. Les articles auront une longueur de 20 à 25 pages. Ils devront être écrits en français ou en anglais. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Mon Nov 17 11:29:23 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Mon, 17 Nov 2008 12:29:23 +0100 Subject: Conf: CatCod 2008, 4-5 decembre 2008, Orleans, France Message-ID: Date: Sat, 15 Nov 2008 19:35:02 +0100 From: "Serge HEIDEN" Message-ID: <016101c94750$df6bceb0$428233c1 at intranet.enslsh.fr> X-url: http://www.catcod.org X-url: http://www.catcod.org/spip.php?rubrique11 X-url: http://textometrie.ens-lsh.fr ************************************************ CatCod 2008 - Programme Premières rencontres internationales pour le Catalogage et le Codage de corpus oraux 4 - 5 Décembre 2008 à l'Université d'Orléans, France http://www.catcod.org ************************************************ Chers collègues, Voici le programme final du workshop CatCod 2008. La participation est libre. Si vous souhaitez que nous réservions pour vous : - le déjeuner du 4 - le dîner du 4 - le déjeuner du 5 Merci de préciser, en envoyant un mail à l'adresse catcod2008 at ens-lsh.fr, le nombre de personnes. Cordialement, Serge Heiden (pour le comité d'organisation) ________________________________________ CatCod2008 Program http://www.catcod.org/spip.php?rubrique11 Jeudi 4 décembre Time Program 10h30 Registration/Accueil 11h30 Welcome session/Bienvenue 12h00 Lunch at Agora restaurant/Déjeuner 13h30 invited speaker #1 14h15 Virginie André, Christophe Benzitoun, Emmanuelle Canut, Jeanne-Marie Debaisieux, Bertrand Gaiffe, Zina Tucsnak Fiche documentaire pour les données orales : description et traitement informatique 15h00 Olivier Baude, Linda Hriba De la variation à la norme, effets de codage dans les ESLOs 15h45 Break/Pause 16h15 Matthieu Quignard, Bertrand Gaiffe Encodage de corpus oraux en TEI 17h00 Michel Jacobson, Emmanuel Schang Propositions pour le catalogage des données sur les langues en contact 17h45 Jiahong Yuan, Mark Liberman Vowel Acoustic Space in Continuous Speech : An example of using audio books for research 18h30 End of session 20h Diner in Orléans Vendredi 5 décembre Time Programme 9h00 invited speaker #2 : Lou Burnard Spoken language metadata : is it shareable ? 9h45 Mohamed Belgacem Construction d'un corpus vocal pour la langue arabe 10h30 Break/Pause 10h45 Athanasios Karasimos, Dimitra Melissaropoulou, Dimitrios Papazachariou, Aggeliki Ralli GreeD : Cataloguing and Encoding Modern Greek Dialectal Oral Corpora 11h30 Christophe Parisse, Aliyah Morgenstern Annotations riches dans les corpus de langage oral : contraintes, choix et évolutivité des formats et des outils 12h15 Iris Eshkol, Marie-Aimée Gazeau, Denis Maurel Définition d'un balisage XML des entités nommées du corpus Eslo. Quelques pistes pour l'annotation des entités dénommantes 13h Lunch at Agora restaurant/Déjeuner 14h30 Michel Bert, Sylvie Bruxelles, Isabel Colon de Carvajal, Carole Etienne, Lorenza Mondada, Véronique Traverso, Daniel Valéro La transcription multimodale outillée : apports des logiciels d'alignement vidéo 15h15 Anne Dister, Liesbeth Degand, Anne-Catherine Simon A la recherche des unités minimales du discours : codages syntaxique et prosodique 16h Break/Pause 16h30 Thierry Bazillon, Yannick Estève, Daniel Luzzati Le codage des corpus oraux 17h15 Closing roundtable/table ronde de synthèse 18h30 End of workshop Where : - The workshop takes place in the Amphithéâtre IRD, (address : Centre IRD d'Orléans, 5 rue du Carbone, 45072 Orléans Cedex 2) - Lunch is at the Agora Restaurant on the campus of Orléans University ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:27:31 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:27:31 +0100 Subject: Job: Post-doctoral fellow, LiveMemories Message-ID: Date: Mon, 17 Nov 2008 14:19:16 +0100 (CET) From: Fausto Giunchiglia Message-ID: <55039.193.205.194.36.1226927956.squirrel at disi.unitn.it> X-url: http://livememories.fbk.eu/ X-url: http://www.disi.unitn.it/~fausto/ X-url: http://dit.unitn.it/~knowdive/ X-url: http://disi.unitn.it/welcome X-url: http://portale.unitn.it/ateneo/ X-url: http://www.apt.trento.it/ We are looking for a post-doctoral fellow interested in working in the LiveMemories project (http://livememories.fbk.eu/). (A position for a top student interested in pursuing a PhD as part of the same project is also available.) The research will be conducted under the direct supervision of Fausto Giunchiglia (http://www.disi.unitn.it/~fausto/) in the Knowdive Group (http://dit.unitn.it/~knowdive/), a large, multicultural and multidisciplinary group which is part of the Department of Computer Science and Information Engineering ( http://disi.unitn.it/welcome), University of Trento ( http://portale.unitn.it/ateneo/). Key words describing the research area of interest are: metadata management and visualization; human-computer interaction; mash-ups; social networks; geographical, spatial, and temporal data. Essential skills and knowledge relevant to the project are: • knowledge and experience concerning user interface design and evaluation, along with a general knowledge of human-computer interaction; • knowledge of languages and methodologies used for the development of rich dynamic web applications (e.g., HTML, JavaScript, XML, CSS, AJAX, mash-ups). Desirable skills and knowledge relevant to the project are: • understanding of the modeling primitives of the most popular social networks (e.g., Facebook, Myspace, Flickr) - particularly, knowledge of the open protocols of these networks as well as of related standardization initiatives (e.g., OpenSocial, LinkedData); • knowledge of the typical architectures of web-based applications and related methods and technologies (e.g., cookies, authorized access to web contents, dynamic generation of web contents); • knowledge of the principles of database design and of relevant languages and methodologies, such as ER diagram modeling, normal forms, SQL, and query optimization; • experience in developing applications under and/or administering at least one of the more popular DBMSs (e.g., Oracle, DB2, MySQL, PostgreSQL); • experience in working with geo-spatial databases (e.g, PostGIS); • experience with project management. Knowledge of Italian is not required. The ideal candidate holds a PhD with top performance in a field related to the areas mentioned above. (S)he should have a proven track record of system design and development as well as of conducting original research and publishing results in good conferences and journals. (S)he should be proactive, self-motivated, able to work independently and in a team, and capable of running projects and leading a small group of programmers and PhD students. The main activities and project responsibilities of the successful candidate and the persons they supervise will concern the design, implementation, and evaluation of user interfaces and associated functionality for: • accessing, managing, and sharing data, metadata, and ontologies in a multimedia environment; • accessing, managing, and sharing geographical, spatial, and temporal data; • enabling the use of social intelligence, including visualization, access, and management of communities; • organizational intelligence. The candidate and the supervisees will also design and implement an API and a mash-up language for metadata, data, and community integration, including temporal and spatial data. They will also supervise and manage the use in real world conditions of the systems that they develop. The successful candidate will be expected to create a small but strong group of programmers and PhD students that will produce top-level research and publish it in the major relevant venues. The successful candidate will support the project coordinator in the overall project management activities. These activities will include, among other things: managing their work and that of the collaborators; continuous monitoring and checking of the project results; producing project deliverables; and managing contacts and collaborations with the project partners. Salary: According to experience, but expected to fall in the range 24KEuro – 36KEuro/ year **NET**, including coverage of basic health insurance. Duration: 3 years plus possibly a few extra months, starting as soon as possible and ending with the end of the project. How to apply: Send your CV, a letter explaining your interest in the position, and the names of three referees by December 15th to: fausto at disi.unitn.it. About us: The Department of Information Engineering and Computer Science of the University of Trento is a leading and fast-growing research institution, characterized by a young and international faculty and a large, international student population. About Trento: Trento (http://www.apt.trento.it/) is a small vibrant city (around 100K people) with a beautifully preserved historic center, situated in the middle of the Dolomites. It is consistently ranked at the top in Italy for quality of life. Thanks to its fortunate location, Trento offers a wide variety of cultural and sports opportunities all year around, as well as excellent food and wine. Further information: Fausto Giunchiglia, fausto at disi.unitn.it ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:29:38 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:29:38 +0100 Subject: Job: Poste en CDI, EDF R&D, Ingenieur de Recherche en Statistique, Clamart Message-ID: Date: Mon, 17 Nov 2008 19:23:13 +0100 From: Claire WAAST-RICHARD Message-ID: X-url: http://www.edfrecrute.com Centre d’expertise, la Direction de la Recherche et du Développement d’EDF regroupe près de 2000 collaborateurs pour contribuer à la performance du Groupe et préparer l’avenir (innovation, études, construction d’outils et d’offres de services). Le Département pluridisciplinaire « Innovation Commerciale Analyse des Marchés et de leur Environnement » (ICAME) fournit un appui à l’élaboration et au portage des offres, des services et des outils de relation Client aux Directions opérationnelles du Groupe EDF et réalise notamment des études qui visent une meilleure connaissance des différentes clientèles, résidentielles, tertiaires et industrielles, collectivités locales du groupe EDF. Le Groupe « Statistique et Outils d’Aide à la Décision » étudie et met en œuvre plus particulièrement des méthodes d’analyse, de fouille et d’enrichissement de données issues d’entrepôts ou provenant de flux de données. Les domaines techniques particulièrement explorés sont : - l’échantillonnage et l’analyse statistique de données, dont les courbes de charge, - le data mining et ses extensions, en particulier, aux données complexes (texte, audio, issues du web), et aux flux de données, - l’informatique décisionnelle et les techniques d’extraction et de visualisation de l’information. Dans un contexte de fort développement, nous recherchons aujourd’hui un(e) : Ingénieur de Recherche en Statistique (H/F) Poste basé à Clamart (92) Vous participerez à des projets de recherche impliquant une double compétence en statistique et système d’information et investiguerez des approches de fouille de données au service de différentes problématiques métiers et enjeux du Groupe EDF, comme, par exemple, l’approfondissement de la connaissance des clients à travers des données d’entreprise ou des données externes structurées ou non. Vous aurez pour mission de proposer des méthodes d’analyse statistique (classifications, modélisations, analyse de données, …) et de les intégrer dans des outils de gestion décisionnelle. Ce poste vous permettra de comprendre les missions des différentes directions opérationnelles et d’envisager, à terme, un déroulement de carrière vers d’autres directions ou filiales internationales. Diplômé(e) d’une école d’ingénieur avec une spécialisation en statistiques, vos stages ou une première expérience vous ont permis de développer des compétences dans le domaine du data mining (méthodes et techniques). Vous connaissez idéalement les outils statistiques ou de data mining (SAS, SPAD, R ou S+) ainsi que la démarche décisionnelle (ETL, OLAPs) et ses outils associés. Au-delà d’un esprit d’analyse et de capacités de synthèse, vous faîtes aussi preuve de réactivité, d'autonomie et d'esprit d'initiative. Votre esprit d’équipe, votre adaptabilité et votre curiosité vous permettront de réussir dans un environnement techniquement et humainement stimulant. Anglais indispensable. Pour postuler suivre le lien : http://www.edfrecrute.com Dérouler les menus : "Accueil" -> "Nous rejoindre" -> "A partir de Bac + 5" Ref du poste: HU09-020 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:20:09 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:20:09 +0100 Subject: These: Remi BOVE, Analyse syntaxique automatique de l'oral, modification horaires Message-ID: Date: Tue, 18 Nov 2008 16:19:12 +0100 (CET) From: Remi BOVE Message-ID: <19611731.3451.1227021553081.JavaMail.root at frontal1> Bonjour à tous, Ce mail pour vous informer que la soutenance de ma thèse intitulée "Analyse syntaxique automatique de l'oral : étude des disfluences" le 25 novembre prochain qui était initialement prévue à 14h, sera finalement avancée à 13h30. Merci de votre compréhension, Bien cordialement, Rémi BOVE ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:31:38 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:31:38 +0100 Subject: Info: ELRA signed its first Language Resources distribution agreement Message-ID: Date: Tue, 18 Nov 2008 17:12:39 +0100 From: info at elda.org Message-ID: <4922E977.8080702 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1081 X-url: http://catalog.elra.info/product_info.php?products_id=1082 X-url: http://catalog.elra.info/product_info.php?products_id=1083 X-url: http://catalog.elra.info/product_info.php?products_id=1084 X-url: http://catalog.elra.info/search_result.php?keywords=w0045 X-url: http://www.elra.info/ X-url: http://www.elda.org/ X-url: http://www.kky.zcu.cz/en [Our apologies if you have received multiple copies of this announcement] // /Press Release - Immediate //Paris//, //France//, November//, 18^th 2008/// *Distribution Agreement* /ELRA signed its first Language Resources distribution agreement for Sign Language processing with the //University of West Bohemia./ ELRA and the University of West Bohemia (Department of Cybernetics) signed a Language Resources distribution agreement to announce the first sign-language databases made available in the ELRA catalogue. On behalf of ELRA, ELDA will act as the distribution agency for the University of West Bohemia, by incorporating to the ELRA Language Resources catalogue four audio-visual speech databases designed and collected for the training and testing of Czech audio-visual continuous speech recognition systems. The resources were built on covering the Czech sign-language, including one resource aiming to be used for training lip-/head-tracking systems under various illumination conditions independently of the language. State-of-the-art R&D work is currently taking place at the University of West Bohemia in areas such as audio-visual speech recognition, audi-visual speech synthesis, sign-language translation and sign-language synthesis, with efforts devoted to the deaf community. With these resources, ELRA is willing to extend the current catalogue, by offering a new type of resources: audio-visual resources for sign-language. With this agreement, the Department of Cybernetics will contribute further to the research and technology progress on audio-visual speech recognition systems. List of Resources: ELRA-S0283 Laboratory Conditions Czech Audio-Visual Speech Corpus (UWB-05-LCAVC) ELRA-S0284 Czech Audio-Visual Speech Corpus for Recognition with Impaired Conditions (UWB-07-ICAVR I) http://catalog.elra.info/product_info.php?products_id=1082 ELRA-S0285 Czech Sign Language Corpus for Recognition – Amateur Signer (UWB-06-SLR-A) http://catalog.elra.info/product_info.php?products_id=1083 ELRA-S0286 Czech Sign Language Corpus for Recognition – Professional Signer (UWB-07-SLR-P) http://catalog.elra.info/product_info.php?products_id=1084 http://catalog.elra.info/search_result.php?keywords=w0045 For more information on the ELRA catalogue, please contact: Valérie Mapelli, mapelli at elda.org For more information on ELRA & ELDA, please contact: Khalid Choukri, choukri at elda.org Hélène Mazo, mazo at elda.org ELDA 55-57, rue Brillat Savarin 75013 Paris (France) Tel.: +33 1 43 13 33 33 Fax: +33 1 43 13 33 30 *** About ELRA *** The European Language Resources Association (ELRA) is a non-profit making organisation founded by the European Commission in 1995, with the mission of providing a clearing house for language resources and promoting Human Language Technologies (HLT). To find out more about ELRA, please visit our web site: www.elra.info *** About ELDA *** The Evaluation and Language resources Distribution Agency (ELDA) is ELRA operational body. ELDA identifies, collects, markets, and distributes language resources, along with the dissemination of general information in the field of HLT. ELDA also participates in some evaluation projects and campaigns, has considerable knowledge and skills in HLT applications and has participated in many French, European and international projects. To find out more about ELDA, please visit our web site: www.elda.org *** About the Department of Cybernetics, University of West Bohemia *** The aim of the Department of Cybernetics' research activity is the building and development of systems theory and its application in the area of objectively and subjectively uncertain systems as well as in the planning of information and control systems. The basic activity of artificial intelligence is the research into sophisticated computer algorithms and methods of intelligent machine decision-making and classification. The reseach is mostly focused on the area of man-machine voice communication in natural language - automatic speech recognition (ASR). To find out more about the Department of Cybernetics, at the University of West Bohemia, please visit our web site: http://www.kky.zcu.cz/en ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:34:13 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:34:13 +0100 Subject: Appel: eLexicography in the 21st century: New challenges, new applications Message-ID: Date: Thu, 20 Nov 2008 12:10:42 +0100 From: "Magali Paquot" Message-ID: <675E9730A1C24FFAA060A8BEEB227298 at MAGALI01> X-url: http://www.uclouvain.be/en-cecl-elexicography.html Second call for papers - eLexicography in the 21st century: New challenges, new applications Organized by the Centre for English Corpus Linguistics (CECL), Université catholique de Louvain, under the aegis of the European Association for Lexicography (EURALEX) and the ACL Special Interest Group SIGLEX. Conference website: www.uclouvain.be/en-cecl-elexicography.html Venue: Louvain-la-Neuve, Belgium Date: 22-24 October, 2009 Organizers: Prof. Sylviane Granger and Dr Magali Paquot Conference theme: Innovative developments in the field of electronic lexicography Key dates - Deadline for submission of abstracts: 15 December 2008 - Notification of acceptance / rejection: 27 February 2009 Papers on the following topics are particularly welcome: - New technological environments (web-based dictionaries, mobile devices, etc.) - Exploitation of language resources: monolingual and multilingual corpora, learner corpora, lexical databases (e.g. WordNet). - Integration of NLP tools (grammatical annotation, speech synthesis, etc.) - Dictionary writing systems and other software available to the lexicographer - Changes to the dictionary macro- and microstructure afforded by the electronic medium (multiple access routes, efficient integration of phraseology, etc.) - Automated customisation of dictionaries in function of users’ needs (proficiency level, receptive vs. productive mode, register) - Integration of electronic dictionaries into language learning and teaching (CALL, translator training, etc.) Keynote speakers We are pleased to announce that the following speakers have accepted our invitation to give a keynote presentation at the conference: Ulrich Heid (Universität Stuttgart, Germany) Marie-Claude L’Homme (Université de Montréal, Canada) Hilary Nesi (Coventry University, Great-Britain) Michael Rundell (Lexicography MasterClass Ltd, Great-Britain) Piek Vossen (Vrije Universiteit Amsterdam, The Netherlands) Organising committee De Cock Sylvie (Facultés Universitaires Saint-Louis & CECL, Université catholique de Louvain, Belgium) Granger Sylviane (CECL, Université catholique de Louvain, Belgium) Paquot Magali (CECL, Université catholique de Louvain, Belgium) Rayson Paul (UCREL, Lancaster University, Great-Britain) Tutin Agnes (LIDILEM, Université Stendhal-Grenoble 3, France) Local committee De Cock Sylvie (Facultés Universitaires Saint-Louis & CECL, Université catholique de Louvain, Belgium) Decuyper Valérie (CECL, Université catholique de Louvain, Belgium) Gilquin Gaëtanelle (CECL, Université catholique de Louvain, Belgium) Granger Sylviane (CECL, Université catholique de Louvain, Belgium) Hugon Claire (CECL, Université catholique de Louvain, Belgium) Meunier Fanny (CECL, Université catholique de Louvain, Belgium) Paquot Magali (CECL, Université catholique de Louvain, Belgium) Thewissen Jennifer (CECL, Université catholique de Louvain, Belgium) Scientific committee Bogaards Paul (Leiden University, The Netherlands) Bouillon Pierrette (ISSCO, University of Geneva, Switzerland) Cowie Anthony (University of Leeds, Great-Britain) Campoy Cubillo, Maria Carmen (Universitat Jaume I, Spain) de Schryver Gilles-Maurice (Ghent University, Belgium) Drouin Patrick (Oservatoire de Linguistique Sens-Texte, Université de Montréal, Canada) Fairon Cédrick (CENTAL, Université catholique de Louvain, Belgium) Fellbaum Christiane (Princeton University, United States) Fontenelle Thierry (Microsoft Natural Language Group, United States) Glaros Nikos (Institute for Language and Speech Processing, Greece) Grefenstette Gregory (EXALEAD, France) Hanks Patrick (Masaryk University, Czech Republic) Kilgarriff Adam (Lexical Computing Ltd, Great-Britain) Korhonen Anna (University of Cambridge, Great-Britain) Herbst Thomas (Universität Erlangen, Germany) Lemnitzer Lothar (Universität Tübingen, Germany) Moon Rosamund (University of Birmingham, Great-Britain) Ooi Vincent (National University of Singapore, Republic of Singapore) Pecman Mojca (Université Paris Diderot - Paris 7, France) Piao Scott (The University of Manchester, Great-Britain) Rayson Paul (UCREL, Lancaster University, Great-Britain) Ronald Jim (Hiroshima Shudo University, Japan) Sierra Martinez Gerardo (GIL, Universidad Autónoma de México, México) Smrz Pavel (Brno University of Technology, Czech Republic) Sobkowiak Wlodzimierz (Adam Mickiewicz University, Poland) Tarp Sven (Centre for Lexicography, Aarhus School of Business, Denmark) Tutin Agnes (LIDILEM, Université Stendhal-Grenoble 3, France) Verlinde Serge (Katholieke Universiteit Leuven, Belgium) Yihua Zhang (Guangdong University of Foreign Studies, China) Zock Michael (CNRS - Laboratoire d’Informatique Fondamentale, France) The conference aims to be a showcase for the latest developments in the field and will feature both software demos and a book exhibition. A selection of papers will be invited for expansion into chapters for a book arising from the conference. Language of the conference: English Conference fee: - 230€ - Early-bird registration (until 30 June 2009): 200€ The conference fee includes: welcome reception, coffee breaks, two lunches (Thursday and Friday) and book of abstracts. Contact: elexicography at uclouvain.be For sponsoring options, please contact sylviane.granger at uclouvain.be ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:32:45 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:32:45 +0100 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Thu, 20 Nov 2008 12:50:16 +0100 From: info at elda.org Message-ID: <49254EF8.3080509 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1085 X-url: http://catalog.elra.info X-url: http://universal.elra.info X-url: http://www.elra.info/LRs-Announcements.html Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** ELRA is happy to announce that 1 new Evaluation Package is now available in its catalogue: * ELRA-E0017 CHIL 2006 Evaluation Package* The CHIL Seminars are scientific presentations given by students, faculty members or invited speakers in the field of multimodal interfaces and speech processing. The language is European English spoken by non native speakers. The recordings comprise the following: videos of the speaker and the audience from 4 fixed cameras, frontal close ups of the speaker, close talking and far-field microphone data of the speaker’s voice and background sounds. The CHIL 2006 Evaluation Package consists of: 1) A set of audiovisual recordings of seminars, called non-interactive seminars and of highly-interactive small working groups’ seminars, called interactive seminars. The recordings were done between 2004 and 2005 according to the “CHIL Room Setup” specification. 2) Video annotations. 3) Orthographic transcriptions. For more information, see: http://catalog.elra.info/product_info.php?products_id=1085 For more information on the catalogue, please contact Valérie Mapelli mailto:mapelli at elda.org Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:38:51 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:38:51 +0100 Subject: Appel: CALICO'09, Pre-Conference Workshop on Automatic Analysis of Learner Language Message-ID: Date: Sun, 23 Nov 2008 20:26:08 -0500 From: "Xiaofei Lu" Message-ID: <9dde48870811231726u4f50a46fkfe0e42caddb98488 at mail.gmail.com> X-url: http://purl.org/net/calico-workshop X-url: http://purl.org/calico/icall X-url: http://www.personal.psu.edu/xxl13 Second CFP for the CALICO'09 Pre-Conference Workshop on Automatic Analysis of Learner Language (AALL'09): From a better understanding of annotation needs to the development and standardization of annotation schemes March 10 or 11, 2009. Arizona State University, Tempe, AZ. Submission Deadline: December 1, 2008 In this workshop, we want to bring together researchers working on the analysis of learner language in the broad sense, including work on annotation schemes for learner corpora and NLP techniques used to detect learner errors and other learner language properties. We invite abstracts addressing these general issues, including but not limited to: - Which properties of learner language are useful and relevant to obtain for Foreign Language Teaching and current Second Language Acquisition research? - What annotation scheme or (error) taxonomy is appropriate for this and how do different annotation schemes compare? - How reliably can errors and other properties of learner language be obtained automatically given the current state-of-the art in NLP? - What is the impact of the specific properties of learner language on the (re)use of NLP technology? How does it impact performance and the potential use of such technology in foreign language teaching tools? - Which annotated learner language corpora have been used or could be used to evaluate the performance of different approaches to analyzing learner language? The workshop is intended to follow up on the pre-conference workshop on the Automatic Analysis of Learner Language held at CALICO 2008 (http://purl.org/net/calico-workshop). We invite submissions of anonymous two page abstracts in an email with the abstract as a pdf attachment. Name, affiliation, and email address should only be included in the text of the email, not in the abstract in the pdf attachment. Send submissions to: calico-workshop at ling.osu.edu Submission Deadline: December 1 Please use the following Subject: Submission to AALL '09 The workshop is organized by the ICALL Special Interest Group of CALICO (http://purl.org/calico/icall), currently chaired by Xiaofei Lu (Pennsylvania State University) and Detmar Meurers (Universität Tübingen). Questions on the event? Contact us at calico-workshop at ling.osu.edu -- Xiaofei Lu, Assistant Professor Department of Applied Linguistics The Pennsylvania State University http://www.personal.psu.edu/xxl13 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:47:57 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:47:57 +0100 Subject: Appel: EvalECD'09 - Extension de la date limite de soumission au 28 novembre 2008 Message-ID: Date: Mon, 24 Nov 2008 14:26:13 +0100 From: Nicolas Béchet Message-ID: <492AAB75.3020305 at lirmm.fr> X-url: http://www.lirmm.fr/~bechet/EvalECD X-url: http://www.lirmm.fr/~bechet/EvalECD/atelier_egc.cls Bonjour, [Veuillez nous excuser en cas de réceptions multiples] EXTENSION DE LA DATE DE SOUMISSION AU 28 NOVEMBRE 2008 Second appel à communications ============================= 1er atelier sur l'Évaluation des méthodes d'Extraction de Connaissances dans les Données (EvalECD) organisé dans le cadre de la conférence EGC 2009. le 27 janvier 2009, Strasbourg, France. Site web de l'atelier : http://www.lirmm.fr/~bechet/EvalECD Contact : evalecd09 at lirmm.fr L'objectif de cet atelier est de discuter des techniques d'évaluation utilisées dans différents domaines et de montrer leurs qualités et leurs limites. Un tel atelier ouvert aux différentes communautés d'EGC permet de compléter et/ou généraliser les travaux présentés dans des ateliers très spécifiques (par exemple, ateliers de TIA'05, COLING'08 en Traitement Automatique des Langues). Cet atelier permettra ainsi de proposer un début de solutions aux problèmes occasionnés par la diversité des évaluations en ECD. Thèmes développés (liste non limitative) ======================================= * Protocoles d'évaluation (automatiques, semi-automatiques, manuels) * Mesures d'évaluation (Précision, Rappel, F-Mesure, Courbes ROC, ...) * Tuning : spécifications des paramètres * Construction de benchmarks * Validation de connaissances en ECD * Expertise humaine en TAL et en IC * Évaluation en Intégration de Données et en Réconciliation de Données * Évaluation des outils d'IHM (ergonomie, visualisation) Dates importantes ================= * Soumission des articles : *28 novembre 2008* * Notification aux auteurs : 22 décembre 2008 * Soumission de la version finale : 5 janvier 2009 * EvalECD 2009 : 27 janvier 2009 Modalités de soumission ======================= Les articles soumis peuvent être rédigés en français ou en anglais, sur environ 12 pages incluant toutes les références et les figures. Les articles pourront être beaucoup plus courts, en particulier pour les articles présentant un travail qui débute. Les soumissions se feront au format PDF. Le format requis pour les actes de l'atelier EvalECD'09 (latex uniquement) est le suivant : http://www.lirmm.fr/~bechet/EvalECD/atelier_egc.cls Les soumissions devront être envoyées à l'adresse ci-après avant le *28 novembre 2008* : evalecd09 at lirmm.fr Organisateurs ============= - Nicolas Bechet (LIRMM) - Mathieu Roche (LIRMM) - Fatiha Saïs (LRI/INRIA-Saclay-Île-de-France) Comité de Programme =================== - Bernd Amann (LIP6) - Jean-Yves Antoine (LI) - Jérôme Azé (LRI) - Zohra Bellahsène (LIRMM) - Catherine Berrut (LIG) - Patrice Buche (INRA - Unité Mét at risk) - Bich-Liên Doan (Supélec) - Stéphane Lallich (ERIC) - Anne Laurent (LIRMM) - Nathalie Pernelle (LRI, INRIA Saclay-Île-de-France) - Pascal Poncelet (LIRMM) - Chantal Reynaud (LRI, INRIA Saclay-Île-de-France) - Christophe Roche (LISTIC) - Bernard Rothenburger (IRIT) - Laurent Simon (LRI, INRIA Saclay-Île-de-France) - Maguelonne Teisseire (LIRMM) - Alexandre Termier (LIG) - Fabien Torre (LIFL) - Juan Manuel Torres-Moreno (LIA) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:49:15 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:49:15 +0100 Subject: Sujet de These: Bourse de Doctorat en analyse syntaxique probabiliste (PhD funding) Message-ID: Date: Mon, 24 Nov 2008 16:02:54 +0100 From: Alexis Nasr Message-ID: <492AC21E.5090502 at lif.univ-mrs.fr> [english version below] Offre de thèse au Laboratoire d'Informatique Fondamentale dans le domaine de l'analyse syntaxique probabiliste Lieu : Laboratoire d'Informatique Fondamentale (Marseille) Date : 1/1/2009 Durée : 3 ans Cette thèse s'inscrit dans le projet ANR Sequoia qui porte sur l'analyse syntaxique probabiliste à large couverture du français. Le sujet de la thèse pourra porter sur différents aspects du projet selon le profil des candidats. Le candidat retenu sera accueilli par l'équipe Traitement Automatique du Langage Ecrit et Parlé ou par l'équipe Bases de Données et Apprentissage Automatique, selon son profil. Deux thèmes sont privilégiés : - grammaires probabilistes . extraction de grammaires probabilistes à partir de banques d'arbres . modèles probabilistes pour la syntaxe - réordonnancement des analyses produites par un analyseur . étude des différents modèles de réordonnancement (boosting, support vector machines ...) . réordonancement de forêts d'analyse . intégration des deux phases d'analyse syntaxique et de réordonnancement. Profil recherché : - formation en TAL ou en apprentissage automatique - maîtrise des langages c et c++ - volonté de travailler à la frontière entre TAL et apprentissage automatique Contacts: Alexis Nasr alexis.nasr at lif.univ-mrs.fr Liva Ralaivola liva.ralaivola at lif.univ-mrs.fr ------------------------------------------------------------------------ 3 yeard PhD funding at the Laboratoire d'Informatique Fondamentale in the field of probabilistic parsing Location : Marseille, France Starting : 1/1/2009 This PhD is part of a French National Research Agency funded project on large scale probabilistic parsing of French. Depending on the candidate's profile, the PhD subject will concern different aspects of the project. Priority will be given to two aspects : - probabilistic grammars . probabilistic grammar extraction from treebanks . probabilistic models for syntax - reranking of the parses produced by a parser . study of the current reranking models (boosting, support vector machines ...) . reranking of a parse forest . integration of the parser and the reranker in a single process The successful candidate should : - hold a relevant degree in the field of Natural Language Processing or Machine Learning. - master the C and C++ programming languages - have the will to work at the frontier of Natural Language Processing or Machine Learning. Contacts: Alexis Nasr alexis.nasr at lif.univ-mrs.fr Liva Ralaivola liva.ralaivola at lif.univ-mrs.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:52:39 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:52:39 +0100 Subject: Livre: La pertinence et ses origines Message-ID: Date: Mon, 24 Nov 2008 22:14:54 +0100 (CET) From: Jean-Louis Dessalles Message-Id: <200811242114.mAOLEskV009978 at fantomas.enst.fr> X-url: http://www.enst.fr/~jld/POC ============================== J'ai le plaisir d'annoncer la parution d'un nouveau livre: "La pertinence et ses origines cognitives - nouvelles théories" http://www.enst.fr/~jld/POC Ce livre propose plusieurs "lois" qui modélisent notre sensibilité à la pertinence des prises de parole spontanées. La principale nouveauté est la découverte du rôle central que joue la notion mathématique de complexité, qui semble spontanément mesurée par les êtres humains. Une situation apparaît comme pertinente dès lors qu'elle est moins "complexe" que prévu. Le livre pose également la question de la raison-d'être biologique de notre exigence de pertinence. Il propose l'une des premières théories de son émergence qui soit compatible avec le cadre darwinien. ============================== jean-louis Dessalles www.telecom-paristech.fr/~jld ============================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:56:45 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:56:45 +0100 Subject: Appel: ALLT 2009 Message-ID: Date: Tue, 25 Nov 2008 14:52:04 +0800 (CST) From: spwang2005 at yahoo.com.tw Message-ID: <924603.99972.qm at web73312.mail.tp2.yahoo.com> X-url: http://www.afl.ntust.edu.tw/p0.htm X-url: http://intl-house.howard-hotels.com.tw/ Call for Abstracts 2009 International Conference on Applied Linguistics & Language Teaching (ALLT) April 16-18, 2009 Conference Themes : Second language acquisition (SLA): Theory and application Corpus/Corpora in Language Application & Teaching CALL and Web in Applied Linguistics and Language Teaching Cross Culture and Literature in Language Teaching Language testing & assessment Language for Specific Purposes (LSP) in Application & Teaching Teaching Chinese as a Second Language (TCSL): Trends and Challenges Translator and interpreter training theories and practices Educational objectives of applied English / foreign language programs Other relevant topics are also welcome. Plenary, Featured and Keynote Speakers TESOL: 1. Professor Amy Tsui 2. Professor Martin Bygate (Department of Linguistics, University of Lancaster) (to be confirmed) 3. Professor Mike Scott (WordSmith)   Linguistics & Chinese TCSL 1. 王士元教授 (香港中文大學,中研院院士) 2. 嚴翼相教授 (漢陽大學國際語學院院長) 3. 楊信彰教授 (廈門大學外語學院院長) 4. 曾志朗教授 (中研院院士)   Corpus Linguistics 1. Professor Lou Burnard (BNC) 2. 鄭錦全教授 (伊利諾大學,中研院院士) 3. Professor Mike Scott (WordSmith)   Interpretation & Translation 1. Prof. Mariachiara Russo 2. 陳平教授 (澳洲昆士蘭大學語言系)   Featured Colloquiums, Workshops and Activities 1. Papers, workshops, and colloquiums (3-4 persons as a team preferred) 2. Methodology: qualitative vs. quantitative 3. Seminar for journal papers: writing and submission 4.演講比賽 Studies in English Language and Literature http://intl-house.howard-hotels.com.tw/   重要日期 ■ 摘要截止日: 97年12月20日 (摘要請勿超過350字,並請將檔案mail至: (allt at mail.ntust.edu.tw) Please check              □Paper        □Student Session         □workshop   □colloquium ■摘要接受通知日期: 97年12月30日 ■全文截稿日: 98年3月5日(10-12 頁) ■會議日期: 98年4月16~18日                Website: http://www.afl.ntust.edu.tw/p0.htm   錄取之稿件請郵寄至以下地址:  台灣科技大學應用外語系 2009 International Conference 台北市 106 大安區基隆路 4 段 43 號 (Paper submission requires 2 hardcopies, one 3.5 diskette, MSWord 6.0 or above; APA/MLA style)   Conference Chair, 林院長茂松 (台灣科技大學人文社會學院) Conference convener: 鄧主任慧君 (台灣科技大學應用外語系) Conference organizer: Dr. Joe Wang Contact person: 沈雁(Emy)、何曉雯(Claire)  (claire at mail.ntust.edu.tw; allt at mail.ntust.edu.tw) Tel: 886-2 2730-3602 Fax: 886-2-2730-1112 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:57:37 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:57:37 +0100 Subject: Appel: TIME 2009 Message-ID: Date: Tue, 25 Nov 2008 17:01:02 +0100 From: Carsten Lutz Message-id: X-url: http://www.inf.unibz.it/krdb/events/time-2009/ X-url: http://www.easychair.org/conferences/?conf=time2009 TIME 2009 Call for Papers Sixteenth International Symposium on Temporal Representation and Reasoning Brixen, Italy, July 23-25, 2009 http://www.inf.unibz.it/krdb/events/time-2009/ The TIME symposium series is a well-established annual event that brings together researchers from all areas of computer science that involve temporal representation and reasoning. This includes, but is not limited to, artificial intelligence, temporal databases, and the verification of software and hardware systems. In addition to fostering interdisciplinarity, the TIME symposia emphasize bridging the gap between theoretical and applied research. TIME 2009 encompasses three tracks, but has a single program committee. The conference will span three days, and will be organized as a combination of technical paper presentations, poster sessions, and keynote lectures. * IMPORTANT DATES Abstract Submission: April 6 Paper Submission: April 9 Paper Notification: May 11 Camera Ready Copy Due: May 22 TIME 2009 Symposium: July 23-25 * TOPICS Track 1: Temporal Representation and Reasoning in AI - temporal aspects of agent- and policy-based systems - spatial and temporal reasoning - reasoning about actions and change - planning and planning languages - ontologies of time and space-time - belief and uncertainty in temporal knowledge - temporal learning and discovery - time in problem solving (e.g. diagnosis, scheduling) - time in human-machine interaction - temporal information extraction - time in natural language processing - spatio-temporal knowledge representation systems - spatio-temporal ontologies for the semantic web Track 2: Temporal Database Management - temporal data models and query languages - temporal query processing and indexing - temporal data mining - time series data management - stream data management - spatio-temporal data management, including moving objects - data currency and expiration - indeterminate and imprecise temporal data - temporal constraints - temporal aspects of workflow and ECA systems - real-time databases - time-dependent security policies - privacy in temporal and spatio-temporal data - temporal aspects of multimedia databases - temporal aspects of e-services and web applications - temporal aspects of distributed systems - novel applications of temporal database management - experiences with real applications Track 3: Temporal Logic and Verification in Computer Science - specification and verification of systems - verification of web applications - synthesis and execution - model checking algorithms - verification of infinite-state systems - reasoning about transition systems - temporal architectures - temporal logics for distributed systems - temporal logics of knowledge - hybrid systems and real-time logics - tools and practical systems - temporal issues in security * PAPER SUBMISSION Submissions of high quality papers describing research results or on-going work are solicited. Submitted papers should contain original, previously unpublished content, should be written in English, and must not be simultaneously submitted for publication elsewhere. Submitted papers will be refereed by at least three reviewers for quality, correctness, originality, and relevance. Accepted papers will be presented at the symposium and included in the proceedings, which will be published by the IEEE Computer Society Press. Acceptance of a paper is contingent on one author presenting the paper at the symposium. Submissions should be in PDF format (with the necessary fonts embedded). They must be formatted according to the IEEE guide- lines described at ftp://pubftp.computer.org/press/outgoing/ proceedings/8.5x11 - Formatting files/ and must not exceed 8 pages; over-length submissions may be rejected without review. Papers are submitted electronically via Easychair: http://www.easychair.org/conferences/?conf=time2009 * CONFERENCE OFFICERS General Chair: David Toman, University of Waterloo, Canada Program Committee Chairs: Carsten Lutz, University of Bremen, Germany Jean-Francois Raskin, Free University of Brussels, Belgium Organization Chair: Alessandro Artale, Free University of Bozen-Bolzano, Italy * PROGRAM COMMITTEE Peter van Beek, University of Waterloo, Canada Claudio Bettini, University of Milan, Italy Thomas Brihaye, University of Mons-Hainaut, Belgium Franck Cassez, National ICT Australia Jan Chomicki, University at Buffalo, USA Carlo Combi, University of Verona, Italy Alessandro Cimatti, IRST, Italy Stephane Demri, CNRS, France Bernd Finkbeiner, Saarland University, Germany Michael Fisher, Liverpool, UK Tim French, University of Western Australia, Australia Antony Galton, University of Exeter, UK Alfonso Gerevini, University of Brescia, Italy Valentin Goranko, University of Witwatersrand, South Africa Rajeev Gore, ANU, Australia Keijo Heljanko, Helsinki University of Technology, Finland Ian Hodkinson, Imperial College, UK Ulrich Hustadt, University of Liverpool, UK George Kollios, Boston University, USA Orna Kupferman, Hebrew University, Israel Francois Laroussinie, CNRS, France Salvatore Latorre, University of Salerno, Italy Nicolas Markey, CNRS, France Rupak Majumdar, University of California, USA Angelo Montanari, University of Udine, Italy Madhusudan Parthasarathy, University of Illinois, USA Ian Pratt-Hartmann, Manchester University, UK Jochen Renz, Australian National University, Australia Roger Villemaire, UQAM, Canada Sean Wang, University of Vermont, USA Jef Wijsen, University of Mons-Hainaut, Belgium Ouri Wolfson, University of Illinois, USA Pierre Wolper, University of Liege, Belgium Frank Wolter, University of Liverpool, UK James Worrell, Oxford University, UK Michael Zakharyaschev, Birkbeck College, UK Carlo Zaniolo, University of California, USA * FURTHER INFORMATION Questions related to submission, reviewing, and program: time09 at informatik.uni-bremen.de Questions related to local organization: artale at inf.unibz.it ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:58:45 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:58:45 +0100 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Tue, 25 Nov 2008 18:32:13 +0100 From: info at elda.org Message-ID: <492C369D.502 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1087 X-url: http://catalog.elra.info/product_info.php?products_id=1088 X-url: http://catalog.elra.info X-url: http://universal.elra.info X-url: http://www.elra.info/LRs-Announcements.html Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** ELRA is happy to announce that 2 new Speech Resources are now available in its catalogue: * ELRA-S0292 Danish EUROM1 (EUROM1_D) *EUROM1 is the first really multilingual speech database produced in Europe. Over 60 speakers per language pronounced numbers, sentences, isolated words using close talking microphone. For more information, see: http://catalog.elra.info/product_info.php?products_id=1087 *ELRA-S0293 The HIWIRE database, a noisy and non-native English speech corpus for cockpit communication* The database contains 8,099 English utterances pronounced by non-native speakers (31 French, 20 Greek, 20 Italian, and 10 Spanish speakers). The collected utterances correspond to human input in a command and control aeronautics application. The data was recorded in studio with a close-talking microphone and real noise recorded in an airplane cockpit was artificially added to the data. The signals are provided in clean (studio recordings with close talking microphone), low, mid and high noise conditions. The three noise levels correspond approximately to signal-to-noise ratios of 10dB, 5dB and -5 dB respectively. For more information, see: http://catalog.elra.info/product_info.php?products_id=1088 For more information on the catalogue, please contact Valérie Mapelli mailto:mapelli at elda.org Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:42:51 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:42:51 +0100 Subject: Appel: AFLiCo 3, 27-29 mai 2009, Paris 10-Nanterre Message-ID: Date: Thu, 27 Nov 2008 13:04:32 +0100 From: Guillaume Desagulier Message-ID: <492E8CD0.8030505 at univ-paris8.fr> X-url: http://www.modyco.fr X-url: http://www.modyco.fr/aflico3 (toutes nos excuses pour les envois multiples) SECOND APPEL A COMMUNICATIONS (version en anglais plus bas) 3e Colloque International de l’Association Française de Linguistique Cognitive (AFLiCo) « Grammaires en construction(s) » Organise par le laboratoire MoDyCo (http://www.modyco.fr) Universite Paris 10, Nanterre, La Defense, France 27-29 mai 2009 http://www.modyco.fr/aflico3 INTERVENANTS INVITES Hans C. BOAS (Univ. du Texas, Austin, USA) Gilles FAUCONNIER (Univ. de Californie, San Diego, USA) Jacques FRANÇOIS (Univ. de Caen, France) Adele GOLDBERG (Univ. de Princeton, USA) Stephane ROBERT (LLACAN, ENS, France) Bernard VICTORRI (Lattice, ENS, France) Richard WATTS (Univ. de Berne, Suisse) OBJECTIFS DU COLLOQUE Cette conference a pour but de reunir les acteurs de la linguistique cognitive en France et au dela, et de renforcer la collaboration entre chercheurs entamee lors des deux precedentes editions a Bordeaux (2005) et Lille (2007) Le concept de grammaire a une importance cruciale dans le cadre theorique de la linguistique cognitive et de nombreuses problematiques se construisent à partir de lui. Entite cognitive construite (par les linguistes, mais aussi par les locuteurs) et / ou emergente (soumise à la variation et au changement, car regulee par des forces tout à la fois conservatrices et innovantes) la grammaire est au centre d’enjeux theoriques considerables. Elle occupe des lors une position-cle qu’il faut interroger. Dans le prolongement des deux precedents colloques de l’AFLiCo, il s’agit donc de focaliser notre attention sur une nouvelle dimension de la linguistique cognitive, un concept qui se decline de differentes façons, depuis la grammaire cognitive de Langacker jusqu’aux grammaires dites de constructions. Ces dernieres, en particulier, constituent aujourd’hui la branche la plus dynamique de ce cadre general de par le nombre de publications et l’impact de ces recherches sur differents niveaux de la linguistique (syntaxe, semantique, morphologie et pragmatique). SESSIONS GENERALES Le colloque AFLiCo 3 sera aussi l’occasion d’aborder des problematiques reliees à la question de la grammaire (liste non-exhaustive) : - La notion d’unite linguistique en rapport avec d’autres concepts comme l’enracinement (entrenchment) ou la frequence d’occurrence. - Une comparaison entre les differentes traditions (americaines et europeennes) liees au figement, à la lexicalisation, etc. - La question de l’apprentissage de la grammaire (L1, L2) - Un point de vue diachronique sur les constructions et la grammaticalisation des constructions - La question des methodes (constitution et utilisation de corpus) - Les prolongements de la linguistique cognitive dans la socio-pragmatique Dans le sillage des deux precedents colloques, nous encourageons les propositions de communication portant sur les passerelles entre la linguistique cognitive (au sens large) et la Theorie des Operations Enonciatives de Culioli, l’approche adamczewskienne ou la Psychomecanique du Langage. Le comite d’organisation encourage les jeunes chercheurs a envoyer une proposition de communication. Il est a noter que les communications peuvent porter sur toutes les langues, pas seulement le francais ou l’anglais. SESSIONS THEMATIQUES Les responsables de panels pour les sessions thematiques doivent fournir les renseignements suivants : - un resume du theme choisi ; - des precisions concernant la structure globale de la session : ordre des presentations, contributions des intervenants, pauses, debats ; - les resumes des communications de chacun des intervenants, ainsi que les renseignements demandes dans la procedure de soumission ci-dessous. Les intervenants sont libres de choisir la structure interne de leur session thematique des lors qu’elle n’affecte pas la structure generale du colloque (pauses cafe, et dejeuner). Nous recommandons que chaque session thematique ne depasse pas une matinee ou une apres-midi. Pour tout renseignement sur l’organisation d’une session thematique, n’hesitez pas a nous contacter (aflico3 at u-paris10.fr). PROCEDURE DE SOUMISSION Chaque proposition sera evaluee par deux relecteurs. Les textes doivent etre anonymes et ne pas depasser 500 mots (hors bibliographie). Ils sont a envoyer par email en fichier attache (MS-WORD -- doc ou rtf -- OpenOffice, PDF) à l’adresse suivante : aflico3 at u-paris10.fr Dans l’objet de votre message, specifiez : ‘abstract AFLICO’ Dans le corps du message, precisez : - le nom de l’auteur / des auteurs - titre - affiliation et adresse de l’auteur / des auteurs - presentation ou poster - session thematique ou session generale - 3 à 5 mots-cles DATES IMPORTANTES Date limite de soumission : Sessions generales : 15 decembre 2008 Sessions thematiques : 8 decembre 2008 (date repoussée) Notification d’acceptation : debut fevrier 2009 INSCRIPTION Des renseignements specifiques concernant la procedure d’inscription et les dates limites seront affiches tres prochainement sur le site. FRAIS D'INSCRIPTION tarif normal (participants/public) : 80 euros membres d'AFLiCo : 60 euros etudiants : 40 euros etudiants membres de l'AFLiCo : 30 euros Pour rejoindre l'AFLiCo, merci de contacter Stephanie Bonnefille (stephanie.bonnefille at univ-tours.fr) LANGUES DU COLLOQUE Anglais, Français SITE DU COLLOQUE http://www.modyco.fr/aflico3 NOUVEAU SITE DE L'AFLICO http://www.aflico.fr/ COMITE D’ORGANISATION Guillaume Desagulier, (MCF, MoDyCo-CNRS & Universite Paris 10, Universite Paris 8) Philippe Grea (MCF, MoDyCo - CNRS & Universite Paris 10) Assistes de Simon Harrison (ENS-Lyon), Dylan Glynn (Universite Catholique de Louvain) COMITE SCIENTIFIQUE President : Dominique Legallois, MCF, Universite de Caen Michel Achard (Professeur, Rice University) Cristiano Broccias (MCF, Universite de Genes) Jose Deulofeu (Professeur, Universite de Provence, Aix-Marseille 1) Pierre Encreve (Directeur d'etudes, EHESS) Gilles Fauconnier (Professeur, Universite de Californie, San Diego) Michel de Fornel (Directeur d'etudes, EHESS) Jean-Michel Fortis (CR, CNRS, Paris 7) Jacques François (Professeur, Universite de Caen) Dylan Glynn (Charge de recherche, Universite Catholique de Louvain) Craig Hamilton (Assoc. Prof., Universite de Haute Alsace, Mulhouse-Colmar) Martin Haspelmath (Professeur, Max-Planck-Institut, Leipzig) Hans-Petter Helland (Professeur, Universite d’Oslo) Willem Hollmann (MCF, University of Lancaster) Sylvain Kahane (Professeur, Universite Paris 10) Anne Lacheret (Professeur, Universite Paris 10) Bernard Laks (Professeur, Universite de Paris 10) Jean-Remi Lapaire (Professeur, Universite de Bordeaux 3) Peter Lauwers (Charge de recherche, Universite Catholique de Louvain) Maarten Lemmens (Professeur, Universite de Lille 3) Danielle Leeman (Professeur, Universite de Paris 10) Sarah Leroy (CR, MoDyCo-CNRS, Universite Paris 10) Wilfrid Rotge (Professeur, Universite de Paris 10) Dominique Willems (Professeur, Universite de Gand) ======== (apologies for multiple postings) SECOND CALL FOR PAPERS Third International Conference of the French Cognitive Linguistics Association (AFLiCo 3) “Grammars in construction(s)”. Organized by MoDyCo (http://www.modyco.fr) University of Paris 10, Nanterre, France 27-29 May 2009 http://www.modyco.fr/aflico3 PLENARY SPEAKERS Hans C. BOAS (University of Texas at Austin, USA) Gilles FAUCONNIER (University of California, San Diego, USA) Jacques FRANCOIS (University of Caen, France) Adele GOLDBERG (Princeton University, USA) Stephane ROBERT (LLACAN, CNRS, France) Bernard VICTORRI (Lattice, ENS, France) Richard WATTS (University of Bern, Switzerland) OBJECTIVES The conference aims at bringing together cognitive linguists working in France and abroad, and strengthening the network of discussion and collaboration set in motion by the first two AFLiCo conferences held in Bordeaux (2005) and Lille (2007). The concept of grammar is of crucial importance to the cognitive linguistics framework and forms the basis for numerous research topics. As a constructed cognitive entity (by linguists or speakers), and/or an emergent one, grammar lies at the heart of considerable theoretical issues. The core position currently held by grammar is thus one to be questioned. Drawing on the themes from the last two AFLiCo conferences, we will examine the concept of grammar in regard to its place in cognitive linguistics, as well as in regard to its place in variants of the model, which range from Langacker’s Cognitive Grammar to so-called construction grammars. This year, the focus will be on the latter. In the wake of Charles Fillmore and Paul Kay’s work, construction grammars endeavor to describe grammar not in terms of “words and lists” (as in generative grammar) but in terms of grammatical constructions whose overall meanings are not predictable from their respective component structures. This enterprise was initially limited to idiomatic constructions (e.g., throw in the towel, kick the bucket, etc.) but swiftly developed to deal with more general constructions (cf. Adele Goldberg’s work on meaningful argument structure). The idea that grammar is composed of constructions – previously identifiable in the works of George Lakoff and Ronald Langacker – currently fuels a vast paradigm and applies to a large variety of linguistic phenomena in morphology, syntax, semantics, and pragmatics. GENERAL SESSIONS The 3rd AFLiCo conference will also provide the occasion to address more general points of discussion in relation to the question of grammar (non-exhaustive list): - The notion of linguistic units as linked to other concepts such as entrenchment or frequency of occurrence - Comparisons between different traditions (American and European) regarding the establishment of a linguistic unit as a cognitive routine, lexicalization, the symbolic thesis, etc. - The acquisition of grammar (L1, L2) - Constructions and diachrony - The grammaticalization of constructions - Methodological concerns (constitution and use of corpora) - Grammars of gesture and kinesic systems - The role of conceptual integration and grammatical blending in grammar - The extension of cognitive linguistics into socio-pragmatics In line with one of the main goals of AFLiCo, we welcome papers elaborating the affinities between cognitive linguistics and related theories (Gustave Guillaume, Antoine Culioli, Henri Adamczewski). The organizers further encourage young researchers to submit an abstract. It is to be noted that papers can bear on any language (not just English or French) THEMATIC SESSIONS Organizers of theme sessions are kindly asked to provide the following information: - a short description of their session topic (300-500 words); - an indication of the structure proposed for the whole session: order of presentations, discussant contributions, breaks, and general discussion by the audience; - the abstracts from all of their speakers, accompanied by all the information requested in the abstract specifications above. Proponents can choose the internal structuring of their Theme Session provided that the overall timetable of the conference (notably coffee and lunch breaks) is kept intact. Ideally, a theme session should take no longer than a whole morning or afternoon. For any further detail you may need in the organization of your theme session, please do not hesitate to contact the organizers (aflico3 at u-paris10.fr). SUBMISSION PROCEDURE Abstracts will be submitted to a double, blind review. They should be fully anonymous and not exceed 500 words (references excluded). To be sent via email as attachment (MS-WORD doc or rtf, OpenOffice, PDF) to: aflico3 at u-paris10.fr Please put in the subject line: ‘abstract AFLICO 3’ In the body of the mail, please specify: - author(s) - title - affiliation of author(s) - presentation or poster - thematic sessions or general session - 3 - 5 keywords IMPORTANT DATES Submission deadline General sessions: December 15th 2008 Theme sessions: December 8th 2008 (extended) Notification of acceptance : Early February 2009 REGISTRATION Details about the registration procedure and registration deadlines will be posted on the conference website as soon as they become available. REGISTRATION FEES Regular fee (participants/audience) : 80 euros AFLiCo members : 60 euros Students : 40 euros Students (including AFliCo membership) : 30 euros If you wish to join the AFLiCo, please contact Stephanie Bonnefille (stephanie.bonnefille at univ-tours.fr) OFFICIAL LANGUAGES French, English CONFERENCE WEBSITE http://www.modyco.fr/aflico3 NEW AFLiCo WEBSITE http://www.aflico.fr/ ORGANIZING COMMITTEE Guillaume Desagulier (Associate Professor, MoDyCo-CNRS-Paris 10, & University of Paris 8) Philippe Grea (Associate Professor, MoDyCo, Paris 10), assisted by Simon Harrison (PhD student, ENS-Lyon), Dylan Glynn (Research Fellow, University of Leuven) SCIENTIFIC COMMITTEE President: Dominique Legallois (Associate Professor, University of Caen) Michel Achard (Professor, Rice University) Cristiano Broccias (University of Genoa) Jose Deulofeu (Professor, Universite de Provence, Aix-Marseille 1) Pierre Encreve (Directeur d'etudes, EHESS) Gilles Fauconnier (Professor, University of California, San Diego) Michel de Fornel (Directeur d'etudes, EHESS) Jean-Michel Fortis (CNRS, Paris 7) Jacques François (Professor, Universite de Caen) Dylan Glynn (Research fellow, University of Leuven) Craig Hamilton (Assoc. Prof., Universite de Haute Alsace, Mulhouse-Colmar) Martin Haspelmath (Prof. Dr., Max-Planck-Institut, Leipzig) Hans-Petter Helland (Professor, University of Oslo) Willem Hollmann (Lecturer, University of Lancaster) Sylvain Kahane (Professor, Universite de Paris 10) Anne Lacheret (Professor, Universite de Paris 10) Bernard Laks (Professor, Universite de Paris 10) Jean-Remi Lapaire (Professor, Universite de Bordeaux 3) Peter Lauwers (Lecturer, Universities of Ghent & Leuven) Danielle Leeman (Professor, Universite de Paris 10) Maarten Lemmens (Professor, Universite de Lille 3) Sarah Leroy (CR, MoDyCo-CNRS, Universite de Paris 10) Wilfrid Rotge (Professor, Universite de Paris 10) Dominique Willems (Prof, Dr., University of Ghent) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:44:29 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:44:29 +0100 Subject: Conf: Congres mondial sur la traduction specialisee, 8-13 decembre 2008, La Havane, Cuba Message-ID: Date: Thu, 27 Nov 2008 15:34:44 +0100 From: Adriana Lau Message-Id: <7.0.1.0.2.20081127153430.0696d1c8 at unilat.org> X-url: http://dtil.unilat.org/cmte2008 X-url: http://dtil.unilat.org/cmte2008/fr/programa.htm X-url: http://dtil.unilat.org/cmte2008/fr/inscripcion.htm X-url: http://dtil.unilat.org/ http://dtil.unilat.org/cmte2008 Congrès mondial sur la traduction spécialisée Langues et dialogue interculturel dans un univers en mondialisation Du 8 au 13 décembre 2008 Hôtel Habana Libre, à La Havane (Cuba) Le but de ce Congrès, dans lequel quelque 300 personnes sont attendues, est de souligner l’importance du travail du traducteur spécialisé, garant du multilinguisme. Programme détaillé : http://dtil.unilat.org/cmte2008/fr/programa.htm Inscriptions : http://dtil.unilat.org/cmte2008/fr/inscripcion.htm ______________________________________________________________________ Adriana Lau DTIL Unió LLatina - Unión Latina - Union latine - Unione Latina - União Latina - Uniunea Latina 131, rue du Bac - 75007 Paris T. +33 (0) 1 45 49 60 62 F. +33 (0) 1 45 49 67 39 a.lau at unilat.org http://dtil.unilat.org/ Info terminologie/a : www.terminometro.info ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:48:20 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:48:20 +0100 Subject: Journee: Journees d'Etude Projet PEPS Relations, 15-16 decembre 2008, MSH Paris Nord Message-ID: Date: Thu, 27 Nov 2008 22:19:04 +0100 From: "Sylviane R. Schwer" Message-Id: X-url: http://www.mshparisnord.org/acces.htm Le projet "PEPS Relations" a le plaisir de vous annoncer la tenue de leurs Journées d'Etudes les lundi 15 et mardi 16 décembre 2008 a la Maison des Sciences de l'Homme de Paris Nord (4 rue de la croix Faron, Plaine Saint-Denis) accès http://www.mshparisnord.org/acces.htm L'inscription, les pauses cafés et les buffets des déjeuners sont gratuits sous réserve de s'être inscrit(e) avant 6 décembre auprès de schwer at lipn.univ-paris13.fr, en indiquant si vous souhaitez déjeuner et quels jours. Bien à vous programme prévisionnel : Lundi 15 décembre 2008 (9h15-18h) ---------------------------------- matin Café accueil Sylviane Schwer : Présentation du projet PEPSRelations Frédéric Nef : "relations ou nexus ?" François Clémentz "Relations internes, relations externes : le double malentendu" Jean-Baptiste Rauzy : "les relations chez Leibniz" Déjeuner-discussion autour d'un buffet après-midi Pierre-André Buvet : "la relation d'appropriation en linguistique" Dale Miller : Relations: their uses in programming and computational specifications Robert Strandh : Implanter les relations dans un langage fonctionnel Mardi 16 décembre 2008 (9h15-18h) ---------------------------------- matin Café accueil Fred Landman : "n-places relations in natural languages" Lucia Tovena & Sylviane Schwer : quelques spécificités de la relations partie-tout dans le cas du verbe. Alain Lecomte : "la ludique: un cadre sans relation d'identité ?" Déjeuner-discussion autour d'un buffet après-midi Christian Retore : les relations dans les modèles de la logique linéaire Pierre Livet : les problèmes spécifiques de représentation des relations sociales Emmanuel Lazega : Les relations dans les réseaux sociaux Synthèse Ces journées sont organisées avec le soutien des organismes suivants : We gratefully acknoledge the support of: - département STIC du CNRS - Université Paris Nord - Laboratoire d'informatique de Paris Nord (LIPN, UMR 7030) - Maison des Sciences de l'Homme de Paris Nord ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:50:34 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:50:34 +0100 Subject: Seminaire: Laboratoire Modyco, programme de la seance du 10 decembre 2008 Message-ID: Date: Fri, 28 Nov 2008 09:41:49 +0100 From: GREA Message-ID: <492FAECD.8040500 at u-paris10.fr> X-url: http://www.modyco.fr/index.php?events:s%C3%A9minaire X-url: http://www.modyco.fr/aflico3/img/Plan_campus_oct_2008.pdf X-url: http://www.modyco.fr/?u_s=1&u_a=845&sid= *Université Paris Ouest Nanterre La défense* Séminaire du laboratoire MoDyCo Contact : Colette Noyau colette.noyau at free.fr, Philippe Gréa philippe.grea at u-paris10.fr Laboratoire UMR 7114 MoDyCo, 200, avenue de la République 92001 Nanterre Cedex Métro : RER Nanterre Université Horaires : 14h00-16h30 Bat. B, salle de conférences Programme http://www.modyco.fr/index.php?events:s%C3%A9minaire Plan http://www.modyco.fr/aflico3/img/Plan_campus_oct_2008.pdf *SEANCE DU 10 DECEMBRE* - 14h00 - 14h45 : F. Tamburini Computational methods for different linguistic phenomena - 14h45 - 15h15 : Pause - 15h15 - 16h00 : M. Nissim Data and models for semantic and discourse processing - 16h00 - 16h30 : J.-R. Lavie Anaphore complexe, syllepse et autres figures, le principe “Trouver Un Prédicat » RESUMES / ABSTRACTS http://www.modyco.fr/?u_s=1&u_a=845&sid= ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:51:20 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:51:20 +0100 Subject: Job: Stage linguiste pour le japonais - LINGWAY Message-ID: Date: Fri, 28 Nov 2008 12:46:34 +0100 From: Hugues de Mazancourt Message-Id: <9DF4015F-84D3-43DD-B8C7-7A0BB7B80B2A at lingway.com> X-url: http://www.lingway.com/ Ingénieur Linguiste CDD - japonais Lieu: Le Kremlin-Bicêtre (Paris/Porte d'Italie) Stage rémunéré Durée: 4 mois ou plus Dates: début 2009 Lingway (www.lingway.com), leader européen des moteurs de recherche verticaux, recherche, dans le cadre de son offre "search" en japonais un(e) LINGUISTE INFORMATICIEN(NE) pour le japonais Rattaché-e au pôle R&D, vous aurez pour mission de: - tester/valider le moteur de recherche en japonais, - participer au développement de la version japonaise de notre analyseur linguistique, - contribuer à la version japonaise du dictionnaire Lingway, Compétences requises: - langue japonaise courante - pratique de l'analyse automatique des langues - pragmatique, autonome, aimant le travail en équipe Compétences souhaitables: - lexicographie - pratique de l'étude de corpus, - connaissance de Perl, Expressions régulières, etc. - connaissance du japonais technique Adresser CV + lettre de motivation à hugues.de-mazancourt at lingway.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:53:28 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:53:28 +0100 Subject: Revue: RFLA XIII-2 / Communiquer par la parole Message-ID: Date: Fri, 28 Nov 2008 13:09:53 +0100 From: Publiling Message-Id: <5.0.2.1.2.20081128130759.02cd2e38 at pop.wanadoo.fr> X-url: http://www.rfla-journal.org Parution de la Revue Française de Linguistique Appliquée - volume XIII-2 / décembre 2008: Communiquer par la parole: des processus complexes Sommaire (résumés, et informations sur les numéros déjà parus, disponibles sur le site de la revue : http://www.rfla-journal.org) Louis-Jean Boë, Hélène Lœvenbruck, Anne Vilain (Grenoble, GIPSA Lab) (5-7) Présentation. La communication parlée: développements récents de la recherche Jean-Luc Schwartz, Marc Sato, (Grenoble) Luciano Fadiga (Ferrara) (9-22) The common language of speech perception and action: a neurocognitive perspective Hélène Lœvenbruck, Marion Dohen, Coriandre Vilain (Grenoble) (23-33) From gestural pointing to vocal pointing in the brain Susanne Fuchs (ZAS/Phonetik, Berlin) & Pascal Perrier (Grenoble) (35-44) Understanding speech production: The PILIOS approach Serge Pinto & Alain Ghio (Aix-en-Provence) (45-57) Troubles du contrôle moteur de la parole: contribution de l’étude des dysarthries et dysphonies à la compréhension de la parole normale Louis-Jean Boë (Grenoble), Lucie Ménard (Montréal), Jihène Serkhane (New-York), Peter Birkholz (Rostock), Bernd Kröger (Aachen), Pierre Badin (Grenoble), Guillaume Captier (Montpellier), Mélanie Canault (Strasbourg), Nicolas Kielwasser (Cluses) (59-80) La croissance de l’instrument vocal: Contrôle, modélisation, potentialités acoustiques et conséquences perceptives Barara Davis (Austin, Texas), Sophie Kern (Lyon), Anne Vilain, Claire Lalevée (Grenoble) (81-91) Des babils à Babel: les premiers pas de la parole Séverine Millotte (Genève) (93-102) Le jeune enfant à la découverte des mots Leonardo Maria Savoia (Florence) & Elisabetta Carpitelli (Grenoble) (103-119) Problèmes de micro-variation phonologique dans les domaines dialectaux de l’Italie septentrionale Gérard Bailly, Frédéric Elisei, Stephan Raidt (Grenoble) (121-131) Boucles de perception-action et interaction face-à-face Compte rendu On ne parle pas franglais. La langue française face à l’anglais, de P. Bogaards (133-134) Le numéro : 25 Euros (+ 3 Euros de frais d’envoi) Commande (envoi direct de chèque (libellé en euros) ou demande de facture) à : Publications Linguistiques / secrétariat administratif 15, rue Lakanal, F-75015 Paris e-mail : publiling at wanadoo.fr Règlement par chèque bancaire ou postal (libellé en euros), ou par virement international à l’ordre de : Publications Linguistiques Compte La Banque Postale Paris : 30041 00001 27 562 53 H 020 94 IBAN : FR80 3004 1000 0127 5625 3H02 094 BIC : PSST FRPP PAR Compte Caisse d’Epargne Paris: 17515 90000 042939212 28 53 IBAN : FR76 1751 5900 0004 2939 2122 853 BIC : CEPA FRPP 751 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:54:28 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:54:28 +0100 Subject: These: Florian Boudian, Resume automatique de texte Message-ID: Date: Fri, 28 Nov 2008 15:06:31 +0100 From: Juan Manuel Torres Moreno Message-ID: <492FFAE7.4040608 at univ-avignon.fr> Bonjour, J'ai le plaisir de vous annoncer la soutenance de thèse en informatique de Florian BOUDIN au Laboratoire Informatique d'Avignon (LIA). Elle porte sur les approches statistiques pour le résumé automatique de texte. La thèse aura lieu le vendredi 5 décembre 2008 à 13h30, dans l'amphi Pascal de l'IUP UAPV/Avignon (Site Agroparc). Vous êtes cordialement invités. -- Juan Manuel TORRES-MORENO Responsable de la thématique TALNE LIA/Université d'Avignon Laboratoire Informatique d'Avignon BP 1228, 84911 Avignon Cedex 9, FRANCE Tél: (+33) 04 90 84 35 68 fax: (+33) 04 90 84 35 01 ======================================================================= Titre: Exploration d'approches statistiques pour le résumé automatique de texte Résumé: Un résumé est un texte reformulé dans un espace plus réduit. Il doit exprimer avec un minimum de mots le contenu essentiel d'un document. Son but est d'aider le lecteur à repérer les informations qui peuvent l'intéresser sans pour autant devoir lire le document en entier. Mais pourquoi avons-nous tant besoin de résumés? Simplement parce que nous ne disposons pas d’assez de temps et d’énergie pour tout lire. La masse d'information textuelle sous forme électronique ne cesse d'augmenter, que ce soit sur Internet ou dans les réseaux des entreprises. Ce volume croissant de textes disponibles rend difficile l'accès à l'information désirée sans l'aide d'outils spécifiques. Produire un résumé est une tâche très complexe car elle nécessite des connaissances linguistiques ainsi que des connaissances du monde qui restent très difficiles à incorporer dans un système automatique. Dans cette thèse de doctorat, nous explorons la problématique du résumé automatique par le biais de trois méthodes statistiques permettant chacune la production de résumés répondant à une tâche différente. Nous proposons une première approche pour la production de résumé dans le domaine spécialisé de la Chimie Organique. Un prototype nommé Yachs a été développé pour démontrer la viabilité de notre approche. Ce système est composé de deux modules, le premier applique un pré-traitement linguistique particulier afin de tenir compte de la spécificité des documents de Chimie Organique tandis que le second sélectionne et assemble les phrases à partir de critères statistiques dont certains sont spécifiques au domaine. Nous proposons ensuite une approche répondant à la problématique du résumé automatique multi-documents orienté par une thématique. Nous détaillons les adaptations apportées au système de résumé générique Cortex ainsi que les résultats observés sur les données des campagnes d’évaluation DUC. Les résultats obtenus par la soumission du LIA lors des participations aux campagnes d'évaluations DUC 2006 et DUC 2007 sont discutés. Nous proposons finalement deux méthodes pour la génération de résumés mis-à-jour. La première approche dite de maximisation-minimisation a été évaluée par une participation à la tâche pilote de DUC 2007. La seconde méthode est inspirée de Maximal Marginal Relevance (MMR), elle a été évaluée par plusieurs soumissions lors de la campagne TAC 2008. Mots clés: Traitement Automatique du Langage Naturel, Résumé Automatique, Méthodes Statistiques, Chimie Organique, Maximal Marginal Relevance, Document Understanding Conference, Text Analysis Conference. ======================================= ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:06:49 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:06:49 +0100 Subject: Appel: MULTICONF-09 Message-ID: Date: Sat, 1 Nov 2008 13:31:10 -0400 From: "Henry Dawson" Message-ID: <71ed09fa0811011031j51fea1b4p31672140905c0f70 at mail.gmail.com> X-url: http://www.PromoteResearch.org MULTICONF-09 call for papers The 2009 Multi Conference in Computer Science, Information Technology and Control systems and Computational Science and Computer Engineering (MULTICONF-09) (website: http://www.PromoteResearch.org ) will be held during July 13-16 2009 in Orlando, FL, USA. We invite draft paper submissions. The event consists of the following conferences: ? International Conference on Artificial Intelligence and Pattern Recognition (AIPR-09) ? International Conference on Automation, Robotics and Control Systems (ARCS-09) ? International Conference on Bioinformatics, Computational Biology, Genomics and Chemoinformatics (BCBGC-09) ? International Conference on Enterprise Information Systems and Web Technologies (EISWT-09) ? International Conference on High Performance Computing, Networking and Communication Systems (HPCNCS-09) ? International Conference on Information Security and Privacy (ISP-09) ? International Conference on Recent Advances in Information Technology and Applications (RAITA-09) ? International Conference on Software Engineering Theory and Practice (SETP-09) ? International Conference on Theory and Applications of Computational Science (TACS-09) ? International Conference on Theoretical and Mathematical Foundations of Computer Science (TMFCS-09) The website http://www.PromoteResearch.org contains more details. Sincerely Henry Dawson Publicity committee ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:09:04 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:09:04 +0100 Subject: Habilitation: Thierry Poibeau, Des mots au texte. Analyse semantique pour l'acces a l'information Message-ID: Date: Mon, 03 Nov 2008 22:31:36 +0100 From: Thierry.Poibeau at lipn.univ-paris13.fr Message-ID: <20081103223136.0tyeqdh4wccgsg44 at intranet.lipn.univ-paris13.fr> X-url: http://www.univ-paris13.fr/upn/accesv.htm# X-url: http://www-lipn.univ-paris13.fr/~poibeau/ Bonjour, J'ai le plaisir de vous inviter ? la soutenance de mon Habilitation ? Diriger des Recherches intitul?e "Des mots au texte. Analyse s?mantique pour l'acc?s ? l'information" (r?sum? ci-dessous), ainsi qu'au pot qui suivra. La soutenance aura lieu le mercredi 26 novembre 2008 ? partir de 10h15, dans la salle L322 de l'universit? Paris 13 (pour se rendre ? l'universit? Paris 13 : cf. http://www.univ-paris13.fr/upn/accesv.htm# ; la salle se trouve dans le b?timent num?rot? L2 sur le plan accessible depuis le site de l'Universit? -- attention : la salle L322 est situ?e au sein du laboratoire LPMTM et non au LIPN) Cordialement, Thierry Poibeau ------ Laboratoire d'Informatique de Paris-Nord CNRS UMR 7030 et Universit? Paris 13 99, avenue Jean-Baptiste Cl?ment 93430 Villetaneuse http://www-lipn.univ-paris13.fr/~poibeau/ Tel. +33 (0)1 49 40 28 26 Fax. +33 (0)1 48 26 07 12 ______________ Composition du jury : Catherine Fuchs (CNRS-Lattice, rapporteur) Beno?t Habert (ENS-LSH, rapporteur) Maria Teresa Pazienza (U. Rome tor Vergata, rapporteur) Michel Denis (CNRS-LIMSI) Daniel Kayser (U. Paris 13) Adeline Nazarenko (U. Paris 13) Pierre Zweigenbaum (CNRS-LIMSI) ______________ Des mots au texte Analyse s?mantique pour l'acc?s ? l'information R?sum? Pourquoi est-il si difficile de comprendre une langue de mani?re automatique, m?me si on ne vise qu'une compr?hension limit?e, factuelle et orient?e vers des faits connus ? La langue, telle qu'elle s'offre ? nous, semble trop mall?able pour ?tre directement appr?hendable par ordinateur. C'est pourtant ? ce probl?me que je me suis int?ress? : comment identifier du semblable dans des productions langagi?res si vari?es, comment rep?rer des fragments de signification au milieu d'un oc?an de textes ? Mon m?moire d'Habilitation se compose de quatre chapitres. Je reviens tout d'abord sur certains d?veloppements r?cents de la linguistique informatique, pour montrer que la disponibilit? de gros corpus a entra?n? une forte op?rationnalisation du domaine. Cette ?volution n'est pas neutre th?oriquement : je pense que l'apport des corpus et des techniques d'acquisition dynamique de connaissances (notamment par les techniques d'apprentissage) rend tout ? fait plausible l'id?e d'une s?mantique fond?e sur l'usage. Les trois chapitres suivants portent chacun sur un niveau d'analyse diff?rent (niveau lexical pour l'annotation s?mantique, niveau pr?dicatif pour l'extraction de relations, niveau textuel pour la mod?lisation de documents sp?cialis?s). Je d?fends l'id?e d'un continuum entre ces niveaux, du fait notamment que tous partagent des similarit?s fondamentales, ce qui peut se manifester parfois de mani?re tr?s visible et influer sur les techniques utilis?es. Je reviens, dans la conclusion, sur les similitudes observ?es entre ces diff?rents paliers : la question de la relation entre mots et concepts, les bords flous des cat?gories envisag?es, leur grande variabilit? sur le plan linguistique. Je m'interroge sur le lien entre traitement automatique des langues (TAL) et linguistique, avant de proposer quelques perspectives permettant de poursuivre ce travail par d'autres chemins. ------ >From Words to Text, Semantic Analysis for Information Access Abstract Why is it so difficult to automatically understand a language even when what is targeted is only a limited kind of understanding, based on known facts? A key reason is the great variability in language, which is too challenging for a computer. This is the problem I try to tackle: how to identify similar meanings among different expressions? How to identify fragments of meaning in a sea of texts? This thesis consists of four chapters. I first consider recent developments in computational linguistics: I show that the availability of large corpora has resulted in more functional Natural Language Processing (NLP). This evolution carries the potential of a major impact on theory: corpora and automatic acquisition of knowledge from corpora (especially using machine learning techniques) makes it possible to get semantics based on language use. Each of the next three chapters deals with a different level of analysis (lexical semantics for semantic annotation, predicative semantics for relation extraction, and text semantics for technical document modelling). I suggest the idea of a continuum between these levels, since they all share fundamental similarities that affect the techniques used. I emphasize, in the conclusion, the similarities between these three different levels: the complex problem of the relations between words and concepts, the fuzziness of linguistic categories, the great variability of language. I conclude with a discussion on the relationship between NLP and linguistics, before proposing future research through alternative routes. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:11:13 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:11:13 +0100 Subject: Seminaire: Alpage (P. Muller), 10 novembre 2008 Message-ID: Date: Tue, 4 Nov 2008 12:39:41 +0100 From: Benoit Crabb? Message-Id: X-url: http://alpage.inria.fr/seminaire.fr.html X-url: http://li.linguist.jussieu.fr ******************* S?minaire Alpage ******************* S?minaire de l'?cole doctorale de Paris 7 Il s'agit du s?minaire de recherche en linguistique informatique organis? par l'?quipe Alpage, Alpage est une nouvelle ?quipe mixte Inria -- Paris 7 issue de la fusion des ?quipes Atoll et Talana. L'?quipe centre ses int?r?ts scientifiques autour de l'analyse syntaxique automatique et du traitement du discours pour la langue fran?aise. Ce s?minaire remplace l'ancien s?minaire Talana. Il se tient le lundi de ***14.00*** ? ***16.00*** tous les 15 jours. Il a lieu en salle 131 au 30 rue du Chateau des Rentiers 75013 Paris (premier ?tage) Toute personne int?ress?e est la bienvenue. ************************************************************* Lundi 10 novembre 2008, Philippe Muller (Irit) nous parlera de : "La c?r?monie de comm?moration du 11 novembre aura lieu le dimanche 12 novembre" M?thodologies pour une ?tude empirique de l'information temporelle en langage naturel R?sum? : --------------------- Les informations de nature temporelle jouent un r?le important dans la compr?hension d'un texte en langage naturel. Apr?s avoir mobilis? beaucoup de chercheurs sur le plan th?orique, ce n'est que r?cemment que ce probl?me a suscit? des travaux visant ? son automatisation dans des cadres empiriques plus syst?matiques. Le d?veloppement de la norme TimeML pour l'annotation de l'anglais a entra?n? un effort dans la sp?cification des repr?sentations de cette information. Cela concerne l'identification des dates et des ?v?nements d'un texte, ?tablir une date et une dur?e pour les ?v?nements, l'ordonnancement des ?v?nements, et la r?solution en contexte de r?f?rences sous-sp?cifi?es. L'information temporelle pose cependant un certain nombre de probl?mes m?thodologiques au-del? d'un simple probl?me d'extraction d'information. Nous pr?senterons notamment les probl?mes que pose l'?valuation des liens entre ?v?nements, une information qui concerne un texte dans son ensemble, et les moyens de l'aborder. ----------------------- Page web du s?minaire : http://alpage.inria.fr/seminaire.fr.html Cursus Linguistique informatique de Paris 7 : http://li.linguist.jussieu.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:14:20 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:14:20 +0100 Subject: Appel: EACL 2009 Workshop on Cognitive Aspects of Computational Language Acquisition Message-ID: Date: 04 Nov 2008 11:56:12 +0000 From: Thierry Poibeau Message-ID: X-url: http://www.cam.ac.uk/cs/email/scanner/ X-url: http://www-lipn.univ-paris13.fr/~poibeau/cognitive/ X-url: http://www.eacl2009.gr/conference/authors 2nd Call for Papers EACL 2009 Workshop on COGNITIVE ASPECTS OF COMPUTATIONAL LANGUAGE ACQUISITION 30 or 31 March 2009 Athens, Greece http://www-lipn.univ-paris13.fr/~poibeau/cognitive/ ----------------------------------------------- Workshop Description ==================== This workshop is focused on the relevance of computational learning methods for research on human language acquisition. Developing and applying such computational techniques that can improve our understanding of human language acquisition will not only benefit cognitive sciences in general, but will also reflect back to NLP and place us in a better position to develop useful language models. The workshop aims to bring together researchers from the diverse fields of NLP, machine learning, artificial intelligence, (psycho)linguistics, etc. who are interested in the relevance of computational techniques for understanding human language learning. The workshop is intended to bridge the gap between the computational and cognitive communities, promote knowledge and resource sharing, and help initiate interdisciplinary research projects. Success in this type of research requires close collaboration between NLP and cognitive scientists. To this end, interdisciplinary workshops can play a key role in advancing existing and initiating new research. This was demonstrated by some successful events like the previous edition of this workshop held at ACL 2007. Areas of interest ================= Papers are invited on, but not limited to, the following topics: - Computational learning theory and analysis of language learning - Computational models of human (first, second and bilingual) language acquisition - Computational models of various aspects of language acquisition, and their interaction with each other - Computational models of the evolution of language - Data resources and tools for investigating computational models of human language acquisition - Empirical and theoretical comparisons of the learning environment and its impact on the acquisition task - Computational methods for acquiring various linguistic information (related to e.g. speech, morphology, lexicon, syntax, semantics, and discourse) and their relevance to research on human language acquisition - Investigations and comparisons of supervised, unsupervised and weakly-supervised methods for learning (e.g. machine learning, statistical, symbolic, biologically-inspired, active learning, various hybrid models) from the cognitive aspect Papers can cover one or more of these areas. Submission Information ====================== Papers should describe original work and should indicate the state of completion of the reported results. In particular, any overlap with previously published work should be clearly mentioned. Submissions will be judged on correctness, novelty, technical strength, clarity of presentation, usability, and significance/relevance to the workshop. Submissions should follow the two-column format of the EACL 2009 main-conference proceedings and should not exceed eight (8) pages, including references. We strongly recommend the use of either the LaTeX style file or the Microsoft-Word Style file, which can be found at http://www.eacl2009.gr/conference/authors. The reviewing will be blind. Therefore, the paper should not include the authors' names and affiliations. Furthermore, self- citations and other references that could reveal the author's identity should be avoided. Submission will be electronic. The only accepted format for submitted papers is Adobe PDF. Papers must be submitted no later than December 19, 2008 using the submission webpage that will be available soon. Submissions will be reviewed by 3 members of the Program Committee. Authors of accepted papers will receive guidelines regarding how to produce camera-ready versions of their papers for inclusion in the EACL workshop proceedings. Notification of receipt will be emailed to the contact author. Important Dates =============== - Paper submission deadline: 19 December 2008 - Acceptance notification sent: 30 January 2009 - Final version deadline: 13 February 2009 - Workshop date: 30 or 31 March 2009 Workshop Chairs =============== - Thierry Poibeau (CNRS and University Paris 13, France) - Afra Alishahi (University of Saarland, Germany)) - Aline Villavicencio (Federal University of Rio Grande do Sul, Brazil and University of Bath, UK) Address any queries regarding the workshop to: cognitive2009 at gmail.com Program Committee ================= - Colin J Bannard (Max Planck Institute for Evolutionary Anthropology, Germany) - Marco Baroni (University of Trento, Italy) - Robert C. Berwick (Massachusetts Institute of Technology, USA) - Jim Blevins (University of Cambridge, UK) - Rens Bod (University of Amsterdam, Netherlands) - Antal van den Bosch (Tilburg University, The Netherlands) - Chris Brew (Ohio State University, USA) - Ted Briscoe (University of Cambridge, UK) - Robin Clark (University of Pennsylvania, USA) - Stephen Clark (University of Oxford, UK) - Matthew W. Crocker (Saarland University, Germany) - James Cussens (University of York, UK) - Walter Daelemans (University of Antwerp, Belgium and Tilburg University, The Netherlands) - Ted Gibson (Massachusetts Institute of Technology, USA) - Henriette Hendriks (University of Cambridge, UK) - Julia Hockenmaier (University of Illinois at Urbana-Champaign, USA) - Marco Idiart (Federal University of Rio Grande do Sul, Brazil) - Mark Johnson (Brown University, USA) - Aravind Joshi (University of Pennsylvania, USA) - Anna Korhonen (University of Cambridge, UK) - Alessandro Lenci (University of Pisa, Italy) - Massimo Poesio (University of Trento, Italy) - Brechtje Post (University of Cambridge, UK) - Ari Rappoport (The Hebrew University of Jerusalem, Israel) - Dan Roth (University of Illinois at Urbana-Champaign, USA) - Kenji Sagae (University of Southern California, USA) - Sabine Schulte im Walde (University of Stuttgart, Germany) - Mark Steedman (University of Edinburgh, UK) - Suzanne Stevenson (University of Toronto, Canada) - Patrick Sturt (University of Edinburgh, UK) - Bert Vaux (University of Wisconsin, USA) - Charles Yang (University of Pennsylvania, USA) - Menno van Zaanen (Macquarie University, Australia) - Michael Zock (LIF, CNRS, Marseille, France) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 4 15:04:31 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 4 Nov 2008 16:04:31 +0100 Subject: Job: Stage post-doctoral, projet PICARTEXT Message-ID: Date: Sat, 01 Nov 2008 13:27:22 +0100 From: christophe rey Message-Id: <7.0.1.0.1.20081101132225.06e25528 at u-picardie.fr> X-url: http://www.u-picardie.fr/LESCLaP/ X-url: http://www.u-picardie.fr/LESCLaP/rey/index.html OFFRE D'EMPLOI : STAGE POST-DOCTORAL Intitul? du poste : Stage post-doctoral pour le projet PICARTEXT D?but du contrat : Janvier 2009 Annonceur : LESCLaP, Universit? de Picardie Jules Verne Type de poste propos? : Stage Post Doctoral, Universit? de Picardie, Amiens (France) Employeur : LESCLaP, Universit? de Picardie Jules Verne http://www.u-picardie.fr/LESCLaP/ Lieu du stage post-doctoral : Amiens, France Dur?e du stage propos? : 1 an, renouvelable 2 fois Th?matiques de recherches du stage : Linguistique g?n?rale et Linguistique informatique Salaire : 1800 euros net Description de l'emploi : Dans le cadre du projet de recherche PICARTEXT financ? par le Conseil R?gional de Picardie, le laboratoire LESCLaP dirig? par le Professeur Jean-Michel Eloy souhaite recruter sous la forme d'un stage post-doctoral d'une dur?e d'un an renouvelable deux fois, une personne titulaire d'un doctorat en Linguistique. Le projet mentionn? vise la cr?ation, le d?veloppement, l'impl?mentation et la pr?paration ? l'exploitation d'une base de donn?es textuelle en langue picarde avoisinant les 20 millions de mots. La personne recrut?e dans le cadre de ce stage aura ? sa charge les aspects structuration, impl?mentation et pr?paration ? l'exploitation de la base. Elle devra ainsi disposer d'une formation en Linguistique avec une solide exp?rience dans le traitement automatique de la langue. Les comp?tences exig?es pour cet emploi rel?vent donc de l'informatique linguistique et se traduisent ? la fois par une bonne culture linguistique et une exp?rience indispensable de la manipulation de langages de programmation (C++, PHP, etc.), des bases de donn?es (SQL, ACCES) et des langages de mod?lisation (XML, CSS, etc.). Adresse d'envoi des candidatures : Les candidats int?ress?s doivent adresser un curriculum vitae et un dossier de candidature ? l'adresse suivante : LESCLaP, Facult? des Lettres- chemin du Thil - 80025 Amiens (France) Toute candidature doit ?tre accompagn?e de l'envoi d'un courrier ?lectronique aux adresses suivantes : jean-michel.eloy at u-picardie.fr christophe.rey at u-picardie.fr RECAPITULATIF : Date de d?but du contrat : Janvier 2009 Adresse : LESCLaP, Facult? des Lettres - chemin du Thil - 80025 Amiens (France) Contact : Jean-Michel Eloy, Directeur du LESCLaP jean-michel.eloy at u-picardie.fr Christophe Rey christophe.rey at u-picardie.fr T?l?phone : 03 22 95 10 81 Fax : 03 22 33 11 51 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:07:56 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:07:56 +0100 Subject: Appel: CICLing 2009 + Lexicom 2009: NLP & Computational Linguistics, Springer LNCS, Mexico City (reminder) Message-ID: Date: Wed, 5 Nov 2008 04:20:58 -0600 From: "Alexander Gelbukh \(CICLing-2009\)" Message-ID: <21B23C93351843AA8EB8B8A2C838AB73 at micron> Dear colleague, This is just a gentle reminder of the deadline for the CICLing-2009 conference with Lexicom 2009, in case if you are interested. Below I repeat the CFP. Please contact us for late submissions if needed (while the system is open, please just go ahead and upload your abstract). Thank you! Alexander - - - - - - - - - - - - - - - - - - CICLing 2009 + Lexicom 2009 10th International Conference on Intelligent Text Processing and Computational Linguistics; pre-conf event: Lexicom-Americas 2009 workshop Mexico City, Mexico CICLing: March 1-7, 2009 Lexicom: February 24-28 www.CICLing.org/2009 PUBLICATION: LNCS: Springer Lecture Notes in Computer Science, separate processings of poster session KEYNOTE SPEAKERS: Jill Burstein, ETS, Ken Church, Microsoft, Dekang Lin, Google. TOURS: Monarch Butterfly wintering site, Indian pyramids, cave, and more. AWARDS: Best paper, best student paper, best presentation, best poster. SUBMISSION DEADLINES: NOW: registration of tentative abstract, November 10: uploading of full papers (contact us for late submissions) TOPICS: All topics related with computational linguistics, natural language processing, human language technologies, information retrieval, etc. See complete CFP and contact on www.CICLing.org/2009. This message is sent in good faith of its usefulness for you as an NLP researcher. If this is an error, kindly let me know. Alexander Gelbukh www.Gelbukh.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:12:53 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:12:53 +0100 Subject: Seminaire: K. Gabor (Inst. Ling. de Budapest), LIPN, selection de features pour le clustering de verbes Message-ID: Date: Fri, 07 Nov 2008 11:37:28 +0100 From: Antoine Rozenknop Message-ID: <49141A68.4010404 at lipn.univ-paris13.fr> X-url: http://www-lipn.univ-paris13.fr/ X-url: http://www-lipn.univ-paris13.fr/actualites/post/Feature-Selection-for-Semantic-Clustering-of-Hungarian-Verbs X-url: http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN Le LIPN accueillera Kata G?bor, de l'Institut Linguistique de Budapest, pour un s?minaire qui portera sur des techniques de clustering appliqu?es ? des donn?es linguistiques. Le s?minaire aura lieu au LIPN (Univ.Paris 13, campus de Villetaneuse) en salle B311, le MERCREDI 12 NOVEMBRE 2008 ? 14 heures. Pour venir au LIPN, voir les informations sur : http://www-lipn.univ-paris13.fr/ Cordialement, Antoine Rozenknop - --- Notes : L'objectif des techniques pr?sent?es est d'obtenir des listes de donn?es lexicales coh?rentes (ici, des verbes). Il s'agit d'un enjeu important pour un certain nombre d'applications d'ing?nierie linguistique comme les syst?mes de questions-r?ponses, d'extraction d'information ou de traduction automatique. L'expos? montrera des exemples tir?s du hongrois mais concerne potentiellement d'autres langues dont, ?videmment, le fran?ais. - ------------------------ Title : Feature Selection for Semantic Clustering of Hungarian Verbs http://www-lipn.univ-paris13.fr/actualites/post/Feature-Selection-for-Semantic-Clustering-of-Hungarian-Verbs - ------------------------ Summary : The presentation will focus on current issues in semantic verb classification, with a particular emphasis on the choice of the feature set which represent verbal syntactic distribution. Experiments on supervised semantic verb classification generally aim at obtaining verb classes equivalent to Beth Levins English verb classification or WordNet synsets. For languages which lack such hand-made resources, verb classes can be obtained by unsupervised clustering. In either case, the underlying hypothesis is that syntactically similar verbs share one or more meaning components, and an adequate representation of verbs distributional context is crucial to the succes of the experiment. The first experiments for clustering Hungarian verbs were carried out using data from a manually annotated treebank. The 150 most frequent verbs were categorized according to the complementation patterns they exhibit in the treebank. There was no limit on the length of the patterns, and adjuncts were also included. As Hungarian is a highly inflective language (with 19 different case suffixes), a huge quantity of different patterns, i.e., a large feature set was used. Despite the fact that the large number of features scatter frequency data, the results were promising. However, in order to extend the clustering to less freqent verbs, one needs a bigger and, consequently, automatically parsed corpus. As the parser introduces more noise, which is an even more sensitive issue when dealing with medium or low frequency verbs, the question raises of how the feature set can be tuned in order to achieve a more precise description of the syntactic distribution of verbs. An obvious solution would be to filter complementation patterns according to their frequency, but this could yield misleading reults for low frequency verbs. A more sophisticated method would be to use a manually built verbal valency dictionary to filter out longer and/or less relevant distributional contexts. On the other hand, this method would imply losing the information carried by adjuncts (e.g. temporal andjuncts reveal aspectual properties of verbs). After presenting the results of the first clustering experiment, I will outline future research directions with respect to feature set reduction, and discuss the advantages and disadvantages of the particular methods. - ---- S?minaires RCLN : http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN - ---- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:15:05 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:15:05 +0100 Subject: These: Pierre Loustau, Interpretation automatique d'itineraires dans des recits de voyages Message-ID: Date: Wed, 05 Nov 2008 14:57:18 +0100 From: Pierre LOUSTAU Message-ID: <4911A63E.9020806 at univ-pau.fr> Bonjour ? tous, J'ai le plaisir de vous annoncer que ma soutenance de th?se intitul?e "/Interpr?tation automatique d'itin?raires dans des r?cits de voyages. D'une information g?ographique du syntagme ? une information g?ographique du discours./" aura lieu le 14 novembre ? 14h ? Pau dans l'amphith??tre D de l'UFR Sciences de l'Universit? de Pau et des Pays de l'Adour. Veuillez m'excuser pour les r?ceptions multiples. Pierre Loustau. *Titre : * Interpr?tation automatique d'itin?raires dans des r?cits de voyages.. D'une information g?ographique du syntagme ? une information g?ographique du discours. *Composition du jury :* Patrice Enjalbert, Professeur des Universit?s (GREYC, Universit? de Caen), Rapporteur Andrew U. Frank, Professeur des Universit?s (Technical University of Vienna), Rapporteur Thierry Joliveau, Professeur des Universit?s ( CRENAM-ISIG, Universit? Jean Monnet de Saint-Etienne), Examinateur Herv? Martin, Professeur des Universit?s (LSR - IMAG, Universit? Joseph Fourier, Grenoble 1), Examinateur Philippe Muller, Ma?tre de Conf?rences (IRIT, Universit? Paul Sabatier, Toulouse), Examinateur Mauro Gaio, Professeur des Universit?s (LIUPPA, Universit? de Pau et des Pays de l'Adour), Directeur de th?se Thierry Nodenot, Ma?tre de Conf?rences (LIUPPA, Universit? de Pau et des Pays de l'Adour), Directeur de th?se *R?sum? : * Cette th?se s'inscrit ? la crois?e du Traitement Automatique du Langage, de l'Extraction d'Information, de la Recherche d'Information, des Sciences Cognitives dans un contexte de G?omatique. Dans ce contexte, nos travaux visent ? traiter automatiquement des textes relatant des r?cits de voyage avec pour objectif d'interpr?ter l'information g?ographique qu'ils contiennent et plus particuli?rement les itin?raires qu'ils d?crivent. L'approche que nous proposons est une m?thode incr?mentale de d?couverte du sens : partant d'une s?mantique du niveau du syntagme nominal simple, et passant par une s?mantique du niveau de la proposition, nous atteignons une s?mantique du niveau du texte. Tr?s sch?matiquement, notre parcours dans la d?couverte du sens est donc le suivant : interpr?tation des ?vocations de lieux, interpr?tation des d?placements du narrateur bas?e sur les verbes de d?placements et le crit?re de polarit? aspectuelle spatiale qui leur est attach?, et enfin interpr?tation de cette s?quence de d?placements pour construire l'itin?raire. Notre contribution r?side donc dans la proposition d'un mod?le du concept d'itin?raire adapt? ? des usages cibl?s (pour la RI et pour des usages de conception d'activit?s p?dagogiques), la proposition d'une approche pour caract?riser l'itin?raire dans le texte et enfin la proposition d'un mode op?ratoire automatis?e et enti?rement impl?ment? permettant de relier la caract?risation de l'itin?raire dans le texte ? son mod?le du concept. Notre d?marche ?tant clairement exp?rimentale, nous nous sommes appuy?s tout au long de nos travaux sur un prototype que nous avons mis au point. Ce prototype (PIIR pour Prototype pour l'Interpr?tation d'Itin?raires dans des R?cits) nous permet de mettre face au traitement automatique les analyses et les algorithmes que nous proposons. Nous avons ?galement ?valu? les r?sultats de nos traitements automatis?s afin de pointer les probl?mes qui restent en suspend apr?s ces travaux de th?se. Ces probl?mes ouvrent des perspectives int?ressantes que nous avons discut?es en fin de m?moire. *Mots-Clefs :* Extraction d'Information, TAL, Recherche d'Information, G?omatique ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:11:12 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:11:12 +0100 Subject: Seminaire: A. Vlachos (Univ. de Cambridge), LIPN, Dirichlet Process Mixture Models for Verb Clustering Message-ID: Date: Fri, 07 Nov 2008 11:33:00 +0100 From: Antoine Rozenknop Message-ID: <4914195C.2070306 at lipn.univ-paris13.fr> X-url: http://www-lipn.univ-paris13.fr/ X-url: http://www-lipn.univ-paris13.fr/actualites/post/Unsupervised-and-Constrained-Dirichlet-Process-Mixture-Models-for-Verb-Clustering Le LIPN accueillera Andreas Vachlos, de l'Universit? de Cambridge, pour un s?minaire qui portera sur des techniques de clustering, contraintes et non supervis?es, appliqu?es au clustering lexical-s?mantique des verbes. Le s?minaire aura lieu au LIPN (Univ.Paris 13, campus de Villetaneuse) en salle B311, le jeudi 20 novembre ? 13 heures. Pour venir au LIPN, voir les informations sur : http://www-lipn.univ-paris13.fr/ Cordialement, Antoine Rozenknop - ------------------------ Title : Unsupervised and Constrained Dirichlet Process Mixture Models for Verb Clustering http://www-lipn.univ-paris13.fr/actualites/post/Unsupervised-and-Constrained-Dirichlet-Process-Mixture-Models-for-Verb-Clustering - ------------------------ Summary : In this work we apply Dirichlet Process Mixture Models (DPMMs) to a learning task in natural language processing (NLP): lexical-semantic verb clustering. Furthermore, we propose a novel method of guiding the DPMM towards a particular clustering solution using pairwise constraints. The quantitative and qualitative evaluation performed highlights the benefits of both standard and constrained DPMMs compared to previously used approaches. Results on datasets from general English and the biomedical domain are presented. - ---- S?minaires des ?quipes RCLN et A3: http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20A3 - ---- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:23:35 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:23:35 +0100 Subject: Job: Postdoc CLIR, France Telecom Orange Labs, Lannion Message-ID: Date: Thu, 6 Nov 2008 14:51:50 +0100 From: Message-ID: <6CF039C5B32037498B02251E11CDE6B00775CABA at ftrdmel3> Offre de postdoc ? France Telecom Orange Labs dans le domaine de la recherche d'information cross-lingue (CLIR). Lieu : France Telecom Orange Labs ? Lannion (Bretagne). Date : d?s que possible en 2008. Dur?e : 12 mois (avec possibilit? d'extension ? 18 mois). Projet : Le postdoc s'inscrit dans le cadre d'un projet de R&D dans le domaine de la recherche d'information multim?dia et multilingue. Activit?s du postdoc : Les activit?s envisag?es pour ce postdoc concernent la recherche d'information cross-lingue pour l'acc?s ? des contenus disponibles dans d'autres langues que celle des requ?tes de l'utilisateur. L'un des objectifs de ce travail est de mener une r?flexion de fond et proposer une approche visant ? rendre le processus de recherche d'information inter-lingue aussi transparent que possible pour l'utilisateur en minimisant sa contribution pour la d?sambigu?sation et la traduction de ses requ?tes. Un autre objectif consiste ? optimiser les hypoth?ses de traduction des requ?tes sur la base de traitements linguistiques et/ou stochastiques. Le candidat retenu aura pour mission de contribuer aux activit?s suivantes : - Etude des travaux existants, des m?thodes utilis?es et des usages du CLIR. - Evaluation d'outils de recherche int?grant une dimension cross-lingue. - R?flexion et proposition d'une approche visant ? optimiser les hypoth?ses de traduction des requ?tes et ? rendre le processus de CLIR aussi transparent que possible pour l'utilisateur. - Int?gration d'un prototype de CLIR ? un moteur existant et ?valuation des r?sultats. Profil recherch? : - Doctorat en informatique ou en linguistique. - Bonnes connaissances du TALN et des diff?rentes approches en traduction. - Bonnes connaissances de la recherche d'information et du CLIR. - Ma?triser Linux, Python ou Java, langage de script (bash), C++ serait un plus. - Langues : fran?ais et anglais (la connaissance de l'espagnol serait un plus). - Motivation pour la R&D dans un milieu industriel. Contact : Malek Boualem France Telecom Orange Labs T?l. 02 96 05 29 83 Email. malek.boualem at orange-ftgroup.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:26:54 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:26:54 +0100 Subject: These: Davy Weissenbacher, Influence des annotations imparfaites sur les systemes de TAL Message-ID: Date: Fri, 07 Nov 2008 00:33:25 +0100 From: Davy.Weissenbacher at lipn.univ-paris13.fr Message-ID: <20081107003325.lt159w26t7kgkwg0 at intranet.lipn.univ-paris13.fr> X-url: http://www-lipn.univ-paris13.fr/planfac/?lang=fr) J'ai le plaisir de vous inviter ? la soutenance de ma th?se intitul?e "Influence des annotations imparfaites sur les syst?mes de Traitement Automatique des Langues, un cadre applicatif: la r?solution de l'anaphore pronominale", ainsi qu'au pot qui suivra. La soutenance aura lieu le Jeudi 20 Novembre ? 15h30, salle B311 du Laboratoire d'Informatique de Paris Nord, Institut Galil?e, Universit? Paris 13, 99 avenue jean-Baptiste Cl?ment, 93430 Villetaneuse (Pour se rendre au LIPN: http://www-lipn.univ-paris13.fr/planfac/?lang=fr) Le jury sera compos? de: M. Bernard Victorri, directeur de recherche CNRS, LATTICE, universit? Paris VII, rapporteur M. Philippe Leray, professeur, Laboratoire d'informatique de Nantes Atlantique, universit? de Nantes, rapporteur M. Jean-Gabriel Ganascia, professeur, LIP6, universit? Paris VI, examinateur M. Sophia Ananiadou, Reader, NaCTeM, university of Manchester, examinateur M. Christophe Fouquer?, professeur, LIPN, universit? Paris XIII, directeur de th?se M. Adeline Nazarenko, professeur, LIPN, universit? Paris XIII, codirectrice de th?se Cordialement, Davy Weissenbacher R?sum? ---------------------------------- Un syst?me informatique ne peut traiter automatiquement un texte sans qu'un certain nombre d'informations contenues dans ce texte, comme les mots ou les phrases, ne soient annot?es. Pour ajouter un nouveau niveau d'annotation un syst?me exploite des annotations d'entr?e, plus 'simples', produites par les syst?mes qui ont ?t? appliqu?s pr?c?demment au texte. Or aucun syst?me d'annotation, ? ce jour, ne r?alise automatiquement une annotation parfaite d'un texte. En raison de la complexit? de la langue naturelle, il est difficile d'isoler les annotations d'entr?e qui sont n?cessaires ? l'algorithme pour annoter un texte. De plus, ces annotations d'entr?e, r?sultant elles-m?me d'un calcul automatique, sont imparfaites i.e. impr?cises, bruit?es et parfois manquantes. En'n, le corpus sur lequel ont ?t? choisies les annotations d'entr?e est un rassemblement artificiel de textes d'un m?me domaine qui donne une vue partielle de la langue. Cette construction implique une variation importante de la 'abilit? de ces annotations lorsque le syst?me est appliqu? sur un corpus d'un autre domaine. L'imperfection des annotations d'entr?e et de sortie des syst?mes de traitement automatique des langues (TAL) semble ?tre une fatalit? avec laquelle nous devons composer plut?t qu'un d?sagr?ment passager d? ? la maturit? naissante des techniques de TAL. L'imperfection des annotations se transmet et augmente ? chaque niveau d'annotation du traitement d'un document. Ce constat fait, une question s'impose. Quel syst?me de TAL obtient les meilleures performances: un syst?me qui int?gre l'imperfection des informations d'entr?e dans son processus de raisonnement ou un syst?me pr?vu pour raisonner ? partir d'informations d'entr?e parfaites mais travaillant avec des informations imparfaites' Nous avons propos? un mod?le d'inf?rence probabiliste reposant sur les r?seaux bay?siens (RB), un formalisme adapt? pour raisonner sur les donn?es de la langue naturelle. Ce mod?le permet d'int?grer dans une repr?sentation unique un ensemble d'annotations h?t?rog?nes. Lors de l'inf?rence toutes les annotations d'entr?e pertinentes sont exploit?es pour r?aliser une t?che donn?e. Les probabilit?s conditionnelles a priori associ?es au r?seau expriment un ensemble de contraintes dont nous nous servons pour estimer les valeurs inconnues des attributs et renforcer la 'abilit? des attributs les plus bruit?s. De plus, leur apprentissage automatique permet de les adapter aux corpus et garantit que les annotations engag?s dans l'inf?rence sont toujours pertinentes. Nous avons valid? notre mod?le sur le probl?me de la r?solution du pronom it anaphorique dans les textes anglais. Nous avons con?u un RB pour l'exclusion des pronoms impersonnels et un RB pour le choix de l'ant?c?dent. Nous avons ?valu? ces deux RB sur des corpus diff?rents. L'analyse des r?sultats du RB pour l'exclusion des pronoms impersonnels a mis en ?vidence l'int?r?t de notre approche, les r?sultats de notre RB sont meilleurs que ceux des syst?mes de l'?tat de l'art concurrents. Sur la t?che plus difficile du choix de l'ant?c?dent, les r?sultats de notre second RB sont moins satisfaisants mais ils restent comparables aux r?sultats des syst?mes de l'?tat de l'art: lorsque l'imperfection des annotations est prise en compte dans l'inf?rence, l'emploi d'annotations de mauvaise qualit? ne d?grade que tr?s faiblement les performances du syst?me; si, sans ?tre parfaits, les annotations sont de meilleure qualit?, leur utilisation am?liore significativement les performances du syst?me. De plus, notre RB mod?lise encore imparfaitement le probl?me du choix de l'ant?c?dent. Pour corriger ces d?fauts, nous proposons, en derni?re partie de cette th?se, le prototype d'un nouveau syst?me reposant sur une extension des r?seaux bay?siens dynamiques. Mots cl?s: Traitement Automatique des Langues, r?solution d'anaphores pronominales, annotation, Incertitude, probabilit?s, r?seaux bay?siens Abstract ---------------------------------- It is not possible for a science computing system to process a text when sequences, like words or sentences, are not annotated. However, to date, no system has been able to automatically produce a perfect annotation of a text. This report poses the following question; which is the better natural language processing system: a system designed to integrate imperfect annotations in its reasoning process or a system designed to work with perfect annotation but dealing with imperfect annotations' To answer this, we have proposed a probabilistic inference model based on Bayesian Networks (BN), a formalism well adapted to reasoning from imperfect data. We have worked on the resolution of the anaphoric pronoun it and validate our model in evaluating two BN on different corpora: a BN dedicated to the impersonal pronoun recognition problem and a BN dealing with the choice of the antecedent problem. The performance of the first BN achieves better results than competing state of the art systems thus highlighting the strengths of our model. The performance of the second BN on the choice of the antecedent problem, which is known to be a difficult task, is not as good. However, the results are still comparable with the performance achieved by the state of the art systems and lead to an interesting outcome: when the imperfection of the annotation is taken into account in the inference process, using bad quality annotations slightly worsens the overall performances of the system; when using better quality annotations, yet still not perfect, the results achieved are significantly better. Key Words: Natural Language Processing, pronominal anaphora resolution, annotations, uncertainty, probability, Bayesian networks ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:22:28 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:22:28 +0100 Subject: Conf: ISUC 2008, 2nd International Symposium on Universal Communication, Dec. 15-16, 2008 Osaka, Japan Message-ID: Date: Thu, 06 Nov 2008 09:41:04 +0100 From: info at elda.org Message-ID: <4912ADA0.6010609 at elda.org> X-url: http://www.is-uc.org/2008/index.html X-url: http://www.is-uc.org/2008/regist/index.html X-url: http://www.is-uc.org/2008/program/index.html [Apologies if you receive this more than once] ============================================= CALL FOR PARTICIPATION ISUC 2008 2nd International Symposium on Universal Communication December 15-16, 2008 Osaka, Japan http://www.is-uc.org/2008/index.html ============================================= * On-line registration http://www.is-uc.org/2008/regist/index.html Registration due date: November 28, 2008 * Program http://www.is-uc.org/2008/program/index.html * Contact Email: isuc2008 at khn.nict.go.jp TEL: +81-6-6372-3053 FAX: +81-6-6376-2362 The development of information network systems enables us to communicate with people in remote places "anytime and anywhere", enriching human knowledge, affection and sensibility. However, there are various barriers which stand in our way to using these systems freely and flexibly. In order to discuss how to overcome these barriers and create a more human-centered communication environment, in 2007 the first International Symposium on Universal Communication was held in Kyoto, Japan featuring discussions with well-known researchers from around the world. Following its success, the Second International Symposium on Universal Communication (ISUC 2008) will be held at the Osaka International Convention Center, 5-3-51, Nakanoshima Kita-ku, Osaka 530-0005 Japan on December 15-16, 2008. Symposium highlights include the following. * Keynote Speech Dec. 15, 2008 1. Overcoming the Language Barrier: Makoto Nagao (National Diet Library) 2. The UCSD/Calit2 GreenLight Project: Thomas DeFanti (University of California, San Diego, USA) 3. Very Large Information Integration and Application Platform - CSTP Coordination Program of Science and Technology Projects - Shojiro Nishio (Osaka University) * Invited Talks Dec. 15, 2008 Speech Processing in Support of Human-Human Communication Alex Waibel Carnegie Mellon University, USA and University of Karlsruhe, Germany Wave Field Synthesis: History, State-of-the-Art and Future Diemer de Vries Delft University of Technology, the Netherlands On Distributed Run-Time Software Evolution Driven by Stakeholders of Smart Home Development Carl K. Chang Iowa State University, USA Dec. 16, 2008 The Maximum Entropy based Rule Selection Model for Statistical Machine Translation Qun Liu Chinese Academy of Sciences, China Depth Estimation and Object Recognition using Integral Imaging Seokwon Yeom Daegu University, Korea DISG: A DIStributed Graph Repository for Web Infrastructure Aoying Zhou East China Normal University, China Compilation of the Balanced Corpus of Contemporary Written Japanese in the KOTONOHA Initiative Kikuo Maekawa The National Institute for Japanese Language Perception of Depth, Motion, and Stability with Motion Parallax Hiroshi Ono York University, Canada Understanding Events Relationally and Temporally Related: Context Assessment Strategies for a Smart Home Fulvio Mastrogiovanni University of Genova, Italy Wireless Sensor Network and Sensor Fusion Technology for Ubiquitous Smart Living Space Applications Ming-Whei Feng Institute for Information Industry, Taiwan We are looking forward to your participation. ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 7 15:28:01 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Nov 2008 16:28:01 +0100 Subject: Appel: EvalECD'09 Message-ID: Date: Fri, 07 Nov 2008 14:32:47 +0100 From: Nicolas B?chet Message-ID: <4914437F.1010702 at lirmm.fr> X-url: http://www.lirmm.fr/~bechet/EvalECD X-url: http://www.lirmm.fr/~bechet/EvalECD/atelier_egc.cls [Veuillez nous excuser en cas de r?ceptions multiples] Second appel ? communications ============================= 1er atelier sur l'?valuation des m?thodes d'Extraction de Connaissances dans les Donn?es (EvalECD) organis? dans le cadre de la conf?rence EGC 2009. le 27 janvier 2009, Strasbourg, France. Site web de l'atelier : http://www.lirmm.fr/~bechet/EvalECD Contact : evalecd09 at lirmm.fr L'objectif de cet atelier est de discuter des techniques d'?valuation utilis?es dans diff?rents domaines et de montrer leurs qualit?s et leurs limites. Un tel atelier ouvert aux diff?rentes communaut?s d'EGC permet de compl?ter et/ou g?n?raliser les travaux pr?sent?s dans des ateliers tr?s sp?cifiques (par exemple, ateliers de TIA'05, COLING'08 en Traitement Automatique des Langues). Cet atelier permettra ainsi de proposer un d?but de solutions aux probl?mes occasionn?s par la diversit? des ?valuations en ECD. Th?mes d?velopp?s (liste non limitative) ======================================= * Protocoles d'?valuation (automatiques, semi-automatiques, manuels) * Mesures d'?valuation (Pr?cision, Rappel, F-Mesure, Courbes ROC, ...) * Tuning : sp?cifications des param?tres * Construction de benchmarks * Validation de connaissances en ECD * Expertise humaine en TAL et en IC * ?valuation en Int?gration de Donn?es et en R?conciliation de Donn?es * ?valuation des outils d'IHM (ergonomie, visualisation) Dates importantes ================= * Soumission des articles : 25 novembre 2008 * Notification aux auteurs : 22 d?cembre 2008 * Soumission de la version finale : 5 janvier 2009 * EvalECD 2009 : 27 janvier 2009 Modalit?s de soumission ======================= Les articles soumis peuvent ?tre r?dig?s en fran?ais ou en anglais, sur environ 12 pages incluant toutes les r?f?rences et les figures. Les articles pourront ?tre beaucoup plus courts, en particulier pour les articles pr?sentant un travail qui d?bute. Les soumissions se feront au format PDF. Le format requis pour les actes de l'atelier EvalECD'09 (latex uniquement) est le suivant : http://www.lirmm.fr/~bechet/EvalECD/atelier_egc.cls Les soumissions devront ?tre envoy?es ? l'adresse ci-apr?s avant le 25 novembre 2008 : evalecd09 at lirmm.fr Organisateurs ============= - Nicolas Bechet (LIRMM) - Mathieu Roche (LIRMM) - Fatiha Sa?s (LRI/INRIA-Saclay-?le-de-France) Comit? de Programme =================== - Bernd Amann (LIP6) - Jean-Yves Antoine (LI) - J?r?me Az? (LRI) - Zohra Bellahs?ne (LIRMM) - Catherine Berrut (LIG) - Patrice Buche (INRA - Unit? M?t at risk) - Bich-Li?n Doan (Sup?lec) - St?phane Lallich (ERIC) - Anne Laurent (LIRMM) - Nathalie Pernelle (LRI, INRIA Saclay-?le-de-France) - Pascal Poncelet (LIRMM) - Chantal Reynaud (LRI, INRIA Saclay-?le-de-France) - Christophe Roche (LISTIC) - Bernard Rothenburger (IRIT) - Laurent Simon (LRI, INRIA Saclay-?le-de-France) - Maguelonne Teisseire (LIRMM) - Alexandre Termier (LIG) - Fabien Torre (LIFL) - Juan Manuel Torres-Moreno (LIA) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Wed Nov 12 11:40:02 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Nov 2008 12:40:02 +0100 Subject: Appel: Journal of Natural Language Engineering, Call for special issue proposals Message-ID: Date: Sat, 08 Nov 2008 17:53:38 +0000 From: Ruslan Mitkov Message-Id: <20081108175731.CA08422BA01 at hygia.cines.fr> Journal of Natural Language Engineering *** Call for special issue proposals *** The area of Natural Language Engineering is following the trend of many other areas, becoming highly specialised with a number of application-orientated and narrow-domain topics emerging or growing in importance. These developments, often coincident with a lack of related literature, necessitate and warrant the publication of specialised volumes focusing on a specific topic of interest to the Natural Language Processing (NLP) research community. The journal of Natural Language Engineering (NLE) invites proposals for special issues on a competitive basis on any topics about applied NLP which have emerged as important developments in Natural Language Engineering and which have attracted the attention of a number of researchers or research groups. After the Call for Proposals for special issues in 2006 which has resulted in two very high quality special issues, we are pleased to announce another such call this year. Topics could cover a variety of NLP methods, tasks and resources as well as NLP-related applications but should focus on the practical implications of operation on the large scale. Topics covering NLP methods, tasks and resources could include but are not limited to POS tagging, parsing, semantic role labelling, word sense disambiguation, anaphora and coreference resolution, named entity recognition, natural language generation, speech recognition, speech synthesis, multimodal processing, statistical methods in Natural Language Engineering, machine learning, evaluation methodologies, corpora and ontologies. Topics covering NLP applications could include but are not limited to machine translation, translation memory and translation tools, summarisation, information retrieval, information extraction, question answering, text and web mining, opinion mining and NLP for biomedical texts. Calls for special issue proposals may be based on a successful workshop or a body of work associated with a particular group or section of the community. In all cases, however, the reviewing process of the accepted proposals will be rigorous and all submissions must be reviewed by at least 3 members of the Guest Editorial Board or other suitable reviewers agreed by the NLE Editors. In the case of papers previously submitted to workshops, the Guest Editors will not be able to re-use previous workshop reviews. In addition, the call for papers of the accepted proposals must be open to all interested parties and all authors will be given equal treatment; in the case of proposals based on previous workshops, submissions cannot be limited to workshop participants only. Interested editors have the option of preliminary feedback by emailing expressions of interest accompanied by a brief description of the intended special issue to the Executive Editor (R.Mitkov at wlv.ac.uk). He will give a brief indication of whether the topic is appropriate to Natural Language Engineering. In the case of initial positive feedback, the prospective Guest Editors will be asked to submit a proposal for a special issue which will be reviewed by the Editors of the journal and by other members of the Journal Editorial Board. At least one proposal will be selected on a competitive basis for each call with the envisaged publication date for the successful proposal(s) from this call on or after October 2009. The proposal for a special issue should include a brief outline of the field and rationale as to why it is important to launch a special issue on the particular topic of interest. It should include a relevant literature survey (related previous special issues, volumes, workshop and conference proceedings) and should explain the added value of the proposed special issue against the background of other relevant or competing publications and volumes (if applicable). It is desirable that a rough estimate on expected submissions to the special issue be provided. The proposals should also include a tentative Guest Editorial Board (it is desirable that one of the members of the Guest Editorial Board be a member of the journal Editorial Board), tentative time-scale for the production of the special issue and information about the prospective Guest Editors (relevant experience, publications etc.). Time-scale - Deadline for submission of special issue proposals: 15 December 2008 (proposals to be emailed to R.Mitkov at wlv.ac.uk) - Notification of acceptance/rejection: 15 January 2009 - Final version of the successful proposal(s) and call for papers: 31 January 2009 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Wed Nov 12 11:42:19 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Nov 2008 12:42:19 +0100 Subject: These: Remi Bove, Analyse syntaxique automatique de l'oral : etude des disfluences Message-ID: Date: Mon, 10 Nov 2008 13:55:33 +0100 (CET) From: Remi BOVE Message-ID: <20282761.29777.1226321735256.JavaMail.root at frontal2> Bonjour ? tous, J'ai le plaisir de vous annoncer que ma soutenance de th?se intitul?e "Analyse syntaxique automatique de l'oral : ?tude des disfluences" aura lieu le 25 novembre ? 14h ? Aix-en-Provence dans la salle C212 (2e ?tage) de l'Universit? de Provence (Aix-Marseille I). R?mi BOVE Jury : Martine ADDA-DECKER (LIMSI, Universit? Paris-Sud, Rapporteur) Jean-Yves ANTOINE (LI, Universit? Fran?ois Rabelais de Tours, Rapporteur) Jacques VERGNE (GREYC, Universit? de Caen, Examinateur) Jos? DEULOFEU (TALEP, Universit? de Provence, Examinateur) Jean VERONIS (TALEP, Universit? de Provence, Directeur) R?sum? : Le but de cette th?se est d'?tudier de fa?on d?taill?e l'impact des disfluences en fran?ais parl? (r?p?titions, auto-corrections, amorces, etc.) sur l'analyse syntaxique automatique de l'oral, et de proposer un mod?le th?orique permettant de les int?grer dans cette analyse. Notre axe de recherche se fonde sur l'hypoth?se selon laquelle une analyse d?taill?e des ?nonc?s oraux (principalement en termes morphosyntaxiques) peut permettre un traitement efficace pour ce type de donn?es, et s'av?re incontournable dans une optique de d?veloppement d'applications g?n?riques dans le domaine des technologies de la parole. Dans ce travail, nous proposons ? la fois une ?tude linguistique d?taill?e et une strat?gie d'analyse syntaxique automatique partielle des disfluences (en syntagmes minimaux non r?cursifs ou "chunk"). Le corpus final obtenu est ainsi segment? en chunks non-disfluents d'une part, ? c?t? des chunks disfluents d'autre part, apr?s prise en compte des r?gularit?s observ?es dans notre corpus. Les r?sultats de l'analyse automatique sont finalement ?valu?s de fa?on quantitative sur le corpus permettant ainsi de valider le mod?le th?orique de fa?on empirique. Mots-Clefs : TAL, Analyse Syntaxique Automatique, Disfluences, Oral, Fran?ais Parl?, ?tiquetage Automatique, Grammaire de Chunking, Linguistique de Corpus ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Wed Nov 12 11:41:01 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Nov 2008 12:41:01 +0100 Subject: These: Francois Lareau, Vers une GUST du francais: le temps verbal Message-ID: Date: Mon, 10 Nov 2008 11:40:20 +0900 From: Fran?ois Lareau Message-Id: Bonjour, J'ai le plaisir de vous inviter ? la soutenance de ma th?se, intitul?e: "Vers une grammaire d'unification Sens-Texte du fran?ais: le temps verbal dans l?interface s?mantique-syntaxe" Il s'agit d'une th?se en linguistique effectu?e en cotutelle dans les laboratoires OLST (Universit? de Montr?al) et Lattice (Universit? Paris 7). La soutenance aura lieu le 25 novembre 2008 ? 9h30 au local C-9019 du pavillon Lionel-Groulx (3150 rue Jean-Brillant) de l'Universit? de Montr?al. Le jury sera compos? des personnes suivantes: Alain Polgu?re, U. de Montr?al, Pr?sident-rapporteur Igor Mel'cuk, U. de Montr?al, Directeur UdeM Sylvain Kahane, U. Paris 10, Directeur UP7 Laurence Danlos, U. Paris 7, Membre du jury Owen Rambow, U. Columbia, Examinateur externe Antoine Soare, U. de Montr?al, Repr?sentant du doyen R?sum?: Cette th?se vise d?une part ? d?crire la flexion verbale en fran?ais, plus particuli?rement celle en temps dans l?interface s?mantique- syntaxe, et d?autre part ? d?velopper le formalisme de la grammaire d?unification Sens-Texte (GUST) et ? en v?rifier l?utilit? pour la description des langues. Pour atteindre notre premier objectif, nous proposons une m?thodologie qui met l?accent sur les signes dans leur ensemble. Au niveau descriptif, notre th?se principale est que le fran?ais poss?de non pas une, mais bien deux cat?gories flexionnelles de temps compl?mentaires. La cat?gorie de d?calage regroupe les gramm?mes D?CAL? et NON-D?CAL?, qui situent un point de rep?re par rapport au moment d??locution. La cat?gorie de temps comme tel regroupe les gramm?mes ANT?RIEUR, SIMULTAN? et POST?RIEUR, qui situent les faits par rapport ? ce point de rep?re. Au niveau formel, nos principaux apports au formalisme de GUST sont la repr?sentation des structures en termes d?objets et de fonctions, ainsi que la mod?lisation des d?compositions s?mantiques. La formalisation de notre mod?le de la flexion verbale s?av?re un moyen int?ressant de v?rifier l?utilit? de GUST puisqu?elle met en jeu des signes vari?s. Elle nous donne ?galement l?occasion d?observer le m?canisme d?articulation des modules de la grammaire. Un PDF de la th?se est disponible ici: https://www.webdepot.umontreal.ca/Usagers/lareauf/these/lareau-these.pdf ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Wed Nov 12 11:43:49 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 12 Nov 2008 12:43:49 +0100 Subject: Appel: Genericity: Interpreation and Uses (Conference I) Message-ID: Date: Mon, 10 Nov 2008 15:04:24 +0100 From: David NICOLAS Message-ID: X-url: http://www.genericity.ens.fr/ CFP: Genericity: Interpreation and Uses (Conference I) May 11-12-13, 2009 ENS (Ecole Normale Sup?rieure) Paris - France http://www.genericity.ens.fr Invited Speakers Nicholas Asher (IRIT / University of Texas at Austin) Ariel Cohen (Ben Gurion University) Francis Corblin (Universit? Paris Sorbonne) Veneeta Dayal (Rutgers University) Carmen Dobrovie-Sorin (CNRS / Paris VII) Manfred Krifka (ZAS Berlin) Christopher Pi??n (Universit? Lille III) Call for Papers Since the publication of the collective work 'The Generic Book' (Carlson & Pelletier (ed.), 1995), research on genericity has developed in various directions. The principal merit of 'The Generic Book' was to establish a unified terminology, which paved the way for very detailed and specific studies, whose results are intended to be cumulative. Since then, much of the research has focused on syntactic, semantic and pragmatic issues and important advances have been made in each of these fields and at their interfaces. The goal of the conference is to bring together theoreticians of different horizons articulating linguistic issues with logical and philosophical ones. The conference welcomes papers on different languages clearly articulating empirical and formal issues, including but not limited to the following topics: - ILP SLP distinction - Kind terms - Generic Determiners - Generic Quantification - Focus - Frequency Adverbs - GEN / HAB distinction - Dispositions - Tense and Aspect in generic sentences - Free choiceness and genericity - Genericity and modality Selection Committee Nicholas Asher (CNRS/Austin Texas) Claire Beyssade (Institut Jean Nicod CNRS/ENS/EHESS) Ariel Cohen (Ben-Gurion University) Francis Corblin (Paris IV Sorbonne) Veneeta Dayal (Rutgers University) Carmen Dobrovie-Sorin (LLF Paris VII) Brenda Laca (Universit? Paris VIII) Alda Mari (Institut Jean Nicod CNRS/ENS/EHESS) David Nicolas (Institut Jean Nicod CNRS/ENS/EHESS) Christopher Pi??n (Universit? Lille III) Benjamin Spector (Institut Jean Nicod CNRS/ENS/EHESS) Isidora Stojanovic (Institut Jean Nicod CNRS/ENS/EHESS) Organization Committee Claire Beyssade (Institut Jean Nicod CNRS/ENS/EHESS) Alda Mari ? Chair - (Institut Jean Nicod CNRS/ENS/EHESS) David Nicolas (Institut Jean Nicod CNRS/ENS/EHESS) Abstract Submission Anonymous abstracts in pdf format not exceeding 2 pages with standard 1 inch margins on all sides, including examples, figures and references, are to be sent to GenerictyConference at gmail.com One single authored and a co-authored abstract can be submitted. Please include in the body of the mail the following information: - Author(s) - Title of the abstract - Affiliation(s) - E-mail Address Important Dates Submission Deadline: January 31st Notification: March 1st Sponsors This conference opens the ANR Project ?Genius: Genericity Interpretation and Uses?. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 14 15:04:32 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Nov 2008 16:04:32 +0100 Subject: Revue: Lexis numero 2, Submorphemique lexicale Message-ID: Date: Thu, 13 Nov 2008 10:05:27 +0100 From: didier.bottineau at free.fr Message-ID: <1226567127.491bedd756655 at imp.free.fr> X-url: http://screcherche.univ-lyon3.fr/lexis/spip.php?article96 Vient de para?tre : le n?2 de LEXIS sur la "submorph?mique lexicale" coordonn? par Dennis Philps. La submorph?mique lexicale / Lexical Submorphemics Dennis Philps, Universit? Toulouse-Le Mirail (France) : Pr?face / Foreword ? Dennis Philps, Universit? Toulouse-Le Mirail (France) : Introduction ? Didier Bottineau, CNRS, MoDyCo ? Universit? Paris 10 Nanterre (France) : ?The submorphemic conjecture in English : towards a distributed model of the cognitive dynamics of submorphemes? ? Line Argoud, doctorante agr?g?e ? Grenoble - Universit? de Toulouse-Le Mirail (France) : ? Les ?mots en bl-? du lexique anglais : ?tude de la structuration des donn?es dans une optique lexico-cognitive ? ? Jean-Marc Chadelat, IUFM de Paris (France) : ? Le symbolisme phon?tique ? l?initiale des mots anglais : l?exemple du marqueur sub-lexical < Cr- > ? ? Ingrid Fandrych, National University of Lesotho (L?sotho) : ?Submorphemic elements in the formation of acronyms, blends and clippings? ? Dennis Philps, Universit? Toulouse-Le Mirail (France) : ?Submorphemic iconicity in the lexicon : a diachronic approach to English ?gn- words?? Le num?ro est accessible ? l'adresse suivante : http://screcherche.univ-lyon3.fr/lexis/spip.php?article96 Les articles peuvent ?tre t?l?charg?s en .pdf, soit individuellement, soit pour le num?ro complet. Le prochain num?ro sur l'emprunt sera coordonn? par Aur?lie Paulin et Jennifer Vince. --------------------------------- Didier Bottineau CNRS, UMR 7114 MoDyCO (Mod?les, Dynamiques, Corpus) Universit? Paris Ouest Nanterre - La D?fense (ex Universit? Paris 10) didier.bottineau at u-paris10.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 14 15:07:18 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Nov 2008 16:07:18 +0100 Subject: These: Zoubeir Mouelhi, Essai de lexicometrie d'une oeuvre arabe classique Message-ID: Date: Thu, 13 Nov 2008 23:25:12 +0100 (CET) From: Zoubeir Mouelhi Message-ID: <7460345.25040.1226615114726.JavaMail.root at co7> Bonjour ? tous, J'ai le plaisir de vous annoncer la soutenance de ma th?se intitul?e "Essai de lexicom?trie d'une oeuvre arabe classique : Al-'Imt?' wa-l-Mu'?nasa de Tawh?d?" pour le 22 novembre ? 9h ? l'Universit? Lumi?re-Lyon2, dans la salle "Jean-Ren? Derr?" au 18 Quai Claude Bernard (1er ?tage) ? Lyon 7?me. Cordialement, Zoubeir mouelhi Jury : M. DICHY Joseph (Universit? Lyon 2, Directeur) M. SAHLOUL Hassan (Universit? Lyon 3, Rapporteur) M. BRAHAM Abdelfattah (Universit? de la Manouba TUNISIE, Rapporteur) M. LELUBRE Xavier (Universit? Lyon 2, Examinateur) M. HASSOUN Mohamed (ENSSIB, Examinateur) R?sum? : S'inscrivant dans la perspective g?n?rale de l'approche quantitative de l'?tude des textes, ? la l'intersection de plusieurs disciplines, notamment la linguistique, l'informatique et la statistique, l'approche lexicom?trique trouve plusieurs applications eu ?gard aux textes, qu'ils soient pris isol?ment (pr?occupations d'ordre stylistique, didactique, historique, etc.), compar?s entre eux (typologies de textes, approche contrastive, etc.), consid?r?s dans leur relation aux auteurs (homog?n?it? d'auteur, attribution d'auteurs, etc.) ou dans leur relation au temps (s?ries textuelles chronologiques, sp?cificit? chronologique, etc.). Dans cette perspective lexicom?trique, notre travail qui porte sur un ouvrage c?l?bre de la pens?e arabe m?di?vale, l'Imt?' wa-l-Mu'?nasa de Tawh?d? (IVe/Xe si?cle) se fixe un triple objectif : En premier lieu, l'?laboration, pour l'arabe, de ce que l'on appelle une norme lexicologique, donnant une assise th?orique et m?thodologique aux travaux lexicom?triques futurs sur les textes arabes. Deux volets composent la norme lexicologique que nous proposons : une norme de saisie et d'harmonisation et une norme de d?pouillement. En deuxi?me lieu, la confection du dictionnaire de fr?quences de notre corpus. Fruit naturel de toute ?tude lexicom?trique globale de cette nature, le dictionnaire de fr?quences traduit et synth?tise les r?organisations formelles op?r?es sur la s?quence textuelle d'origine, ainsi que le r?sultat des diff?rentes analyses statistiques qui ont port? sur le vocabulaire du texte. En troisi?me et dernier lieu, soumettre ce corpus ? un certain nombre de m?thodes d'analyse et de traitement statistiques propres ? la lexicom?trie en vue d'en ?tudier, principalement, la structure lexicale mais aussi la trame radicale. Ainsi, la richesse lexicale, l'accroissement du vocabulaire, la r?partition des cat?gories lexicales, la connexion lexicale, etc., qui repr?sentent tant d'?l?ments et d'indices pouvant caract?riser le style d'un auteur, d'un genre ou d'une ?poque, ont-ils donc ?t? ?tudi?s et analys?s. Il est n?cessaire dans ce type d'entreprise, que des op?rations de d?pouillement pr?alables soient op?r?es selon des r?gles claires et stables assorties d'une r?flexion minutieuse autour des notions de segmentation, de lemmatisation, de d?sambigu?sation, de cat?gorisation, etc. Les d?comptes obtenus suite ? ces ?tapes de d?pouillement et de quantification, sont soumis aux traitements statistiques et ? l'interpr?tation pour juger in fine des variations des diff?rentes unit?s linguistiques du corpus et en d?crire la structure lexicale. Mots-Clefs : Lexicom?trie arabe, norme lexicologique, d?pouillement lexical, TAL arabe, segmentation, lemmatisation, d?sambigu?sation, cat?gorisation, structure lexicale, richesse lexicale, cat?gories lexicales, textes arabes classiques, linguistique de corpus. Abstract : Lexicometry belongs to the general field of quantitative textual study and is situated at the intersection of various subjects, among which linguistics, computer science and statistics ; it is concerned with several types of applications in relationship to texts, whether they are considered separately (and studied for their stylistic, didactic or historical properties), compared to one another (as in textual typology, contrastive studies, etc.), considered in their relationship to their authors (studying homogeneity in a given author or automatically attributing texts to specific authors) or to their place in time (textual chronological series, chronological specificity, etc.). In this lexicometrical framework, our dissertation, which is based on a famous work of Arabic medieval thinking, Imt?? wa-l-Mu??nasa de Taw??d? (4th –10th centuries), has a threefold objective: - first, elaborating for Arabic what is known as a lexicological norm that provides a theoretical and methodological foundation for future work in lexicometry based on Arabic texts. There are two components to the lexicological norm that we propose: one for data collection and harmonization and one for data retrieval. - second, building a frequency dictionary for our corpus. The natural outcome of any general lexicometical work of this kind, the frequency dictionary reproduces and synthesizes the formal reorganizations that have been carried out on the original text sequences, as well as the results of various statistical analyses of the text's vocabulary. - finally, submitting the corpus to various statistical analysis and processing methods that are typical of lexicometry in order to mostly study its lexical structure but also its “radical weft”. Thus, lexical richness, vocabulary increase, the distribution of lexical categories, lexical connectivity, etc., which are as many clues or elements that may characterize an author's style, a genre or a given time period, have been studied and analyzed. In this type of endeavor, it is essential that data retrieval be carried out in accordance with stable and precise procedures following careful deliberation about such notions as segmentation, lemmatization, disambiguation, categorization, etc. The figures that have been arrived at following the retrieval and quantification stages are then submitted to statistical processing and human interpretation in order to observe variation as measured in the various linguistic units of the corpus and describe its lexical structure. Key words : Arabic lexicometry, lexicological norm, lexical data retrieval, Arabic NLP, segmentation, lemmatization, disambiguation, categorisation, lexical structure, lexical richness, lexical categories, classic Arabic texts, corpus linguistics. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 14 15:09:48 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 14 Nov 2008 16:09:48 +0100 Subject: Livres: Parutions diverses Message-ID: Date: Fri, 14 Nov 2008 07:14:09 +0100 From: marc arabyan Message-ID: www.lambert-lucas.com editeur en sciences du langage ******************** Viennent de paraitre (septembre et octobre 2008) ******************** (1) Cecile CANUT: LE SPECTRE IDENTITAIRE, ENTRE LANGUE ET POUVOIR AU MALI; ISBN 978-2-915806-47-2; 230 pages (ouvrage publie avec le concours de l'Universite Montpellier 3). ******************** (2) Paul JOUISON (1948-1991): COURS DE GESTES 1977-1978, preface de Brigitte GARCIA; collection "Archives de la langue des signes francaise"; ISBN 978-2-915806-24-3; 110 pages. ******************** (3) Jean-Marie ZEMB (1928-2007), ARISTOTE (traduction de Francois MULLER avec la collaboration de Robert MULLER); ISBN: 978-2-915806-59-5; 140 pages. ******************** (4) Coordonne par Pascal SINGY et Patrice GUEX, COMMUNICATION ET MEDECINE : LA PREVENTION DU SIDA AUPRES DES POPULATIONS MIGRANTES D'ORIGINE SUBSAHARIENNE; ISBN: 978-2-915806-83-0; 156 pages (ouvrage publie avec le concours de l'Universite de Lausanne). ******************** (5) Henri BOYER, LANGUE ET IDENTITE: SUR LE NATIONALISME LINGUISTIQUE; ISBN : 978-2-915806-87-8; 100 pages. ******************** (6) Jean-Francois JEANDILLOU, EFFETS DE TEXTES; ISBN: 978-2-915806-10-6; 340 pages (ouvrage publie avec le concours de l?IUF). ******************** (7) Coordonne par Jean-Pierre SAUTOT, LE FILM DE CLASSE: ETUDE SEMIOTIQUE ET ENJEUX DIDACTIQUES; ISBN 978-2-915806-54-0; 200 pages (ouvrage publie avec le concours des Universites Lyon 1, Lyon 2 et Grenoble 3). ******************** (8) Coordonne par Ursula BAEHLER, Ruth GANTERT et Rita Catrina IMBODEN, PENSER LES METAPHORES (collection "Semiotique"); ISBN 978-2-915806-84-7; 120 pages (ouvrage publie avec le concours de l?Acad?mie Suisse des Sciences Sociales et Humaines). ******************** Pour recevoir regulierement nos informations, abonnez-vous a la newsletter en cliquant sur la commande ci-dessous et en envoyant le message sans rien changer: mailto:lambertlucas-request at ml.free.fr?subject=subscribe ******************** Marc Arabyan ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Mon Nov 17 11:24:41 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Mon, 17 Nov 2008 12:24:41 +0100 Subject: Info: Session intensive NooJ, Inalco, Clichy Message-ID: Date: Sat, 15 Nov 2008 12:16:33 +0100 From: Anaid Donabedian Message-ID: <491EAF91.4030606 at inalco.fr> X-url: http://www.nooj4nlp.net *Stage intensif : traiter un corpus avec NooJ* Formation organis?e par le Cercle de linguistique de l?Inalco *26-30 janvier 2009 de 9h30 ? 17h30* Centre Clichy 104, quai de Clichy 92110 CLICHY ? Salle d?informatique de Clichy Ouvert aux ?tudiants de Master et de doctorat, ainsi qu?aux enseignants chercheurs (pour les ?tudiants de Master 1 ou 2, inscription p?dagogique recommand?e sous les codes LGE07115 et LGE08115 pour un total de 6 ECTS en ouverture) Anim? par : Max Silberztein, INALCO, Universit? de Franche-Comt? www.nooj4nlp.net NooJ est un environnement de d?veloppement linguistique qui propose des m?thodologies et des outils pour annoter et ?tudier des corpus linguistiques dans des langues de tous types. Il permet de construire des ressources linguistiques, les tester en les appliquant ? des textes de taille importante, et d?explorer un corpus en ?laborant des requ?tes adapt?es ? l?objectif et au cadre th?orique de l?utilisateur. NooJ est un outil puissant, permettant de traiter des corpus de tr?s grande taille. Son utilisation ne requiert pas de connaissances en programmation ou traitement automatique des langues. Au cours de ce s?minaire intensif, je pr?senterai les points suivants : 1. Traitement de corpus : ouvrir un texte, g?rer des corpus, lancer des requ?tes et construire des concordances 2. Formalisation de la morphologie : morphologie flexionnelle (ex. conjugaison des verbes), morphologie d?rivationnelle (ex. nominalisation d?un verbe), morphologie productive (ex. n?ologismes) 3. Construction d?un lexique NooJ : mots simples, mots compos?s et expressions fig?es 4. Syntaxe : requ?tes syntaxiques, grammaires locales, le groupe nominal 5. S?mantique : extraction d?entit?s nomm?es, construction de paraphrases, analyse s?mantique Les atouts de NooJ : NooJ permet de formaliser cinq niveaux de ph?nom?nes linguistiques : orthographe, morphologie, lexique, syntaxe et s?mantique. Pour chacun de ces niveaux, NooJ propose une m?thodologie, un ou plusieurs formalismes adapt?s, des outils-logiciels de d?veloppement et un ou plusieurs analyseurs automatiques de textes. Par exemple, au niveau morphologique, NooJ fournit deux formalismes pour d?crire la flexion et la d?rivation, un formalisme pour d?crire la morphologie lexicale (par ex. pour repr?senter les familles de mots) et un formalisme pour entrer des r?gles de morphologie productive (par ex. pour formaliser la cr?ation de n?ologismes). Les outils et formalismes de NooJ sont tous compatibles entre eux de fa?on ascendante, et sont graduellement plus puissants au fur et ? mesure qu?on monte dans la hi?rarchie linguistique. Par exemple, le niveau orthographique utilise des machines ? ?tats finis ; le niveau syntaxique utilise des grammaires hors contexte ; le niveau s?mantique utilise des r?seaux de transition augment?s (Augmented Transition Networks ou ATN) dont la puissance est ?quivalente ? celle d?une machine de Turing. Cette approche ? multiple ? apporte de nombreux avantages pour les travaux de description linguistique car chaque niveau de formalisation est d?crit de la fa?on la plus naturelle possible : les linguistes disposent donc d?outils de d?veloppement et d?analyse parfaitement adapt?s ? leurs besoins de formalisation. Par ailleurs, des ph?nom?nes tr?s sp?cifiques ? des langues tr?s diff?rentes, comme par exemple la variation orthographique (massive) en chinois, le traitement des voyelles absentes en arabe, la morphologie massive en hongrois etc. sont trait?s avec des outils parfaitement adapt?s. NooJ fournit un environnement unifi? ? l?int?rieur duquel ces outils communiquent entre eux gr?ce ? une structure d?annotations (? Text Annotation Structure ? ou TAS). Au-del? de la possibilit? d?int?grer des ressources linguistiques de niveaux diff?rents, la TAS permet de formaliser des ph?nom?nes ? cheval sur plusieurs niveaux linguistiques. Dans la limite des places disponibles Inscription : INALCO ? ?cole Doctorale Sandrine WONG (e-mail: sandrine.wong at inalco.fr ) 49 bis, avenue de la Belle Gabrielle 75012 PARIS T?l.: 01 80 51 95 06 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Mon Nov 17 11:25:46 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Mon, 17 Nov 2008 12:25:46 +0100 Subject: Seminaire: A. Vlachos - report au 21 novembre 10h30 Message-ID: Date: Fri, 14 Nov 2008 18:51:44 +0100 From: Antoine Rozenknop Message-ID: <491DBAB0.8030406 at lipn.univ-paris13.fr> X-url: http://www-lipn.univ-paris13.fr/ X-url: http://www-lipn.univ-paris13.fr/actualites/post/Unsupervised-and-Constrained-Dirichlet-Process-Mixture-Models-for-Verb-Clustering X-url: http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN X-url: http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20A3 Bonjour, En raison des gr?ves du 20 nov., *** le s?minaire d'Andreas Vlachos est d?plac? au 21 novembre ? 10h30 en salle B311 *** . Merci de pr?venir les personnes int?ress?es autour de vous et d?sol? pour les personnes qui ne pourront pas y assister. - ------------------- Le LIPN accueillera Andreas Vachlos, de l'Universit? de Cambridge, pour un s?minaire qui portera sur des techniques de clustering, contraintes et non supervis?es, appliqu?es au clustering lexical-s?mantique des verbes. Le s?minaire aura lieu au LIPN (Univ.Paris 13, campus de Villetaneuse) en salle B311, le vendredi 21 novembre ? 10h30. Pour venir au LIPN, voir les informations sur : http://www-lipn.univ-paris13.fr/ Cordialement, Antoine Rozenknop - ------------------------ Title : Unsupervised and Constrained Dirichlet Process Mixture Models for Verb Clustering http://www-lipn.univ-paris13.fr/actualites/post/Unsupervised-and-Constrained-Dirichlet-Process-Mixture-Models-for-Verb-Clustering - ------------------------ Summary : In this work we apply Dirichlet Process Mixture Models (DPMMs) to a learning task in natural language processing (NLP): lexical-semantic verb clustering. Furthermore, we propose a novel method of guiding the DPMM towards a particular clustering solution using pairwise constraints. The quantitative and qualitative evaluation performed highlights the benefits of both standard and constrained DPMMs compared to previously used approaches. Results on datasets from general English and the biomedical domain are presented. - ---- S?minaires des ?quipes RCLN et A3 (pas encore mis-?-jour sur ce changement) : http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20RCLN http://www-lipn.univ-paris13.fr/actualites/tag/s%C3%A9minaire%20A3 - ---- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Mon Nov 17 11:27:47 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Mon, 17 Nov 2008 12:27:47 +0100 Subject: Appel: RNTI, Fouille de Donnees d'Opinions (2eme appel) Message-ID: Date: Sat, 15 Nov 2008 11:43:16 +0100 (CET) From: Mathieu.Roche at lirmm.fr Message-ID: <3793.84.98.226.207.1226745796.squirrel at kirkenes.lirmm.fr> X-url: http://www.lirmm.fr/~mroche/FODOP08/Appel_RevueRNTI_opinions.pdf X-url: http://www.lirmm.fr/~mroche/FODOP08/ X-url: http://www.antsearch.univ-tours.fr/rnti/ ################### ########## ####### 2?me appel ? soumissions pour ##### un num?ro sp?cial de la Revue RNTI ### ## FOUILLE DES DONNEES D'OPINIONS # http://www.lirmm.fr/~mroche/FODOP08/Appel_RevueRNTI_opinions.pdf Objectifs de ce num?ro sp?cial : ------------------------------ Pour faire suite ? l'atelier FODOP'08 (http://www.lirmm.fr/~mroche/FODOP08/) sur la probl?matique de la fouille des donn?es d'opinions, un num?ro sp?cial est propos? sur cette m?me th?matique. De plus en plus de documents contenant des informations exprimant des opinions ou des sentiments apparaissent sur le Web (i.e. commentaires ou ?valuations de produits par des clients, forums, groupe de discussion, blogs). Aujourd?hui, la d?tection ou l'extraction automatique d'opinions devient un domaine de recherche particuli?rement prometteur notamment avec le d?veloppement du Web 2.0. Elle devient essentielle pour de tr?s nombreux domaines d'applications. Nous pouvons citer, par exemple, le d?veloppement de t?ches de veille (technologique, marketing, concurrentielle, soci?tale), l'?valuation d'un produit par la communaut? avant un achat, l'image que les clients peuvent se faire d'une entreprise, la d?tection de rumeurs (buzz) sur le web, d?tection d'opinions ?mergentes et/ou significatives dans les forums, etc. Ainsi, les approches traditionnelles de fouille de donn?es doivent ?tre adapt?es ? un contexte dans lequel il faut appr?hender de gros volumes de donn?es particuli?rement h?t?rog?nes. L'objectif principal de ce num?ro sp?cial est alors de d?crire les diff?rents traitements des donn?es d'opinions. Th?mes d?velopp?s (liste non exhaustive) : ---------------------------------------- ? Cat?gorisation automatique de textes d'opinion ? Ontologies et donn?es d'opinion ? Aide ? la d?cision pour les donn?es d'opinion ? Visualisation pour une analyse des donn?es d'opinion ? Interrogation des donn?es d'opinion ? Acquisition de bases de donn?es d'opinion ? Veille technologique pour l'analyse des opinions ? D?tection de tendances dans les opinions ? Fouille du Web pour acqu?rir et/ou analyser des textes d'opinion ? TAL ? partir de textes d'opinion - Analyse de discours Coordinateurs : ------------- - Mathieu Roche (LIRMM, Univ. Montpellier 2) - Pascal Poncelet (LIRMM, Univ. Montpellier 2) Comit? de R?daction : ------------------- ? Nathalie Aussenac-Gilles (IRIT) ? Catherine Berrut (LIG) ? Vincent Claveau (IRISA) ? B?atrice Daille (LINA) ? G?rard Dray (LGI2P) ? Marc El-B?ze (LIA) ? St?phane Ferrari (GREYC) ? Patrick Gallinari (LIP6) ? Jean-Gabriel Ganascia (LIP6) ? Eric Gaussier (LIG) ? Martine Hurault Plantet (LIMSI) ? Anne Laurent (LIRMM) ? Sigrid Maurel (CELI France) ? Elisabeth M?tais (Cedric CNAM) ? Josiane Mothe (IRIT) ? Patrick Paroubeck (LIMSI) ? Michel Planti? (LGI2P) ? Violaine Prince (LIRMM) ? Christophe Roche (LISTIC) ? Ludovic Tanguy (CLLE-ERSS) ? Maguelonne Teisseire (LIRMM) - Anne Vilnat (LIMSI) Calendrier : ---------- ---------------------------------------------------------------- | 15 d?cembre 2008 : Soumission d'un r?sum? d'une page | 16 janvier 2009 : Soumission des articles | 13 mars 2009 : Notification aux auteurs | 10 avril 2009 : Envoi de la version finale des articles ---------------------------------------------------------------- Recommandations aux auteurs : --------------------------- Dans un premier temps, Une d?claration d'intention avec un r?sum? d'une page est ? envoyer avant le 15 d?cembre 2008 ? Mathieu Roche et Pascal Poncelet (mroche at lirmm.fr et poncelet at lirmm.fr). Les articles complets au format pdf devront ?tres soumis avant le 16 janvier 2009. Ils devront respecter la feuille de style de la revue RNTI disponible sur le site http://www.antsearch.univ-tours.fr/rnti/. Les articles auront une longueur de 20 ? 25 pages. Ils devront ?tre ?crits en fran?ais ou en anglais. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Mon Nov 17 11:29:23 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Mon, 17 Nov 2008 12:29:23 +0100 Subject: Conf: CatCod 2008, 4-5 decembre 2008, Orleans, France Message-ID: Date: Sat, 15 Nov 2008 19:35:02 +0100 From: "Serge HEIDEN" Message-ID: <016101c94750$df6bceb0$428233c1 at intranet.enslsh.fr> X-url: http://www.catcod.org X-url: http://www.catcod.org/spip.php?rubrique11 X-url: http://textometrie.ens-lsh.fr ************************************************ CatCod 2008 - Programme Premi?res rencontres internationales pour le Catalogage et le Codage de corpus oraux 4 - 5 D?cembre 2008 ? l'Universit? d'Orl?ans, France http://www.catcod.org ************************************************ Chers coll?gues, Voici le programme final du workshop CatCod 2008. La participation est libre. Si vous souhaitez que nous r?servions pour vous : - le d?jeuner du 4 - le d?ner du 4 - le d?jeuner du 5 Merci de pr?ciser, en envoyant un mail ? l'adresse catcod2008 at ens-lsh.fr, le nombre de personnes. Cordialement, Serge Heiden (pour le comit? d'organisation) ________________________________________ CatCod2008 Program http://www.catcod.org/spip.php?rubrique11 Jeudi 4 d?cembre Time Program 10h30 Registration/Accueil 11h30 Welcome session/Bienvenue 12h00 Lunch at Agora restaurant/D?jeuner 13h30 invited speaker #1 14h15 Virginie Andr?, Christophe Benzitoun, Emmanuelle Canut, Jeanne-Marie Debaisieux, Bertrand Gaiffe, Zina Tucsnak Fiche documentaire pour les donn?es orales : description et traitement informatique 15h00 Olivier Baude, Linda Hriba De la variation ? la norme, effets de codage dans les ESLOs 15h45 Break/Pause 16h15 Matthieu Quignard, Bertrand Gaiffe Encodage de corpus oraux en TEI 17h00 Michel Jacobson, Emmanuel Schang Propositions pour le catalogage des donn?es sur les langues en contact 17h45 Jiahong Yuan, Mark Liberman Vowel Acoustic Space in Continuous Speech : An example of using audio books for research 18h30 End of session 20h Diner in Orl?ans Vendredi 5 d?cembre Time Programme 9h00 invited speaker #2 : Lou Burnard Spoken language metadata : is it shareable ? 9h45 Mohamed Belgacem Construction d'un corpus vocal pour la langue arabe 10h30 Break/Pause 10h45 Athanasios Karasimos, Dimitra Melissaropoulou, Dimitrios Papazachariou, Aggeliki Ralli GreeD : Cataloguing and Encoding Modern Greek Dialectal Oral Corpora 11h30 Christophe Parisse, Aliyah Morgenstern Annotations riches dans les corpus de langage oral : contraintes, choix et ?volutivit? des formats et des outils 12h15 Iris Eshkol, Marie-Aim?e Gazeau, Denis Maurel D?finition d'un balisage XML des entit?s nomm?es du corpus Eslo. Quelques pistes pour l'annotation des entit?s d?nommantes 13h Lunch at Agora restaurant/D?jeuner 14h30 Michel Bert, Sylvie Bruxelles, Isabel Colon de Carvajal, Carole Etienne, Lorenza Mondada, V?ronique Traverso, Daniel Val?ro La transcription multimodale outill?e : apports des logiciels d'alignement vid?o 15h15 Anne Dister, Liesbeth Degand, Anne-Catherine Simon A la recherche des unit?s minimales du discours : codages syntaxique et prosodique 16h Break/Pause 16h30 Thierry Bazillon, Yannick Est?ve, Daniel Luzzati Le codage des corpus oraux 17h15 Closing roundtable/table ronde de synth?se 18h30 End of workshop Where : - The workshop takes place in the Amphith??tre IRD, (address : Centre IRD d'Orl?ans, 5 rue du Carbone, 45072 Orl?ans Cedex 2) - Lunch is at the Agora Restaurant on the campus of Orl?ans University ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:27:31 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:27:31 +0100 Subject: Job: Post-doctoral fellow, LiveMemories Message-ID: Date: Mon, 17 Nov 2008 14:19:16 +0100 (CET) From: Fausto Giunchiglia Message-ID: <55039.193.205.194.36.1226927956.squirrel at disi.unitn.it> X-url: http://livememories.fbk.eu/ X-url: http://www.disi.unitn.it/~fausto/ X-url: http://dit.unitn.it/~knowdive/ X-url: http://disi.unitn.it/welcome X-url: http://portale.unitn.it/ateneo/ X-url: http://www.apt.trento.it/ We are looking for a post-doctoral fellow interested in working in the LiveMemories project (http://livememories.fbk.eu/). (A position for a top student interested in pursuing a PhD as part of the same project is also available.) The research will be conducted under the direct supervision of Fausto Giunchiglia (http://www.disi.unitn.it/~fausto/) in the Knowdive Group (http://dit.unitn.it/~knowdive/), a large, multicultural and multidisciplinary group which is part of the Department of Computer Science and Information Engineering ( http://disi.unitn.it/welcome), University of Trento ( http://portale.unitn.it/ateneo/). Key words describing the research area of interest are: metadata management and visualization; human-computer interaction; mash-ups; social networks; geographical, spatial, and temporal data. Essential skills and knowledge relevant to the project are: ? knowledge and experience concerning user interface design and evaluation, along with a general knowledge of human-computer interaction; ? knowledge of languages and methodologies used for the development of rich dynamic web applications (e.g., HTML, JavaScript, XML, CSS, AJAX, mash-ups). Desirable skills and knowledge relevant to the project are: ? understanding of the modeling primitives of the most popular social networks (e.g., Facebook, Myspace, Flickr) - particularly, knowledge of the open protocols of these networks as well as of related standardization initiatives (e.g., OpenSocial, LinkedData); ? knowledge of the typical architectures of web-based applications and related methods and technologies (e.g., cookies, authorized access to web contents, dynamic generation of web contents); ? knowledge of the principles of database design and of relevant languages and methodologies, such as ER diagram modeling, normal forms, SQL, and query optimization; ? experience in developing applications under and/or administering at least one of the more popular DBMSs (e.g., Oracle, DB2, MySQL, PostgreSQL); ? experience in working with geo-spatial databases (e.g, PostGIS); ? experience with project management. Knowledge of Italian is not required. The ideal candidate holds a PhD with top performance in a field related to the areas mentioned above. (S)he should have a proven track record of system design and development as well as of conducting original research and publishing results in good conferences and journals. (S)he should be proactive, self-motivated, able to work independently and in a team, and capable of running projects and leading a small group of programmers and PhD students. The main activities and project responsibilities of the successful candidate and the persons they supervise will concern the design, implementation, and evaluation of user interfaces and associated functionality for: ? accessing, managing, and sharing data, metadata, and ontologies in a multimedia environment; ? accessing, managing, and sharing geographical, spatial, and temporal data; ? enabling the use of social intelligence, including visualization, access, and management of communities; ? organizational intelligence. The candidate and the supervisees will also design and implement an API and a mash-up language for metadata, data, and community integration, including temporal and spatial data. They will also supervise and manage the use in real world conditions of the systems that they develop. The successful candidate will be expected to create a small but strong group of programmers and PhD students that will produce top-level research and publish it in the major relevant venues. The successful candidate will support the project coordinator in the overall project management activities. These activities will include, among other things: managing their work and that of the collaborators; continuous monitoring and checking of the project results; producing project deliverables; and managing contacts and collaborations with the project partners. Salary: According to experience, but expected to fall in the range 24KEuro ? 36KEuro/ year **NET**, including coverage of basic health insurance. Duration: 3 years plus possibly a few extra months, starting as soon as possible and ending with the end of the project. How to apply: Send your CV, a letter explaining your interest in the position, and the names of three referees by December 15th to: fausto at disi.unitn.it. About us: The Department of Information Engineering and Computer Science of the University of Trento is a leading and fast-growing research institution, characterized by a young and international faculty and a large, international student population. About Trento: Trento (http://www.apt.trento.it/) is a small vibrant city (around 100K people) with a beautifully preserved historic center, situated in the middle of the Dolomites. It is consistently ranked at the top in Italy for quality of life. Thanks to its fortunate location, Trento offers a wide variety of cultural and sports opportunities all year around, as well as excellent food and wine. Further information: Fausto Giunchiglia, fausto at disi.unitn.it ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:29:38 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:29:38 +0100 Subject: Job: Poste en CDI, EDF R&D, Ingenieur de Recherche en Statistique, Clamart Message-ID: Date: Mon, 17 Nov 2008 19:23:13 +0100 From: Claire WAAST-RICHARD Message-ID: X-url: http://www.edfrecrute.com Centre d?expertise, la Direction de la Recherche et du D?veloppement d?EDF regroupe pr?s de 2000 collaborateurs pour contribuer ? la performance du Groupe et pr?parer l?avenir (innovation, ?tudes, construction d?outils et d?offres de services). Le D?partement pluridisciplinaire ? Innovation Commerciale Analyse des March?s et de leur Environnement ? (ICAME) fournit un appui ? l??laboration et au portage des offres, des services et des outils de relation Client aux Directions op?rationnelles du Groupe EDF et r?alise notamment des ?tudes qui visent une meilleure connaissance des diff?rentes client?les, r?sidentielles, tertiaires et industrielles, collectivit?s locales du groupe EDF. Le Groupe ? Statistique et Outils d?Aide ? la D?cision ? ?tudie et met en ?uvre plus particuli?rement des m?thodes d?analyse, de fouille et d?enrichissement de donn?es issues d?entrep?ts ou provenant de flux de donn?es. Les domaines techniques particuli?rement explor?s sont : - l??chantillonnage et l?analyse statistique de donn?es, dont les courbes de charge, - le data mining et ses extensions, en particulier, aux donn?es complexes (texte, audio, issues du web), et aux flux de donn?es, - l?informatique d?cisionnelle et les techniques d?extraction et de visualisation de l?information. Dans un contexte de fort d?veloppement, nous recherchons aujourd?hui un(e) : Ing?nieur de Recherche en Statistique (H/F) Poste bas? ? Clamart (92) Vous participerez ? des projets de recherche impliquant une double comp?tence en statistique et syst?me d?information et investiguerez des approches de fouille de donn?es au service de diff?rentes probl?matiques m?tiers et enjeux du Groupe EDF, comme, par exemple, l?approfondissement de la connaissance des clients ? travers des donn?es d?entreprise ou des donn?es externes structur?es ou non. Vous aurez pour mission de proposer des m?thodes d?analyse statistique (classifications, mod?lisations, analyse de donn?es, ?) et de les int?grer dans des outils de gestion d?cisionnelle. Ce poste vous permettra de comprendre les missions des diff?rentes directions op?rationnelles et d?envisager, ? terme, un d?roulement de carri?re vers d?autres directions ou filiales internationales. Dipl?m?(e) d?une ?cole d?ing?nieur avec une sp?cialisation en statistiques, vos stages ou une premi?re exp?rience vous ont permis de d?velopper des comp?tences dans le domaine du data mining (m?thodes et techniques). Vous connaissez id?alement les outils statistiques ou de data mining (SAS, SPAD, R ou S+) ainsi que la d?marche d?cisionnelle (ETL, OLAPs) et ses outils associ?s. Au-del? d?un esprit d?analyse et de capacit?s de synth?se, vous fa?tes aussi preuve de r?activit?, d'autonomie et d'esprit d'initiative. Votre esprit d??quipe, votre adaptabilit? et votre curiosit? vous permettront de r?ussir dans un environnement techniquement et humainement stimulant. Anglais indispensable. Pour postuler suivre le lien : http://www.edfrecrute.com D?rouler les menus : "Accueil" -> "Nous rejoindre" -> "A partir de Bac + 5" Ref du poste: HU09-020 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:20:09 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:20:09 +0100 Subject: These: Remi BOVE, Analyse syntaxique automatique de l'oral, modification horaires Message-ID: Date: Tue, 18 Nov 2008 16:19:12 +0100 (CET) From: Remi BOVE Message-ID: <19611731.3451.1227021553081.JavaMail.root at frontal1> Bonjour ? tous, Ce mail pour vous informer que la soutenance de ma th?se intitul?e "Analyse syntaxique automatique de l'oral : ?tude des disfluences" le 25 novembre prochain qui ?tait initialement pr?vue ? 14h, sera finalement avanc?e ? 13h30. Merci de votre compr?hension, Bien cordialement, R?mi BOVE ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:31:38 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:31:38 +0100 Subject: Info: ELRA signed its first Language Resources distribution agreement Message-ID: Date: Tue, 18 Nov 2008 17:12:39 +0100 From: info at elda.org Message-ID: <4922E977.8080702 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1081 X-url: http://catalog.elra.info/product_info.php?products_id=1082 X-url: http://catalog.elra.info/product_info.php?products_id=1083 X-url: http://catalog.elra.info/product_info.php?products_id=1084 X-url: http://catalog.elra.info/search_result.php?keywords=w0045 X-url: http://www.elra.info/ X-url: http://www.elda.org/ X-url: http://www.kky.zcu.cz/en [Our apologies if you have received multiple copies of this announcement] // /Press Release - Immediate //Paris//, //France//, November//, 18^th 2008/// *Distribution Agreement* /ELRA signed its first Language Resources distribution agreement for Sign Language processing with the //University of West Bohemia./ ELRA and the University of West Bohemia (Department of Cybernetics) signed a Language Resources distribution agreement to announce the first sign-language databases made available in the ELRA catalogue. On behalf of ELRA, ELDA will act as the distribution agency for the University of West Bohemia, by incorporating to the ELRA Language Resources catalogue four audio-visual speech databases designed and collected for the training and testing of Czech audio-visual continuous speech recognition systems. The resources were built on covering the Czech sign-language, including one resource aiming to be used for training lip-/head-tracking systems under various illumination conditions independently of the language. State-of-the-art R&D work is currently taking place at the University of West Bohemia in areas such as audio-visual speech recognition, audi-visual speech synthesis, sign-language translation and sign-language synthesis, with efforts devoted to the deaf community. With these resources, ELRA is willing to extend the current catalogue, by offering a new type of resources: audio-visual resources for sign-language. With this agreement, the Department of Cybernetics will contribute further to the research and technology progress on audio-visual speech recognition systems. List of Resources: ELRA-S0283 Laboratory Conditions Czech Audio-Visual Speech Corpus (UWB-05-LCAVC) ELRA-S0284 Czech Audio-Visual Speech Corpus for Recognition with Impaired Conditions (UWB-07-ICAVR I) http://catalog.elra.info/product_info.php?products_id=1082 ELRA-S0285 Czech Sign Language Corpus for Recognition ? Amateur Signer (UWB-06-SLR-A) http://catalog.elra.info/product_info.php?products_id=1083 ELRA-S0286 Czech Sign Language Corpus for Recognition ? Professional Signer (UWB-07-SLR-P) http://catalog.elra.info/product_info.php?products_id=1084 http://catalog.elra.info/search_result.php?keywords=w0045 For more information on the ELRA catalogue, please contact: Val?rie Mapelli, mapelli at elda.org For more information on ELRA & ELDA, please contact: Khalid Choukri, choukri at elda.org H?l?ne Mazo, mazo at elda.org ELDA 55-57, rue Brillat Savarin 75013 Paris (France) Tel.: +33 1 43 13 33 33 Fax: +33 1 43 13 33 30 *** About ELRA *** The European Language Resources Association (ELRA) is a non-profit making organisation founded by the European Commission in 1995, with the mission of providing a clearing house for language resources and promoting Human Language Technologies (HLT). To find out more about ELRA, please visit our web site: www.elra.info *** About ELDA *** The Evaluation and Language resources Distribution Agency (ELDA) is ELRA operational body. ELDA identifies, collects, markets, and distributes language resources, along with the dissemination of general information in the field of HLT. ELDA also participates in some evaluation projects and campaigns, has considerable knowledge and skills in HLT applications and has participated in many French, European and international projects. To find out more about ELDA, please visit our web site: www.elda.org *** About the Department of Cybernetics, University of West Bohemia *** The aim of the Department of Cybernetics' research activity is the building and development of systems theory and its application in the area of objectively and subjectively uncertain systems as well as in the planning of information and control systems. The basic activity of artificial intelligence is the research into sophisticated computer algorithms and methods of intelligent machine decision-making and classification. The reseach is mostly focused on the area of man-machine voice communication in natural language - automatic speech recognition (ASR). To find out more about the Department of Cybernetics, at the University of West Bohemia, please visit our web site: http://www.kky.zcu.cz/en ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:34:13 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:34:13 +0100 Subject: Appel: eLexicography in the 21st century: New challenges, new applications Message-ID: Date: Thu, 20 Nov 2008 12:10:42 +0100 From: "Magali Paquot" Message-ID: <675E9730A1C24FFAA060A8BEEB227298 at MAGALI01> X-url: http://www.uclouvain.be/en-cecl-elexicography.html Second call for papers - eLexicography in the 21st century: New challenges, new applications Organized by the Centre for English Corpus Linguistics (CECL), Universit? catholique de Louvain, under the aegis of the European Association for Lexicography (EURALEX) and the ACL Special Interest Group SIGLEX. Conference website: www.uclouvain.be/en-cecl-elexicography.html Venue: Louvain-la-Neuve, Belgium Date: 22-24 October, 2009 Organizers: Prof. Sylviane Granger and Dr Magali Paquot Conference theme: Innovative developments in the field of electronic lexicography Key dates - Deadline for submission of abstracts: 15 December 2008 - Notification of acceptance / rejection: 27 February 2009 Papers on the following topics are particularly welcome: - New technological environments (web-based dictionaries, mobile devices, etc.) - Exploitation of language resources: monolingual and multilingual corpora, learner corpora, lexical databases (e.g. WordNet). - Integration of NLP tools (grammatical annotation, speech synthesis, etc.) - Dictionary writing systems and other software available to the lexicographer - Changes to the dictionary macro- and microstructure afforded by the electronic medium (multiple access routes, efficient integration of phraseology, etc.) - Automated customisation of dictionaries in function of users? needs (proficiency level, receptive vs. productive mode, register) - Integration of electronic dictionaries into language learning and teaching (CALL, translator training, etc.) Keynote speakers We are pleased to announce that the following speakers have accepted our invitation to give a keynote presentation at the conference: Ulrich Heid (Universit?t Stuttgart, Germany) Marie-Claude L?Homme (Universit? de Montr?al, Canada) Hilary Nesi (Coventry University, Great-Britain) Michael Rundell (Lexicography MasterClass Ltd, Great-Britain) Piek Vossen (Vrije Universiteit Amsterdam, The Netherlands) Organising committee De Cock Sylvie (Facult?s Universitaires Saint-Louis & CECL, Universit? catholique de Louvain, Belgium) Granger Sylviane (CECL, Universit? catholique de Louvain, Belgium) Paquot Magali (CECL, Universit? catholique de Louvain, Belgium) Rayson Paul (UCREL, Lancaster University, Great-Britain) Tutin Agnes (LIDILEM, Universit? Stendhal-Grenoble 3, France) Local committee De Cock Sylvie (Facult?s Universitaires Saint-Louis & CECL, Universit? catholique de Louvain, Belgium) Decuyper Val?rie (CECL, Universit? catholique de Louvain, Belgium) Gilquin Ga?tanelle (CECL, Universit? catholique de Louvain, Belgium) Granger Sylviane (CECL, Universit? catholique de Louvain, Belgium) Hugon Claire (CECL, Universit? catholique de Louvain, Belgium) Meunier Fanny (CECL, Universit? catholique de Louvain, Belgium) Paquot Magali (CECL, Universit? catholique de Louvain, Belgium) Thewissen Jennifer (CECL, Universit? catholique de Louvain, Belgium) Scientific committee Bogaards Paul (Leiden University, The Netherlands) Bouillon Pierrette (ISSCO, University of Geneva, Switzerland) Cowie Anthony (University of Leeds, Great-Britain) Campoy Cubillo, Maria Carmen (Universitat Jaume I, Spain) de Schryver Gilles-Maurice (Ghent University, Belgium) Drouin Patrick (Oservatoire de Linguistique Sens-Texte, Universit? de Montr?al, Canada) Fairon C?drick (CENTAL, Universit? catholique de Louvain, Belgium) Fellbaum Christiane (Princeton University, United States) Fontenelle Thierry (Microsoft Natural Language Group, United States) Glaros Nikos (Institute for Language and Speech Processing, Greece) Grefenstette Gregory (EXALEAD, France) Hanks Patrick (Masaryk University, Czech Republic) Kilgarriff Adam (Lexical Computing Ltd, Great-Britain) Korhonen Anna (University of Cambridge, Great-Britain) Herbst Thomas (Universit?t Erlangen, Germany) Lemnitzer Lothar (Universit?t T?bingen, Germany) Moon Rosamund (University of Birmingham, Great-Britain) Ooi Vincent (National University of Singapore, Republic of Singapore) Pecman Mojca (Universit? Paris Diderot - Paris 7, France) Piao Scott (The University of Manchester, Great-Britain) Rayson Paul (UCREL, Lancaster University, Great-Britain) Ronald Jim (Hiroshima Shudo University, Japan) Sierra Martinez Gerardo (GIL, Universidad Aut?noma de M?xico, M?xico) Smrz Pavel (Brno University of Technology, Czech Republic) Sobkowiak Wlodzimierz (Adam Mickiewicz University, Poland) Tarp Sven (Centre for Lexicography, Aarhus School of Business, Denmark) Tutin Agnes (LIDILEM, Universit? Stendhal-Grenoble 3, France) Verlinde Serge (Katholieke Universiteit Leuven, Belgium) Yihua Zhang (Guangdong University of Foreign Studies, China) Zock Michael (CNRS - Laboratoire d?Informatique Fondamentale, France) The conference aims to be a showcase for the latest developments in the field and will feature both software demos and a book exhibition. A selection of papers will be invited for expansion into chapters for a book arising from the conference. Language of the conference: English Conference fee: - 230? - Early-bird registration (until 30 June 2009): 200? The conference fee includes: welcome reception, coffee breaks, two lunches (Thursday and Friday) and book of abstracts. Contact: elexicography at uclouvain.be For sponsoring options, please contact sylviane.granger at uclouvain.be ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 21 16:32:45 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 21 Nov 2008 17:32:45 +0100 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Thu, 20 Nov 2008 12:50:16 +0100 From: info at elda.org Message-ID: <49254EF8.3080509 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1085 X-url: http://catalog.elra.info X-url: http://universal.elra.info X-url: http://www.elra.info/LRs-Announcements.html Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** ELRA is happy to announce that 1 new Evaluation Package is now available in its catalogue: * ELRA-E0017 CHIL 2006 Evaluation Package* The CHIL Seminars are scientific presentations given by students, faculty members or invited speakers in the field of multimodal interfaces and speech processing. The language is European English spoken by non native speakers. The recordings comprise the following: videos of the speaker and the audience from 4 fixed cameras, frontal close ups of the speaker, close talking and far-field microphone data of the speaker?s voice and background sounds. The CHIL 2006 Evaluation Package consists of: 1) A set of audiovisual recordings of seminars, called non-interactive seminars and of highly-interactive small working groups? seminars, called interactive seminars. The recordings were done between 2004 and 2005 according to the ?CHIL Room Setup? specification. 2) Video annotations. 3) Orthographic transcriptions. For more information, see: http://catalog.elra.info/product_info.php?products_id=1085 For more information on the catalogue, please contact Val?rie Mapelli mailto:mapelli at elda.org Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:38:51 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:38:51 +0100 Subject: Appel: CALICO'09, Pre-Conference Workshop on Automatic Analysis of Learner Language Message-ID: Date: Sun, 23 Nov 2008 20:26:08 -0500 From: "Xiaofei Lu" Message-ID: <9dde48870811231726u4f50a46fkfe0e42caddb98488 at mail.gmail.com> X-url: http://purl.org/net/calico-workshop X-url: http://purl.org/calico/icall X-url: http://www.personal.psu.edu/xxl13 Second CFP for the CALICO'09 Pre-Conference Workshop on Automatic Analysis of Learner Language (AALL'09): From a better understanding of annotation needs to the development and standardization of annotation schemes March 10 or 11, 2009. Arizona State University, Tempe, AZ. Submission Deadline: December 1, 2008 In this workshop, we want to bring together researchers working on the analysis of learner language in the broad sense, including work on annotation schemes for learner corpora and NLP techniques used to detect learner errors and other learner language properties. We invite abstracts addressing these general issues, including but not limited to: - Which properties of learner language are useful and relevant to obtain for Foreign Language Teaching and current Second Language Acquisition research? - What annotation scheme or (error) taxonomy is appropriate for this and how do different annotation schemes compare? - How reliably can errors and other properties of learner language be obtained automatically given the current state-of-the art in NLP? - What is the impact of the specific properties of learner language on the (re)use of NLP technology? How does it impact performance and the potential use of such technology in foreign language teaching tools? - Which annotated learner language corpora have been used or could be used to evaluate the performance of different approaches to analyzing learner language? The workshop is intended to follow up on the pre-conference workshop on the Automatic Analysis of Learner Language held at CALICO 2008 (http://purl.org/net/calico-workshop). We invite submissions of anonymous two page abstracts in an email with the abstract as a pdf attachment. Name, affiliation, and email address should only be included in the text of the email, not in the abstract in the pdf attachment. Send submissions to: calico-workshop at ling.osu.edu Submission Deadline: December 1 Please use the following Subject: Submission to AALL '09 The workshop is organized by the ICALL Special Interest Group of CALICO (http://purl.org/calico/icall), currently chaired by Xiaofei Lu (Pennsylvania State University) and Detmar Meurers (Universit?t T?bingen). Questions on the event? Contact us at calico-workshop at ling.osu.edu -- Xiaofei Lu, Assistant Professor Department of Applied Linguistics The Pennsylvania State University http://www.personal.psu.edu/xxl13 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:47:57 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:47:57 +0100 Subject: Appel: EvalECD'09 - Extension de la date limite de soumission au 28 novembre 2008 Message-ID: Date: Mon, 24 Nov 2008 14:26:13 +0100 From: Nicolas B?chet Message-ID: <492AAB75.3020305 at lirmm.fr> X-url: http://www.lirmm.fr/~bechet/EvalECD X-url: http://www.lirmm.fr/~bechet/EvalECD/atelier_egc.cls Bonjour, [Veuillez nous excuser en cas de r?ceptions multiples] EXTENSION DE LA DATE DE SOUMISSION AU 28 NOVEMBRE 2008 Second appel ? communications ============================= 1er atelier sur l'?valuation des m?thodes d'Extraction de Connaissances dans les Donn?es (EvalECD) organis? dans le cadre de la conf?rence EGC 2009. le 27 janvier 2009, Strasbourg, France. Site web de l'atelier : http://www.lirmm.fr/~bechet/EvalECD Contact : evalecd09 at lirmm.fr L'objectif de cet atelier est de discuter des techniques d'?valuation utilis?es dans diff?rents domaines et de montrer leurs qualit?s et leurs limites. Un tel atelier ouvert aux diff?rentes communaut?s d'EGC permet de compl?ter et/ou g?n?raliser les travaux pr?sent?s dans des ateliers tr?s sp?cifiques (par exemple, ateliers de TIA'05, COLING'08 en Traitement Automatique des Langues). Cet atelier permettra ainsi de proposer un d?but de solutions aux probl?mes occasionn?s par la diversit? des ?valuations en ECD. Th?mes d?velopp?s (liste non limitative) ======================================= * Protocoles d'?valuation (automatiques, semi-automatiques, manuels) * Mesures d'?valuation (Pr?cision, Rappel, F-Mesure, Courbes ROC, ...) * Tuning : sp?cifications des param?tres * Construction de benchmarks * Validation de connaissances en ECD * Expertise humaine en TAL et en IC * ?valuation en Int?gration de Donn?es et en R?conciliation de Donn?es * ?valuation des outils d'IHM (ergonomie, visualisation) Dates importantes ================= * Soumission des articles : *28 novembre 2008* * Notification aux auteurs : 22 d?cembre 2008 * Soumission de la version finale : 5 janvier 2009 * EvalECD 2009 : 27 janvier 2009 Modalit?s de soumission ======================= Les articles soumis peuvent ?tre r?dig?s en fran?ais ou en anglais, sur environ 12 pages incluant toutes les r?f?rences et les figures. Les articles pourront ?tre beaucoup plus courts, en particulier pour les articles pr?sentant un travail qui d?bute. Les soumissions se feront au format PDF. Le format requis pour les actes de l'atelier EvalECD'09 (latex uniquement) est le suivant : http://www.lirmm.fr/~bechet/EvalECD/atelier_egc.cls Les soumissions devront ?tre envoy?es ? l'adresse ci-apr?s avant le *28 novembre 2008* : evalecd09 at lirmm.fr Organisateurs ============= - Nicolas Bechet (LIRMM) - Mathieu Roche (LIRMM) - Fatiha Sa?s (LRI/INRIA-Saclay-?le-de-France) Comit? de Programme =================== - Bernd Amann (LIP6) - Jean-Yves Antoine (LI) - J?r?me Az? (LRI) - Zohra Bellahs?ne (LIRMM) - Catherine Berrut (LIG) - Patrice Buche (INRA - Unit? M?t at risk) - Bich-Li?n Doan (Sup?lec) - St?phane Lallich (ERIC) - Anne Laurent (LIRMM) - Nathalie Pernelle (LRI, INRIA Saclay-?le-de-France) - Pascal Poncelet (LIRMM) - Chantal Reynaud (LRI, INRIA Saclay-?le-de-France) - Christophe Roche (LISTIC) - Bernard Rothenburger (IRIT) - Laurent Simon (LRI, INRIA Saclay-?le-de-France) - Maguelonne Teisseire (LIRMM) - Alexandre Termier (LIG) - Fabien Torre (LIFL) - Juan Manuel Torres-Moreno (LIA) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:49:15 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:49:15 +0100 Subject: Sujet de These: Bourse de Doctorat en analyse syntaxique probabiliste (PhD funding) Message-ID: Date: Mon, 24 Nov 2008 16:02:54 +0100 From: Alexis Nasr Message-ID: <492AC21E.5090502 at lif.univ-mrs.fr> [english version below] Offre de th?se au Laboratoire d'Informatique Fondamentale dans le domaine de l'analyse syntaxique probabiliste Lieu : Laboratoire d'Informatique Fondamentale (Marseille) Date : 1/1/2009 Dur?e : 3 ans Cette th?se s'inscrit dans le projet ANR Sequoia qui porte sur l'analyse syntaxique probabiliste ? large couverture du fran?ais. Le sujet de la th?se pourra porter sur diff?rents aspects du projet selon le profil des candidats. Le candidat retenu sera accueilli par l'?quipe Traitement Automatique du Langage Ecrit et Parl? ou par l'?quipe Bases de Donn?es et Apprentissage Automatique, selon son profil. Deux th?mes sont privil?gi?s : - grammaires probabilistes . extraction de grammaires probabilistes ? partir de banques d'arbres . mod?les probabilistes pour la syntaxe - r?ordonnancement des analyses produites par un analyseur . ?tude des diff?rents mod?les de r?ordonnancement (boosting, support vector machines ...) . r?ordonancement de for?ts d'analyse . int?gration des deux phases d'analyse syntaxique et de r?ordonnancement. Profil recherch? : - formation en TAL ou en apprentissage automatique - ma?trise des langages c et c++ - volont? de travailler ? la fronti?re entre TAL et apprentissage automatique Contacts: Alexis Nasr alexis.nasr at lif.univ-mrs.fr Liva Ralaivola liva.ralaivola at lif.univ-mrs.fr ------------------------------------------------------------------------ 3 yeard PhD funding at the Laboratoire d'Informatique Fondamentale in the field of probabilistic parsing Location : Marseille, France Starting : 1/1/2009 This PhD is part of a French National Research Agency funded project on large scale probabilistic parsing of French. Depending on the candidate's profile, the PhD subject will concern different aspects of the project. Priority will be given to two aspects : - probabilistic grammars . probabilistic grammar extraction from treebanks . probabilistic models for syntax - reranking of the parses produced by a parser . study of the current reranking models (boosting, support vector machines ...) . reranking of a parse forest . integration of the parser and the reranker in a single process The successful candidate should : - hold a relevant degree in the field of Natural Language Processing or Machine Learning. - master the C and C++ programming languages - have the will to work at the frontier of Natural Language Processing or Machine Learning. Contacts: Alexis Nasr alexis.nasr at lif.univ-mrs.fr Liva Ralaivola liva.ralaivola at lif.univ-mrs.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:52:39 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:52:39 +0100 Subject: Livre: La pertinence et ses origines Message-ID: Date: Mon, 24 Nov 2008 22:14:54 +0100 (CET) From: Jean-Louis Dessalles Message-Id: <200811242114.mAOLEskV009978 at fantomas.enst.fr> X-url: http://www.enst.fr/~jld/POC ============================== J'ai le plaisir d'annoncer la parution d'un nouveau livre: "La pertinence et ses origines cognitives - nouvelles th?ories" http://www.enst.fr/~jld/POC Ce livre propose plusieurs "lois" qui mod?lisent notre sensibilit? ? la pertinence des prises de parole spontan?es. La principale nouveaut? est la d?couverte du r?le central que joue la notion math?matique de complexit?, qui semble spontan?ment mesur?e par les ?tres humains. Une situation appara?t comme pertinente d?s lors qu'elle est moins "complexe" que pr?vu. Le livre pose ?galement la question de la raison-d'?tre biologique de notre exigence de pertinence. Il propose l'une des premi?res th?ories de son ?mergence qui soit compatible avec le cadre darwinien. ============================== jean-louis Dessalles www.telecom-paristech.fr/~jld ============================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:56:45 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:56:45 +0100 Subject: Appel: ALLT 2009 Message-ID: Date: Tue, 25 Nov 2008 14:52:04 +0800 (CST) From: spwang2005 at yahoo.com.tw Message-ID: <924603.99972.qm at web73312.mail.tp2.yahoo.com> X-url: http://www.afl.ntust.edu.tw/p0.htm X-url: http://intl-house.howard-hotels.com.tw/ Call for Abstracts 2009 International Conference on Applied Linguistics & Language Teaching (ALLT) April 16-18, 2009 Conference Themes : Second language acquisition (SLA): Theory and application Corpus/Corpora in Language Application & Teaching CALL and Web in Applied Linguistics and Language Teaching Cross Culture and Literature in Language Teaching Language testing & assessment Language for Specific Purposes (LSP) in Application & Teaching Teaching Chinese as a Second Language (TCSL): Trends and Challenges Translator and interpreter training theories and practices Educational objectives of applied English / foreign language programs Other relevant topics are also welcome. Plenary, Featured and Keynote Speakers TESOL: 1. Professor Amy Tsui 2. Professor Martin Bygate (Department of Linguistics, University of Lancaster) (to be confirmed) 3. Professor Mike Scott (WordSmith) ? Linguistics & Chinese TCSL 1. ????? (????????????) 2. ????? (???????????) 3. ????? (??????????) 4. ????? (?????) ? Corpus Linguistics 1. Professor Lou Burnard (BNC) 2. ????? (???????????) 3. Professor Mike Scott (WordSmith) ? Interpretation & Translation 1. Prof. Mariachiara Russo 2. ???? (??????????) ? Featured Colloquiums, Workshops and Activities 1. Papers, workshops, and colloquiums (3-4 persons as a team preferred) 2. Methodology: qualitative vs. quantitative 3. Seminar for journal papers: writing and submission 4.???? Studies in English Language and Literature http://intl-house.howard-hotels.com.tw/ ? ???? ? ?????: 97?12?20? (??????350???????mail?: (allt at mail.ntust.edu.tw) Please check????????????? ?Paper??????? ?Student Session???????? ?workshop? ??colloquium ?????????: 97?12?30? ??????: 98?3?5??10-12 ?? ?????: 98?4?16~18? ?????????????? Website: http://www.afl.ntust.edu.tw/p0.htm ? ?????????????:? ??????????? 2009 International Conference ??? 106 ?????? 4 ? 43 ? (Paper submission requires 2 hardcopies, one 3.5 diskette, MSWord 6.0 or above; APA/MLA style) ? Conference Chair, ????? (????????????) Conference convener: ????? (???????????) Conference organizer: Dr. Joe Wang Contact person: ??(Emy)????(Claire) ?(claire at mail.ntust.edu.tw; allt at mail.ntust.edu.tw) Tel: 886-2 2730-3602 Fax: 886-2-2730-1112 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:57:37 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:57:37 +0100 Subject: Appel: TIME 2009 Message-ID: Date: Tue, 25 Nov 2008 17:01:02 +0100 From: Carsten Lutz Message-id: X-url: http://www.inf.unibz.it/krdb/events/time-2009/ X-url: http://www.easychair.org/conferences/?conf=time2009 TIME 2009 Call for Papers Sixteenth International Symposium on Temporal Representation and Reasoning Brixen, Italy, July 23-25, 2009 http://www.inf.unibz.it/krdb/events/time-2009/ The TIME symposium series is a well-established annual event that brings together researchers from all areas of computer science that involve temporal representation and reasoning. This includes, but is not limited to, artificial intelligence, temporal databases, and the verification of software and hardware systems. In addition to fostering interdisciplinarity, the TIME symposia emphasize bridging the gap between theoretical and applied research. TIME 2009 encompasses three tracks, but has a single program committee. The conference will span three days, and will be organized as a combination of technical paper presentations, poster sessions, and keynote lectures. * IMPORTANT DATES Abstract Submission: April 6 Paper Submission: April 9 Paper Notification: May 11 Camera Ready Copy Due: May 22 TIME 2009 Symposium: July 23-25 * TOPICS Track 1: Temporal Representation and Reasoning in AI - temporal aspects of agent- and policy-based systems - spatial and temporal reasoning - reasoning about actions and change - planning and planning languages - ontologies of time and space-time - belief and uncertainty in temporal knowledge - temporal learning and discovery - time in problem solving (e.g. diagnosis, scheduling) - time in human-machine interaction - temporal information extraction - time in natural language processing - spatio-temporal knowledge representation systems - spatio-temporal ontologies for the semantic web Track 2: Temporal Database Management - temporal data models and query languages - temporal query processing and indexing - temporal data mining - time series data management - stream data management - spatio-temporal data management, including moving objects - data currency and expiration - indeterminate and imprecise temporal data - temporal constraints - temporal aspects of workflow and ECA systems - real-time databases - time-dependent security policies - privacy in temporal and spatio-temporal data - temporal aspects of multimedia databases - temporal aspects of e-services and web applications - temporal aspects of distributed systems - novel applications of temporal database management - experiences with real applications Track 3: Temporal Logic and Verification in Computer Science - specification and verification of systems - verification of web applications - synthesis and execution - model checking algorithms - verification of infinite-state systems - reasoning about transition systems - temporal architectures - temporal logics for distributed systems - temporal logics of knowledge - hybrid systems and real-time logics - tools and practical systems - temporal issues in security * PAPER SUBMISSION Submissions of high quality papers describing research results or on-going work are solicited. Submitted papers should contain original, previously unpublished content, should be written in English, and must not be simultaneously submitted for publication elsewhere. Submitted papers will be refereed by at least three reviewers for quality, correctness, originality, and relevance. Accepted papers will be presented at the symposium and included in the proceedings, which will be published by the IEEE Computer Society Press. Acceptance of a paper is contingent on one author presenting the paper at the symposium. Submissions should be in PDF format (with the necessary fonts embedded). They must be formatted according to the IEEE guide- lines described at ftp://pubftp.computer.org/press/outgoing/ proceedings/8.5x11 - Formatting files/ and must not exceed 8 pages; over-length submissions may be rejected without review. Papers are submitted electronically via Easychair: http://www.easychair.org/conferences/?conf=time2009 * CONFERENCE OFFICERS General Chair: David Toman, University of Waterloo, Canada Program Committee Chairs: Carsten Lutz, University of Bremen, Germany Jean-Francois Raskin, Free University of Brussels, Belgium Organization Chair: Alessandro Artale, Free University of Bozen-Bolzano, Italy * PROGRAM COMMITTEE Peter van Beek, University of Waterloo, Canada Claudio Bettini, University of Milan, Italy Thomas Brihaye, University of Mons-Hainaut, Belgium Franck Cassez, National ICT Australia Jan Chomicki, University at Buffalo, USA Carlo Combi, University of Verona, Italy Alessandro Cimatti, IRST, Italy Stephane Demri, CNRS, France Bernd Finkbeiner, Saarland University, Germany Michael Fisher, Liverpool, UK Tim French, University of Western Australia, Australia Antony Galton, University of Exeter, UK Alfonso Gerevini, University of Brescia, Italy Valentin Goranko, University of Witwatersrand, South Africa Rajeev Gore, ANU, Australia Keijo Heljanko, Helsinki University of Technology, Finland Ian Hodkinson, Imperial College, UK Ulrich Hustadt, University of Liverpool, UK George Kollios, Boston University, USA Orna Kupferman, Hebrew University, Israel Francois Laroussinie, CNRS, France Salvatore Latorre, University of Salerno, Italy Nicolas Markey, CNRS, France Rupak Majumdar, University of California, USA Angelo Montanari, University of Udine, Italy Madhusudan Parthasarathy, University of Illinois, USA Ian Pratt-Hartmann, Manchester University, UK Jochen Renz, Australian National University, Australia Roger Villemaire, UQAM, Canada Sean Wang, University of Vermont, USA Jef Wijsen, University of Mons-Hainaut, Belgium Ouri Wolfson, University of Illinois, USA Pierre Wolper, University of Liege, Belgium Frank Wolter, University of Liverpool, UK James Worrell, Oxford University, UK Michael Zakharyaschev, Birkbeck College, UK Carlo Zaniolo, University of California, USA * FURTHER INFORMATION Questions related to submission, reviewing, and program: time09 at informatik.uni-bremen.de Questions related to local organization: artale at inf.unibz.it ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Tue Nov 25 21:58:45 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 25 Nov 2008 22:58:45 +0100 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Tue, 25 Nov 2008 18:32:13 +0100 From: info at elda.org Message-ID: <492C369D.502 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1087 X-url: http://catalog.elra.info/product_info.php?products_id=1088 X-url: http://catalog.elra.info X-url: http://universal.elra.info X-url: http://www.elra.info/LRs-Announcements.html Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** ELRA is happy to announce that 2 new Speech Resources are now available in its catalogue: * ELRA-S0292 Danish EUROM1 (EUROM1_D) *EUROM1 is the first really multilingual speech database produced in Europe. Over 60 speakers per language pronounced numbers, sentences, isolated words using close talking microphone. For more information, see: http://catalog.elra.info/product_info.php?products_id=1087 *ELRA-S0293 The HIWIRE database, a noisy and non-native English speech corpus for cockpit communication* The database contains 8,099 English utterances pronounced by non-native speakers (31 French, 20 Greek, 20 Italian, and 10 Spanish speakers). The collected utterances correspond to human input in a command and control aeronautics application. The data was recorded in studio with a close-talking microphone and real noise recorded in an airplane cockpit was artificially added to the data. The signals are provided in clean (studio recordings with close talking microphone), low, mid and high noise conditions. The three noise levels correspond approximately to signal-to-noise ratios of 10dB, 5dB and -5 dB respectively. For more information, see: http://catalog.elra.info/product_info.php?products_id=1088 For more information on the catalogue, please contact Val?rie Mapelli mailto:mapelli at elda.org Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:42:51 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:42:51 +0100 Subject: Appel: AFLiCo 3, 27-29 mai 2009, Paris 10-Nanterre Message-ID: Date: Thu, 27 Nov 2008 13:04:32 +0100 From: Guillaume Desagulier Message-ID: <492E8CD0.8030505 at univ-paris8.fr> X-url: http://www.modyco.fr X-url: http://www.modyco.fr/aflico3 (toutes nos excuses pour les envois multiples) SECOND APPEL A COMMUNICATIONS (version en anglais plus bas) 3e Colloque International de l?Association Fran?aise de Linguistique Cognitive (AFLiCo) ? Grammaires en construction(s) ? Organise par le laboratoire MoDyCo (http://www.modyco.fr) Universite Paris 10, Nanterre, La Defense, France 27-29 mai 2009 http://www.modyco.fr/aflico3 INTERVENANTS INVITES Hans C. BOAS (Univ. du Texas, Austin, USA) Gilles FAUCONNIER (Univ. de Californie, San Diego, USA) Jacques FRAN?OIS (Univ. de Caen, France) Adele GOLDBERG (Univ. de Princeton, USA) Stephane ROBERT (LLACAN, ENS, France) Bernard VICTORRI (Lattice, ENS, France) Richard WATTS (Univ. de Berne, Suisse) OBJECTIFS DU COLLOQUE Cette conference a pour but de reunir les acteurs de la linguistique cognitive en France et au dela, et de renforcer la collaboration entre chercheurs entamee lors des deux precedentes editions a Bordeaux (2005) et Lille (2007) Le concept de grammaire a une importance cruciale dans le cadre theorique de la linguistique cognitive et de nombreuses problematiques se construisent ? partir de lui. Entite cognitive construite (par les linguistes, mais aussi par les locuteurs) et / ou emergente (soumise ? la variation et au changement, car regulee par des forces tout ? la fois conservatrices et innovantes) la grammaire est au centre d?enjeux theoriques considerables. Elle occupe des lors une position-cle qu?il faut interroger. Dans le prolongement des deux precedents colloques de l?AFLiCo, il s?agit donc de focaliser notre attention sur une nouvelle dimension de la linguistique cognitive, un concept qui se decline de differentes fa?ons, depuis la grammaire cognitive de Langacker jusqu?aux grammaires dites de constructions. Ces dernieres, en particulier, constituent aujourd?hui la branche la plus dynamique de ce cadre general de par le nombre de publications et l?impact de ces recherches sur differents niveaux de la linguistique (syntaxe, semantique, morphologie et pragmatique). SESSIONS GENERALES Le colloque AFLiCo 3 sera aussi l?occasion d?aborder des problematiques reliees ? la question de la grammaire (liste non-exhaustive) : - La notion d?unite linguistique en rapport avec d?autres concepts comme l?enracinement (entrenchment) ou la frequence d?occurrence. - Une comparaison entre les differentes traditions (americaines et europeennes) liees au figement, ? la lexicalisation, etc. - La question de l?apprentissage de la grammaire (L1, L2) - Un point de vue diachronique sur les constructions et la grammaticalisation des constructions - La question des methodes (constitution et utilisation de corpus) - Les prolongements de la linguistique cognitive dans la socio-pragmatique Dans le sillage des deux precedents colloques, nous encourageons les propositions de communication portant sur les passerelles entre la linguistique cognitive (au sens large) et la Theorie des Operations Enonciatives de Culioli, l?approche adamczewskienne ou la Psychomecanique du Langage. Le comite d?organisation encourage les jeunes chercheurs a envoyer une proposition de communication. Il est a noter que les communications peuvent porter sur toutes les langues, pas seulement le francais ou l?anglais. SESSIONS THEMATIQUES Les responsables de panels pour les sessions thematiques doivent fournir les renseignements suivants : - un resume du theme choisi ; - des precisions concernant la structure globale de la session : ordre des presentations, contributions des intervenants, pauses, debats ; - les resumes des communications de chacun des intervenants, ainsi que les renseignements demandes dans la procedure de soumission ci-dessous. Les intervenants sont libres de choisir la structure interne de leur session thematique des lors qu?elle n?affecte pas la structure generale du colloque (pauses cafe, et dejeuner). Nous recommandons que chaque session thematique ne depasse pas une matinee ou une apres-midi. Pour tout renseignement sur l?organisation d?une session thematique, n?hesitez pas a nous contacter (aflico3 at u-paris10.fr). PROCEDURE DE SOUMISSION Chaque proposition sera evaluee par deux relecteurs. Les textes doivent etre anonymes et ne pas depasser 500 mots (hors bibliographie). Ils sont a envoyer par email en fichier attache (MS-WORD -- doc ou rtf -- OpenOffice, PDF) ? l?adresse suivante : aflico3 at u-paris10.fr Dans l?objet de votre message, specifiez : ?abstract AFLICO? Dans le corps du message, precisez : - le nom de l?auteur / des auteurs - titre - affiliation et adresse de l?auteur / des auteurs - presentation ou poster - session thematique ou session generale - 3 ? 5 mots-cles DATES IMPORTANTES Date limite de soumission : Sessions generales : 15 decembre 2008 Sessions thematiques : 8 decembre 2008 (date repouss?e) Notification d?acceptation : debut fevrier 2009 INSCRIPTION Des renseignements specifiques concernant la procedure d?inscription et les dates limites seront affiches tres prochainement sur le site. FRAIS D'INSCRIPTION tarif normal (participants/public) : 80 euros membres d'AFLiCo : 60 euros etudiants : 40 euros etudiants membres de l'AFLiCo : 30 euros Pour rejoindre l'AFLiCo, merci de contacter Stephanie Bonnefille (stephanie.bonnefille at univ-tours.fr) LANGUES DU COLLOQUE Anglais, Fran?ais SITE DU COLLOQUE http://www.modyco.fr/aflico3 NOUVEAU SITE DE L'AFLICO http://www.aflico.fr/ COMITE D?ORGANISATION Guillaume Desagulier, (MCF, MoDyCo-CNRS & Universite Paris 10, Universite Paris 8) Philippe Grea (MCF, MoDyCo - CNRS & Universite Paris 10) Assistes de Simon Harrison (ENS-Lyon), Dylan Glynn (Universite Catholique de Louvain) COMITE SCIENTIFIQUE President : Dominique Legallois, MCF, Universite de Caen Michel Achard (Professeur, Rice University) Cristiano Broccias (MCF, Universite de Genes) Jose Deulofeu (Professeur, Universite de Provence, Aix-Marseille 1) Pierre Encreve (Directeur d'etudes, EHESS) Gilles Fauconnier (Professeur, Universite de Californie, San Diego) Michel de Fornel (Directeur d'etudes, EHESS) Jean-Michel Fortis (CR, CNRS, Paris 7) Jacques Fran?ois (Professeur, Universite de Caen) Dylan Glynn (Charge de recherche, Universite Catholique de Louvain) Craig Hamilton (Assoc. Prof., Universite de Haute Alsace, Mulhouse-Colmar) Martin Haspelmath (Professeur, Max-Planck-Institut, Leipzig) Hans-Petter Helland (Professeur, Universite d?Oslo) Willem Hollmann (MCF, University of Lancaster) Sylvain Kahane (Professeur, Universite Paris 10) Anne Lacheret (Professeur, Universite Paris 10) Bernard Laks (Professeur, Universite de Paris 10) Jean-Remi Lapaire (Professeur, Universite de Bordeaux 3) Peter Lauwers (Charge de recherche, Universite Catholique de Louvain) Maarten Lemmens (Professeur, Universite de Lille 3) Danielle Leeman (Professeur, Universite de Paris 10) Sarah Leroy (CR, MoDyCo-CNRS, Universite Paris 10) Wilfrid Rotge (Professeur, Universite de Paris 10) Dominique Willems (Professeur, Universite de Gand) ======== (apologies for multiple postings) SECOND CALL FOR PAPERS Third International Conference of the French Cognitive Linguistics Association (AFLiCo 3) ?Grammars in construction(s)?. Organized by MoDyCo (http://www.modyco.fr) University of Paris 10, Nanterre, France 27-29 May 2009 http://www.modyco.fr/aflico3 PLENARY SPEAKERS Hans C. BOAS (University of Texas at Austin, USA) Gilles FAUCONNIER (University of California, San Diego, USA) Jacques FRANCOIS (University of Caen, France) Adele GOLDBERG (Princeton University, USA) Stephane ROBERT (LLACAN, CNRS, France) Bernard VICTORRI (Lattice, ENS, France) Richard WATTS (University of Bern, Switzerland) OBJECTIVES The conference aims at bringing together cognitive linguists working in France and abroad, and strengthening the network of discussion and collaboration set in motion by the first two AFLiCo conferences held in Bordeaux (2005) and Lille (2007). The concept of grammar is of crucial importance to the cognitive linguistics framework and forms the basis for numerous research topics. As a constructed cognitive entity (by linguists or speakers), and/or an emergent one, grammar lies at the heart of considerable theoretical issues. The core position currently held by grammar is thus one to be questioned. Drawing on the themes from the last two AFLiCo conferences, we will examine the concept of grammar in regard to its place in cognitive linguistics, as well as in regard to its place in variants of the model, which range from Langacker?s Cognitive Grammar to so-called construction grammars. This year, the focus will be on the latter. In the wake of Charles Fillmore and Paul Kay?s work, construction grammars endeavor to describe grammar not in terms of ?words and lists? (as in generative grammar) but in terms of grammatical constructions whose overall meanings are not predictable from their respective component structures. This enterprise was initially limited to idiomatic constructions (e.g., throw in the towel, kick the bucket, etc.) but swiftly developed to deal with more general constructions (cf. Adele Goldberg?s work on meaningful argument structure). The idea that grammar is composed of constructions ? previously identifiable in the works of George Lakoff and Ronald Langacker ? currently fuels a vast paradigm and applies to a large variety of linguistic phenomena in morphology, syntax, semantics, and pragmatics. GENERAL SESSIONS The 3rd AFLiCo conference will also provide the occasion to address more general points of discussion in relation to the question of grammar (non-exhaustive list): - The notion of linguistic units as linked to other concepts such as entrenchment or frequency of occurrence - Comparisons between different traditions (American and European) regarding the establishment of a linguistic unit as a cognitive routine, lexicalization, the symbolic thesis, etc. - The acquisition of grammar (L1, L2) - Constructions and diachrony - The grammaticalization of constructions - Methodological concerns (constitution and use of corpora) - Grammars of gesture and kinesic systems - The role of conceptual integration and grammatical blending in grammar - The extension of cognitive linguistics into socio-pragmatics In line with one of the main goals of AFLiCo, we welcome papers elaborating the affinities between cognitive linguistics and related theories (Gustave Guillaume, Antoine Culioli, Henri Adamczewski). The organizers further encourage young researchers to submit an abstract. It is to be noted that papers can bear on any language (not just English or French) THEMATIC SESSIONS Organizers of theme sessions are kindly asked to provide the following information: - a short description of their session topic (300-500 words); - an indication of the structure proposed for the whole session: order of presentations, discussant contributions, breaks, and general discussion by the audience; - the abstracts from all of their speakers, accompanied by all the information requested in the abstract specifications above. Proponents can choose the internal structuring of their Theme Session provided that the overall timetable of the conference (notably coffee and lunch breaks) is kept intact. Ideally, a theme session should take no longer than a whole morning or afternoon. For any further detail you may need in the organization of your theme session, please do not hesitate to contact the organizers (aflico3 at u-paris10.fr). SUBMISSION PROCEDURE Abstracts will be submitted to a double, blind review. They should be fully anonymous and not exceed 500 words (references excluded). To be sent via email as attachment (MS-WORD doc or rtf, OpenOffice, PDF) to: aflico3 at u-paris10.fr Please put in the subject line: ?abstract AFLICO 3? In the body of the mail, please specify: - author(s) - title - affiliation of author(s) - presentation or poster - thematic sessions or general session - 3 - 5 keywords IMPORTANT DATES Submission deadline General sessions: December 15th 2008 Theme sessions: December 8th 2008 (extended) Notification of acceptance : Early February 2009 REGISTRATION Details about the registration procedure and registration deadlines will be posted on the conference website as soon as they become available. REGISTRATION FEES Regular fee (participants/audience) : 80 euros AFLiCo members : 60 euros Students : 40 euros Students (including AFliCo membership) : 30 euros If you wish to join the AFLiCo, please contact Stephanie Bonnefille (stephanie.bonnefille at univ-tours.fr) OFFICIAL LANGUAGES French, English CONFERENCE WEBSITE http://www.modyco.fr/aflico3 NEW AFLiCo WEBSITE http://www.aflico.fr/ ORGANIZING COMMITTEE Guillaume Desagulier (Associate Professor, MoDyCo-CNRS-Paris 10, & University of Paris 8) Philippe Grea (Associate Professor, MoDyCo, Paris 10), assisted by Simon Harrison (PhD student, ENS-Lyon), Dylan Glynn (Research Fellow, University of Leuven) SCIENTIFIC COMMITTEE President: Dominique Legallois (Associate Professor, University of Caen) Michel Achard (Professor, Rice University) Cristiano Broccias (University of Genoa) Jose Deulofeu (Professor, Universite de Provence, Aix-Marseille 1) Pierre Encreve (Directeur d'etudes, EHESS) Gilles Fauconnier (Professor, University of California, San Diego) Michel de Fornel (Directeur d'etudes, EHESS) Jean-Michel Fortis (CNRS, Paris 7) Jacques Fran?ois (Professor, Universite de Caen) Dylan Glynn (Research fellow, University of Leuven) Craig Hamilton (Assoc. Prof., Universite de Haute Alsace, Mulhouse-Colmar) Martin Haspelmath (Prof. Dr., Max-Planck-Institut, Leipzig) Hans-Petter Helland (Professor, University of Oslo) Willem Hollmann (Lecturer, University of Lancaster) Sylvain Kahane (Professor, Universite de Paris 10) Anne Lacheret (Professor, Universite de Paris 10) Bernard Laks (Professor, Universite de Paris 10) Jean-Remi Lapaire (Professor, Universite de Bordeaux 3) Peter Lauwers (Lecturer, Universities of Ghent & Leuven) Danielle Leeman (Professor, Universite de Paris 10) Maarten Lemmens (Professor, Universite de Lille 3) Sarah Leroy (CR, MoDyCo-CNRS, Universite de Paris 10) Wilfrid Rotge (Professor, Universite de Paris 10) Dominique Willems (Prof, Dr., University of Ghent) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:44:29 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:44:29 +0100 Subject: Conf: Congres mondial sur la traduction specialisee, 8-13 decembre 2008, La Havane, Cuba Message-ID: Date: Thu, 27 Nov 2008 15:34:44 +0100 From: Adriana Lau Message-Id: <7.0.1.0.2.20081127153430.0696d1c8 at unilat.org> X-url: http://dtil.unilat.org/cmte2008 X-url: http://dtil.unilat.org/cmte2008/fr/programa.htm X-url: http://dtil.unilat.org/cmte2008/fr/inscripcion.htm X-url: http://dtil.unilat.org/ http://dtil.unilat.org/cmte2008 Congr?s mondial sur la traduction sp?cialis?e Langues et dialogue interculturel dans un univers en mondialisation Du 8 au 13 d?cembre 2008 H?tel Habana Libre, ? La Havane (Cuba) Le but de ce Congr?s, dans lequel quelque 300 personnes sont attendues, est de souligner l?importance du travail du traducteur sp?cialis?, garant du multilinguisme. Programme d?taill? : http://dtil.unilat.org/cmte2008/fr/programa.htm Inscriptions : http://dtil.unilat.org/cmte2008/fr/inscripcion.htm ______________________________________________________________________ Adriana Lau DTIL Uni? LLatina - Uni?n Latina - Union latine - Unione Latina - Uni?o Latina - Uniunea Latina 131, rue du Bac - 75007 Paris T. +33 (0) 1 45 49 60 62 F. +33 (0) 1 45 49 67 39 a.lau at unilat.org http://dtil.unilat.org/ Info terminologie/a : www.terminometro.info ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:48:20 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:48:20 +0100 Subject: Journee: Journees d'Etude Projet PEPS Relations, 15-16 decembre 2008, MSH Paris Nord Message-ID: Date: Thu, 27 Nov 2008 22:19:04 +0100 From: "Sylviane R. Schwer" Message-Id: X-url: http://www.mshparisnord.org/acces.htm Le projet "PEPS Relations" a le plaisir de vous annoncer la tenue de leurs Journ?es d'Etudes les lundi 15 et mardi 16 d?cembre 2008 a la Maison des Sciences de l'Homme de Paris Nord (4 rue de la croix Faron, Plaine Saint-Denis) acc?s http://www.mshparisnord.org/acces.htm L'inscription, les pauses caf?s et les buffets des d?jeuners sont gratuits sous r?serve de s'?tre inscrit(e) avant 6 d?cembre aupr?s de schwer at lipn.univ-paris13.fr, en indiquant si vous souhaitez d?jeuner et quels jours. Bien ? vous programme pr?visionnel : Lundi 15 d?cembre 2008 (9h15-18h) ---------------------------------- matin Caf? accueil Sylviane Schwer : Pr?sentation du projet PEPSRelations Fr?d?ric Nef : "relations ou nexus ?" Fran?ois Cl?mentz "Relations internes, relations externes : le double malentendu" Jean-Baptiste Rauzy : "les relations chez Leibniz" D?jeuner-discussion autour d'un buffet apr?s-midi Pierre-Andr? Buvet : "la relation d'appropriation en linguistique" Dale Miller : Relations: their uses in programming and computational specifications Robert Strandh : Implanter les relations dans un langage fonctionnel Mardi 16 d?cembre 2008 (9h15-18h) ---------------------------------- matin Caf? accueil Fred Landman : "n-places relations in natural languages" Lucia Tovena & Sylviane Schwer : quelques sp?cificit?s de la relations partie-tout dans le cas du verbe. Alain Lecomte : "la ludique: un cadre sans relation d'identit? ?" D?jeuner-discussion autour d'un buffet apr?s-midi Christian Retore : les relations dans les mod?les de la logique lin?aire Pierre Livet : les probl?mes sp?cifiques de repr?sentation des relations sociales Emmanuel Lazega : Les relations dans les r?seaux sociaux Synth?se Ces journ?es sont organis?es avec le soutien des organismes suivants : We gratefully acknoledge the support of: - d?partement STIC du CNRS - Universit? Paris Nord - Laboratoire d'informatique de Paris Nord (LIPN, UMR 7030) - Maison des Sciences de l'Homme de Paris Nord ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:50:34 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:50:34 +0100 Subject: Seminaire: Laboratoire Modyco, programme de la seance du 10 decembre 2008 Message-ID: Date: Fri, 28 Nov 2008 09:41:49 +0100 From: GREA Message-ID: <492FAECD.8040500 at u-paris10.fr> X-url: http://www.modyco.fr/index.php?events:s%C3%A9minaire X-url: http://www.modyco.fr/aflico3/img/Plan_campus_oct_2008.pdf X-url: http://www.modyco.fr/?u_s=1&u_a=845&sid= *Universit? Paris Ouest Nanterre La d?fense* S?minaire du laboratoire MoDyCo Contact : Colette Noyau colette.noyau at free.fr, Philippe Gr?a philippe.grea at u-paris10.fr Laboratoire UMR 7114 MoDyCo, 200, avenue de la R?publique 92001 Nanterre Cedex M?tro : RER Nanterre Universit? Horaires : 14h00-16h30 Bat. B, salle de conf?rences Programme http://www.modyco.fr/index.php?events:s%C3%A9minaire Plan http://www.modyco.fr/aflico3/img/Plan_campus_oct_2008.pdf *SEANCE DU 10 DECEMBRE* - 14h00 - 14h45 : F. Tamburini Computational methods for different linguistic phenomena - 14h45 - 15h15 : Pause - 15h15 - 16h00 : M. Nissim Data and models for semantic and discourse processing - 16h00 - 16h30 : J.-R. Lavie Anaphore complexe, syllepse et autres figures, le principe ?Trouver Un Pr?dicat ? RESUMES / ABSTRACTS http://www.modyco.fr/?u_s=1&u_a=845&sid= ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:51:20 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:51:20 +0100 Subject: Job: Stage linguiste pour le japonais - LINGWAY Message-ID: Date: Fri, 28 Nov 2008 12:46:34 +0100 From: Hugues de Mazancourt Message-Id: <9DF4015F-84D3-43DD-B8C7-7A0BB7B80B2A at lingway.com> X-url: http://www.lingway.com/ Ing?nieur Linguiste CDD - japonais Lieu: Le Kremlin-Bic?tre (Paris/Porte d'Italie) Stage r?mun?r? Dur?e: 4 mois ou plus Dates: d?but 2009 Lingway (www.lingway.com), leader europ?en des moteurs de recherche verticaux, recherche, dans le cadre de son offre "search" en japonais un(e) LINGUISTE INFORMATICIEN(NE) pour le japonais Rattach?-e au p?le R&D, vous aurez pour mission de: - tester/valider le moteur de recherche en japonais, - participer au d?veloppement de la version japonaise de notre analyseur linguistique, - contribuer ? la version japonaise du dictionnaire Lingway, Comp?tences requises: - langue japonaise courante - pratique de l'analyse automatique des langues - pragmatique, autonome, aimant le travail en ?quipe Comp?tences souhaitables: - lexicographie - pratique de l'?tude de corpus, - connaissance de Perl, Expressions r?guli?res, etc. - connaissance du japonais technique Adresser CV + lettre de motivation ? hugues.de-mazancourt at lingway.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:53:28 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:53:28 +0100 Subject: Revue: RFLA XIII-2 / Communiquer par la parole Message-ID: Date: Fri, 28 Nov 2008 13:09:53 +0100 From: Publiling Message-Id: <5.0.2.1.2.20081128130759.02cd2e38 at pop.wanadoo.fr> X-url: http://www.rfla-journal.org Parution de la Revue Fran?aise de Linguistique Appliqu?e - volume XIII-2 / d?cembre 2008: Communiquer par la parole: des processus complexes Sommaire (r?sum?s, et informations sur les num?ros d?j? parus, disponibles sur le site de la revue : http://www.rfla-journal.org) Louis-Jean Bo?, H?l?ne L?venbruck, Anne Vilain (Grenoble, GIPSA Lab) (5-7) Pr?sentation. La communication parl?e: d?veloppements r?cents de la recherche Jean-Luc Schwartz, Marc Sato, (Grenoble) Luciano Fadiga (Ferrara) (9-22) The common language of speech perception and action: a neurocognitive perspective H?l?ne L?venbruck, Marion Dohen, Coriandre Vilain (Grenoble) (23-33) From gestural pointing to vocal pointing in the brain Susanne Fuchs (ZAS/Phonetik, Berlin) & Pascal Perrier (Grenoble) (35-44) Understanding speech production: The PILIOS approach Serge Pinto & Alain Ghio (Aix-en-Provence) (45-57) Troubles du contr?le moteur de la parole: contribution de l??tude des dysarthries et dysphonies ? la compr?hension de la parole normale Louis-Jean Bo? (Grenoble), Lucie M?nard (Montr?al), Jih?ne Serkhane (New-York), Peter Birkholz (Rostock), Bernd Kr?ger (Aachen), Pierre Badin (Grenoble), Guillaume Captier (Montpellier), M?lanie Canault (Strasbourg), Nicolas Kielwasser (Cluses) (59-80) La croissance de l?instrument vocal: Contr?le, mod?lisation, potentialit?s acoustiques et cons?quences perceptives Barara Davis (Austin, Texas), Sophie Kern (Lyon), Anne Vilain, Claire Lalev?e (Grenoble) (81-91) Des babils ? Babel: les premiers pas de la parole S?verine Millotte (Gen?ve) (93-102) Le jeune enfant ? la d?couverte des mots Leonardo Maria Savoia (Florence) & Elisabetta Carpitelli (Grenoble) (103-119) Probl?mes de micro-variation phonologique dans les domaines dialectaux de l?Italie septentrionale G?rard Bailly, Fr?d?ric Elisei, Stephan Raidt (Grenoble) (121-131) Boucles de perception-action et interaction face-?-face Compte rendu On ne parle pas franglais. La langue fran?aise face ? l?anglais, de P. Bogaards (133-134) Le num?ro : 25 Euros (+ 3 Euros de frais d?envoi) Commande (envoi direct de ch?que (libell? en euros) ou demande de facture) ? : Publications Linguistiques / secr?tariat administratif 15, rue Lakanal, F-75015 Paris e-mail : publiling at wanadoo.fr R?glement par ch?que bancaire ou postal (libell? en euros), ou par virement international ? l?ordre de : Publications Linguistiques Compte La Banque Postale Paris : 30041 00001 27 562 53 H 020 94 IBAN : FR80 3004 1000 0127 5625 3H02 094 BIC : PSST FRPP PAR Compte Caisse d?Epargne Paris: 17515 90000 042939212 28 53 IBAN : FR76 1751 5900 0004 2939 2122 853 BIC : CEPA FRPP 751 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at LIPN.UNIV-PARIS13.FR Fri Nov 28 15:54:28 2008 From: thierry.hamon at LIPN.UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 28 Nov 2008 16:54:28 +0100 Subject: These: Florian Boudian, Resume automatique de texte Message-ID: Date: Fri, 28 Nov 2008 15:06:31 +0100 From: Juan Manuel Torres Moreno Message-ID: <492FFAE7.4040608 at univ-avignon.fr> Bonjour, J'ai le plaisir de vous annoncer la soutenance de th?se en informatique de Florian BOUDIN au Laboratoire Informatique d'Avignon (LIA). Elle porte sur les approches statistiques pour le r?sum? automatique de texte. La th?se aura lieu le vendredi 5 d?cembre 2008 ? 13h30, dans l'amphi Pascal de l'IUP UAPV/Avignon (Site Agroparc). Vous ?tes cordialement invit?s. -- Juan Manuel TORRES-MORENO Responsable de la th?matique TALNE LIA/Universit? d'Avignon Laboratoire Informatique d'Avignon BP 1228, 84911 Avignon Cedex 9, FRANCE T?l: (+33) 04 90 84 35 68 fax: (+33) 04 90 84 35 01 ======================================================================= Titre: Exploration d'approches statistiques pour le r?sum? automatique de texte R?sum?: Un r?sum? est un texte reformul? dans un espace plus r?duit. Il doit exprimer avec un minimum de mots le contenu essentiel d'un document. Son but est d'aider le lecteur ? rep?rer les informations qui peuvent l'int?resser sans pour autant devoir lire le document en entier. Mais pourquoi avons-nous tant besoin de r?sum?s? Simplement parce que nous ne disposons pas d?assez de temps et d??nergie pour tout lire. La masse d'information textuelle sous forme ?lectronique ne cesse d'augmenter, que ce soit sur Internet ou dans les r?seaux des entreprises. Ce volume croissant de textes disponibles rend difficile l'acc?s ? l'information d?sir?e sans l'aide d'outils sp?cifiques. Produire un r?sum? est une t?che tr?s complexe car elle n?cessite des connaissances linguistiques ainsi que des connaissances du monde qui restent tr?s difficiles ? incorporer dans un syst?me automatique. Dans cette th?se de doctorat, nous explorons la probl?matique du r?sum? automatique par le biais de trois m?thodes statistiques permettant chacune la production de r?sum?s r?pondant ? une t?che diff?rente. Nous proposons une premi?re approche pour la production de r?sum? dans le domaine sp?cialis? de la Chimie Organique. Un prototype nomm? Yachs a ?t? d?velopp? pour d?montrer la viabilit? de notre approche. Ce syst?me est compos? de deux modules, le premier applique un pr?-traitement linguistique particulier afin de tenir compte de la sp?cificit? des documents de Chimie Organique tandis que le second s?lectionne et assemble les phrases ? partir de crit?res statistiques dont certains sont sp?cifiques au domaine. Nous proposons ensuite une approche r?pondant ? la probl?matique du r?sum? automatique multi-documents orient? par une th?matique. Nous d?taillons les adaptations apport?es au syst?me de r?sum? g?n?rique Cortex ainsi que les r?sultats observ?s sur les donn?es des campagnes d??valuation DUC. Les r?sultats obtenus par la soumission du LIA lors des participations aux campagnes d'?valuations DUC 2006 et DUC 2007 sont discut?s. Nous proposons finalement deux m?thodes pour la g?n?ration de r?sum?s mis-?-jour. La premi?re approche dite de maximisation-minimisation a ?t? ?valu?e par une participation ? la t?che pilote de DUC 2007. La seconde m?thode est inspir?e de Maximal Marginal Relevance (MMR), elle a ?t? ?valu?e par plusieurs soumissions lors de la campagne TAC 2008. Mots cl?s: Traitement Automatique du Langage Naturel, R?sum? Automatique, M?thodes Statistiques, Chimie Organique, Maximal Marginal Relevance, Document Understanding Conference, Text Analysis Conference. ======================================= ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ -------------------------------------------------------------------------