From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:18:43 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:18:43 +0100 Subject: Job: Stage de fin d'etude ou de cesure, Orange Message-ID: Date: Fri, 30 Nov 2012 09:10:15 +0100 From: Message-ID: <16671_1354263017_50B869E9_16671_16958_1_A77731DA68DB4D4B838358655763009B94B3B1EB52 at PUEXCB2D.nanterre.francetelecom.fr> Bonjour, Veuillez trouver ci-joint une proposition de stage de fin d'étude qui pourra intéresser des étudiants en traitement automatique des langues. Bien cordialement, Laurence Grauby FT/OF/DMGP/Portail/ARPA/118712 - Local/Pôle Data et Support --------------------------------- téléphone : 05 56 16 92 22 mobile : 06 48 08 11 87 ------------------------------------------------------------------------ Intitulé : Amélioration de la qualité du moteur de recherche 118712 Mission La direction 118712 est une entité marketing en charge de la définition, de la conception et du déploiement des offres de renseignements annuaire d'Orange sur différents canaux (renseignements téléphoniques, web, mobile,...). Le moteur de recherche du 118712 est accessible sur le web (2 millions de visiteurs uniques par mois) et via l’appli mobile 118712. L’objectif du stage est de définir et de mettre en œuvre une stratégie d’amélioration de la qualité des Listes Réponses du moteur mono champ (Google like) du 118712. Au moteur proprement dit est associé un analyseur de requêtes qui permet de typer une requête utilisateur en identifiant ses différents constituants (activité professionnelle, localité, adresse, dénomination...) afin de lui appliquer des traitements spécifiques. L’amélioration des réponses moteur et de l’analyseur de requêtes sont à mener en parallèle. L’ensemble des actions que vous mettrez en œuvre s’articuleront en trois étapes principales : 1- Analyse des Requêtes internautes et de leur résultat : - Choix d’un corpus de requêtes pour l’évaluation - Définition des typologies de demande - Evaluation de la pertinence du moteur de recherche et de l’analyse de requêtes 2- Analyse des anomalies de réponse aux requêtes internautes - Diagnostic sur les causes de non réponses (silence) - Diagnostic sur les causes de réponses non satisfaisantes (bruit) 3- Mise en œuvre d’un plan d’action pour améliorer la qualité - Identification des leviers d’amélioration : données annuaire, paramétrage du moteur et de l’analyseur de requêtes, évolutions logicielles, ... - Priorisation des actions en fonction du bénéfice attendu - Prise en charge des paramétrages (référentiels de mots clés, stratégie de correction automatique de la requête, ...) et évaluation de l’effet sur le corpus - Rédaction du cahier des charges pour les évolutions logicielles Vous mènerez à bien ces réalisations avec le soutien des équipes de développement et dans le respect des orientations marketing. Enfin, vous opérerez une veille technologique et concurrentielle active, et vous vous en inspirerez pour trouver des propositions d’améliorations. Profil recherché Formation bac + 5 (ingénieur, master pro ou recherche) en informatique, technologies internet ou traitement automatique des langues. Stage de fin d’étude ou de césure. Compétences - Intérêt marqué pour le web et les moteurs de recherche – Profil « Ultra connecté » - Manipulation de gros volumes de données, maîtrise d’Excel et d’outils de manipulation de bases de données (SQL, Access, Business Object, ...) - Motivation, sens créatif et savoir être force de proposition, goût pour la résolution de problèmes - Esprit d’analyse et capacité de synthèse, rigueur - Qualités rédactionnelles et maîtrise de la langue, - Bonne communication Modalités Site de France Télécom à Eysines (Pres de Bordeaux) 6 mois à partir de mars 2010 Stage rémunéré Contact : Laurence Grauby (mail : laurence.grauby at orange.com, Tel : 05 56 16 92 22) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:08:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:08:18 +0100 Subject: Appel: SIGIR 2013 - Dublin, Ireland Message-ID: Date: Thu, 29 Nov 2012 07:42:30 -0800 (PST) From: Séamus Lawless Message-ID: <1354203750.14630.YahooMailNeo at web121405.mail.ne1.yahoo.com> X-url: http://www.sigir2013.ie/ =================================================== SIGIR 2013, Dublin, Ireland, 28 July-1 August, 2013 http://www.sigir2013.ie/ =================================================== CALL FOR PAPERS SIGIR is the major international forum for the presentation of new research results and for the demonstration of new systems and techniques in the broad field of information retrieval (IR). The Conference and Program Chairs invite all those working in areas related to IR to submit original full papers, short papers, and proposals for tutorials, workshops, and demonstrations of systems. SIGIR 2013 welcomes contributions related to any aspect of IR theory and foundation, techniques, and applications. Relevant topics include, but are not limited to: - Document Representation and Content Analysis (e.g., text representation, document structure, linguistic analysis, multi-lingual IR, cross-lingual IR, NLP for IR, information extraction, sentiment analysis, clustering, classification, topic models, facets, text streams) - Queries and Query Analysis (e.g., query representation, query suggestion, query reformulation, query intent, conversational search, query log analysis, session analysis, question answering) - Users and Interactive IR (e.g., user models, user studies, user feedback, search interface, summarization, task models, personalized search) - Retrieval Models and Ranking (e.g., IR theory, language models, probabilistic retrieval models, feature-based models, learning to rank, combining searches, diversity) - Search Engine Architectures and Scalability ( e.g., indexing, compression, distributed IR, P2P IR, mobile devices) - Filtering and Recommending (e.g., content-based filtering, collaborative filtering, recommender systems, profiles) - Evaluation (e.g., test collections, effectiveness measures, experimental design) - Web IR and Social Media Search (e.g., link analysis, click models/behavioural modelling, social tagging, social network analysis, advertising and search, blog search, microblog search, forum search, community-based QA (CQA), adversarial IR, vertical and local search) - IR and Structured Data (e.g., XML search, ranking in databases, desktop search, entity search) - Multimedia IR (e.g., image search, video search, speech/audio search, music IR) - Other Applications (e.g., digital libraries, enterprise search, genomics IR, legal IR, patent search, text reuse) Important Dates: - Monday 21 January 2013: Abstracts for full research papers due - Monday 28 January 2013: Full research papers due - Monday 4 February 2013: Workshop proposals due - Monday 18 February 2013: Short papers, demonstration, and tutorial proposals due - Monday 11 March 2013: Notification of workshop acceptances - Monday 11 March 2013: Doctoral consortium proposals due - Monday 15 April 2013: All other acceptance notifications - Sunday 28 July 2013: Conference begins in Dublin Information on how to submit will be available in mid-December, 2012. For details, please visit http://www.sigir2013.ie/. Program Committee Chairs Maarten de Rijke, University of Amsterdam, The Netherlands Diane Kelly, University of North Carolina, Chapel Hill, USA Tetsuya Sakai, Microsoft Research Asia, China General Conference Chairs Gareth Jones, Dublin City University, Ireland Páraic Sheridan, CNGL, Dublin City University, Ireland -------------------------------------------------------------------------------------------- We apologize if you receive duplicates of this CFP. Please feel free to distribute it to those who might be interested. -------------------------------------------------------------------------------------------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:21:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:21:25 +0100 Subject: Seminaire: Alpage, Sandra Kuebler, 7 decembre 2013, Paris Message-ID: Date: Fri, 30 Nov 2012 11:22:01 +0100 From: Marie Candito Message-ID: ************** Séminaire Alpage ******************* Séminaire de l'école doctorale de Paris Diderot : Il s'agit du séminaire de recherche en linguistique informatique organisé par l'équipe Alpage, équipe mixte INRIA - Paris Diderot, spécialisée en analyse syntaxique automatique et en traitement du discours. Le prochain séminaire se tiendra : * vendredi 7 décembre de 11h à 12h30 * en salle 3E91 à l'UFRL, 16, rue Clisson, 75013 Paris (3e étage gauche) Toute personne intéressée est la bienvenue. ****************************** Sandra Kuebler (Indiana University) 20 Years of Statistical Parsing for German: What Have we Learned? Abstract: In this talk, I will look at the development of statistical approaches to parsing German from the beginnings by Dubey and Keller in 2003. German is interesting for parsing research since it counts as a morphologically rich language. But on the richness scale, it is fairly low, and it is still close to English. German is also an interesting case because there are two large-size treebanks available with two different annotation schemes. This puts us in a unique position to look into the influence of decisions in the annotation schemes, independent of the language. However, as the results so far show, there are more questions than answers. I will discuss results on using different parsers as well as different treebanks. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:23:20 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:23:20 +0100 Subject: Sujet de these: 2 PhD positions in computational Linguistics Message-ID: Date: Fri, 30 Nov 2012 10:35:10 +0000 From: Ilaria Tiddi Message-ID: X-url: http://www.uu.se/jobb/phd-students/annonsvisning?tarContentId=222147 Bonjour, J'ai pensé que des étudiants en TAL pourraient être interéssés à cette offre: --- PhD positions in computational linguistics at Uppsala University We are currently advertising for two salaried PhD student positions. You can find the announcement at: http://www.uu.se/jobb/phd-students/annonsvisning?tarContentId=222147 ---- Dans le groupe du prof. Joakim Nivre. Cordialement, Ilaria TIDDI PhD Student KMi Department - The Open University ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:26:34 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:26:34 +0100 Subject: Appel: Coria 2013 et RJCRI 2013 (Report date de soumission) Message-ID: Date: Fri, 30 Nov 2012 14:50:43 +0100 From: Catherine Berrut Message-Id: <624A7440-6414-44EC-A5BC-0CFFCD57DAC6 at imag.fr> X-url: http://coria.unine.ch X-url: http://coria.unine.ch/rjcri.htm La date de soumission des articles à Coria 2013 et RJCRI 2013 est repoussée au 14 décembre. ========================================================= CORIA 2013, Neuchâtel (Suisse), du 3 au 5 Avril 2013 CORIA 2013 (http://coria.unine.ch) est la dixième édition de la COnférence en Recherche d'Information et Applications. Organisée avec le support de l'ARIA (Association francophone de Recherche d'Information et Applications, http://www.asso-aria.org), elle est la principale manifestation francophone dans ce domaine. CORIA a pour but de rassembler les équipes et les chercheurs menant des travaux scientifiques dans le domaine de la recherche d'informations : recherche d'information sur le web, extraction d'information au sein de documents multimédia, analyse d'opinion ou de réseaux sociaux, contextes monolingue ou multilingue, recherche de documents numériques et d'images, apprentissage et classification automatiques, interfaces homme-machine pour l'accès à l'information, etc. CORIA se veut largement ouverte à l'ensemble de la communauté scientifique concernée par la Recherche d'Information. Après s'être tenue à Toulouse, Grenoble, Lyon, Saint-Étienne, Lannion, Toulon, Sousse (Tunisie, en partenariat avec CIFED), Avignon, Bordeaux (en partenariat avec CIFED), CORIA aura lieu cette année du 3 avril au 5 avril 2013 à Neuchâtel (Suisse). L'activité scientifique en recherche d'information connaît une évolution forte depuis la généralisation du web et, plus récemment, le développement de l'informatique nomade. Les limites du domaine sont elles-mêmes en mutation et favorisent les synergies avec les travaux en apprentissage automatique, traitement automatique des langues, traitement de l'image, traitement de la parole, communication écrite et documents, systèmes d'information et bases de données, représentation et gestion des connaissances... Les domaines d'application sont vastes et peuvent être appliqués au web dans sa globalité ou restreints par exemple à des bibliothèques numériques ou des réseaux sociaux. Le public visé par CORIA 2013 est celui des universitaires et chercheurs - confirmés ou non -, des industriels et des spécialistes du domaine et des étudiants en Master se dirigeant vers les métiers de la Recherche. Les soumissions peuvent être faites en anglais ou en français. Les contributions peuvent concerner des travaux académiques ou des applications industrielles. Le programme prévoit deux conférences invitées, l'une de Jamie Callan (CMU), la seconde de Donna Harman (NIST). Ces deux conférenciers feront par ailleurs un cours dédiés aux doctorants lors d'un séminaire du CUSO, le mardi 2 avril 2013 (le jour précédant la conférence). Pendant la conférence CORIA 2013 seront également organisées les 8e Rencontres Jeunes Chercheurs en Recherche d'Information (RJCRI). Elles ont pour objectif de permettre à tous les doctorants de présenter leur problématique de recherche, d'établir des contacts avec des équipes travaillant sur des domaines similaires ou connexes, et d'offrir à l'ensemble de la communauté un aperçu des axes de recherche actuels. Les travaux sélectionnés pour les RJCRI donneront lieu à une présentation orale et sous forme de poster. Cette année, les soumissions conjointes RJCRI et CORIA sont autorisées (voir modalités dans RJCRI http://coria.unine.ch/rjcri.htm ) Thématiques (liste non exhaustive) - Théorie et modèles formels pour la RI : modèle logique, modèles de langages - Multilinguisme : Recherche d'information multilingue, traduction automatique - Multimédia (images, audio, vidéos, son, musique) : indexation, navigation, accès, interactions avec le texte - Passage à l'échelle : indexation, performances, architectures - Classification automatique, clustering, ranking, apprentissage automatique - Filtrage, routage, détection de nouveautés - Modélisation du contexte, personalisation - Traitement Automatique de la Langue Naturelle pour la recherche d'information - Systèmes de Questions Réponses - Extraction d'informations : ontologies, ressources et recherche d'informations, détection d'entités nommées - Web : grands graphes, utilisation de la topologie du web, lois de puissances, citations, analyse de liens - RI et documents structurés : RI et XML, RI précise et recherche de passages - Réseaux sociaux : analyse de blogs et de sites communautaires, suivi de conversations, analyse de rumeurs, analyse de sentiments, détection d'opinion - Recherche collaborative : filtrage, systèmes de recommandation - Interaction utilisateur : interrogation flexible, interfaces, visualisation, modélisation de l'utilisateur, accessibilité, indexation collaborative - Traitement et représentation des connaissances : logique floue, méta-données, ontologies, web sémantique, ingénierie des connaissances - Bibliothèques numériques : RI sur des livres numérisés, robustesse, OCR et indexabilité - Systèmes de recherche d'information dédiés : recherche d'information génomique, géographique - RI distribuée : recherche d'information mobile, située, P2P - Outils pour la recherche d'information : évaluation, bancs d'essais, métriques, expérimentations qualitatives des systèmes Dates importantes La soumission des articles se fera en deux étapes : d'abord la soumission d'un résumé et ensuite la soumission de l'article. Le calendrier de soumission est le même pour CORIA et les RJCRI : - Date limite de soumission des articles : 14/12/2012 - Réponse aux auteurs : 01/02/2013 - Date limite de soumission de la version finale : 22/02/2013 Site de dépôt des articles de Coria : https://www.easychair.org/conferences/?conf=coria2013 Site de dépôt des articles de RJCRI : https://www.easychair.org/conferences/?conf=rjcri2013 Format des articles - Les soumissions peuvent être faites en anglais ou en français. - Les contributions peuvent concerner des travaux académiques ou des applications industrielles. - Les textes de communications doivent comporter 16 pages maximum au format des revues Hermes. Ils doivent être précédés d'une page de garde comportant le titre, les noms et coordonnées précises des auteurs, une liste de mots clé en français et en anglais, un résumé d'une vingtaine de lignes au maximum. La mention « article soumis à CORIA et RJCRI » doit être portée sur la page de garde le cas échéant. - Les articles peuvent être écrits en Word ou en LaTeX. - Le format des articles Word et LaTeX peut être téléchargé sur le site Hermes. - Les articles déposés doivent être au format PDF exclusivement. Modalités RJCRI : voir http://coria.unine.ch/rjcri.htm Catherine Berrut, Professeur Université Joseph Fourier Laboratoire LIG et Polytech Grenoble BP 53 - 38041 Grenoble cedex 9 tel : 04 76 51 42 63 mail : catherine.berrut at imag.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:30:07 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:30:07 +0100 Subject: Livre: Experimentations et evaluations en fouille de textes Message-ID: Date: Fri, 30 Nov 2012 16:05:51 +0100 From: "Ars" Message-ID: <008d01cdcf0c$38e71d40$aab557c0$@fr> Expérimentations et évaluations en fouille de textes un panorama des campagnes DEFT Collection Systèmes d'information et organisations documentaires, sous la direction de Stéphane Chaudiron sous la direction de Cyril Grouin - Dominic Forest La fouille de textes est une activité combinant traitements informatiques et données linguistiques avec comme objectif principal l’extraction et l’organisation automatique des informations présentes dans les textes. Deux familles de méthodes permettent d’atteindre ce but : celles à base de connaissances d’experts et celles reposant sur un apprentissage automatique supervisé. Une campagne d’évaluation consiste à confronter les systèmes développés par plusieurs équipes sur un même jeu de données et en un temps limité. Créé en 2005 à l’image des campagnes anglo-saxonnes, le défi fouille de textes (DEFT) est aujourd’hui la seule campagne d’évaluation francophone en fouille de textes. Cet ouvrage rassemble les méthodes utilisées lors des différentes éditions du défi. Les thématiques relèvent de la classification de documents en genres et thèmes, de la fouille d’opinions et de l’identification de la période de parution d’un document. Les coordonnateurs Ingénieur d’Etudes CNRS au LIMSI, Cyril Grouin travaille sur l’anonymisation de documents cliniques et sur les entités nommées étendues. Il coorganise les campagnes d’évaluation DEFT sur la fouille de textes. Dominic Forest est professeur agrégé à l’Ecole de bibliothéconomie et des sciences de l’information de l’Université de Montréal. Ses recherches portent sur la fouille de textes et les humanités numériques. Nous vous remercions de l'accueil que vous réserverez à cet ouvrage et espérons qu'il suscitera l'intérêt de vos lecteurs. Pour information : ISBN : 978-2-7462-3836-7 - Format : 15,5 x 23,5 - 248 p. - 59 € Éditeur : Hermes - Lavoisier Vous pouvez vous procurer cet ouvrage dans toutes les librairies spécialisées et sur le site Lavoisier : www.lavoisier.fr Expérimentations et évaluations en fouille de textes un panorama des campagnes DEFT Sommaire : Première partie - Introduction Chapitre 1. Expérimentations et évaluations en fouille de textes : un panorama des campagnes DEFT Deuxième partie - Les campagnes en genres et thèmes Chapitre 2. Détecter les ruptures thématiques dans les discours : synergie entre supervision et non- supervision Chapitre 3. L’équipe du GRDS au DEFT2006 : Indexo-II Chapitre 4. Pré-traitements classiques ou par analyse distributionnelle : application aux méthodes de classification automatique déployées pour DEFT2008 Troisième partie - Les campagnes en fouille d’opinions Chapitre 5. Classification d’opinions et convergence des techniques symboliques, statistiques et distributionnelles Chapitre 6. DEFT2009 : essais d’optimisation d’une procédure de base pour la tâche 1 Chapitre 7. Détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique Quatrième partie - Les campagnes diachroniques Chapitre 8. Datation d’un article de journal par analyse lexicale et statistique Chapitre 9. Système du LIA pour la campagne DEFT2010 Chapitre 10. Apprentissage supervisé et paresseux pour la fouille de textes Chapitre 11. Méthodes pour l’archéologie linguistique : datation par combinaison d’indices temporels Index ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:53:32 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:53:32 +0100 Subject: Job: Stage master recherche, Laboratoire ERIC Message-ID: Date: Wed, 28 Nov 2012 15:46:39 +0100 From: Ah-Pine Julien Message-ID: <50B623CF.5070607 at eric.univ-lyon2.fr> Bonjour, Le laboratoire ERIC propose un stage de niveau master orienté recherche d'une durée de 6 mois à partir de janvier 2013. Le sujet porte sur les méthodes hybrides combinant les approches symboliques et les approches statistiques dans le cadre de tâches en Traitement Automatique de la Langue (reconnaissance d'entités nommées, détection d'opinions notamment dans les médias sociaux). Pour plus de détails et pour candidater merci de consulter le document ci-dessous. Par ailleurs, merci de transférer ce message à des étudiants ou départements susceptibles d'être intéressés par l'offre. Bien cordialement, ------------------------------------------------------------------------------- Combining rule-based and statistical-based techniques in Natural Language Processing Research internship at ERIC lab - 6 months starting from january 2013 1 Context This internship proposal is in the context of the french funded project Imagiweb http://eric.univ-lyon2.fr/~jvelcin/imagiweb/. The project is concerned with the analysis of the representation that entities want to disseminate about themselves through web 2.0 tools. The entities the project target are of different kinds and could be politicians, companies and so on. How do the recipients perceive these entities after the statements they make through their posts, blogs and so on ? What are the different types of representations/opinions about these entities that emerge from social media data and from different communities ? In order to address these general issues, the project proposes an approach that mixes different domains such as sociology, semiology, knowledge bases, natural language processing and text mining. The project gathers six partners : one company, AMI software, one french group, EDF, one american group, Xerox and three public research labs, CEPEL (in political science), ERIC lab and LIA (in computer science). 2 Topic description In this context, the ERIC lab http://eric.univ-lyon2.fr/ is openning an internship on the general topic \Combining rule-based and statistical-based techniques in Natural Language Processing". The goal of this work is to provide a state-of-the-art report on hybrid techniques (mixing rule-based and statistical-based) used in NLP tasks. Rule-based techniques in NLP generally have high precision but rather poor recall whereas statistical- based methods rather have lower precision but higer recall performances. Many attemps have been proposed in order to combine both types of approaches in order to produce better algorithms (see a non exhaustive list of references below). A more particular attention will be paid to the following NLP tasks : named entity recognition and opinion detection in social media data. The recruited candidate will have to (i) review the main strategies proposed in the literature for combining rule-based and statistical-based methods; (ii) focus on the techniques that could suit the data and tasks of the Imagiweb project and (iii) implement the retained methods in order to conduct some experiments that compare the different techniques. As a result, the implemented algorithms will be tested on a dataset of tweets and/or blogs (in french) provided by other partners in the project in order to help with the detection of entities representations and recipients opinions. This internship will be conducted in close relationship with Xerox http://www.xrce.xerox.com/. 3 Requirements Master degree in machine learning and/or computational linguistics. The ideal candidates have prior work experiences with NLP tools, R and/or Python and have a good understanding of french. 4 Salary Around 436 euros / month 5 Contact and application To apply, please send an email to Julien Ah-Pine mailto:julien.ah-pine at eric.univ-lyon2.fr and Julien Velcin mailto:julien.velcin at eric.univ-lyon2.fr with a resume, a cover letter, the candidate's grades and the name of two references we can contact for recommendation letters. References [1] Julien Ah-Pine and Guillaume Jacquet. Clique-based clustering for improving named entity recognition systems. In EACL, pages 51{59, 2009. [2] Caroline Brun. Detecting opinions using deep syntactic analysis. In Galia Angelova, Kalina Bontcheva, Ruslan Mitkov, and Nicolas Nicolov, editors, RANLP, pages 392{398. RANLP 2011 Organising Committee, 2011. [3] Thierry Charnois, Marc Plantevit, Christophe Rigotti, and Bruno Cremilleux. Fouille de données séquentielles pour l'extraction d'information dans les textes. Revue Traitement Automatique des Langues (TAL), 50(3):59{87, December 2009. [4] Dominic Rout Diana Maynard, Kalina Bontcheva. Challenges in developing opinion mining tools for social media. In Proceedings of the @NLP workshop associated with LREC 12, 2012. [5] Ronen Feldman, Benjamin Rosenfeld, and Moshe Fresko. Teg—a hybrid approach to information extraction. Knowl. Inf. Syst., 9(1):1{18, January 2006. [6] Moshe Fresko, Binyamin Rosenfeld, and Ronen Feldman. A hybrid approach to ner by memm and manual rules. In Proceedings of the 14th ACM international conference on Information and knowledge management, CIKM '05, pages 361{362, New York, NY, USA, 2005. ACM. [7] Natalia Grabar, Marie Dupuch, Amandine Périnet, and Thierry Hamon. Hybrid 2012, innovative hybrid approaches to the processing of textual data. In Proceedings of Hybrid 12, workshop associated to EACL 12, 2012. [8] Kun-Lin Liu, Wu-Jun Li, and Minyi Guo. Emoticon smoothed language models for twitter sentiment analysis. In AAAI, 2012. [9] Xiaohua Liu, Shaodian Zhang, Furu Wei, and Ming Zhou. Recognizing named entities in tweets. In Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Lan- guage Technologies - Volume 1, HLT '11, pages 359{367, Stroudsburg, PA, USA, 2011. Association for Computational Linguistics. [10] Xiaohua Liu, Ming Zhou, Furu Wei, Zhongyang Fu, and Xiangyang Zhou. Joint inference of named entity recognition and normalization for tweets. In Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics: Long Papers - Volume 1, ACL '12, pages 526{535, Stroudsburg, PA, USA, 2012. Association for Computational Linguistics. [11] David Nadeau and Satoshi Sekine. A survey of named entity recognition and classi cation. Linguisticae Investigationes, 30(1):3{26, January 2007. Publisher: John Benjamins Publishing Company. [12] Alexander Pak and Patrick Paroubek. Le microblogage pour la microanalyse des sentiments et des opinions. TAL, 51(3):75{100, 2010. [13] Carlos Rodrìguez-Penagos, Jens Grivolla, and Joan Codina Fibà. A hybrid framework for scalable opinion mining in social media: detecting polarities and attitude targets. In Proceedings of the Workshop on Se- mantic Analysis in Social Media, pages 46{52, Stroudsburg, PA, USA, 2012. Association for Computational Linguistics. [14] Rohini Srihari, Cheng Niu, and Wei Li. A hybrid approach for named entity and sub-type tagging. In Proceedings of the sixth conference on Applied natural language processing, ANLC '00, pages 247{254, Stroudsburg, PA, USA, 2000. Association for Computational Linguistics. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:37:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:37:50 +0100 Subject: Info: Vers un etiqueteur libre du francais / Towards an open-source French tagger Message-ID: Date: Wed, 28 Nov 2012 11:27:17 +0100 From: Agata Savary Message-ID: <50B5E705.3010102 at univ-tours.fr> X-url: http://hackage.haskell.org/package/concraft ENGLISH VERSION FOLLOWS =================================== CONCRAFT (http://hackage.haskell.org/package/concraft) est un étiqueteur libre du polonais basé sur l'idée innovante des CRF contraints (Constrained Conditional Random Fields, cf [1]). Il permet de maîtriser la complexité des CRF classiques en limitant l'ensemble des étiquettes considérées pour un mot par la sortie d'un analyseur morphologique. Il obtient de meilleurs résultats que les autres taggers du polonais, en particulier en ce qui concerne les mots inconnus. Nous souhaiterions étudier l'adaptabilité de CONCRAFT à une langue fléchie d'une autre famille. Ainsi, nous sommes à la recherche : - d'un corpus français annoté morphologiquement (de préférence avec les parties du discours et avec les traits flexionnels tels que nombre, genre, temps, etc.), - d'un analyseur morphologique à large couverture dont le tagset serait équivalent à celui du corpus, - d'autres étiqueteur libres du français pour une études contrastive. Une version française du CONCRAFT, obtenue grâce à cette expérience, serait distribuée sous une licence libre (probablement BSD). [1] Jakub Waszczuk "Harnessing the CRF complexity with domain-specific constraints. The case of morphosyntactic tagging of a highly inflected language", in Proceedings of COLING 2012, Mumbai, India. =================================== CONCRAFT (http://hackage.haskell.org/package/concraft) is an open source tagger for Polish based on a novel idea of a Constrained Conditional Random Fields model (see [1] for details). It allows to harness the complexity of CRFs by constraining the set of labels for a given token by the output of a morphological analyzer. It outperforms existing taggers for Polish, notably with respect to unknown words. We are planning to explore CONCRAFT's adaptability to an inflected language of a different family. Thus, we are looking for: - a morphologically annotated corpus of French (preferably with both parts-of-speech and morphological features such as gender, number, tense, etc.), - a large-coverage morphological analyser whose tagset would be equivalent to the corpus tagset, - other freely-available taggers for French in view of a contrastive analysis. A French version of CONCRAFT obtained in this experiment would be distributed under an open license (probably BSD). [1] Jakub Waszczuk "Harnessing the CRF complexity with domain-specific constraints. The case of morphosyntactic tagging of a highly inflected language", in Proceedings of COLING 2012, Mumbai, India. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:58:01 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:58:01 +0100 Subject: Ecole: Programme du stage NooJ, INALCO, 21-25 janvier 2013 Message-ID: Date: Wed, 28 Nov 2012 16:05:19 +0100 From: Max Silberztein Message-Id: <867CB836-29B6-40F2-B7B1-F3F4D3A47CAE at gmail.com> Stage intensif NooJ à l’INALCO 21 – 25 janvier 2013 65 rue des Grands Moulins, 75013 Paris (attention : places limitées) PROGRAMME Lundi 21 janvier 2013 9H-12H30 : Fouille de texte : textes et corpus, requêtes et concordances, analyses statistiques. 14H Masako Watabe (INALCO) : Morphologie du rromani 14H40 Maximiliano Duran (INALCO) : Dictionnaire et morphologie du quechua 15H20 Hamid Annouz (INALCO) : Conjugaison des verbes berbères 15H40 Kaci Ferroudja (INALCO) : La particule « d » en berbère Mardi 22 janvier 2013 9H-12H30 : Lexique & morphologie : Unités Linguistiques Atomiques, dictionnaires, flexion et dérivation. 14H Xavier Blanco (Univ. Autonome de Barcelone) : Dictionnaires de l’espagnol et du catalan 15H Vincent Bénet (INALCO) : Dictionnaire et morphologie du russe Mercredi 23 janvier 2013 9H-12H30 : Syntaxe locale : requêtes syntaxiques, grammaires locales, extraction d’entités nommées. Thierry Declerck (DFKI GmbH): Analyse des sentiments dans les domaines financier et politique Sandrine Bassols : Dictionnaire et morphologie du kurde Jeudi 24 janvier 2013 9H-12H30 : Syntaxe structurelle : Grammaires hors contexte, contraintes d’accord et arbres structurels. 14H Philippe Lambert (Inst. Jean Lamour) : Questionnaires à réponses ouvertes pour les nanosciences 15H Ariane Louvet : Etude des blogs vietnamiens avec viet4nooj Vendredi 25 janvier 2013 9H-12H30 : Sémantique : Analyse & génération transformationnelle, levée d’ambiguïté sémantique 14H Meng Sun (INALCO) : Détection automatique d’opinions pour le chinois et le français 15H Slim Mesfar (ENSI) : Annotations syntactico-sémantiques de l’arabe Ce stage s’adresse particulièrement aux étudiants de Master, doctorants et chercheurs intéressés par la linguistique descriptive, la linguistique de corpus et l’analyse automatique de textes dans une perspective de sciences humaines. Les inscriptions sont gratuites mais obligatoires. Attention : les places sont limitées à 50 participants maximum. Les étudiants de Master qui peuvent et souhaitent valider le stage auprès de leur département devront impérativement rendre un devoir à l'issue du stage. Chaque participant devra venir avec son ordinateur portable sur lequel NooJ doit être déjà installé (PC Windows, Mac OSX ou LINUX) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:32:06 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:32:06 +0100 Subject: Appel: Atelier SOS'2013, Extension de la date de soumission Message-ID: Date: Fri, 30 Nov 2012 17:34:33 +0100 From: Laurie Serrano Message-ID: X-url: http://weblab-project.org/workshop/sos2013 Extension de la date de soumission au mercredi *5 décembre 2012*.* *Merci de diffuser cet appel à communications le plus largement possible. Toutes nos excuses pour d'éventuelles réceptions multiples.* *Quatrième édition de l’atelier "Sources Ouvertes et Services"* *SOS’2013 (en association avec EGC’2013)* *29 janvier 2013 - Toulouse, France* http://weblab-project.org/workshop/sos2013 *Présentation de l'atelier :* Pour sa quatrième édition, l'atelier SOS'2013 propose de poursuivre une réflexion commune autour des diverses problématiques liées au traitement de données disponibles en sources ouvertes (SO). Les SO désignent l'ensemble des médias accessibles librement, de façon gratuite ou payante, tels qu'Internet, les bases de données publiques, les journaux, les CD-ROM, les chaînes de télévision et de radio, etc., par opposition aux sources fermées dont la consultation nécessite de disposer d'autorisations spécifiques. Ces SO fournissent d’importants volumes de données multimédia hétérogènes (image, texte, audio, vidéo, etc.) qui nécessitent des traitements adaptés en vue de leur exploitation. Cet atelier est dédié à toutes ces étapes, partant de la phase de découverte des sources d’information, en passant par la collecte et l'analyse des données collectées jusqu’à la phase de capitalisation et d’exploitation des connaissances. Un intérêt particulier sera porté aux choix architecturaux retenus pour la réalisation d’applications exploitant les SO. En effet, ces applications tentent généralement de faire cohabiter plusieurs briques logicielles (COTS, logiciels open source, développements ad-hoc, etc.) en vue de la réalisation d'une tâche particulière. Cela représente un défi scientifique et technique auquel les recherches sur l’enchaînement des traitements algorithmiques capables d'exploiter ces données peuvent contribuer. L’accent sera mis sur les architectures orientées services (SOA) et sur l’utilisation des technologies du Web Sémantique. Pour cette nouvelle édition, l'atelier SOS souhaite s'intéresser également au traitement des grandes masses de données ("Big data"). L'explosion récente des données disponibles sur le Web a fait émerger de nouvelles problématiques visant à adapter et optimiser toute la chaine de traitement de l'information face aux nouveaux volumes à traiter. Cet atelier souhaite rassembler des chercheurs issus à la fois des mondes académique et industriel afin d'obtenir un panel représentatif d'acteurs et de leurs travaux sur les thèmes présentés ci-après. *Thèmes de l'atelier :* Les auteurs sont invités à envoyer des propositions ayant une portée théorique, méthodologique ou pratique, sur l’un des thèmes suivants (liste non exhaustive) : * Identification et découverte automatique de sources d’information, * Accès et collecte d’information à partir de sources ouvertes (Web, réseaux sociaux, flux RSS et autres), * Classification, filtrage des informations d'intérêt, * Extraction d’information à partir de textes non structurés et/ou utilisant des vocabulaires spécifiques (blogs, langage sms, forums), * Extraction d’information à partir de gros volumes de données multimédia (texte, image, vidéo, audio), * Analyse des sentiments/opinions dans les médias sociaux (réseaux sociaux, blogs, forums), * Modélisation et capitalisation des connaissances extraites à partir de sources ouvertes (ontologies, annotations sémantiques), * Exploitation des connaissances extraites à partir de sources ouvertes : raisonnement, aide à la décision, visualisation, * Détection de signaux faibles, * Evaluation et qualification des sources d’information, * Evaluation et qualification des informations extraites à partir de sources ouvertes, * Inférence, fouille et validation de liens entre données, * Plate-formes d’intégration de services de traitement hétérogènes : interopérabilité des services, orchestration sémantique, * Applications de veille stratégique ou économique à partir de sources ouvertes, * Applications de renseignement d’origine sources ouvertes (ROSO), * Applications de traitement de l'information orientées "Big data". *Comité de programme :* Florence Amardeilh (Mondeca) Gaël de Chalendar (CEA LIST) Olivier Corby (INRIA, Sophia Antipolis) Valentina Dragos (ONERA) Adil El Ghali (IBM) Christian Fluhr (GEOL Semantics) Bruno Grilheres (Cassidian) Dafni Stampouli (Cassidian) Nicolas Hernandez (Université de Nantes) Alexandre Pauchet (LITIS, Rouen) Haïfa Zargayouna (LIPN, Université de Paris 13) Maroua Bouzid (GREYC, Université de Caen) Cassia Trojahn (IRIT, Toulouse) Klaus Atzenbeck (IISYS, Hof University, Germany) Sinan Yurtsever (Atos, Turkey) Nizar Ghoula (Université de Genève, Switzerland) *Dates importantes :* * Date limite de soumission : *5 Décembre 2012* * Notification aux auteurs : 21 Décembre 2012 * Version finale : 2 Janvier 2013 * Date de l'atelier : 29 Janvier 2013 *Soumission :* Cet atelier invite les auteurs à soumettre leurs articles en français ou en anglais (résumé en anglais souhaité dans les deux cas). Les articles soumis ne devront pas dépasser 12 pages (annexes comprises). Nous vous demandons de respecter les instructions des organisateurs de EGC'2013 et d'utiliser la dernière version du format RNTI disponible à l'adresse suivante : http://www.antsearch.univ-tours.fr/rnti Chaque proposition sera évaluée par au moins deux membres du comité de programme. Les communications retenues feront l’objet d’une présentation orale par l'un des auteurs (en français ou en anglais à leur convenance). La journée commencera par une présentation d’un conférencier invité sur l'un des thèmes de l’atelier et s’achèvera par une table ronde autour des problématiques liées à l’exploitation des sources ouvertes. *Les articles doivent être envoyés à l'adresse suivante : sos2013 at weblab-project.org* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:45:15 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:45:15 +0100 Subject: Journee: Journee d'informations sur le projet Dariah, 30 janvier 2013, Paris Message-ID: Date: Wed, 28 Nov 2012 14:20:23 +0100 From: Jean-Luc Minel Message-ID: <50B60F97.7040000 at u-paris10.fr> X-url: http://www.tge-adonis.fr/international/dariah Le 30 janvier 2013, le TGE Adonis organise une journée d'information sur le projet Dariah - /Digital Research Infrastructure for the Arts and Humanities/. Ce projet se donne pour objectif de construire une infrastructure numérique http://www.tge-adonis.fr/international/dariah, en rassemblant les différentes initiatives en matière d'humanités numériques au niveau européen. Si vous souhaitez en prendre connaissance, mieux appréhender ses différentes facettes (institutionnelles, scientifiques juridiques, financières, etc.), si vous vous posez des questions sur l'intérêt, pour votre laboratoire ou votre équipe, à y prendre part, cette journée sera l'occasion de rencontrer différentes personnes déjà impliquées dans le projet, de même que plusieurs de ses responsables/coordinateurs, au niveau français et au niveau européen. Interviendront notamment Jacques Dubucs (MESR), Patrice Bourdelais (INSHS), Jean-Luc Pinol (TGE Adonis), Laurent Romary (INRIA), Sophie David (TGE Adonis), Raymond Bérard (ABES), le Consortium Archives des Ethnologues de CORPUS-IR, Marin Dacos (Cléo), Karl-Heinz Mörth (Österreichische Akademie der Wissenschaften), Sandra Collins (Digital Repository of Ireland). *Programme* : Le programme définitif sera mis en ligne dans les prochaines semaines sur le site du TGE. *Informations pratiques* Lieu : Amphithéâtre Gustave Roussy (Bâtiment B, 2ème étage), Campus des Cordeliers, 15 rue de l'Ecole de Médecine, 75005 Paris http://maps.google.fr/maps?q=15+rue+de+l%E2%80%99Ecole+de+M%C3%A9decine&hl=fr&ie=UTF8&hnear=15+Rue+de+l%27%C3%89cole+de+M%C3%A9decine,+75006+Paris,+%C3%8Ele-de-France&t=m&z=16, de 10h à 18h (accueil à partir de 9h30). *Inscription* Compte-tenu du nombre limité de places, nous vous remercions de bien vouloir annoncer votre présence en vous inscrivant via le formulaire disponible ici http://www.tge-adonis.fr/webform/inscription-journee-info-dariah-30-01-13 . *Le comité d'organisation* : Nadine Dardenne, Sophie David, Nicolas Larrousse, Jean-Luc Minel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:34:34 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:34:34 +0100 Subject: Ressources: DGT-ACQUIS, New freely available large-scale aligned parallel corpus Message-ID: Date: Wed, 28 Nov 2012 10:26:38 +0100 From: Ralf Steinberger Message-id: <000d01cdcd4a$7852d1e0$68f875a0$@jrc.ec.europa.eu> X-url: http://langtech.jrc.ec.europa.eu/DGT-Acquis.html Following the release of the JRC-Acquis in 2006, the DGT-Translation Memory in several releases since 2007 and the ECDC-Translation Memory in 2012, we are now releasing the new parallel corpus DGT-Acquis. DGT-Acquis has been produced by the European Commission’s Directorate General for Translation (DGT) and it is being distributed by the Joint Research Centre (JRC). DGT-Acquis is a parallel collection of manually translated full-text documents in all 23 official EU languages, that has been paragraph-aligned for all 253 language pairs. It has been produced on the basis of the Official Journal (OJ) of the European Union (more specifically the L, LM, C, CA and CE Series). Languages: All 253 language pairs involving the following 23 languages: Bulgarian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Irish, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish and Swedish. URL: http://langtech.jrc.ec.europa.eu/DGT-Acquis.html Creator: European Commission - Directorate General for Translation ( http://ec.europa.eu/dgs/translation/index_en.htm DGT) Size: 3.54 million files; 5 GB in plain text format WHAT IS DGT-Acquis DGT-Acquis consists of a collection of Official Journal issues published in up to 23 languages between 2004 and 2011. The full-text documents have been paragraph-aligned automatically for all language pairs. The data is being distributed in several formats: (1) the original XML data and its corresponding TIFF files; (2) file level data in Formex4 format; (3) file level data in plain text format; and (4) the same data aligned at paragraph level. Users can thus make use of the aligned data or they can re-process the data using their own tools and methods. WHAT IS the difference between DGT-Acquis and the other resources distributed by the JRC While the translation memories DGT-TM and ECDC-TM are collections of individual translation units (or sentences) taken out of their full-text context, both JRC-Acquis and DGT-Acquis consist of full-text documents aligned at sentence or paragraph level. This allows using the data for applications that need to analyse entire texts, e.g. for discourse structure analysis, to detect domain information, for experiments on automatic summarisation, for translation studies, etc. Regarding the contents of the documents, JRC-Acquis and DGT-Acquis partially overlap for the period 2004 to 2006 while the documents for all other time periods should be unique. Comparing the resources used to produce DGT-Acquis and DGT-TM, DGT-TM is based exclusively on the L-Series of the Official Journal, while DGT-Acquis also contains the LM, C, CA and CE collections. The processing steps (data preparation and alignment) to produce the various data sets were entirely different. The format is not the same, and the processing quality of each of the resources is expected to be different, as well. For details on the resources and on the overlap between them, see the detailed descriptions of the resources at http://ipsc.jrc.ec.europa.eu/index.php?id=61. MOTIVATION FOR THIS RELEASE The public data release is in line with the general effort of the European Commission to support multilingualism, language diversity and the re-use of Commission information. It follows the release of the JRC-Acquis parallel corpus in 2006 (over 1 billion words in 22 languages), of the DGT-TM Translation Memory since 2007, the multilingual named entity resource JRC-Names in 2011, the multilingual multi-label classification tool (and accompanying text data) JRC EuroVoc Indexer (JEX) (22 languages), and further smaller multilingual resources. See http://ipsc.jrc.ec.europa.eu/index.php?id=61 for more information on these resources. WHAT DGT-ACQUIS CAN BE USED FOR DGT-ACQUIS is a large parallel corpus in electronic form. It can be used by specialists in computational linguistics to train statistical machine translation software, to generate multilingual dictionaries, to train and test multilingual information extraction software, to carry out testing and training of summarisation or discourse analysis software, to train and test cross-lingual clustering and classification, and more. Parallel corpora are also particularly useful for annotation projection across languages (http://publications.jrc.ec.europa.eu/repository/handle/111111111/1/simple-search?query=%28%28author%3ASteinberger%29+AND+%28title%3AAnnotation+title%3AParallel%29%29&from_advanced=true&conjunction3=AND&field4=type&conjunction2=AND&field3=ANY&field2=title&conjunction1=AND&query4=&field1=author&query1=Steinberger&query2=Annotation+Parallel&query3=&num_search_field=4) , which saves annotation effort and thus facilitates the development of highly multilingual text processing software. MORE INFORMATION ON DGT-ACQUIS At http://langtech.jrc.ec.europa.eu/JRC_Publications.html , you find detailed publications on the JRC’s multilingual language technology activity. For details on DGT-Acquis, however, there is not currently yet any detailed publication. Until further notice, please make reference to it by pointing to the web page http://langtech.jrc.ec.europa.eu/DGT-Acquis.html. WHAT NEXT? The JRC and collaborating European Union services are currently finalising the release of further highly multilingual linguistic resources. Ralf Steinberger http://langtech.jrc.ec.europa.eu/RS.html European Commission - Joint Research Centre (JRC) 21027 Ispra (VA), Italy URL – Applications: http://emm.newsbrief.eu/overview.html URL – Resources: http://ipsc.jrc.ec.europa.eu/index.php?id=61 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:40:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:40:14 +0100 Subject: These: Bassam Jabaian, Systemes de comprehension et de traduction de la parole Message-ID: Date: Wed, 28 Nov 2012 13:50:08 +0100 From: Bassam Jabaian Message-ID: <50B60880.1080103 at univ-avignon.fr> Bonjour, J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée "Systèmes de compréhension et de traduction de la parole : vers une approche unifiée dans le cadre de la portabilité multilingue des systèmes de dialogue". La soutenance aura lieu le mardi 4 décembre 2012 à 13h00 dans l'amphithéatre Blaise Pascal du Centre d'Enseignement et de Recherche en Informatique de l'Université d'Avignon (//339, chemin des Meinajariès 84911 Avignon, ceri.univ-avignon.fr). Vous êtes également conviés au pot de thèse qui suivra la soutenance. Bien cordialement, Bassam Jabaian ----------------------------------------------------------------------- Le jury de soutenance sera composé de : M. Wolfgang Minker --- Professeur, Universität Ulm, ITDS, Ulm --- Rapporteur M. François Yvon --- Professeur, Université Paris-Sud, LIMSI, Orsay --- Rapporteur Mme Géraldine Damnati --- Directrice de recherche, Orange Labs, Lannion --- Examinateur M. Alexandre Allauzen --- Maître de Conférences, Université Paris-Sud, LIMSI, Orsay --- Examinateur M. Laurent Besacier --- Professeur, Université Joseph Fourier, LIG, Grenoble --- Directeur de thèse M. Fabrice Lefèvre --- Professeur, Université d'Avignon, CERI/LIA, Avignon --- Directeur de thèse Résumé de la thèse : La généralisation de l'usage des systèmes de dialogue homme-machine accroît la nécessité du développement rapide des différents composants de ces systèmes. Les systèmes de dialogue peuvent être conçus pour différents domaines d'application et dans des langues différentes. La nécessité d'une production rapide pour de nouvelles langues reste un problème ouvert et crucial auquel il est nécessaire d'apporter des solutions efficaces. Nos travaux s'intéressent particulièrement au module de compréhension de la parole et proposent des approches pour la portabilité rapide peu coûteuse de ce module. Les méthodes statistiques ont montré de bonnes performances pour concevoir les modules de compréhension de la parole pour l'étiquetage sémantique de tours de dialogue. Cependant ces méthodes nécessitent de larges corpus pour être apprises. La collecte de ces corpus est aussi coûteuse en temps et en expertise humaine. Dans cette thèse, nous proposons plusieurs approches pour porter un système de compréhension d'une langue vers une autre en utilisant les techniques de la traduction automatique. Les premiers travaux consistent à appliquer la traduction automatique à plusieurs niveaux du processus de portabilité du système de compréhension afin de réduire le coût lié à la production de nouvelles données d'apprentissage. Les résultats expérimentaux montrent que l'utilisation de la traduction automatique permet d'obtenir des systèmes performant avec un minimum de contribution humaine. Nos travaux impliquant à la fois de la compréhension de la parole et de la traduction automatique nous avons effectué une comparaison approfondie entre les méthodes utilisées pour chacune des tâches et nous avons proposé un décodage conjoint basé sur une méthode discriminante qui à la fois traduit une phrase et lui attribue ses étiquettes sémantiques. Ce décodage est obtenu par une approche à base de graphe qui permet de composer un graphe de traduction avec un graphe de compréhension. Cette représentation peut être généralisée pour permettre des transmissions d'informations riches entre tous les composants du système de dialogue. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:05:13 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:05:13 +0100 Subject: Appel: Interspeech 2013 Conference Message-ID: Date: Wed, 28 Nov 2012 18:56:37 +0100 From: Interspeech 2013 Message-Id: <0BB67EE2-636E-4219-A456-513D8A5CB756 at Interspeech2013.org> X-url: http://www.interspeech2013.org/ Interspeech 2013 Conference - First Call for Participation with special focus on "Speech in Life Sciences and Human Societies" Dear colleagues, It is our great pleasure to announce the forthcoming edition of INTERSPEECH, the annual conference of the International Speech Communication Association (ISCA), which will be held in Lyon, France, 25-29 August 2013. INTERSPEECH is the world's largest and most comprehensive conference on Spoken Language Processing science and technology. This edition will be the 14th in the annual series of Interspeech events and will coincide with the 25th anniversary of ISCA, formerly known as ESCA, which was born in France in 1988. INTERSPEECH 2013 is coordinated by AFCP (Association Francophone de la Communication Parlée, i.e. the “French-speaking” Special Interest Group of ISCA). The conference will be hosted in the Lyon Convention Center, which offers first-grade facilities in a very attractive city and region, at the heart of Europe. Speech is a fundamental human activity which runs across biology, medicine, psychology, sociology, anthropology or ecology. It is central to the organization and the development of human health, personality and intelligence. It is also essential to the synergy within human groups and their relationship with their environment. Besides the conventional acoustic and linguistic viewpoints on speech communication, all these related disciplines provide additional approaches to speech as the keystone of communication, cognition and interaction in human societies. The conference will thus promote an interdisciplinary approach covering all aspects of speech science and technology, ranging from fundamental contributions to practical applications, in a wide variety of areas. INTERSPEECH 2013 will consist of regular oral and poster sessions, plenary talks by internationally renowned experts, tutorials, exhibits, special sessions, show & tells and satellite events. INTERSPEECH papers are indexed in ISI, Engineering Index, Scopus, and Google Scholar. Our website will provide you with information and news including the various calls, the important dates, instructions, programs, and all useful arrangements for participating to the conference. The INTERSPEECH 2013 Organizing Committee is actively engaged in the preparation of the event and it will be a great honor and pleasure for the French community in Speech Sciences to welcome you to INTERSPEECH 2013 in Lyon, next summer. Bien amicalement, Frédéric Bimbot (Chair) Cécile Fougeron (Co-Chair) François Pellegrino (Co-Chair) Contact : conference-chairs at interspeech2013.org ------------------------------------------------------------------------ Interspeech 2013 Calls First Announcement CALL FOR SATELLITE WORKSHOPS The call for Satellite Workshops is now closed. INTERSPEECH 2013 satellite events will be announced and advertised on:www.interspeech2013.org/satellite_events.html CALL FOR TUTORIALS Submission Deadline: January 4, 2013 Notification of acceptance: February 4, 2013 Tutorial proposals covering interdisciplinary topics and/or focusing on important emerging areas of interest related to the conference are encouraged. We welcome applications which may be either "recent advances on..." some recently emerging specialized hot topics which deserves to be focused on, or “crash-courses” targeted towards an audience who is looking for a comprehensive yet condensed overview of a wider area. Visit the Tutorial Page of the conference website for more information and for instructions on how to submit a tutorial proposal: www.interspeech2013.org/tutorials.html CALL FOR SPECIAL SESSIONS Submission Deadline: January 15, 2013 Notification of pre-selection: February 1, 2013 Final list of special sessions: May 22, 2013 Special sessions at Interspeech are designed to bring together researchers in relevant fields of interest, either on a targeted topic, or beyond the traditional scope of the conference. Prospective organizers are invited to submit a proposal via e-mail at special-session at interspeech2013.org For more information about the 2013 Special Session submission process :www.interspeech2013.org/special_sessions.html CALL FOR PAPERS Submission Deadline: March 18, 2013 Notification of acceptance: May 22, 2013 Camera-ready paper: May 29, 2013 Technical chairs : Lori Lamel, Pascal Perrier Contact : technical-chairs at interspeech2013.org Click here for the complete Call for Papers. CALL FOR SHOW & TELL AND OTHER SPECIAL EVENTS Show and Tell Submission Deadline: April 19, 2013 Notification of acceptance: May 22, 2013 The Show & Tell event is intended to provide professionals of various backgrounds with an opportunity to demonstrate their most recent progress, developments or innovation tracks, and interact with the conference attendees in an informal way. Other special events are in preparation and will be detailed within the forthcoming months. For more info on Show & Tell and to keep posted on other special events click here:www.interspeech2013.org/special_events.html SPONSORSHIP AND EXHIBIT OPPORTUNITIES If you consider becoming a sponsor of INTERSPEECH 2013 or an exhibitor at the conference, you are welcome to visit: http://www.interspeech2013.org/sponsors_exhibitors.html For any inquiry, please contact : sponsors-exhibitors at interspeech2013.org CONFERENCE ORGANIZATION The administrative organization and logistic coordination of the conference is carried out by INRIA Rennes Bretagne Atlantique and EUROPA ORGANISATION. To contact the organizers : organizers at interspeech2013.org CONFERENCE VENUE The Conference will be held at the Lyon Convention Center (CCC), Lyon, France. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:54:45 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:54:45 +0100 Subject: Job: Stage M2 en TAL Message-ID: Date: Wed, 28 Nov 2012 16:04:16 +0100 From: Isabelle Tellier Message-ID: <50B627F0.8030106 at univ-paris3.fr> X-url: http://www.leguide.com/information/fr/job/hf-stage-rdmoteur-de-recherche/ Le site web leguide.com propose un stage de niveau M2 en TAL : http://www.leguide.com/information/fr/job/hf-stage-rdmoteur-de-recherche/ Envoyer CV + lettre de motivation à marty.patrick at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:01:04 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:01:04 +0100 Subject: Sujet de these: Computer Human Interaction and Natural Language Processing, GREYC LAB/HULTECH TEAM, Caen Message-ID: Date: Wed, 28 Nov 2012 17:31:36 +0100 From: Fabrice Maurel Message-ID: <50B63C68.2070206 at unicaen.fr> ------ Apologies for cross-posting. Please circulate to any potentially interested parties ------ SALARIED PHD POSITION IN COMPUTER HUMAN INTERACTION AND NATURAL LANGUAGE PROCESSING AT CAEN BASSE-NORMANDIE UNIVERSITY - GREYC LAB/HULTECH TEAM - project ART-ADN ------ TOPIC ----------------------- The work focuses on improving non-visual access to digital documents on touch-screen tablets based on the extraction and reorganization of the structure of texts, documents and interfaces. As such, the high-dimension structure of documents is made available through haptic-oral interaction. The proposition involves three main components: interpretation of texts (NLP), reorganization of structures (HCI) and haptic perception (ELEC). CONTEXT ----------------------- This thesis will take place within the context of the ART-ADN project supported by the call for "innovative societies" of the French National Agency for Research (ANR). The candidate will develop his work in the GREYC laboratory (CNRS UMR 6072) of the University of Caen Basse-Normandie (UCBN) and the National Superior Engineering School of Caen (ENSICAEN). In particular, the HULTECH (Human Language Technologies) team and the ELECTRONIC team will be involved in the supervision of the thesis. SALARY DETAILS ----------------------- The successful individual will be employed as a salaried researcher at Caen Basse-Normandie University, while studying towards his/her PhD. For employment in France, the reference figure for net salary is *1,375* euros/month The post is fixed term for three years with a start date about Marsh 2013 or soon after. REQUIREMENTS & ELIGIBILITY ------------------------------------------ The high-standard successful candidate will possess a Master degree covering primarily the field of User-centered Design of Interfaces and Human-Computer Interaction (HCI). Additional skills that would be appreciated are Speech and Natural Language Processing (NLP), Electronics (ELEC) and/or Image Processing (IMAGE). Autonomy and openness are also required since the project will be developed in a multidisciplinary collaboration involving psychologists (PALM UPRES EA 4649), ergonomists and associations of visually impaired people (VIP). APPLICATION DETAILS ---------------------------------- If you are interested in this funding, please send the following information to the supervisors Fabrice Maurel (fabrice.maurel at unicaen.fr), Pierre Beust (pierre.beust at unicaen.fr) and Jean-Marc Routoure (jean-marc.routoure at unicaen.fr): - a letter of motivation, - a detailed Resume, - a copy of all diplomas after high school and - the detailed list of all the marks obtained in the Master and Bachelor degrees. For further details please see: art-adn.greyc.fr Closing date for applications: 1st Marsh 2013 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 08:49:19 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 09:49:19 +0100 Subject: Job: Stage en terminologie/linguistique de corpus Message-ID: Date: Mon, 03 Dec 2012 11:01:00 +0100 From: Condamines Message-ID: <50BC785C.9050202 at univ-tlse2.fr> X-url: http://www.cnes.fr/web/CNES-fr/175-stages-2011-2012.php?view=item&item=7352 ---------------------------------------- Proposition de stage de M2 au CNES : Utilisation des méthodes de la linguistique de corpus pour proposer des améliorations dans la constitution et la rédaction de L'encyclopédie d'exobiologie. Le stage de 6 mois se déroulera à Toulouse, au CNES et au laboratoire CLLE-ERSS. Il sera rémunéré à hauteur de 800 euros par mois. Renseignements et inscription : http://www.cnes.fr/web/CNES-fr/175-stages-2011-2012.php?view=item&item=7352 ----------------------------------------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 08:53:41 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 09:53:41 +0100 Subject: These: Sylvain Raybaud, Utilisation de mesures de confiance en traduction automatique Message-ID: Date: Mon, 03 Dec 2012 14:42:56 +0100 From: Sylvain Raybaud Message-ID: <50BCAC60.4040708 at loria.fr> Bonjour Je souhaite vous faire part à fin de diffusion sur ln at cines.fr, si vous êtes d'accord, de la soutenance prochaine (mercredi 5 décembre à 14h au LORIA à Nancy) de ma thèse intitulée : « De l'utilisation de mesures de confiance en traduction automatique : évaluation, post-édition et application à la traduction de la parole. » Cette thèse sera soutenue devant le jury suivant : MM. François Yvon et Laurent Besacier, rapporteurs ; MM. Guillaume Gravier et François Charpillet, examinateurs ; ainsi M. Kamel Smaïli, directeur de thèse, et M. David Langlois, coencadrant. Les résumés en français et en anglais suivent. bien cordialement, Sylvain Raybaud Résumé : Cette thèse de doctorat aborde les problématiques de l'estimation de confiance pour la traduction automatique, et de la traduction automatique statistique de la parole spontanée à grand vocabulaire. J'y propose une formalisation du problème d'estimation de confiance, et aborde expérimentalement le problème sous le paradigme de la classification et régression multivariée. Je propose une évaluation des performances des différentes méthodes évoquées, présente les résultats obtenus lors d'une campagne d'évaluation internationale et propose une application à la post-édition par des experts de documents traduits automatiquement. J'aborde ensuite le problème de la traduction automatique de la parole. Après avoir passé en revue les spécificités du médium oral et les défis particuliers qu'il soulève, je propose des méthodes originales pour y répondre, utilisant notamment les réseaux de confusion phonétiques, les mesures de confiances et des techniques de segmentation de la parole. Je montre finalement que le prototype proposé rivalise avec des systèmes état de l'art à la conception plus classique. Abstract : In this thesis I shall deal with the issues of confidence estimation for machine translation and statistical machine translation of large vocabulary spontaneous speech translation. I shall first formalize the problem of confidence estimation. I present experiments under the paradigm of multivariate classification and regression. I review the performances yielded by different techniques, present the results obtained during the WMT2012 internation evaluation campaign and give the details of an application to post edition of automatically translated documents. I then deal with the issue of speech translation. After going into the details of what makes it a very specific and particularly challenging problem, I present original methods to partially solve it, by using phonetic confusion networs, confidence estimation techniques and speech segmentation. I show that the prototype I developped yields performances comparable to state-of-the-art of more standard design. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 08:57:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 09:57:25 +0100 Subject: Seminaire: LIMSI, Horacio Saggion, jeudi 6 decembre 2012 Message-ID: Date: Mon, 03 Dec 2012 15:56:09 +0100 From: Anne-Laure Ligozat Message-ID: Bonjour, Jeudi 6 décembre, le LIMSI recevra Horacio Saggion (TALN Research Group Universitat Pompeu Fabra – Barcelona - Spain) qui présentera ses travaux sur la simplification de textes. Le séminaire aura lieu à 14h en salle du conseil du LIMSI (http://www.limsi.fr/Pratique/acces/). Toute personne intéressée est la bienvenue. ===================================== Title: Text Simplification in Spanish Abstract: For people with cognitive disabilities access to textual information is often very difficult because texts written for the general public may be too complex for them to read. One possibility to grant access to textual information for people with cognitive problems is to adapt and simplify texts manually. However, making easy-to-read versions of the current volume of textual information (or even a small proportion of it) would be impractical with human efforts alone. Automatic text simplification is a technology to produce adaptable texts by reducing their syntactic and lexical complexity so that they become readable for a target user group. In this talk I will give an overview of the natural language processing technology produced for the Simplext project which aims at developing text simplification technology in Spanish. Our work so far has produced a number of useful resources for text simplification (e.g. aligned corpus), a prototype for reduction of structural complexity using transduction rules and a lexical simplification procedure based on co-occurrence statistics. I will also take the opportunity to describe work being carried out at the TALN research group including work on summarization, information extraction, and text generation. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 08:59:47 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 09:59:47 +0100 Subject: Job: Postdoc, INRIA Rennes, France, structured CRF Message-ID: Date: Mon, 03 Dec 2012 16:31:50 +0100 From: Vincent Claveau Message-ID: <50BCC5E6.9080901 at irisa.fr> POSTDOCTORAL POSITION at INRIA Rennes, France Topic: Conditional Random Fields for structured annotation In the field of natural language processing, statistical methods have become very popular thanks to their efficiency in dealing with noisy inputs (e.g., automatic speech transcripts, blog, tweets). In the particular case of sequence labeling problems, such as named entities recognition (discovery of person names, places, dates, etc. within a text), the Conditional Random Fields (CRF) model is particularly effective . CRFs are currently limited to model unstructured sequences (flat representation), while one of the current problems is to predict structured sequences (tree-structured for example). Methods for modeling such structured sequences exist, like Probabilistic Context Free Grammars (PCFG), but their effectiveness is limited when confronted with noisy input as we are aiming to process. The proposed work is to study a method for predicting sequences of structured objects robust to handle noisy inputs. This method will provide a decomposition of the overall problem into sub-problems modeled by CRF and redial the different results to produce a structured output. Evaluation will be performed on noisy texts (speech transcripts, tweets...). This work takes place in the context of the Quaero project, funded by the French National Innovation Agency (www.quaero.org). The work will be performed at IRISA/INRIA Rennes, France (http://www.irisa.fr/, http://www.inria.fr/centre/rennes/). The candidate will integrate the TexMex team, whose main research topics include large-scale multimedia indexing, speech processing, information retrieval. QUALIFICATIONS AND POSITION The successful candidate will have a PhD with a track record of Text-Mining or Machine Learning for Natural Language Processing research. Fluency in English is mandatory. This position is to be filled as early as possible, and will end on the 31st of Dec 2013. Salary follows INRIA scales and depends on the candidate's experience (the minimum monthly net salary is about 1900 €). To apply, please send a cover letter, describing how the applicant's knowledge and research background will contribute to the project, a CV, and the names and contact information of two referees to: Christian Raymond (christian.raymond at irisa.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 09:02:54 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 10:02:54 +0100 Subject: Appel: Call for Short Papers, Special Volume on Non-standard Data Sources in Corpus-based Research Message-ID: Date: Mon, 3 Dec 2012 13:44:34 -0200 From: Marcos Zampieri Message-ID: X-url: http://nosdacworkshop.com/resources.html Date: Mon, 3 Dec 2012 13:44:34 -0200 Importance: Normal X-OriginalArrivalTime: 03 Dec 2012 15:44:35.0409 (UTC) FILETIME=[185E5C10:01CDD16D] Please apologize for cross-posting. ========================================================================= Call for Short Papers - Special Volume on Non-standard Data Sources in Corpus-based Research Following the 1st workshop on Automatic Processing of Non-Standard Data Sources In Corpus-based Research (NOSDAC) held in August 31st at the University of Cologne, we are compiling a special volume to appear as the 5th Edition of the ZSM-Studien series sponsored by the Centre of Multilingualism of the University of Cologne. We are welcoming unpublished short-papers (up to 8 A5 pages including references) presenting and describing original non-standard language resources, such as: - Non-standard (historical, internet, SMS) corpora (freely available). - POS Taggers and parsers developed for historical and/or internet data. - Computational tools for spelling normalization. - Corpus interfaces or query tools for non-standard language All papers will be peer-reviewed by an international committee and selected according to the originality of the resource and quality of the manuscript. Submissions should be done via EasyChair. More information and template for submission can be found at: http://nosdacworkshop.com/resources.html The deadline for submissions is December 21st 2012. Peer Review Committee: - Jorge Baptista - University of Algarve and INESC-ID Lisbon (Portugal) - Michael Beißwenger - TU Dortmund University (Germany) - Stefanie Dipper - Ruhr University Bochum (Germany) - Lothar Lemnitzer - Berlin-Brandenburg Academy of Sciences and Humanities (Germany) - Francesco Mambrini - Harvard University (USA) - Nuno Mamede - Instituto Superior Técnico and INESC-ID Lisbon (Portugal) - Alexander Mehler - University of Frankfurt (Germany) - Marco Passarotti - Università Cattolica del Sacro Cuore, Milan (Italy) Organizing Committee: - Marcos Zampieri - University of Cologne (Germany) - Sascha Diwersy - University of Cologne (Germany) Best Regards, Marcos Zampieri marcos.zampieri at uni-koeln.de Romance Philology Department University of Cologne Sascha Diwersy sascha.diwersy at uni-koeln.de Romance Philology Department University of Cologne ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 09:09:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 10:09:39 +0100 Subject: Seminaire: INFOLINGU, Nicolas TURENNE, INRA, lundi 28 janvier 2013 Message-ID: Date: Tue, 4 Dec 2012 16:17:57 +0100 From: Myriam RAKHO Message-ID: ************************************************************************ INFOLINGU Le séminaire de l'équipe Informatique Linguistique du Laboratoire d'Informatique de l'Institut Gaspard Monge (LIGM) Université Paris-Est Marne-la-Vallée Date : *Le lundi 28 janvier 2013 à 10h30* Lieu : Université Paris-Est Marne-la-Vallée Bâtiment Copernic, 4ème étage, salle de séminaires 4B08R Toute personne intéressée est la bienvenue ************************************************************************ *** INTERVENANT *** *Nicolas TURENNE, INRA* *** TITRE *** Présentation d'un nouveau livre intitulé : "Knowledge Needs and Information Extraction: Towards an Artificial Consciousness" Le livre est disponible à cette adresse : http://eu.wiley.com/WileyCDA/WileyTitle/productCd-1848215150,descCd-description.html *** RÉSUMÉ *** Amongst the big questions about humanity from “Who am I?” to “Where am I”, there is the subject of consciousness relayed by philosophy and theology at first and then by biology, psychology, sociology and more recently by cognitive sciences. This book attempts to reconcile these disciplines through the common denominator of consciousness, but on one of its specific aspect. The book presents a concept of-motivation of field of activity, as a biological motor of a state of consciousness, and of which system informatics enables to reveal its existence. If consciousness is not well defined, a limited frame provides a more precise and observable definition despite the context complexity of the individuals: psychological, social and technical. These observable elements are of two nature: a nature of principal activity and a cognitive-linguistic nature, which are adapted with extrinsic and intrinsic control factors. The argument presented here consists in presenting a state of consciousness as related to the concept of instinctive (therefore physiological) information need, and whose carrier traces on the traditional information channels, i.e. letters and subscriptions and on the modern information channels, i.e. text messages and web pages, can be analyzed via knowledge extraction. ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 09:15:33 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 10:15:33 +0100 Subject: Conf: Colloque La linguistique de corpus, 14-15 decembre 2012, Bordeaux Message-ID: Date: Tue, 4 Dec 2012 17:45:40 +0100 (CET) From: "sandra.augendre" Message-ID: <1922015877.11984.1354639540547.JavaMail.www at wwinf1m32> La linguistique de corpus à l’heure de la confrontation entre concepts, techniques et applications / Corpus Linguistics: How to bind concepts, technique and application? Vendredi 14 décembre 2012 : Goethe Institut (35 cours de Verdun, Bordeaux, Tram C, « Paul Doumer ») Samedi 15 décembre: Université Bordeaux 3, Pessac (Tram B, « Montaigne-Montesquieu ») Site web : https://sites.google.com/site/corpus2012bordeaux3/home PROGRAMME Vendredi 14 décembre 9h Accueil 9h30 Ouverture et présentation du colloque 10h-11h15 Atelier « Coder l’oral » Thomas SCHMIDT (Institut für Deutsche Sprache, Mannheim), Transcription et codage dans un corpus de recherche et enseignement de l’allemand parlé Samira MOUKRIM (Faculté des Lettres et Sciences Humaines Saïs-Fès, Université Sidi Mohamed Ben Abdellah), Coder l’des langues à tradition orale : un palier d’interaction entre écriture et formalisation 10h-11h15 Atelier « Multimodalité et codage » Chafia AMMI, Amel DJEZZAR (Université Dr Yahia Fares, Médéa, Algérie), Le traitement automatique de corpus traduits : limites et perspectives Isabelle ESTÈVE (LIDILEM, Grenoble 3), Encoder et décoder les dynamiques inter- et intra-modalités : défis et perspectives amenés par la multimodalité enfantine sourde 11h15-11h45 Pause 11h45-13h Atelier « Coder l’oral » suite Isabelle RACINE (ELCF, Université de Genève), Sylvain DETEY (SILS, Université Waseda & Dysola, Université de Rouen), Julien EYCHENNE (Hankuk University of Foreign Studies), Coder l’oral via l’écrit : de la relative prévisibilité des natifs à l’imprévisibilité des apprenants hispanophones dans le cas de la liaison Béatrice Akissi BOUTIN (CLLE-ERSS-UMR 5263, Université Toulouse 2 et ILA, Institut de Linguistique Appliquée, Université Félix Houphouët-Boigny, Abidjan), Annotation de l’oral, codages, et interprétations 11h45-13h Atelier « Multimodalité et codage » suite Catherine BOLLY (F.S.R.-FNRS & Université catholique de Louvain), Dominique BOUTET (UMR SFL, CNRS, Paris 8 & Université d’Evry Val d’Essonne), Corpus écologique et économie des outils. Le cas du corpus multimodal CorpAGEst Eric FRIGINAL (Georgia State University, Atlanta), Encoding and annotating a corpus of telephone-based customer service interactions 13h-14h30 Repas 14h30-16h30 Atelier « Corpus et formalismes » Gabriela BILBIIE (Universite Paris Diderot - Paris 7 & Laboratoire de Linguistique Formelle, LLF), La mise en facteur à droite dans le Penn Treebank Laurence DANLOS (Université Paris Diderot, ALPAGE), Méthodologie pour le FDTB (French Discourse Tree Bank) Nathalie GASIGLIA (Université Lille 3), Enrichir le balisage de corpus thématiques à haut rendement exploratoire pour en améliorer le rendement documentaire 14h30-16h30 Atelier « Corpus appliqués » Sylvain DETEY (SILS, Université Waseda & Dysola, Université de Rouen), Isabelle RACINE (ELCF, Université de Genève), Julien EYCHENNE (Hankuk University of Foreign Studies), Yuji KAWAGUCHI (Tokyo University of Foreign Studies), Mariko KONDO (SILS, Université Waseda), Interphonologie et codage de corpus oraux non-natifs : méthodologie et voyelles d’apprenants japonais de FLE Martine MARQUILLÓ-LARRUY (Département des sciences du langage, Université de Poitiers), Pascale TREVISIOL-OKAMURA (Département des sciences du langage, Université de Poitiers), Christophe NAUD (Maison des Langues de l'Université de Poitiers), Laure CHOTEL (Télécom Ecole de Management, Evry), "Corpus Évry - Poitiers" : codage d’un corpus multimodal et formation Nikola PAILLEREAU (Laboratoire de Phonétique et Phonologie (UMR 7018), CNRS / Université Sorbonne-Nouvelle), Simon LANDRON (Laboratoire de Phonétique et Phonologie (UMR 7018), CNRS / Université Sorbonne-Nouvelle & PLIDAM, INALCO), Laurianne GEORGETON (Laboratoire de Phonétique et Phonologie (UMR 7018), CNRS / Université Sorbonne-Nouvelle), Coder les voyelles médianes du français en vue de productions isolées ou de non-mots : enjeux et utilisation 16h30-17h Pause 17h-18h30 Table ronde « Corpus et formalismes » Table ronde regroupant les communicants de l’atelier « Corpus et formalismes » présidée par Marie-Hélène CANDITO (Université Paris-Diderot) et Lionel CLEMENT (Université Bordeaux 1) 17h-18h30 Table ronde « Corpus appliqués » Table ronde regroupant les communicants de l’atelier « Corpus appliqués » présidée par Marie-Noëlle LAMY (Open University) et Sandrine AGUERRE (Université Bordeaux 3) Samedi 15 décembre 9h30-10h30 Plénière Lou Burnard (Université d’Oxford & TGE Adonis), De Literary and Linguistic Computing aux Humanités numériques : quelle importance pour les sciences du langage ? 10h30-13h Atelier « Corpus et Humanités numériques » Loïc LIEGEOIS, Thierry CHANIER, Damien CHABANAL (LRL, Clermont Université), L’exemple d’un corpus d’interactions orales spontanées structuré en TEI : quels avantages pour l’interopérabilité, l’analyse et le partage des données de la recherche ? Marie-Hélène LAY (Université de Poitiers & FoReLL, Formes et Représentations en Linguistique et Littérature, EA 3816), Quels outils d'analyse de corpus pour les digital humanities ? Plaidoyer pour des outils d'étiquetage non-robustes Patrick DROUIN (Observatoire de linguistique Sens-Texte, Université de Montréal), Philippe LANGLAIS (Département d’informatique et de recherche opérationnelle, Université de Montréal), Christian GUILBAULT (Department of French, Simon Fraser University), Annotation d’un corpus de messages textes (SMS) : dualité et complémentarité entre l’oral et l’écrit Bernard LAKS (Paris Ouest, Modyco et Institut universitaire de France, Variation et changement au miroir des grands corpus oraux : le cas du français 13h Clôture du colloque Inscription au colloque Universitaires extérieurs à l’université de Bordeaux : 30 € Etudiants extérieurs à l’Université de Bordeaux : 20 € Etudiants et personnels de l’Université de Bordeaux : gratuité 1. Télécharger le formulaire d’inscription sur le site du colloque : https://sites.google.com/site/corpus2012bordeaux3/home 2. Envoyer le formulaire dûment rempli à : Madame Laurence DULAU – Bureau D 007 Direction de la Recherche – Pôle financier Université Bordeaux 3 33607 Pessac cedex vous pouvez aussi envoyer un courriel à : laurence.dulau at u-bordeaux3.fr Comité scientifique Guy ACHARD-BAYLE (Univ. de Lorraine & CREM EA 3476), Philippe BLACHE (Aix-Marseille & LPL UMR 7309), Lou BURNARD (Oxford & TGE Adonis), Paul CAPPEAU (Poitiers & FoReLL EA 3816), Thierry CHANIER (Clermont 2 & LRL EA 999), Ray COOKE (Bordeaux – Victor Segalen), Cécile FABRE (Toulouse 2 & CLLE-ERSS UMR 5263), Evelyne JACQUEY (Univ. de Lorraine & ATILF UMR 7118), Nathalie KUBLER (CLILLAC-ARP, Université Paris-Diderot), Laurence LABRUNE (Bordeaux 3 & CLLE-ERSS UMR 5263), Marie-Noëlle LAMY (Open University & CREET), Benoît LE BLANC (ENSC-IPB & UMR 5218), Philippe MARTIN (CLILLAC-ARP, Université Paris-Diderot), Damon MAYAFFRE (Nice-Sophia Antipolis & BCL UMR 7320), Sylvie MELLET (Nice-Sophia Antipolis & BCL UMR 7320), Lorenza MONDADA (Bâle & ICAR UMR 5191), Jean-Marie PIERREL (Univ. de Lorraine & ATILF UMR 7118), Sophie ROSSET (LIMSI UPR 3251), Véronique TRAVERSO (ICAR UMR 5191), Agnès TUTIN (Grenoble 3 & LIDILEM EA 609), Jean-Marie VIPREY (Univ. de Franche-Comté & ELLIADD EA 4661) Comité d’organisation Sandrine AGUERRE, Sandra AUGENDRE, Jean-Luc BERGEY, Gilles BOYÉ, Jean-Sébastien BRILLEAUD, Marie-Odile HIDDEN, Anna KUPŚĆ Catherine MATHON, NGUYEN Van Toan, Christelle ROUET-DELARUE, Henri PORTINE ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 09:27:06 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 10:27:06 +0100 Subject: Appel: WIMS'13, Call for Papers/Workshop Proposals Message-ID: Date: Wed, 05 Dec 2012 10:10:27 +0100 From: Plantié Michel Message-ID: <50BF0F83.1090709 at mines-ales.fr> CALL FOR PAPERS/PROPOSALS International Conference on Web Intelligence, Mining and Semantics (WIMS'13) June 12-14, 2013 - Madrid, Spain http://aida.ii.uam.es/wims13/ About WIMS'13: The 3rd International Conference on Web Intelligence, Mining and Semantics (WIMS'13) will be organised under the auspices of Autonomous University of Madrid, Spain. The WIMS series of conferences concerned with intelligent approaches to transform the World Wide Web into a global reasoning and semantics-driven computing machine. The conference will provide an excellent international forum for sharing knowledge and results in theory, methodology and applications of Web intelligence, Web mining and Web semantics. The purpose of the WIMS'13 is: - To provide a forum for established researchers and practitioners to present past and current research contributing to the state of the art of Web technology research and applications. - To give doctoral students an opportunity to present their research to a friendly and knowledgeable audience and receive valuable feedback. - To provide an informal social event where Web technology researchers and practitioners can meet. Conference Venue: The conference will be hosted by Autonomous University of Madrid. Confirmed Keynote Speakers: - Prof. Amit Sheth (Physical Cyber Social Computing: An early 21st century approach to - Computing for Human Experience), - Dr. Jason J. Jung (Contextual Synchronization on Social Collaboration) - Prof. Asunción Gómez-Pérez (TBA). Call for Papers/Tutorials/ Posters/Industri al Track/Workshop proposals: http://aida. ii.uam.es/ wims13/cfp. php Publication: Accepted papers/tutorials/ posters will be published by ACM and disseminated through the ACM Digital Library. Selected extended papers will be invited to appear in a special issues of reputed journals in the field and also in a book published by Elsevier. Important Dates Tutorial and Workshop proposals due December 17, 2012 Notification of workshop acceptance December 21, 2012 Electronic submission of research papers December 23, 2012 Electronic submission of poster papers December 23, 2012 Notifications of tutorial acceptance January 10, 2013 Notification of paper/poster acceptanceFebruary 17, 2013 Registration opens February 18, 2013 Camera-ready of accepted papers/tutorials March 4, 2013 Deadline for paper submissions for workshops February 7, 2013 Acceptance of papers for workshops March 10, 2013 Camera ready workshop papers March 30, 2013 Author registration deadline March 30, 2013 Conference 12-14 June,2013 Contact: David Camacho Escuela Politécnica Superior Universidad Autónoma de Madrid Francisco Tomás y Valiente, 11 , 28049, Madrid , Spain Tel/Fax: +34 91 497 51 00 E-mail:wims13 at uam.es ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Dec 7 08:37:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Dec 2012 09:37:18 +0100 Subject: These: Aymen Elkhlifi, Approche Generique d=?WINDOWS-1252?Q?=92Extraction_?=Automatique des Evenements et leur Exploitation Message-ID: Date: Fri, 7 Dec 2012 03:44:41 +0000 (GMT) From: elkhlifi aymen Message-ID: <1354851881.40206.YahooMailNeo at web172201.mail.ir2.yahoo.com> Bonjour,   J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée "Approche Générique d’Extraction Automatique des Evénements et leur Exploitation". Elle aura lieu le Samedi 08 décembre 2012 à 14h,  à la Maison de la recherche, Salle 01 - RC, 28 rue Serpente, 75006 Paris. Métro : Odéon (ligne 4 ou 10) ou Saint-Michel (ligne 4 ou RER B) Bus : 58, 70. Vélib : juste devant. Vous êtes également conviés au pot de thèse qui suivra la soutenance. ---------------------------- Le jury est composé de : M. Abdelmajid Ben Hamadou, Professeur en Informatique, Université de Sfax, Rapporteur M. Jean-Gabriel Ganascia, Professeur en Informatique, Université PMC, Paris 6, Examinateur M. Ghassan Mourad, Professeur en Informatique-Linguistique, Université Libanaise à Beyrouth, Rapporteur Mme Delphine Battistelli, Maître de Conférences (HDR), Université Paris-Sorbonne, Examinateur Mme Rim Faiz, Professeur en Informatique, IHEC-Université de Carthage, Directeur M. Jean-Pierre Desclés, Professeur émérite, en Informatique, Université Paris-Sorbonne, Directeur Bien cordialement, Aymen Elkhlifi --------------------------------------------------------------- Résumé : Dans le cadre de notre thèse, nous avons proposé une approche générique d’extraction automatique des événements et de leur exploitation. L’approche est organisée en quatre composantes indépendantes et réutilisables. Une première composante de prétraitement, où les textes sont nettoyés et segmentés. Au cours de la seconde étape, les événements sont extraits en se basant sur notre algorithme AnnotEC qui dispose d’une complexité polynomiale et qui est associé à des cartes sémantiques et des ressources linguistiques dédiées. Nous avons mis en place deux nouvelles mesures de similarité SimCatégoreille et SimEvent pour regrouper les événements similaires dans le cadre de la troisième composante de clustering. Les annotations, ajoutées tout au long des trois premières étapes, sont exploitées au niveau de la dernière composante par le bais des fichiers de synthèse paramétrables par l’utilisateur. L’approche a été évaluée sur un corpus issu du Web 2.0. Nous avons comparé les résultats avec des méthodes d’apprentissage automatique et des méthodes linguistiques par compilation et nous avons obtenu de meilleurs résultats. Mot-clés : Extraction d’événement, Annotation d’information, Cartes Sémantiques, Mesure de Similarité Sémantique. ------------------------------------------------------------------------ Summary : In the framework of our thesis, we proposed a generic approach for the automatic extraction of events and their exploitation. This approach is divided into four independent and reusable components. The first component of pretreatment, in which texts are cleaned and segmented. During the second stage, events are extracted based on our algorithm AnnotEC which has polynomial complexity. AnnotEC is associated with semantic maps and dedicated linguistic resources. We have proposed two new similarity measures SimCatégoreille and SimEvent to group similar events using clustering algorithms. Annotations, added throughout the first three steps, are used at the last component by summarizing files configurable by users. The approach was evaluated on a corpus of Web 2.0, we compared the obtained results with machine learning methods and linguistic compiling methods and we got good results. Keywords : Event Extraction, Information Annotation, Semantic Maps, Semantic Measure of Similarity. ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 12:33:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 13:33:14 +0100 Subject: These: Lei Zhang, Analyse automatique d'opinion Message-ID: Date: Wed, 05 Dec 2012 14:20:43 +0100 From: Zhang Lei Message-ID: <62c6e439be9bab0c5c3cb9dce24e0fea at imap.unicaen.fr> Bonjour, J'ai le plaisir de vous convier à ma soutenance de thèse qui se déroulera le mardi 11 décembre à 14h00 en salle des thèses de l'université de Caen Basse-Normandie (1er étage, à coté du secrétariat de l'ED SIMEM), campus 2, bâtiment sciences 3. Vous êtes également invités au pot qui suivra en salle 351 dans le même bâtiment. Titre ===== Analyse automatique d'opinion : problématique de l'intensité et de la négation pour l'application à un corpus journalistique Composition du Jury =================== Mme Béatrice Daille, professeur des universités, université de Nantes (rapporteur) Mme Brigitte Grau, professeur des universités, ENSIIE (rapporteur) M. Thierry Poibeau, directeur de Recherche, laboratoire LaTTiCe (examinateur) M. Gaël Dias, professeur des universités, université de Caen Basse-Normandie (examinateur) M. Patrice Enjalbert, professeur des universités, université de Caen Basse-Normandie (examinateur) M. Stéphane Ferrari, maître de conférences, HDR, université de Caen Basse-Normandie (directeur) Résumé ====== La problématique de l'analyse d'opinion connaît un intérêt croissant depuis une quinzaine d'années. Cette problématique mène à de nombreux travaux ayant des objectifs allant de la constitution de ressources lexicales à l'identification des cibles d'une opinion. Le cadre applicatif de notre étude est l'analyse automatique d'articles de journaux pour la veille d'opinion. Ce cadre est ambitieux vis-à-vis de l'état de l'art puisque nous sommes amené à étudier un grand nombre de critères propres à l'analyse d'opinion. Nous proposons un modèle conceptuel permettant de caractériser une opinion par la polarité, l'intensité, la prototypicalité, la cible, la source, l’engagement de l'auteur, etc. En particulier, nous modélisons la négation et ses effets sur l'intensité et la polarité. En plus des cas classiques de négation, nous sommes en mesure de modéliser des effets de rhétoriques tels que l'euphémisme ou la litote, très présents dans le genre journalistique. À partir de ce modèle conceptuel, nous présentons un ensemble de choix techniques permettant de préciser les ressources et traitements nécessaires à l'automatisation. Nous mettons en œuvre deux applications (en chinois et en français) de la chaîne de traitements issue du modèle permettant de confirmer la validité du modèle conceptuel ainsi que l'efficacité des traitements automatiques.  Cordialement, Lei Zhang ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 12:36:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 13:36:16 +0100 Subject: Appel: 1st International Conference on Statistical Language and Speech Processing Message-ID: Date: Wed, 5 Dec 2012 15:56:28 +0000 From: "Maarouf, Ismall" Message-ID: <6B982DE0E1760848ABA8A809FFD806DFC949DF at EXCHMBX10X03.unv.wlv.ac.uk> X-url: http://grammars.grlmc.com/SLSP2013/ Full Title: 1st International Conference on Statistical Language and Speech Processing Short Title: SLSP 2013 Date: 29-Jul-2013 - 31-Jul-2013 Location: Tarragona, Spain Contact Person: Florentina Voicu Meeting Email: [X] Web Site: http://grammars.grlmc.com/SLSP2013/ Linguistic Field(s): Computational Linguistics Call Deadline: 05-Mar-2013 Meeting Description: 1st International Conference on Statistical Language and Speech Processing (SLSP 2013) Tarragona, Spain July 29-31, 2013 Organised by: Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Research Institute for Information and Language Processing (RIILP) University of Wolverhampton http://grammars.grlmc.com/SLSP2013/ Aims: SLSP is the first event in a series to host and promote research on the wide spectrum of statistical methods that are currently in use in computational language or speech processing. It aims at attracting contributions from both fields. Though there exist large, well-known conferences including papers in any of these fields, SLSP is a more focused meeting where synergies between areas and people will hopefully happen. SLSP will reserve significant space for young scholars at the beginning of their careers. Venue: SLSP 2013 will take place in Tarragona, 100 km. to the south of Barcelona. Registration: The period for registration is open from November 30, 2012 to July 29, 2013. The registration form can be found at: http://grammars.grlmc.com/SLSP2013/Registration.php Structure: SLSP 2013 will consist of: ‐ Invited talks ‐ Invited tutorials ‐ Peer‐reviewed contributions Invited Speakers: To be announced Acknowledgements: Diputació de Tarragona Universitat Rovira i Virgili University of Wolverhampton Call for Papers: The conference invites submissions discussing the employment of statistical methods (including machine learning) within language and speech processing. The list below is indicative and not exhaustive: - Phonology, morphology - Syntax, semantics - Discourse, dialogue, pragmatics - Statistical models for natural language processing - Supervised, unsupervised and semi-supervised machine learning methods applied to natural language, including speech - Statistical methods, including biologically-inspired methods - Similarity - Alignment - Language resources - Part-of-speech tagging - Parsing - Semantic role labelling - Natural language generation - Anaphora and coreference resolution - Speech recognition - Speaker identification/verification - Speech transcription - Text-to-speech synthesis - Machine translation - Translation technology - Text summarisation - Information retrieval - Text categorisation - Information extraction - Term extraction - Spelling correction - Text and web mining - Opinion mining and sentiment analysis - Spoken dialogue systems - Author identification, plagiarism and spam filtering Authors are invited to submit papers presenting original and unpublished research. Papers should not exceed 12 single‐spaced pages (including eventual appendices) and should be formatted according to the standard format for Springer Verlag's LNAI series (see http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0). Submissions are to be uploaded to: https://www.easychair.org/conferences/?conf=slsp2013 Publications: A volume of proceedings published by Springer in the LNAI topical subseries of the LNCS series will be available by the time of the conference. A special issue of a major journal will be later published containing peer‐reviewed extended versions of some of the papers contributed to the conference. Submissions will be by invitation. Deadlines: Paper submission: March 5, 2013 (23:59h, CET) Notification of paper acceptance or rejection: April 9, 2013 Final version of the paper for the LNAI proceedings: April 17, 2013 Early registration: April 24, 2013 Late registration: July 19, 2013 Submission to the post‐conference journal special issue: October 31, 2013 Questions and Further Information: florentinalilica.voicu at urv.cat Contact Information: SLSP 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34‐977‐559543 Fax: +34‐977‐558386 Programme Committee: Carlos Martín-Vide (Tarragona, Co-Chair) Ruslan Mitkov (Wolverhampton, Co-Chair) Jerome Bellegarda (Apple Inc., Cupertino) Robert C. Berwick (MIT) Laurent Besacier (LIG, Grenoble) Bill Byrne (Cambridge) Jen-Tzung Chien (National Chiao Tung U, Hsinchu) Kenneth Church (IBM Research) Koby Crammer (Technion) Renato De Mori (McGill & Avignon) Thierry Dutoit (U Mons) Marcello Federico (Bruno Kessler Foundation, Trento) Katherine Forbes-Riley (Pittsburgh) Sadaoki Furui (Tokyo Tech) Yuqing Gao (IBM Thomas J. Watson) Ralp Grishman (New York U) Dilek Hakkani-Tür (Microsoft Research, Mountain View) Adam Kilgarriff (Lexical Computing Ltd., Brighton) Dietrich Klakow (Saarbrücken) Philipp Koehn (Edinburgh) Mikko Kurimo (Aalto) Lori Lamel (CNRS-LIMSI, Orsay) Philippe Langlais (Montréal) Haizhou Li (Institute for Infocomm Research, Singapore) Qun Liu (Dublin City) Daniel Marcu (SDL) Manuel Montes-y-Gómez (INAOEP, Puebla) Masaaki Nagata (NTT, Kyoto) Joakim Nivre (Uppsala) Kemal Oflazer (Carnegie Mellon Qatar, Doha) Miles Osborne (Edinburgh) Manny Rayner (Geneva) Giuseppe Riccardi (U Trento) José A. Rodríguez Fonollosa (Technical U Catalonia, Barcelona) Paolo Rosso (Technical U Valencia) Mark Steedman (Edinburgh) Tomek Strzalkowski (Albany) Gökhan Tür (Microsoft Research, Redmond) Stephan Vogel (Qatar Computing Research Institute, Doha) Kuansan Wang (Microsoft Research, Redmond) Dekai Wu (HKUST, Hong Kong) Min Zhang (Institute for Infocomm Research, Singapore) Yunxin Zhao (U Missouri, Columbia) Organising Committee: Adrian Horia Dediu (Tarragona) Carlos Martín‐Vide (Tarragona, Co-Chair) Ruslan Mitkov (Wolverhampton, Co-Chair) Bianca Truthe (Magdeburg) Florentina Lilica Voicu (Tarragona) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 12:37:27 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 13:37:27 +0100 Subject: Revue: Langue fran=?ISO-8859-1?Q?=E7aise_?=176, Comment ecrire une grammaire du francais ? Message-ID: Date: Wed, 05 Dec 2012 18:26:25 +0100 From: Celine Vaguer Message-ID: <50BF83C1.2040103 at free.fr> X-url: http://www.armand-colin.com/revue/20/1/langages.php X-url: http://www.armand-colin.com/revue/7/1/langue-francaise.php *Langue française 176* * **Comment écrire une grammaire du français ? par Teddy Arnavielle & Gilles Siouffi* * Écrire une grammaire du français aujourd'hui TEDDY ARNAVIELLE, GILLES SIOUFFI * La Grammaire méthodique du français : élaboration d'une grammaire linguistique globale JEAN-CHRISTOPHE PELLAT, MARTIN RIEGEL * Une tâche à accomplir pour la linguistique française du XXe siècle : élaborer une grammaire des usages du français HENRI-JOSÉ DEULOFEU, JEANNE-MARIE DEBAISIEUX * La Grande Grammaire du Français et la variété des données ANNE ABEILLÉ, DANIÈLE GODARD * De quelques problèmes spécifiques à l'élaboration d'une grammaire historique BERNARD COMBETTES * Le sens grammatical. Élaboration d'un référentiel à l'usage des enseignants DAN VAN RAEMDONCK * La fabrique d'un guide grammatical pour les enseignants du primaire CORINNE DELHAY, JEAN-PAUL MEYER * Divergences catégorielles et description diachronique dans une grammaire universitaire pour Italiens AURELIO PRINCIPATO ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 12:55:51 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 13:55:51 +0100 Subject: Seminaire: Programme 2012-2013, Seminaire du Centre d'Alembert Message-ID: Date: Thu, 6 Dec 2012 08:40:44 +0100 From: Centre d'Alembert Message-Id: X-url: http://www.centre-dalembert.u-psud.fr Bonjour, Nous sommes heureux de vous annoncer le nouveau programme de séminaires du Centre d'Alembert, pour l'année 2012-2013 : "Sensibles, empêchées, inaccessibles, ouvertes, archivées, revisitées... Les données de la recherche en questions" Au coeur des pratiques scientifiques, les données de la recherche sont aussi objets de débats publics et d' « affaires » juridiques, d'enjeux économiques ... Données matérielles, mais aussi immatérielles, pensées dans le présent ou dans le long temps de leur conservation, dans l'entre soi du laboratoire comme dans le rapport, plus large, à la Société, les données de la recherche constituent des objets tout aussi pluriels que vitaux. Réfléchir à leurs modes de constitution, de préservation et de diffusion aujourd'hui est une entrée privilégiée pour penser les pratiques scientifiques et leurs mutations. Au travers d'exemples (des cahiers de laboratoires aux grandes infrastructures de gestion des données) et de situations concrètes (les politiques liées à l'archivage des données scientifiques, le plagiat, etc.), les intervenants du séminaire 2012-2013 du Centre d'Alembert illustreront le parcours et les destins de ces données. Première séance le mercredi 12 décembre. Programme détaillé mis à jour et contact : Web : http://www.centre-dalembert.u-psud.fr Mél. : centre.dalembert at u-psud.fr Les séances ont lieu à la Faculté des Sciences d'Orsay, bâtiment des colloques (338) de 13h30 à 15h30 (entrée libre) Accès : http://maps.google.fr/maps?q=rue+andr%C3%A9+guinier+orsay&hl=fr&ie=UTF8&hnear=Rue+du+Doyen+Andr%C3%A9+Guinier,+91400+Orsay,+Essonne,+%C3%8Ele-de-France&t=m&z=16 -------------------------------- Séance du mercredi 12 décembre 2012 Constituer des données scientifiques sensibles Patrick GAUDRAY Directeur de Recherche au CNRS, Membre du Comité Consultatif National d'Éthique Données scientifiques sensibles : qui possède quoi ? Entre pouvoir et illusions. Le partage des connaissances est à la base du progrès scientifique. Il est conditionné par le partage des données de la science. C'est le sens même de la publication scientifique qui est un de ses meilleurs indicateurs de qualité. Or, le nombreux vertigineusement croissant de publications scientifiques s'accompagne d'un accroissement tout aussi vertigineux des données propriétaires, des données cachées, des données protégées. Le pouvoir (économique, mais pas seulement) qu'on veut associer aux données scientifiques n'est-il pas en train de leur enlever leur valeur d'objet de science, voire de sujet de science ? On a ainsi pu prend récemment conscience de l'impact des données cachées dans l'appréhension sociétale des dangers possibles de l'utilisation des OGM. On pourra également discuter le cas des biobanques, grandes et petites, indispensables aux recherches moderne en biologie et santé, pivots de la recherche clinique, et dont le nombre et la dimension ont rapidement augmenté ces dernières années. Ces biobanques alimentent la médecine dite personnalisée qui a été comparée au Pays d'Oz des soins de santé, au monde merveilleux des tests génétiques qui vous arrivent par Internet ou une officine de quartier. C'est l'appel de l'Université de Californie à Berkeley pour que ses nouveaux étudiants se soumettent à des enquêtes génétiques sur les variants géniques qui participent au contrôle de l'alcoolémie ou d'autres intolérances. Mais c'est aussi le pays des règlements juridiques qui ont conduit l'université d'état d'Arizona à verser près d'un million de dollars à 41 membres de la tribu indienne des Havasupai pour utilisation non autorisée de matériel génétique, au-delà des termes de l'étude initialement prévue. Ces biobanques interrogent l'éthique à de nombreux niveaux : le consentement éclairé, la confidentialité (restriction de l'accès à l'information initiale, et dissociation permanente entre l'échantillon et les informations qui permettraient une identification individuelle), le retrait de la participation, le partage des avantages qui proviennent de la biobanque, la commercialisation, le partage des données entre les biobanques, et plus généralement les questions de propriété et de gouvernance au niveau de la collaboration internationale. Elsa SUPIOT Centre de recherche en droit des sciences et des techniques, Université Paris1 Panthéon-Sorbonne Données scientifiques sensibles: intérêt individuel ou collectif ? Entre protection et circulation. Les données dites "sensibles" occupent aujourd'hui une place prépondérante en recherche et se trouvent au c¦ur d'un conflit délicat d'intérêts. Protection de la vie privée des individus et de leur liberté, intérêts financiers majeurs sur le marché pharmaceutique, outil indispensable de découverte et d'innovation: les données sensibles soulèvent la délicate question de l'articulation d'une protection de ces données et de leur nécessaire circulation. Le droit, tant au niveau national qu'international, se propose d'assurer cette articulation. La réglementation qui en résulte n'est cependant pas exempte de critiques: entraves excessives apportées à la réalisation des projets de recherche, lacunes dans la protection des personnes dont les données sont impliquées, pour ne pas les citer. Dès lors, dépasser les limites d'un encadrement fondé sur la protection (et ses exceptions) pour réfléchir d'abord en termes d'utilisation et d'intérêts collectifs s'impose. Animatrice de la séance : Stéphanie LACOUR Chargée de recherche CNRS au Centre d'études sur la coopération juridique internationale (Cecoji), spécialiste du droit applicable aux sciences et aux technologies émergentes. -------------------------------- Programme 2012-2013 16/01/2013 Les cahiers de laboratoire : objectifs, pratiques, formes nouvelles et standardisation/normalisation 30/01/2013 Outils de constitution de données : bases de données, nouvelles technologies 13/02/2013 Manipulation des données scientifiques, Faux, plagiats et pillages 27/02/2013 Le patrimoine et les archives scientifiques 20/03/2013 Mémoire(s) scientifique et préservation des savoirs et savoir-faire 3/04/2013 Quels accès aux données ? Du "communisme" scientifique aux modèles propriétaires 1 10/04/2013 Quels accès aux données ? Du "communisme" scientifique aux modèles propriétaires 2 NB : Nous vous invitons à consulter régulièrement notre site Internet, des modifications pouvant intervenir, en cas de force majeure, dans la planification. Nous vous remercions pour l'intérêt que vous portez aux activités du Centre. ========================================================== CENTRE D'ALEMBERT (Centre Interdisciplinaire d'Etude de l'Evolution des Idées, des Sciences et des Techniques) Bâtiment 407 - 91405 ORSAY Cedex Tél. : 01.69.15.61.90 - Fax : 01.69.15.43.98 Courriel : centre.dalembert at u-psud.fr http://www.centre-dalembert.u-psud.fr ========================================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:01:09 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:01:09 +0100 Subject: Appel: Scanned documents processing evaluations campaign, MAURDOR 2013 Message-ID: Date: Thu, 6 Dec 2012 09:45:59 +0100 From: "Oparin Ilya" Message-ID: X-url: http://www.maurdor-campaign.org This is the Call for Participation in the scanned documents processing evaluation campaign MAURDOR 2013. You can find the detailed information below (French and English versions). ### French version ### *** Campagne d’évaluation MAURDOR *** Le traitement automatique de documents numérisés est en plein essor. La campagne MAURDOR vise à évaluer des systèmes de traitement automatique de documents écrits. Elle cherche à quantifier et qualifier les capacités des systèmes à extraire des informations pertinentes à partir d’images issues de la numérisation de documents écrits. Coordonnée par le Laboratoire National de métrologie et d’Essais (LNE) et CASSIDIAN, la présente campagne d’évaluation propose un cadre commun de tâches afin de rendre compte des performances actuelles des systèmes de traitement automatique de documents numériques. Pour remplir cet objectif, le LNE fournira aux participants les éléments suivants : - Des données cohérentes de développements et de test, correspondant aux domaines applicatifs concernés. - Des outils de métriques automatiques de la performance des systèmes. - Un protocole d’évaluation commun applicable à chacune des étapes de traitement ainsi qu’à une chaine complète de traitement automatique de documents écrits. Le plan d’évaluation de la campagne est accessible sur www.maurdor-campaign.org Un atelier sera organisé à la fin de chaque campagne pour rendre compte des résultats obtenus et confronter les approches des différents participants. ** Un corpus de documents hétérogènes ** Une des particularités de l’évaluation MAURDOR est de s’appuyer sur un corpus de documents très hétérogènes. Le corpus d’apprentissage MAURDOR 2013 comportera au total 5 000 documents en anglais, français et arabe correspondant aux catégories suivantes - Des formulaires (environ 12% du corpus) vierges ou complétés - Des documents commerciaux (environ 40% du corpus) imprimés mais également commentés manuellement - Des correspondances privées manuscrites (environ 25% du corpus) pouvant parfois contenir des entêtes imprimées - Des correspondances commerciales (environ 20% du corpus) imprimées mais également commentées manuellement - D’autres documents comme des articles de journaux ou des plans…(environ 3% du corpus) Les systèmes seront évalués sur un corpus de 1 000 documents dont la répartition par catégorie respectera les mêmes proportions que celles du corpus d’apprentissage. ** Tâches évaluées ** MAURDOR repose sur la définition d’une chaîne de traitement complète dans laquelle cinq modules distincts sont mis en œuvre. Chaque module remplit une fonction particulière et contribue au traitement complet du document. Ce sont ces cinq modules qui seront évalués au cours de la campagne. Les modules sont les suivants : - Module n°1 : Typage des zones d’un document permettant de segmenter les images de documents en zones distinctes - Module n°2 : Typage de la nature de l’écriture (manuscrite, dactylographiée) - Module n°3 : Identification de la langue (anglais, arabe, français ou autre) - Module n°4 : Reconnaissance de l’écriture dactylographiée et manuscrite (OCR). - Module n°5 : Extraction de la structure du document. Une évaluation applicative sera également effectuée. Elle consistera à évaluer la complétude et la précision de la reconnaissance par rapport à la présence de mots clés dans les documents. ** Comment participer ? ** Cette campagne est ouverte à toutes les personnes, entreprises ou institutions qui souhaiteraient évaluer leur approche en matière de traitement automatique de documents numériques. Tous les participants devront présenter leur(s) système(s) lors de l’atelier et être en capacité d’expliquer ses fondements. L’atelier est réservé aux participants à la campagne et aux agences ayant financé le projet. Les modules étant indépendant, les participants peuvent s’inscrire pour évaluer une chaîne complète (évaluation applicative) ou des modules de leur choix. L’inscription se fait sur le site www.maurdor-campaign.org ** Dates importantes ** Accès au plan d’évaluation 01/12/2012 Accès aux données d’apprentissage 01/12/2012 Début de la campagne d’évaluation 04/03/2013 Fin de la campagne d’évaluation 29/04/2013 Début de la phase d’adjudication 29/04/2013 Fin de la phase d’adjudication 06/05/2013 Atelier Mai 2013 ### English version ### *** MAURDOR-campaigns: Scanned documents processing evaluations *** ** Presentation ** Scanned documents processing is an important issue for information retrieval. The MAURDOR campaigns aim at assessing the progress of the automatic systems in this area. The goal is to quantify and qualify the ability of the systems to extract the relevant information in scanned documents. The Laboratoire national de métrologie et d’essais (LNE) and CASSIDIAN, an EADS company, will conduct evaluation campaigns entitled MAURDOR in 2013 in order to support Scanned documents processing researches and help advance the state of the art in Optical Characters Recognition technologies. The LNE and CASSIDIAN provide the following to the participants: - Consistent data for the training sets, the development and the test sets. - Automatic metrics tools. - Common rules so as to assess the different steps essential for scanned documents processing. A workshop will be organized at the end of the campaign to account for the results and compare the approaches of various participants. The evaluation plan is available at www.maurdor-campaign.org ** A heterogeneous database ** The MAURDOR evaluations are based on a very heterogeneous database. The training set is multilingual (English, French, and Arabic) and consists on 5,000 different documents corresponding to the following classes: - Blank forms and completed forms (around 12% of the database) - Typewritten commercial documents with sometimes several manual annotations (around 40% of the database) - Handwritten personal letters with sometimes typewritten headers (around 25% of the database) - Commercial letters (around 20% of the database) as purchase orders or bills - Other documents like newspapers articles or maps…(around 3% of the database). The test set contains 1,000 documents distributed as the training set. ** Tasks ** MAURDOR is based on a complete processing in which five separate modules are implemented. Each module performs a particular function contributing to the complete processing of the scanned document. The following five modules are independently assessed during the campaign: - Task 1: Segmentation and typing areas (table, text, image…) - Task 2: Type writing characterization (handwritten or typewritten characters) - Task 3: Language detection - Task 4: Characters recognition - Task 5: Establishing reading order and relations between areas An evaluation will be performed for an operational application as an end-to-end processing chain. It will consist in the assessment of the completion and the accuracy of the results according to the presence of keywords in the recognized text. ** How to participate? ** This evaluation is intended to be of interest of all researchers working on the problem of scanned documents processing. Participation in the evaluation is invited for all researchers who find the tasks and the evaluation of interest. The only requirement is the participation in the follow-up workshop. All the participants must attend the evaluation workshop and be prepared to discuss their system(s), their results in detail. To participate, simply fill out the registration form available at www.maurdor-campaign.org ** Important dates ** Evaluation plan released 01/12/2012 Training data available 01/12/2012 Beginning of the campaign 04/03/2013 End of the campaign 29/04/2013 Beginning of the adjudication 29/04/2013 End of the adjudication 06/05/2013 Workshop May 2013 Another campaign will be organized in 2014. ### Ilya OPARIN Ingénieur en traitement automatique des langues Direction des Essais Tél. : 01 30 69 14 91 Laboratoire national de métrologie et d'essais 29, avenue Roger Hennequin - 78197 Trappes cedex Tél. : 01 30 69 10 00 - Fax : 01 30 69 12 34 Site internet : www.lne.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:09:42 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:09:42 +0100 Subject: Appel: Colloque TRADETAL2013 Message-ID: Date: Fri, 7 Dec 2012 12:01:11 +0000 (GMT) From: Farouk BOUHADIBA Message-ID: <1354881671.47978.YahooMailClassic at web132302.mail.ird.yahoo.com> VIème Colloque International en Traductologie et TAL (TRADETAL 2013) Thème: Le TAL en Algérie et au Maghreb : Etat de l’art et perspectives de formation et de recherche Date de déroulement : 4, 5 et 6 mai 2013 Lieu : Université d’Oran Es-Sénia ORGANISATEURS : Pr. BOUHADIBA Farouk (Labo 022/2000, Université d’Oran, Algérie) Pr. CARDEY Sylviane (Centre TAL, Lucien Tesnière, Besançon, France) ARGUMENTAIRE Le but de ce colloque serait de faire l’état de l’art sur la recherche et la formation en Traitement Automatique des Langues dans le monde et de situer l’état de la recherche dans ce domaine dans le Maghreb et plus spécialement en Algérie. Ceci afin de réfléchir sur l’impact de la recherche en Traitement Automatique des Langues en Algérie par rapport à ce qui se fait dans le Maghreb et Outre Mer. L’objectif principal de ce colloque est de situer l’impact de ce domaine de recherche et ce spécialement par rapport à la dictionnairique en ligne, la place de la langue arabe dans les autoroutes de l’information et de la communication, l’élaboration de programmes de formation dans ce domaine ainsi que tout ce qui a trait aux protocoles de la rédaction technique de l’arabe vers d’autres langues (Environnement, Tourisme, Sécurité, Santé, Formation Professionnelle, Recherche Appliquée, etc.). Il s’agit également de sensibiliser universitaires et décideurs sur l’importance de la création de centres ou de départements TAL en Algérie comme cela se fait en Tunisie et au Maroc par exemple et dans les pays du Bassin Méditerranéen. Ceci afin de renforcer la pluridisciplinarité dans la recherche en TAL sur la Langue Arabe par rapport à d’autres langues telles que le Français, l’Anglais, l’Espagnol, le Russe et le Chinois. Cette sixième édition du TRADETAL, à l’instar des éditions précédentes, se veut une manifestation scientifique annuelle pour développer les échanges de recherche intra et inter universitaires (Nationaux et Internationaux) afin d’établir des liens et des bases d’échanges pour la recherche et la formation en TAL et plus spécialement les corpus linguistiques pour dictionnaires et traducteurs automatiques en lignes de la langue arabe. L’objectif étant la mise en place d’une plateforme pour intégrer et développer la place de la langue arabe dans les autoroutes de l’information actuels. Cette édition du Colloque International en Traductologie et TAL (TRADETAL2013) s’intéresse particulièrement au TAL en Algérie et au Maghreb : Etat de l’art et perspectives de formation et de recherche. Elle vise principalement le renforcement des liens et contacts entre chercheurs et universitaires qui s’intéressent à différents aspects du transfert de la Langue Arabe vers d’autres langues telles que le Français, l’Anglais ou l’Espagnol, le Russe et le Chinois, entre autres. Ceci n’exclut nullement tous travaux sur la Langue Arabe à tous les niveaux d’analyse linguistique et extralinguistique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:10:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:10:59 +0100 Subject: Appel: KBGen Challenge Message-ID: Date: 07 Dec 2012 16:38:33 +0100 From: Claire Gardent Message-Id: X-url: http://www.kbgen.org/ CALL FOR PARTICIPATION The KBGen Challenge: Generating from Knowledge Bases http://www.kbgen.org/ Important Dates ----------------------- 08 December 2012: Registration and Pre-Release Download 01 February 2013: Deadline for feedback and comments on pre-release data 01 March 2013: Release of full KBGen 2013 Task data 01 June 2013: Deadline for System Outputs August 2013: Reporting and discussing results at ENLG Call for Pre-Registration and Sample Data Release ---------------------------------------------------------------------- We invite teams of researchers to pre-register now for the KBGen 2013 Task by filling in the registration form here: http://www.kbgen.org/register/ Once registered, teams will be given access to sample data with which to familiarise themselves with the input representation formats we have developed. We welcome comments and feedback till February, 1st 2013. The complete KBGen data will be distributed on March 1st, and the deadline for submitting system outputs will be in early June (exact date to be confirmed). Results and participating systems will be presented at ENLG in August 2013. Below we provide a brief overview of the KBGen Task. For more information please visit the other pages on this site. KBGen Task ------------------ The task for participating teams is to develop systems that map the input representations provided by the KBGen organisers to sentences, and to submit system outputs for the inputs in the test data set. Data ------ The KBGen Task data is derived from the AURA Knowledge Base which was developed in the context of the HALO Project at SRI International. This knowledge base encodes knowledge contained in a college-level biology textbook. We have processed and adapted this data so that each input provided by the KBGen task can be verbalised in a single, possibly complex, sentence. To minimise the amount of engineering required to participate, we also make available a lexicon mapping the concepts and relations present in the KBGen data to words. Evaluation -------------- Submitted system outputs will be evaluated by a variety of automatic metrics and human-assessed quality criteria. Input Representations ------------------------------- The input representations are bundles of triples expressing relations between entities. For the development phase, the data set will consist of input and output pairs, where each input is associated with one or more manually produced sentence verbalising this input. Here is an example of the input-output pairs that we propose for the challenge: "The temperature of a biomembrane is directly proportional to its fluidity, and the density of a biomembrane is inversely proportional to its fluidity." ((:TRIPLES ( Biomembrane2717 fluidity Fluidity-Value2723 ) ( Biomembrane2717 temperature Temperature-Value2673 ) ( Temperature-Value2673 directly-proportional Fluidity-Value2723 ) ( Biomembrane2717 density Density-Value2762 ) ( Density-Value2762 inversely-proportional Fluidity-Value2723 ) ) (:INSTANCE-TYPES ( Biomembrane2717 instance-of Entity ) ( Biomembrane2717 instance-of Biomembrane ) ( Fluidity-Value2723 instance-of Fluidity-Value ) ( Temperature-Value2673 instance-of Temperature-Value ) ( Density-Value2762 instance-of Density-Value )) ) As mentioned above, we make available a lexicon which maps each concept and relation present in the input to words. Organising Team ----------------------- Eva Banik, Computational Linguistics Ltd, UK Claire Gardent, CNRS/LORIA, Nancy, France Eric Kow, Computational Linguistics Ltd, UK Contact email info at kbgen.org ------------------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:13:17 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:13:17 +0100 Subject: Ecole: Promise Winter School 2013 in Bressanone, Italy, 4-8 February 2013 Message-ID: Date: Fri, 07 Dec 2012 18:24:24 +0100 From: ELRA ELDA Information Message-ID: <50C22648.2020205 at elda.org> X-url: http://www.promise-noe.eu/events/winter-school-2013/ [Apologies for cross-posting] *PROMISE Winter School 2013: Bridging between Information Retrieval and Databases* Bressanone, Italy 4 - 8 February 2013 http://www.promise-noe.eu/events/winter-school-2013/ The aim of the PROMISE Winter School 2013 on "Bridging between Information Retrieval and Databases" is to give participants a grounding in the core topics that constitute the multidisciplinary area of information access and retrieval to unstructured, semistructured, and structured information. The school is a week-long event consisting of guest lectures from invited speakers who are recognized experts in the field. The school is intended for_PhD students, Masters students or senior researchers such as post-doctoral researchers_ form the fields of databases, information retrieval, and related fields. The registration is open until December 20, 2012 (https://docs.google.com/spreadsheet/embeddedform?formkey=dEs1N09jVHNCeTVNR1d3QzN0MnVtTVE6MQ). All information on venue, accommodation and fees can be found at http://www.promise-noe.eu/events/winter-school-2013/registration-and-accomodation TheWinter School programme is available online (http://www.promise-noe.eu/events/winter-school-2013/programme). Any question? Send a mail to winter-school [at] promise-noe.eu ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:19:55 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:19:55 +0100 Subject: Revue: Langages, numero 188 (4/2012) Formes et sens Message-ID: Date: Sat, 8 Dec 2012 12:19:31 +0100 From: Catherine SCHNEDECKER Message-ID: X-url: http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9964 * Langages, nº188 (4/2012) Formes et sens : de l’unicité à la variabilité. Etude de l'espace et du temps (dir. : STOSIC Dejan, FAGARD Benjamin ) Sommaire du n°188 http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9963 - STOSIC Dejan, FAGARD Benjamin Formes et sens : de l’unicité à la variabilité http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9964 - HICKMANN Maya Diversité des langues et acquisition du langage : espace et temporalité chez l’enfant http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9965 - IAKOVLEVA Tatiana, HICKMANN Maya Contraintes typologiques dans l'acquisition d'une langue étrangère : l'expression du mouvement chez les apprenants russophones du français http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9966 - PETROVIC Marijana Le passé simple, le parfait simple et l’aoriste : français, roumain, valaque et serbe http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9967 - DE SAUSSURE Louis, STHIOUL Bertrand Formes et interprétations du passé surcomposé : unité sémantique d’une variation diatopique http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9968 - ALEKSANDROVA Angelina Enfant, j’aimais les épinards : l’expression nominale du temps http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9969 - FAGARD Benjamin De ante à devant et avant : différenciation sémantique dans l’évolution des langues romanes http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9970 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:04:15 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:04:15 +0100 Subject: Seminaire: Quantitative models of early language acquisition, Emmanuel Dupoux Message-ID: Date: Tue, 11 Dec 2012 09:40:17 +0100 From: Nadéra Bureau Message-ID: <001e01cdd77b$2634dbc0$729e9340$@bureau at lpl-aix.fr> Brain & Language Research Institute Vendredi 21 décembre 2012 11h Salle des Voûtes Fédération de Recherche 3 C (Comportement, Cerveau, Cognition) 3 place Victor Hugo, Marseille (Labex BLRI) Emmanuel DUPOUX Quantitative models of early language acquisition Résumé : The past 40 years of psycholinguistic research has shown that infants learn their first language at an impressive speed. During the first year of life, even before they start to talk, infants converge on the basic building blocks of the phonological structure of their language. Yet, the mechanisms that they use to achieve this early phonological acquisition are still not well known. We show that a modeling approach based on machine learning algorithms and speech technology applied to large speech databases can help to shed light on the early pattern of development. First, we argue that because of acoustic variability, phonemes cannot be acquired directly from the acoustic signal; only highly context dependent and talker dependent phones or phones fragments can be extracted in a bottom-up way. Second, words cannot be acquired directly from the acoustic signal either, but a small number of protowords or sentence fragments can be extracted on the basis of repetition frequency. Third, these two kinds of protolinguistic units can interact with one another in order to converge with more abstract units. The proposal is therefore that the different levels of the phonological system are acquired in parallel, through increasingly more precise approximations. This accounts for the largely overlapping development of lexical and phonological knowledge during the first year of life. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:14:47 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:14:47 +0100 Subject: Job: CDD Ingenieur linguiste, Equipex ORTOLANG Message-ID: Date: Tue, 11 Dec 2012 10:13:17 +0100 From: Etienne Petitjean Message-Id: <8F13128E-DE9A-4C6B-A114-79DDDCB8272C at atilf.fr> Offre d’emploi d’ingénieur pour le « Développement de ressources et de services pour la linguistique » ------------------------------------------------------------------------ Informations générales Lieu : Nancy (Laboratoire ATILF UMR 7118) dans le cadre de l’Equipex ORTOLANG Date de publication : mercredi 28 novembre 2012 Date limite de candidature : 31/12/2012 Type de contrat : CDD Technique/Administratif Durée du contrat : 36 mois Date d'embauche prévue : 1er février 2013 Quotité de travail : Temps complet Niveau d'études souhaité : Bac+5 Expérience souhaitée : expérience souhaitée en linguisitique informatique Rémunération : 2000 euros brut mensuel environ (selon expérience) Missions Dans le cadre du projet d'Equipex ORTOLANG (www.ortolang.fr) et intégré à l’équipe informatique du laboratoire ATILF, cet ingénieur sera chargé de créer ou d’enrichir des ressources linguistiques et de créer les outils d’exploitation de ces ressources. Il travaillera en coordination avec les partenaires d’ORTOLANG pour faciliter la convergence des formats de données (ressources) pour faciliter leur partage, et développera des services informatisés pour leur accès. Il participera à des groupes de travail concernés par ces problématiques au niveau du laboratoire. Activités L’ingénieur interviendra dans différents projets en cours ou à venir visant à produire des ressources linguistiques annotées en vue de leur mise en ligne. Il travaillera en collaboration avec les développeurs informatiques pour la création de scripts et d’outils permettant l’exploitation en ligne de ces ressources. Il apportera sa double compétence linguistique et informatique pour mener à bien les missions qui lui seront confiées. Il recevra des formations pour l’acquisition de nouvelles compétences dans les domaines techniques liés à son activité. Compétences Maîtriser au moins un langage de scripts (Perl, Python, Ruby) Maîtriser les bases de données (SQL et MySQL) Avoir une bonne connaissance du langage XML et de ses applications (une connaissance de la TEI sera un plus) Avoir une bonne expérience en linguistique et en traitement de corpus Avoir une bonne connaissance des technologies du Web (XHTML, CSS, Javascript) Travail en équipe, esprit d’initiative Contexte de travail Dans le cadre de la mise en place de l'Equipex ORTOLANG (www.ortolang.fr), cet emploi s'insérera dans le laboratoire ATILF (http://www.atilf.fr), Unité Mixte de Recherche du CNRS et de l’Université de Lorraine et partenaire d'ORTOLANG. Informations complémentaires Toute candidature (CV détaillé et lettre de motivation) devra être adressée à : Etienne Petitjean etienne.petitjean at atilf.fr Contact Etienne Petitjean etienne.petitjean at atilf.fr Jean-Marie Pierrel jean-marie.pierrel at atilf.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:19:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:19:05 +0100 Subject: Job: CDD Ingenieur informatique, Equipex ORTOLANG Message-ID: Date: Tue, 11 Dec 2012 10:15:46 +0100 From: Etienne Petitjean Message-Id: <2F2FD559-DD0D-4184-99B9-4ADB785948DC at atilf.fr> Offre d’emploi d’ingénieur pour le « Développement d’outils et de traitement de ressources pour la linguistique » ------------------------------------------------------------------------ Informations générales Lieu : Nancy (Laboratoire ATILF UMR 7118) dans le cadre de l’Equipex ORTOLANG Date de publication : jeudi 6 décembre 2012 Date limite de candidature : 31/12/2012 Type de contrat : CDD Technique/Administratif Durée du contrat : 36 mois Date d'embauche prévue : 1er février 2013 Quotité de travail : Temps complet Niveau d'études souhaité : Bac+5 Expérience souhaitée : une expérience en traitement de corpus sera un plus Rémunération : 2000 euros brut mensuel environ (selon expérience) Missions Dans le cadre du projet d'Equipex ORTOLANG (www.ortolang.fr) et intégré à l’équipe informatique du laboratoire ATILF, cet ingénieur sera chargé de développer ou de se réappropier des outils et des chaines de traitements pour la production et l’exploitation de ressources linguistiques. Il travaillera en coordination avec les partenaires d’ORTOLANG pour faciliter le partage et la mise en ligne d’outils à destination de la communauté. Activités L’ingénieur travaillera en appui des ingénieurs en poste sur différents projets informatiques concernant notamment le traitement de gros volumes de données linguistiques, le développement de chaines de traitement de données et la mise en place d’outils réutilisables sur le Web. Compétences Maîtriser au moins les langages de scripts (Perl et le Shell Unix) Maîtriser les bases de données (SQL et MySQL) Avoir une bonne connaissance du langage XML et de ses applications (une connaissance de la TEI sera un plus) Avoir une bonne expérience du langage Java Avoir une bonne connaissance des technologies du Web (XHTML, CSS, Javascript) Travail en équipe, esprit d’initiative Contexte de travail Dans le cadre de la mise en place de l'Equipex ORTOLANG (www.ortolang.fr), cet emploi s'insérera dans le laboratoire ATILF (http://www.atilf.fr), Unité Mixte de Recherche du CNRS et de l’Université de Lorraine et partenaire d'ORTOLANG. Informations complémentaires Toute candidature (CV détaillé et lettre de motivation) devra être adressée à : Etienne Petitjean etienne.petitjean at atilf.fr Contact Etienne Petitjean etienne.petitjean at atilf.fr Jean-Marie Pierrel jean-marie.pierrel at atilf.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:24:23 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:24:23 +0100 Subject: Job: Stage, Extraction et modelisation de connaissances d=?WINDOWS-1252?Q?=92un_?=document texte (mots-cles, themes) Message-ID: Date: Tue, 11 Dec 2012 16:48:44 +0100 From: Alain Simac-Lejeune Message-ID: Proposition de stage de M2 dans l'entreprise Compilatio (Saint-Félix, 74) : *Extraction et modélisation de connaissances d’un document texte* Le stage consiste à étudier les méthodes existantes pour faire de l’analyse de documents, l’extraction de mots-clés, l’extraction de thématiques dans le but de créer une signature sémantique du document. Le stage de 6 mois se déroulera à Saint-Félix en Haute-Savoie (Vers Annecy et Chambéry). Il sera rémunéré de manière conventielle. Renseignements et candidatures : Alain Simac-Lejeune : alain at compilatio.net *L’entreprise* : Compilatio est un éditeur de logiciel (entreprise innovante) propose un service en ligne pour l’analyse de documents pour la prévention et la détection de plagiat. Leader français de la détection de plagiat créé en 2007, l’entreprise sert plus de 200 établissements supérieurs et analyse quotidiennement plus de 1000 documents. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:32:09 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:32:09 +0100 Subject: Job: Stage, Recherche de similitudes dans Wikipedia avec SPARQL (DBPedia) Message-ID: Date: Tue, 11 Dec 2012 16:50:27 +0100 From: Alain Simac-Lejeune Message-ID: Proposition de stage de M2 dans l'entreprise Compilatio (Saint-Félix, 74) : *Recherche de similitudes dans Wikipedia avec SPARQL (DBPedia)* Le stage consiste à étudier le projet DBpedia, le SPARQL et Wikipédia et de proposer un outil permettant la recherche d’articles de Wikipédia présentant des similitudes avec le document analysé. Le stage de 6 mois se déroulera à Saint-Félix en Haute-Savoie (Vers Annecy et Chambéry). Il sera rémunéré de manière conventielle. Renseignements et candidatures : Alain Simac-Lejeune : alain at compilatio.net *L’entreprise* : Compilatio est un éditeur de logiciel (entreprise innovante) propose un service en ligne pour l’analyse de documents pour la prévention et la détection de plagiat. Leader français de la détection de plagiat créé en 2007, l’entreprise sert plus de 200 établissements supérieurs et analyse quotidiennement plus de 1000 documents. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:33:51 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:33:51 +0100 Subject: Ecole: Terminology workshop (Last call) Message-ID: Date: Tue, 11 Dec 2012 19:06:06 +0100 From: "iula at online" Message-ID: <05D8AA38E5A64281B19C5C1DAE444B43 at ws076671> X-url: http://www.iula.upf.edu/teronlform0uk.htm Dear colleagues, We are pleased to announce that the online workshop Methodology for Terminology Work (second edition in English) will start on January 16th 2013. This workshop is offered by IULATERM, the leading Research Group in Terminology under the direction of M. Teresa Cabré, in the framework of the online Master in Terminology. The online workshop Methodology for Terminology Work deals with the foundations of terminological practice within the framework of M. T. Cabré's Communicative Theory of Terminology, and it is aimed at learning how to elaborate a terminological product (a glossary or vocabulary) following the main phases of terminology work: definition of the work, writing of the work plan, creation and examination of the extraction corpus, database creation and revision, and work editing. The online workshop Methodology for Terminology Work is based on TERMINUS 2.0©, an application for terminology and corpus management developed by IULATERM Research Group. TERMINUS 2.0© is an integrated web application which provides tools for the complete terminographic workflow: document search, corpus compilation and exploration, automatic term extraction, dictionary and project management, database creation and maintenance, and dictionary edition (in digital or print format). Please note that the number of places for the workshop is limited; thus early registration is strongly recommended. Please see below for further details, and do not hesitate to write to us should you need any additional information. Workshop dates: January 16th - March 12th 2013 ECTS Credits: 10 Fee: ? 600 Registration: http://www.iula.upf.edu/teronlform0uk.htm (Please follow the instructions indicated under Registration procedure) Further information and contact: iulaonline at upf.edu Best regards, M. Teresa Cabré Director of the Master in Terminology ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:37:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:37:25 +0100 Subject: Appel: ACL 2013 Student Research Workshop Message-ID: Date: Tue, 11 Dec 2012 19:30:16 +0100 From: Sebastian Krause Message-ID: <50C77BB8.60603 at dfki.de> X-url: http://sites.google.com/site/aclsrw2013/ SECOND CALL FOR PAPERS -- ACL 2013 STUDENT RESEARCH WORKSHOP 5-7 August, 2013, Sofia, Bulgaria ** Submission deadline: Sunday, March 3, 2013 ** http://sites.google.com/site/aclsrw2013/ GENERAL INVITATION FOR SUBMISSIONS ---------------------------------------- The ACL Student Research Workshop provides a venue for student researchers investigating topics in Computational Linguistics and Natural Language Processing to present their research, to meet potential advisors, and to receive feedback from the international research community. The workshop's goal is to aid students at multiple stages of their education: from those in the final stages of undergraduate training to those who are preparing their graduate thesis proposal. Towards this goal, we invite papers in two separate categories. 1. Thesis/Research Proposals: This category is appropriate for experienced students who wish to get feedback on their proposal and broader ideas for the field in order to strengthen their final research. 2. Research Papers: Most appropriate for students who are new to academic conferences. Papers in this category can describe completed work or work in progress with preliminary results. Subject to the availability of established researcher volunteers, each accepted paper will be assigned a mentor, who will provide feedback on the work to the student at the conference. Separately, the committee will do its best to assign pre-submission mentors to students who wish to get feedback before the paper deadline. This service will be available on a first come, first served basis and does not guarantee acceptance into the workshop. Students who wish to take advantage of this opportunity should let the co-chairs know via email (to: acl-srw-2013 at googlegroups.com) no later than Saturday, December 29, 2012 and should submit a paper draft no later than Friday, January 18, 2013. TOPICS ---------------------------------------- Relevant topics for the workshop include, but are not limited to, the following areas (in alphabetical order): - Cognitive modeling of language processing and psycholinguistics - Dialogue and interactive systems - Discourse, coreference and pragmatics - Evaluation methods - Information retrieval - Language resources - Lexical semantics and ontologies - Low resource language processing - Machine translation: methods, applications and evaluation - Multilinguality in NLP - NLP applications - NLP and creativity - NLP for the languages of Central and Eastern Europe and the Balkans - NLP for the Web and social media - Question answering - Semantics - Sentiment analysis, opinion mining and text classification - Spoken language processing - Statistical and Machine Learning methods in NLP - Summarization and generation - Syntax and parsing - Tagging and chunking - Text mining and information extraction - Word segmentation SUBMISSION GUIDELINES ---------------------------------------- See our site: https://sites.google.com/site/aclsrw2013/submission-guidelines IMPORTANT DATES ---------------------------------------- - Pre-submission mentoring service application: December 29, 2012 - Pre-submission mentoring paper deadline: January 18, 2013 - Submission deadline: March 3, 2013 - Notification of acceptance: April 24, 2013 - Camera-ready submission deadline: May 24, 2013 - Conference dates: August 5-7, 2013 (The workshop will be held during the main conference, in a mode similar to the conference's regular sessions.) TRAVEL FUNDING ---------------------------------------- We will be able to provide student authors of accepted papers with a limited amount of travel support. Details on how to apply for this will be part of the acceptance notification distributed in April 2013. ORGANISING COMMITTEE ---------------------------------------- Student Chairs: - Anik Dey, The Hong Kong University of Science & Technology - Sebastian Krause, German Research Center for Artificial Intelligence - Ivelina Nikolova, Bulgarian Academy of Sciences - Eva Vecchi, Universita di Trento Faculty Advisors: - Steven Bethard, University of Colorado Boulder & KU Leuven - Preslav I. Nakov, Qatar Computing Research Institute - Feiyu Xu, German Research Center for Artificial Intelligence PROGRAM COMMITTEE ---------------------------------------- See our site: https://sites.google.com/site/aclsrw2013/program-committee CONTACT ---------------------------------------- acl-srw-2013 at googlegroups.com ++++++++++++++++++++++++++++++++++++++++ We apologize if you receive duplicates of this CFP. Please feel free to distribute it to those who might be interested. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:01:32 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:01:32 +0100 Subject: Job: 2 Stages, Analyse des evenements et l'extraction d'information temporelle , LIMSI-CNRS Message-ID: Date: Wed, 12 Dec 2012 14:25:27 +0100 From: Xavier Tannier Message-ID: <50C885C7.9060202 at limsi.fr> X-url: http://perso.limsi.fr/Individu/xtannier/fr/Stages/sujet_2013_M1_M2_analyse_temporelle_de_pages_web.html X-url: http://perso.limsi.fr/Individu/xtannier/fr/Stages/sujet_2013_L_moteur_de_recherche_evenements.html Bonjour, Deux stages autour de l'analyse des événements et l'extraction d'information temporelle sont proposés cette année par l'équipe ILES du LIMSI-CNRS. Le LIMSI se situe à Orsay (91), sur le plateau de Saclay. 1. Niveau M1, M2Pro, M2R (sujet à moduler en fonction du niveau) : *"Analyse temporelle de pages web d'information" * http://perso.limsi.fr/Individu/xtannier/fr/Stages/sujet_2013_M1_M2_analyse_temporelle_de_pages_web.html 2. Niveau DUT info, L3 ou fin de premier cycle d'école d'ingénieur : *"Réalisation d'une interface graphique pour un moteur de recherche d'événements"* http://perso.limsi.fr/Individu/xtannier/fr/Stages/sujet_2013_L_moteur_de_recherche_evenements.html Merci d'envoyer vos candidatures à Xavier Tannier (xtannier at limsi.fr) et Véronique Moriceau (moriceau at limsi.fr), en précisant bien à quel stage vous postulez. Cordialement, Xavier Tannier Maître de conférence LIMSI-CNRS (bât. 508, bureau 12, RdC) Université Paris-Sud 11 B.P. 133 91403 ORSAY CEDEX FRANCE http://www.limsi.fr/~xtannier/ tel: 0033 (0)1 69 85 80 12 fax: 0033 (0)1 69 85 80 88 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:03:10 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:03:10 +0100 Subject: Appel: HMGE 2013 (ESSLLI Workshop) Message-ID: Date: Wed, 12 Dec 2012 15:19:20 +0100 From: Yannick Parmentier Message-ID: <20121212141920.GG4091 at nausicaa> X-url: http://www.univ-orleans.fr/lifo/evenements/HMGE13/ ** apologies for cross-posting ** CALL FOR PAPERS ====================================================== High-level Methodologies for Grammar Engineering (HMGE 2013) ESSLLI 2013 Workshop (Language and Computation Area) University of Düsseldorf, Germany August 12-16, 2013 http://www.univ-orleans.fr/lifo/evenements/HMGE13/ ====================================================== INTRODUCTION ============ Many grammatical frameworks have been proposed over the last decades to describe the syntax (and semantics) of natural language. Among the most widely used, one may cite Tree-Adjoining Grammar (TAG) [Joshi et. Al, 1975], Lexical-Functional Grammar (LFG) [Bresnan and Kaplan, 1982], or Head- driven Phrase Structure Grammar (HPSG) [Pollard and Sag, 1994]. These frameworks present theoretical and practical interests. From a theoretical point of view, they provide a formal device for the linguist to experiment with her/his theories. From a practical point of view, they make it possible to automatically process natural language in applications such as dialog systems, machine translation, etc. They differ in their expressivity and complexity. Some reveal themselves more adequate for the description of a given language than others. Still, for many of these frameworks, large resources (i.e., grammars) have been designed, at first by hand, and later via dedicated tools (e.g., integrated grammar environments such as XLE for LFG [King et al, 2000]). In this workshop, we are concerned with this complex task of grammar engineering, keeping in mind the two above-mentioned theoretical and practical interests. TOPICS ====== HMGE is open to submissions on topics including, but not limited to: * development, maintenance and enhancement of grammars * semi-automatic acquisition of grammars * debugging environments for grammar design * dedicated description languages for grammar engineering * applications of large-scale grammars VENUE ===== The workshop will be held as part of ESSLLI in August 2013 in Düsseldorf, Germany. More information about ESSLLI can be found at the ESSLLI web pages at http://esslli2013.de/. IMPORTANT DATES =============== Paper submission deadline: March 10, 2013 Reviews due: April 28, 2013 Camera ready version: May 19, 2013 Workshop: August 12-16, 2013 SUBMISSIONS =========== Papers must be submitted electronically as PDF files and be prepared using the Springer LNAI/LNCS format. Detailed formatting instructions can be found at: http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0 HMGE accepts two kinds of submissions: - full papers (12 pages including references) reporting completed, significant research, - short papers (6 pages including references) reporting ongoing work and partial results. Each submission will be reviewed by three program committee members. Accepted long papers will be presented within 20 minutes talks plus 10 minutes for questions. Accepted short papers will be presented within 10 minutes talks plus 10 minutes for questions. Both paper types will be published in the workshop proceedings. Since reviewing will be blind, the submission should not include the authors' names and affiliations. Other identifying information such as obvious self-references (e.g., "We showed in [12] ...") and financial or personal acknowledgements should be omitted in the submitted papers whenever feasible. Papers have to be submitted via the easychair conference management system using the following link: http://www.easychair.org/conferences/?conf=hmge13 PROGRAM COMMITEE ================ Emily Bender, Washington Philippe Blache, Aix-en-Provence Miriam Butt, Konstanz Eric De La Clergerie, Paris Benoît Crabbé, Paris Berthold Crysmann, Paris Stefanie Dipper, Bochum Denys Duchier, Orléans Claire Gardent, Nancy Josef van Genabith, Dublin Timm Lichte, Düsseldorf Montserrat Marimon, Barcelona Yusuke Miyao, Tokyo Stefan Müller, Berlin Gertjan van Noord, Groningen Yannick Parmentier, Orléans Agnieszka Patejuk, Warsaw ORGANIZING COMMITEE =================== Denys Duchier (LIFO - Université d'Orléans) Yannick Parmentier (LIFO - Université d'Orléans) Information about the Workshop is available at the HMGE workshop website: http://www.univ-orleans.fr/lifo/evenements/HMGE13/ E-mail:hmge13 at easychair.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:17:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:17:46 +0100 Subject: Appel: Verbum, La composition neoclassique (Report de date / Deadline extension) Message-ID: Date: Wed, 12 Dec 2012 16:49:21 +0100 From: Stéphanie Lignon Message-ID: <50C8A781.8080803 at univ-nancy2.fr> La composition néoclassique, numéro de Verbum coordonné par Stéphanie Lignon et Fiammetta Namer Parmi les procédés de création lexicale disponibles dans la langue, la composition néoclassique met en jeu des modèles particuliers. La composition est un procédé constructionnel qui fait intervenir deux lexèmes de base afin de construire un nouveau lexème (timbre-poste, porte-bagage). On distingue deux types de composition, la composition standard (ou populaire ou ordinaire), qui met en jeu des lexèmes du vocabulaire contemporain (porte-bagage), et la composition néoclassique, qui met en jeu des lexèmes empruntés au fonds patrimonial, comme coléoptère ou anthropophage. La composition néoclassique (également dite « savante », « érudite », ou encore appelée « infixation », « confixation », etc.) était initialement réservée à la formation de termes des vocabulaires de spécialités en médecine, chimie, zoologie, botanique, etc. Or, aujourd’hui, elle sert de modèle à des formations appartenant non plus à des vocabulaires spécialisés, mais à la langue « générale » ; cf. par exemple contraintophobe, ferrovipathe, capillo-tracté, chronophage, théâtrolâtre, publivore, bobophile. Toutefois, son identification est plus délicate que celle des affixés : - le seul segment que partagent tous les composés néoclassiques est la voyelle de liaison –o- (politicomédiatique, primoaccédant) ou –i- (liberticide) entre les composants ; - le segment qui suit la voyelle de liaison est soit un mot du français, soit un constituant grec ou latin présent dans d'autres mots du français ; - ce dernier, contrairement aux mots, ne figure pas dans les lexiques du français. Son succès dans la langue générale est la raison qui nous pousse à vouloir proposer un numéro thématique dédié à ce procédé. Une attention toute particulière sera portée aux soumissions proposant un lien avec les corpus et la formalisation (modèles), dans un contexte monolingue et multilingue, dans les domaines de spécialité ou dans la langue générale. L'appel s'adresse aux spécialistes de plusieurs domaines, quel que soit le courant théorique adopté : - linguistique : lexique, terminologie, morphologie ; - TAL, - psycholinguistique (aspect perception, apprentissage de la langue, troubles du langage, etc.). Calendrier : - 30 janvier 2013 : Les auteurs souhaitant proposer un article sur ce thème sont priés d?envoyer une intention de soumission de deux pages (bibliographie non comprise) de leur projet pour le 15 janvier 2013. Ce résumé ne doit pas être programmatique. Il doit indiquer clairement la problématique abordée et faire état des principaux résultats qui seront exposés dans l?article. - 28 février 2013 : Sélection des communications par le comité de lecture et notification aux auteurs - 30 juin 2013 : réception des articles complets qui devront faire entre 15 et 20 pages. La feuille de style sera communiquée aux auteurs lors de la notification de leur acceptation. Les propositions sont à envoyer à Stéphanie Lignon ( stephanie.lignon at univ-lorraine.fr)et Fiammetta Namer ( fiammetta.namer at univ-lorraine.fr). Comité de lecture : Dany AMIOT (STL, Université Lille 3), Frédérique BRIN-HENRY (ATILF, Université de Lorraine), Georgette DAL (STL, Université Lille 3), Natalia GRABAR (STL, Université Lille 3), Nabil HATHOUT (CLLE, Université Toulouse-Le Mirail), Stéphanie LIGNON (ATILF, Université de Lorraine), Fiammetta NAMER (ATILF, Université de Lorraine), Séverine CASALIS (URECA, Université Lille 3), Thierry HAMON (LIM&BIO, Université Paris 13), Thi Mai TRAN (STL, Université Lille 2). *********************************************************************** Neoclassical Compounding Special issue of the Verbum journal Guest Editors: Stéphanie Lignon and Fiammetta Namer Neoclassical Compounding Special issue of the Verbum journal Guest Editors: Stéphanie Lignon and Fiammetta Namer Among all the available morphological processes for lexical creation in languages, the neoclassical compounding involves specific models. Compounding is a constructional process during which at least two base lexemes are combined in order to construct a new lexeme (tea bag, timbre-poste, porte-bagage). Two types of compounding may be distinguished: standard compounding (also called popular) on the one hand which involves the modern vocabulary (porte-bagage), and neoclassical compounding on the other hand which involves lexemes borrowed from ancient languages, often Greek and Latin (coléoptère, anthropophage). Neoclassical compounding (also called in French “savante”, “érudite”, “infixation”, “confixation”, etc.) was first used to describe the creation of terms in specialized vocabularies, such as medicine, chemistry, zoology, botanics, etc. More recently however, this type of compounding also provides models for the creation of lexemes which do not belong to specialized vocabularies, but to the “general” language; e.g., contraintophobe, ferrovipathe, capillo-tracté, chronophage, théâtrolâtre, publivore, bobophile. Moreover, automatic identification of such lexemes is not obvious, while the affixed lexemes may be detected quite easily. We can mention several reasons for this situation: - the only segment shared by the neoclassical compounds is the binding vowel –o- (politicomédiatique, primoaccédant) or –i- (liberticide) occurring between the components; - the segment which follows the binding vowel is either a modern word (in French, English or in other languages) or a Greek or Latin element also present in other words of the modern language; - the Greek or Latin elements are not part of the modern lexicon of a given language (French, English...), while the modern words are. Hence, in addition to the linguistic modeling, the automatic processing of the neoclassical compounds also requires a specific treatment. The unsuspected success of the neoclassical compounding within the general language is our main motivation for this special issue dedicated to neoclassical compounding. Special attention will be paid to submissions which establish a link between corpus processing and formal models, within monolingual and multilingual contexts, in specialized areas or in general language. The call welcomes researchers from different areas, whatever their theoretical schools and trends: - linguistics: lexicon, terminology, morphology; - Natural Language Processing, - psycholinguistics (aspects related to the perception, language learning, language impairment, etc.). Important dates (deadline extension): - January 30th, 2013: Authors who would like to submit an article addressing these topics are invited to send their proposal consisting of two pages (plus references) with their publication project before January 15th, 2013. The abstract should not be programmatic but should clearly indicate its purpose and present the main results which will be developed in the article. - February 28th, 2013: Selection of the communications performed by the Scientific Committee and notifications sent to the authors. - June 30th, 2013: Reception of final versions of the articles, which should contain between 15 and 20 pages. The style sheet will be provided to the concerned authors with the acceptance notifications. Please send your submission to Stéphanie LIGNON (stephanie.lignon at univ-lorraine.fr) et Fiammetta NAMER (fiammetta.namer at univ-lorraine.fr) Scientific committee: Dany AMIOT (STL, Université Lille 3), Frédérique BRIN-HENRY (ATILF, Université de Lorraine), Georgette DAL (STL, Université Lille 3), Natalia GRABAR (STL, Université Lille 3), Nabil HATHOUT (CLLE, Université Toulouse-Le Mirail), Stéphanie LIGNON (ATILF, Université de Lorraine), Fiammetta NAMER (ATILF, Université de Lorraine), Séverine CASALIS (URECA, Université Lille 3), Thierry HAMON (LIM&BIO, Université Paris 13), Thi Mai TRAN (STL, Université Lille 2). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:20:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:20:37 +0100 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Wed, 12 Dec 2012 17:22:17 +0100 From: ELRA ELDA Information Message-ID: <50C8AF39.8030207 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1178 X-url: http://catalog.elra.info/product_info.php?products_id=1179 X-url: http://catalog.elra.info/product_info.php?products_id=1180 X-url: http://catalog.elra.info/product_info.php?products_id=1181 Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** ELRA is happy to announce that 4 new Written Corpora are now available in its catalogue. *ELRA-W0059 LT Corpus* The LT Corpus is composed of 70 fiction texts from Portuguese renowned authors. The corpus contains 1,781,083 tokens. The texts date from before 1940. The corpus is delivered in one file, in two different formats. The txt version has one sentence per line, an identification number for each text and no further annotation. The cqpweb file is one token per line, followed by pos tag and lemma, and is annotated for NP chunks. For more information, see: http://catalog.elra.info/product_info.php?products_id=1178 *ELRA-W0060 PTPARL Corpus* The PTPARL Corpus contains 1,076 texts consisting of adapted transcriptions of the Portuguese Parliament sessions. The corpus contains 1,000,441 tokens. The corpus is delivered in one file, in two different formats. The txt version has one sentence per line, an identification number for each text and no further annotation. The cqpweb file is one token per line, followed by pos tag and lemma, and is annotated for NP chunks. For more information, see: http://catalog.elra.info/product_info.php?products_id=1179 *ELRA-W0061 CINTIL-DependencyBank* The CINTIL-DependencyBank (Silva and Branco, 2012) is a corpus of sentences annotated with their syntactic dependency graphs and grammatical function tags composed of 10,039 sentences and 110,166 tokens taken from different sources and domains: news (8,861 sentences; 101,430 tokens), novels (399 sentences; 3,082 tokens). In addition, there are 779 sentences (5,654 tokens) that are used for regression testing of the computational grammar that supported the annotation of the corpus. For more information, see: http://catalog.elra.info/product_info.php?products_id=1180 *ELRA-W0062 CINTIL-DeepBank* The CINTIL-DeepBank (Branco et al., 2010) is a corpus of sentences annotated with their full-fledged deep grammatical representations, composed of 10,039 sentences and 110,166 tokens taken from different sources and domains: news (8,861 sentences; 101,430 tokens), and novels (399 sentences; 3,082 tokens). In addition, there are 779 sentences (5,654 tokens) used for regression testing of the computational grammar that supported the annotation of the corpus. For more information, see: http://catalog.elra.info/product_info.php?products_id=1181 For more information on the catalogue, please contact Valérie Mapelli (mapelli at elda.org) Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:21:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:21:25 +0100 Subject: Info: Newsletter du LPL numero 5 - dec. 2012 Message-ID: Date: Thu, 13 Dec 2012 10:27:58 +0100 From: Joëlle Lavaud Message-ID: <50C99F9E.2060405 at lpl-aix.fr> X-url: http://www.lpl.univ-aix.fr/fileadmin/template/NewsLetter/NL5.htm Bonjour, Nous avons le plaisir de vous envoyer le dernier numéro de la Newsletter du Laboratoire Parole et Langage, consultable en ligne : http://www.lpl.univ-aix.fr/fileadmin/template/NewsLetter/NL5.htm Nous vous souhaitons une bonne lecture. Cordialement, La cellule communication du LPL ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:23:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:23:59 +0100 Subject: Seminaire: Prochains seminaires CLLE-ERSS, Programme Message-ID: Date: Thu, 13 Dec 2012 11:45:13 +0100 From: mai hodac Message-ID: Vous trouverez ci-dessous la liste des prochains séminaires organisés par le laboratoire CLLE-ERSS à l'Université de Toulouse - le Mirail. Un programme plus détaillé est donnée sur la page du laboratoire http://w3.erss.univ-tlse2.fr/ -- manifestations *Jeudi 20 décembre 2012 : François Morlane-Hondère,* Université de Toulouse, CLLE-ERSS L'analyse distributionnelle automatique comme méthode d'observation des relations lexicales en contexte *Jeudi 10 janvier 2013 : Karine Duvignau,* Université de Toulouse, CLLE-ERSS De la métaphore au résumé de textes de vulgarisation scientifique : données et propositions *Jeudi 24 janvier 2013 : Laure-Anne Johnsen, *Universités de Neuchâtel et de Fribourg "Soi-disant qu'ils ont retrouvé le squelette de la Joconde". Le clitique ils à référence indéterminée : une construction impersonnelle ? Précédé d'une petite introduction au Corpus OFROM : corpus oral de français de Suisse romande *Jeudi 7 février 2013 : Marleen Van Peteghem*, Université de Gand « Même » : de l'identité à la focalisation *Jeudi 21 février 2013 : Elise Leroy,* Websourd et chargée de mission à l'Université de Toulouse, CETIM Didactique de la Langue des signes française, langue 1. Reconnaître les enseignants sourds et construire une discipline. *Jeudi 14 mars 2013 : Christian Rétoré,* Université de Bordeaux 1, LaBRI (délégation CNRS à l'IRIT) Un cadre logique commun pour la sémantique compositionnelle et la pragmatique lexicale Application au voyageur virtuel *Jeudi 28 mars 2013 : Sophie Rosset,* LIMSI Accords inter-annotateurs dans une campagne d'annotation : de la théorie à la pratique ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:27:07 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:27:07 +0100 Subject: Appel: ESSLLI Student Session 2013 Message-ID: Date: Fri, 14 Dec 2012 16:02:27 +0100 From: Margot Colinet Message-ID: X-url: http://stus2013.loriweb.org/ X-url: http://esslli2013.de/ First Call for Papers ESSLLI 2013 STUDENT SESSION Held during The 25th European Summer School in Logic, Language and Information Düsseldorf, Germany, August 5-16, 2013 Deadline for submissions: April 1st, 2013 https://www.easychair.org/conferences/?conf=essllistus2013 *ABOUT*: The Student Session of the 25th European Summer School in Logic, Language, and Information (ESSLLI) will take place in *Düsseldorf, Germany on August 5-16, 2013*. We invite submissions of original, unpublished work from students in any area at the intersection of Logic & Language, Language & Computation, or Logic & Computation. Submissions will be reviewed by several experts in the field, and accepted papers will be presented orally or as posters and will appear in the student session proceedings in Springer. This is an excellent opportunity to receive valuable feedback from expert readers and to present your work to a diverse audience. *A SEPARATE POSTER SESSION*: Note that this year there are two separate kinds of submissions, one for the oral presentations and one for the posters. This means that papers can be directly submitted as posters. Reviewing and ranking will be done separately. We particularly encourage submissions for posters. More detailed guidelines regarding submission can be found on the Student Session website: http://stus2013.loriweb.org/, (links to previous years' proceedings are also available there). Please direct inquiries about submission procedures or other matters relating to the Student Session to margotcolinet at gmail.com For general inquiries about ESSLLI 2013, please consult the main ESSLLI 2013 page, http://esslli2013.de/. Kind regards, *The ESSLLI 2013 Student Session Organization Committee*, Chair: Margot Colinet (Université Paris Diderot-Paris 7) LOCO (LOgic and Computation) co-chairs: Ronald de Haan (Technische Universität Wien) Michał Zawidzki (Uniwersytet Łódzki) LOLA (LOgic and LAnguage) co-chairs: Agata Renans (Universität Potsdam) Barbara Tomaszewicz (University of Southern California) LACO (LAnguage and Computation) co-chairs: Pierre Bourreau (Heinrich-Heine-Universität Düsseldorf) Julia Zinova (Heinrich-Heine-Universität Düsseldorf) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:32:21 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:32:21 +0100 Subject: Conf: Colloque international La langue, la voix, la parole, La Sorbonne, Paris, 17-18 janvier 2013 Message-ID: Date: Fri, 14 Dec 2012 01:45:58 +0000 (GMT) From: Amr Ibrahim Message-ID: <1355449558.93353.YahooMailNeo at web171302.mail.ir2.yahoo.com> X-url: http://www.cereli.fr Équipe d’Accueil 4509 – STIH CRL Sens, Textes, Informatique, Histoire Cellule de Recherche en Linguistique La langue, la voix, la parole Colloque international À la Sorbonne Jeudi 17 & Vendredi 18 janvier 2013 Salle J-636 Programme Jeudi 9h – 9h30 – Accueil Sous la présidence de Claire Martinot (Paris-Sorbonne) 9h 30 – 9h 45 – Allocution d’ouverture – Joëlle Ducos – Directrice de l’Équipe Sens Textes Informatique Histoire 9h45 – 10h30 Quand la prosodie précède le sens : de la contagion musicale à la didactique des langues Branka Zei Pollermann – Vox Institute – Genève Pause 11h00 – 11h 45 Les mélodies des sens : la variété prosodique des modalités en italien Domenico Di Russo – Universita Gabriele D’Annunzio - Chieti-Pescara 11h45 – 12h30 Voix et genre : un état de la question Erwan Pépiot – Université Paris 8 Repas Sous la présidence de Ross Charnock (Paris-Dauphine) 14h30 – 15h 15 Des deux phases cruciales dans la traduction des contes wolof Omar Diop – Université de Caen Basse Normandie – Caen 15h15 - 16h 00 De la voix au voisement – étude acoustique, articulatoire et acquisition des consonnes sonantes en polonais et en français Jagoda Bruni – Universität Stuttgart – Stuttgart Pause 16h30 – 17h15 Travail de la voix dans la langue : le cas de la prononciation du Français langue étrangère Claire Pillot-Loiseau – CNRS & Université Paris 3 Sorbonne Nouvelle 17h15 – 18h 00 La voix de l’enseignant de FLE : une voix pragmatique ? Malak Moustapha-Sabeur – Université de Carthage – Tunis Vendredi Sous la présidence de Dardo De Vecchi (Euromed - Marseille) 9h00 – 9h 45 « Que Diable est cecy ? » : langue, voix parole dans les « romans » de Rabelais Julien Ludovic Lebreton – Université Paris-Sorbonne 9h45 – 10h30 L’être langue, le chant du corps. Les pratiques glossolaliques d’Antonin Artaud Sébastien Lemporte – Université de Franche-Comté – Besançon Pause 11h00 – 11h45 « Il n’y a point de passion si babillarde que la joie » : détour historique pour réfléchir aux enjeux actuels de la recherche sur la « prosodie affective » Sarah Nancy – Université Paris-Sorbonne nouvelle 11h 45 – 12h 30 La voix : lieu commun de mémoire Rosine Schautz – Smith College – Genève Repas Sous la présidence de Clara Romero (Paris-Descartes) 14h30 – 15h 15 La structure prosodique dynamique : dernière (re)structuration avant énonciation Philippe Martin – Université Paris 7 Denis Diderot 15h15 – 16h 00 Humain / non-humain : la construction de l’altérité par la voix dans le cinéma américain de science-fiction depuis 1950 Coralie Vincent – CNRS & Université Paris 8 Pause 16h30 – 17h 15 Pourquoi la voix réunit-elle toutes les dimensions de la prédication ? Amr Helmy Ibrahim – Université de Franche-Comté & Université Paris-Sorbonne 18h 30 à 19h30 - Amphithéâtre Edgar Quinet (46 rue Saint-Jacques) Passages Évelyne Saunier (chant) & Jérôme Lefebvre (guitare) Dans un répertoire allant du 17^e au 20^e siècle, avec des arrangements originaux ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:34:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:34:39 +0100 Subject: These: Hai-Son Le, Modeles neuronaux pour la modelisation statistique de la langue Message-ID: Date: Fri, 14 Dec 2012 11:40:08 +0100 From: Alexandre Allauzen Message-ID: <50CB0208.7050203 at limsi.fr> Bonjour à toutes et à tous, c'est avec grand plaisir que je vous convie à ma soutenance de thèse jeudi 20 décembre 2012 à 14h en salle de conférences du Bâtiment S, LIMSI. Cette thèse s'intitule: Modèles neuronaux pour la modélisation statistique de la langue (Continuous Space Neural Network Models in Natural Language Processing) Le jury est composé de : Rapporteurs: Laurent BESACIER, Professeur, Université Joseph Fourier Holger SCHWENK, Professeur, Université du Maine Examinateurs: Yoshua BENGIO, Professeur, Université de Montréal Hermann NEY, Professeur, RWTH Aachen Michèle SEBAG, Directrice de recherche, LRI & Université Paris Sud Encadrants de thèse: François YVON, Professeur, LIMSI-CNRS & Université Paris Sud Alexandre ALLAUZEN, Maitre de Conférences, LIMSI-CNRS & Université Paris Sud Je serais également ravi de vous voir au pot qui suivra. Cordialement Hai-Son LE Abstract The purpose of language models is in general to capture and to model regularities of language, thereby capturing morphological, syntactical and distributional properties of word sequences in a given language. They play an important role in many successful applications of Natural Language Processing, such as Automatic Speech Recognition, Machine Translation and Information Extraction. The most successful approaches to date are based on n-gram assumption and the adjustment of statistics from the training data by applying smoothing and back-off techniques, notably Kneser-Ney technique, introduced twenty years ago. In this way, language models predicts a word based on its n-1 previous words. In spite of their prevalence, conventional n-gram based language models still suffer from several limitations that could be intuitively overcome by consulting human expert knowledge. One critical limitation is that, ignoring all linguistic properties, they treat each word as one discrete symbol with no relation with the others. Another point is that, even with a huge amount of data, the data sparsity issue always has an important impact, so the optimal value of n in the n-gram assumption is often 4 or 5 which is insufficient in practice. This kind of model is constructed based on the count of n-grams in training data. Therefore, the pertinence of theses models is conditioned only on the characteristics of the training text (its quantity, its representation of the content in terms of theme, date). Recently, one of the most successful attempt that tries to directly learn word similarities is to use distributed word representations in language modeling, where distributionally words, which have semantic and syntactic similarities, are expected to be represented as neighbors in a continuous space. These representations and the associated objective function (the likelihood of the training data) are jointly learned using a multi-layer neural network architecture. In this way, word similarities are learned automatically. This approach has shown significant and consistent improvements when applied to automatic speech recognition and statistical machine translation tasks. A major difficulty with the continuous space neural network based approach remains the computational burden, which does not scale well to the massive corpora that are nowadays available. For this reason, the first contribution of this dissertation is the definition of a neural architecture based on a tree representation of the output vocabulary, namely Structured OUtput Layer (SOUL), which makes them well suited for large scale frameworks. The SOUL model combines the neural network approach with the class-based approach. It achieves significant improvements on both state-of-the-art large scale automatic speech recognition and statistical machine translations tasks. The second contribution is to provide several insightful analyses on their performances, their pros and cons, their induced word space representation. Finally, the third contribution is the successful adoption of the continuous space neural network into a machine translation framework. New translation models are proposed and reported to achieve significant improvements over state-of-the-art baseline systems. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:36:45 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:36:45 +0100 Subject: Job: Two salaried PhD positions in Machine Translation at Wolverhampton Message-ID: Date: Fri, 14 Dec 2012 11:25:19 +0000 From: "Maarouf, Ismall" Message-ID: <6B982DE0E1760848ABA8A809FFD806DFC94E82 at EXCHMBX10X03.unv.wlv.ac.uk> X-url: http://clg.wlv.ac.uk/ X-url: http://ec.europa.eu/research/participants/portal/download?docId=31562 X-url: http://expert-itn.eu TWO SALARIED PHD POSITIONS IN MACHINE TRANSLATION AT UNIVERSITY OF WOLVERHAMPTON- Marie Curie ITN project EXPERT ------ Applications are invited for two three-year Early Stage Researcher pre-doctoral positions in hybrid language translation technologies. The positions are part of the new EU Framework 7 Marie-Curie Network EXPERT, concerned with the exploitation of empirical approaches to machine translation, including statistical machine translation and example-based machine translation. The EXPERT project brings together researchers from six European universities (University of Wolverhampton (UoW), University of Sheffield (USFD), Universidad de Malaga (UMA), Universitaet des Saarlandes (USAAR), Dublin City University (DCU) and Universiteit van Amsterdam (UvA)) and five translation services and technology providers (Pangeanic, Hermes and Translated, Celer Soluciones and WordFast). The two projects allocated to the University of Wolverhampton are : 1). Use of language technology to improve matching & retrieval in translation memories; 2). Investigation of methodologies to evaluate the improved SMT, EBMT and TM prototypes and new hybrid computer-aided translation technology proposed in EXPERT. The research will be conducted under supervision of University of Wolverhampton with opportunities for collaborative work with other universities and industrial partners in EXPERT, and with the expectation of a 6 month secondment to 2-3 partners in this project based on the topic of research. This is an opportunity to work in a well-connected international team with world-leading reputation in the Natural Language Processing (NLP). The Research Group in Computational Linguistics (http://clg.wlv.ac.uk/) is considered one of the top performers in UK research. SALARY ------ The successful individual will be employed as a salaried researcher while studying towards his/her PhD. Salary rates and additional mobility, career and travel allowances are as per the Marie Curie programme (see Annex 3 of this document http://ec.europa.eu/research/participants/portal/download?docId=31562, page 69). For employment in the UK, the reference figure for gross salary is 51,062 euros/year. The post is fixed term for three years with a start date of 1 February 2013 or soon after. REQUIREMENTS & ELIGIBILITY ------ Appointment will be subject to the eligibility requirements of the Marie Curie programme, which specify that early stage researchers must be, at the time of recruitment, in the first four years of their research careers, measured from the date when they obtained the qualification which would entitle them to embark on a doctorate. Please check Section III.3 of the following link for further information on the Marie Curie scheme regarding eligibility criteria: ftp://ftp.cordis.europa.eu/pub/fp7/docs/fp7-mga-annex3intramulti_en.pdf . In particular, candidates cannot have lived in the country of their chosen host university for more than 12 months in the 3 years immediately prior to their appointment. Applicants should hold a good honours degree in a relevant field of study (e.g. computer science, engineering, mathematics) and have experience in natural language processing, machine translation or related area. They should also have a solid background in mathematics/statistics and excellent programming skills (C/C++, Java, Python/Perl, etc.). See the job specification for more details on the expected profile: https://jobs.wlv.ac.uk/wd/plsql/wd_portal.list?p_web_site_id=3045&p_function=map&p_title=Current%20vacancies HOW TO APPLY ------ The application process consists of two compulsory stages: - Stage 1: Register and fill in the application form on the EXPERT website (http://expert-itn.eu/). You will receive a reference number and confirmation. - Stage 2: Use the application system of the University of Wolverhampton (https://jobs.wlv.ac.uk/wd/plsql/wd_portal.list?p_web_site_id=3045&p_function=map&p_title=Current%20vacancies), please make sure to include: . Detailed CV; . A copy of your confirmation from the expert-itn.eu; . 2 page summary on the research to be undertaken on the chosen topic. It should include, but is not limited to, a). aim of the research; b). general research question to be refined during the Phd; c). research plan; d). why do have necessary skills to undertake this project? Closing date: 11 January 2013 More information can be found at http://expert-itn.eu ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:40:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:40:57 +0100 Subject: Appel: CLA 2013 Message-ID: Date: Fri, 14 Dec 2012 23:28:53 +0100 From: CLA Organizers Message-ID: X-url: http://www.cla-conf.info CONFERENCE NEXT EDITION We wanted to convey the message that we continue to work on the next edition of the conference, which will take place probably in October 2013 (in Poland). More information will appear on the website: http://www.cla-conf.info. Already we encourage you to participate. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:41:11 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:41:11 +0100 Subject: Livre: Computational Linguistics Message-ID: Date: Fri, 14 Dec 2012 23:28:53 +0100 From: CLA Organizers Message-ID: X-url: http://www.cla-conf.info FIRST CLA BOOK! Taking this opportunity we would like to inform you that the Springer has published extended versions of selected papers submitted to our conferences so far in "Computational Linguistics Applications" book. Book Title: Computational Linguistics Book Subtitle: Applications Copyright: 2013 DOI: 10.1007/978-3-642-34399-5 Print ISBN: 978-3-642-34398-8 Online ISBN: 978-3-642-34399-5 Series Title: Studies in Computational Intelligence Series Volume: 458 Series ISSN: 1860-949X Publisher: Springer Berlin Heidelberg Copyright Holder: Springer-Verlag Berlin Heidelberg Editors: Adam Przepiorkowski, Maciej Piasecki, Krzysztof Jassem, Piotr Fuglewicz Book preview: http://link.springer.com/book/10.1007/978-3-642-34399-5/page/1 About this book: * Latest research on Computational Linguistics * Written by leading experts in the field The ever-growing popularity of Google over the recent decade has required a specific method of man-machine communication: human query should be short, whereas the machine answer may take a form of a wide range of documents. This type of communication has triggered a rapid development in the domain of Information Extraction, aimed at providing the asker with a more precise information. The recent success of intelligent personal assistants supporting users in searching or even extracting information and answers from large collections of electronic documents signals the onset of a new era in man-machine communication - we shall soon explain to our small devices what we need to know and expect valuable answers quickly and automatically delivered. The progress of man-machine communication is accompanied by growth in the significance of applied Computational Linguistics - we need machines to understand much more from the language we speak naturally than it is the case of up-to-date search systems. Moreover, we need machine support in crossing language barriers that is necessary more and more often when facing the global character of the Web. This books reports on the latest developments in the field. It contains 15 chapters written by researchers who aim at making linguistic theories work - for the better understanding between the man and the machine. ************************************************************* Table of contents (15 chapters) I) NLP Toolkits 1) Using HFST for Creating Computational Linguistic Applications Authors: Krister Linden, Erik Axelson, Senka Drobac, Sam Hardwick, Miikka Silfverberg 2) PSI-Toolkit: A Natural Language Processing Pipeline Authors: Filip Graliński, Krzysztof Jassem, Marcin Junczys-Dowmunt 3) Fextor: A Feature Extraction Framework for Natural Language Processing: A Case Study in Word Sense Disambiguation, Relation Recognition and Anaphora Resolution Authors: Bartosz Broda, Paweł Kędzia, Michał Marcińczuk, Adam Radziszewski, Radosław Ramocki II) Information Extraction 4) Automatic Construction of a Dynamic Thesaurus for Proper Names Authors: Roman Kurc, Maciej Piasecki, Stan Szpakowicz 5) A Multilingual Integrated Framework for Processing Lexical Collocations Authors: Violeta Seretan 6) An Approach to Efficient Processing of Multi-word Units Authors: Cvetana Krstev, Ivan Obradovic, Ranka Stankovic, Dusko Vitas 7) PRALED - A New Kind of Lexicographic Workstation Authors: Ales Horak, Adam Rambousek 8) Multidimensional and Multimodal Information in EcoLexicon Authors: Pilar Leon-Arauz, Arianne Reimerink, Pamela Faber 9) Techniques for Multilingual Security-Related Event Extraction from Online News Authors: Martin Atkinson, Mian Du, Jakub Piskorski, Hristo Tanev, Roman Yangarber 10) Automatic Metadata Generation in an Archaeological Digital Library: Semantic Annotation of Grey Literature Authors: Andreas Vlachidis, Ceri Binding, Keith May, Douglas Tudhope 11) Towards Automatic Detection of Various Types of Prominence in Read Aloud Russian Texts Authors: Nina Volskaya, Daniil Kocharov, Pavel Skrelin, Ekaterina Shumovskaya III) Multilinguality 12) Translation Ambiguity Resolution Using Interactive Contextual Information Authors: Farag Saad, Andreas Nurnberger 13) Machine Translation at Work Authors: Aljoscha Burchardt, Cindy Tscherwinka, Eleftherios Avramidis, Hans Uszkoreit 14) Anubis - Speeding Up Computer-Aided Translation Authors: Rafał Jaworski 15) Incorporating Subject Areas into the Apertium Machine Translation System Authors: Jordi Duran, Lluis Villarejo, Mireia Farrus, Sergio Ortiz, Gema Ramirez ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From zilles at CS.UREGINA.CA Mon Dec 17 22:47:43 2012 From: zilles at CS.UREGINA.CA (Sandra Zilles) Date: Mon, 17 Dec 2012 16:47:43 -0600 Subject: Call For Papers - Canadian AI Conference 2013 Message-ID: ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Apologies for cross-posting. Please distribute widely. ======================= Final Call for Papers =========================== AI 2013: The 26th Canadian Conference on Artificial Intelligence www.canadianai.ca May 28th to May 31st, 2013 Regina, Saskatchewan, Canada ================================================================================== IMPORTANT DATES --------------- Full paper submission deadline: January 21st, 2013 Notification of acceptance: February 25th, 2013 Final papers due: March 6th, 2013 Conference: May 28th to May 31st, 2013 CALL FOR PAPERS --------------- AI'2013, the twenty-sixth Canadian Conference on Artificial Intelligence, invites papers that present original work in all areas of Artificial intelligence, either theoretical or applied. Topics of interest include, but are not limited to: • Agent Systems AI Applications Automated Reasoning Bioinformatics and BioNLP • Case-based Reasoning • Cognitive Models • Constraint Satisfaction • Data Mining • E-Commerce • Evolutionary Computation • Games • Information Retrieval • Knowledge Representation • Machine Learning • Multi-media Processing • Natural Language Processing • Neural Nets • Planning • Robotics • Search • Smart Graphics • Uncertainty • User Modeling • Web Applications Each paper will be reviewed by at least three Program Committee members according to its originality, technical merit and clarity of presentation. Accepted papers will be allocated either a maximum of 12 pages (long papers) or a maximum of 7 pages (short papers) in the proceedings. As in previous years, we plan to publish all accepted papers for which one of the authors will have registered and is present at the conference in the conference proceedings as Lecture Notes in Artificial Intelligence by Springer. The papers will have to be formatted accordingly. Each accepted paper (long or short) will be allocated a presentation slot at the conference, where the presentations for short papers will be shorter in time. Poster presentations of accepted papers will be welcome. Papers submitted to AI'2013 must not have been accepted for publication elsewhere or be under review for another conference. BEST PAPER AWARD ---------------- The Best Paper Award will be presented at the conference to the authors of the best paper. SUBMISSIONS ----------- Authors are invited to submit electronically, by January 21st, 2013. Submissions must be uploaded on Easychair, following this link: https://www.easychair.org/conferences/?conf=ai2013 Paper format: • Papers must be written in English. • All submissions must be up to 7 pages in length for short papers, and 8-12 pages for long papers. • Papers must be in PDF format. • Papers must be formatted according to Springer LNCS style. The use of the LaTeX2e style file available from Springer is strongly encouraged. For guidelines on the preparation of papers see here: http://www.canadianai.ca/AI_2013/Submission/index.html ORGANIZERS ---------- AI'2013 is collocated with two cognate conferences: the Canadian Graphical Interface Conference and the Canadian Conference on Computer and Robot Vision. General Co-chairs AI/GI/CRV: Cory Butz (University of Regina) Atefeh Farzindar (NLP Technologies Inc.) Program Co-chairs: Osmar Zaiane (University of Alberta) Sandra Zilles (University of Regina) Local Arrangement Chair: Orland Hoeber (University of Regina) Program Committee: The list of program committee members so far includes the following names: Reda Alhajj, Xiangdong An, Aijun An, John Anderson, Wolfgang Banzhaf, Denilson Barbosa, Andre Barreto, Sabine Bergler, Giuseppe Carenini, Yllias Chali, Colin Cherry, Cristina Conati, Joerg Denzinger, Ralph Deters, Michael Fleming, Gosta Grahne, Kevin Grant, Marek Grzes, Howard Hamilton, Robert Hilderman, Robert Holte, Michael Horsch, Frank Hutter, Vlado Keselj, Grzegorz Kondrak, Anthony Kusalik, Laks Lakshmanan, Marc Lanctot, Guy Lapalme, Kate Larson, Levi Lelis, Carson Leung, Daniel Lizotte, Cristina Manfredotti, Stan Matwin, Sheila McIlraith, Martin Memmel, Robert Mercer, Evangelos Milios, Gabriel Murray, Jeff Orchard, Lourdes Pena-Castillo, Gerald Penn, David Poole, Fred Popowich, Doina Precup, Michael Richter, Rafael Schirru, Ben Steichen, Csaba Szepesvari, Peter Van Beek, Paolo Viappiani, Asmir Vodencarevic, Osmar Zaiane, Harry Zhang, Sandra Zilles Please mark the dates in your calendar. We hope to receive your submissions and see you at the conference. ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ -------------- next part -------------- An HTML attachment was scrubbed... URL: From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:07:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:07:28 +0100 Subject: Livre: L'Heterogene a l'=?WINDOWS-1252?Q?=9Cuvre_?=dans la langue et les discours. Hommage a Jacqueline Authier-Revuz Message-ID: Date: Mon, 17 Dec 2012 13:30:04 +0100 From: Alice Krieg-Planque Message-ID: <50CF104C.5080408 at club-internet.fr> X-url: http://www.lambert-lucas.com//index.php?l_nr=ok_dp.php&l_nr_c=783f3d95a940e0c783abc3847e9ae6df&i=173 Vient de paraître : titre : L'Hétérogène à l'œuvre dans la langue et les discours. Hommage à Jacqueline Authier-Revuz textes réunis et présentés par Sonia Branca-Rosoff, Claire Doquet, Julie Lefebvre, Evelyne Oppermann-Marsaux, Sabine Pétillon et Frédérique Sitri Editions Lambert-Lucas (Limoges) 2012 436 pages 36 euros ISBN 978-2-35935-049-4 Quatrième de couverture : Elèves, collègues et amis de Jacqueline Authier-Revuz, nous avons souhaité lui rendre hommage en lui offrant ce livre. Nous avons ainsi tenu à lui exprimer collectivement notre amitié et notre admiration et à montrer à quel point ses travaux et son enseignement inspirent et orientent nos propres réflexions. Ce volume est aussi l'occasion de donner la parole à un courant représentatif d'une tendance de la linguistique contemporaine qui, traversant des domaines aussi variés que la grammaire, l'analyse du discours, l'histoire de la langue, la critique génétique, l'étude de l'oral, l'étude de l'écrit, et jetant même des ponts vers des terres voisines (analyse des textes littéraires, psychanalyse) s'organise autour de deux convictions : tout d'abord, la nécessité au cœur de la pratique linguistique de distinguer les deux ordres de la langue et du discours en refusant la disparition de l'un au profit de l'autre ; ensuite le caractère central accordé, à la suite de Benveniste, au métalangage ordinaire, envisagé comme une dimension constitutive du langage humain : les choix mêmes d'objets – les commentaires méta-énonciatifs, le discours rapporté – touchent crucialement à la question centrale du sujet dans son rapport à sa propre énonciation et à celle des autres. Sommaire : Sonia BRANCA-ROSOFF, Claire DOQUET, Julie LEFEBVRE, Evelyne OPPERMAN-MARSAUX, Sabine PETILLON, Frédérique SITRI. Une écriture du rayonnement Bibliographie de Jacqueline Authier-Revuz Michel ARRIVE. Ce qui faire rire le linguiste, ou Du métalangage chez Saussure Fernando HARTMANN. Le sujet n'est pas un objet Jean-Michel ADAM. Arrêt-sur-mot et narrativisation d'un concept : le "pénitentialisme" de la CIA et les /Trois Petits Cochons/ Alice KRIEG-PLANQUE. La "novlangue" : une langue imaginaire au service de la critique du "discours autre" Eni PUCCINELLI ORLANDI. Un corpus textuel ? Claire DOQUET. Ordre scriptural et boucles (méta-)énonciatives : remords, reprises, retours dans l'écriture Catherine BORE. Le discours direct dans des écrits fictionnels scolaires : marques et significations Irène FENOGLIO. "L'axiologie du langage et le langage de l'axiologie" : notes manuscrites pour un article en cours du travail d'E. Benveniste Marie-Christine LALA. Fonder l'énonciation : de la grammaire à la linguistique Michèle NOAILLY. Les jugements mitigés : le cas de /plus ou moins/ Evelyne OPPERMANN-MARSAUX. L'interjection /allez/ comme marque de désapprobation du discours d'autrui : approche diachronique Sonia BRANCA-ROSOFF et Bertrand VERINE. Le discours direct et ses limites : l'asymétrie de la frontière gauche et de la frontière droite Bernard COMBETTES. Aspects de la ponctuation par le tiret au XIXe siècle : l'exemple de /L'Insu//rgé/ de Jules Vallès Patrick DENDALE. Le conditionnel "journalistique", marqueur de modalisation en discours second : éléments d'archéologie grammaticale Caroline MELLET. Analyse discursive d'un dialogue institutionnel : discours direct et dialogisme dans les questions au gouvernement Frédérique SITRI. Formes de RDA et genres : les formes du discours direct dans les récits de cure Patricia von MUNCHOW. Elever l'enfant, une affaire de parole : la représentation du discours autre dans les guides parentaux français et allemands Dóris CUNHA. Formes et degrés d'orientation dialogique, genre et point de vue Simone DELESALLE et Francine MAZIERE. Les façons de rapporter et l'interdiscursivité au fondement de la construction du français Philippe SCHEPENS. Prolégomènes à l'analyse d'un journal écrit sous l'Occupation : Qui parle ? Stéphane BIKIALO. Coïncidences du dire : Jacqueline Authier-Revuz et Bernard Noël Alma BOLON. "L'Inconnue" (Villiers de l'Ile-Adam) et /La Cara de la desgracia/ (J.C. Onetti) : la parole de la surdité Catherine RANNOUX. Bribes de voix, fragments de vie : /Ce que j'appelle oubli/, de Laurent Mauvignier Laurence ROSIER. /Comme elles disent/ : femmes d'écriture réflexives (Colette, Annie Ernaux, Marie Darrieusecq) France VERNIER. Ce que citer veut dire : Annie Ernaux et le langage de l'autre monde Sabine PETILLON. Analyse de linguistique génétique et publication d'un poème de Nancy Huston Index des notions Index des auteurs Site éditeur, avec table des matières à télécharger : http://www.lambert-lucas.com//index.php?l_nr=ok_dp.php&l_nr_c=783f3d95a940e0c783abc3847e9ae6df&i=173 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:04:21 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:04:21 +0100 Subject: Stage: Maquettage d'un systeme d'interaction avec des connaissances linguistiques Message-ID: Date: Sun, 16 Dec 2012 18:11:09 +0100 (CET) From: Maxime Lefrançois Message-ID: <921868106.17465600.1355677869186.JavaMail.root at inria.fr> Proposition de stage Master/Ingénieur: Maquettage d'un système d'interaction avec des connaissances linguistiques. Sujet: Ce stage à dominante IHM et Ergonomie Logicielle s'effectuera au sein de l'équipe WIMMICS [1] de l'Inria Sophia-Antipolis. Les linguistes du projet RELIEF [2] développent une ressource lexicale de nouvelle génération - le Réseau Lexical du Français (RLF) - en accord avec la théorie Sens-Texte [3]. Pour le moment, le logiciel d'édition développé pour le projet RELIEF, MVS Dicet, ne permet pas de représenter les définitions des mots aussi formellement que le voudrait la théorie Sens-Texte. Or une telle formalisation est aujourd'hui nécessaire pour faciliter le travail des linguistes et accélérer l'élaboration du RLF. L'équipe WIMMICS s'inspire des Graphes Conceptuels [4], de la Théorie Sens-Texte et des Grammaires de Dépendances [5], pour développer le nouveau formalisme mathématique des Graphes d'Unités [6], qui a pour but de permettre la formalisation des définitions, et plus généralement la représentation et la manipulation de connaissances linguistiques à base de graphes et de règles. Ce stage s'insère donc en amont du développement de deux prototypes d'éditeurs: un prototype d'éditeur permettant l'interaction avec des objets du formalisme générique, et un prototype d'extension du logiciel d'édition lexicographique Mvs Dicet développé pour le projet RELIEF. Objectifs: L'objectif de ce stage est de proposer des scénarios d'interaction avec les objets de base du formalisme des graphes d'unités, et de maquetter un prototype d'éditeur. Durée, lieu: 4-6 mois, rémunérés, au sein de l'équipe WIMMICS [1] de l'Inria Sophia-Antipolis. Profil souhaité: Ce stage s'adresse en priorité à des étudiant en Ingénieur / Master, avec une dominante IHM et Ergonomie Logicielle. Un intérêt pour les Graphes Conceptuels et/ou le traitement du langage est un plus. Contacts et envoi des candidatures: Maxime Lefrançois, maxime.lefrancois[at]inria.fr, Alain Giboin, alain.giboin[at]inria.fr Pointeurs [1] http://wimmics.inria.fr [2] Projet RELIEF, Réseau Lexical du Français, et Bibliographie de référence http://www.atilf.fr/spip.php?article908 [3] http://en.wikipedia.org/wiki/Meaning%E2%80%93text_theory [4] http://en.wikipedia.org/wiki/Conceptual_graph [5] http://en.wikipedia.org/wiki/Dependency_grammar [6] http://maxime-lefrancois.info ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:10:38 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:10:38 +0100 Subject: Cursus: Programme de Master international, Erasmus Mundus Message-ID: Date: Mon, 17 Dec 2012 15:01:30 +0100 From: Sylvain Pogodalla Message-ID: <20687.9658.348558.267940 at caussimon.loria.fr> X-url: http://lct-master.org X-url: http://ec.europa.eu/education/external-relation-programmes/mundus_en.htm X-url: http://eacea.ec.europa.eu/erasmus_mundus/ À diffuser auprès des étudiants qui souhaitent faire un master Le programme Erasmus Mundus en "Language and Communication Technologies" (EMMLCT) http://lct-master.org invite les étudiants *européens* et *non européens* à postuler à la participation à ce programme pour l'automne 2013. *La date limite de candidature est le 1er janvier 2013.* *Informations importantes* + enseignement en anglais + durée: 2 ans + chaque année d'étude dans un établissement partenaire différent + spécialisation dans les méthodes et technologies de l'informatique linguistique + bourses d'études du programme Erasmus Mundus de l'Union Européenne, *y compris pour les étudiants européens* *Le programme EMMLCT est proposé par le consortium d'universités* 1. Saarland University in Saarbruecken, Germany (coordinator) 2. University of Trento, Trento, Italy 3. University of Malta, Malta 4. University of Lorraine, Nancy, France 5. Charles University, Prague, Czech Republic 6. Rijksuniversiteit Groningen, The Netherlands 7. Shanghai Jiao Tong University, China 8. The University of Melbourne, Australia L'Université du pays Basque / Euskal Herriko University, San Sebastian, Spain participe également comme partenaire associé. *Le programme EMMLCT en bref* Le programme EMMLCT est un Master international. Le programme propose d'étudier chacune des deux années dans une université différente du consortium. Lorsque les conditions ont été remplies, les étudiants obtiennent deux Masters qui ont une reconnaissance nationale dans chacun des pays d'études. Les cours comprennent des modules fondamentaux obligatoires ainsi que des modules avancés en technologies du langage et de la communication et en informatique, un projet optionnel, et la rédaction d'un mémoire de Master. Le programme vise à donner aux étudiants des compétences et des perspectives sur les disciplines variées qui contribuent aux méthodes utilisées dans les technologies du langage et de la communication et à renforcer leur connaissance des méthodes scientifiques. De plus, les étudiants acquièrent des connaissances pratiques en choisissant une combinaison de modules en technologie du langage, en linguistique informatique et théorique, et en informatique. Le programme EMMLCT a été défini pour prendre en compte les demandes de l'industrie et de la recherche dans le domaine des technologies des langues. Il offre des perspectives d'apprentissage et de formation Le programme EMMLCT est approuvé et soutenu par le programme Erasmus Mundus de l'Union Européenne. Pour plus d'information : http://ec.europa.eu/education/external-relation-programmes/mundus_en.htm http://eacea.ec.europa.eu/erasmus_mundus/. *Candidatures* Tous les candidats doivent satisfaire les conditions suivantes : 1. Avoir une Licence (ou un diplôme équivalent) en informatique, linguistique, informatique linguistique, sciences cognitives, mathématiques, intelligence artificielle ou tout autre discipline pertinente. Ce diplôme doit avoir été obtenu avant le début des cours du master EMMLCT. 2. Compétences linguistiques : pour les étudiants dont la langue maternelle n'est pas l'anglais, un certificat d'aptitude en anglais, langue d'enseignement, est requis (TOEFL, IELTS, Cambridge certificate, etc.) Les candidatures se font en ligne. Plus d'information et les instructions pour la candidature se trouvent à : http://lct-master.org Adresse pour de plus amples informations : lct-info at coli.uni-sb.de Coordination du programme : Prof. Hans Uszkoreit Dr. Ing. Ivana Kruijff-Korbayova Department of Computational Linguistics and Phonetics Saarland University Saarbruecken, Germany http://lct-master.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:12:02 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:12:02 +0100 Subject: Revue: CORELA, vol. 10, num. 2 Message-ID: Date: Tue, 18 Dec 2012 11:30:02 +0100 From: Gilles Col Message-Id: X-url: http://corela.edel.univ-poitiers.fr/index.php?id=2742 X-url: http://corela.edel.univ-poitiers.fr/index.php?id=2743 X-url: http://corela.edel.univ-poitiers.fr/index.php?id=2762 Chers collègues, L'équipe éditoriale de la revue CORELA - Cognition / Représentation / Langages a le plaisir de vous annoncer la publication de son dernier numéro (vol. 10, num. 2): http://corela.edel.univ-poitiers.fr/index.php?id=2742 Les propositions de publication pour le prochain numéro de la revue (vol. 11, num. 1) sont à envoyer à Gilles Col (gilles.col at univ-poitiers.fr) avant le 31 mars 2013. Sommaire du numéro: Pi Hsia HUNG. "L'acquisition de l'expression de la spatialité en mandarin langue étrangère par des apprenants francophones" http://corela.edel.univ-poitiers.fr/index.php?id=2743 Bachir BESSAI. "Plurilinguisme et insécurité linguistique en Algérie : Paroles de lycéen (né)s à Bejaïa". http://corela.edel.univ-poitiers.fr/index.php?id=2762 Nous vons informons par ailleurs que la revue CORELA sera adhérente de Revue.org à compter de la rentrée 2013. Bonne lecture Gilles Col, Professeur à l'Université de Poitiers / FoReLL / LaTTiCe CNRS-ENS Dir. Revue CORELA - Cognition, Représentation, Langages http://corela.edel.univ-poitiers.fr/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:14:32 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:14:32 +0100 Subject: Appel: TSD 2013 Message-ID: Date: Tue, 18 Dec 2012 16:16:25 +0100 From: TSD 2013 Message-Id: X-url: http://www.tsdconference.org/tsd2013 ************************************************************************ TSD 2013 - PRELIMINARY ANNOUNCEMENT ************************************************************************ Sixteenth International Conference on TEXT, SPEECH and DIALOGUE (TSD 2013) Plzen (Pilsen), Czech Republic, 1-5 September 2013 http://www.tsdconference.org TSD NEWS The TSD conference fee was significantly reduced. It is organized in parallel with SPECOM. ABOUT CONFERENCE The conference is organized by the Faculty of Applied Sciences, University of West Bohemia, Pilsen, and the Faculty of Informatics, Masaryk University, Brno. This year the conference is organized in parallel with the 15th International Conference on Speech and Computer (SPECOM). The conference is supported by International Speech Communication Association (ISCA). Venue: Plzen (Pilsen), angelo Hotel (city center), Czech Republic TSD SERIES TSD series have evolved as a prime forum for interaction between researchers in both spoken and written language processing from all over the world. Proceedings of TSD form a book published by Springer-Verlag in their Lecture Notes in Artificial Intelligence (LNAI) series. The TSD proceedings are regularly indexed by Thomson Reuters Conference Proceedings Citation Index. LNAI series are listed in all major citation databases such as DBLP, SCOPUS, EI, INSPEC, or COMPENDEX. TOPICS Topics of the conference will include (but are not limited to): Corpora and Language Resources (monolingual, multilingual, text and spoken corpora, large web corpora, disambiguation, specialized lexicons, dictionaries) Speech Recognition (multilingual, continuous, emotional speech, handicapped speaker, out-of-vocabulary words, alternative way of feature extraction, new models for acoustic and language modelling) Tagging, Classification and Parsing of Text and Speech (multilingual processing, sentiment analysis, credibility analysis, automatic text labeling, summarization, authorship attribution) Speech and Spoken Language Generation (multilingual, high fidelity speech synthesis, computer singing) Semantic Processing of Text and Speech (information extraction, information retrieval, data mining, semantic web, knowledge representation, inference, ontologies, sense disambiguation, plagiarism detection) Integrating Applications of Text and Speech Processing (machine translation, natural language understanding, question-answering strategies, assistive technologies) Automatic Dialogue Systems (self-learning, multilingual, question-answering systems, dialogue strategies, prosody in dialogues) Multimodal Techniques and Modelling (video processing, facial animation, visual speech synthesis, user modelling, emotions and personality modelling) OFFICIAL LANGUAGE The official language of the event will be English. However, papers on processing of languages other than English are strongly encouraged. PROGRAM COMMITTEE Hynek Hermansky, USA (general chair) Eneko Agirre, Spain Genevieve Baudoin, France Jan Cernocky, Czech Republic Darja Fiser, Slovenia Radovan Garabik, Slovakia Alexander Gelbukh, Mexico Louise Guthrie, GB Jan Hajic, Czech Republic Eva Hajicova, Czech Republic Ludwig Hitzenberger, Germany Jaroslava Hlavacova, Czech Republic Ales Horak, Czech Republic Eduard Hovy, USA Ivan Kopecek, Czech Republic Steven Krauwer, The Netherlands Siegfried Kunzmann, Germany Natalija Loukachevitch, Russia Vaclav Matousek, Czech Republic Diana McCarthy, UK Hermann Ney, Germany Elmar Noeth, Germany Karel Oliva, Czech Republic Karel Pala, Czech Republic Nikola Pavesic, Slovenia Fabio Pianesi, Italy Maciej Piasecki, Poland Jan Pomikalek, Czech Republic Adam Przepiorkowski, Poland Josef Psutka, Czech Republic James Pustejovsky, USA Leon Rothkrantz, The Netherlands Milan Rusko, Slovakia Stefan Steidl, Germany Pavel Skrelin, Russia Pavel Smrz, Czech Republic Petr Sojka, Czech Republic Georg Stemmer, Germany Marko Tadic, Croatia Tamas Varadi, Hungary Zygmunt Vetulani, Poland Taras Vintsiuk, Ukraine Pascal Wiggers, The Netherlands Yorick Wilks, GB Victor Zakharov, Russia FORMAT OF THE CONFERENCE The conference program will include presentation of invited papers, oral presentations, and poster/demonstration sessions. Papers will be presented in plenary or topic oriented sessions.One day of the conference will be dedicated to tutorials and workshops. Social events including a trip in the vicinity of Pilsen will allow additional informal interactions. Details about the social event will be available on the web page. SUBMISSION OF PAPERS Authors are invited to submit a full paper not exceeding 8 pages formatted in the LNCS style (see below). Those accepted will be presented either orally or as posters. The decision on the presentation format will be based upon the recommendation of three independent reviewers. The authors are asked to submit their papers using the on-line submission form accessible from the conference web site. Papers submitted to TSD 2013 must not be under review by any other conference or publication during the TSD review cycle, and must not be previously published or accepted for publication elsewhere. As the reviewing is blind, the paper should not include authors' name and affiliations. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ...", should be avoided. Instead, use citations, such as "Smith previously showed (Smith, 1991) ...". Papers that do not conform to the requirements above are determined to be rejected without review. The authors are strongly encouraged to write their papers in TeX (plain) or LaTeX formats. These formats are necessary for the final versions of the papers that will be published in the Springer Lecture Notes. Authors using a MS Word-compatible software for the final version must use the LNCS template for MS Word and within the submit process ask the Proceedings Editors to convert the paper to the LaTeX format. For this service a service-and-license fee of CZK 1500 will be levied automatically. The paper format for the review has to be either the PDF or PostScript file with all required fonts included. Upon notification of acceptance, speakers will receive further information on submitting their camera-ready and electronic sources (for detailed instructions on the final paper format see http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0). Authors are also invited to present actual projects, a developed software or interesting materials relevant to the topics of the conference. Speakers who have prepared a demonstration should provide an abstract not exceeding one page. The demonstration abstracts will not appear in the conference proceedings. IMPORTANT DATES March 31, 2013 ............ Submission of full papers May 12, 2013 .............. Notification of acceptance June 9, 2013 .............. Final papers (camera ready) and registration September 1-5, 2013 ....... Conference date The contributions to the conference will be published in proceedings that will be made available on CD to participants at the time of the conference. CONFERENCE FEES The conference fee depends on the date of payment and on your status. It includes one copy of the conference proceedings, refreshments/coffee breaks, opening dinner, welcome party, mid-conference social event admissions, and organizing costs. In order to lower the fee as much as possible, meals during the conference, the accommodation, and the conference trip are not included. Full participant: early registration by June 9, 2013 - CZK 8.200 (approx. 320 EUR) late registration by August 1, 2013 - CZK 9.400 (approx. 370 EUR) on-site registration - CZK 10.000 (approx. 390 EUR) Student (reduced): early registration by June 9, 2013 - CZK 7.000 (approx. 280 EUR) late registration by August 1, 2013 - CZK 8.400 (approx. 330 EUR) on-site registration - CZK 8.900 (approx. 350 EUR) The payment may be refunded up until August 15, at the cost of CZK 1.500. No refund is possible after this date. All costs are in Czech Crowns (Czech Koruna, CZK), see e.g. http://www.xe.com/ucc/ for the current exchange rate. At least one of the authors has to register and pay the registration fee by June 9, 2013 for their paper to be included in the conference proceedings. Only one paper of up to 8 pages is included in the regular registration fee. The additional paper and page charge is CZK 1000 per page. Any additional paper is treated as extra pages. An extra page charge is CZK 1000 per page. An author with more than one paper pays the additional paper rates unless a co-author has also registered and paid the full registration fee. In the case of uncertainty, feel free to contact the organising committee for clarification. As in previous years, we will do our best to ensure grants for the prospective TSD participants from economically less powerful countries, especially the countries of the former Soviet Union and its satellites. By now we are negotiating with our partner supporting organisations about the form and amount of the grants. LOCATION The city of Plzen (Pilsen) is situated in Western Bohemia at the confluence of four rivers. With its 170,000 inhabitants it is the fourth largest city in the Czech Republic and an important industrial, commercial, and administrative centre. It is also the capital of the Pilsen Region. In addition, it has been selected as the European capital of culture for 2015 by the Council of the European Union. Pilsen is well-known for its brewing tradition. The trademark Pilsner-Urquell has a good reputation all over the world thanks to the traditional recipe, high quality hops and good groundwater. Beer lovers will also appreciate a visit to the Brewery Museum or the Brewery itself. Apart from its delicious beer, Pilsen hides lots of treasures in its core. The city can boast the second largest synagogue in Europe. The dominant of the old part of the city center is definitely the 13th-century Gothic cathedral featuring the highest tower in Bohemia (102.34 m). It is possible to go up and admire the view of the city. Not far from the cathedral is the splendid Renaissance Town Hall from 1558 and plenty of pleasant cafes and pubs are situated on and around the main square. There is also the beautiful Pilsen Historical Underground - under the city center, a complex network of passageways and cellars can be found. They are about 14 km long and visitors can see the most beautiful part of this labyrinth during the tour. It is recommended to visit the City Zoological Garden, having the second largest space for bears in Europe and keeping several Komodo dragons, large lizards which exist only in a few zoos in the world. The University of West Bohemia in Pilsen provides a variety of courses for both Czech and international students. It is the only institution of higher education in this part of the country which prepares students for careers in engineering (electrical and mechanical), science (computer science, applied mathematics, physics, and mechanics), education (both primary and secondary), economics, philosophy, politics, archeology, anthropology, foreign languages, law and public administration, art and design. GETTING THERE The city has access from the D5 motorway connecting Prague (Praha) with Germany. Pilsen has very good bus and train connections with the capital of Prague (it takes about 1 - 1.5 hour to get from Prague to Pilsen). >From Vaclav Havel Airport Prague (PRG) you can reach Pilsen by frequent public transport in 1.5 - 2 hours. ACCOMMODATION The organising committee has arranged accommodation for reasonable prices in the angelo Hotel Pilsen, which is situated in the city center in walking distance from the main railway station and opposite to the historical entrance of the Pilsner Urquell Brewery. There are a lot of restaurants in hotel neighbourhood offering specialities of national and foreign cuisine. Student halls of residence will be also available at the time of conference. ADDRESS All correspondence regarding the conference should be addressed to: Ms Anna Habernalova, TSD 2013 Conference Secretary E-mail: tsd2013 at tsdconference.org Phone: +420 722 375 005 Fax: +420 377 632 402 - Please, mark the faxed material with capitals 'TSD' on top. TSD 2013 conference web site: http://www.tsdconference.org/tsd2013 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From zilles at CS.UREGINA.CA Thu Dec 20 13:45:19 2012 From: zilles at CS.UREGINA.CA (Sandra Zilles) Date: Thu, 20 Dec 2012 07:45:19 -0600 Subject: Call for Workshop Proposals - Canadian Conference on AI 2013 Message-ID: ================ CALL FOR WORKSHOP PROPOSALS =================== The 26th Canadian Conference on Artificial Intelligence www.canadianai.ca/AI_2013 May 28th to May 31th, 2013 Regina, Saskatchewan, Canada =================================================================================== Canadian AI 2013 Call for Workshop Proposals The Program Committee of the twenty-sixth Canadian Conference on Artificial Intelligence (AI’2013) solicits proposals for workshops in all areas and topics pertaining to AI to be held on May 28th, 2013, immediately preceding the main conference. Workshops addressing emerging research directions in AI are highly encouraged. We are particularly seeking workshops presenting up and coming novel ideas in the field of AI with opportunity to crystalize new communities outside the main common stream of AI. The main goal of the AI’2013 workshops is to facilitate active interchange of ideas both theoretical and applied, in the general areas related to Artificial Intelligence. The workshops will provide an informal setting where participants will have the opportunity to discuss specific technical topics in an atmosphere that fosters such exchanges. The workshop organizers will be responsible for advertising the workshop, forming the program committee, reviewing and selecting papers in a transparent way, and deciding on the final program. Workshop organizers will also be responsible for publishing their own proceedings. Workshops may be full-day or half-day. A full-day workshop should ideally include between 10-12 regular papers, while a half-day workshop would consist of 5-6 regular papers. A workshop proposal should include the following information: 1- The name of the workshop. 2- The names, addresses, and a short bio of the organizers. 3- Scope, topics, and a brief description of the technical issues that the workshop will address, and the reasons why the workshop is of interest at this time. 4- The names of potential program committee members (could be tentative PC) [optional]. 5- The planned format of the workshop (papers, demos, panels, etc.) 7- The names of the potential keynote speakers [optional], if a keynote speech is included in the planned format of the workshop. 8- If applicable, a description of past versions of the workshop, including dates, organizers, number of submitted and accepted papers, number of attendees. 9- An estimate of the expected number of submitted and accepted papers, and of the expected number of attendees. 10-A description of the plans for publicity (CFP, submission and notification deadlines, etc.) The deadlines for the workshpop proposals are as follows: Workshop proposal submission: Jan 16, 2013 Notification of acceptance of proposal: Jan 21, 2013 Workshop: May 28, 2013 Workshop proposals or inquiries should be sent to the AI-2013 Program co-chairs: Sandra Zilles, zilles AT cs.uregina.ca, and Osmar Zaiane, zaiane AT cs.ualberta.ca We look forward to receiving your proposal ! Sandra Zilles and Osmar Zaiane AI-2013 Program co-chairs -------------- next part -------------- An HTML attachment was scrubbed... URL: From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 13:56:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 14:56:28 +0100 Subject: Revue: CORELA, Langage, espace, cognition Message-ID: Date: Wed, 19 Dec 2012 17:45:10 +0100 From: Gilles Col Message-Id: X-url: http://09.edel.univ-poitiers.fr/corela/index.php?id=2717 Chers collègues, L'équipe éditoriale de la revue CORELA - Cognition / Représentation / Langages a le plaisir de vous annoncer la publication de son dernier numéro thématique (http://09.edel.univ-poitiers.fr/corela/index.php?id=2717) : "LANGUE, ESPACE, COGNITION" sous la direction de Benjamin FAGARD et Dejan STOSIC Sommaire du numéro: Benjamin Fagard et Dejan Stosic: Introduction générale : langue, espace, cognition http://09.edel.univ-poitiers.fr/corela/index.php?id=2720 Francis Corblin : Locus et telos : aller à l'école, être à la plage* http://09.edel.univ-poitiers.fr/corela/index.php?id=2722 Dejan Stosic : En passant par : une expression en voie de grammaticalisation ? http://09.edel.univ-poitiers.fr/corela/index.php?id=2844 Philippe Gréa : Le centre n'est pas au milieu (et inversement). Pour une approche phénoménologique et gestaltiste de la localisation http://09.edel.univ-poitiers.fr/corela/index.php?id=2831 Véronique Lagae : Marqueurs du point de départ spatial et temporel antéposés : une comparaison de depuis, dès et à partir de http://09.edel.univ-poitiers.fr/corela/index.php?id=2820 Emilia Hilgert : Les prépositions ensemblistes et la question de leur emploi spatial http://09.edel.univ-poitiers.fr/corela/index.php?id=2808 Marie Lammert : Où est ailleurs ? Sémantique lexicale de l'adverbe spatial ailleurs http://09.edel.univ-poitiers.fr/corela/index.php?id=2801 Michel Aurnague : Les bases ontologiques des procès de déplacement http://09.edel.univ-poitiers.fr/corela/index.php?id=2846 Francine Gerhard-Krait : Du nom place aux verbes déplacer et replacer : quelques questions de legs et d'appropriations sémantiques http://09.edel.univ-poitiers.fr/corela/index.php?id=2790 Richard Huyghe : Evénements et localisation spatiale : quand le lieu est un événement http://09.edel.univ-poitiers.fr/corela/index.php?id=2786 Dany Amiot : De la localisation à l'évaluation : des verbes préfixés évaluatifs au sens bien particulier http://09.edel.univ-poitiers.fr/corela/index.php?id=2775 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:04:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:04:48 +0100 Subject: Conf: TRALOGY II, 17 et 18 janvier 2013, Paris Message-ID: Date: Wed, 19 Dec 2012 18:58:37 +0100 From: Joseph Mariani Message-ID: <50D2004D.509 at limsi.fr> X-url: http://www.tralogy.eu/spip.php?article34&lang=en X-url: http://www.tralogy.eu/spip.php?article34&lang=fr ************ Apologies for Multiple Posting ************ Registration to TRALOGY II is now open! Following the success of the first Conference in March 2011, we are glad to invite you to this new forum for those interested in all fields where human and machine translation meet. This conference is a place where professionals, scientists and trainers can congregate, meet and talk about the future of the trade with technology and research in mind. This edition will be dedicated to meaning, how it is sought while we work and by technological processes as well, and the limits to be explored in common by scientists and real human translators to enhance and assist translation in progress. A registration form is available on the TRALOGY website : http://www.tralogy.eu/spip.php?article34&lang=en Registration is free-of-charge. As the number of places at the venue is limited, make sure to register early, so that we can confirm your final registration. ------------------------------------------------------------------------ Les inscriptions à TRALOGY II sont ouvertes ! Suite au succès enregistré lors de la première conférence en mars 2011, nous avons le plaisir de vous inviter à ce nouveau forum destinés à ceux qu'intéressent tous les domaines où /biotraduction/ et traduction automatique se rencontrent. Cette conférence est un lieu où professionnels, chercheurs et formateurs peuvent se rassembler, se rencontrer et parler de l'avenir de la profession tout en pensant technologie et recherche. Cette édition est consacrée au sens, que l'on recherche quand nous sommes à la tâche et aussi grâce à des processus technologiques, ainsi qu'aux limites que chercheurs et les vrais traducteurs humains se doivent d'explorer ensemble pour améliorer et soutenir la traduction à l'oeuvre. Un formulaire d'inscription est à votre disposition sur le site de TRALOGY : http://www.tralogy.eu/spip.php?article34&lang=fr Cette inscription est gratuite. Le nombre de place étant limité sur le lieu de la conférence, veillez à vous inscrire rapidement pour que nous puissions confirmer votre inscription définitive. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:00:02 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:00:02 +0100 Subject: Job: Stage, Phonetisation d'enonces ecrits pour la synthese de parole, IRISA Message-ID: Date: Wed, 19 Dec 2012 18:04:39 +0100 From: Gwénolé Lecorvé Message-ID: <50D1F3A7.7020509 at irisa.fr> [English version below] Bonjour à tous, L'équipe Cordial de l'IRISA (Lannion) propose un sujet de stage sur la phonétisation d'énoncés écrits pour la synthèse de parole (conversion de graphèmes en phonèmes) et, plus précisément, sur l'adaptation d'un système de phonétisation à des spécificités de prononciation telles que peuvent par exemple produire des accents régionaux ou étranger, voire certains états émotionnels particuliers. Le sujet est détaillé plus amplement en toute fin de cet email. Ce sujet s'adresse à des étudiants de master (ou équivalent bac+5) pour durée de 5 mois environ. Le stage aurait lieu sur le site lannionnais de l'IRISA. Merci de le diffuser auprès des étudiants qui pourraient être intéressés. Cordialement, Gwénolé Lecorvé. -- Dear colleagues, The group Cordial at IRISA (Lannion) is proposing an internship about written text phonetization (grapheme-to-phoneme conversion) for speech synthesis. More precisely, this internship would focus on the adaptation of a phonetization tool in order to match the specifics of various regional or foreign accents within a same language (French) or of some particular emotional states. The proposal is detailed at the bottom of this email. This intern is addressed to master students (or equivalent) and would last about 5 months. Thanks for forwarding this emails to students who may be interested. Best regards, Gwénolé Lecorvé. -- *Title: Grapheme-to-phoneme conversion adaptation using conditional random fields* *Description:* Grapheme-to-phoneme conversion consists in generating possible pronunciations for an isolated word or for a sequence of words. More formally, this conversion is a transliteration of a sequence of graphemes, i.e., letters, into a sequence of phonemes, symbolic units to represent elementary sounds of a language. Grapheme-to-phoneme converters are used in speech processing - either to help automatic speech recognition systems to decode words from a speech signal - or as a mean to explain speech synthesizers how a written input should be acoustically produced. A problem with such tools is that they are trained on large and varied amounts of aligned sequences of graphemes and phonemes, leading to generic manners of pronouncing words in a given language. As a consequence, they are not adequate as soon as one wants to recognize or synthesize specific voices, for instance, accentuated speech, stressed speech, dictating voices versus chatting voices, etc. [1]. While multiple methods have been proposed for grapheme-to-phoneme conversion [2, 3], the primary goal of this internship is to propose a method to adapt grapheme-to-phoneme models which can easily be adapted under conditions specified by the user. More precisely, the use of conditional random fields (CRF) will be studied to model the generic French pronunciation and variants of it [4]. CRFs are state-of-the-art statistical tools widely used for labelling problems in natural language processing [5]. A further important goal is to be able to automatically characterize pronunciation distinctive features of a given specific voice as compared to a generic voice. This means highlighting and generalizing differences that can be observed between two sequences of phonemes derived from a same sequence of graphemes. Results of this internship would be integrated into the speech synthesis platform of the team in order to easily and automatically simulate and imitate specific voices. *Technical skills:* C/C++ and a scripting language (e.g., Perl or Python) *Keywords:* Natural language processing, speech processing, machine learning, statistical learning *Contact:* Gwénolé Lecorvé (gwenole.lecorve at irisa.fr) *References:* [1] B. Hutchinson and J. Droppo. Learning non-parametric models of pronunciation. In Proceedings of ICASSP, 2011. [2] M. Bisani and H. Ney. Joint-sequence models for grapheme-to-phoneme conversion. In Speech Communication, 2008. [3] S. Hahn, P. Lehnen, and Ney H. Powerful extensions to crfs for grapheme to phoneme conversion. In Proceedings of ICASSP, 2011. [4] Irina Illina, Dominique Fohr, and Denis Jouvet. Multiple pronunciation generation using grapheme-to-phoneme conversion based on conditional random fields. In Proceedings of SPECOM, 2011. [5] John D. Lafferty, Andrew McCallum, and Fernando C. N. Pereira. Conditional random fields: probabilistic models for segmenting and labeling sequence data. In Proceedings of ICML, 2001. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:06:24 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:06:24 +0100 Subject: Appel: SIGIR 2013 Message-ID: Date: Thu, 20 Dec 2012 05:51:22 -0800 (PST) From: Séamus Lawless Message-ID: <1356011482.83972.YahooMailNeo at web142602.mail.bf1.yahoo.com> X-url: http://www.sigir2013.ie/ =================================================== 2nd Call for Papers / Importance Notice SIGIR 2013, Dublin, Ireland, 28 July-1 August, 2013 http://www.sigir2013.ie/ =================================================== CALL FOR PAPERS IMPORTANT: Regular contributors to SIGIR, please note changes to SIGIR 2013 for authors, as outlined below. SIGIR is the major international forum for the presentation of new research results and for the demonstration of new systems and techniques in the broad field of information retrieval (IR). The Conference and Program Chairs invite all those working in areas related to IR to submit original full papers, short papers, and proposals for tutorials, workshops, and demonstrations of systems. SIGIR 2013 welcomes contributions related to any aspect of IR theory and foundation, techniques, and applications. Relevant topics include, but are not limited to:  - Document Representation and Content Analysis (e.g., text representation, document structure, linguistic analysis, multi-lingual IR, cross-lingual IR, NLP for IR, information extraction, sentiment analysis, clustering, classification, topic models, facets, text streams)  - Queries and Query Analysis (e.g., query representation, query suggestion, query reformulation, query intent, conversational search, query log analysis, session analysis, question answering) - Users and Interactive IR (e.g., user models, user studies, user feedback, search interface, summarization, task models, personalized search)  - Retrieval Models and Ranking (e.g., IR theory, language models, probabilistic retrieval models, feature-based models, learning to rank, combining searches, diversity)  - Search Engine Architectures and Scalability (e.g., indexing, compression, distributed IR, P2P IR, mobile devices)  - Filtering and Recommending (e.g., content-based filtering, collaborative filtering, recommender systems, profiles)  - Evaluation (e.g., test collections, effectiveness measures, experimental design)  - Web IR and Social Media Search (e.g., link analysis, click models/behavioural modelling, social tagging, social network analysis, advertising and search, blog search, microblog search, forum search, community-based QA (CQA), adversarial IR, vertical and local search)  - IR and Structured Data (e.g., XML search, ranking in databases, desktop search, entity search)  - Multimedia IR (e.g., image search, video search, speech/audio search, music IR)  - Other Applications (e.g., digital libraries, enterprise search, genomics IR, legal IR, patent search, text reuse) IMPORTANT DATES - Monday 21 January 2013: Abstracts for full research papers due  - Monday 28 January 2013: Full research papers due  - Monday 4 February 2013: Workshop proposals due  - Monday 18 February 2013: Short papers, demonstration, and tutorial proposals due  - Monday 11 March 2013: Notification of workshop acceptances  - Monday 11 March 2013: Doctoral consortium proposals due  - Monday 15 April 2013: All other acceptance notifications  - Sunday 28 July 2013: Conference begins in Dublin IMPORTANT NOTICE We'd like to draw your attention to a few changes at SIGIR 2013 for authors. (1) The full paper track (10 pages) will introduce a new review criterion, *Reproducibility of Methods*, in addition to the criteria traditionally used at SIGIR. The full set of review criteria can be found in the FULL PAPER REVIEW CRITERIA section below. Also, visit the following pages: http://www.sigir2013.ie/fullpapers.html http://www.sigir2013.ie/requirements.html (2) Along with the full paper track, we will have a short paper (4 pages) and demo paper (2 pages) tracks. Note that SIGIR previously had posters (2 pages) and demo papers (1 page). Visit this page for details: http://www.sigir2013.ie/posterdemonstrations.html FULL PAPER REVIEW CRITERIA Relevance to SIGIR: Is the work presented within the scope of SIGIR? Originality of Work: Does the work describe a unique problem? Does the work propose a creative solution to an old problem? Is there similar prior art? Technical Soundness: Are the algorithms and methods used correct? Is the experimental design appropriate? Are the experiments and analyses thorough? Are appropriate statistical tests used? Quality of Presentation: Are the ideas, methods, results and discussions presented clearly? Is the paper structure appropriate? Is the paper written in good English? Impact of Ideas or Results: Will this research change practice? Will this work be cited? Will this work generate additional research? Adequacy of Citations: Are the authors aware of relevant prior art? Do the authors provide a good overview of it? Is the citation list unbiased? Reproducibility of Methods: Are the descriptions of the methods used detailed and accurate? Given the resources used in the paper, or (if they are unavailable) similar resources, could researchers carry out similar experiments to verify the results? What further description could the authors provide? Program Committee Chairs Maarten de Rijke, University of Amsterdam, The Netherlands Diane Kelly, University of North Carolina, Chapel Hill, USA Tetsuya Sakai, Microsoft Research Asia, China General Conference Chairs Gareth Jones, CNGL, Dublin City University, Ireland Páraic Sheridan, CNGL, Dublin City University, Ireland ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:08:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:08:39 +0100 Subject: Appel: RFP 2013, Reseau Francais de Phonologie Message-ID: Date: Thu, 20 Dec 2012 16:52:09 +0100 From: Olivier Crouzet Message-Id: <20121220165209.e76db3372a645438b05c2e2f at univ-nantes.fr> X-url: http://www.lling.univ-nantes.fr/ Toutes nos excuses pour les envois multiples / Apologies for cross-postings. ###################################################### APPEL A COMMUNICATION Réseau Français de Phonologie 2013 (RFP 2013) Après les rencontres qui se sont tenues à Orléans 2010, Tours 2011 et Paris 2012, le Réseau Français de Phonologie (RFP) lance un appel à communication pour un colloque organisé par le Laboratoire de Linguistique (Lling/EA3827, Université de Nantes), en collaboration avec le FoReLL (Université de Poitiers) et la MSH-Ange Guépin, qui se tiendra à Nantes du 1er au 3 juillet 2013. Conférenciers invités * Phillip Backley (Tohoku Gakuin University, Sendai, Japon). * Didier Demolin (GIPSA Grenoble / UMR 5216, France). * Andrew Nevins (University College London, Royaume-Uni). * Bert Vaux (King's College Cambridge, Royaume-Uni). * Sophie Wauquier (Université de Paris 8 / UMR 7023, France). * Leo Wetzels (Vrije Universiteit Amsterdam, Pays-Bas). Session principale Toutes les écoles et tous les courants de la phonologie sont invités à participer. Les problèmes traités peuvent concerner la phonologie générale comme l'analyse phonologique d'un phénomène linguistique ou d'une langue particulière. Seront prises en considération les soumissions concernant l'analyse du signal, la perception, l'acquisition, la diachronie, la dialectologie, les formalismes, l'épistémologie et toutes les questions qui s'inscrivent explicitement dans le domaine de la phonologie et de ses interfaces. Sessions thématiques Nous encourageons particulièrement cette année les communications portant sur les thèmes de l'Acquisition de la phonologie, ainsi que celles portant sur l'Harmonie. Session Thématique 1 : Acquisition Cette session a pour objectif d'aborder les recherches récentes dans les domaines de l'acquisition phonologique ou de l'apprentissage de la phonologie d'une langue première ou seconde. Elle vise à mettre en avant des données, souvent non attestées dans la langue adulte, qui questionnent les modèles théoriques développés en phonologie. Les propositions attendues peuvent porter, sans limitation aucune, sur les unités minimales (traits, éléments, segments), sur les niveaux syllabiques ou prosodiques, sur les processus, en production ou en perception (notamment sur le lien entre ces deux modalités). Quel que soit le cadre théorique retenu, les communications proposées pourront porter sur une langue particulière ou s'inscrire dans une perspective typologique. Session Thématique 2 : Harmonie L'harmonie, un processus largement répandu à travers les langues du monde, peut se définir comme un changement syntagmatique à travers lequel un segment assimile les qualités d'un élément situé dans le même domaine. Locale (contiguïté stricte), étendue à un domaine particulier (syllabe, pied, mot ou syntagme phonologique), l'harmonie, vue comme une assimilation à distance, peut concerner aussi bien les voyelles (harmonie vocalique) que les consonnes (harmonie consonantique). Si la localité apparaît cruciale dans la définition du phénomène, l'harmonie répond souvent à des contraintes de directionnalité. Un ensemble de segments, intervenants dans le domaine harmonique, semble soit bloquer l'harmonie, soit être transparent : ces derniers sont-ils vraiment inertes ou participent-ils, d'une quelconque manière, au phénomène ? Ce processus résulte-t-il de principes phonétiques (hypothèse de la phonologisation d'un processus de coarticulation) ou de principes strictement phonologiques (hypothèse d'une computation reposant sur un corps restreint de principes) ? Cette session est ouverte aux propositions relevant de la phonologie proprement dite mais aussi à celles axées sur les relations harmoniques dans la production et la perception de la parole, la prosodie, dans l'acquisition, le développement et l'apprentissage, dans la structuration du lexique, dans les domaines de la reconnaissance automatique de la parole et de la synthèse vocale (liste non limitative). Format de soumission et sélection Les propositions de communication, rédigées en français ou en anglais, seront présentées sous forme d'un résumé de deux pages maximum (format A4, police Times taille 12), incluant les éléments essentiels de bibliographie, et soumises anonymement à l'adresse suivante : https://www.easychair.org/conferences/?conf=rfp2013. Les propositions seront transférées pour évaluation à deux rapporteurs et la sélection finale fera l'objet d'une discussion collective. Calendrier * Appel à contributions : 15 décembre 2013 * Envoi des contributions avant le 1er mars 2013 * Retour des avis aux auteurs : 15 avril 2013 * Colloque : du 1er au 3 juillet 2013 Organisation Les communications seront de 30 minutes, dix minutes de discussion incluses. Comité de lecture J.-P. Angoujard (U. de Nantes), S. Bendjaballah (U. Paris 7), G. Bergounioux (U. d'Orléans), J. Brandao de Carvalho (U. Paris 8), Ph. Carr (U. de Montpellier), C. Dugua (U. d'Orléans), J. Durand (U. de Toulouse), S. Ferré (U. de Tours), J.-M. Fournier (U. de Tours), S. Herment, (U. d'Aix-Marseille), M. D'Imperio (Aix-Marseille), M. Lahrouchi (U. Paris 8), B. Laks (U. Paris 10), J.-L. Léonard (U. Paris 3), J. Lowenstamm (U. Paris 7), N. Nguyen (U. d'Aix-Marseille), R. Noske (U. de Lille), C. Patin (U. de Lille), A. Rialland (U. Paris 3), R. Ridouane (U. Paris 3), M. Russo (U. Paris 8) , P. Sauzet (U. Toulouse), T. Scheer (U. Nice), Ph. Ségéral (U. Paris 7), A. Tifrit (U. de Nantes), N. Vallée (U. de Grenoble), S. Wauquier (U. Paris 8). Comité d'organisation J.-M. Beltzung, E. Caratini, O. Crouzet, A. Tifrit ########################################################### CALL FOR PAPERS French Phonology Network Meeting 2013 (RFP 2013) After the conferences organized in Orléans 2010, Tours 2011 and Paris 2012, the French Phonology Network (Réseau Français de Phonologie) is launching a call for papers for a new meeting in the same spirit that will take place in Nantes from July, 1st to 3rd, 2013 thanks to the LLing (EA3827, Université de Nantes), FoReLL (Université de Poitiers) and MSH-Ange Guépin. Invited speakers * Phillip Backley (Tohoku Gakuin University, Sendai, Japon). * Didier Demolin (GIPSA Grenoble / UMR 5216 , France). * Andrew Nevins (University College London, Royaume-Uni) * Bert Vaux (King's College Cambridge, Royaume-Uni). * Sophie Wauquier (Université de Paris 8 / UMR 7023, France). * Leo Wetzels (Vrije Universiteit Amsterdam, Pays-Bas). Main session Phonologists of every school or background are warmly welcome to participate. Issues at stake may be in the field of general phonology or of the phonological analysis of a linguistic phenomenon of a specific language. Submissions that will be taken into consideration will be those dealing with signal processing, perception, acquisition, diachrony, dialectology, formalism, epistemology and all issues which explicitly file under the field of phonology and its interfaces. Thematic sessions This year we'd like to draw your attention to the fact that thematic sessions will be organized around 'Acquisition' and 'Harmony'. Thematic session 1 : Acquisition This thematic session aims at addressing the latest issues in the field of phonological acquisition of a first or second language. It will bring forward data which are unattested in adult's languages and challenge phonological theories. Submissions dealing with any aspect/level of phonological acquisition are welcome. They may be concerned with minimal units in phonology (features, elements, segments), the syllable, prosody, processes (in production or perception) among other topics. Contributions may be couched in any theoretical framework, and may be concerned with the acquisition of a single language or adopt a cross-linguistic/typological perspective. Thematic session 2 : Harmony Harmony is a wide-spread process among the world's languages. It may be defined as a syntagmatic change whereby a given segment absorbs some of the properties of another segment in the same phonological domain. When it is perceived as some kind of long-distance assimilation, harmony -which may be local (strict contiguity) or extended to a given domain (syllable, foot, word, phonological phrase)- may target vowels (vowel harmony) or consonants (consonant harmony). If locality seems to play a crucial role in its definition, harmony is also sensitive to directionality. Intervening segments (within the domain within which harmony applies) may prevent harmony to take place or be transparent: are these really invisible or are they somehow involved in the harmony process? Are harmony processes due to phonetic (e.g. phonologization of a coarticulation process) or to strictly phonological principles (e.g. computation of a restricted set of principles)? This thematic session aims at bringing together people who are concerned with harmony in general phonology as well as with harmonic relations in speech perception and production, prosody, acquisition, development, the structuring of the lexicon, automatic speech recognition and speech synthesis (this list, of course, should not be interpreted as being exhaustive). Submission format and selection Abstracts will be written either in French or in English and will not exceed two pages in length, (A4 format, Times font, size 12), including examples and references, and will be submitted through Easychair: https://www.easychair.org/conferences/?conf=rfp2013. The abstract must be completely anonymous and do not contain any information that identifies the authors. Submissions will then be forwarded to two peers for assessment and the final selection will be carried out by a board meeting. Important dates * Call for papers: December 15, 2012 * Deadline for submission: March 1st, 2013 * Notification of acceptance: April 15, 2013 * Conference: July 1st to 3rd, 2013. Organization Talks will last 20 minutes, followed by 10 minutes' debate. Reviewers J.-P. Angoujard (U. de Nantes), S. Bendjaballah (U. Paris 7), G. Bergounioux (U. d'Orléans), J. Brandao de Carvalho (U. Paris 8), Ph. Carr (U. de Montpellier), C. Dugua (U. d'Orléans), J. Durand (U. de Toulouse), S. Ferré (U. de Tours), J.-M. Fournier (U. de Tours), S. Herment, (U. d'Aix-Marseille), M. D'Imperio (Aix-Marseille), M. Lahrouchi (U. Paris 8), B. Laks (U. Paris 10), J.-L. Léonard (U. Paris 3), J. Lowenstamm (U. Paris 7), N. Nguyen (U. d'Aix-Marseille), R. Noske (U. de Lille), C. Patin (U. de Lille), A. Rialland (U. Paris 3), R. Ridouane (U. Paris 3), M. Russo (U. Paris 8) , P. Sauzet (U. Toulouse), T. Scheer (U. Nice), Ph. Ségéral (U. Paris 7), A. Tifrit (U. de Nantes), N. Vallée (U. de Grenoble), S. Wauquier (U. Paris 8). Organizing committee J.-M. Beltzung, E. Caratini, O. Crouzet, A. Tifrit ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:09:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:09:37 +0100 Subject: Job: Stages TAL et Informatique chez Semantia, Marseille Message-ID: Date: Fri, 21 Dec 2012 09:01:04 +0000 From: Lucile Paroz Message-ID: Bonjour à tous, Semantia est un fournisseur de services en ligne (ASP), spécialisé dans le traitement du langage pour l'optimisation de la gestion de la relation client. Deux stages sont proposés pour 2013 : un stage de 3 à 6 mois en TAL et un stage de 4 à 6 mois en Informatique. Contexte du stage TAL Intégré au service de Recherche et Développement, l'objectif du stage est de participer à l'optimisation des Bases de Connaissances des applicatifs de la société pour le traitement et l'analyse du langage. Après s'être familiarisé avec les outils et les solutions Semantia, il devra proposer des solutions d'optimisation du module morpho-syntaxique. Connaissances requises et/ou acquises : * Bonnes connaissances des outils disponibles en TALN, plus particulièrement des Grammaires * Esprit d'équipe * Sens de l'initiative * Autonomie * Rigueur * Motivation Niveau : Bac+3 minimum en Linguistique Durée du stage : de 3 à 6 mois Contexte du stage Informatique Intégré au service de Recherche et Développement, le stagiaire participera à l'optimisation des Bases de Connaissances des applicatifs de la société pour le traitement et l'analyse du langage. L'objectif du stage est la mise en place d'un module grammatical permettant d'améliorer le rendement de certaines règles linguistiques. Le stagiaire devra être en mesure de proposer des méthodes et de mettre en place différentes solutions en situation. Connaissances requises et/ou acquises : * Compilation et théorie des langages * Développement d'analyseur syntaxique * Expérience de générateur type Yacc, Lex * Maîtrise avancée de l'algorithme * Langage C/C++/Java * Rigueur et motivation Niveau : Bac+3 minimum dans la discipline Durée du stage : de 4 à 6 mois Contacts * drh at semantia.com * Tél. : 04 42 36 80 91 En vous souhaitant de belles fêtes de fin d'année, L'équipe de Semantia ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:14:56 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:14:56 +0100 Subject: Job: Stage, Analyse coreen ou japonais (Sinequa) Message-ID: Date: Fri, 21 Dec 2012 22:00:20 +0100 From: Frederik Cailliau Message-ID: <50D4CDE4.8070603 at sinequa.com> X-url: http://www.sinequa.com/ Bonjour, Veuillez trouver ci-dessous deux offres de stage pour 2013. Bien cordialement, Frederik Cailliau http://www.sinequa.com/ --------------------------------------------- Offre de stage 2013 Sujet : Amélioration d'un module d'analyse linguistique pour la recherche d'information en coréen ou en japonais Lieu : Sinequa, 12 rue d'Athènes, 75009 Paris Cadre : Master 1 ou 2 en Linguistique-Informatique ou spécialité TAL Compétences : - Bonnes bases informatiques, maîtrise d'un langage de script (type PERL). - Maîtrise avancée du coréen ou du japonais. Indemnités : selon niveau et expérience. Début : dès que possible. Contact: Frederik Cailliau, cailliau at sinequa.com ---------------------------------------------- Internship 2013 Topic: Improvement of a module of linguistic analysis for information retrieval in Korean or Japanese. Location: Sinequa, 12 rue d'Athènes, 75009 Paris Required education: Master in Computational Linguistics or option NLP Skills: - Good basic knowledge of computer science, proficiency of a scripting language (such as PERL). - Proficiency of Korean or Japanese close to native. Compensation: depending on level and experience. Start: as soon as possible. Contact: Frederik Cailliau, cailliau at sinequa.com ---------------------------------------------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Thu Dec 27 09:13:38 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Thu, 27 Dec 2012 10:13:38 +0100 Subject: Appel: Second Workshop on Computational Linguistics for Literature Message-ID: Date: Sat, 22 Dec 2012 09:59:40 -0500 From: Stan Szpakowicz Message-ID: <50D5CADC.1030902 at eecs.uottawa.ca> Second Workshop on Computational Linguistics for Literature Co-located with NAACL-HLT 2013 June 13 or 14, 2013, Atlanta, Georgia, USA Submission deadline: March 1, 2013 First Call for Papers (Apologies for multiple postings) The amount of literary material available on-line keeps growing rapidly: there are machine-readable texts from libraries, collections and e-book stores, as well as "live" literature such as e-zines, blogs or self-published e-books. We need tools to help navigate, visualize and better appreciate the high volume of available literature. We invite papers on applying state-of-the art NLP methods to literary data. What characteristics of literature make it special? Is it, indeed, a unique type of language data? How should we adapt our tools to find meaning in literary text? What lessons from automatic processing of literature could apply to other types of data? Position papers are welcome, too. Topics of interest (suitably related topics are welcome): - the needs of the readers and how those needs translate into meaningful NLP tasks; - searching for literature; - recommendation systems for literature; - computational modelling of narratives, computational narratology; - summarization of literature; - finding similar books; - differences between literature and other genres as relevant to computational linguistics; - discourse structure in literature; - emotion analysis for literature; - profiling and authorship attribution; - identification and analysis of literature genres; - building and analyzing social networks of characters; - generation of literary narrative, dialogue or poetry All information, including our excellent program committee, announcements and updates, sits at: https://sites.google.com/site/clfl2013/ Anna, David, Stan ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Thu Dec 27 09:16:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Thu, 27 Dec 2012 10:16:46 +0100 Subject: Job: Ingenieur en traitement automatique des langues, DGA Message-ID: Date: Sun, 23 Dec 2012 23:20:38 +0100 From: Laura Chaubard Message-Id: <748F24A6-2DF9-4629-A3C1-F1AA800858F2 at gmail.com> Ingénieur en Traitement Automatique des Langues MINISTERE DE LA DEFENSE DGA-Maitrise de l’Information 1000 collaborateurs propose 1 CDD de 3 ans, évolutif en CDI Mission du poste L’enjeu du poste est d’assurer des prestations d’expertise afin d’acquérir des modules de traitement automatique des langues (TAL) performants et d’en maîtriser les risques techniques. Intégré à une équipe de maîtrise d’ouvrage, vous contribuerez à l’expertise technique et aux processus d’acquisition de systèmes TAL au profit des forces armées : - En participant à l’élaboration des spécifications techniques pour les études amont et les programmes, - En menant des analyses et des expérimentations pour orienter les choix, - En assurant le suivi et la qualification des démonstrateurs et systèmes livrés, en interaction directe avec les industriels et les opérationnels, - En participant à la coordination des services étatiques et aux retours d’expérience opérationnels, - En participant à l’animation d’un réseau d’académiques, d’industriels et d’agences étatiques autour des thématiques d’intérêt Défense. Votre expertise portera sur les méthodes de développement et d’évaluation des technologies de traitement de l’information langagière non structurée (texte, parole, document scanné), sur l’architecture des systèmes de traitement sémantique de l’information et sur l’intégration de ces systèmes dans la chaîne du renseignement. Votre activité sera pluridisciplinaire et vous travaillerez en lien avec les autres départements d’experts techniques de DGA Maîtrise de l’information. Profil du poste Vous avez un bac + 5 et des compétences dans les domaines suivants: - Informatique de base : algorithmique, systèmes d’information… - Apprentissage automatique, intelligence artificielle, - Méthodes statistiques pour le traitement de l’information Un doctorat ou une expérience professionnelle dans le domaine du traitement de la parole ou du langage naturel seraient appréciés. Poste basé en région rennaise avec déplacements en région parisienne. Candidature et prétentions avant le 28 janvier 2013 à DGA Maitrise de l’information- M. Gérard Le Chaix, chef du département « Espace, Observation, Renseignement, Drones », gerard.le-chaix at dga.defense.gouv.fr, copie à laura.chaubard at dga.defense.gouv.fr . ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Thu Dec 27 09:23:31 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Thu, 27 Dec 2012 10:23:31 +0100 Subject: Job: Research Assistant @ NUS/NTU, Singapore Message-ID: Date: Mon, 24 Dec 2012 22:53:19 +0800 From: Erik Cambria Message-ID: <563B6979-98DB-469A-A7E9-96A390DA0551 at nus.edu.sg> X-url: http://sentic.net/sentics X-url: http://sentic.net/elm Apologies for cross-posting. We are looking to hire a motivated individual for the position of Research Assistant at the National University of Singapore and Nanyang Technological University, under the joint supervision of Erik Cambria and Guangbin Huang. The duration of the position is 12 months, but may be extended an additional 6 months or more. The candidate is expected to start in the first quarter of 2013. The successful candidate will be involved in a project for the application of extreme learning machines (ELM) to sentic computing in order to develop a two-level affective common sense reasoning framework, which will be exploited for tasks such as opinion mining and sentiment analysis. Applicants should have a PhD (or a good honors degree) in Computer Science or similar, as well as relevant experience in conducting research in the field. The ideal candidate should have basic understanding in neural networks, knowledge representation, and natural language processing, and should be able to work independently on such tasks as literature review, programming, and data management. Remuneration will be commensurate with qualifications and experience. Interested applicants should send their CV to cambria at nus.edu.sg. For more information about the project, please visit opening, keep an eye on http://sentic.net/elm. Best Regards and Merry Christmas, Erik Cambria and Guangbin Huang Erik Cambria, PhD Research Scientist Web: http://sentic.net Email: cambria at nus.edu.sg ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:18:43 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:18:43 +0100 Subject: Job: Stage de fin d'etude ou de cesure, Orange Message-ID: Date: Fri, 30 Nov 2012 09:10:15 +0100 From: Message-ID: <16671_1354263017_50B869E9_16671_16958_1_A77731DA68DB4D4B838358655763009B94B3B1EB52 at PUEXCB2D.nanterre.francetelecom.fr> Bonjour, Veuillez trouver ci-joint une proposition de stage de fin d'?tude qui pourra int?resser des ?tudiants en traitement automatique des langues. Bien cordialement, Laurence Grauby FT/OF/DMGP/Portail/ARPA/118712 - Local/P?le Data et Support --------------------------------- t?l?phone : 05 56 16 92 22 mobile : 06 48 08 11 87 ------------------------------------------------------------------------ Intitul? : Am?lioration de la qualit? du moteur de recherche 118712 Mission La direction 118712 est une entit? marketing en charge de la d?finition, de la conception et du d?ploiement des offres de renseignements annuaire d'Orange sur diff?rents canaux (renseignements t?l?phoniques, web, mobile,...). Le moteur de recherche du 118712 est accessible sur le web (2 millions de visiteurs uniques par mois) et via l?appli mobile 118712. L?objectif du stage est de d?finir et de mettre en ?uvre une strat?gie d?am?lioration de la qualit? des Listes R?ponses du moteur mono champ (Google like) du 118712. Au moteur proprement dit est associ? un analyseur de requ?tes qui permet de typer une requ?te utilisateur en identifiant ses diff?rents constituants (activit? professionnelle, localit?, adresse, d?nomination...) afin de lui appliquer des traitements sp?cifiques. L?am?lioration des r?ponses moteur et de l?analyseur de requ?tes sont ? mener en parall?le. L?ensemble des actions que vous mettrez en ?uvre s?articuleront en trois ?tapes principales : 1- Analyse des Requ?tes internautes et de leur r?sultat : - Choix d?un corpus de requ?tes pour l??valuation - D?finition des typologies de demande - Evaluation de la pertinence du moteur de recherche et de l?analyse de requ?tes 2- Analyse des anomalies de r?ponse aux requ?tes internautes - Diagnostic sur les causes de non r?ponses (silence) - Diagnostic sur les causes de r?ponses non satisfaisantes (bruit) 3- Mise en ?uvre d?un plan d?action pour am?liorer la qualit? - Identification des leviers d?am?lioration?: donn?es annuaire, param?trage du moteur et de l?analyseur de requ?tes, ?volutions logicielles, ... - Priorisation des actions en fonction du b?n?fice attendu - Prise en charge des param?trages (r?f?rentiels de mots cl?s, strat?gie de correction automatique de la requ?te, ...) et ?valuation de l?effet sur le corpus - R?daction du cahier des charges pour les ?volutions logicielles Vous m?nerez ? bien ces r?alisations avec le soutien des ?quipes de d?veloppement et dans le respect des orientations marketing. Enfin, vous op?rerez une veille technologique et concurrentielle active, et vous vous en inspirerez pour trouver des propositions d?am?liorations. Profil recherch? Formation bac + 5 (ing?nieur, master pro ou recherche) en informatique, technologies internet ou traitement automatique des langues. Stage de fin d??tude ou de c?sure. Comp?tences - Int?r?t marqu? pour le web et les moteurs de recherche ? Profil ? Ultra connect? ? - Manipulation de gros volumes de donn?es, ma?trise d?Excel et d?outils de manipulation de bases de donn?es (SQL, Access, Business Object, ...) - Motivation, sens cr?atif et savoir ?tre force de proposition, go?t pour la r?solution de probl?mes - Esprit d?analyse et capacit? de synth?se, rigueur - Qualit?s r?dactionnelles et ma?trise de la langue, - Bonne communication Modalit?s Site de France T?l?com ? Eysines (Pres de Bordeaux) 6 mois ? partir de mars 2010 Stage r?mun?r? Contact : Laurence Grauby (mail : laurence.grauby at orange.com, Tel : 05 56 16 92 22) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:08:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:08:18 +0100 Subject: Appel: SIGIR 2013 - Dublin, Ireland Message-ID: Date: Thu, 29 Nov 2012 07:42:30 -0800 (PST) From: S?amus Lawless Message-ID: <1354203750.14630.YahooMailNeo at web121405.mail.ne1.yahoo.com> X-url: http://www.sigir2013.ie/ =================================================== SIGIR 2013, Dublin, Ireland, 28 July-1 August, 2013 http://www.sigir2013.ie/ =================================================== CALL FOR PAPERS SIGIR is the major international forum for the presentation of new research results and for the demonstration of new systems and techniques in the broad field of information retrieval (IR). The Conference and Program Chairs invite all those working in areas related to IR to submit original full papers, short papers, and proposals for tutorials, workshops, and demonstrations of systems. SIGIR 2013 welcomes contributions related to any aspect of IR theory and foundation, techniques, and applications. Relevant topics include, but are not limited to: - Document Representation and Content Analysis (e.g., text representation, document structure, linguistic analysis, multi-lingual IR, cross-lingual IR, NLP for IR, information extraction, sentiment analysis, clustering, classification, topic models, facets, text streams) - Queries and Query Analysis (e.g., query representation, query suggestion, query reformulation, query intent, conversational search, query log analysis, session analysis, question answering) - Users and Interactive IR (e.g., user models, user studies, user feedback, search interface, summarization, task models, personalized search) - Retrieval Models and Ranking (e.g., IR theory, language models, probabilistic retrieval models, feature-based models, learning to rank, combining searches, diversity) - Search Engine Architectures and Scalability ( e.g., indexing, compression, distributed IR, P2P IR, mobile devices) - Filtering and Recommending (e.g., content-based filtering, collaborative filtering, recommender systems, profiles) - Evaluation (e.g., test collections, effectiveness measures, experimental design) - Web IR and Social Media Search (e.g., link analysis, click models/behavioural modelling, social tagging, social network analysis, advertising and search, blog search, microblog search, forum search, community-based QA (CQA), adversarial IR, vertical and local search) - IR and Structured Data (e.g., XML search, ranking in databases, desktop search, entity search) - Multimedia IR (e.g., image search, video search, speech/audio search, music IR) - Other Applications (e.g., digital libraries, enterprise search, genomics IR, legal IR, patent search, text reuse) Important Dates: - Monday 21 January 2013: Abstracts for full research papers due - Monday 28 January 2013: Full research papers due - Monday 4 February 2013: Workshop proposals due - Monday 18 February 2013: Short papers, demonstration, and tutorial proposals due - Monday 11 March 2013: Notification of workshop acceptances - Monday 11 March 2013: Doctoral consortium proposals due - Monday 15 April 2013: All other acceptance notifications - Sunday 28 July 2013: Conference begins in Dublin Information on how to submit will be available in mid-December, 2012. For details, please visit?http://www.sigir2013.ie/. Program Committee Chairs Maarten de Rijke, University of Amsterdam, The Netherlands Diane Kelly, University of North Carolina, Chapel Hill, USA Tetsuya Sakai, Microsoft Research Asia, China General Conference Chairs Gareth Jones, Dublin City University, Ireland P?raic Sheridan, CNGL, Dublin City University, Ireland -------------------------------------------------------------------------------------------- We apologize if you receive duplicates of this CFP. Please feel free to distribute it to those who might be interested. -------------------------------------------------------------------------------------------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:21:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:21:25 +0100 Subject: Seminaire: Alpage, Sandra Kuebler, 7 decembre 2013, Paris Message-ID: Date: Fri, 30 Nov 2012 11:22:01 +0100 From: Marie Candito Message-ID: ************** S?minaire Alpage ******************* S?minaire de l'?cole doctorale de Paris Diderot : Il s'agit du s?minaire de recherche en linguistique informatique organis? par l'?quipe Alpage, ?quipe mixte INRIA - Paris Diderot, sp?cialis?e en analyse syntaxique automatique et en traitement du discours. Le prochain s?minaire se tiendra : * vendredi 7 d?cembre de 11h ? 12h30 * en salle 3E91 ? l'UFRL, 16, rue Clisson, 75013 Paris (3e ?tage gauche) Toute personne int?ress?e est la bienvenue. ****************************** Sandra Kuebler (Indiana University) 20 Years of Statistical Parsing for German: What Have we Learned? Abstract: In this talk, I will look at the development of statistical approaches to parsing German from the beginnings by Dubey and Keller in 2003. German is interesting for parsing research since it counts as a morphologically rich language. But on the richness scale, it is fairly low, and it is still close to English. German is also an interesting case because there are two large-size treebanks available with two different annotation schemes. This puts us in a unique position to look into the influence of decisions in the annotation schemes, independent of the language. However, as the results so far show, there are more questions than answers. I will discuss results on using different parsers as well as different treebanks. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:23:20 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:23:20 +0100 Subject: Sujet de these: 2 PhD positions in computational Linguistics Message-ID: Date: Fri, 30 Nov 2012 10:35:10 +0000 From: Ilaria Tiddi Message-ID: X-url: http://www.uu.se/jobb/phd-students/annonsvisning?tarContentId=222147 Bonjour, J'ai pens? que des ?tudiants en TAL pourraient ?tre inter?ss?s ? cette offre: --- PhD positions in computational linguistics at Uppsala University We are currently advertising for two salaried PhD student positions. You can find the announcement at: http://www.uu.se/jobb/phd-students/annonsvisning?tarContentId=222147 ---- Dans le groupe du prof. Joakim Nivre. Cordialement, Ilaria TIDDI PhD Student KMi Department - The Open University ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:26:34 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:26:34 +0100 Subject: Appel: Coria 2013 et RJCRI 2013 (Report date de soumission) Message-ID: Date: Fri, 30 Nov 2012 14:50:43 +0100 From: Catherine Berrut Message-Id: <624A7440-6414-44EC-A5BC-0CFFCD57DAC6 at imag.fr> X-url: http://coria.unine.ch X-url: http://coria.unine.ch/rjcri.htm La date de soumission des articles ? Coria 2013 et RJCRI 2013 est repouss?e au 14 d?cembre. ========================================================= CORIA 2013, Neuch?tel (Suisse), du 3 au 5 Avril 2013 CORIA 2013 (http://coria.unine.ch) est la dixi?me ?dition de la COnf?rence en Recherche d'Information et Applications. Organis?e avec le support de l'ARIA (Association francophone de Recherche d'Information et Applications, http://www.asso-aria.org), elle est la principale manifestation francophone dans ce domaine. CORIA a pour but de rassembler les ?quipes et les chercheurs menant des travaux scientifiques dans le domaine de la recherche d'informations : recherche d'information sur le web, extraction d'information au sein de documents multim?dia, analyse d'opinion ou de r?seaux sociaux, contextes monolingue ou multilingue, recherche de documents num?riques et d'images, apprentissage et classification automatiques, interfaces homme-machine pour l'acc?s ? l'information, etc. CORIA se veut largement ouverte ? l'ensemble de la communaut? scientifique concern?e par la Recherche d'Information. Apr?s s'?tre tenue ? Toulouse, Grenoble, Lyon, Saint-?tienne, Lannion, Toulon, Sousse (Tunisie, en partenariat avec CIFED), Avignon, Bordeaux (en partenariat avec CIFED), CORIA aura lieu cette ann?e du 3 avril au 5 avril 2013 ? Neuch?tel (Suisse). L'activit? scientifique en recherche d'information conna?t une ?volution forte depuis la g?n?ralisation du web et, plus r?cemment, le d?veloppement de l'informatique nomade. Les limites du domaine sont elles-m?mes en mutation et favorisent les synergies avec les travaux en apprentissage automatique, traitement automatique des langues, traitement de l'image, traitement de la parole, communication ?crite et documents, syst?mes d'information et bases de donn?es, repr?sentation et gestion des connaissances... Les domaines d'application sont vastes et peuvent ?tre appliqu?s au web dans sa globalit? ou restreints par exemple ? des biblioth?ques num?riques ou des r?seaux sociaux. Le public vis? par CORIA 2013 est celui des universitaires et chercheurs - confirm?s ou non -, des industriels et des sp?cialistes du domaine et des ?tudiants en Master se dirigeant vers les m?tiers de la Recherche. Les soumissions peuvent ?tre faites en anglais ou en fran?ais. Les contributions peuvent concerner des travaux acad?miques ou des applications industrielles. Le programme pr?voit deux conf?rences invit?es, l'une de Jamie Callan (CMU), la seconde de Donna Harman (NIST). Ces deux conf?renciers feront par ailleurs un cours d?di?s aux doctorants lors d'un s?minaire du CUSO, le mardi 2 avril 2013 (le jour pr?c?dant la conf?rence). Pendant la conf?rence CORIA 2013 seront ?galement organis?es les 8e Rencontres Jeunes Chercheurs en Recherche d'Information (RJCRI). Elles ont pour objectif de permettre ? tous les doctorants de pr?senter leur probl?matique de recherche, d'?tablir des contacts avec des ?quipes travaillant sur des domaines similaires ou connexes, et d'offrir ? l'ensemble de la communaut? un aper?u des axes de recherche actuels. Les travaux s?lectionn?s pour les RJCRI donneront lieu ? une pr?sentation orale et sous forme de poster. Cette ann?e, les soumissions conjointes RJCRI et CORIA sont autoris?es (voir modalit?s dans RJCRI http://coria.unine.ch/rjcri.htm ) Th?matiques (liste non exhaustive) - Th?orie et mod?les formels pour la RI : mod?le logique, mod?les de langages - Multilinguisme : Recherche d'information multilingue, traduction automatique - Multim?dia (images, audio, vid?os, son, musique) : indexation, navigation, acc?s, interactions avec le texte - Passage ? l'?chelle : indexation, performances, architectures - Classification automatique, clustering, ranking, apprentissage automatique - Filtrage, routage, d?tection de nouveaut?s - Mod?lisation du contexte, personalisation - Traitement Automatique de la Langue Naturelle pour la recherche d'information - Syst?mes de Questions R?ponses - Extraction d'informations : ontologies, ressources et recherche d'informations, d?tection d'entit?s nomm?es - Web : grands graphes, utilisation de la topologie du web, lois de puissances, citations, analyse de liens - RI et documents structur?s : RI et XML, RI pr?cise et recherche de passages - R?seaux sociaux : analyse de blogs et de sites communautaires, suivi de conversations, analyse de rumeurs, analyse de sentiments, d?tection d'opinion - Recherche collaborative : filtrage, syst?mes de recommandation - Interaction utilisateur : interrogation flexible, interfaces, visualisation, mod?lisation de l'utilisateur, accessibilit?, indexation collaborative - Traitement et repr?sentation des connaissances : logique floue, m?ta-donn?es, ontologies, web s?mantique, ing?nierie des connaissances - Biblioth?ques num?riques : RI sur des livres num?ris?s, robustesse, OCR et indexabilit? - Syst?mes de recherche d'information d?di?s : recherche d'information g?nomique, g?ographique - RI distribu?e : recherche d'information mobile, situ?e, P2P - Outils pour la recherche d'information : ?valuation, bancs d'essais, m?triques, exp?rimentations qualitatives des syst?mes Dates importantes La soumission des articles se fera en deux ?tapes : d'abord la soumission d'un r?sum? et ensuite la soumission de l'article. Le calendrier de soumission est le m?me pour CORIA et les RJCRI : - Date limite de soumission des articles : 14/12/2012 - R?ponse aux auteurs : 01/02/2013 - Date limite de soumission de la version finale : 22/02/2013 Site de d?p?t des articles de Coria : https://www.easychair.org/conferences/?conf=coria2013 Site de d?p?t des articles de RJCRI : https://www.easychair.org/conferences/?conf=rjcri2013 Format des articles - Les soumissions peuvent ?tre faites en anglais ou en fran?ais. - Les contributions peuvent concerner des travaux acad?miques ou des applications industrielles. - Les textes de communications doivent comporter 16 pages maximum au format des revues Hermes. Ils doivent ?tre pr?c?d?s d'une page de garde comportant le titre, les noms et coordonn?es pr?cises des auteurs, une liste de mots cl? en fran?ais et en anglais, un r?sum? d'une vingtaine de lignes au maximum. La mention ? article soumis ? CORIA et RJCRI ? doit ?tre port?e sur la page de garde le cas ?ch?ant. - Les articles peuvent ?tre ?crits en Word ou en LaTeX. - Le format des articles Word et LaTeX peut ?tre t?l?charg? sur le site Hermes. - Les articles d?pos?s doivent ?tre au format PDF exclusivement. Modalit?s RJCRI : voir http://coria.unine.ch/rjcri.htm Catherine Berrut, Professeur Universit? Joseph Fourier Laboratoire LIG et Polytech Grenoble BP 53 - 38041 Grenoble cedex 9 tel : 04 76 51 42 63 mail : catherine.berrut at imag.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:30:07 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:30:07 +0100 Subject: Livre: Experimentations et evaluations en fouille de textes Message-ID: Date: Fri, 30 Nov 2012 16:05:51 +0100 From: "Ars" Message-ID: <008d01cdcf0c$38e71d40$aab557c0$@fr> Exp?rimentations et ?valuations en fouille de textes un panorama des campagnes DEFT Collection Syst?mes d'information et organisations documentaires, sous la direction de St?phane Chaudiron sous la direction de Cyril Grouin - Dominic Forest La fouille de textes est une activit? combinant traitements informatiques et donn?es linguistiques avec comme objectif principal l?extraction et l?organisation automatique des informations pr?sentes dans les textes. Deux familles de m?thodes permettent d?atteindre ce but : celles ? base de connaissances d?experts et celles reposant sur un apprentissage automatique supervis?. Une campagne d??valuation consiste ? confronter les syst?mes d?velopp?s par plusieurs ?quipes sur un m?me jeu de donn?es et en un temps limit?. Cr?? en 2005 ? l?image des campagnes anglo-saxonnes, le d?fi fouille de textes (DEFT) est aujourd?hui la seule campagne d??valuation francophone en fouille de textes. Cet ouvrage rassemble les m?thodes utilis?es lors des diff?rentes ?ditions du d?fi. Les th?matiques rel?vent de la classification de documents en genres et th?mes, de la fouille d?opinions et de l?identification de la p?riode de parution d?un document. Les coordonnateurs Ing?nieur d?Etudes CNRS au LIMSI, Cyril Grouin travaille sur l?anonymisation de documents cliniques et sur les entit?s nomm?es ?tendues. Il coorganise les campagnes d??valuation DEFT sur la fouille de textes. Dominic Forest est professeur agr?g? ? l?Ecole de biblioth?conomie et des sciences de l?information de l?Universit? de Montr?al. Ses recherches portent sur la fouille de textes et les humanit?s num?riques. Nous vous remercions de l'accueil que vous r?serverez ? cet ouvrage et esp?rons qu'il suscitera l'int?r?t de vos lecteurs. Pour information : ISBN : 978-2-7462-3836-7 - Format : 15,5 x 23,5 - 248 p. - 59 ? ?diteur : Hermes - Lavoisier Vous pouvez vous procurer cet ouvrage dans toutes les librairies sp?cialis?es et sur le site Lavoisier : www.lavoisier.fr Exp?rimentations et ?valuations en fouille de textes un panorama des campagnes DEFT Sommaire : Premi?re partie - Introduction Chapitre 1. Exp?rimentations et ?valuations en fouille de textes : un panorama des campagnes DEFT Deuxi?me partie - Les campagnes en genres et th?mes Chapitre 2. D?tecter les ruptures th?matiques dans les discours : synergie entre supervision et non- supervision Chapitre 3. L??quipe du GRDS au DEFT2006 : Indexo-II Chapitre 4. Pr?-traitements classiques ou par analyse distributionnelle : application aux m?thodes de classification automatique d?ploy?es pour DEFT2008 Troisi?me partie - Les campagnes en fouille d?opinions Chapitre 5. Classification d?opinions et convergence des techniques symboliques, statistiques et distributionnelles Chapitre 6. DEFT2009 : essais d?optimisation d?une proc?dure de base pour la t?che 1 Chapitre 7. D?tection de la subjectivit? et cat?gorisation de textes subjectifs par une approche mixte symbolique et statistique Quatri?me partie - Les campagnes diachroniques Chapitre 8. Datation d?un article de journal par analyse lexicale et statistique Chapitre 9. Syst?me du LIA pour la campagne DEFT2010 Chapitre 10. Apprentissage supervis? et paresseux pour la fouille de textes Chapitre 11. M?thodes pour l?arch?ologie linguistique : datation par combinaison d?indices temporels Index ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:53:32 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:53:32 +0100 Subject: Job: Stage master recherche, Laboratoire ERIC Message-ID: Date: Wed, 28 Nov 2012 15:46:39 +0100 From: Ah-Pine Julien Message-ID: <50B623CF.5070607 at eric.univ-lyon2.fr> Bonjour, Le laboratoire ERIC propose un stage de niveau master orient? recherche d'une dur?e de 6 mois ? partir de janvier 2013. Le sujet porte sur les m?thodes hybrides combinant les approches symboliques et les approches statistiques dans le cadre de t?ches en Traitement Automatique de la Langue (reconnaissance d'entit?s nomm?es, d?tection d'opinions notamment dans les m?dias sociaux). Pour plus de d?tails et pour candidater merci de consulter le document ci-dessous. Par ailleurs, merci de transf?rer ce message ? des ?tudiants ou d?partements susceptibles d'?tre int?ress?s par l'offre. Bien cordialement, ------------------------------------------------------------------------------- Combining rule-based and statistical-based techniques in Natural Language Processing Research internship at ERIC lab - 6 months starting from january 2013 1 Context This internship proposal is in the context of the french funded project Imagiweb http://eric.univ-lyon2.fr/~jvelcin/imagiweb/. The project is concerned with the analysis of the representation that entities want to disseminate about themselves through web 2.0 tools. The entities the project target are of different kinds and could be politicians, companies and so on. How do the recipients perceive these entities after the statements they make through their posts, blogs and so on ? What are the different types of representations/opinions about these entities that emerge from social media data and from different communities ? In order to address these general issues, the project proposes an approach that mixes different domains such as sociology, semiology, knowledge bases, natural language processing and text mining. The project gathers six partners : one company, AMI software, one french group, EDF, one american group, Xerox and three public research labs, CEPEL (in political science), ERIC lab and LIA (in computer science). 2 Topic description In this context, the ERIC lab http://eric.univ-lyon2.fr/ is openning an internship on the general topic \Combining rule-based and statistical-based techniques in Natural Language Processing". The goal of this work is to provide a state-of-the-art report on hybrid techniques (mixing rule-based and statistical-based) used in NLP tasks. Rule-based techniques in NLP generally have high precision but rather poor recall whereas statistical- based methods rather have lower precision but higer recall performances. Many attemps have been proposed in order to combine both types of approaches in order to produce better algorithms (see a non exhaustive list of references below). A more particular attention will be paid to the following NLP tasks : named entity recognition and opinion detection in social media data. The recruited candidate will have to (i) review the main strategies proposed in the literature for combining rule-based and statistical-based methods; (ii) focus on the techniques that could suit the data and tasks of the Imagiweb project and (iii) implement the retained methods in order to conduct some experiments that compare the different techniques. As a result, the implemented algorithms will be tested on a dataset of tweets and/or blogs (in french) provided by other partners in the project in order to help with the detection of entities representations and recipients opinions. This internship will be conducted in close relationship with Xerox http://www.xrce.xerox.com/. 3 Requirements Master degree in machine learning and/or computational linguistics. The ideal candidates have prior work experiences with NLP tools, R and/or Python and have a good understanding of french. 4 Salary Around 436 euros / month 5 Contact and application To apply, please send an email to Julien Ah-Pine mailto:julien.ah-pine at eric.univ-lyon2.fr and Julien Velcin mailto:julien.velcin at eric.univ-lyon2.fr with a resume, a cover letter, the candidate's grades and the name of two references we can contact for recommendation letters. References [1] Julien Ah-Pine and Guillaume Jacquet. Clique-based clustering for improving named entity recognition systems. In EACL, pages 51{59, 2009. [2] Caroline Brun. Detecting opinions using deep syntactic analysis. In Galia Angelova, Kalina Bontcheva, Ruslan Mitkov, and Nicolas Nicolov, editors, RANLP, pages 392{398. RANLP 2011 Organising Committee, 2011. [3] Thierry Charnois, Marc Plantevit, Christophe Rigotti, and Bruno Cremilleux. Fouille de donn?es s?quentielles pour l'extraction d'information dans les textes. Revue Traitement Automatique des Langues (TAL), 50(3):59{87, December 2009. [4] Dominic Rout Diana Maynard, Kalina Bontcheva. Challenges in developing opinion mining tools for social media. In Proceedings of the @NLP workshop associated with LREC 12, 2012. [5] Ronen Feldman, Benjamin Rosenfeld, and Moshe Fresko. Teg—a hybrid approach to information extraction. Knowl. Inf. Syst., 9(1):1{18, January 2006. [6] Moshe Fresko, Binyamin Rosenfeld, and Ronen Feldman. A hybrid approach to ner by memm and manual rules. In Proceedings of the 14th ACM international conference on Information and knowledge management, CIKM '05, pages 361{362, New York, NY, USA, 2005. ACM. [7] Natalia Grabar, Marie Dupuch, Amandine P?rinet, and Thierry Hamon. Hybrid 2012, innovative hybrid approaches to the processing of textual data. In Proceedings of Hybrid 12, workshop associated to EACL 12, 2012. [8] Kun-Lin Liu, Wu-Jun Li, and Minyi Guo. Emoticon smoothed language models for twitter sentiment analysis. In AAAI, 2012. [9] Xiaohua Liu, Shaodian Zhang, Furu Wei, and Ming Zhou. Recognizing named entities in tweets. In Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Lan- guage Technologies - Volume 1, HLT '11, pages 359{367, Stroudsburg, PA, USA, 2011. Association for Computational Linguistics. [10] Xiaohua Liu, Ming Zhou, Furu Wei, Zhongyang Fu, and Xiangyang Zhou. Joint inference of named entity recognition and normalization for tweets. In Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics: Long Papers - Volume 1, ACL '12, pages 526{535, Stroudsburg, PA, USA, 2012. Association for Computational Linguistics. [11] David Nadeau and Satoshi Sekine. A survey of named entity recognition and classi cation. Linguisticae Investigationes, 30(1):3{26, January 2007. Publisher: John Benjamins Publishing Company. [12] Alexander Pak and Patrick Paroubek. Le microblogage pour la microanalyse des sentiments et des opinions. TAL, 51(3):75{100, 2010. [13] Carlos Rodr?guez-Penagos, Jens Grivolla, and Joan Codina Fib?. A hybrid framework for scalable opinion mining in social media: detecting polarities and attitude targets. In Proceedings of the Workshop on Se- mantic Analysis in Social Media, pages 46{52, Stroudsburg, PA, USA, 2012. Association for Computational Linguistics. [14] Rohini Srihari, Cheng Niu, and Wei Li. A hybrid approach for named entity and sub-type tagging. In Proceedings of the sixth conference on Applied natural language processing, ANLC '00, pages 247{254, Stroudsburg, PA, USA, 2000. Association for Computational Linguistics. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:37:50 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:37:50 +0100 Subject: Info: Vers un etiqueteur libre du francais / Towards an open-source French tagger Message-ID: Date: Wed, 28 Nov 2012 11:27:17 +0100 From: Agata Savary Message-ID: <50B5E705.3010102 at univ-tours.fr> X-url: http://hackage.haskell.org/package/concraft ENGLISH VERSION FOLLOWS =================================== CONCRAFT (http://hackage.haskell.org/package/concraft) est un ?tiqueteur libre du polonais bas? sur l'id?e innovante des CRF contraints (Constrained Conditional Random Fields, cf [1]). Il permet de ma?triser la complexit? des CRF classiques en limitant l'ensemble des ?tiquettes consid?r?es pour un mot par la sortie d'un analyseur morphologique. Il obtient de meilleurs r?sultats que les autres taggers du polonais, en particulier en ce qui concerne les mots inconnus. Nous souhaiterions ?tudier l'adaptabilit? de CONCRAFT ? une langue fl?chie d'une autre famille. Ainsi, nous sommes ? la recherche : - d'un corpus fran?ais annot? morphologiquement (de pr?f?rence avec les parties du discours et avec les traits flexionnels tels que nombre, genre, temps, etc.), - d'un analyseur morphologique ? large couverture dont le tagset serait ?quivalent ? celui du corpus, - d'autres ?tiqueteur libres du fran?ais pour une ?tudes contrastive. Une version fran?aise du CONCRAFT, obtenue gr?ce ? cette exp?rience, serait distribu?e sous une licence libre (probablement BSD). [1] Jakub Waszczuk "Harnessing the CRF complexity with domain-specific constraints. The case of morphosyntactic tagging of a highly inflected language", in Proceedings of COLING 2012, Mumbai, India. =================================== CONCRAFT (http://hackage.haskell.org/package/concraft) is an open source tagger for Polish based on a novel idea of a Constrained Conditional Random Fields model (see [1] for details). It allows to harness the complexity of CRFs by constraining the set of labels for a given token by the output of a morphological analyzer. It outperforms existing taggers for Polish, notably with respect to unknown words. We are planning to explore CONCRAFT's adaptability to an inflected language of a different family. Thus, we are looking for: - a morphologically annotated corpus of French (preferably with both parts-of-speech and morphological features such as gender, number, tense, etc.), - a large-coverage morphological analyser whose tagset would be equivalent to the corpus tagset, - other freely-available taggers for French in view of a contrastive analysis. A French version of CONCRAFT obtained in this experiment would be distributed under an open license (probably BSD). [1] Jakub Waszczuk "Harnessing the CRF complexity with domain-specific constraints. The case of morphosyntactic tagging of a highly inflected language", in Proceedings of COLING 2012, Mumbai, India. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:58:01 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:58:01 +0100 Subject: Ecole: Programme du stage NooJ, INALCO, 21-25 janvier 2013 Message-ID: Date: Wed, 28 Nov 2012 16:05:19 +0100 From: Max Silberztein Message-Id: <867CB836-29B6-40F2-B7B1-F3F4D3A47CAE at gmail.com> Stage intensif NooJ ? l?INALCO 21 ? 25 janvier 2013 65 rue des Grands Moulins, 75013 Paris (attention : places limit?es) PROGRAMME Lundi 21 janvier 2013 9H-12H30 : Fouille de texte : textes et corpus, requ?tes et concordances, analyses statistiques. 14H Masako Watabe (INALCO) : Morphologie du rromani 14H40 Maximiliano Duran (INALCO) : Dictionnaire et morphologie du quechua 15H20 Hamid Annouz (INALCO) : Conjugaison des verbes berb?res 15H40 Kaci Ferroudja (INALCO) : La particule ? d ? en berb?re Mardi 22 janvier 2013 9H-12H30 : Lexique & morphologie : Unit?s Linguistiques Atomiques, dictionnaires, flexion et d?rivation. 14H Xavier Blanco (Univ. Autonome de Barcelone) : Dictionnaires de l?espagnol et du catalan 15H Vincent B?net (INALCO) : Dictionnaire et morphologie du russe Mercredi 23 janvier 2013 9H-12H30 : Syntaxe locale : requ?tes syntaxiques, grammaires locales, extraction d?entit?s nomm?es. Thierry Declerck (DFKI GmbH): Analyse des sentiments dans les domaines financier et politique Sandrine Bassols : Dictionnaire et morphologie du kurde Jeudi 24 janvier 2013 9H-12H30 : Syntaxe structurelle : Grammaires hors contexte, contraintes d?accord et arbres structurels. 14H Philippe Lambert (Inst. Jean Lamour) : Questionnaires ? r?ponses ouvertes pour les nanosciences 15H Ariane Louvet : Etude des blogs vietnamiens avec viet4nooj Vendredi 25 janvier 2013 9H-12H30 : S?mantique : Analyse & g?n?ration transformationnelle, lev?e d?ambigu?t? s?mantique 14H Meng Sun (INALCO) : D?tection automatique d?opinions pour le chinois et le fran?ais 15H Slim Mesfar (ENSI) : Annotations syntactico-s?mantiques de l?arabe Ce stage s?adresse particuli?rement aux ?tudiants de Master, doctorants et chercheurs int?ress?s par la linguistique descriptive, la linguistique de corpus et l?analyse automatique de textes dans une perspective de sciences humaines. Les inscriptions sont gratuites mais obligatoires. Attention : les places sont limit?es ? 50 participants maximum. Les ?tudiants de Master qui peuvent et souhaitent valider le stage aupr?s de leur d?partement devront imp?rativement rendre un devoir ? l'issue du stage. Chaque participant devra venir avec son ordinateur portable sur lequel NooJ doit ?tre d?j? install? (PC Windows, Mac OSX ou LINUX) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:32:06 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:32:06 +0100 Subject: Appel: Atelier SOS'2013, Extension de la date de soumission Message-ID: Date: Fri, 30 Nov 2012 17:34:33 +0100 From: Laurie Serrano Message-ID: X-url: http://weblab-project.org/workshop/sos2013 Extension de la date de soumission au mercredi *5 d?cembre 2012*.* *Merci de diffuser cet appel ? communications le plus largement possible. Toutes nos excuses pour d'?ventuelles r?ceptions multiples.* *Quatri?me ?dition de l?atelier "Sources Ouvertes et Services"* *SOS?2013 (en association avec EGC?2013)* *29 janvier 2013 - Toulouse, France* http://weblab-project.org/workshop/sos2013 *Pr?sentation de l'atelier :* Pour sa quatri?me ?dition, l'atelier SOS'2013 propose de poursuivre une r?flexion commune autour des diverses probl?matiques li?es au traitement de donn?es disponibles en sources ouvertes (SO). Les SO d?signent l'ensemble des m?dias accessibles librement, de fa?on gratuite ou payante, tels qu'Internet, les bases de donn?es publiques, les journaux, les CD-ROM, les cha?nes de t?l?vision et de radio, etc., par opposition aux sources ferm?es dont la consultation n?cessite de disposer d'autorisations sp?cifiques. Ces SO fournissent d?importants volumes de donn?es multim?dia h?t?rog?nes (image, texte, audio, vid?o, etc.) qui n?cessitent des traitements adapt?s en vue de leur exploitation. Cet atelier est d?di? ? toutes ces ?tapes, partant de la phase de d?couverte des sources d?information, en passant par la collecte et l'analyse des donn?es collect?es jusqu?? la phase de capitalisation et d?exploitation des connaissances. Un int?r?t particulier sera port? aux choix architecturaux retenus pour la r?alisation d?applications exploitant les SO. En effet, ces applications tentent g?n?ralement de faire cohabiter plusieurs briques logicielles (COTS, logiciels open source, d?veloppements ad-hoc, etc.) en vue de la r?alisation d'une t?che particuli?re. Cela repr?sente un d?fi scientifique et technique auquel les recherches sur l?encha?nement des traitements algorithmiques capables d'exploiter ces donn?es peuvent contribuer. L?accent sera mis sur les architectures orient?es services (SOA) et sur l?utilisation des technologies du Web S?mantique. Pour cette nouvelle ?dition, l'atelier SOS souhaite s'int?resser ?galement au traitement des grandes masses de donn?es ("Big data"). L'explosion r?cente des donn?es disponibles sur le Web a fait ?merger de nouvelles probl?matiques visant ? adapter et optimiser toute la chaine de traitement de l'information face aux nouveaux volumes ? traiter. Cet atelier souhaite rassembler des chercheurs issus ? la fois des mondes acad?mique et industriel afin d'obtenir un panel repr?sentatif d'acteurs et de leurs travaux sur les th?mes pr?sent?s ci-apr?s. *Th?mes de l'atelier :* Les auteurs sont invit?s ? envoyer des propositions ayant une port?e th?orique, m?thodologique ou pratique, sur l?un des th?mes suivants (liste non exhaustive) : * Identification et d?couverte automatique de sources d?information, * Acc?s et collecte d?information ? partir de sources ouvertes (Web, r?seaux sociaux, flux RSS et autres), * Classification, filtrage des informations d'int?r?t, * Extraction d?information ? partir de textes non structur?s et/ou utilisant des vocabulaires sp?cifiques (blogs, langage sms, forums), * Extraction d?information ? partir de gros volumes de donn?es multim?dia (texte, image, vid?o, audio), * Analyse des sentiments/opinions dans les m?dias sociaux (r?seaux sociaux, blogs, forums), * Mod?lisation et capitalisation des connaissances extraites ? partir de sources ouvertes (ontologies, annotations s?mantiques), * Exploitation des connaissances extraites ? partir de sources ouvertes : raisonnement, aide ? la d?cision, visualisation, * D?tection de signaux faibles, * Evaluation et qualification des sources d?information, * Evaluation et qualification des informations extraites ? partir de sources ouvertes, * Inf?rence, fouille et validation de liens entre donn?es, * Plate-formes d?int?gration de services de traitement h?t?rog?nes : interop?rabilit? des services, orchestration s?mantique, * Applications de veille strat?gique ou ?conomique ? partir de sources ouvertes, * Applications de renseignement d?origine sources ouvertes (ROSO), * Applications de traitement de l'information orient?es "Big data". *Comit? de programme :* Florence Amardeilh (Mondeca) Ga?l de Chalendar (CEA LIST) Olivier Corby (INRIA, Sophia Antipolis) Valentina Dragos (ONERA) Adil El Ghali (IBM) Christian Fluhr (GEOL Semantics) Bruno Grilheres (Cassidian) Dafni Stampouli (Cassidian) Nicolas Hernandez (Universit? de Nantes) Alexandre Pauchet (LITIS, Rouen) Ha?fa Zargayouna (LIPN, Universit? de Paris 13) Maroua Bouzid (GREYC, Universit? de Caen) Cassia Trojahn (IRIT, Toulouse) Klaus Atzenbeck (IISYS, Hof University, Germany) Sinan Yurtsever (Atos, Turkey) Nizar Ghoula (Universit? de Gen?ve, Switzerland) *Dates importantes :* * Date limite de soumission : *5 D?cembre 2012* * Notification aux auteurs : 21 D?cembre 2012 * Version finale : 2 Janvier 2013 * Date de l'atelier : 29 Janvier 2013 *Soumission :* Cet atelier invite les auteurs ? soumettre leurs articles en fran?ais ou en anglais (r?sum? en anglais souhait? dans les deux cas). Les articles soumis ne devront pas d?passer 12 pages (annexes comprises). Nous vous demandons de respecter les instructions des organisateurs de EGC'2013 et d'utiliser la derni?re version du format RNTI disponible ? l'adresse suivante : http://www.antsearch.univ-tours.fr/rnti Chaque proposition sera ?valu?e par au moins deux membres du comit? de programme. Les communications retenues feront l?objet d?une pr?sentation orale par l'un des auteurs (en fran?ais ou en anglais ? leur convenance). La journ?e commencera par une pr?sentation d?un conf?rencier invit? sur l'un des th?mes de l?atelier et s?ach?vera par une table ronde autour des probl?matiques li?es ? l?exploitation des sources ouvertes. *Les articles doivent ?tre envoy?s ? l'adresse suivante : sos2013 at weblab-project.org* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:45:15 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:45:15 +0100 Subject: Journee: Journee d'informations sur le projet Dariah, 30 janvier 2013, Paris Message-ID: Date: Wed, 28 Nov 2012 14:20:23 +0100 From: Jean-Luc Minel Message-ID: <50B60F97.7040000 at u-paris10.fr> X-url: http://www.tge-adonis.fr/international/dariah Le 30 janvier 2013, le TGE Adonis organise une journ?e d'information sur le projet Dariah - /Digital Research Infrastructure for the Arts and Humanities/. Ce projet se donne pour objectif de construire une infrastructure num?rique http://www.tge-adonis.fr/international/dariah, en rassemblant les diff?rentes initiatives en mati?re d'humanit?s num?riques au niveau europ?en. Si vous souhaitez en prendre connaissance, mieux appr?hender ses diff?rentes facettes (institutionnelles, scientifiques juridiques, financi?res, etc.), si vous vous posez des questions sur l'int?r?t, pour votre laboratoire ou votre ?quipe, ? y prendre part, cette journ?e sera l'occasion de rencontrer diff?rentes personnes d?j? impliqu?es dans le projet, de m?me que plusieurs de ses responsables/coordinateurs, au niveau fran?ais et au niveau europ?en. Interviendront notamment Jacques Dubucs (MESR), Patrice Bourdelais (INSHS), Jean-Luc Pinol (TGE Adonis), Laurent Romary (INRIA), Sophie David (TGE Adonis), Raymond B?rard (ABES), le Consortium Archives des Ethnologues de CORPUS-IR, Marin Dacos (Cl?o), Karl-Heinz M?rth (?sterreichische Akademie der Wissenschaften), Sandra Collins (Digital Repository of Ireland). *Programme* : Le programme d?finitif sera mis en ligne dans les prochaines semaines sur le site du TGE. *Informations pratiques* Lieu : Amphith??tre Gustave Roussy (B?timent B, 2?me ?tage), Campus des Cordeliers, 15 rue de l'Ecole de M?decine, 75005 Paris http://maps.google.fr/maps?q=15+rue+de+l%E2%80%99Ecole+de+M%C3%A9decine&hl=fr&ie=UTF8&hnear=15+Rue+de+l%27%C3%89cole+de+M%C3%A9decine,+75006+Paris,+%C3%8Ele-de-France&t=m&z=16, de 10h ? 18h (accueil ? partir de 9h30). *Inscription* Compte-tenu du nombre limit? de places, nous vous remercions de bien vouloir annoncer votre pr?sence en vous inscrivant via le formulaire disponible ici http://www.tge-adonis.fr/webform/inscription-journee-info-dariah-30-01-13 . *Le comit? d'organisation* : Nadine Dardenne, Sophie David, Nicolas Larrousse, Jean-Luc Minel ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:34:34 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:34:34 +0100 Subject: Ressources: DGT-ACQUIS, New freely available large-scale aligned parallel corpus Message-ID: Date: Wed, 28 Nov 2012 10:26:38 +0100 From: Ralf Steinberger Message-id: <000d01cdcd4a$7852d1e0$68f875a0$@jrc.ec.europa.eu> X-url: http://langtech.jrc.ec.europa.eu/DGT-Acquis.html Following the release of the JRC-Acquis in 2006, the DGT-Translation Memory in several releases since 2007 and the ECDC-Translation Memory in 2012, we are now releasing the new parallel corpus DGT-Acquis. DGT-Acquis has been produced by the European Commission?s Directorate General for Translation (DGT) and it is being distributed by the Joint Research Centre (JRC). DGT-Acquis is a parallel collection of manually translated full-text documents in all 23 official EU languages, that has been paragraph-aligned for all 253 language pairs. It has been produced on the basis of the Official Journal (OJ) of the European Union (more specifically the L, LM, C, CA and CE Series). Languages: All 253 language pairs involving the following 23 languages: Bulgarian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Irish, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish and Swedish. URL: http://langtech.jrc.ec.europa.eu/DGT-Acquis.html Creator: European Commission - Directorate General for Translation ( http://ec.europa.eu/dgs/translation/index_en.htm DGT) Size: 3.54 million files; 5 GB in plain text format WHAT IS DGT-Acquis DGT-Acquis consists of a collection of Official Journal issues published in up to 23 languages between 2004 and 2011. The full-text documents have been paragraph-aligned automatically for all language pairs. The data is being distributed in several formats: (1) the original XML data and its corresponding TIFF files; (2) file level data in Formex4 format; (3) file level data in plain text format; and (4) the same data aligned at paragraph level. Users can thus make use of the aligned data or they can re-process the data using their own tools and methods. WHAT IS the difference between DGT-Acquis and the other resources distributed by the JRC While the translation memories DGT-TM and ECDC-TM are collections of individual translation units (or sentences) taken out of their full-text context, both JRC-Acquis and DGT-Acquis consist of full-text documents aligned at sentence or paragraph level. This allows using the data for applications that need to analyse entire texts, e.g. for discourse structure analysis, to detect domain information, for experiments on automatic summarisation, for translation studies, etc. Regarding the contents of the documents, JRC-Acquis and DGT-Acquis partially overlap for the period 2004 to 2006 while the documents for all other time periods should be unique. Comparing the resources used to produce DGT-Acquis and DGT-TM, DGT-TM is based exclusively on the L-Series of the Official Journal, while DGT-Acquis also contains the LM, C, CA and CE collections. The processing steps (data preparation and alignment) to produce the various data sets were entirely different. The format is not the same, and the processing quality of each of the resources is expected to be different, as well. For details on the resources and on the overlap between them, see the detailed descriptions of the resources at http://ipsc.jrc.ec.europa.eu/index.php?id=61. MOTIVATION FOR THIS RELEASE The public data release is in line with the general effort of the European Commission to support multilingualism, language diversity and the re-use of Commission information. It follows the release of the JRC-Acquis parallel corpus in 2006 (over 1 billion words in 22 languages), of the DGT-TM Translation Memory since 2007, the multilingual named entity resource JRC-Names in 2011, the multilingual multi-label classification tool (and accompanying text data) JRC EuroVoc Indexer (JEX) (22 languages), and further smaller multilingual resources. See http://ipsc.jrc.ec.europa.eu/index.php?id=61 for more information on these resources. WHAT DGT-ACQUIS CAN BE USED FOR DGT-ACQUIS is a large parallel corpus in electronic form. It can be used by specialists in computational linguistics to train statistical machine translation software, to generate multilingual dictionaries, to train and test multilingual information extraction software, to carry out testing and training of summarisation or discourse analysis software, to train and test cross-lingual clustering and classification, and more. Parallel corpora are also particularly useful for annotation projection across languages (http://publications.jrc.ec.europa.eu/repository/handle/111111111/1/simple-search?query=%28%28author%3ASteinberger%29+AND+%28title%3AAnnotation+title%3AParallel%29%29&from_advanced=true&conjunction3=AND&field4=type&conjunction2=AND&field3=ANY&field2=title&conjunction1=AND&query4=&field1=author&query1=Steinberger&query2=Annotation+Parallel&query3=&num_search_field=4) , which saves annotation effort and thus facilitates the development of highly multilingual text processing software. MORE INFORMATION ON DGT-ACQUIS At http://langtech.jrc.ec.europa.eu/JRC_Publications.html , you find detailed publications on the JRC?s multilingual language technology activity. For details on DGT-Acquis, however, there is not currently yet any detailed publication. Until further notice, please make reference to it by pointing to the web page http://langtech.jrc.ec.europa.eu/DGT-Acquis.html. WHAT NEXT? The JRC and collaborating European Union services are currently finalising the release of further highly multilingual linguistic resources. Ralf Steinberger http://langtech.jrc.ec.europa.eu/RS.html European Commission - Joint Research Centre (JRC) 21027 Ispra (VA), Italy URL ? Applications: http://emm.newsbrief.eu/overview.html URL ? Resources: http://ipsc.jrc.ec.europa.eu/index.php?id=61 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:40:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:40:14 +0100 Subject: These: Bassam Jabaian, Systemes de comprehension et de traduction de la parole Message-ID: Date: Wed, 28 Nov 2012 13:50:08 +0100 From: Bassam Jabaian Message-ID: <50B60880.1080103 at univ-avignon.fr> Bonjour, J'ai le plaisir de vous inviter ? la soutenance de ma th?se intitul?e "Syst?mes de compr?hension et de traduction de la parole : vers une approche unifi?e dans le cadre de la portabilit? multilingue des syst?mes de dialogue". La soutenance aura lieu le mardi 4 d?cembre 2012 ? 13h00 dans l'amphith?atre Blaise Pascal du Centre d'Enseignement et de Recherche en Informatique de l'Universit? d'Avignon (//339, chemin des Meinajari?s 84911 Avignon, ceri.univ-avignon.fr). Vous ?tes ?galement convi?s au pot de th?se qui suivra la soutenance. Bien cordialement, Bassam Jabaian ----------------------------------------------------------------------- Le jury de soutenance sera compos? de : M. Wolfgang Minker --- Professeur, Universit?t Ulm, ITDS, Ulm --- Rapporteur M. Fran?ois Yvon --- Professeur, Universit? Paris-Sud, LIMSI, Orsay --- Rapporteur Mme G?raldine Damnati --- Directrice de recherche, Orange Labs, Lannion --- Examinateur M. Alexandre Allauzen --- Ma?tre de Conf?rences, Universit? Paris-Sud, LIMSI, Orsay --- Examinateur M. Laurent Besacier --- Professeur, Universit? Joseph Fourier, LIG, Grenoble --- Directeur de th?se M. Fabrice Lef?vre --- Professeur, Universit? d'Avignon, CERI/LIA, Avignon --- Directeur de th?se R?sum? de la th?se : La g?n?ralisation de l'usage des syst?mes de dialogue homme-machine accro?t la n?cessit? du d?veloppement rapide des diff?rents composants de ces syst?mes. Les syst?mes de dialogue peuvent ?tre con?us pour diff?rents domaines d'application et dans des langues diff?rentes. La n?cessit? d'une production rapide pour de nouvelles langues reste un probl?me ouvert et crucial auquel il est n?cessaire d'apporter des solutions efficaces. Nos travaux s'int?ressent particuli?rement au module de compr?hension de la parole et proposent des approches pour la portabilit? rapide peu co?teuse de ce module. Les m?thodes statistiques ont montr? de bonnes performances pour concevoir les modules de compr?hension de la parole pour l'?tiquetage s?mantique de tours de dialogue. Cependant ces m?thodes n?cessitent de larges corpus pour ?tre apprises. La collecte de ces corpus est aussi co?teuse en temps et en expertise humaine. Dans cette th?se, nous proposons plusieurs approches pour porter un syst?me de compr?hension d'une langue vers une autre en utilisant les techniques de la traduction automatique. Les premiers travaux consistent ? appliquer la traduction automatique ? plusieurs niveaux du processus de portabilit? du syst?me de compr?hension afin de r?duire le co?t li? ? la production de nouvelles donn?es d'apprentissage. Les r?sultats exp?rimentaux montrent que l'utilisation de la traduction automatique permet d'obtenir des syst?mes performant avec un minimum de contribution humaine. Nos travaux impliquant ? la fois de la compr?hension de la parole et de la traduction automatique nous avons effectu? une comparaison approfondie entre les m?thodes utilis?es pour chacune des t?ches et nous avons propos? un d?codage conjoint bas? sur une m?thode discriminante qui ? la fois traduit une phrase et lui attribue ses ?tiquettes s?mantiques. Ce d?codage est obtenu par une approche ? base de graphe qui permet de composer un graphe de traduction avec un graphe de compr?hension. Cette repr?sentation peut ?tre g?n?ralis?e pour permettre des transmissions d'informations riches entre tous les composants du syst?me de dialogue. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:05:13 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:05:13 +0100 Subject: Appel: Interspeech 2013 Conference Message-ID: Date: Wed, 28 Nov 2012 18:56:37 +0100 From: Interspeech 2013 Message-Id: <0BB67EE2-636E-4219-A456-513D8A5CB756 at Interspeech2013.org> X-url: http://www.interspeech2013.org/ Interspeech 2013 Conference - First Call for Participation with special focus on "Speech in Life Sciences and Human Societies" Dear colleagues, It is our great pleasure to announce the forthcoming edition of INTERSPEECH, the annual conference of the International Speech Communication Association (ISCA), which will be held in Lyon, France, 25-29 August 2013. INTERSPEECH is the world's largest and most comprehensive conference on Spoken Language Processing science and technology. This edition will be the 14th in the annual series of Interspeech events and will coincide with the 25th anniversary of ISCA, formerly known as ESCA, which was born in France in 1988. INTERSPEECH 2013 is coordinated by AFCP (Association Francophone de la Communication Parl?e, i.e. the ?French-speaking? Special Interest Group of ISCA). The conference will be hosted in the Lyon Convention Center, which offers first-grade facilities in a very attractive city and region, at the heart of Europe. Speech is a fundamental human activity which runs across biology, medicine, psychology, sociology, anthropology or ecology. It is central to the organization and the development of human health, personality and intelligence. It is also essential to the synergy within human groups and their relationship with their environment. Besides the conventional acoustic and linguistic viewpoints on speech communication, all these related disciplines provide additional approaches to speech as the keystone of communication, cognition and interaction in human societies. The conference will thus promote an interdisciplinary approach covering all aspects of speech science and technology, ranging from fundamental contributions to practical applications, in a wide variety of areas. INTERSPEECH 2013 will consist of regular oral and poster sessions, plenary talks by internationally renowned experts, tutorials, exhibits, special sessions, show & tells and satellite events. INTERSPEECH papers are indexed in ISI, Engineering Index, Scopus, and Google Scholar. Our website will provide you with information and news including the various calls, the important dates, instructions, programs, and all useful arrangements for participating to the conference. The INTERSPEECH 2013 Organizing Committee is actively engaged in the preparation of the event and it will be a great honor and pleasure for the French community in Speech Sciences to welcome you to INTERSPEECH 2013 in Lyon, next summer. Bien amicalement, Fr?d?ric Bimbot (Chair) C?cile Fougeron (Co-Chair) Fran?ois Pellegrino (Co-Chair) Contact : conference-chairs at interspeech2013.org ------------------------------------------------------------------------ Interspeech 2013 Calls First Announcement CALL FOR SATELLITE WORKSHOPS The call for Satellite Workshops is now closed. INTERSPEECH 2013 satellite events will be announced and advertised on:www.interspeech2013.org/satellite_events.html CALL FOR TUTORIALS Submission Deadline: January 4, 2013 Notification of acceptance: February 4, 2013 Tutorial proposals covering interdisciplinary topics and/or focusing on important emerging areas of interest related to the conference are encouraged. We welcome applications which may be either "recent advances on..." some recently emerging specialized hot topics which deserves to be focused on, or ?crash-courses? targeted towards an audience who is looking for a comprehensive yet condensed overview of a wider area. Visit the Tutorial Page of the conference website for more information and for instructions on how to submit a tutorial proposal: www.interspeech2013.org/tutorials.html CALL FOR SPECIAL SESSIONS Submission Deadline: January 15, 2013 Notification of pre-selection: February 1, 2013 Final list of special sessions: May 22, 2013 Special sessions at Interspeech are designed to bring together researchers in relevant fields of interest, either on a targeted topic, or beyond the traditional scope of the conference. Prospective organizers are invited to submit a proposal via e-mail at special-session at interspeech2013.org For more information about the 2013 Special Session submission process :www.interspeech2013.org/special_sessions.html CALL FOR PAPERS Submission Deadline: March 18, 2013 Notification of acceptance: May 22, 2013 Camera-ready paper: May 29, 2013 Technical chairs : Lori Lamel, Pascal Perrier Contact : technical-chairs at interspeech2013.org Click here for the complete Call for Papers. CALL FOR SHOW & TELL AND OTHER SPECIAL EVENTS Show and Tell Submission Deadline: April 19, 2013 Notification of acceptance: May 22, 2013 The Show & Tell event is intended to provide professionals of various backgrounds with an opportunity to demonstrate their most recent progress, developments or innovation tracks, and interact with the conference attendees in an informal way. Other special events are in preparation and will be detailed within the forthcoming months. For more info on Show & Tell and to keep posted on other special events click here:www.interspeech2013.org/special_events.html SPONSORSHIP AND EXHIBIT OPPORTUNITIES If you consider becoming a sponsor of INTERSPEECH 2013 or an exhibitor at the conference, you are welcome to visit: http://www.interspeech2013.org/sponsors_exhibitors.html For any inquiry, please contact : sponsors-exhibitors at interspeech2013.org CONFERENCE ORGANIZATION The administrative organization and logistic coordination of the conference is carried out by INRIA Rennes Bretagne Atlantique and EUROPA ORGANISATION. To contact the organizers : organizers at interspeech2013.org CONFERENCE VENUE The Conference will be held at the Lyon Convention Center (CCC), Lyon, France. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 19:54:45 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 20:54:45 +0100 Subject: Job: Stage M2 en TAL Message-ID: Date: Wed, 28 Nov 2012 16:04:16 +0100 From: Isabelle Tellier Message-ID: <50B627F0.8030106 at univ-paris3.fr> X-url: http://www.leguide.com/information/fr/job/hf-stage-rdmoteur-de-recherche/ Le site web leguide.com propose un stage de niveau M2 en TAL : http://www.leguide.com/information/fr/job/hf-stage-rdmoteur-de-recherche/ Envoyer CV + lettre de motivation ? marty.patrick at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 1 20:01:04 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 1 Dec 2012 21:01:04 +0100 Subject: Sujet de these: Computer Human Interaction and Natural Language Processing, GREYC LAB/HULTECH TEAM, Caen Message-ID: Date: Wed, 28 Nov 2012 17:31:36 +0100 From: Fabrice Maurel Message-ID: <50B63C68.2070206 at unicaen.fr> ------ Apologies for cross-posting. Please circulate to any potentially interested parties ------ SALARIED PHD POSITION IN COMPUTER HUMAN INTERACTION AND NATURAL LANGUAGE PROCESSING AT CAEN BASSE-NORMANDIE UNIVERSITY - GREYC LAB/HULTECH TEAM - project ART-ADN ------ TOPIC ----------------------- The work focuses on improving non-visual access to digital documents on touch-screen tablets based on the extraction and reorganization of the structure of texts, documents and interfaces. As such, the high-dimension structure of documents is made available through haptic-oral interaction. The proposition involves three main components: interpretation of texts (NLP), reorganization of structures (HCI) and haptic perception (ELEC). CONTEXT ----------------------- This thesis will take place within the context of the ART-ADN project supported by the call for "innovative societies" of the French National Agency for Research (ANR). The candidate will develop his work in the GREYC laboratory (CNRS UMR 6072) of the University of Caen Basse-Normandie (UCBN) and the National Superior Engineering School of Caen (ENSICAEN). In particular, the HULTECH (Human Language Technologies) team and the ELECTRONIC team will be involved in the supervision of the thesis. SALARY DETAILS ----------------------- The successful individual will be employed as a salaried researcher at Caen Basse-Normandie University, while studying towards his/her PhD. For employment in France, the reference figure for net salary is *1,375* euros/month The post is fixed term for three years with a start date about Marsh 2013 or soon after. REQUIREMENTS & ELIGIBILITY ------------------------------------------ The high-standard successful candidate will possess a Master degree covering primarily the field of User-centered Design of Interfaces and Human-Computer Interaction (HCI). Additional skills that would be appreciated are Speech and Natural Language Processing (NLP), Electronics (ELEC) and/or Image Processing (IMAGE). Autonomy and openness are also required since the project will be developed in a multidisciplinary collaboration involving psychologists (PALM UPRES EA 4649), ergonomists and associations of visually impaired people (VIP). APPLICATION DETAILS ---------------------------------- If you are interested in this funding, please send the following information to the supervisors Fabrice Maurel (fabrice.maurel at unicaen.fr), Pierre Beust (pierre.beust at unicaen.fr) and Jean-Marc Routoure (jean-marc.routoure at unicaen.fr): - a letter of motivation, - a detailed Resume, - a copy of all diplomas after high school and - the detailed list of all the marks obtained in the Master and Bachelor degrees. For further details please see: art-adn.greyc.fr Closing date for applications: 1st Marsh 2013 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 08:49:19 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 09:49:19 +0100 Subject: Job: Stage en terminologie/linguistique de corpus Message-ID: Date: Mon, 03 Dec 2012 11:01:00 +0100 From: Condamines Message-ID: <50BC785C.9050202 at univ-tlse2.fr> X-url: http://www.cnes.fr/web/CNES-fr/175-stages-2011-2012.php?view=item&item=7352 ---------------------------------------- Proposition de stage de M2 au CNES : Utilisation des m?thodes de la linguistique de corpus pour proposer des am?liorations dans la constitution et la r?daction de L'encyclop?die d'exobiologie. Le stage de 6 mois se d?roulera ? Toulouse, au CNES et au laboratoire CLLE-ERSS. Il sera r?mun?r? ? hauteur de 800 euros par mois. Renseignements et inscription : http://www.cnes.fr/web/CNES-fr/175-stages-2011-2012.php?view=item&item=7352 ----------------------------------------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 08:53:41 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 09:53:41 +0100 Subject: These: Sylvain Raybaud, Utilisation de mesures de confiance en traduction automatique Message-ID: Date: Mon, 03 Dec 2012 14:42:56 +0100 From: Sylvain Raybaud Message-ID: <50BCAC60.4040708 at loria.fr> Bonjour Je souhaite vous faire part ? fin de diffusion sur ln at cines.fr, si vous ?tes d'accord, de la soutenance prochaine (mercredi 5 d?cembre ? 14h au LORIA ? Nancy) de ma th?se intitul?e : ? De l'utilisation de mesures de confiance en traduction automatique : ?valuation, post-?dition et application ? la traduction de la parole. ? Cette th?se sera soutenue devant le jury suivant : MM. Fran?ois Yvon et Laurent Besacier, rapporteurs ; MM. Guillaume Gravier et Fran?ois Charpillet, examinateurs ; ainsi M. Kamel Sma?li, directeur de th?se, et M. David Langlois, coencadrant. Les r?sum?s en fran?ais et en anglais suivent. bien cordialement, Sylvain Raybaud R?sum? : Cette th?se de doctorat aborde les probl?matiques de l'estimation de confiance pour la traduction automatique, et de la traduction automatique statistique de la parole spontan?e ? grand vocabulaire. J'y propose une formalisation du probl?me d'estimation de confiance, et aborde exp?rimentalement le probl?me sous le paradigme de la classification et r?gression multivari?e. Je propose une ?valuation des performances des diff?rentes m?thodes ?voqu?es, pr?sente les r?sultats obtenus lors d'une campagne d'?valuation internationale et propose une application ? la post-?dition par des experts de documents traduits automatiquement. J'aborde ensuite le probl?me de la traduction automatique de la parole. Apr?s avoir pass? en revue les sp?cificit?s du m?dium oral et les d?fis particuliers qu'il soul?ve, je propose des m?thodes originales pour y r?pondre, utilisant notamment les r?seaux de confusion phon?tiques, les mesures de confiances et des techniques de segmentation de la parole. Je montre finalement que le prototype propos? rivalise avec des syst?mes ?tat de l'art ? la conception plus classique. Abstract : In this thesis I shall deal with the issues of confidence estimation for machine translation and statistical machine translation of large vocabulary spontaneous speech translation. I shall first formalize the problem of confidence estimation. I present experiments under the paradigm of multivariate classification and regression. I review the performances yielded by different techniques, present the results obtained during the WMT2012 internation evaluation campaign and give the details of an application to post edition of automatically translated documents. I then deal with the issue of speech translation. After going into the details of what makes it a very specific and particularly challenging problem, I present original methods to partially solve it, by using phonetic confusion networs, confidence estimation techniques and speech segmentation. I show that the prototype I developped yields performances comparable to state-of-the-art of more standard design. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 08:57:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 09:57:25 +0100 Subject: Seminaire: LIMSI, Horacio Saggion, jeudi 6 decembre 2012 Message-ID: Date: Mon, 03 Dec 2012 15:56:09 +0100 From: Anne-Laure Ligozat Message-ID: Bonjour, Jeudi 6 d?cembre, le LIMSI recevra Horacio Saggion (TALN Research Group Universitat Pompeu Fabra ? Barcelona - Spain) qui pr?sentera ses travaux sur la simplification de textes. Le s?minaire aura lieu ? 14h en salle du conseil du LIMSI (http://www.limsi.fr/Pratique/acces/). Toute personne int?ress?e est la bienvenue. ===================================== Title: Text Simplification in Spanish Abstract: For people with cognitive disabilities access to textual information is often very difficult because texts written for the general public may be too complex for them to read. One possibility to grant access to textual information for people with cognitive problems is to adapt and simplify texts manually. However, making easy-to-read versions of the current volume of textual information (or even a small proportion of it) would be impractical with human efforts alone. Automatic text simplification is a technology to produce adaptable texts by reducing their syntactic and lexical complexity so that they become readable for a target user group. In this talk I will give an overview of the natural language processing technology produced for the Simplext project which aims at developing text simplification technology in Spanish. Our work so far has produced a number of useful resources for text simplification (e.g. aligned corpus), a prototype for reduction of structural complexity using transduction rules and a lexical simplification procedure based on co-occurrence statistics. I will also take the opportunity to describe work being carried out at the TALN research group including work on summarization, information extraction, and text generation. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 08:59:47 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 09:59:47 +0100 Subject: Job: Postdoc, INRIA Rennes, France, structured CRF Message-ID: Date: Mon, 03 Dec 2012 16:31:50 +0100 From: Vincent Claveau Message-ID: <50BCC5E6.9080901 at irisa.fr> POSTDOCTORAL POSITION at INRIA Rennes, France Topic: Conditional Random Fields for structured annotation In the field of natural language processing, statistical methods have become very popular thanks to their efficiency in dealing with noisy inputs (e.g., automatic speech transcripts, blog, tweets). In the particular case of sequence labeling problems, such as named entities recognition (discovery of person names, places, dates, etc. within a text), the Conditional Random Fields (CRF) model is particularly effective . CRFs are currently limited to model unstructured sequences (flat representation), while one of the current problems is to predict structured sequences (tree-structured for example). Methods for modeling such structured sequences exist, like Probabilistic Context Free Grammars (PCFG), but their effectiveness is limited when confronted with noisy input as we are aiming to process. The proposed work is to study a method for predicting sequences of structured objects robust to handle noisy inputs. This method will provide a decomposition of the overall problem into sub-problems modeled by CRF and redial the different results to produce a structured output. Evaluation will be performed on noisy texts (speech transcripts, tweets...). This work takes place in the context of the Quaero project, funded by the French National Innovation Agency (www.quaero.org). The work will be performed at IRISA/INRIA Rennes, France (http://www.irisa.fr/, http://www.inria.fr/centre/rennes/). The candidate will integrate the TexMex team, whose main research topics include large-scale multimedia indexing, speech processing, information retrieval. QUALIFICATIONS AND POSITION The successful candidate will have a PhD with a track record of Text-Mining or Machine Learning for Natural Language Processing research. Fluency in English is mandatory. This position is to be filled as early as possible, and will end on the 31st of Dec 2013. Salary follows INRIA scales and depends on the candidate's experience (the minimum monthly net salary is about 1900 ?). To apply, please send a cover letter, describing how the applicant's knowledge and research background will contribute to the project, a CV, and the names and contact information of two referees to: Christian Raymond (christian.raymond at irisa.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 09:02:54 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 10:02:54 +0100 Subject: Appel: Call for Short Papers, Special Volume on Non-standard Data Sources in Corpus-based Research Message-ID: Date: Mon, 3 Dec 2012 13:44:34 -0200 From: Marcos Zampieri Message-ID: X-url: http://nosdacworkshop.com/resources.html Date: Mon, 3 Dec 2012 13:44:34 -0200 Importance: Normal X-OriginalArrivalTime: 03 Dec 2012 15:44:35.0409 (UTC) FILETIME=[185E5C10:01CDD16D] Please apologize for cross-posting. ========================================================================= Call for Short Papers - Special Volume on Non-standard Data Sources in Corpus-based Research Following the 1st workshop on Automatic Processing of Non-Standard Data Sources In Corpus-based Research (NOSDAC) held in August 31st at the University of Cologne, we are compiling a special volume to appear as the 5th Edition of the ZSM-Studien series sponsored by the Centre of Multilingualism of the University of Cologne. We are welcoming unpublished short-papers (up to 8 A5 pages including references) presenting and describing original non-standard language resources, such as: - Non-standard (historical, internet, SMS) corpora (freely available). - POS Taggers and parsers developed for historical and/or internet data. - Computational tools for spelling normalization. - Corpus interfaces or query tools for non-standard language All papers will be peer-reviewed by an international committee and selected according to the originality of the resource and quality of the manuscript. Submissions should be done via EasyChair. More information and template for submission can be found at: http://nosdacworkshop.com/resources.html The deadline for submissions is December 21st 2012. Peer Review Committee: - Jorge Baptista - University of Algarve and INESC-ID Lisbon (Portugal) - Michael Bei?wenger - TU Dortmund University (Germany) - Stefanie Dipper - Ruhr University Bochum (Germany) - Lothar Lemnitzer - Berlin-Brandenburg Academy of Sciences and Humanities (Germany) - Francesco Mambrini - Harvard University (USA) - Nuno Mamede - Instituto Superior T?cnico and INESC-ID Lisbon (Portugal) - Alexander Mehler - University of Frankfurt (Germany) - Marco Passarotti - Universit? Cattolica del Sacro Cuore, Milan (Italy) Organizing Committee: - Marcos Zampieri - University of Cologne (Germany) - Sascha Diwersy - University of Cologne (Germany) Best Regards, Marcos Zampieri marcos.zampieri at uni-koeln.de Romance Philology Department University of Cologne Sascha Diwersy sascha.diwersy at uni-koeln.de Romance Philology Department University of Cologne ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 09:09:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 10:09:39 +0100 Subject: Seminaire: INFOLINGU, Nicolas TURENNE, INRA, lundi 28 janvier 2013 Message-ID: Date: Tue, 4 Dec 2012 16:17:57 +0100 From: Myriam RAKHO Message-ID: ************************************************************************ INFOLINGU Le s?minaire de l'?quipe Informatique Linguistique du Laboratoire d'Informatique de l'Institut Gaspard Monge (LIGM) Universit? Paris-Est Marne-la-Vall?e Date : *Le lundi 28 janvier 2013 ? 10h30* Lieu : Universit? Paris-Est Marne-la-Vall?e B?timent Copernic, 4?me ?tage, salle de s?minaires 4B08R Toute personne int?ress?e est la bienvenue ************************************************************************ *** INTERVENANT *** *Nicolas TURENNE, INRA* *** TITRE *** Pr?sentation d'un nouveau livre intitul? : "Knowledge Needs and Information Extraction: Towards an Artificial Consciousness" Le livre est disponible ? cette adresse : http://eu.wiley.com/WileyCDA/WileyTitle/productCd-1848215150,descCd-description.html *** R?SUM? *** Amongst the big questions about humanity from ?Who am I?? to ?Where am I?, there is the subject of consciousness relayed by philosophy and theology at first and then by biology, psychology, sociology and more recently by cognitive sciences. This book attempts to reconcile these disciplines through the common denominator of consciousness, but on one of its specific aspect. The book presents a concept of-motivation of field of activity, as a biological motor of a state of consciousness, and of which system informatics enables to reveal its existence. If consciousness is not well defined, a limited frame provides a more precise and observable definition despite the context complexity of the individuals: psychological, social and technical. These observable elements are of two nature: a nature of principal activity and a cognitive-linguistic nature, which are adapted with extrinsic and intrinsic control factors. The argument presented here consists in presenting a state of consciousness as related to the concept of instinctive (therefore physiological) information need, and whose carrier traces on the traditional information channels, i.e. letters and subscriptions and on the modern information channels, i.e. text messages and web pages, can be analyzed via knowledge extraction. ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 09:15:33 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 10:15:33 +0100 Subject: Conf: Colloque La linguistique de corpus, 14-15 decembre 2012, Bordeaux Message-ID: Date: Tue, 4 Dec 2012 17:45:40 +0100 (CET) From: "sandra.augendre" Message-ID: <1922015877.11984.1354639540547.JavaMail.www at wwinf1m32> La linguistique de corpus ? l?heure de la confrontation entre concepts, techniques et applications / Corpus Linguistics: How to bind concepts, technique and application? Vendredi 14 d?cembre 2012 : Goethe Institut (35 cours de Verdun, Bordeaux, Tram C, ? Paul Doumer ?) Samedi 15 d?cembre: Universit? Bordeaux 3, Pessac (Tram B, ? Montaigne-Montesquieu ?) Site web : https://sites.google.com/site/corpus2012bordeaux3/home PROGRAMME Vendredi 14 d?cembre 9h Accueil 9h30 Ouverture et pr?sentation du colloque 10h-11h15 Atelier ? Coder l?oral ? Thomas SCHMIDT (Institut f?r Deutsche Sprache, Mannheim), Transcription et codage dans un corpus de recherche et enseignement de l?allemand parl? Samira MOUKRIM (Facult? des Lettres et Sciences Humaines Sa?s-F?s, Universit? Sidi Mohamed Ben Abdellah), Coder l?des langues ? tradition orale : un palier d?interaction entre ?criture et formalisation 10h-11h15 Atelier ? Multimodalit? et codage ? Chafia AMMI, Amel DJEZZAR (Universit? Dr Yahia Fares, M?d?a, Alg?rie), Le traitement automatique de corpus traduits : limites et perspectives Isabelle EST?VE (LIDILEM, Grenoble 3), Encoder et d?coder les dynamiques inter- et intra-modalit?s : d?fis et perspectives amen?s par la multimodalit? enfantine sourde 11h15-11h45 Pause 11h45-13h Atelier ? Coder l?oral ? suite Isabelle RACINE (ELCF, Universit? de Gen?ve), Sylvain DETEY (SILS, Universit? Waseda & Dysola, Universit? de Rouen), Julien EYCHENNE (Hankuk University of Foreign Studies), Coder l?oral via l??crit : de la relative pr?visibilit? des natifs ? l?impr?visibilit? des apprenants hispanophones dans le cas de la liaison B?atrice Akissi BOUTIN (CLLE-ERSS-UMR 5263, Universit? Toulouse 2 et ILA, Institut de Linguistique Appliqu?e, Universit? F?lix Houphou?t-Boigny, Abidjan), Annotation de l?oral, codages, et interpr?tations 11h45-13h Atelier ? Multimodalit? et codage ? suite Catherine BOLLY (F.S.R.-FNRS & Universit? catholique de Louvain), Dominique BOUTET (UMR SFL, CNRS, Paris 8 & Universit? d?Evry Val d?Essonne), Corpus ?cologique et ?conomie des outils. Le cas du corpus multimodal CorpAGEst Eric FRIGINAL (Georgia State University, Atlanta), Encoding and annotating a corpus of telephone-based customer service interactions 13h-14h30 Repas 14h30-16h30 Atelier ? Corpus et formalismes ? Gabriela BILBIIE (Universite Paris Diderot - Paris 7 & Laboratoire de Linguistique Formelle, LLF), La mise en facteur ? droite dans le Penn Treebank Laurence DANLOS (Universit? Paris Diderot, ALPAGE), M?thodologie pour le FDTB (French Discourse Tree Bank) Nathalie GASIGLIA (Universit? Lille 3), Enrichir le balisage de corpus th?matiques ? haut rendement exploratoire pour en am?liorer le rendement documentaire 14h30-16h30 Atelier ? Corpus appliqu?s ? Sylvain DETEY (SILS, Universit? Waseda & Dysola, Universit? de Rouen), Isabelle RACINE (ELCF, Universit? de Gen?ve), Julien EYCHENNE (Hankuk University of Foreign Studies), Yuji KAWAGUCHI (Tokyo University of Foreign Studies), Mariko KONDO (SILS, Universit? Waseda), Interphonologie et codage de corpus oraux non-natifs : m?thodologie et voyelles d?apprenants japonais de FLE Martine MARQUILL?-LARRUY (D?partement des sciences du langage, Universit? de Poitiers), Pascale TREVISIOL-OKAMURA (D?partement des sciences du langage, Universit? de Poitiers), Christophe NAUD (Maison des Langues de l'Universit? de Poitiers), Laure CHOTEL (T?l?com Ecole de Management, Evry), "Corpus ?vry - Poitiers" : codage d?un corpus multimodal et formation Nikola PAILLEREAU (Laboratoire de Phon?tique et Phonologie (UMR 7018), CNRS / Universit? Sorbonne-Nouvelle), Simon LANDRON (Laboratoire de Phon?tique et Phonologie (UMR 7018), CNRS / Universit? Sorbonne-Nouvelle & PLIDAM, INALCO), Laurianne GEORGETON (Laboratoire de Phon?tique et Phonologie (UMR 7018), CNRS / Universit? Sorbonne-Nouvelle), Coder les voyelles m?dianes du fran?ais en vue de productions isol?es ou de non-mots : enjeux et utilisation 16h30-17h Pause 17h-18h30 Table ronde ? Corpus et formalismes ? Table ronde regroupant les communicants de l?atelier ? Corpus et formalismes ? pr?sid?e par Marie-H?l?ne CANDITO (Universit? Paris-Diderot) et Lionel CLEMENT (Universit? Bordeaux 1) 17h-18h30 Table ronde ? Corpus appliqu?s ? Table ronde regroupant les communicants de l?atelier ? Corpus appliqu?s ? pr?sid?e par Marie-No?lle LAMY (Open University) et Sandrine AGUERRE (Universit? Bordeaux 3) Samedi 15 d?cembre 9h30-10h30 Pl?ni?re Lou Burnard (Universit? d?Oxford & TGE Adonis), De Literary and Linguistic Computing aux Humanit?s num?riques : quelle importance pour les sciences du langage ? 10h30-13h Atelier ? Corpus et Humanit?s num?riques ? Lo?c LIEGEOIS, Thierry CHANIER, Damien CHABANAL (LRL, Clermont Universit?), L?exemple d?un corpus d?interactions orales spontan?es structur? en TEI : quels avantages pour l?interop?rabilit?, l?analyse et le partage des donn?es de la recherche ? Marie-H?l?ne LAY (Universit? de Poitiers & FoReLL, Formes et Repr?sentations en Linguistique et Litt?rature, EA 3816), Quels outils d'analyse de corpus pour les digital humanities ? Plaidoyer pour des outils d'?tiquetage non-robustes Patrick DROUIN (Observatoire de linguistique Sens-Texte, Universit? de Montr?al), Philippe LANGLAIS (D?partement d?informatique et de recherche op?rationnelle, Universit? de Montr?al), Christian GUILBAULT (Department of French, Simon Fraser University), Annotation d?un corpus de messages textes (SMS) : dualit? et compl?mentarit? entre l?oral et l??crit Bernard LAKS (Paris Ouest, Modyco et Institut universitaire de France, Variation et changement au miroir des grands corpus oraux : le cas du fran?ais 13h Cl?ture du colloque Inscription au colloque Universitaires ext?rieurs ? l?universit? de Bordeaux : 30 ? Etudiants ext?rieurs ? l?Universit? de Bordeaux : 20 ? Etudiants et personnels de l?Universit? de Bordeaux : gratuit? 1. T?l?charger le formulaire d?inscription sur le site du colloque : https://sites.google.com/site/corpus2012bordeaux3/home 2. Envoyer le formulaire d?ment rempli ? : Madame Laurence DULAU ? Bureau D 007 Direction de la Recherche ? P?le financier Universit? Bordeaux 3 33607 Pessac cedex vous pouvez aussi envoyer un courriel ? : laurence.dulau at u-bordeaux3.fr Comit? scientifique Guy ACHARD-BAYLE (Univ. de Lorraine & CREM EA 3476), Philippe BLACHE (Aix-Marseille & LPL UMR 7309), Lou BURNARD (Oxford & TGE Adonis), Paul CAPPEAU (Poitiers & FoReLL EA 3816), Thierry CHANIER (Clermont 2 & LRL EA 999), Ray COOKE (Bordeaux ? Victor Segalen), C?cile FABRE (Toulouse 2 & CLLE-ERSS UMR 5263), Evelyne JACQUEY (Univ. de Lorraine & ATILF UMR 7118), Nathalie KUBLER (CLILLAC-ARP, Universit? Paris-Diderot), Laurence LABRUNE (Bordeaux 3 & CLLE-ERSS UMR 5263), Marie-No?lle LAMY (Open University & CREET), Beno?t LE BLANC (ENSC-IPB & UMR 5218), Philippe MARTIN (CLILLAC-ARP, Universit? Paris-Diderot), Damon MAYAFFRE (Nice-Sophia Antipolis & BCL UMR 7320), Sylvie MELLET (Nice-Sophia Antipolis & BCL UMR 7320), Lorenza MONDADA (B?le & ICAR UMR 5191), Jean-Marie PIERREL (Univ. de Lorraine & ATILF UMR 7118), Sophie ROSSET (LIMSI UPR 3251), V?ronique TRAVERSO (ICAR UMR 5191), Agn?s TUTIN (Grenoble 3 & LIDILEM EA 609), Jean-Marie VIPREY (Univ. de Franche-Comt? & ELLIADD EA 4661) Comit? d?organisation Sandrine AGUERRE, Sandra AUGENDRE, Jean-Luc BERGEY, Gilles BOY?, Jean-S?bastien BRILLEAUD, Marie-Odile HIDDEN, Anna KUP?? Catherine MATHON, NGUYEN Van Toan, Christelle ROUET-DELARUE, Henri PORTINE ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 5 09:27:06 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 5 Dec 2012 10:27:06 +0100 Subject: Appel: WIMS'13, Call for Papers/Workshop Proposals Message-ID: Date: Wed, 05 Dec 2012 10:10:27 +0100 From: Planti? Michel Message-ID: <50BF0F83.1090709 at mines-ales.fr> CALL FOR PAPERS/PROPOSALS International Conference on Web Intelligence, Mining and Semantics (WIMS'13) June 12-14, 2013 - Madrid, Spain http://aida.ii.uam.es/wims13/ About WIMS'13: The 3rd International Conference on Web Intelligence, Mining and Semantics (WIMS'13) will be organised under the auspices of Autonomous University of Madrid, Spain. The WIMS series of conferences concerned with intelligent approaches to transform the World Wide Web into a global reasoning and semantics-driven computing machine. The conference will provide an excellent international forum for sharing knowledge and results in theory, methodology and applications of Web intelligence, Web mining and Web semantics. The purpose of the WIMS'13 is: - To provide a forum for established researchers and practitioners to present past and current research contributing to the state of the art of Web technology research and applications. - To give doctoral students an opportunity to present their research to a friendly and knowledgeable audience and receive valuable feedback. - To provide an informal social event where Web technology researchers and practitioners can meet. Conference Venue: The conference will be hosted by Autonomous University of Madrid. Confirmed Keynote Speakers: - Prof. Amit Sheth (Physical Cyber Social Computing: An early 21st century approach to - Computing for Human Experience), - Dr. Jason J. Jung (Contextual Synchronization on Social Collaboration) - Prof. Asunci?n G?mez-P?rez (TBA). Call for Papers/Tutorials/ Posters/Industri al Track/Workshop proposals: http://aida. ii.uam.es/ wims13/cfp. php Publication: Accepted papers/tutorials/ posters will be published by ACM and disseminated through the ACM Digital Library. Selected extended papers will be invited to appear in a special issues of reputed journals in the field and also in a book published by Elsevier. Important Dates Tutorial and Workshop proposals due December 17, 2012 Notification of workshop acceptance December 21, 2012 Electronic submission of research papers December 23, 2012 Electronic submission of poster papers December 23, 2012 Notifications of tutorial acceptance January 10, 2013 Notification of paper/poster acceptanceFebruary 17, 2013 Registration opens February 18, 2013 Camera-ready of accepted papers/tutorials March 4, 2013 Deadline for paper submissions for workshops February 7, 2013 Acceptance of papers for workshops March 10, 2013 Camera ready workshop papers March 30, 2013 Author registration deadline March 30, 2013 Conference 12-14 June,2013 Contact: David Camacho Escuela Polit?cnica Superior Universidad Aut?noma de Madrid Francisco Tom?s y Valiente, 11 , 28049, Madrid , Spain Tel/Fax: +34 91 497 51 00 E-mail:wims13 at uam.es ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Dec 7 08:37:18 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 7 Dec 2012 09:37:18 +0100 Subject: These: Aymen Elkhlifi, Approche Generique d=?WINDOWS-1252?Q?=92Extraction_?=Automatique des Evenements et leur Exploitation Message-ID: Date: Fri, 7 Dec 2012 03:44:41 +0000 (GMT) From: elkhlifi aymen Message-ID: <1354851881.40206.YahooMailNeo at web172201.mail.ir2.yahoo.com> Bonjour, ? J'ai le plaisir de vous inviter ? la soutenance de ma th?se intitul?e "Approche G?n?rique d?Extraction Automatique des Ev?nements et leur Exploitation". Elle aura lieu le Samedi 08 d?cembre 2012 ? 14h, ?? la Maison de la recherche, Salle 01 - RC, 28 rue Serpente, 75006 Paris. M?tro : Od?on (ligne 4 ou 10) ou Saint-Michel (ligne 4 ou RER B) Bus : 58, 70. V?lib : juste devant. Vous ?tes ?galement convi?s au pot de th?se qui suivra la soutenance. ---------------------------- Le jury est compos? de : M. Abdelmajid Ben Hamadou, Professeur en Informatique, Universit? de Sfax, Rapporteur M. Jean-Gabriel Ganascia, Professeur en Informatique, Universit? PMC, Paris 6, Examinateur M. Ghassan Mourad, Professeur en Informatique-Linguistique, Universit? Libanaise ? Beyrouth, Rapporteur Mme Delphine Battistelli, Ma?tre de Conf?rences (HDR), Universit? Paris-Sorbonne, Examinateur Mme Rim Faiz, Professeur en Informatique, IHEC-Universit? de Carthage, Directeur M. Jean-Pierre Descl?s, Professeur ?m?rite, en Informatique, Universit? Paris-Sorbonne, Directeur Bien cordialement, Aymen Elkhlifi --------------------------------------------------------------- R?sum? : Dans le cadre de notre th?se, nous avons propos? une approche g?n?rique d?extraction automatique des ?v?nements et de leur exploitation. L?approche est organis?e en quatre composantes ind?pendantes et r?utilisables. Une premi?re composante de pr?traitement, o? les textes sont nettoy?s et segment?s. Au cours de la seconde ?tape, les ?v?nements sont extraits en se basant sur notre algorithme AnnotEC qui dispose d?une complexit? polynomiale et qui est associ? ? des cartes s?mantiques et des ressources linguistiques d?di?es. Nous avons mis en place deux nouvelles mesures de similarit? SimCat?goreille et SimEvent pour regrouper les ?v?nements similaires dans le cadre de la troisi?me composante de clustering. Les annotations, ajout?es tout au long des trois premi?res ?tapes, sont exploit?es au niveau de la derni?re composante par le bais des fichiers de synth?se param?trables par l?utilisateur. L?approche a ?t? ?valu?e sur un corpus issu du Web 2.0. Nous avons compar? les r?sultats avec des m?thodes d?apprentissage automatique et des m?thodes linguistiques par compilation et nous avons obtenu de meilleurs r?sultats. Mot-cl?s : Extraction d??v?nement, Annotation d?information, Cartes S?mantiques, Mesure de Similarit? S?mantique. ------------------------------------------------------------------------ Summary : In the framework of our thesis, we proposed a generic approach for the automatic extraction of events and their exploitation. This approach is divided into four independent and reusable components. The first component of pretreatment, in which texts are cleaned and segmented. During the second stage, events are extracted based on our algorithm AnnotEC which has polynomial complexity. AnnotEC is associated with semantic maps and dedicated linguistic resources. We have proposed two new similarity measures SimCat?goreille and SimEvent to group similar events using clustering algorithms. Annotations, added throughout the first three steps, are used at the last component by summarizing files configurable by users. The approach was evaluated on a corpus of Web 2.0, we compared the obtained results with machine learning methods and linguistic compiling methods and we got good results. Keywords : Event Extraction, Information Annotation, Semantic Maps, Semantic Measure of Similarity. ------------------------------------------------------------------------ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 12:33:14 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 13:33:14 +0100 Subject: These: Lei Zhang, Analyse automatique d'opinion Message-ID: Date: Wed, 05 Dec 2012 14:20:43 +0100 From: Zhang Lei Message-ID: <62c6e439be9bab0c5c3cb9dce24e0fea at imap.unicaen.fr> Bonjour, J'ai le plaisir de vous convier ? ma soutenance de th?se qui se d?roulera le mardi 11 d?cembre ? 14h00 en salle des th?ses de l'universit? de Caen Basse-Normandie (1er ?tage, ? cot? du secr?tariat de l'ED SIMEM), campus 2, b?timent sciences 3. Vous ?tes ?galement invit?s au pot qui suivra en salle 351 dans le m?me b?timent. Titre ===== Analyse automatique d'opinion : probl?matique de l'intensit? et de la n?gation pour l'application ? un corpus journalistique Composition du Jury =================== Mme B?atrice Daille, professeur des universit?s, universit? de Nantes (rapporteur) Mme Brigitte Grau, professeur des universit?s, ENSIIE (rapporteur) M. Thierry Poibeau, directeur de Recherche, laboratoire LaTTiCe (examinateur) M. Ga?l Dias, professeur des universit?s, universit? de Caen Basse-Normandie (examinateur) M. Patrice Enjalbert, professeur des universit?s, universit? de Caen Basse-Normandie (examinateur) M. St?phane Ferrari, ma?tre de conf?rences, HDR, universit? de Caen Basse-Normandie (directeur) R?sum? ====== La probl?matique de l'analyse d'opinion conna?t un int?r?t croissant depuis une quinzaine d'ann?es. Cette probl?matique m?ne ? de nombreux travaux ayant des objectifs allant de la constitution de ressources lexicales ? l'identification des cibles d'une opinion. Le cadre applicatif de notre ?tude est l'analyse automatique d'articles de journaux pour la veille d'opinion. Ce cadre est ambitieux vis-?-vis de l'?tat de l'art puisque nous sommes amen? ? ?tudier un grand nombre de crit?res propres ? l'analyse d'opinion. Nous proposons un mod?le conceptuel permettant de caract?riser une opinion par la polarit?, l'intensit?, la prototypicalit?, la cible, la source, l?engagement de l'auteur, etc. En particulier, nous mod?lisons la n?gation et ses effets sur l'intensit? et la polarit?. En plus des cas classiques de n?gation, nous sommes en mesure de mod?liser des effets de rh?toriques tels que l'euph?misme ou la litote, tr?s pr?sents dans le genre journalistique. ? partir de ce mod?le conceptuel, nous pr?sentons un ensemble de choix techniques permettant de pr?ciser les ressources et traitements n?cessaires ? l'automatisation. Nous mettons en ?uvre deux applications (en chinois et en fran?ais) de la cha?ne de traitements issue du mod?le permettant de confirmer la validit? du mod?le conceptuel ainsi que l'efficacit? des traitements automatiques.? Cordialement, Lei Zhang ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 12:36:16 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 13:36:16 +0100 Subject: Appel: 1st International Conference on Statistical Language and Speech Processing Message-ID: Date: Wed, 5 Dec 2012 15:56:28 +0000 From: "Maarouf, Ismall" Message-ID: <6B982DE0E1760848ABA8A809FFD806DFC949DF at EXCHMBX10X03.unv.wlv.ac.uk> X-url: http://grammars.grlmc.com/SLSP2013/ Full Title: 1st International Conference on Statistical Language and Speech Processing Short Title: SLSP 2013 Date: 29-Jul-2013 - 31-Jul-2013 Location: Tarragona, Spain Contact Person: Florentina Voicu Meeting Email: [X] Web Site: http://grammars.grlmc.com/SLSP2013/ Linguistic Field(s): Computational Linguistics Call Deadline: 05-Mar-2013 Meeting Description: 1st International Conference on Statistical Language and Speech Processing (SLSP 2013) Tarragona, Spain July 29-31, 2013 Organised by: Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Research Institute for Information and Language Processing (RIILP) University of Wolverhampton http://grammars.grlmc.com/SLSP2013/ Aims: SLSP is the first event in a series to host and promote research on the wide spectrum of statistical methods that are currently in use in computational language or speech processing. It aims at attracting contributions from both fields. Though there exist large, well-known conferences including papers in any of these fields, SLSP is a more focused meeting where synergies between areas and people will hopefully happen. SLSP will reserve significant space for young scholars at the beginning of their careers. Venue: SLSP 2013 will take place in Tarragona, 100 km. to the south of Barcelona. Registration: The period for registration is open from November 30, 2012 to July 29, 2013. The registration form can be found at: http://grammars.grlmc.com/SLSP2013/Registration.php Structure: SLSP 2013 will consist of: ? Invited talks ? Invited tutorials ? Peer?reviewed contributions Invited Speakers: To be announced Acknowledgements: Diputaci? de Tarragona Universitat Rovira i Virgili University of Wolverhampton Call for Papers: The conference invites submissions discussing the employment of statistical methods (including machine learning) within language and speech processing. The list below is indicative and not exhaustive: - Phonology, morphology - Syntax, semantics - Discourse, dialogue, pragmatics - Statistical models for natural language processing - Supervised, unsupervised and semi-supervised machine learning methods applied to natural language, including speech - Statistical methods, including biologically-inspired methods - Similarity - Alignment - Language resources - Part-of-speech tagging - Parsing - Semantic role labelling - Natural language generation - Anaphora and coreference resolution - Speech recognition - Speaker identification/verification - Speech transcription - Text-to-speech synthesis - Machine translation - Translation technology - Text summarisation - Information retrieval - Text categorisation - Information extraction - Term extraction - Spelling correction - Text and web mining - Opinion mining and sentiment analysis - Spoken dialogue systems - Author identification, plagiarism and spam filtering Authors are invited to submit papers presenting original and unpublished research. Papers should not exceed 12 single?spaced pages (including eventual appendices) and should be formatted according to the standard format for Springer Verlag's LNAI series (see http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0). Submissions are to be uploaded to: https://www.easychair.org/conferences/?conf=slsp2013 Publications: A volume of proceedings published by Springer in the LNAI topical subseries of the LNCS series will be available by the time of the conference. A special issue of a major journal will be later published containing peer?reviewed extended versions of some of the papers contributed to the conference. Submissions will be by invitation. Deadlines: Paper submission: March 5, 2013 (23:59h, CET) Notification of paper acceptance or rejection: April 9, 2013 Final version of the paper for the LNAI proceedings: April 17, 2013 Early registration: April 24, 2013 Late registration: July 19, 2013 Submission to the post?conference journal special issue: October 31, 2013 Questions and Further Information: florentinalilica.voicu at urv.cat Contact Information: SLSP 2013 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34?977?559543 Fax: +34?977?558386 Programme Committee: Carlos Mart?n-Vide (Tarragona, Co-Chair) Ruslan Mitkov (Wolverhampton, Co-Chair) Jerome Bellegarda (Apple Inc., Cupertino) Robert C. Berwick (MIT) Laurent Besacier (LIG, Grenoble) Bill Byrne (Cambridge) Jen-Tzung Chien (National Chiao Tung U, Hsinchu) Kenneth Church (IBM Research) Koby Crammer (Technion) Renato De Mori (McGill & Avignon) Thierry Dutoit (U Mons) Marcello Federico (Bruno Kessler Foundation, Trento) Katherine Forbes-Riley (Pittsburgh) Sadaoki Furui (Tokyo Tech) Yuqing Gao (IBM Thomas J. Watson) Ralp Grishman (New York U) Dilek Hakkani-T?r (Microsoft Research, Mountain View) Adam Kilgarriff (Lexical Computing Ltd., Brighton) Dietrich Klakow (Saarbr?cken) Philipp Koehn (Edinburgh) Mikko Kurimo (Aalto) Lori Lamel (CNRS-LIMSI, Orsay) Philippe Langlais (Montr?al) Haizhou Li (Institute for Infocomm Research, Singapore) Qun Liu (Dublin City) Daniel Marcu (SDL) Manuel Montes-y-G?mez (INAOEP, Puebla) Masaaki Nagata (NTT, Kyoto) Joakim Nivre (Uppsala) Kemal Oflazer (Carnegie Mellon Qatar, Doha) Miles Osborne (Edinburgh) Manny Rayner (Geneva) Giuseppe Riccardi (U Trento) Jos? A. Rodr?guez Fonollosa (Technical U Catalonia, Barcelona) Paolo Rosso (Technical U Valencia) Mark Steedman (Edinburgh) Tomek Strzalkowski (Albany) G?khan T?r (Microsoft Research, Redmond) Stephan Vogel (Qatar Computing Research Institute, Doha) Kuansan Wang (Microsoft Research, Redmond) Dekai Wu (HKUST, Hong Kong) Min Zhang (Institute for Infocomm Research, Singapore) Yunxin Zhao (U Missouri, Columbia) Organising Committee: Adrian Horia Dediu (Tarragona) Carlos Mart?n?Vide (Tarragona, Co-Chair) Ruslan Mitkov (Wolverhampton, Co-Chair) Bianca Truthe (Magdeburg) Florentina Lilica Voicu (Tarragona) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 12:37:27 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 13:37:27 +0100 Subject: Revue: Langue fran=?ISO-8859-1?Q?=E7aise_?=176, Comment ecrire une grammaire du francais ? Message-ID: Date: Wed, 05 Dec 2012 18:26:25 +0100 From: Celine Vaguer Message-ID: <50BF83C1.2040103 at free.fr> X-url: http://www.armand-colin.com/revue/20/1/langages.php X-url: http://www.armand-colin.com/revue/7/1/langue-francaise.php *Langue fran?aise 176* * **Comment ?crire une grammaire du fran?ais ? par Teddy Arnavielle & Gilles Siouffi* * ?crire une grammaire du fran?ais aujourd'hui TEDDY ARNAVIELLE, GILLES SIOUFFI * La Grammaire m?thodique du fran?ais : ?laboration d'une grammaire linguistique globale JEAN-CHRISTOPHE PELLAT, MARTIN RIEGEL * Une t?che ? accomplir pour la linguistique fran?aise du XXe si?cle : ?laborer une grammaire des usages du fran?ais HENRI-JOS? DEULOFEU, JEANNE-MARIE DEBAISIEUX * La Grande Grammaire du Fran?ais et la vari?t? des donn?es ANNE ABEILL?, DANI?LE GODARD * De quelques probl?mes sp?cifiques ? l'?laboration d'une grammaire historique BERNARD COMBETTES * Le sens grammatical. ?laboration d'un r?f?rentiel ? l'usage des enseignants DAN VAN RAEMDONCK * La fabrique d'un guide grammatical pour les enseignants du primaire CORINNE DELHAY, JEAN-PAUL MEYER * Divergences cat?gorielles et description diachronique dans une grammaire universitaire pour Italiens AURELIO PRINCIPATO ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 12:55:51 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 13:55:51 +0100 Subject: Seminaire: Programme 2012-2013, Seminaire du Centre d'Alembert Message-ID: Date: Thu, 6 Dec 2012 08:40:44 +0100 From: Centre d'Alembert Message-Id: X-url: http://www.centre-dalembert.u-psud.fr Bonjour, Nous sommes heureux de vous annoncer le nouveau programme de s?minaires du Centre d'Alembert, pour l'ann?e 2012-2013 : "Sensibles, emp?ch?es, inaccessibles, ouvertes, archiv?es, revisit?es... Les donn?es de la recherche en questions" Au coeur des pratiques scientifiques, les donn?es de la recherche sont aussi objets de d?bats publics et d' ? affaires ? juridiques, d'enjeux ?conomiques ... Donn?es mat?rielles, mais aussi immat?rielles, pens?es dans le pr?sent ou dans le long temps de leur conservation, dans l'entre soi du laboratoire comme dans le rapport, plus large, ? la Soci?t?, les donn?es de la recherche constituent des objets tout aussi pluriels que vitaux. R?fl?chir ? leurs modes de constitution, de pr?servation et de diffusion aujourd'hui est une entr?e privil?gi?e pour penser les pratiques scientifiques et leurs mutations. Au travers d'exemples (des cahiers de laboratoires aux grandes infrastructures de gestion des donn?es) et de situations concr?tes (les politiques li?es ? l'archivage des donn?es scientifiques, le plagiat, etc.), les intervenants du s?minaire 2012-2013 du Centre d'Alembert illustreront le parcours et les destins de ces donn?es. Premi?re s?ance le mercredi 12 d?cembre. Programme d?taill? mis ? jour et contact : Web : http://www.centre-dalembert.u-psud.fr M?l. : centre.dalembert at u-psud.fr Les s?ances ont lieu ? la Facult? des Sciences d'Orsay, b?timent des colloques (338) de 13h30 ? 15h30 (entr?e libre) Acc?s : http://maps.google.fr/maps?q=rue+andr%C3%A9+guinier+orsay&hl=fr&ie=UTF8&hnear=Rue+du+Doyen+Andr%C3%A9+Guinier,+91400+Orsay,+Essonne,+%C3%8Ele-de-France&t=m&z=16 -------------------------------- S?ance du mercredi 12 d?cembre 2012 Constituer des donn?es scientifiques sensibles Patrick GAUDRAY Directeur de Recherche au CNRS, Membre du Comit? Consultatif National d'?thique Donn?es scientifiques sensibles : qui poss?de quoi ? Entre pouvoir et illusions. Le partage des connaissances est ? la base du progr?s scientifique. Il est conditionn? par le partage des donn?es de la science. C'est le sens m?me de la publication scientifique qui est un de ses meilleurs indicateurs de qualit?. Or, le nombreux vertigineusement croissant de publications scientifiques s'accompagne d'un accroissement tout aussi vertigineux des donn?es propri?taires, des donn?es cach?es, des donn?es prot?g?es. Le pouvoir (?conomique, mais pas seulement) qu'on veut associer aux donn?es scientifiques n'est-il pas en train de leur enlever leur valeur d'objet de science, voire de sujet de science ? On a ainsi pu prend r?cemment conscience de l'impact des donn?es cach?es dans l'appr?hension soci?tale des dangers possibles de l'utilisation des OGM. On pourra ?galement discuter le cas des biobanques, grandes et petites, indispensables aux recherches moderne en biologie et sant?, pivots de la recherche clinique, et dont le nombre et la dimension ont rapidement augment? ces derni?res ann?es. Ces biobanques alimentent la m?decine dite personnalis?e qui a ?t? compar?e au Pays d'Oz des soins de sant?, au monde merveilleux des tests g?n?tiques qui vous arrivent par Internet ou une officine de quartier. C'est l'appel de l'Universit? de Californie ? Berkeley pour que ses nouveaux ?tudiants se soumettent ? des enqu?tes g?n?tiques sur les variants g?niques qui participent au contr?le de l'alcool?mie ou d'autres intol?rances. Mais c'est aussi le pays des r?glements juridiques qui ont conduit l'universit? d'?tat d'Arizona ? verser pr?s d'un million de dollars ? 41 membres de la tribu indienne des Havasupai pour utilisation non autoris?e de mat?riel g?n?tique, au-del? des termes de l'?tude initialement pr?vue. Ces biobanques interrogent l'?thique ? de nombreux niveaux : le consentement ?clair?, la confidentialit? (restriction de l'acc?s ? l'information initiale, et dissociation permanente entre l'?chantillon et les informations qui permettraient une identification individuelle), le retrait de la participation, le partage des avantages qui proviennent de la biobanque, la commercialisation, le partage des donn?es entre les biobanques, et plus g?n?ralement les questions de propri?t? et de gouvernance au niveau de la collaboration internationale. Elsa SUPIOT Centre de recherche en droit des sciences et des techniques, Universit? Paris1 Panth?on-Sorbonne Donn?es scientifiques sensibles: int?r?t individuel ou collectif ? Entre protection et circulation. Les donn?es dites "sensibles" occupent aujourd'hui une place pr?pond?rante en recherche et se trouvent au c?ur d'un conflit d?licat d'int?r?ts. Protection de la vie priv?e des individus et de leur libert?, int?r?ts financiers majeurs sur le march? pharmaceutique, outil indispensable de d?couverte et d'innovation: les donn?es sensibles soul?vent la d?licate question de l'articulation d'une protection de ces donn?es et de leur n?cessaire circulation. Le droit, tant au niveau national qu'international, se propose d'assurer cette articulation. La r?glementation qui en r?sulte n'est cependant pas exempte de critiques: entraves excessives apport?es ? la r?alisation des projets de recherche, lacunes dans la protection des personnes dont les donn?es sont impliqu?es, pour ne pas les citer. D?s lors, d?passer les limites d'un encadrement fond? sur la protection (et ses exceptions) pour r?fl?chir d'abord en termes d'utilisation et d'int?r?ts collectifs s'impose. Animatrice de la s?ance : St?phanie LACOUR Charg?e de recherche CNRS au Centre d'?tudes sur la coop?ration juridique internationale (Cecoji), sp?cialiste du droit applicable aux sciences et aux technologies ?mergentes. -------------------------------- Programme 2012-2013 16/01/2013 Les cahiers de laboratoire : objectifs, pratiques, formes nouvelles et standardisation/normalisation 30/01/2013 Outils de constitution de donn?es : bases de donn?es, nouvelles technologies 13/02/2013 Manipulation des donn?es scientifiques, Faux, plagiats et pillages 27/02/2013 Le patrimoine et les archives scientifiques 20/03/2013 M?moire(s) scientifique et pr?servation des savoirs et savoir-faire 3/04/2013 Quels acc?s aux donn?es ? Du "communisme" scientifique aux mod?les propri?taires 1 10/04/2013 Quels acc?s aux donn?es ? Du "communisme" scientifique aux mod?les propri?taires 2 NB : Nous vous invitons ? consulter r?guli?rement notre site Internet, des modifications pouvant intervenir, en cas de force majeure, dans la planification. Nous vous remercions pour l'int?r?t que vous portez aux activit?s du Centre. ========================================================== CENTRE D'ALEMBERT (Centre Interdisciplinaire d'Etude de l'Evolution des Id?es, des Sciences et des Techniques) B?timent 407 - 91405 ORSAY Cedex T?l. : 01.69.15.61.90 - Fax : 01.69.15.43.98 Courriel : centre.dalembert at u-psud.fr http://www.centre-dalembert.u-psud.fr ========================================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:01:09 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:01:09 +0100 Subject: Appel: Scanned documents processing evaluations campaign, MAURDOR 2013 Message-ID: Date: Thu, 6 Dec 2012 09:45:59 +0100 From: "Oparin Ilya" Message-ID: X-url: http://www.maurdor-campaign.org This is the Call for Participation in the scanned documents processing evaluation campaign MAURDOR 2013. You can find the detailed information below (French and English versions). ### French version ### *** Campagne d??valuation MAURDOR *** Le traitement automatique de documents num?ris?s est en plein essor. La campagne MAURDOR vise ? ?valuer des syst?mes de traitement automatique de documents ?crits. Elle cherche ? quantifier et qualifier les capacit?s des syst?mes ? extraire des informations pertinentes ? partir d?images issues de la num?risation de documents ?crits. Coordonn?e par le Laboratoire National de m?trologie et d?Essais (LNE) et CASSIDIAN, la pr?sente campagne d??valuation propose un cadre commun de t?ches afin de rendre compte des performances actuelles des syst?mes de traitement automatique de documents num?riques. Pour remplir cet objectif, le LNE fournira aux participants les ?l?ments suivants : - Des donn?es coh?rentes de d?veloppements et de test, correspondant aux domaines applicatifs concern?s. - Des outils de m?triques automatiques de la performance des syst?mes. - Un protocole d??valuation commun applicable ? chacune des ?tapes de traitement ainsi qu?? une chaine compl?te de traitement automatique de documents ?crits. Le plan d??valuation de la campagne est accessible sur www.maurdor-campaign.org Un atelier sera organis? ? la fin de chaque campagne pour rendre compte des r?sultats obtenus et confronter les approches des diff?rents participants. ** Un corpus de documents h?t?rog?nes ** Une des particularit?s de l??valuation MAURDOR est de s?appuyer sur un corpus de documents tr?s h?t?rog?nes. Le corpus d?apprentissage MAURDOR 2013 comportera au total 5 000 documents en anglais, fran?ais et arabe correspondant aux cat?gories suivantes - Des formulaires (environ 12% du corpus) vierges ou compl?t?s - Des documents commerciaux (environ 40% du corpus) imprim?s mais ?galement comment?s manuellement - Des correspondances priv?es manuscrites (environ 25% du corpus) pouvant parfois contenir des ent?tes imprim?es - Des correspondances commerciales (environ 20% du corpus) imprim?es mais ?galement comment?es manuellement - D?autres documents comme des articles de journaux ou des plans?(environ 3% du corpus) Les syst?mes seront ?valu?s sur un corpus de 1 000 documents dont la r?partition par cat?gorie respectera les m?mes proportions que celles du corpus d?apprentissage. ** T?ches ?valu?es ** MAURDOR repose sur la d?finition d?une cha?ne de traitement compl?te dans laquelle cinq modules distincts sont mis en ?uvre. Chaque module remplit une fonction particuli?re et contribue au traitement complet du document. Ce sont ces cinq modules qui seront ?valu?s au cours de la campagne. Les modules sont les suivants : - Module n?1 : Typage des zones d?un document permettant de segmenter les images de documents en zones distinctes - Module n?2 : Typage de la nature de l??criture (manuscrite, dactylographi?e) - Module n?3 : Identification de la langue (anglais, arabe, fran?ais ou autre) - Module n?4 : Reconnaissance de l??criture dactylographi?e et manuscrite (OCR). - Module n?5 : Extraction de la structure du document. Une ?valuation applicative sera ?galement effectu?e. Elle consistera ? ?valuer la compl?tude et la pr?cision de la reconnaissance par rapport ? la pr?sence de mots cl?s dans les documents. ** Comment participer ? ** Cette campagne est ouverte ? toutes les personnes, entreprises ou institutions qui souhaiteraient ?valuer leur approche en mati?re de traitement automatique de documents num?riques. Tous les participants devront pr?senter leur(s) syst?me(s) lors de l?atelier et ?tre en capacit? d?expliquer ses fondements. L?atelier est r?serv? aux participants ? la campagne et aux agences ayant financ? le projet. Les modules ?tant ind?pendant, les participants peuvent s?inscrire pour ?valuer une cha?ne compl?te (?valuation applicative) ou des modules de leur choix. L?inscription se fait sur le site www.maurdor-campaign.org ** Dates importantes ** Acc?s au plan d??valuation 01/12/2012 Acc?s aux donn?es d?apprentissage 01/12/2012 D?but de la campagne d??valuation 04/03/2013 Fin de la campagne d??valuation 29/04/2013 D?but de la phase d?adjudication 29/04/2013 Fin de la phase d?adjudication 06/05/2013 Atelier Mai 2013 ### English version ### *** MAURDOR-campaigns: Scanned documents processing evaluations *** ** Presentation ** Scanned documents processing is an important issue for information retrieval. The MAURDOR campaigns aim at assessing the progress of the automatic systems in this area. The goal is to quantify and qualify the ability of the systems to extract the relevant information in scanned documents. The Laboratoire national de m?trologie et d?essais (LNE) and CASSIDIAN, an EADS company, will conduct evaluation campaigns entitled MAURDOR in 2013 in order to support Scanned documents processing researches and help advance the state of the art in Optical Characters Recognition technologies. The LNE and CASSIDIAN provide the following to the participants: - Consistent data for the training sets, the development and the test sets. - Automatic metrics tools. - Common rules so as to assess the different steps essential for scanned documents processing. A workshop will be organized at the end of the campaign to account for the results and compare the approaches of various participants. The evaluation plan is available at www.maurdor-campaign.org ** A heterogeneous database ** The MAURDOR evaluations are based on a very heterogeneous database. The training set is multilingual (English, French, and Arabic) and consists on 5,000 different documents corresponding to the following classes: - Blank forms and completed forms (around 12% of the database) - Typewritten commercial documents with sometimes several manual annotations (around 40% of the database) - Handwritten personal letters with sometimes typewritten headers (around 25% of the database) - Commercial letters (around 20% of the database) as purchase orders or bills - Other documents like newspapers articles or maps?(around 3% of the database). The test set contains 1,000 documents distributed as the training set. ** Tasks ** MAURDOR is based on a complete processing in which five separate modules are implemented. Each module performs a particular function contributing to the complete processing of the scanned document. The following five modules are independently assessed during the campaign: - Task 1: Segmentation and typing areas (table, text, image?) - Task 2: Type writing characterization (handwritten or typewritten characters) - Task 3: Language detection - Task 4: Characters recognition - Task 5: Establishing reading order and relations between areas An evaluation will be performed for an operational application as an end-to-end processing chain. It will consist in the assessment of the completion and the accuracy of the results according to the presence of keywords in the recognized text. ** How to participate? ** This evaluation is intended to be of interest of all researchers working on the problem of scanned documents processing. Participation in the evaluation is invited for all researchers who find the tasks and the evaluation of interest. The only requirement is the participation in the follow-up workshop. All the participants must attend the evaluation workshop and be prepared to discuss their system(s), their results in detail. To participate, simply fill out the registration form available at www.maurdor-campaign.org ** Important dates ** Evaluation plan released 01/12/2012 Training data available 01/12/2012 Beginning of the campaign 04/03/2013 End of the campaign 29/04/2013 Beginning of the adjudication 29/04/2013 End of the adjudication 06/05/2013 Workshop May 2013 Another campaign will be organized in 2014. ### Ilya OPARIN Ing?nieur en traitement automatique des langues Direction des Essais T?l. : 01 30 69 14 91 Laboratoire national de m?trologie et d'essais 29, avenue Roger Hennequin - 78197 Trappes cedex T?l. : 01 30 69 10 00 - Fax : 01 30 69 12 34 Site internet : www.lne.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:09:42 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:09:42 +0100 Subject: Appel: Colloque TRADETAL2013 Message-ID: Date: Fri, 7 Dec 2012 12:01:11 +0000 (GMT) From: Farouk BOUHADIBA Message-ID: <1354881671.47978.YahooMailClassic at web132302.mail.ird.yahoo.com> VI?me Colloque International en Traductologie et TAL (TRADETAL 2013) Th?me: Le TAL en Alg?rie et au Maghreb : Etat de l?art et perspectives de formation et de recherche Date de d?roulement : 4, 5 et 6 mai 2013 Lieu : Universit? d?Oran Es-S?nia ORGANISATEURS : Pr. BOUHADIBA Farouk (Labo 022/2000, Universit? d?Oran, Alg?rie) Pr. CARDEY Sylviane (Centre TAL, Lucien Tesni?re, Besan?on, France) ARGUMENTAIRE Le but de ce colloque serait de faire l??tat de l?art sur la recherche et la formation en Traitement Automatique des Langues dans le monde et de situer l??tat de la recherche dans ce domaine dans le Maghreb et plus sp?cialement en Alg?rie. Ceci afin de r?fl?chir sur l?impact de la recherche en Traitement Automatique des Langues en Alg?rie par rapport ? ce qui se fait dans le Maghreb et Outre Mer. L?objectif principal de ce colloque est de situer l?impact de ce domaine de recherche et ce sp?cialement par rapport ? la dictionnairique en ligne, la place de la langue arabe dans les autoroutes de l?information et de la communication, l??laboration de programmes de formation dans ce domaine ainsi que tout ce qui a trait aux protocoles de la r?daction technique de l?arabe vers d?autres langues (Environnement, Tourisme, S?curit?, Sant?, Formation Professionnelle, Recherche Appliqu?e, etc.). Il s?agit ?galement de sensibiliser universitaires et d?cideurs sur l?importance de la cr?ation de centres ou de d?partements TAL en Alg?rie comme cela se fait en Tunisie et au Maroc par exemple et dans les pays du Bassin M?diterran?en. Ceci afin de renforcer la pluridisciplinarit? dans la recherche en TAL sur la Langue Arabe par rapport ? d?autres langues telles que le Fran?ais, l?Anglais, l?Espagnol, le Russe et le Chinois. Cette sixi?me ?dition du TRADETAL, ? l?instar des ?ditions pr?c?dentes, se veut une manifestation scientifique annuelle pour d?velopper les ?changes de recherche intra et inter universitaires (Nationaux et Internationaux) afin d??tablir des liens et des bases d??changes pour la recherche et la formation en TAL et plus sp?cialement les corpus linguistiques pour dictionnaires et traducteurs automatiques en lignes de la langue arabe. L?objectif ?tant la mise en place d?une plateforme pour int?grer et d?velopper la place de la langue arabe dans les autoroutes de l?information actuels. Cette ?dition du Colloque International en Traductologie et TAL (TRADETAL2013) s?int?resse particuli?rement au TAL en Alg?rie et au Maghreb : Etat de l?art et perspectives de formation et de recherche. Elle vise principalement le renforcement des liens et contacts entre chercheurs et universitaires qui s?int?ressent ? diff?rents aspects du transfert de la Langue Arabe vers d?autres langues telles que le Fran?ais, l?Anglais ou l?Espagnol, le Russe et le Chinois, entre autres. Ceci n?exclut nullement tous travaux sur la Langue Arabe ? tous les niveaux d?analyse linguistique et extralinguistique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:10:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:10:59 +0100 Subject: Appel: KBGen Challenge Message-ID: Date: 07 Dec 2012 16:38:33 +0100 From: Claire Gardent Message-Id: X-url: http://www.kbgen.org/ CALL FOR PARTICIPATION The KBGen Challenge: Generating from Knowledge Bases http://www.kbgen.org/ Important Dates ----------------------- 08 December 2012: Registration and Pre-Release Download 01 February 2013: Deadline for feedback and comments on pre-release data 01 March 2013: Release of full KBGen 2013 Task data 01 June 2013: Deadline for System Outputs August 2013: Reporting and discussing results at ENLG Call for Pre-Registration and Sample Data Release ---------------------------------------------------------------------- We invite teams of researchers to pre-register now for the KBGen 2013 Task by filling in the registration form here: http://www.kbgen.org/register/ Once registered, teams will be given access to sample data with which to familiarise themselves with the input representation formats we have developed. We welcome comments and feedback till February, 1st 2013. The complete KBGen data will be distributed on March 1st, and the deadline for submitting system outputs will be in early June (exact date to be confirmed). Results and participating systems will be presented at ENLG in August 2013. Below we provide a brief overview of the KBGen Task. For more information please visit the other pages on this site. KBGen Task ------------------ The task for participating teams is to develop systems that map the input representations provided by the KBGen organisers to sentences, and to submit system outputs for the inputs in the test data set. Data ------ The KBGen Task data is derived from the AURA Knowledge Base which was developed in the context of the HALO Project at SRI International. This knowledge base encodes knowledge contained in a college-level biology textbook. We have processed and adapted this data so that each input provided by the KBGen task can be verbalised in a single, possibly complex, sentence. To minimise the amount of engineering required to participate, we also make available a lexicon mapping the concepts and relations present in the KBGen data to words. Evaluation -------------- Submitted system outputs will be evaluated by a variety of automatic metrics and human-assessed quality criteria. Input Representations ------------------------------- The input representations are bundles of triples expressing relations between entities. For the development phase, the data set will consist of input and output pairs, where each input is associated with one or more manually produced sentence verbalising this input. Here is an example of the input-output pairs that we propose for the challenge: "The temperature of a biomembrane is directly proportional to its fluidity, and the density of a biomembrane is inversely proportional to its fluidity." ((:TRIPLES ( Biomembrane2717 fluidity Fluidity-Value2723 ) ( Biomembrane2717 temperature Temperature-Value2673 ) ( Temperature-Value2673 directly-proportional Fluidity-Value2723 ) ( Biomembrane2717 density Density-Value2762 ) ( Density-Value2762 inversely-proportional Fluidity-Value2723 ) ) (:INSTANCE-TYPES ( Biomembrane2717 instance-of Entity ) ( Biomembrane2717 instance-of Biomembrane ) ( Fluidity-Value2723 instance-of Fluidity-Value ) ( Temperature-Value2673 instance-of Temperature-Value ) ( Density-Value2762 instance-of Density-Value )) ) As mentioned above, we make available a lexicon which maps each concept and relation present in the input to words. Organising Team ----------------------- Eva Banik, Computational Linguistics Ltd, UK Claire Gardent, CNRS/LORIA, Nancy, France Eric Kow, Computational Linguistics Ltd, UK Contact email info at kbgen.org ------------------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:13:17 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:13:17 +0100 Subject: Ecole: Promise Winter School 2013 in Bressanone, Italy, 4-8 February 2013 Message-ID: Date: Fri, 07 Dec 2012 18:24:24 +0100 From: ELRA ELDA Information Message-ID: <50C22648.2020205 at elda.org> X-url: http://www.promise-noe.eu/events/winter-school-2013/ [Apologies for cross-posting] *PROMISE Winter School 2013: Bridging between Information Retrieval and Databases* Bressanone, Italy 4 - 8 February 2013 http://www.promise-noe.eu/events/winter-school-2013/ The aim of the PROMISE Winter School 2013 on "Bridging between Information Retrieval and Databases" is to give participants a grounding in the core topics that constitute the multidisciplinary area of information access and retrieval to unstructured, semistructured, and structured information. The school is a week-long event consisting of guest lectures from invited speakers who are recognized experts in the field. The school is intended for_PhD students, Masters students or senior researchers such as post-doctoral researchers_ form the fields of databases, information retrieval, and related fields. The registration is open until December 20, 2012 (https://docs.google.com/spreadsheet/embeddedform?formkey=dEs1N09jVHNCeTVNR1d3QzN0MnVtTVE6MQ). All information on venue, accommodation and fees can be found at http://www.promise-noe.eu/events/winter-school-2013/registration-and-accomodation TheWinter School programme is available online (http://www.promise-noe.eu/events/winter-school-2013/programme). Any question? Send a mail to winter-school [at] promise-noe.eu ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 8 13:19:55 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 8 Dec 2012 14:19:55 +0100 Subject: Revue: Langages, numero 188 (4/2012) Formes et sens Message-ID: Date: Sat, 8 Dec 2012 12:19:31 +0100 From: Catherine SCHNEDECKER Message-ID: X-url: http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9964 * Langages, n?188 (4/2012) Formes et sens : de l?unicit? ? la variabilit?. Etude de l'espace et du temps (dir. : STOSIC Dejan, FAGARD Benjamin ) Sommaire du n?188 http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9963 - STOSIC Dejan, FAGARD Benjamin Formes et sens : de l?unicit? ? la variabilit? http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9964 - HICKMANN Maya Diversit? des langues et acquisition du langage : espace et temporalit? chez l?enfant http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9965 - IAKOVLEVA Tatiana, HICKMANN Maya Contraintes typologiques dans l'acquisition d'une langue ?trang?re : l'expression du mouvement chez les apprenants russophones du fran?ais http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9966 - PETROVIC Marijana Le pass? simple, le parfait simple et l?aoriste : fran?ais, roumain, valaque et serbe http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9967 - DE SAUSSURE Louis, STHIOUL Bertrand Formes et interpr?tations du pass? surcompos? : unit? s?mantique d?une variation diatopique http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9968 - ALEKSANDROVA Angelina Enfant, j?aimais les ?pinards : l?expression nominale du temps http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9969 - FAGARD Benjamin De ante ? devant et avant : diff?renciation s?mantique dans l??volution des langues romanes http://www.armand-colin.com/revues_article_info.php?idr=20&idnum=424134&idart=9970 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:04:15 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:04:15 +0100 Subject: Seminaire: Quantitative models of early language acquisition, Emmanuel Dupoux Message-ID: Date: Tue, 11 Dec 2012 09:40:17 +0100 From: Nad?ra Bureau Message-ID: <001e01cdd77b$2634dbc0$729e9340$@bureau at lpl-aix.fr> Brain & Language Research Institute Vendredi 21 d?cembre 2012 11h Salle des Vo?tes F?d?ration de Recherche 3 C (Comportement, Cerveau, Cognition) 3 place Victor Hugo, Marseille (Labex BLRI) Emmanuel DUPOUX Quantitative models of early language acquisition R?sum? : The past 40 years of psycholinguistic research has shown that infants learn their first language at an impressive speed. During the first year of life, even before they start to talk, infants converge on the basic building blocks of the phonological structure of their language. Yet, the mechanisms that they use to achieve this early phonological acquisition are still not well known. We show that a modeling approach based on machine learning algorithms and speech technology applied to large speech databases can help to shed light on the early pattern of development. First, we argue that because of acoustic variability, phonemes cannot be acquired directly from the acoustic signal; only highly context dependent and talker dependent phones or phones fragments can be extracted in a bottom-up way. Second, words cannot be acquired directly from the acoustic signal either, but a small number of protowords or sentence fragments can be extracted on the basis of repetition frequency. Third, these two kinds of protolinguistic units can interact with one another in order to converge with more abstract units. The proposal is therefore that the different levels of the phonological system are acquired in parallel, through increasingly more precise approximations. This accounts for the largely overlapping development of lexical and phonological knowledge during the first year of life. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:14:47 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:14:47 +0100 Subject: Job: CDD Ingenieur linguiste, Equipex ORTOLANG Message-ID: Date: Tue, 11 Dec 2012 10:13:17 +0100 From: Etienne Petitjean Message-Id: <8F13128E-DE9A-4C6B-A114-79DDDCB8272C at atilf.fr> Offre d?emploi d?ing?nieur pour le ? D?veloppement de ressources et de services pour la linguistique ? ------------------------------------------------------------------------ Informations g?n?rales Lieu : Nancy (Laboratoire ATILF UMR 7118) dans le cadre de l?Equipex ORTOLANG Date de publication : mercredi 28 novembre 2012 Date limite de candidature : 31/12/2012 Type de contrat : CDD Technique/Administratif Dur?e du contrat : 36 mois Date d'embauche pr?vue : 1er f?vrier 2013 Quotit? de travail : Temps complet Niveau d'?tudes souhait? : Bac+5 Exp?rience souhait?e : exp?rience souhait?e en linguisitique informatique R?mun?ration : 2000 euros brut mensuel environ (selon exp?rience) Missions Dans le cadre du projet d'Equipex ORTOLANG (www.ortolang.fr) et int?gr? ? l??quipe informatique du laboratoire ATILF, cet ing?nieur sera charg? de cr?er ou d?enrichir des ressources linguistiques et de cr?er les outils d?exploitation de ces ressources. Il travaillera en coordination avec les partenaires d?ORTOLANG pour faciliter la convergence des formats de donn?es (ressources) pour faciliter leur partage, et d?veloppera des services informatis?s pour leur acc?s. Il participera ? des groupes de travail concern?s par ces probl?matiques au niveau du laboratoire. Activit?s L?ing?nieur interviendra dans diff?rents projets en cours ou ? venir visant ? produire des ressources linguistiques annot?es en vue de leur mise en ligne. Il travaillera en collaboration avec les d?veloppeurs informatiques pour la cr?ation de scripts et d?outils permettant l?exploitation en ligne de ces ressources. Il apportera sa double comp?tence linguistique et informatique pour mener ? bien les missions qui lui seront confi?es. Il recevra des formations pour l?acquisition de nouvelles comp?tences dans les domaines techniques li?s ? son activit?. Comp?tences Ma?triser au moins un langage de scripts (Perl, Python, Ruby) Ma?triser les bases de donn?es (SQL et MySQL) Avoir une bonne connaissance du langage XML et de ses applications (une connaissance de la TEI sera un plus) Avoir une bonne exp?rience en linguistique et en traitement de corpus Avoir une bonne connaissance des technologies du Web (XHTML, CSS, Javascript) Travail en ?quipe, esprit d?initiative Contexte de travail Dans le cadre de la mise en place de l'Equipex ORTOLANG (www.ortolang.fr), cet emploi s'ins?rera dans le laboratoire ATILF (http://www.atilf.fr), Unit? Mixte de Recherche du CNRS et de l?Universit? de Lorraine et partenaire d'ORTOLANG. Informations compl?mentaires Toute candidature (CV d?taill? et lettre de motivation) devra ?tre adress?e ? : Etienne Petitjean etienne.petitjean at atilf.fr Contact Etienne Petitjean etienne.petitjean at atilf.fr Jean-Marie Pierrel jean-marie.pierrel at atilf.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:19:05 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:19:05 +0100 Subject: Job: CDD Ingenieur informatique, Equipex ORTOLANG Message-ID: Date: Tue, 11 Dec 2012 10:15:46 +0100 From: Etienne Petitjean Message-Id: <2F2FD559-DD0D-4184-99B9-4ADB785948DC at atilf.fr> Offre d?emploi d?ing?nieur pour le ? D?veloppement d?outils et de traitement de ressources pour la linguistique ? ------------------------------------------------------------------------ Informations g?n?rales Lieu : Nancy (Laboratoire ATILF UMR 7118) dans le cadre de l?Equipex ORTOLANG Date de publication : jeudi 6 d?cembre 2012 Date limite de candidature : 31/12/2012 Type de contrat : CDD Technique/Administratif Dur?e du contrat : 36 mois Date d'embauche pr?vue : 1er f?vrier 2013 Quotit? de travail : Temps complet Niveau d'?tudes souhait? : Bac+5 Exp?rience souhait?e : une exp?rience en traitement de corpus sera un plus R?mun?ration : 2000 euros brut mensuel environ (selon exp?rience) Missions Dans le cadre du projet d'Equipex ORTOLANG (www.ortolang.fr) et int?gr? ? l??quipe informatique du laboratoire ATILF, cet ing?nieur sera charg? de d?velopper ou de se r?appropier des outils et des chaines de traitements pour la production et l?exploitation de ressources linguistiques. Il travaillera en coordination avec les partenaires d?ORTOLANG pour faciliter le partage et la mise en ligne d?outils ? destination de la communaut?. Activit?s L?ing?nieur travaillera en appui des ing?nieurs en poste sur diff?rents projets informatiques concernant notamment le traitement de gros volumes de donn?es linguistiques, le d?veloppement de chaines de traitement de donn?es et la mise en place d?outils r?utilisables sur le Web. Comp?tences Ma?triser au moins les langages de scripts (Perl et le Shell Unix) Ma?triser les bases de donn?es (SQL et MySQL) Avoir une bonne connaissance du langage XML et de ses applications (une connaissance de la TEI sera un plus) Avoir une bonne exp?rience du langage Java Avoir une bonne connaissance des technologies du Web (XHTML, CSS, Javascript) Travail en ?quipe, esprit d?initiative Contexte de travail Dans le cadre de la mise en place de l'Equipex ORTOLANG (www.ortolang.fr), cet emploi s'ins?rera dans le laboratoire ATILF (http://www.atilf.fr), Unit? Mixte de Recherche du CNRS et de l?Universit? de Lorraine et partenaire d'ORTOLANG. Informations compl?mentaires Toute candidature (CV d?taill? et lettre de motivation) devra ?tre adress?e ? : Etienne Petitjean etienne.petitjean at atilf.fr Contact Etienne Petitjean etienne.petitjean at atilf.fr Jean-Marie Pierrel jean-marie.pierrel at atilf.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:24:23 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:24:23 +0100 Subject: Job: Stage, Extraction et modelisation de connaissances d=?WINDOWS-1252?Q?=92un_?=document texte (mots-cles, themes) Message-ID: Date: Tue, 11 Dec 2012 16:48:44 +0100 From: Alain Simac-Lejeune Message-ID: Proposition de stage de M2 dans l'entreprise Compilatio (Saint-F?lix, 74) : *Extraction et mod?lisation de connaissances d?un document texte* Le stage consiste ? ?tudier les m?thodes existantes pour faire de l?analyse de documents, l?extraction de mots-cl?s, l?extraction de th?matiques dans le but de cr?er une signature s?mantique du document. Le stage de 6 mois se d?roulera ? Saint-F?lix en Haute-Savoie (Vers Annecy et Chamb?ry). Il sera r?mun?r? de mani?re conventielle. Renseignements et candidatures : Alain Simac-Lejeune : alain at compilatio.net *L?entreprise* : Compilatio est un ?diteur de logiciel (entreprise innovante) propose un service en ligne pour l?analyse de documents pour la pr?vention et la d?tection de plagiat. Leader fran?ais de la d?tection de plagiat cr?? en 2007, l?entreprise sert plus de 200 ?tablissements sup?rieurs et analyse quotidiennement plus de 1000 documents. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:32:09 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:32:09 +0100 Subject: Job: Stage, Recherche de similitudes dans Wikipedia avec SPARQL (DBPedia) Message-ID: Date: Tue, 11 Dec 2012 16:50:27 +0100 From: Alain Simac-Lejeune Message-ID: Proposition de stage de M2 dans l'entreprise Compilatio (Saint-F?lix, 74) : *Recherche de similitudes dans Wikipedia avec SPARQL (DBPedia)* Le stage consiste ? ?tudier le projet DBpedia, le SPARQL et Wikip?dia et de proposer un outil permettant la recherche d?articles de Wikip?dia pr?sentant des similitudes avec le document analys?. Le stage de 6 mois se d?roulera ? Saint-F?lix en Haute-Savoie (Vers Annecy et Chamb?ry). Il sera r?mun?r? de mani?re conventielle. Renseignements et candidatures : Alain Simac-Lejeune : alain at compilatio.net *L?entreprise* : Compilatio est un ?diteur de logiciel (entreprise innovante) propose un service en ligne pour l?analyse de documents pour la pr?vention et la d?tection de plagiat. Leader fran?ais de la d?tection de plagiat cr?? en 2007, l?entreprise sert plus de 200 ?tablissements sup?rieurs et analyse quotidiennement plus de 1000 documents. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:33:51 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:33:51 +0100 Subject: Ecole: Terminology workshop (Last call) Message-ID: Date: Tue, 11 Dec 2012 19:06:06 +0100 From: "iula at online" Message-ID: <05D8AA38E5A64281B19C5C1DAE444B43 at ws076671> X-url: http://www.iula.upf.edu/teronlform0uk.htm Dear colleagues, We are pleased to announce that the online workshop Methodology for Terminology Work (second edition in English) will start on January 16th 2013. This workshop is offered by IULATERM, the leading Research Group in Terminology under the direction of M. Teresa Cabr?, in the framework of the online Master in Terminology. The online workshop Methodology for Terminology Work deals with the foundations of terminological practice within the framework of M. T. Cabr?'s Communicative Theory of Terminology, and it is aimed at learning how to elaborate a terminological product (a glossary or vocabulary) following the main phases of terminology work: definition of the work, writing of the work plan, creation and examination of the extraction corpus, database creation and revision, and work editing. The online workshop Methodology for Terminology Work is based on TERMINUS 2.0?, an application for terminology and corpus management developed by IULATERM Research Group. TERMINUS 2.0? is an integrated web application which provides tools for the complete terminographic workflow: document search, corpus compilation and exploration, automatic term extraction, dictionary and project management, database creation and maintenance, and dictionary edition (in digital or print format). Please note that the number of places for the workshop is limited; thus early registration is strongly recommended. Please see below for further details, and do not hesitate to write to us should you need any additional information. Workshop dates: January 16th - March 12th 2013 ECTS Credits: 10 Fee: ? 600 Registration: http://www.iula.upf.edu/teronlform0uk.htm (Please follow the instructions indicated under Registration procedure) Further information and contact: iulaonline at upf.edu Best regards, M. Teresa Cabr? Director of the Master in Terminology ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Dec 11 20:37:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 11 Dec 2012 21:37:25 +0100 Subject: Appel: ACL 2013 Student Research Workshop Message-ID: Date: Tue, 11 Dec 2012 19:30:16 +0100 From: Sebastian Krause Message-ID: <50C77BB8.60603 at dfki.de> X-url: http://sites.google.com/site/aclsrw2013/ SECOND CALL FOR PAPERS -- ACL 2013 STUDENT RESEARCH WORKSHOP 5-7 August, 2013, Sofia, Bulgaria ** Submission deadline: Sunday, March 3, 2013 ** http://sites.google.com/site/aclsrw2013/ GENERAL INVITATION FOR SUBMISSIONS ---------------------------------------- The ACL Student Research Workshop provides a venue for student researchers investigating topics in Computational Linguistics and Natural Language Processing to present their research, to meet potential advisors, and to receive feedback from the international research community. The workshop's goal is to aid students at multiple stages of their education: from those in the final stages of undergraduate training to those who are preparing their graduate thesis proposal. Towards this goal, we invite papers in two separate categories. 1. Thesis/Research Proposals: This category is appropriate for experienced students who wish to get feedback on their proposal and broader ideas for the field in order to strengthen their final research. 2. Research Papers: Most appropriate for students who are new to academic conferences. Papers in this category can describe completed work or work in progress with preliminary results. Subject to the availability of established researcher volunteers, each accepted paper will be assigned a mentor, who will provide feedback on the work to the student at the conference. Separately, the committee will do its best to assign pre-submission mentors to students who wish to get feedback before the paper deadline. This service will be available on a first come, first served basis and does not guarantee acceptance into the workshop. Students who wish to take advantage of this opportunity should let the co-chairs know via email (to: acl-srw-2013 at googlegroups.com) no later than Saturday, December 29, 2012 and should submit a paper draft no later than Friday, January 18, 2013. TOPICS ---------------------------------------- Relevant topics for the workshop include, but are not limited to, the following areas (in alphabetical order): - Cognitive modeling of language processing and psycholinguistics - Dialogue and interactive systems - Discourse, coreference and pragmatics - Evaluation methods - Information retrieval - Language resources - Lexical semantics and ontologies - Low resource language processing - Machine translation: methods, applications and evaluation - Multilinguality in NLP - NLP applications - NLP and creativity - NLP for the languages of Central and Eastern Europe and the Balkans - NLP for the Web and social media - Question answering - Semantics - Sentiment analysis, opinion mining and text classification - Spoken language processing - Statistical and Machine Learning methods in NLP - Summarization and generation - Syntax and parsing - Tagging and chunking - Text mining and information extraction - Word segmentation SUBMISSION GUIDELINES ---------------------------------------- See our site: https://sites.google.com/site/aclsrw2013/submission-guidelines IMPORTANT DATES ---------------------------------------- - Pre-submission mentoring service application: December 29, 2012 - Pre-submission mentoring paper deadline: January 18, 2013 - Submission deadline: March 3, 2013 - Notification of acceptance: April 24, 2013 - Camera-ready submission deadline: May 24, 2013 - Conference dates: August 5-7, 2013 (The workshop will be held during the main conference, in a mode similar to the conference's regular sessions.) TRAVEL FUNDING ---------------------------------------- We will be able to provide student authors of accepted papers with a limited amount of travel support. Details on how to apply for this will be part of the acceptance notification distributed in April 2013. ORGANISING COMMITTEE ---------------------------------------- Student Chairs: - Anik Dey, The Hong Kong University of Science & Technology - Sebastian Krause, German Research Center for Artificial Intelligence - Ivelina Nikolova, Bulgarian Academy of Sciences - Eva Vecchi, Universita di Trento Faculty Advisors: - Steven Bethard, University of Colorado Boulder & KU Leuven - Preslav I. Nakov, Qatar Computing Research Institute - Feiyu Xu, German Research Center for Artificial Intelligence PROGRAM COMMITTEE ---------------------------------------- See our site: https://sites.google.com/site/aclsrw2013/program-committee CONTACT ---------------------------------------- acl-srw-2013 at googlegroups.com ++++++++++++++++++++++++++++++++++++++++ We apologize if you receive duplicates of this CFP. Please feel free to distribute it to those who might be interested. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:01:32 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:01:32 +0100 Subject: Job: 2 Stages, Analyse des evenements et l'extraction d'information temporelle , LIMSI-CNRS Message-ID: Date: Wed, 12 Dec 2012 14:25:27 +0100 From: Xavier Tannier Message-ID: <50C885C7.9060202 at limsi.fr> X-url: http://perso.limsi.fr/Individu/xtannier/fr/Stages/sujet_2013_M1_M2_analyse_temporelle_de_pages_web.html X-url: http://perso.limsi.fr/Individu/xtannier/fr/Stages/sujet_2013_L_moteur_de_recherche_evenements.html Bonjour, Deux stages autour de l'analyse des ?v?nements et l'extraction d'information temporelle sont propos?s cette ann?e par l'?quipe ILES du LIMSI-CNRS. Le LIMSI se situe ? Orsay (91), sur le plateau de Saclay. 1. Niveau M1, M2Pro, M2R (sujet ? moduler en fonction du niveau) : *"Analyse temporelle de pages web d'information" * http://perso.limsi.fr/Individu/xtannier/fr/Stages/sujet_2013_M1_M2_analyse_temporelle_de_pages_web.html 2. Niveau DUT info, L3 ou fin de premier cycle d'?cole d'ing?nieur : *"R?alisation d'une interface graphique pour un moteur de recherche d'?v?nements"* http://perso.limsi.fr/Individu/xtannier/fr/Stages/sujet_2013_L_moteur_de_recherche_evenements.html Merci d'envoyer vos candidatures ? Xavier Tannier (xtannier at limsi.fr) et V?ronique Moriceau (moriceau at limsi.fr), en pr?cisant bien ? quel stage vous postulez. Cordialement, Xavier Tannier Ma?tre de conf?rence LIMSI-CNRS (b?t. 508, bureau 12, RdC) Universit? Paris-Sud 11 B.P. 133 91403 ORSAY CEDEX FRANCE http://www.limsi.fr/~xtannier/ tel: 0033 (0)1 69 85 80 12 fax: 0033 (0)1 69 85 80 88 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:03:10 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:03:10 +0100 Subject: Appel: HMGE 2013 (ESSLLI Workshop) Message-ID: Date: Wed, 12 Dec 2012 15:19:20 +0100 From: Yannick Parmentier Message-ID: <20121212141920.GG4091 at nausicaa> X-url: http://www.univ-orleans.fr/lifo/evenements/HMGE13/ ** apologies for cross-posting ** CALL FOR PAPERS ====================================================== High-level Methodologies for Grammar Engineering (HMGE 2013) ESSLLI 2013 Workshop (Language and Computation Area) University of D?sseldorf, Germany August 12-16, 2013 http://www.univ-orleans.fr/lifo/evenements/HMGE13/ ====================================================== INTRODUCTION ============ Many grammatical frameworks have been proposed over the last decades to describe the syntax (and semantics) of natural language. Among the most widely used, one may cite Tree-Adjoining Grammar (TAG) [Joshi et. Al, 1975], Lexical-Functional Grammar (LFG) [Bresnan and Kaplan, 1982], or Head- driven Phrase Structure Grammar (HPSG) [Pollard and Sag, 1994]. These frameworks present theoretical and practical interests. From a theoretical point of view, they provide a formal device for the linguist to experiment with her/his theories. From a practical point of view, they make it possible to automatically process natural language in applications such as dialog systems, machine translation, etc. They differ in their expressivity and complexity. Some reveal themselves more adequate for the description of a given language than others. Still, for many of these frameworks, large resources (i.e., grammars) have been designed, at first by hand, and later via dedicated tools (e.g., integrated grammar environments such as XLE for LFG [King et al, 2000]). In this workshop, we are concerned with this complex task of grammar engineering, keeping in mind the two above-mentioned theoretical and practical interests. TOPICS ====== HMGE is open to submissions on topics including, but not limited to: * development, maintenance and enhancement of grammars * semi-automatic acquisition of grammars * debugging environments for grammar design * dedicated description languages for grammar engineering * applications of large-scale grammars VENUE ===== The workshop will be held as part of ESSLLI in August 2013 in D?sseldorf, Germany. More information about ESSLLI can be found at the ESSLLI web pages at http://esslli2013.de/. IMPORTANT DATES =============== Paper submission deadline: March 10, 2013 Reviews due: April 28, 2013 Camera ready version: May 19, 2013 Workshop: August 12-16, 2013 SUBMISSIONS =========== Papers must be submitted electronically as PDF files and be prepared using the Springer LNAI/LNCS format. Detailed formatting instructions can be found at: http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0 HMGE accepts two kinds of submissions: - full papers (12 pages including references) reporting completed, significant research, - short papers (6 pages including references) reporting ongoing work and partial results. Each submission will be reviewed by three program committee members. Accepted long papers will be presented within 20 minutes talks plus 10 minutes for questions. Accepted short papers will be presented within 10 minutes talks plus 10 minutes for questions. Both paper types will be published in the workshop proceedings. Since reviewing will be blind, the submission should not include the authors' names and affiliations. Other identifying information such as obvious self-references (e.g., "We showed in [12] ...") and financial or personal acknowledgements should be omitted in the submitted papers whenever feasible. Papers have to be submitted via the easychair conference management system using the following link: http://www.easychair.org/conferences/?conf=hmge13 PROGRAM COMMITEE ================ Emily Bender, Washington Philippe Blache, Aix-en-Provence Miriam Butt, Konstanz Eric De La Clergerie, Paris Beno?t Crabb?, Paris Berthold Crysmann, Paris Stefanie Dipper, Bochum Denys Duchier, Orl?ans Claire Gardent, Nancy Josef van Genabith, Dublin Timm Lichte, D?sseldorf Montserrat Marimon, Barcelona Yusuke Miyao, Tokyo Stefan M?ller, Berlin Gertjan van Noord, Groningen Yannick Parmentier, Orl?ans Agnieszka Patejuk, Warsaw ORGANIZING COMMITEE =================== Denys Duchier (LIFO - Universit? d'Orl?ans) Yannick Parmentier (LIFO - Universit? d'Orl?ans) Information about the Workshop is available at the HMGE workshop website: http://www.univ-orleans.fr/lifo/evenements/HMGE13/ E-mail:hmge13 at easychair.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:17:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:17:46 +0100 Subject: Appel: Verbum, La composition neoclassique (Report de date / Deadline extension) Message-ID: Date: Wed, 12 Dec 2012 16:49:21 +0100 From: St?phanie Lignon Message-ID: <50C8A781.8080803 at univ-nancy2.fr> La composition n?oclassique, num?ro de Verbum coordonn? par St?phanie Lignon et Fiammetta Namer Parmi les proc?d?s de cr?ation lexicale disponibles dans la langue, la composition n?oclassique met en jeu des mod?les particuliers. La composition est un proc?d? constructionnel qui fait intervenir deux lex?mes de base afin de construire un nouveau lex?me (timbre-poste, porte-bagage). On distingue deux types de composition, la composition standard (ou populaire ou ordinaire), qui met en jeu des lex?mes du vocabulaire contemporain (porte-bagage), et la composition n?oclassique, qui met en jeu des lex?mes emprunt?s au fonds patrimonial, comme col?opt?re ou anthropophage. La composition n?oclassique (?galement dite ? savante ?, ? ?rudite ?, ou encore appel?e ? infixation ?, ? confixation ?, etc.) ?tait initialement r?serv?e ? la formation de termes des vocabulaires de sp?cialit?s en m?decine, chimie, zoologie, botanique, etc. Or, aujourd?hui, elle sert de mod?le ? des formations appartenant non plus ? des vocabulaires sp?cialis?s, mais ? la langue ? g?n?rale ? ; cf. par exemple contraintophobe, ferrovipathe, capillo-tract?, chronophage, th??trol?tre, publivore, bobophile. Toutefois, son identification est plus d?licate que celle des affix?s : - le seul segment que partagent tous les compos?s n?oclassiques est la voyelle de liaison ?o- (politicom?diatique, primoacc?dant) ou ?i- (liberticide) entre les composants ; - le segment qui suit la voyelle de liaison est soit un mot du fran?ais, soit un constituant grec ou latin pr?sent dans d'autres mots du fran?ais ; - ce dernier, contrairement aux mots, ne figure pas dans les lexiques du fran?ais. Son succ?s dans la langue g?n?rale est la raison qui nous pousse ? vouloir proposer un num?ro th?matique d?di? ? ce proc?d?. Une attention toute particuli?re sera port?e aux soumissions proposant un lien avec les corpus et la formalisation (mod?les), dans un contexte monolingue et multilingue, dans les domaines de sp?cialit? ou dans la langue g?n?rale. L'appel s'adresse aux sp?cialistes de plusieurs domaines, quel que soit le courant th?orique adopt? : - linguistique : lexique, terminologie, morphologie ; - TAL, - psycholinguistique (aspect perception, apprentissage de la langue, troubles du langage, etc.). Calendrier : - 30 janvier 2013 : Les auteurs souhaitant proposer un article sur ce th?me sont pri?s d?envoyer une intention de soumission de deux pages (bibliographie non comprise) de leur projet pour le 15 janvier 2013. Ce r?sum? ne doit pas ?tre programmatique. Il doit indiquer clairement la probl?matique abord?e et faire ?tat des principaux r?sultats qui seront expos?s dans l?article. - 28 f?vrier 2013 : S?lection des communications par le comit? de lecture et notification aux auteurs - 30 juin 2013 : r?ception des articles complets qui devront faire entre 15 et 20 pages. La feuille de style sera communiqu?e aux auteurs lors de la notification de leur acceptation. Les propositions sont ? envoyer ? St?phanie Lignon ( stephanie.lignon at univ-lorraine.fr)et Fiammetta Namer ( fiammetta.namer at univ-lorraine.fr). Comit? de lecture : Dany AMIOT (STL, Universit? Lille 3), Fr?d?rique BRIN-HENRY (ATILF, Universit? de Lorraine), Georgette DAL (STL, Universit? Lille 3), Natalia GRABAR (STL, Universit? Lille 3), Nabil HATHOUT (CLLE, Universit? Toulouse-Le Mirail), St?phanie LIGNON (ATILF, Universit? de Lorraine), Fiammetta NAMER (ATILF, Universit? de Lorraine), S?verine CASALIS (URECA, Universit? Lille 3), Thierry HAMON (LIM&BIO, Universit? Paris 13), Thi Mai TRAN (STL, Universit? Lille 2). *********************************************************************** Neoclassical Compounding Special issue of the Verbum journal Guest Editors: St?phanie Lignon and Fiammetta Namer Neoclassical Compounding Special issue of the Verbum journal Guest Editors: St?phanie Lignon and Fiammetta Namer Among all the available morphological processes for lexical creation in languages, the neoclassical compounding involves specific models. Compounding is a constructional process during which at least two base lexemes are combined in order to construct a new lexeme (tea bag, timbre-poste, porte-bagage). Two types of compounding may be distinguished: standard compounding (also called popular) on the one hand which involves the modern vocabulary (porte-bagage), and neoclassical compounding on the other hand which involves lexemes borrowed from ancient languages, often Greek and Latin (col?opt?re, anthropophage). Neoclassical compounding (also called in French ?savante?, ??rudite?, ?infixation?, ?confixation?, etc.) was first used to describe the creation of terms in specialized vocabularies, such as medicine, chemistry, zoology, botanics, etc. More recently however, this type of compounding also provides models for the creation of lexemes which do not belong to specialized vocabularies, but to the ?general? language; e.g., contraintophobe, ferrovipathe, capillo-tract?, chronophage, th??trol?tre, publivore, bobophile. Moreover, automatic identification of such lexemes is not obvious, while the affixed lexemes may be detected quite easily. We can mention several reasons for this situation: - the only segment shared by the neoclassical compounds is the binding vowel ?o- (politicom?diatique, primoacc?dant) or ?i- (liberticide) occurring between the components; - the segment which follows the binding vowel is either a modern word (in French, English or in other languages) or a Greek or Latin element also present in other words of the modern language; - the Greek or Latin elements are not part of the modern lexicon of a given language (French, English...), while the modern words are. Hence, in addition to the linguistic modeling, the automatic processing of the neoclassical compounds also requires a specific treatment. The unsuspected success of the neoclassical compounding within the general language is our main motivation for this special issue dedicated to neoclassical compounding. Special attention will be paid to submissions which establish a link between corpus processing and formal models, within monolingual and multilingual contexts, in specialized areas or in general language. The call welcomes researchers from different areas, whatever their theoretical schools and trends: - linguistics: lexicon, terminology, morphology; - Natural Language Processing, - psycholinguistics (aspects related to the perception, language learning, language impairment, etc.). Important dates (deadline extension): - January 30th, 2013: Authors who would like to submit an article addressing these topics are invited to send their proposal consisting of two pages (plus references) with their publication project before January 15th, 2013. The abstract should not be programmatic but should clearly indicate its purpose and present the main results which will be developed in the article. - February 28th, 2013: Selection of the communications performed by the Scientific Committee and notifications sent to the authors. - June 30th, 2013: Reception of final versions of the articles, which should contain between 15 and 20 pages. The style sheet will be provided to the concerned authors with the acceptance notifications. Please send your submission to St?phanie LIGNON (stephanie.lignon at univ-lorraine.fr) et Fiammetta NAMER (fiammetta.namer at univ-lorraine.fr) Scientific committee: Dany AMIOT (STL, Universit? Lille 3), Fr?d?rique BRIN-HENRY (ATILF, Universit? de Lorraine), Georgette DAL (STL, Universit? Lille 3), Natalia GRABAR (STL, Universit? Lille 3), Nabil HATHOUT (CLLE, Universit? Toulouse-Le Mirail), St?phanie LIGNON (ATILF, Universit? de Lorraine), Fiammetta NAMER (ATILF, Universit? de Lorraine), S?verine CASALIS (URECA, Universit? Lille 3), Thierry HAMON (LIM&BIO, Universit? Paris 13), Thi Mai TRAN (STL, Universit? Lille 2). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:20:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:20:37 +0100 Subject: Ressources: ELRA - Language Resources Catalogue - Update Message-ID: Date: Wed, 12 Dec 2012 17:22:17 +0100 From: ELRA ELDA Information Message-ID: <50C8AF39.8030207 at elda.org> X-url: http://catalog.elra.info/product_info.php?products_id=1178 X-url: http://catalog.elra.info/product_info.php?products_id=1179 X-url: http://catalog.elra.info/product_info.php?products_id=1180 X-url: http://catalog.elra.info/product_info.php?products_id=1181 Our apologies if you have received multiple copies of this announcement. ***************************************************************** ELRA - Language Resources Catalogue - Update ***************************************************************** ELRA is happy to announce that 4 new Written Corpora are now available in its catalogue. *ELRA-W0059 LT Corpus* The LT Corpus is composed of 70 fiction texts from Portuguese renowned authors. The corpus contains 1,781,083 tokens. The texts date from before 1940. The corpus is delivered in one file, in two different formats. The txt version has one sentence per line, an identification number for each text and no further annotation. The cqpweb file is one token per line, followed by pos tag and lemma, and is annotated for NP chunks. For more information, see: http://catalog.elra.info/product_info.php?products_id=1178 *ELRA-W0060 PTPARL Corpus* The PTPARL Corpus contains 1,076 texts consisting of adapted transcriptions of the Portuguese Parliament sessions. The corpus contains 1,000,441 tokens. The corpus is delivered in one file, in two different formats. The txt version has one sentence per line, an identification number for each text and no further annotation. The cqpweb file is one token per line, followed by pos tag and lemma, and is annotated for NP chunks. For more information, see: http://catalog.elra.info/product_info.php?products_id=1179 *ELRA-W0061 CINTIL-DependencyBank* The CINTIL-DependencyBank (Silva and Branco, 2012) is a corpus of sentences annotated with their syntactic dependency graphs and grammatical function tags composed of 10,039 sentences and 110,166 tokens taken from different sources and domains: news (8,861 sentences; 101,430 tokens), novels (399 sentences; 3,082 tokens). In addition, there are 779 sentences (5,654 tokens) that are used for regression testing of the computational grammar that supported the annotation of the corpus. For more information, see: http://catalog.elra.info/product_info.php?products_id=1180 *ELRA-W0062 CINTIL-DeepBank* The CINTIL-DeepBank (Branco et al., 2010) is a corpus of sentences annotated with their full-fledged deep grammatical representations, composed of 10,039 sentences and 110,166 tokens taken from different sources and domains: news (8,861 sentences; 101,430 tokens), and novels (399 sentences; 3,082 tokens). In addition, there are 779 sentences (5,654 tokens) used for regression testing of the computational grammar that supported the annotation of the corpus. For more information, see: http://catalog.elra.info/product_info.php?products_id=1181 For more information on the catalogue, please contact Val?rie Mapelli (mapelli at elda.org) Visit our On-line Catalogue: http://catalog.elra.info Visit the Universal Catalogue: http://universal.elra.info Archives of ELRA Language Resources Catalogue Updates: http://www.elra.info/LRs-Announcements.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:21:25 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:21:25 +0100 Subject: Info: Newsletter du LPL numero 5 - dec. 2012 Message-ID: Date: Thu, 13 Dec 2012 10:27:58 +0100 From: Jo?lle Lavaud Message-ID: <50C99F9E.2060405 at lpl-aix.fr> X-url: http://www.lpl.univ-aix.fr/fileadmin/template/NewsLetter/NL5.htm Bonjour, Nous avons le plaisir de vous envoyer le dernier num?ro de la Newsletter du Laboratoire Parole et Langage, consultable en ligne : http://www.lpl.univ-aix.fr/fileadmin/template/NewsLetter/NL5.htm Nous vous souhaitons une bonne lecture. Cordialement, La cellule communication du LPL ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:23:59 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:23:59 +0100 Subject: Seminaire: Prochains seminaires CLLE-ERSS, Programme Message-ID: Date: Thu, 13 Dec 2012 11:45:13 +0100 From: mai hodac Message-ID: Vous trouverez ci-dessous la liste des prochains s?minaires organis?s par le laboratoire CLLE-ERSS ? l'Universit? de Toulouse - le Mirail. Un programme plus d?taill? est donn?e sur la page du laboratoire http://w3.erss.univ-tlse2.fr/ -- manifestations *Jeudi 20 d?cembre 2012 : Fran?ois Morlane-Hond?re,* Universit? de Toulouse, CLLE-ERSS L'analyse distributionnelle automatique comme m?thode d'observation des relations lexicales en contexte *Jeudi 10 janvier 2013 : Karine Duvignau,* Universit? de Toulouse, CLLE-ERSS De la m?taphore au r?sum? de textes de vulgarisation scientifique : donn?es et propositions *Jeudi 24 janvier 2013 : Laure-Anne Johnsen, *Universit?s de Neuch?tel et de Fribourg "Soi-disant qu'ils ont retrouv? le squelette de la Joconde". Le clitique ils ? r?f?rence ind?termin?e : une construction impersonnelle ? Pr?c?d? d'une petite introduction au Corpus OFROM : corpus oral de fran?ais de Suisse romande *Jeudi 7 f?vrier 2013 : Marleen Van Peteghem*, Universit? de Gand ? M?me ? : de l'identit? ? la focalisation *Jeudi 21 f?vrier 2013 : Elise Leroy,* Websourd et charg?e de mission ? l'Universit? de Toulouse, CETIM Didactique de la Langue des signes fran?aise, langue 1. Reconna?tre les enseignants sourds et construire une discipline. *Jeudi 14 mars 2013 : Christian R?tor?,* Universit? de Bordeaux 1, LaBRI (d?l?gation CNRS ? l'IRIT) Un cadre logique commun pour la s?mantique compositionnelle et la pragmatique lexicale Application au voyageur virtuel *Jeudi 28 mars 2013 : Sophie Rosset,* LIMSI Accords inter-annotateurs dans une campagne d'annotation : de la th?orie ? la pratique ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:27:07 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:27:07 +0100 Subject: Appel: ESSLLI Student Session 2013 Message-ID: Date: Fri, 14 Dec 2012 16:02:27 +0100 From: Margot Colinet Message-ID: X-url: http://stus2013.loriweb.org/ X-url: http://esslli2013.de/ First Call for Papers ESSLLI 2013 STUDENT SESSION Held during The 25th European Summer School in Logic, Language and Information D?sseldorf, Germany, August 5-16, 2013 Deadline for submissions: April 1st, 2013 https://www.easychair.org/conferences/?conf=essllistus2013 *ABOUT*: The Student Session of the 25th European Summer School in Logic, Language, and Information (ESSLLI) will take place in *D?sseldorf, Germany on August 5-16, 2013*. We invite submissions of original, unpublished work from students in any area at the intersection of Logic & Language, Language & Computation, or Logic & Computation. Submissions will be reviewed by several experts in the field, and accepted papers will be presented orally or as posters and will appear in the student session proceedings in Springer. This is an excellent opportunity to receive valuable feedback from expert readers and to present your work to a diverse audience. *A SEPARATE POSTER SESSION*: Note that this year there are two separate kinds of submissions, one for the oral presentations and one for the posters. This means that papers can be directly submitted as posters. Reviewing and ranking will be done separately. We particularly encourage submissions for posters. More detailed guidelines regarding submission can be found on the Student Session website: http://stus2013.loriweb.org/, (links to previous years' proceedings are also available there). Please direct inquiries about submission procedures or other matters relating to the Student Session to margotcolinet at gmail.com For general inquiries about ESSLLI 2013, please consult the main ESSLLI 2013 page, http://esslli2013.de/. Kind regards, *The ESSLLI 2013 Student Session Organization Committee*, Chair: Margot Colinet (Universit? Paris Diderot-Paris 7) LOCO (LOgic and Computation) co-chairs: Ronald de Haan (Technische Universit?t Wien) Micha? Zawidzki (Uniwersytet ??dzki) LOLA (LOgic and LAnguage) co-chairs: Agata Renans (Universit?t Potsdam) Barbara Tomaszewicz (University of Southern California) LACO (LAnguage and Computation) co-chairs: Pierre Bourreau (Heinrich-Heine-Universit?t D?sseldorf) Julia Zinova (Heinrich-Heine-Universit?t D?sseldorf) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:32:21 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:32:21 +0100 Subject: Conf: Colloque international La langue, la voix, la parole, La Sorbonne, Paris, 17-18 janvier 2013 Message-ID: Date: Fri, 14 Dec 2012 01:45:58 +0000 (GMT) From: Amr Ibrahim Message-ID: <1355449558.93353.YahooMailNeo at web171302.mail.ir2.yahoo.com> X-url: http://www.cereli.fr ?quipe d?Accueil 4509 ? STIH CRL Sens, Textes, Informatique, Histoire Cellule de Recherche en Linguistique La langue, la voix, la parole Colloque international ? la Sorbonne Jeudi 17 & Vendredi 18 janvier 2013 Salle J-636 Programme Jeudi 9h ? 9h30 ? Accueil Sous la pr?sidence de Claire Martinot (Paris-Sorbonne) 9h 30 ? 9h 45 ? Allocution d?ouverture ? Jo?lle Ducos ? Directrice de l??quipe Sens Textes Informatique Histoire 9h45 ? 10h30 Quand la prosodie pr?c?de le sens : de la contagion musicale ? la didactique des langues Branka Zei Pollermann ? Vox Institute ? Gen?ve Pause 11h00 ? 11h 45 Les m?lodies des sens : la vari?t? prosodique des modalit?s en italien Domenico Di Russo ? Universita Gabriele D?Annunzio - Chieti-Pescara 11h45 ? 12h30 Voix et genre : un ?tat de la question Erwan P?piot ? Universit? Paris 8 Repas Sous la pr?sidence de Ross Charnock (Paris-Dauphine) 14h30 ? 15h 15 Des deux phases cruciales dans la traduction des contes wolof Omar Diop ? Universit? de Caen Basse Normandie ? Caen 15h15 - 16h 00 De la voix au voisement ? ?tude acoustique, articulatoire et acquisition des consonnes sonantes en polonais et en fran?ais Jagoda Bruni ? Universit?t Stuttgart ? Stuttgart Pause 16h30 ? 17h15 Travail de la voix dans la langue : le cas de la prononciation du Fran?ais langue ?trang?re Claire Pillot-Loiseau ? CNRS & Universit? Paris 3 Sorbonne Nouvelle 17h15 ? 18h 00 La voix de l?enseignant de FLE : une voix pragmatique ? Malak Moustapha-Sabeur ? Universit? de Carthage ? Tunis Vendredi Sous la pr?sidence de Dardo De Vecchi (Euromed - Marseille) 9h00 ? 9h 45 ? Que Diable est cecy ? ? : langue, voix parole dans les ? romans ? de Rabelais Julien Ludovic Lebreton ? Universit? Paris-Sorbonne 9h45 ? 10h30 L??tre langue, le chant du corps. Les pratiques glossolaliques d?Antonin Artaud S?bastien Lemporte ? Universit? de Franche-Comt? ? Besan?on Pause 11h00 ? 11h45 ? Il n?y a point de passion si babillarde que la joie ? : d?tour historique pour r?fl?chir aux enjeux actuels de la recherche sur la ? prosodie affective ? Sarah Nancy ? Universit? Paris-Sorbonne nouvelle 11h 45 ? 12h 30 La voix : lieu commun de m?moire Rosine Schautz ? Smith College ? Gen?ve Repas Sous la pr?sidence de Clara Romero (Paris-Descartes) 14h30 ? 15h 15 La structure prosodique dynamique : derni?re (re)structuration avant ?nonciation Philippe Martin ? Universit? Paris 7 Denis Diderot 15h15 ? 16h 00 Humain / non-humain : la construction de l?alt?rit? par la voix dans le cin?ma am?ricain de science-fiction depuis 1950 Coralie Vincent ? CNRS & Universit? Paris 8 Pause 16h30 ? 17h 15 Pourquoi la voix r?unit-elle toutes les dimensions de la pr?dication ? Amr Helmy Ibrahim ? Universit? de Franche-Comt? & Universit? Paris-Sorbonne 18h 30 ? 19h30 - Amphith??tre Edgar Quinet (46 rue Saint-Jacques) Passages ?velyne Saunier (chant) & J?r?me Lefebvre (guitare) Dans un r?pertoire allant du 17^e au 20^e si?cle, avec des arrangements originaux ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:34:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:34:39 +0100 Subject: These: Hai-Son Le, Modeles neuronaux pour la modelisation statistique de la langue Message-ID: Date: Fri, 14 Dec 2012 11:40:08 +0100 From: Alexandre Allauzen Message-ID: <50CB0208.7050203 at limsi.fr> Bonjour ? toutes et ? tous, c'est avec grand plaisir que je vous convie ? ma soutenance de th?se jeudi 20 d?cembre 2012 ? 14h en salle de conf?rences du B?timent S, LIMSI. Cette th?se s'intitule: Mod?les neuronaux pour la mod?lisation statistique de la langue (Continuous Space Neural Network Models in Natural Language Processing) Le jury est compos? de : Rapporteurs: Laurent BESACIER, Professeur, Universit? Joseph Fourier Holger SCHWENK, Professeur, Universit? du Maine Examinateurs: Yoshua BENGIO, Professeur, Universit? de Montr?al Hermann NEY, Professeur, RWTH Aachen Mich?le SEBAG, Directrice de recherche, LRI & Universit? Paris Sud Encadrants de th?se: Fran?ois YVON, Professeur, LIMSI-CNRS & Universit? Paris Sud Alexandre ALLAUZEN, Maitre de Conf?rences, LIMSI-CNRS & Universit? Paris Sud Je serais ?galement ravi de vous voir au pot qui suivra. Cordialement Hai-Son LE Abstract The purpose of language models is in general to capture and to model regularities of language, thereby capturing morphological, syntactical and distributional properties of word sequences in a given language. They play an important role in many successful applications of Natural Language Processing, such as Automatic Speech Recognition, Machine Translation and Information Extraction. The most successful approaches to date are based on n-gram assumption and the adjustment of statistics from the training data by applying smoothing and back-off techniques, notably Kneser-Ney technique, introduced twenty years ago. In this way, language models predicts a word based on its n-1 previous words. In spite of their prevalence, conventional n-gram based language models still suffer from several limitations that could be intuitively overcome by consulting human expert knowledge. One critical limitation is that, ignoring all linguistic properties, they treat each word as one discrete symbol with no relation with the others. Another point is that, even with a huge amount of data, the data sparsity issue always has an important impact, so the optimal value of n in the n-gram assumption is often 4 or 5 which is insufficient in practice. This kind of model is constructed based on the count of n-grams in training data. Therefore, the pertinence of theses models is conditioned only on the characteristics of the training text (its quantity, its representation of the content in terms of theme, date). Recently, one of the most successful attempt that tries to directly learn word similarities is to use distributed word representations in language modeling, where distributionally words, which have semantic and syntactic similarities, are expected to be represented as neighbors in a continuous space. These representations and the associated objective function (the likelihood of the training data) are jointly learned using a multi-layer neural network architecture. In this way, word similarities are learned automatically. This approach has shown significant and consistent improvements when applied to automatic speech recognition and statistical machine translation tasks. A major difficulty with the continuous space neural network based approach remains the computational burden, which does not scale well to the massive corpora that are nowadays available. For this reason, the first contribution of this dissertation is the definition of a neural architecture based on a tree representation of the output vocabulary, namely Structured OUtput Layer (SOUL), which makes them well suited for large scale frameworks. The SOUL model combines the neural network approach with the class-based approach. It achieves significant improvements on both state-of-the-art large scale automatic speech recognition and statistical machine translations tasks. The second contribution is to provide several insightful analyses on their performances, their pros and cons, their induced word space representation. Finally, the third contribution is the successful adoption of the continuous space neural network into a machine translation framework. New translation models are proposed and reported to achieve significant improvements over state-of-the-art baseline systems. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:36:45 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:36:45 +0100 Subject: Job: Two salaried PhD positions in Machine Translation at Wolverhampton Message-ID: Date: Fri, 14 Dec 2012 11:25:19 +0000 From: "Maarouf, Ismall" Message-ID: <6B982DE0E1760848ABA8A809FFD806DFC94E82 at EXCHMBX10X03.unv.wlv.ac.uk> X-url: http://clg.wlv.ac.uk/ X-url: http://ec.europa.eu/research/participants/portal/download?docId=31562 X-url: http://expert-itn.eu TWO SALARIED PHD POSITIONS IN MACHINE TRANSLATION AT UNIVERSITY OF WOLVERHAMPTON- Marie Curie ITN project EXPERT ------ Applications are invited for two three-year Early Stage Researcher pre-doctoral positions in hybrid language translation technologies. The positions are part of the new EU Framework 7 Marie-Curie Network EXPERT, concerned with the exploitation of empirical approaches to machine translation, including statistical machine translation and example-based machine translation. The EXPERT project brings together researchers from six European universities (University of Wolverhampton (UoW), University of Sheffield (USFD), Universidad de Malaga (UMA), Universitaet des Saarlandes (USAAR), Dublin City University (DCU) and Universiteit van Amsterdam (UvA)) and five translation services and technology providers (Pangeanic, Hermes and Translated, Celer Soluciones and WordFast). The two projects allocated to the University of Wolverhampton are : 1). Use of language technology to improve matching & retrieval in translation memories; 2). Investigation of methodologies to evaluate the improved SMT, EBMT and TM prototypes and new hybrid computer-aided translation technology proposed in EXPERT. The research will be conducted under supervision of University of Wolverhampton with opportunities for collaborative work with other universities and industrial partners in EXPERT, and with the expectation of a 6 month secondment to 2-3 partners in this project based on the topic of research. This is an opportunity to work in a well-connected international team with world-leading reputation in the Natural Language Processing (NLP). The Research Group in Computational Linguistics (http://clg.wlv.ac.uk/) is considered one of the top performers in UK research. SALARY ------ The successful individual will be employed as a salaried researcher while studying towards his/her PhD. Salary rates and additional mobility, career and travel allowances are as per the Marie Curie programme (see Annex 3 of this document http://ec.europa.eu/research/participants/portal/download?docId=31562, page 69). For employment in the UK, the reference figure for gross salary is 51,062 euros/year. The post is fixed term for three years with a start date of 1 February 2013 or soon after. REQUIREMENTS & ELIGIBILITY ------ Appointment will be subject to the eligibility requirements of the Marie Curie programme, which specify that early stage researchers must be, at the time of recruitment, in the first four years of their research careers, measured from the date when they obtained the qualification which would entitle them to embark on a doctorate. Please check Section III.3 of the following link for further information on the Marie Curie scheme regarding eligibility criteria: ftp://ftp.cordis.europa.eu/pub/fp7/docs/fp7-mga-annex3intramulti_en.pdf . In particular, candidates cannot have lived in the country of their chosen host university for more than 12 months in the 3 years immediately prior to their appointment. Applicants should hold a good honours degree in a relevant field of study (e.g. computer science, engineering, mathematics) and have experience in natural language processing, machine translation or related area. They should also have a solid background in mathematics/statistics and excellent programming skills (C/C++, Java, Python/Perl, etc.). See the job specification for more details on the expected profile: https://jobs.wlv.ac.uk/wd/plsql/wd_portal.list?p_web_site_id=3045&p_function=map&p_title=Current%20vacancies HOW TO APPLY ------ The application process consists of two compulsory stages: - Stage 1: Register and fill in the application form on the EXPERT website (http://expert-itn.eu/). You will receive a reference number and confirmation. - Stage 2: Use the application system of the University of Wolverhampton (https://jobs.wlv.ac.uk/wd/plsql/wd_portal.list?p_web_site_id=3045&p_function=map&p_title=Current%20vacancies), please make sure to include: . Detailed CV; . A copy of your confirmation from the expert-itn.eu; . 2 page summary on the research to be undertaken on the chosen topic. It should include, but is not limited to, a). aim of the research; b). general research question to be refined during the Phd; c). research plan; d). why do have necessary skills to undertake this project? Closing date: 11 January 2013 More information can be found at http://expert-itn.eu ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:40:57 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:40:57 +0100 Subject: Appel: CLA 2013 Message-ID: Date: Fri, 14 Dec 2012 23:28:53 +0100 From: CLA Organizers Message-ID: X-url: http://www.cla-conf.info CONFERENCE NEXT EDITION We wanted to convey the message that we continue to work on the next edition of the conference, which will take place probably in October 2013 (in Poland). More information will appear on the website: http://www.cla-conf.info. Already we encourage you to participate. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Dec 16 21:41:11 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 16 Dec 2012 22:41:11 +0100 Subject: Livre: Computational Linguistics Message-ID: Date: Fri, 14 Dec 2012 23:28:53 +0100 From: CLA Organizers Message-ID: X-url: http://www.cla-conf.info FIRST CLA BOOK! Taking this opportunity we would like to inform you that the Springer has published extended versions of selected papers submitted to our conferences so far in "Computational Linguistics Applications" book. Book Title: Computational Linguistics Book Subtitle: Applications Copyright: 2013 DOI: 10.1007/978-3-642-34399-5 Print ISBN: 978-3-642-34398-8 Online ISBN: 978-3-642-34399-5 Series Title: Studies in Computational Intelligence Series Volume: 458 Series ISSN: 1860-949X Publisher: Springer Berlin Heidelberg Copyright Holder: Springer-Verlag Berlin Heidelberg Editors: Adam Przepiorkowski, Maciej Piasecki, Krzysztof Jassem, Piotr Fuglewicz Book preview: http://link.springer.com/book/10.1007/978-3-642-34399-5/page/1 About this book: * Latest research on Computational Linguistics * Written by leading experts in the field The ever-growing popularity of Google over the recent decade has required a specific method of man-machine communication: human query should be short, whereas the machine answer may take a form of a wide range of documents. This type of communication has triggered a rapid development in the domain of Information Extraction, aimed at providing the asker with a more precise information. The recent success of intelligent personal assistants supporting users in searching or even extracting information and answers from large collections of electronic documents signals the onset of a new era in man-machine communication - we shall soon explain to our small devices what we need to know and expect valuable answers quickly and automatically delivered. The progress of man-machine communication is accompanied by growth in the significance of applied Computational Linguistics - we need machines to understand much more from the language we speak naturally than it is the case of up-to-date search systems. Moreover, we need machine support in crossing language barriers that is necessary more and more often when facing the global character of the Web. This books reports on the latest developments in the field. It contains 15 chapters written by researchers who aim at making linguistic theories work - for the better understanding between the man and the machine. ************************************************************* Table of contents (15 chapters) I) NLP Toolkits 1) Using HFST for Creating Computational Linguistic Applications Authors: Krister Linden, Erik Axelson, Senka Drobac, Sam Hardwick, Miikka Silfverberg 2) PSI-Toolkit: A Natural Language Processing Pipeline Authors: Filip Grali?ski, Krzysztof Jassem, Marcin Junczys-Dowmunt 3) Fextor: A Feature Extraction Framework for Natural Language Processing: A Case Study in Word Sense Disambiguation, Relation Recognition and Anaphora Resolution Authors: Bartosz Broda, Pawe? K?dzia, Micha? Marci?czuk, Adam Radziszewski, Rados?aw Ramocki II) Information Extraction 4) Automatic Construction of a Dynamic Thesaurus for Proper Names Authors: Roman Kurc, Maciej Piasecki, Stan Szpakowicz 5) A Multilingual Integrated Framework for Processing Lexical Collocations Authors: Violeta Seretan 6) An Approach to Efficient Processing of Multi-word Units Authors: Cvetana Krstev, Ivan Obradovic, Ranka Stankovic, Dusko Vitas 7) PRALED - A New Kind of Lexicographic Workstation Authors: Ales Horak, Adam Rambousek 8) Multidimensional and Multimodal Information in EcoLexicon Authors: Pilar Leon-Arauz, Arianne Reimerink, Pamela Faber 9) Techniques for Multilingual Security-Related Event Extraction from Online News Authors: Martin Atkinson, Mian Du, Jakub Piskorski, Hristo Tanev, Roman Yangarber 10) Automatic Metadata Generation in an Archaeological Digital Library: Semantic Annotation of Grey Literature Authors: Andreas Vlachidis, Ceri Binding, Keith May, Douglas Tudhope 11) Towards Automatic Detection of Various Types of Prominence in Read Aloud Russian Texts Authors: Nina Volskaya, Daniil Kocharov, Pavel Skrelin, Ekaterina Shumovskaya III) Multilinguality 12) Translation Ambiguity Resolution Using Interactive Contextual Information Authors: Farag Saad, Andreas Nurnberger 13) Machine Translation at Work Authors: Aljoscha Burchardt, Cindy Tscherwinka, Eleftherios Avramidis, Hans Uszkoreit 14) Anubis - Speeding Up Computer-Aided Translation Authors: Rafa? Jaworski 15) Incorporating Subject Areas into the Apertium Machine Translation System Authors: Jordi Duran, Lluis Villarejo, Mireia Farrus, Sergio Ortiz, Gema Ramirez ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From zilles at CS.UREGINA.CA Mon Dec 17 22:47:43 2012 From: zilles at CS.UREGINA.CA (Sandra Zilles) Date: Mon, 17 Dec 2012 16:47:43 -0600 Subject: Call For Papers - Canadian AI Conference 2013 Message-ID: ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Apologies for cross-posting. Please distribute widely. ======================= Final Call for Papers =========================== AI 2013: The 26th Canadian Conference on Artificial Intelligence www.canadianai.ca May 28th to May 31st, 2013 Regina, Saskatchewan, Canada ================================================================================== IMPORTANT DATES --------------- Full paper submission deadline: January 21st, 2013 Notification of acceptance: February 25th, 2013 Final papers due: March 6th, 2013 Conference: May 28th to May 31st, 2013 CALL FOR PAPERS --------------- AI'2013, the twenty-sixth Canadian Conference on Artificial Intelligence, invites papers that present original work in all areas of Artificial intelligence, either theoretical or applied. Topics of interest include, but are not limited to: ? Agent Systems AI Applications Automated Reasoning Bioinformatics and BioNLP ? Case-based Reasoning ? Cognitive Models ? Constraint Satisfaction ? Data Mining ? E-Commerce ? Evolutionary Computation ? Games ? Information Retrieval ? Knowledge Representation ? Machine Learning ? Multi-media Processing ? Natural Language Processing ? Neural Nets ? Planning ? Robotics ? Search ? Smart Graphics ? Uncertainty ? User Modeling ? Web Applications Each paper will be reviewed by at least three Program Committee members according to its originality, technical merit and clarity of presentation. Accepted papers will be allocated either a maximum of 12 pages (long papers) or a maximum of 7 pages (short papers) in the proceedings. As in previous years, we plan to publish all accepted papers for which one of the authors will have registered and is present at the conference in the conference proceedings as Lecture Notes in Artificial Intelligence by Springer. The papers will have to be formatted accordingly. Each accepted paper (long or short) will be allocated a presentation slot at the conference, where the presentations for short papers will be shorter in time. Poster presentations of accepted papers will be welcome. Papers submitted to AI'2013 must not have been accepted for publication elsewhere or be under review for another conference. BEST PAPER AWARD ---------------- The Best Paper Award will be presented at the conference to the authors of the best paper. SUBMISSIONS ----------- Authors are invited to submit electronically, by January 21st, 2013. Submissions must be uploaded on Easychair, following this link: https://www.easychair.org/conferences/?conf=ai2013 Paper format: ? Papers must be written in English. ? All submissions must be up to 7 pages in length for short papers, and 8-12 pages for long papers. ? Papers must be in PDF format. ? Papers must be formatted according to Springer LNCS style. The use of the LaTeX2e style file available from Springer is strongly encouraged. For guidelines on the preparation of papers see here: http://www.canadianai.ca/AI_2013/Submission/index.html ORGANIZERS ---------- AI'2013 is collocated with two cognate conferences: the Canadian Graphical Interface Conference and the Canadian Conference on Computer and Robot Vision. General Co-chairs AI/GI/CRV: Cory Butz (University of Regina) Atefeh Farzindar (NLP Technologies Inc.) Program Co-chairs: Osmar Zaiane (University of Alberta) Sandra Zilles (University of Regina) Local Arrangement Chair: Orland Hoeber (University of Regina) Program Committee: The list of program committee members so far includes the following names: Reda Alhajj, Xiangdong An, Aijun An, John Anderson, Wolfgang Banzhaf, Denilson Barbosa, Andre Barreto, Sabine Bergler, Giuseppe Carenini, Yllias Chali, Colin Cherry, Cristina Conati, Joerg Denzinger, Ralph Deters, Michael Fleming, Gosta Grahne, Kevin Grant, Marek Grzes, Howard Hamilton, Robert Hilderman, Robert Holte, Michael Horsch, Frank Hutter, Vlado Keselj, Grzegorz Kondrak, Anthony Kusalik, Laks Lakshmanan, Marc Lanctot, Guy Lapalme, Kate Larson, Levi Lelis, Carson Leung, Daniel Lizotte, Cristina Manfredotti, Stan Matwin, Sheila McIlraith, Martin Memmel, Robert Mercer, Evangelos Milios, Gabriel Murray, Jeff Orchard, Lourdes Pena-Castillo, Gerald Penn, David Poole, Fred Popowich, Doina Precup, Michael Richter, Rafael Schirru, Ben Steichen, Csaba Szepesvari, Peter Van Beek, Paolo Viappiani, Asmir Vodencarevic, Osmar Zaiane, Harry Zhang, Sandra Zilles Please mark the dates in your calendar. We hope to receive your submissions and see you at the conference. ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ -------------- next part -------------- An HTML attachment was scrubbed... URL: From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:07:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:07:28 +0100 Subject: Livre: L'Heterogene a l'=?WINDOWS-1252?Q?=9Cuvre_?=dans la langue et les discours. Hommage a Jacqueline Authier-Revuz Message-ID: Date: Mon, 17 Dec 2012 13:30:04 +0100 From: Alice Krieg-Planque Message-ID: <50CF104C.5080408 at club-internet.fr> X-url: http://www.lambert-lucas.com//index.php?l_nr=ok_dp.php&l_nr_c=783f3d95a940e0c783abc3847e9ae6df&i=173 Vient de para?tre : titre : L'H?t?rog?ne ? l'?uvre dans la langue et les discours. Hommage ? Jacqueline Authier-Revuz textes r?unis et pr?sent?s par Sonia Branca-Rosoff, Claire Doquet, Julie Lefebvre, Evelyne Oppermann-Marsaux, Sabine P?tillon et Fr?d?rique Sitri Editions Lambert-Lucas (Limoges) 2012 436 pages 36 euros ISBN 978-2-35935-049-4 Quatri?me de couverture : El?ves, coll?gues et amis de Jacqueline Authier-Revuz, nous avons souhait? lui rendre hommage en lui offrant ce livre. Nous avons ainsi tenu ? lui exprimer collectivement notre amiti? et notre admiration et ? montrer ? quel point ses travaux et son enseignement inspirent et orientent nos propres r?flexions. Ce volume est aussi l'occasion de donner la parole ? un courant repr?sentatif d'une tendance de la linguistique contemporaine qui, traversant des domaines aussi vari?s que la grammaire, l'analyse du discours, l'histoire de la langue, la critique g?n?tique, l'?tude de l'oral, l'?tude de l'?crit, et jetant m?me des ponts vers des terres voisines (analyse des textes litt?raires, psychanalyse) s'organise autour de deux convictions : tout d'abord, la n?cessit? au c?ur de la pratique linguistique de distinguer les deux ordres de la langue et du discours en refusant la disparition de l'un au profit de l'autre ; ensuite le caract?re central accord?, ? la suite de Benveniste, au m?talangage ordinaire, envisag? comme une dimension constitutive du langage humain : les choix m?mes d'objets ? les commentaires m?ta-?nonciatifs, le discours rapport? ? touchent crucialement ? la question centrale du sujet dans son rapport ? sa propre ?nonciation et ? celle des autres. Sommaire : Sonia BRANCA-ROSOFF, Claire DOQUET, Julie LEFEBVRE, Evelyne OPPERMAN-MARSAUX, Sabine PETILLON, Fr?d?rique SITRI. Une ?criture du rayonnement Bibliographie de Jacqueline Authier-Revuz Michel ARRIVE. Ce qui faire rire le linguiste, ou Du m?talangage chez Saussure Fernando HARTMANN. Le sujet n'est pas un objet Jean-Michel ADAM. Arr?t-sur-mot et narrativisation d'un concept : le "p?nitentialisme" de la CIA et les /Trois Petits Cochons/ Alice KRIEG-PLANQUE. La "novlangue" : une langue imaginaire au service de la critique du "discours autre" Eni PUCCINELLI ORLANDI. Un corpus textuel ? Claire DOQUET. Ordre scriptural et boucles (m?ta-)?nonciatives : remords, reprises, retours dans l'?criture Catherine BORE. Le discours direct dans des ?crits fictionnels scolaires : marques et significations Ir?ne FENOGLIO. "L'axiologie du langage et le langage de l'axiologie" : notes manuscrites pour un article en cours du travail d'E. Benveniste Marie-Christine LALA. Fonder l'?nonciation : de la grammaire ? la linguistique Mich?le NOAILLY. Les jugements mitig?s : le cas de /plus ou moins/ Evelyne OPPERMANN-MARSAUX. L'interjection /allez/ comme marque de d?sapprobation du discours d'autrui : approche diachronique Sonia BRANCA-ROSOFF et Bertrand VERINE. Le discours direct et ses limites : l'asym?trie de la fronti?re gauche et de la fronti?re droite Bernard COMBETTES. Aspects de la ponctuation par le tiret au XIXe si?cle : l'exemple de /L'Insu//rg?/ de Jules Vall?s Patrick DENDALE. Le conditionnel "journalistique", marqueur de modalisation en discours second : ?l?ments d'arch?ologie grammaticale Caroline MELLET. Analyse discursive d'un dialogue institutionnel : discours direct et dialogisme dans les questions au gouvernement Fr?d?rique SITRI. Formes de RDA et genres : les formes du discours direct dans les r?cits de cure Patricia von MUNCHOW. Elever l'enfant, une affaire de parole : la repr?sentation du discours autre dans les guides parentaux fran?ais et allemands D?ris CUNHA. Formes et degr?s d'orientation dialogique, genre et point de vue Simone DELESALLE et Francine MAZIERE. Les fa?ons de rapporter et l'interdiscursivit? au fondement de la construction du fran?ais Philippe SCHEPENS. Prol?gom?nes ? l'analyse d'un journal ?crit sous l'Occupation : Qui parle ? St?phane BIKIALO. Co?ncidences du dire : Jacqueline Authier-Revuz et Bernard No?l Alma BOLON. "L'Inconnue" (Villiers de l'Ile-Adam) et /La Cara de la desgracia/ (J.C. Onetti) : la parole de la surdit? Catherine RANNOUX. Bribes de voix, fragments de vie : /Ce que j'appelle oubli/, de Laurent Mauvignier Laurence ROSIER. /Comme elles disent/ : femmes d'?criture r?flexives (Colette, Annie Ernaux, Marie Darrieusecq) France VERNIER. Ce que citer veut dire : Annie Ernaux et le langage de l'autre monde Sabine PETILLON. Analyse de linguistique g?n?tique et publication d'un po?me de Nancy Huston Index des notions Index des auteurs Site ?diteur, avec table des mati?res ? t?l?charger : http://www.lambert-lucas.com//index.php?l_nr=ok_dp.php&l_nr_c=783f3d95a940e0c783abc3847e9ae6df&i=173 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:04:21 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:04:21 +0100 Subject: Stage: Maquettage d'un systeme d'interaction avec des connaissances linguistiques Message-ID: Date: Sun, 16 Dec 2012 18:11:09 +0100 (CET) From: Maxime Lefran?ois Message-ID: <921868106.17465600.1355677869186.JavaMail.root at inria.fr> Proposition de stage Master/Ing?nieur: Maquettage d'un syst?me d'interaction avec des connaissances linguistiques. Sujet: Ce stage ? dominante IHM et Ergonomie Logicielle s'effectuera au sein de l'?quipe WIMMICS [1] de l'Inria Sophia-Antipolis. Les linguistes du projet RELIEF [2] d?veloppent une ressource lexicale de nouvelle g?n?ration - le R?seau Lexical du Fran?ais (RLF) - en accord avec la th?orie Sens-Texte [3]. Pour le moment, le logiciel d'?dition d?velopp? pour le projet RELIEF, MVS Dicet, ne permet pas de repr?senter les d?finitions des mots aussi formellement que le voudrait la th?orie Sens-Texte. Or une telle formalisation est aujourd'hui n?cessaire pour faciliter le travail des linguistes et acc?l?rer l'?laboration du RLF. L'?quipe WIMMICS s'inspire des Graphes Conceptuels [4], de la Th?orie Sens-Texte et des Grammaires de D?pendances [5], pour d?velopper le nouveau formalisme math?matique des Graphes d'Unit?s [6], qui a pour but de permettre la formalisation des d?finitions, et plus g?n?ralement la repr?sentation et la manipulation de connaissances linguistiques ? base de graphes et de r?gles. Ce stage s'ins?re donc en amont du d?veloppement de deux prototypes d'?diteurs: un prototype d'?diteur permettant l'interaction avec des objets du formalisme g?n?rique, et un prototype d'extension du logiciel d'?dition lexicographique Mvs Dicet d?velopp? pour le projet RELIEF. Objectifs: L'objectif de ce stage est de proposer des sc?narios d'interaction avec les objets de base du formalisme des graphes d'unit?s, et de maquetter un prototype d'?diteur. Dur?e, lieu: 4-6 mois, r?mun?r?s, au sein de l'?quipe WIMMICS [1] de l'Inria Sophia-Antipolis. Profil souhait?: Ce stage s'adresse en priorit? ? des ?tudiant en Ing?nieur / Master, avec une dominante IHM et Ergonomie Logicielle. Un int?r?t pour les Graphes Conceptuels et/ou le traitement du langage est un plus. Contacts et envoi des candidatures: Maxime Lefran?ois, maxime.lefrancois[at]inria.fr, Alain Giboin, alain.giboin[at]inria.fr Pointeurs [1] http://wimmics.inria.fr [2] Projet RELIEF, R?seau Lexical du Fran?ais, et Bibliographie de r?f?rence http://www.atilf.fr/spip.php?article908 [3] http://en.wikipedia.org/wiki/Meaning%E2%80%93text_theory [4] http://en.wikipedia.org/wiki/Conceptual_graph [5] http://en.wikipedia.org/wiki/Dependency_grammar [6] http://maxime-lefrancois.info ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:10:38 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:10:38 +0100 Subject: Cursus: Programme de Master international, Erasmus Mundus Message-ID: Date: Mon, 17 Dec 2012 15:01:30 +0100 From: Sylvain Pogodalla Message-ID: <20687.9658.348558.267940 at caussimon.loria.fr> X-url: http://lct-master.org X-url: http://ec.europa.eu/education/external-relation-programmes/mundus_en.htm X-url: http://eacea.ec.europa.eu/erasmus_mundus/ ? diffuser aupr?s des ?tudiants qui souhaitent faire un master Le programme Erasmus Mundus en "Language and Communication Technologies" (EMMLCT) http://lct-master.org invite les ?tudiants *europ?ens* et *non europ?ens* ? postuler ? la participation ? ce programme pour l'automne 2013. *La date limite de candidature est le 1er janvier 2013.* *Informations importantes* + enseignement en anglais + dur?e: 2 ans + chaque ann?e d'?tude dans un ?tablissement partenaire diff?rent + sp?cialisation dans les m?thodes et technologies de l'informatique linguistique + bourses d'?tudes du programme Erasmus Mundus de l'Union Europ?enne, *y compris pour les ?tudiants europ?ens* *Le programme EMMLCT est propos? par le consortium d'universit?s* 1. Saarland University in Saarbruecken, Germany (coordinator) 2. University of Trento, Trento, Italy 3. University of Malta, Malta 4. University of Lorraine, Nancy, France 5. Charles University, Prague, Czech Republic 6. Rijksuniversiteit Groningen, The Netherlands 7. Shanghai Jiao Tong University, China 8. The University of Melbourne, Australia L'Universit? du pays Basque / Euskal Herriko University, San Sebastian, Spain participe ?galement comme partenaire associ?. *Le programme EMMLCT en bref* Le programme EMMLCT est un Master international. Le programme propose d'?tudier chacune des deux ann?es dans une universit? diff?rente du consortium. Lorsque les conditions ont ?t? remplies, les ?tudiants obtiennent deux Masters qui ont une reconnaissance nationale dans chacun des pays d'?tudes. Les cours comprennent des modules fondamentaux obligatoires ainsi que des modules avanc?s en technologies du langage et de la communication et en informatique, un projet optionnel, et la r?daction d'un m?moire de Master. Le programme vise ? donner aux ?tudiants des comp?tences et des perspectives sur les disciplines vari?es qui contribuent aux m?thodes utilis?es dans les technologies du langage et de la communication et ? renforcer leur connaissance des m?thodes scientifiques. De plus, les ?tudiants acqui?rent des connaissances pratiques en choisissant une combinaison de modules en technologie du langage, en linguistique informatique et th?orique, et en informatique. Le programme EMMLCT a ?t? d?fini pour prendre en compte les demandes de l'industrie et de la recherche dans le domaine des technologies des langues. Il offre des perspectives d'apprentissage et de formation Le programme EMMLCT est approuv? et soutenu par le programme Erasmus Mundus de l'Union Europ?enne. Pour plus d'information : http://ec.europa.eu/education/external-relation-programmes/mundus_en.htm http://eacea.ec.europa.eu/erasmus_mundus/. *Candidatures* Tous les candidats doivent satisfaire les conditions suivantes : 1. Avoir une Licence (ou un dipl?me ?quivalent) en informatique, linguistique, informatique linguistique, sciences cognitives, math?matiques, intelligence artificielle ou tout autre discipline pertinente. Ce dipl?me doit avoir ?t? obtenu avant le d?but des cours du master EMMLCT. 2. Comp?tences linguistiques : pour les ?tudiants dont la langue maternelle n'est pas l'anglais, un certificat d'aptitude en anglais, langue d'enseignement, est requis (TOEFL, IELTS, Cambridge certificate, etc.) Les candidatures se font en ligne. Plus d'information et les instructions pour la candidature se trouvent ? : http://lct-master.org Adresse pour de plus amples informations : lct-info at coli.uni-sb.de Coordination du programme : Prof. Hans Uszkoreit Dr. Ing. Ivana Kruijff-Korbayova Department of Computational Linguistics and Phonetics Saarland University Saarbruecken, Germany http://lct-master.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:12:02 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:12:02 +0100 Subject: Revue: CORELA, vol. 10, num. 2 Message-ID: Date: Tue, 18 Dec 2012 11:30:02 +0100 From: Gilles Col Message-Id: X-url: http://corela.edel.univ-poitiers.fr/index.php?id=2742 X-url: http://corela.edel.univ-poitiers.fr/index.php?id=2743 X-url: http://corela.edel.univ-poitiers.fr/index.php?id=2762 Chers coll?gues, L'?quipe ?ditoriale de la revue CORELA - Cognition / Repr?sentation / Langages a le plaisir de vous annoncer la publication de son dernier num?ro (vol. 10, num. 2): http://corela.edel.univ-poitiers.fr/index.php?id=2742 Les propositions de publication pour le prochain num?ro de la revue (vol. 11, num. 1) sont ? envoyer ? Gilles Col (gilles.col at univ-poitiers.fr) avant le 31 mars 2013. Sommaire du num?ro: Pi Hsia HUNG. "L'acquisition de l'expression de la spatialit? en mandarin langue ?trang?re par des apprenants francophones" http://corela.edel.univ-poitiers.fr/index.php?id=2743 Bachir BESSAI. "Plurilinguisme et ins?curit? linguistique en Alg?rie : Paroles de lyc?en (n?)s ? Beja?a". http://corela.edel.univ-poitiers.fr/index.php?id=2762 Nous vons informons par ailleurs que la revue CORELA sera adh?rente de Revue.org ? compter de la rentr?e 2013. Bonne lecture Gilles Col, Professeur ? l'Universit? de Poitiers / FoReLL / LaTTiCe CNRS-ENS Dir. Revue CORELA - Cognition, Repr?sentation, Langages http://corela.edel.univ-poitiers.fr/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Dec 19 16:14:32 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 19 Dec 2012 17:14:32 +0100 Subject: Appel: TSD 2013 Message-ID: Date: Tue, 18 Dec 2012 16:16:25 +0100 From: TSD 2013 Message-Id: X-url: http://www.tsdconference.org/tsd2013 ************************************************************************ TSD 2013 - PRELIMINARY ANNOUNCEMENT ************************************************************************ Sixteenth International Conference on TEXT, SPEECH and DIALOGUE (TSD 2013) Plzen (Pilsen), Czech Republic, 1-5 September 2013 http://www.tsdconference.org TSD NEWS The TSD conference fee was significantly reduced. It is organized in parallel with SPECOM. ABOUT CONFERENCE The conference is organized by the Faculty of Applied Sciences, University of West Bohemia, Pilsen, and the Faculty of Informatics, Masaryk University, Brno. This year the conference is organized in parallel with the 15th International Conference on Speech and Computer (SPECOM). The conference is supported by International Speech Communication Association (ISCA). Venue: Plzen (Pilsen), angelo Hotel (city center), Czech Republic TSD SERIES TSD series have evolved as a prime forum for interaction between researchers in both spoken and written language processing from all over the world. Proceedings of TSD form a book published by Springer-Verlag in their Lecture Notes in Artificial Intelligence (LNAI) series. The TSD proceedings are regularly indexed by Thomson Reuters Conference Proceedings Citation Index. LNAI series are listed in all major citation databases such as DBLP, SCOPUS, EI, INSPEC, or COMPENDEX. TOPICS Topics of the conference will include (but are not limited to): Corpora and Language Resources (monolingual, multilingual, text and spoken corpora, large web corpora, disambiguation, specialized lexicons, dictionaries) Speech Recognition (multilingual, continuous, emotional speech, handicapped speaker, out-of-vocabulary words, alternative way of feature extraction, new models for acoustic and language modelling) Tagging, Classification and Parsing of Text and Speech (multilingual processing, sentiment analysis, credibility analysis, automatic text labeling, summarization, authorship attribution) Speech and Spoken Language Generation (multilingual, high fidelity speech synthesis, computer singing) Semantic Processing of Text and Speech (information extraction, information retrieval, data mining, semantic web, knowledge representation, inference, ontologies, sense disambiguation, plagiarism detection) Integrating Applications of Text and Speech Processing (machine translation, natural language understanding, question-answering strategies, assistive technologies) Automatic Dialogue Systems (self-learning, multilingual, question-answering systems, dialogue strategies, prosody in dialogues) Multimodal Techniques and Modelling (video processing, facial animation, visual speech synthesis, user modelling, emotions and personality modelling) OFFICIAL LANGUAGE The official language of the event will be English. However, papers on processing of languages other than English are strongly encouraged. PROGRAM COMMITTEE Hynek Hermansky, USA (general chair) Eneko Agirre, Spain Genevieve Baudoin, France Jan Cernocky, Czech Republic Darja Fiser, Slovenia Radovan Garabik, Slovakia Alexander Gelbukh, Mexico Louise Guthrie, GB Jan Hajic, Czech Republic Eva Hajicova, Czech Republic Ludwig Hitzenberger, Germany Jaroslava Hlavacova, Czech Republic Ales Horak, Czech Republic Eduard Hovy, USA Ivan Kopecek, Czech Republic Steven Krauwer, The Netherlands Siegfried Kunzmann, Germany Natalija Loukachevitch, Russia Vaclav Matousek, Czech Republic Diana McCarthy, UK Hermann Ney, Germany Elmar Noeth, Germany Karel Oliva, Czech Republic Karel Pala, Czech Republic Nikola Pavesic, Slovenia Fabio Pianesi, Italy Maciej Piasecki, Poland Jan Pomikalek, Czech Republic Adam Przepiorkowski, Poland Josef Psutka, Czech Republic James Pustejovsky, USA Leon Rothkrantz, The Netherlands Milan Rusko, Slovakia Stefan Steidl, Germany Pavel Skrelin, Russia Pavel Smrz, Czech Republic Petr Sojka, Czech Republic Georg Stemmer, Germany Marko Tadic, Croatia Tamas Varadi, Hungary Zygmunt Vetulani, Poland Taras Vintsiuk, Ukraine Pascal Wiggers, The Netherlands Yorick Wilks, GB Victor Zakharov, Russia FORMAT OF THE CONFERENCE The conference program will include presentation of invited papers, oral presentations, and poster/demonstration sessions. Papers will be presented in plenary or topic oriented sessions.One day of the conference will be dedicated to tutorials and workshops. Social events including a trip in the vicinity of Pilsen will allow additional informal interactions. Details about the social event will be available on the web page. SUBMISSION OF PAPERS Authors are invited to submit a full paper not exceeding 8 pages formatted in the LNCS style (see below). Those accepted will be presented either orally or as posters. The decision on the presentation format will be based upon the recommendation of three independent reviewers. The authors are asked to submit their papers using the on-line submission form accessible from the conference web site. Papers submitted to TSD 2013 must not be under review by any other conference or publication during the TSD review cycle, and must not be previously published or accepted for publication elsewhere. As the reviewing is blind, the paper should not include authors' name and affiliations. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ...", should be avoided. Instead, use citations, such as "Smith previously showed (Smith, 1991) ...". Papers that do not conform to the requirements above are determined to be rejected without review. The authors are strongly encouraged to write their papers in TeX (plain) or LaTeX formats. These formats are necessary for the final versions of the papers that will be published in the Springer Lecture Notes. Authors using a MS Word-compatible software for the final version must use the LNCS template for MS Word and within the submit process ask the Proceedings Editors to convert the paper to the LaTeX format. For this service a service-and-license fee of CZK 1500 will be levied automatically. The paper format for the review has to be either the PDF or PostScript file with all required fonts included. Upon notification of acceptance, speakers will receive further information on submitting their camera-ready and electronic sources (for detailed instructions on the final paper format see http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0). Authors are also invited to present actual projects, a developed software or interesting materials relevant to the topics of the conference. Speakers who have prepared a demonstration should provide an abstract not exceeding one page. The demonstration abstracts will not appear in the conference proceedings. IMPORTANT DATES March 31, 2013 ............ Submission of full papers May 12, 2013 .............. Notification of acceptance June 9, 2013 .............. Final papers (camera ready) and registration September 1-5, 2013 ....... Conference date The contributions to the conference will be published in proceedings that will be made available on CD to participants at the time of the conference. CONFERENCE FEES The conference fee depends on the date of payment and on your status. It includes one copy of the conference proceedings, refreshments/coffee breaks, opening dinner, welcome party, mid-conference social event admissions, and organizing costs. In order to lower the fee as much as possible, meals during the conference, the accommodation, and the conference trip are not included. Full participant: early registration by June 9, 2013 - CZK 8.200 (approx. 320 EUR) late registration by August 1, 2013 - CZK 9.400 (approx. 370 EUR) on-site registration - CZK 10.000 (approx. 390 EUR) Student (reduced): early registration by June 9, 2013 - CZK 7.000 (approx. 280 EUR) late registration by August 1, 2013 - CZK 8.400 (approx. 330 EUR) on-site registration - CZK 8.900 (approx. 350 EUR) The payment may be refunded up until August 15, at the cost of CZK 1.500. No refund is possible after this date. All costs are in Czech Crowns (Czech Koruna, CZK), see e.g. http://www.xe.com/ucc/ for the current exchange rate. At least one of the authors has to register and pay the registration fee by June 9, 2013 for their paper to be included in the conference proceedings. Only one paper of up to 8 pages is included in the regular registration fee. The additional paper and page charge is CZK 1000 per page. Any additional paper is treated as extra pages. An extra page charge is CZK 1000 per page. An author with more than one paper pays the additional paper rates unless a co-author has also registered and paid the full registration fee. In the case of uncertainty, feel free to contact the organising committee for clarification. As in previous years, we will do our best to ensure grants for the prospective TSD participants from economically less powerful countries, especially the countries of the former Soviet Union and its satellites. By now we are negotiating with our partner supporting organisations about the form and amount of the grants. LOCATION The city of Plzen (Pilsen) is situated in Western Bohemia at the confluence of four rivers. With its 170,000 inhabitants it is the fourth largest city in the Czech Republic and an important industrial, commercial, and administrative centre. It is also the capital of the Pilsen Region. In addition, it has been selected as the European capital of culture for 2015 by the Council of the European Union. Pilsen is well-known for its brewing tradition. The trademark Pilsner-Urquell has a good reputation all over the world thanks to the traditional recipe, high quality hops and good groundwater. Beer lovers will also appreciate a visit to the Brewery Museum or the Brewery itself. Apart from its delicious beer, Pilsen hides lots of treasures in its core. The city can boast the second largest synagogue in Europe. The dominant of the old part of the city center is definitely the 13th-century Gothic cathedral featuring the highest tower in Bohemia (102.34 m). It is possible to go up and admire the view of the city. Not far from the cathedral is the splendid Renaissance Town Hall from 1558 and plenty of pleasant cafes and pubs are situated on and around the main square. There is also the beautiful Pilsen Historical Underground - under the city center, a complex network of passageways and cellars can be found. They are about 14 km long and visitors can see the most beautiful part of this labyrinth during the tour. It is recommended to visit the City Zoological Garden, having the second largest space for bears in Europe and keeping several Komodo dragons, large lizards which exist only in a few zoos in the world. The University of West Bohemia in Pilsen provides a variety of courses for both Czech and international students. It is the only institution of higher education in this part of the country which prepares students for careers in engineering (electrical and mechanical), science (computer science, applied mathematics, physics, and mechanics), education (both primary and secondary), economics, philosophy, politics, archeology, anthropology, foreign languages, law and public administration, art and design. GETTING THERE The city has access from the D5 motorway connecting Prague (Praha) with Germany. Pilsen has very good bus and train connections with the capital of Prague (it takes about 1 - 1.5 hour to get from Prague to Pilsen). >From Vaclav Havel Airport Prague (PRG) you can reach Pilsen by frequent public transport in 1.5 - 2 hours. ACCOMMODATION The organising committee has arranged accommodation for reasonable prices in the angelo Hotel Pilsen, which is situated in the city center in walking distance from the main railway station and opposite to the historical entrance of the Pilsner Urquell Brewery. There are a lot of restaurants in hotel neighbourhood offering specialities of national and foreign cuisine. Student halls of residence will be also available at the time of conference. ADDRESS All correspondence regarding the conference should be addressed to: Ms Anna Habernalova, TSD 2013 Conference Secretary E-mail: tsd2013 at tsdconference.org Phone: +420 722 375 005 Fax: +420 377 632 402 - Please, mark the faxed material with capitals 'TSD' on top. TSD 2013 conference web site: http://www.tsdconference.org/tsd2013 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From zilles at CS.UREGINA.CA Thu Dec 20 13:45:19 2012 From: zilles at CS.UREGINA.CA (Sandra Zilles) Date: Thu, 20 Dec 2012 07:45:19 -0600 Subject: Call for Workshop Proposals - Canadian Conference on AI 2013 Message-ID: ================ CALL FOR WORKSHOP PROPOSALS =================== The 26th Canadian Conference on Artificial Intelligence www.canadianai.ca/AI_2013 May 28th to May 31th, 2013 Regina, Saskatchewan, Canada =================================================================================== Canadian AI 2013 Call for Workshop Proposals The Program Committee of the twenty-sixth Canadian Conference on Artificial Intelligence (AI?2013) solicits proposals for workshops in all areas and topics pertaining to AI to be held on May 28th, 2013, immediately preceding the main conference. Workshops addressing emerging research directions in AI are highly encouraged. We are particularly seeking workshops presenting up and coming novel ideas in the field of AI with opportunity to crystalize new communities outside the main common stream of AI. The main goal of the AI?2013 workshops is to facilitate active interchange of ideas both theoretical and applied, in the general areas related to Artificial Intelligence. The workshops will provide an informal setting where participants will have the opportunity to discuss specific technical topics in an atmosphere that fosters such exchanges. The workshop organizers will be responsible for advertising the workshop, forming the program committee, reviewing and selecting papers in a transparent way, and deciding on the final program. Workshop organizers will also be responsible for publishing their own proceedings. Workshops may be full-day or half-day. A full-day workshop should ideally include between 10-12 regular papers, while a half-day workshop would consist of 5-6 regular papers. A workshop proposal should include the following information: 1- The name of the workshop. 2- The names, addresses, and a short bio of the organizers. 3- Scope, topics, and a brief description of the technical issues that the workshop will address, and the reasons why the workshop is of interest at this time. 4- The names of potential program committee members (could be tentative PC) [optional]. 5- The planned format of the workshop (papers, demos, panels, etc.) 7- The names of the potential keynote speakers [optional], if a keynote speech is included in the planned format of the workshop. 8- If applicable, a description of past versions of the workshop, including dates, organizers, number of submitted and accepted papers, number of attendees. 9- An estimate of the expected number of submitted and accepted papers, and of the expected number of attendees. 10-A description of the plans for publicity (CFP, submission and notification deadlines, etc.) The deadlines for the workshpop proposals are as follows: Workshop proposal submission: Jan 16, 2013 Notification of acceptance of proposal: Jan 21, 2013 Workshop: May 28, 2013 Workshop proposals or inquiries should be sent to the AI-2013 Program co-chairs: Sandra Zilles, zilles AT cs.uregina.ca, and Osmar Zaiane, zaiane AT cs.ualberta.ca We look forward to receiving your proposal ! Sandra Zilles and Osmar Zaiane AI-2013 Program co-chairs -------------- next part -------------- An HTML attachment was scrubbed... URL: From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 13:56:28 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 14:56:28 +0100 Subject: Revue: CORELA, Langage, espace, cognition Message-ID: Date: Wed, 19 Dec 2012 17:45:10 +0100 From: Gilles Col Message-Id: X-url: http://09.edel.univ-poitiers.fr/corela/index.php?id=2717 Chers coll?gues, L'?quipe ?ditoriale de la revue CORELA - Cognition / Repr?sentation / Langages a le plaisir de vous annoncer la publication de son dernier num?ro th?matique (http://09.edel.univ-poitiers.fr/corela/index.php?id=2717) : "LANGUE, ESPACE, COGNITION" sous la direction de Benjamin FAGARD et Dejan STOSIC Sommaire du num?ro: Benjamin Fagard et Dejan Stosic: Introduction g?n?rale : langue, espace, cognition http://09.edel.univ-poitiers.fr/corela/index.php?id=2720 Francis Corblin : Locus et telos : aller ? l'?cole, ?tre ? la plage* http://09.edel.univ-poitiers.fr/corela/index.php?id=2722 Dejan Stosic : En passant par : une expression en voie de grammaticalisation ? http://09.edel.univ-poitiers.fr/corela/index.php?id=2844 Philippe Gr?a : Le centre n'est pas au milieu (et inversement). Pour une approche ph?nom?nologique et gestaltiste de la localisation http://09.edel.univ-poitiers.fr/corela/index.php?id=2831 V?ronique Lagae : Marqueurs du point de d?part spatial et temporel ant?pos?s : une comparaison de depuis, d?s et ? partir de http://09.edel.univ-poitiers.fr/corela/index.php?id=2820 Emilia Hilgert : Les pr?positions ensemblistes et la question de leur emploi spatial http://09.edel.univ-poitiers.fr/corela/index.php?id=2808 Marie Lammert : O? est ailleurs ? S?mantique lexicale de l'adverbe spatial ailleurs http://09.edel.univ-poitiers.fr/corela/index.php?id=2801 Michel Aurnague : Les bases ontologiques des proc?s de d?placement http://09.edel.univ-poitiers.fr/corela/index.php?id=2846 Francine Gerhard-Krait : Du nom place aux verbes d?placer et replacer : quelques questions de legs et d'appropriations s?mantiques http://09.edel.univ-poitiers.fr/corela/index.php?id=2790 Richard Huyghe : Ev?nements et localisation spatiale : quand le lieu est un ?v?nement http://09.edel.univ-poitiers.fr/corela/index.php?id=2786 Dany Amiot : De la localisation ? l'?valuation : des verbes pr?fix?s ?valuatifs au sens bien particulier http://09.edel.univ-poitiers.fr/corela/index.php?id=2775 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:04:48 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:04:48 +0100 Subject: Conf: TRALOGY II, 17 et 18 janvier 2013, Paris Message-ID: Date: Wed, 19 Dec 2012 18:58:37 +0100 From: Joseph Mariani Message-ID: <50D2004D.509 at limsi.fr> X-url: http://www.tralogy.eu/spip.php?article34&lang=en X-url: http://www.tralogy.eu/spip.php?article34&lang=fr ************ Apologies for Multiple Posting ************ Registration to TRALOGY II is now open! Following the success of the first Conference in March 2011, we are glad to invite you to this new forum for those interested in all fields where human and machine translation meet. This conference is a place where professionals, scientists and trainers can congregate, meet and talk about the future of the trade with technology and research in mind. This edition will be dedicated to meaning, how it is sought while we work and by technological processes as well, and the limits to be explored in common by scientists and real human translators to enhance and assist translation in progress. A registration form is available on the TRALOGY website : http://www.tralogy.eu/spip.php?article34&lang=en Registration is free-of-charge. As the number of places at the venue is limited, make sure to register early, so that we can confirm your final registration. ------------------------------------------------------------------------ Les inscriptions ? TRALOGY II sont ouvertes ! Suite au succ?s enregistr? lors de la premi?re conf?rence en mars 2011, nous avons le plaisir de vous inviter ? ce nouveau forum destin?s ? ceux qu'int?ressent tous les domaines o? /biotraduction/ et traduction automatique se rencontrent. Cette conf?rence est un lieu o? professionnels, chercheurs et formateurs peuvent se rassembler, se rencontrer et parler de l'avenir de la profession tout en pensant technologie et recherche. Cette ?dition est consacr?e au sens, que l'on recherche quand nous sommes ? la t?che et aussi gr?ce ? des processus technologiques, ainsi qu'aux limites que chercheurs et les vrais traducteurs humains se doivent d'explorer ensemble pour am?liorer et soutenir la traduction ? l'oeuvre. Un formulaire d'inscription est ? votre disposition sur le site de TRALOGY : http://www.tralogy.eu/spip.php?article34&lang=fr Cette inscription est gratuite. Le nombre de place ?tant limit? sur le lieu de la conf?rence, veillez ? vous inscrire rapidement pour que nous puissions confirmer votre inscription d?finitive. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:00:02 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:00:02 +0100 Subject: Job: Stage, Phonetisation d'enonces ecrits pour la synthese de parole, IRISA Message-ID: Date: Wed, 19 Dec 2012 18:04:39 +0100 From: Gw?nol? Lecorv? Message-ID: <50D1F3A7.7020509 at irisa.fr> [English version below] Bonjour ? tous, L'?quipe Cordial de l'IRISA (Lannion) propose un sujet de stage sur la phon?tisation d'?nonc?s ?crits pour la synth?se de parole (conversion de graph?mes en phon?mes) et, plus pr?cis?ment, sur l'adaptation d'un syst?me de phon?tisation ? des sp?cificit?s de prononciation telles que peuvent par exemple produire des accents r?gionaux ou ?tranger, voire certains ?tats ?motionnels particuliers. Le sujet est d?taill? plus amplement en toute fin de cet email. Ce sujet s'adresse ? des ?tudiants de master (ou ?quivalent bac+5) pour dur?e de 5 mois environ. Le stage aurait lieu sur le site lannionnais de l'IRISA. Merci de le diffuser aupr?s des ?tudiants qui pourraient ?tre int?ress?s. Cordialement, Gw?nol? Lecorv?. -- Dear colleagues, The group Cordial at IRISA (Lannion) is proposing an internship about written text phonetization (grapheme-to-phoneme conversion) for speech synthesis. More precisely, this internship would focus on the adaptation of a phonetization tool in order to match the specifics of various regional or foreign accents within a same language (French) or of some particular emotional states. The proposal is detailed at the bottom of this email. This intern is addressed to master students (or equivalent) and would last about 5 months. Thanks for forwarding this emails to students who may be interested. Best regards, Gw?nol? Lecorv?. -- *Title: Grapheme-to-phoneme conversion adaptation using conditional random fields* *Description:* Grapheme-to-phoneme conversion consists in generating possible pronunciations for an isolated word or for a sequence of words. More formally, this conversion is a transliteration of a sequence of graphemes, i.e., letters, into a sequence of phonemes, symbolic units to represent elementary sounds of a language. Grapheme-to-phoneme converters are used in speech processing - either to help automatic speech recognition systems to decode words from a speech signal - or as a mean to explain speech synthesizers how a written input should be acoustically produced. A problem with such tools is that they are trained on large and varied amounts of aligned sequences of graphemes and phonemes, leading to generic manners of pronouncing words in a given language. As a consequence, they are not adequate as soon as one wants to recognize or synthesize specific voices, for instance, accentuated speech, stressed speech, dictating voices versus chatting voices, etc. [1]. While multiple methods have been proposed for grapheme-to-phoneme conversion [2, 3], the primary goal of this internship is to propose a method to adapt grapheme-to-phoneme models which can easily be adapted under conditions specified by the user. More precisely, the use of conditional random fields (CRF) will be studied to model the generic French pronunciation and variants of it [4]. CRFs are state-of-the-art statistical tools widely used for labelling problems in natural language processing [5]. A further important goal is to be able to automatically characterize pronunciation distinctive features of a given specific voice as compared to a generic voice. This means highlighting and generalizing differences that can be observed between two sequences of phonemes derived from a same sequence of graphemes. Results of this internship would be integrated into the speech synthesis platform of the team in order to easily and automatically simulate and imitate specific voices. *Technical skills:* C/C++ and a scripting language (e.g., Perl or Python) *Keywords:* Natural language processing, speech processing, machine learning, statistical learning *Contact:* Gw?nol? Lecorv? (gwenole.lecorve at irisa.fr) *References:* [1] B. Hutchinson and J. Droppo. Learning non-parametric models of pronunciation. In Proceedings of ICASSP, 2011. [2] M. Bisani and H. Ney. Joint-sequence models for grapheme-to-phoneme conversion. In Speech Communication, 2008. [3] S. Hahn, P. Lehnen, and Ney H. Powerful extensions to crfs for grapheme to phoneme conversion. In Proceedings of ICASSP, 2011. [4] Irina Illina, Dominique Fohr, and Denis Jouvet. Multiple pronunciation generation using grapheme-to-phoneme conversion based on conditional random fields. In Proceedings of SPECOM, 2011. [5] John D. Lafferty, Andrew McCallum, and Fernando C. N. Pereira. Conditional random fields: probabilistic models for segmenting and labeling sequence data. In Proceedings of ICML, 2001. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:06:24 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:06:24 +0100 Subject: Appel: SIGIR 2013 Message-ID: Date: Thu, 20 Dec 2012 05:51:22 -0800 (PST) From: S?amus Lawless Message-ID: <1356011482.83972.YahooMailNeo at web142602.mail.bf1.yahoo.com> X-url: http://www.sigir2013.ie/ =================================================== 2nd Call for Papers / Importance Notice SIGIR 2013, Dublin, Ireland, 28 July-1 August, 2013 http://www.sigir2013.ie/ =================================================== CALL FOR PAPERS IMPORTANT: Regular contributors to SIGIR, please note changes to SIGIR 2013 for authors, as outlined below. SIGIR is the major international forum for the presentation of new research results and for the demonstration of new systems and techniques in the broad field of information retrieval (IR). The Conference and Program Chairs invite all those working in areas related to IR to submit original full papers, short papers, and proposals for tutorials, workshops, and demonstrations of systems. SIGIR 2013 welcomes contributions related to any aspect of IR theory and foundation, techniques, and applications. Relevant topics include, but are not limited to:? - Document Representation and Content Analysis (e.g., text representation, document structure, linguistic analysis, multi-lingual IR, cross-lingual IR, NLP for IR, information extraction, sentiment analysis, clustering, classification, topic models, facets, text streams)? - Queries and Query Analysis (e.g., query representation, query suggestion, query reformulation, query intent, conversational search, query log analysis, session analysis, question answering) - Users and Interactive IR (e.g., user models, user studies, user feedback, search interface, summarization, task models, personalized search)? - Retrieval Models and Ranking (e.g., IR theory, language models, probabilistic retrieval models, feature-based models, learning to rank, combining searches, diversity)? - Search Engine Architectures and Scalability (e.g., indexing, compression, distributed IR, P2P IR, mobile devices)? - Filtering and Recommending (e.g., content-based filtering, collaborative filtering, recommender systems, profiles)? - Evaluation (e.g., test collections, effectiveness measures, experimental design)? - Web IR and Social Media Search (e.g., link analysis, click models/behavioural modelling, social tagging, social network analysis, advertising and search, blog search, microblog search, forum search, community-based QA (CQA), adversarial IR, vertical and local search)? - IR and Structured Data (e.g., XML search, ranking in databases, desktop search, entity search)? - Multimedia IR (e.g., image search, video search, speech/audio search, music IR)? - Other Applications (e.g., digital libraries, enterprise search, genomics IR, legal IR, patent search, text reuse) IMPORTANT DATES - Monday 21 January 2013: Abstracts for full research papers due? - Monday 28 January 2013: Full research papers due? - Monday 4 February 2013: Workshop proposals due? - Monday 18 February 2013: Short papers, demonstration, and tutorial proposals due? - Monday 11 March 2013: Notification of workshop acceptances? - Monday 11 March 2013: Doctoral consortium proposals due? - Monday 15 April 2013: All other acceptance notifications? - Sunday 28 July 2013: Conference begins in Dublin IMPORTANT NOTICE We'd like to draw your attention to a few changes at SIGIR 2013 for authors. (1) The full paper track (10 pages) will introduce a new review criterion, *Reproducibility of Methods*, in addition to the criteria traditionally used at SIGIR. The full set of review criteria can be found in the FULL PAPER REVIEW CRITERIA section below. Also, visit the following pages: http://www.sigir2013.ie/fullpapers.html http://www.sigir2013.ie/requirements.html (2) Along with the full paper track, we will have a short paper (4 pages) and demo paper (2 pages) tracks. Note that SIGIR previously had posters (2 pages) and demo papers (1 page). Visit this page for details: http://www.sigir2013.ie/posterdemonstrations.html FULL PAPER REVIEW CRITERIA Relevance to SIGIR: Is the work presented within the scope of SIGIR? Originality of Work: Does the work describe a unique problem? Does the work propose a creative solution to an old problem? Is there similar prior art? Technical Soundness: Are the algorithms and methods used correct? Is the experimental design appropriate? Are the experiments and analyses thorough? Are appropriate statistical tests used? Quality of Presentation: Are the ideas, methods, results and discussions presented clearly? Is the paper structure appropriate? Is the paper written in good English? Impact of Ideas or Results: Will this research change practice? Will this work be cited? Will this work generate additional research? Adequacy of Citations: Are the authors aware of relevant prior art? Do the authors provide a good overview of it? Is the citation list unbiased? Reproducibility of Methods: Are the descriptions of the methods used detailed and accurate? Given the resources used in the paper, or (if they are unavailable) similar resources, could researchers carry out similar experiments to verify the results? What further description could the authors provide? Program Committee Chairs Maarten de Rijke, University of Amsterdam, The Netherlands Diane Kelly, University of North Carolina, Chapel Hill, USA Tetsuya Sakai, Microsoft Research Asia, China General Conference Chairs Gareth Jones, CNGL, Dublin City University, Ireland P?raic Sheridan, CNGL, Dublin City University, Ireland ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:08:39 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:08:39 +0100 Subject: Appel: RFP 2013, Reseau Francais de Phonologie Message-ID: Date: Thu, 20 Dec 2012 16:52:09 +0100 From: Olivier Crouzet Message-Id: <20121220165209.e76db3372a645438b05c2e2f at univ-nantes.fr> X-url: http://www.lling.univ-nantes.fr/ Toutes nos excuses pour les envois multiples / Apologies for cross-postings. ###################################################### APPEL A COMMUNICATION R?seau Fran?ais de Phonologie 2013 (RFP 2013) Apr?s les rencontres qui se sont tenues ? Orl?ans 2010, Tours 2011 et Paris 2012, le R?seau Fran?ais de Phonologie (RFP) lance un appel ? communication pour un colloque organis? par le Laboratoire de Linguistique (Lling/EA3827, Universit? de Nantes), en collaboration avec le FoReLL (Universit? de Poitiers) et la MSH-Ange Gu?pin, qui se tiendra ? Nantes du 1er au 3 juillet 2013. Conf?renciers invit?s * Phillip Backley (Tohoku Gakuin University, Sendai, Japon). * Didier Demolin (GIPSA Grenoble / UMR 5216, France). * Andrew Nevins (University College London, Royaume-Uni). * Bert Vaux (King's College Cambridge, Royaume-Uni). * Sophie Wauquier (Universit? de Paris 8 / UMR 7023, France). * Leo Wetzels (Vrije Universiteit Amsterdam, Pays-Bas). Session principale Toutes les ?coles et tous les courants de la phonologie sont invit?s ? participer. Les probl?mes trait?s peuvent concerner la phonologie g?n?rale comme l'analyse phonologique d'un ph?nom?ne linguistique ou d'une langue particuli?re. Seront prises en consid?ration les soumissions concernant l'analyse du signal, la perception, l'acquisition, la diachronie, la dialectologie, les formalismes, l'?pist?mologie et toutes les questions qui s'inscrivent explicitement dans le domaine de la phonologie et de ses interfaces. Sessions th?matiques Nous encourageons particuli?rement cette ann?e les communications portant sur les th?mes de l'Acquisition de la phonologie, ainsi que celles portant sur l'Harmonie. Session Th?matique 1 : Acquisition Cette session a pour objectif d'aborder les recherches r?centes dans les domaines de l'acquisition phonologique ou de l'apprentissage de la phonologie d'une langue premi?re ou seconde. Elle vise ? mettre en avant des donn?es, souvent non attest?es dans la langue adulte, qui questionnent les mod?les th?oriques d?velopp?s en phonologie. Les propositions attendues peuvent porter, sans limitation aucune, sur les unit?s minimales (traits, ?l?ments, segments), sur les niveaux syllabiques ou prosodiques, sur les processus, en production ou en perception (notamment sur le lien entre ces deux modalit?s). Quel que soit le cadre th?orique retenu, les communications propos?es pourront porter sur une langue particuli?re ou s'inscrire dans une perspective typologique. Session Th?matique 2 : Harmonie L'harmonie, un processus largement r?pandu ? travers les langues du monde, peut se d?finir comme un changement syntagmatique ? travers lequel un segment assimile les qualit?s d'un ?l?ment situ? dans le m?me domaine. Locale (contigu?t? stricte), ?tendue ? un domaine particulier (syllabe, pied, mot ou syntagme phonologique), l'harmonie, vue comme une assimilation ? distance, peut concerner aussi bien les voyelles (harmonie vocalique) que les consonnes (harmonie consonantique). Si la localit? appara?t cruciale dans la d?finition du ph?nom?ne, l'harmonie r?pond souvent ? des contraintes de directionnalit?. Un ensemble de segments, intervenants dans le domaine harmonique, semble soit bloquer l'harmonie, soit ?tre transparent : ces derniers sont-ils vraiment inertes ou participent-ils, d'une quelconque mani?re, au ph?nom?ne ? Ce processus r?sulte-t-il de principes phon?tiques (hypoth?se de la phonologisation d'un processus de coarticulation) ou de principes strictement phonologiques (hypoth?se d'une computation reposant sur un corps restreint de principes) ? Cette session est ouverte aux propositions relevant de la phonologie proprement dite mais aussi ? celles ax?es sur les relations harmoniques dans la production et la perception de la parole, la prosodie, dans l'acquisition, le d?veloppement et l'apprentissage, dans la structuration du lexique, dans les domaines de la reconnaissance automatique de la parole et de la synth?se vocale (liste non limitative). Format de soumission et s?lection Les propositions de communication, r?dig?es en fran?ais ou en anglais, seront pr?sent?es sous forme d'un r?sum? de deux pages maximum (format A4, police Times taille 12), incluant les ?l?ments essentiels de bibliographie, et soumises anonymement ? l'adresse suivante : https://www.easychair.org/conferences/?conf=rfp2013. Les propositions seront transf?r?es pour ?valuation ? deux rapporteurs et la s?lection finale fera l'objet d'une discussion collective. Calendrier * Appel ? contributions : 15 d?cembre 2013 * Envoi des contributions avant le 1er mars 2013 * Retour des avis aux auteurs : 15 avril 2013 * Colloque : du 1er au 3 juillet 2013 Organisation Les communications seront de 30 minutes, dix minutes de discussion incluses. Comit? de lecture J.-P. Angoujard (U. de Nantes), S. Bendjaballah (U. Paris 7), G. Bergounioux (U. d'Orl?ans), J. Brandao de Carvalho (U. Paris 8), Ph. Carr (U. de Montpellier), C. Dugua (U. d'Orl?ans), J. Durand (U. de Toulouse), S. Ferr? (U. de Tours), J.-M. Fournier (U. de Tours), S. Herment, (U. d'Aix-Marseille), M. D'Imperio (Aix-Marseille), M. Lahrouchi (U. Paris 8), B. Laks (U. Paris 10), J.-L. L?onard (U. Paris 3), J. Lowenstamm (U. Paris 7), N. Nguyen (U. d'Aix-Marseille), R. Noske (U. de Lille), C. Patin (U. de Lille), A. Rialland (U. Paris 3), R. Ridouane (U. Paris 3), M. Russo (U. Paris 8) , P. Sauzet (U. Toulouse), T. Scheer (U. Nice), Ph. S?g?ral (U. Paris 7), A. Tifrit (U. de Nantes), N. Vall?e (U. de Grenoble), S. Wauquier (U. Paris 8). Comit? d'organisation J.-M. Beltzung, E. Caratini, O. Crouzet, A. Tifrit ########################################################### CALL FOR PAPERS French Phonology Network Meeting 2013 (RFP 2013) After the conferences organized in Orl?ans 2010, Tours 2011 and Paris 2012, the French Phonology Network (R?seau Fran?ais de Phonologie) is launching a call for papers for a new meeting in the same spirit that will take place in Nantes from July, 1st to 3rd, 2013 thanks to the LLing (EA3827, Universit? de Nantes), FoReLL (Universit? de Poitiers) and MSH-Ange Gu?pin. Invited speakers * Phillip Backley (Tohoku Gakuin University, Sendai, Japon). * Didier Demolin (GIPSA Grenoble / UMR 5216 , France). * Andrew Nevins (University College London, Royaume-Uni) * Bert Vaux (King's College Cambridge, Royaume-Uni). * Sophie Wauquier (Universit? de Paris 8 / UMR 7023, France). * Leo Wetzels (Vrije Universiteit Amsterdam, Pays-Bas). Main session Phonologists of every school or background are warmly welcome to participate. Issues at stake may be in the field of general phonology or of the phonological analysis of a linguistic phenomenon of a specific language. Submissions that will be taken into consideration will be those dealing with signal processing, perception, acquisition, diachrony, dialectology, formalism, epistemology and all issues which explicitly file under the field of phonology and its interfaces. Thematic sessions This year we'd like to draw your attention to the fact that thematic sessions will be organized around 'Acquisition' and 'Harmony'. Thematic session 1 : Acquisition This thematic session aims at addressing the latest issues in the field of phonological acquisition of a first or second language. It will bring forward data which are unattested in adult's languages and challenge phonological theories. Submissions dealing with any aspect/level of phonological acquisition are welcome. They may be concerned with minimal units in phonology (features, elements, segments), the syllable, prosody, processes (in production or perception) among other topics. Contributions may be couched in any theoretical framework, and may be concerned with the acquisition of a single language or adopt a cross-linguistic/typological perspective. Thematic session 2 : Harmony Harmony is a wide-spread process among the world's languages. It may be defined as a syntagmatic change whereby a given segment absorbs some of the properties of another segment in the same phonological domain. When it is perceived as some kind of long-distance assimilation, harmony -which may be local (strict contiguity) or extended to a given domain (syllable, foot, word, phonological phrase)- may target vowels (vowel harmony) or consonants (consonant harmony). If locality seems to play a crucial role in its definition, harmony is also sensitive to directionality. Intervening segments (within the domain within which harmony applies) may prevent harmony to take place or be transparent: are these really invisible or are they somehow involved in the harmony process? Are harmony processes due to phonetic (e.g. phonologization of a coarticulation process) or to strictly phonological principles (e.g. computation of a restricted set of principles)? This thematic session aims at bringing together people who are concerned with harmony in general phonology as well as with harmonic relations in speech perception and production, prosody, acquisition, development, the structuring of the lexicon, automatic speech recognition and speech synthesis (this list, of course, should not be interpreted as being exhaustive). Submission format and selection Abstracts will be written either in French or in English and will not exceed two pages in length, (A4 format, Times font, size 12), including examples and references, and will be submitted through Easychair: https://www.easychair.org/conferences/?conf=rfp2013. The abstract must be completely anonymous and do not contain any information that identifies the authors. Submissions will then be forwarded to two peers for assessment and the final selection will be carried out by a board meeting. Important dates * Call for papers: December 15, 2012 * Deadline for submission: March 1st, 2013 * Notification of acceptance: April 15, 2013 * Conference: July 1st to 3rd, 2013. Organization Talks will last 20 minutes, followed by 10 minutes' debate. Reviewers J.-P. Angoujard (U. de Nantes), S. Bendjaballah (U. Paris 7), G. Bergounioux (U. d'Orl?ans), J. Brandao de Carvalho (U. Paris 8), Ph. Carr (U. de Montpellier), C. Dugua (U. d'Orl?ans), J. Durand (U. de Toulouse), S. Ferr? (U. de Tours), J.-M. Fournier (U. de Tours), S. Herment, (U. d'Aix-Marseille), M. D'Imperio (Aix-Marseille), M. Lahrouchi (U. Paris 8), B. Laks (U. Paris 10), J.-L. L?onard (U. Paris 3), J. Lowenstamm (U. Paris 7), N. Nguyen (U. d'Aix-Marseille), R. Noske (U. de Lille), C. Patin (U. de Lille), A. Rialland (U. Paris 3), R. Ridouane (U. Paris 3), M. Russo (U. Paris 8) , P. Sauzet (U. Toulouse), T. Scheer (U. Nice), Ph. S?g?ral (U. Paris 7), A. Tifrit (U. de Nantes), N. Vall?e (U. de Grenoble), S. Wauquier (U. Paris 8). Organizing committee J.-M. Beltzung, E. Caratini, O. Crouzet, A. Tifrit ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:09:37 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:09:37 +0100 Subject: Job: Stages TAL et Informatique chez Semantia, Marseille Message-ID: Date: Fri, 21 Dec 2012 09:01:04 +0000 From: Lucile Paroz Message-ID: Bonjour ? tous, Semantia est un fournisseur de services en ligne (ASP), sp?cialis? dans le traitement du langage pour l'optimisation de la gestion de la relation client. Deux stages sont propos?s pour 2013 : un stage de 3 ? 6 mois en TAL et un stage de 4 ? 6 mois en Informatique. Contexte du stage TAL Int?gr? au service de Recherche et D?veloppement, l'objectif du stage est de participer ? l'optimisation des Bases de Connaissances des applicatifs de la soci?t? pour le traitement et l'analyse du langage. Apr?s s'?tre familiaris? avec les outils et les solutions Semantia, il devra proposer des solutions d'optimisation du module morpho-syntaxique. Connaissances requises et/ou acquises : * Bonnes connaissances des outils disponibles en TALN, plus particuli?rement des Grammaires * Esprit d'?quipe * Sens de l'initiative * Autonomie * Rigueur * Motivation Niveau : Bac+3 minimum en Linguistique Dur?e du stage : de 3 ? 6 mois Contexte du stage Informatique Int?gr? au service de Recherche et D?veloppement, le stagiaire participera ? l'optimisation des Bases de Connaissances des applicatifs de la soci?t? pour le traitement et l'analyse du langage. L'objectif du stage est la mise en place d'un module grammatical permettant d'am?liorer le rendement de certaines r?gles linguistiques. Le stagiaire devra ?tre en mesure de proposer des m?thodes et de mettre en place diff?rentes solutions en situation. Connaissances requises et/ou acquises : * Compilation et th?orie des langages * D?veloppement d'analyseur syntaxique * Exp?rience de g?n?rateur type Yacc, Lex * Ma?trise avanc?e de l'algorithme * Langage C/C++/Java * Rigueur et motivation Niveau : Bac+3 minimum dans la discipline Dur?e du stage : de 4 ? 6 mois Contacts * drh at semantia.com * T?l. : 04 42 36 80 91 En vous souhaitant de belles f?tes de fin d'ann?e, L'?quipe de Semantia ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Dec 22 14:14:56 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 22 Dec 2012 15:14:56 +0100 Subject: Job: Stage, Analyse coreen ou japonais (Sinequa) Message-ID: Date: Fri, 21 Dec 2012 22:00:20 +0100 From: Frederik Cailliau Message-ID: <50D4CDE4.8070603 at sinequa.com> X-url: http://www.sinequa.com/ Bonjour, Veuillez trouver ci-dessous deux offres de stage pour 2013. Bien cordialement, Frederik Cailliau http://www.sinequa.com/ --------------------------------------------- Offre de stage 2013 Sujet : Am?lioration d'un module d'analyse linguistique pour la recherche d'information en cor?en ou en japonais Lieu : Sinequa, 12 rue d'Ath?nes, 75009 Paris Cadre : Master 1 ou 2 en Linguistique-Informatique ou sp?cialit? TAL Comp?tences : - Bonnes bases informatiques, ma?trise d'un langage de script (type PERL). - Ma?trise avanc?e du cor?en ou du japonais. Indemnit?s : selon niveau et exp?rience. D?but : d?s que possible. Contact: Frederik Cailliau, cailliau at sinequa.com ---------------------------------------------- Internship 2013 Topic: Improvement of a module of linguistic analysis for information retrieval in Korean or Japanese. Location: Sinequa, 12 rue d'Ath?nes, 75009 Paris Required education: Master in Computational Linguistics or option NLP Skills: - Good basic knowledge of computer science, proficiency of a scripting language (such as PERL). - Proficiency of Korean or Japanese close to native. Compensation: depending on level and experience. Start: as soon as possible. Contact: Frederik Cailliau, cailliau at sinequa.com ---------------------------------------------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Thu Dec 27 09:13:38 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Thu, 27 Dec 2012 10:13:38 +0100 Subject: Appel: Second Workshop on Computational Linguistics for Literature Message-ID: Date: Sat, 22 Dec 2012 09:59:40 -0500 From: Stan Szpakowicz Message-ID: <50D5CADC.1030902 at eecs.uottawa.ca> Second Workshop on Computational Linguistics for Literature Co-located with NAACL-HLT 2013 June 13 or 14, 2013, Atlanta, Georgia, USA Submission deadline: March 1, 2013 First Call for Papers (Apologies for multiple postings) The amount of literary material available on-line keeps growing rapidly: there are machine-readable texts from libraries, collections and e-book stores, as well as "live" literature such as e-zines, blogs or self-published e-books. We need tools to help navigate, visualize and better appreciate the high volume of available literature. We invite papers on applying state-of-the art NLP methods to literary data. What characteristics of literature make it special? Is it, indeed, a unique type of language data? How should we adapt our tools to find meaning in literary text? What lessons from automatic processing of literature could apply to other types of data? Position papers are welcome, too. Topics of interest (suitably related topics are welcome): - the needs of the readers and how those needs translate into meaningful NLP tasks; - searching for literature; - recommendation systems for literature; - computational modelling of narratives, computational narratology; - summarization of literature; - finding similar books; - differences between literature and other genres as relevant to computational linguistics; - discourse structure in literature; - emotion analysis for literature; - profiling and authorship attribution; - identification and analysis of literature genres; - building and analyzing social networks of characters; - generation of literary narrative, dialogue or poetry All information, including our excellent program committee, announcements and updates, sits at: https://sites.google.com/site/clfl2013/ Anna, David, Stan ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Thu Dec 27 09:16:46 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Thu, 27 Dec 2012 10:16:46 +0100 Subject: Job: Ingenieur en traitement automatique des langues, DGA Message-ID: Date: Sun, 23 Dec 2012 23:20:38 +0100 From: Laura Chaubard Message-Id: <748F24A6-2DF9-4629-A3C1-F1AA800858F2 at gmail.com> Ing?nieur en Traitement Automatique des Langues MINISTERE DE LA DEFENSE DGA-Maitrise de l?Information 1000 collaborateurs propose 1 CDD de 3 ans, ?volutif en CDI Mission du poste L?enjeu du poste est d?assurer des prestations d?expertise afin d?acqu?rir des modules de traitement automatique des langues (TAL) performants et d?en ma?triser les risques techniques. Int?gr? ? une ?quipe de ma?trise d?ouvrage, vous contribuerez ? l?expertise technique et aux processus d?acquisition de syst?mes TAL au profit des forces arm?es : - En participant ? l??laboration des sp?cifications techniques pour les ?tudes amont et les programmes, - En menant des analyses et des exp?rimentations pour orienter les choix, - En assurant le suivi et la qualification des d?monstrateurs et syst?mes livr?s, en interaction directe avec les industriels et les op?rationnels, - En participant ? la coordination des services ?tatiques et aux retours d?exp?rience op?rationnels, - En participant ? l?animation d?un r?seau d?acad?miques, d?industriels et d?agences ?tatiques autour des th?matiques d?int?r?t D?fense. Votre expertise portera sur les m?thodes de d?veloppement et d??valuation des technologies de traitement de l?information langagi?re non structur?e (texte, parole, document scann?), sur l?architecture des syst?mes de traitement s?mantique de l?information et sur l?int?gration de ces syst?mes dans la cha?ne du renseignement. Votre activit? sera pluridisciplinaire et vous travaillerez en lien avec les autres d?partements d?experts techniques de DGA Ma?trise de l?information. Profil du poste Vous avez un bac + 5 et des comp?tences dans les domaines suivants: - Informatique de base : algorithmique, syst?mes d?information? - Apprentissage automatique, intelligence artificielle, - M?thodes statistiques pour le traitement de l?information Un doctorat ou une exp?rience professionnelle dans le domaine du traitement de la parole ou du langage naturel seraient appr?ci?s. Poste bas? en r?gion rennaise avec d?placements en r?gion parisienne. Candidature et pr?tentions avant le 28 janvier 2013 ? DGA Maitrise de l?information- M. G?rard Le Chaix, chef du d?partement ? Espace, Observation, Renseignement, Drones ?, gerard.le-chaix at dga.defense.gouv.fr, copie ? laura.chaubard at dga.defense.gouv.fr . ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Thu Dec 27 09:23:31 2012 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Thu, 27 Dec 2012 10:23:31 +0100 Subject: Job: Research Assistant @ NUS/NTU, Singapore Message-ID: Date: Mon, 24 Dec 2012 22:53:19 +0800 From: Erik Cambria Message-ID: <563B6979-98DB-469A-A7E9-96A390DA0551 at nus.edu.sg> X-url: http://sentic.net/sentics X-url: http://sentic.net/elm Apologies for cross-posting. We are looking to hire a motivated individual for the position of Research Assistant at the National University of Singapore and Nanyang Technological University, under the joint supervision of Erik Cambria and Guangbin Huang. The duration of the position is 12 months, but may be extended an additional 6 months or more. The candidate is expected to start in the first quarter of 2013. The successful candidate will be involved in a project for the application of extreme learning machines (ELM) to sentic computing in order to develop a two-level affective common sense reasoning framework, which will be exploited for tasks such as opinion mining and sentiment analysis. Applicants should have a PhD (or a good honors degree) in Computer Science or similar, as well as relevant experience in conducting research in the field. The ideal candidate should have basic understanding in neural networks, knowledge representation, and natural language processing, and should be able to work independently on such tasks as literature review, programming, and data management. Remuneration will be commensurate with qualifications and experience. Interested applicants should send their CV to cambria at nus.edu.sg. For more information about the project, please visit opening, keep an eye on http://sentic.net/elm. Best Regards and Merry Christmas, Erik Cambria and Guangbin Huang Erik Cambria, PhD Research Scientist Web: http://sentic.net Email: cambria at nus.edu.sg ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ -------------------------------------------------------------------------