From hamon at LIMSI.FR Tue Sep 2 20:48:45 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 22:48:45 +0200 Subject: Livre: Metalangage et expression du sentiment linguistique profane Message-ID: Date: Sat, 30 Aug 2014 11:05:13 +0200 From: Michelle Lecolle Message-ID: <540193C9.2060903 at univ-lorraine.fr> X-url: http://lediscoursetlalangue.wordpress.com/ Avis de parution : Michelle Lecolle, coord., « Métalangage et expression du sentiment linguistique "profane" »,/Le Discours et la langue/ 6.1, 2014, - Introduction, /Michelle Lecolle/ - La conscience métalinguistique ordinaire et la linguistique naïve dans les travaux russes contemporains, /Michèle Debrenne/ - « Fais tes syllabes ! »: quand le terme théorique est une unité opératoire, /Corinne Gomila/ - /Un verbe c’est quelque chose/ : emploi « profane » ou emploi « savant » du métalangage à l’école élémentaire ?, /Patrice Gourdet et Danièle Cogis/ - Lexique métalinguistique et classes de Français Langue Étrangère/Seconde en France, /Angélique Martin-Masset / - Métalangage et sentiment linguistique des experts : regard en langue de spécialité, /Aurélie Picton/ - « Sentir des adjectifs » et « penser avec le nez ». Le sentiment linguistique dans les métiers du sensoriel, /Gérard Petit et Fanny Rinck/ - Glissements progressifs de « sémantique », /Anne Le Draoulec, Marie-Paule Péry-Woodley et Josette Rebeyrolle/ - Le /mot à la mode/ : usages et enjeux d’une expression métalinguistique profane, /Gilles Siouffi, Agnès Steuckardt et Chantal Wionet / - Faux amis / vrais ennemis : réutilisations de la notion d’anglicisme dans le discours métalinguistique au Québec, /Bruno Courbon et Myriam Paquet-Gauthier/ *Varia * - Les journalistes en Belgique causent-ils « belge », une fois ? Des belgicismes sur les sites d’information, Antoine Jacquet Site de la revue : Le Discours et la langue http://lediscoursetlalangue.wordpress.com/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:09:48 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:09:48 +0200 Subject: Appel: Workshop Enjeux, methodes et outils pour ameliorer la redaction des textes techniques Message-ID: date: Tue, 02 Sep 2014 14:45:57 +0200 from: "Patrick Saint-Dizier" message-id: <172f-5405bc00-243-50e21380 at 46542121> Workshop: Enjeux, méthodes et outils pour améliorer la rédaction des textes techniques IRIT, Université Paul Sabatier, Toulouse, 13-14 Novembre 2014 Objectifs La rédaction technique est un secteur en pleine expansion du fait, entre autres, de la complexité des produits commercialisés et des processus industriels, des exigences croissantes en sécurité et du développement des approches en spécification (exigences, règles métier). Les tâches dévolues aux rédacteurs techniques deviennent de plus en plus lourdes. Celles-ci incluent une prise en compte plus importante des interactions avec le métier et les opérateurs, mais aussi la prise en compte des contraintes réglementaires et un accroissement important en matière de qualité de rédaction. Cette qualité de rédaction est d’une nature différente des contrôles offerts par les éditeurs de textes classiques et nécessite une démarche particulière. L’objectif de ce séminaire est de faire se rencontrer les différents métiers de la rédaction technique, les chercheurs, les enseignants, et les industriels qui développent des outils d’aide à la rédaction technique afin d’approfondir une connaissance réciproque des métiers de la rédaction ainsi que les possibilités d’aide que peuvent offrir des systèmes avancés en matière de traitement de la langue, intelligence artificielle et ergonomie cognitive. Le séminaire consistera en présentations, démonstrations et études de cas, dans le but de promouvoir des liens entre métiers et de développer de nouvelles synergies. Thèmes (non exhaustif) - Pratiques de la rédaction technique (en linguistique, ergonomie, psycholinguistique), protocoles d’analyse de ces pratiques - Le document technique : aspects épistémologiques, fonctionnels, linguistiques, conceptuels. Le document technique, ses évolutions et ses challenges, incluant la dimension multimédia - Théories et recommandations de la rédaction technique (par ex. minimalisme, différentes déclinaisons de la langue contrôlée (par ex. par rapport au domaine, aux tâches, au type de doc technique)), normes métier, - Les attentes et besoins de la rédaction technique, le fonctionnement de la salle de rédaction ; rédaction et cycles de vie des documents, la relation rédacteur-opérateur (par ex. le REX), - La rédaction technique dans une langue étrangère au rédacteur (anglais), - Rédaction technique et maitrise des risques industriels : modèles mathématiques, psychologiques, etc., - Les challenges en analyse de la cohérence et de la cohésion des documents, - Les systèmes d’aide à la rédaction technique au niveau de la langue (Rat-RQA, Rubric, Lelie, etc.), et au niveau fonctionnel (Scenari, plateformes basées XML), - Méthodes en correction des erreurs : stratégies et processus, méthodes linguistiques, capitalisation des corrections, mémoire de correction, - Démonstrations de systèmes. Participation : gratuite. repas de midi à régler sur place. S’inscrire avant le 15 Octobre. Pour une intervention, soumettre un résumé d’une page en Word, format libre, avant le 15 septembre. Réponse le 30 Septembre. Les industriels auteurs de solutions de rédaction ainsi que les équipes de rédacteurs sont encouragée à participer. Adresser toute correspondance : Patrick Saint-Dizier, stdizier at irit.fr Directeur de recherches au CNRS à l’IRIT. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:06:15 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:06:15 +0200 Subject: Appel: AAAI FLAIRS special track on Artificial Intelligence for Big Social Data Analysis Message-ID: Date: Tue, 2 Sep 2014 04:03:34 -0500 (EST) From: SenticNet Message-ID: <627620085.3512085.1409648614443.open-xchange at bosoxweb01.eigbox.net> X-url: http://sentic.net/flairs Apologies for cross-posting, Submissions are invited for a FLAIRS-28 special track on Artificial Intelligence for Big Social Data Analysis, in cooperation with the Association for the Advancement of Artificial Intelligence (AAAI), to be held in Florida next May. For more info, please visit http://sentic.net/flairs RATIONALE As the Web rapidly evolves, Web users are evolving with it. In an era of social connectedness, people are becoming increasingly enthusiastic about interacting, sharing, and collaborating through social networks, online communities, blogs, Wikis, and other online collaborative media. In recent years, this collective intelligence has spread to many different areas, with particular focus on fields related to everyday life such as commerce, tourism, education, and health, causing the size of the Social Web to expand exponentially. The distillation of knowledge from such a large amount of unstructured information, however, is an extremely difficult task, as the contents of today's Web are perfectly suitable for human consumption, but remain hardly accessible to machines. The opportunity to capture the opinions of the general public about social events, political movements, company strategies, marketing campaigns, and product preferences has raised growing interest both within the scientific community, leading to many exciting open challenges, as well as in the business world, due to the remarkable benefits to be had from marketing and financial market prediction. The main aim of this Special Track is to explore the new frontiers of big data computing for opinion mining and sentiment analysis through machine learning techniques, knowledge-based systems, adaptive and transfer learning, in order to more efficiently retrieve and extract social information from the Web. TOPICS The Special Track aims to provide an international forum for researchers in the field of big data computing for opinion mining and sentiment analysis to share information on their latest investigations in social information retrieval and their applications both in academic research areas and industrial sectors. The broader context of the Special Track comprehends information retrieval, natural language processing, web mining, semantic web, and artificial intelligence. Topics of interest include but are not limited to: - Machine learning for sentiment mining - Concept-level sentiment analysis - Biologically-inspired opinion mining - Sentiment identification & classification - Association rule learning for opinion mining - Time evolving opinion & sentiment analysis - Multi-modal sentiment analysis - Multi-domain & cross-domain evaluation - Knowledge base construction & integration with opinion analysis - Transfer learning of opinion & sentiment with knowledge bases - Sentiment topic detection & trend discovery - Social ranking - Social network analysis - Opinion spam detection The Special Issue also welcomes papers on specific application domains of knowledge-based systems for big social data analysis, e.g., influence networks, customer experience management, intelligent user interfaces, multimedia management, computer-mediated human-human communication, enterprise feedback management, surveillance, art. TIMEFRAME November 17th, 2014: Paper submission deadline January 19th, 2015: Notification of paper acceptance February 23rd, 2015: Camera-ready of accepted papers May 18th-20th, 2015: Conference dates SUBMISSION AND PROCEEDINGS Submitted papers must be original, and not submitted concurrently to a journal or another conference. Double-blind reviewing will be provided, so submitted papers must use fake author names and affiliations. Papers must use the latest AAAI Press template, and must be submitted as PDF through the EasyChair conference system. There are three kinds of submissions: full papers (up to 6 pages), short papers (up to 4 pages), and poster abstracts (up to 250 words). Acceptance as a full paper entails a 20 minute presentation during a regular session, while short papers and abstracts will be required to participate in the poster session. Rejected full papers may still be accepted as short papers or poster abstracts. Selected, expanded versions of Special Track papers will be published in a follow-on Special Issue of Springer's Cognitive Computation journal. ORGANIZERS - Erik Cambria, Nanyang Technological University (Singapore) - Amir Hussain, University of Stirling (UK) - Newton Howard, MIT Media Laboratory (USA) From hamon at LIMSI.FR Tue Sep 2 21:27:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:27:35 +0200 Subject: Ecole: Formation ELAN, 19-20 Novembre 2014, Poitiers Message-ID: Date: Tue, 2 Sep 2014 18:44:07 +0200 From: FR2559 secretariat-general Message-ID: <5405F3D7.6030605 at cnrs.fr> X-url: http://www.typologie.cnrs.fr X-url: http://www.ilf.cnrs.fr DATE LIMITE D'INSCRIPTION AU 15 SEPTEMBRE 2014 Bonjour, Le groupe "Multimodalité et modalité gestuo-visuelle" du consortium "Corpus oraux et multimodaux" (IRCOM) propose une formation sur la "NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC ELAN" pendant deux journées les 19 et 20 NOVEMBRE 2014 à Poitiers. Le nombre de participants étant limité pour cet atelier, nous demandons aux personnes intéressées de bien vouloir faire parvenir à Claudia S. Bianchini (claudia.savina.bianchini at univ-poitiers.fr) un bref CV, une lettre indiquant les intérêts et motivations du candidat pour participer à l'atelier, ainsi que la fiche de pré-inscription dûment complétée avant le 15 septembre 2014. Les candidatures seront examinées par un comité ad hoc du Conseil Scientifique 'Multimodalité'. Le comité d'organisation Claudia S. Bianchini, PhD MCF Licence SDL-LSF, Univ. Poitiers claudia.savina.bianchini at univ-poitiers.fr Université de Poitiers - UFR Lettres et Langues (Bât. A3) 1 rue Raymond CANTEL - TSA 11102 86073 POITIERS CEDEX 9 ************************************************************************ NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC ELAN ATELIER DE FORMATION 19 et 20 NOVEMBRE 2014 MSHS Bât A5, 5 rue Théodore Lefebvre 86 000 POITIERS OBJECTIF Le consortium « Corpus oraux et multimodaux » (IRCOM) coordonné par la fédération Typologie et Universaux Linguistiques sous l'égide de la très grande infrastructure de recherche HUMA-NUM a vocation à fédérer les équipes, laboratoires, chercheurs et enseignants-chercheurs engagés dans la constitution et le traitement de corpus oraux et multimodaux, afin de faire converger les pratiques. A cette fin, l'IRCOM propose un certain nombre de formations dans différents domaines liés à l'utilisation de corpus en linguistique. L'un de ces domaines concerne la notation, l'annotation et l'analyse de corpus multimodaux. Une session de formation à l'annotation avec le logiciel ELAN se déroulera les mercredi 19 et jeudi 20 novembre 2014 à Poitiers. COMITE D'ORGANISATION ET FORMATEURS L'atelier « Notation, annotation et analyse de corpus multimodaux avec le logiciel ELAN » est organisé par le groupe de travail multimodalité et modalité gestuo-visuelle en charge de ces questions au sein du consortium IRCOM. Trois formateurs interviendront dans cet atelier : - Christophe Parisse (Modyco) - Isabelle Rousset (Lidilem) - Dominique Boutet (SFL) DEROULEMENT DE L'ATELIER La formation se déroulera sur 2 journées. Les participants, limités à 28 au total, seront divisés en deux groupes de travail selon le niveau d'expertise des participants : niveau débutant et niveau avancé. Les participants devront apporter leur ordinateur portable (configurations requises, voir « Avant d'assister à la formation »). Les corpus et schémas d'annotation utilisés seront fournis par l'IRCOM. La formation théorique alternera avec des sessions de mise en pratique et ce tout au long des deux journées. INSCRIPTION ET PRISE EN CHARGE DES FRAIS Le nombre de participants étant limité à 28 participants, nous demandons aux personnes intéressées de bien vouloir faire parvenir à Claudia S. Bianchini (claudia.savina.bianchini at univ-poitiers.fr) un bref CV, une lettre indiquant les intérêts et motivations du candidat pour participer à l'atelier, ainsi que la fiche de pré-inscription dûment complétée avant le 15 avril 2014. Les candidatures seront examinées par un comité ad hoc du Conseil Scientifique. L'IRCOM prendra en charge les déjeuners et les pauses café qui seront pris sur place. Programme préliminaire de l'atelier : - GROUPE DEBUTANTS Jour 1 (19 novembre 2014) Prise en main du logiciel ELAN - Chargement du logiciel. Présentation des principales fonctionnalités d'ELAN (découverte du menu), chargement de données primaires multimodales (vidéo et audio), création de pistes (acteurs), segmentations (manuelle, à la volée), annotations. Synchronisation des données primaires. (C. Parisse) - Sensibilisation aux formats et codecs. Comment importer une annotation effectuée sous excel, ou d'autres logiciels d'annotation (Praat, Transcriber, Toolbox, Clan). Bâtir un template sous ELAN : stéréotypes et types associés aux pistes (acteurs). (C. Parisse) Jour 2 (20 novembre 2014) Template et Fonctions avancées - Bâtir un template sous ELAN : vocabulaire contrôlé. Associations VC, types linguistiques et pistes d'annotation. Fonctions avancées d'ELAN (merge et tokeniser). Répartir les annotations entre annotateurs et fusionner les transcriptions. (D. Boutet) - Corriger une annotation : Fonction rechercher/remplacer (fichier simple ou multiple). Faire de requêtes sous ELAN, sauvegarde des requêtes et des résultats. Exporter vers Excel. (I. Rousset et C. Parisse) - GROUPE AVANCES Jour 1 (19 novembre 2014) Prise en main du logiciel ELAN (Isabelle Rousset) - Questions présidant à l'établissement d'un schéma d'annotation, élaboration d'un template : structuration de l'annotation (type des pistes et des attributs). Constitution de vocabulaires contrôlés, insertion de différents médias, modalités de segmentation, annotations. (I. Rousset) - Import d'annotations, Fonctions avancées (merge, filtres, copy, tokeniser), Modifications/ réutilisation d'un template. Sensibilisation à la constitution d'un manuel de codage. (I. Rousset) Jour 2 (20 novembre 2014) Requêtes et analyse - Requêtes, utilisation d'expressions régulières, enregistrement des requêtes, recherches sur plusieurs fichiers, exports des résultats. Utilisation d'Excel : import, export des données, utilisation des fonctions d'Excel pour modifier des données, pour générer des tiers ou des données à réimporter le cas échéant. (C. Parisse) - Insertion de données primaires de type biomécanique (fichiers liés), affichage dans ELAN, transformation des données en annotations (import des données depuis excel). (D. Boutet) Avant d'assister à la formation, il est nécessaire d'avoir téléchargé et installé : Pour Windows et Mac OS : - 4 Go d'espace disque disponible pour l'installation des applications 5 Go supplémentaires pour le téléchargement du contenu - Carte graphique avec les dernières versions des pilotes mises à jour ; Résolution d'écran 1 024 x 768 - Lecteur DVD-ROM (graveur de DVD compatible requis pour la gravure de DVD ; graveur de Blu-ray requis pour la gravure de disques Blu-ray) - Logiciel QuickTime 7 - Connexion Internet requise pour les services Web Microsoft® Service Pack 2, Windows Media Center, Windows Vista®, Windows 7 ou Windows 8. - 2 Go de mémoire RAM - Ecran couleur avec carte vidéo couleurs 16 bits - Pilote d'affichage et de son compatible avec Microsoft DirectX 9 ou 10 - Windows Media Player (requis en cas d'importation/exportation de formats Windows Media) Mac OS (Privilégiez tout de même un ordinateur PC) - Processeur Intel® multicoeur 64 bits - Mac OS X v10.6 à v10. - 8.2 Go de mémoire RAM Téléchargez les logiciels ELAN, Excel ou openoffice Calc, notepad ++ FICHE DE PRE-INSCRIPTION _____________________ NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC ELAN ATELIER DE FORMATION 19 et 20 NOVEMBRE 2014 MSHS Bât A5, 5 rue Théodore Lefebvre 86 000 POITIERS L'inscription sera validée après l'examen du dossier de candidature composé : 1) d'un bref CV ; 2) d'une lettre où le candidat expose ses intérêts et motivations à participer à l'atelier ; 3) du présent formulaire. Nom, prénom : Adresse personnelle : E-Mail : Téléphone : Statut : O Doctorant O Chercheur / ITA O Post-doctorant O Enseignant-Chercheur O Autre (précisez) : Organisme : A renvoyer avant le 15 septembre 2014 à claudia.savina.bianchini at univ-poitiers.fr Veuillez nous excuser pour les doublons... ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 20:50:32 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 22:50:32 +0200 Subject: Job: Poste d'ingenieur en developpement Java, Labex ASLAN, Lyon, Oct 2014 Message-ID: Date: Sat, 30 Aug 2014 13:10:14 +0200 From: Serge Heiden Message-ID: <5401B116.6090607 at ens-lyon.fr> X-url: http://aslan.universite-lyon.fr X-url: http://icar.univ-lyon2.fr X-url: http://textometrie.ens-lyon.fr [merci de diffuser dans les universités et les écoles d'ingénieurs en informatique] ======================================================================== Poste d'ingénieur en développement Java, Labex ASLAN, Lyon, Oct 2014 Dans le cadre des activités du Labex ASLAN (http://aslan.universite-lyon.fr), le laboratoire ICAR (http://icar.univ-lyon2.fr) cherche à pourvoir un **CDD de 12 mois** à partir de début octobre 2014 axé sur le développement de la plateforme d'analyse de données textuelles TXM (http://textometrie.ens-lyon.fr). L'ingénieur intégrera l'équipe de développement du site de Lyon au sein du laboratoire. Il participera aux évolutions de la version portail web de TXM (développement de services de mise en ligne d'éditions critiques et intégration du moteur de recherche syntaxique TIGERSearch) ainsi que de la version pour poste (intégration d'outils de TAL dans la plateforme et développement de nouveaux services d'annotation/correction de corpus). D'excellentes compétences en conception et en programmation sont attendues. Plus précisément les compétences recherchées incluent : - expérience en conception et développement Java open-source : développement Java (type Eclipse RCP), spécification/recettage par gestion de tickets (Redmine), gestion de versions (SVN), rédaction de documentation développeur (Javadoc) et utilisateur (LibreOffice, Dokuwiki) - développement web : développement Java/JavaScript (GWT + Tomcat), web services (REST), standards HTML/CSS - traitement XML (StAX/DOM, XSLT) - traitement relationnel (SQL, JDBC) - rédaction technique en français et en anglais Connaissances supplémentaires appréciées : - connaissance de standards d'encodage XML de textes : Text Encoding Initiative, TIGER XML, TMX - connaissance générale en TAL : tokenization, étiquetage morpho-syntaxique, lemmatisation, annotation syntaxique - connaissance en ergonomie des interfaces graphiques utilisateur - langage de programmation C - langage de script R La personne devra faire preuve d'excellentes capacités relationnelles pour le travail en équipe avec des développeurs, des chercheurs et des étudiants, ainsi que faire preuve d'autonomie. Salaire annuel brut de 26 000 euros selon diplôme. Le poste est ouvert aux débutants (récents diplômés d'école d'ingénieur ou de Master) mais aussi aux récents docteurs possédant de bonnes capacités en programmation. Le profil possède une forte dominante développement, toutefois le travail attendu s’inscrit dans les activités de recherche de l'équipe Lincobato, très active dans le domaine de l'analyse informatisée de corpus textuels et la philologie numérique en ancien français, et se prête à publications. En fonction de la qualité de l'ingénieur/docteur recruté, le laboratoire bénéficie d'un fond constant de projets permettant d'envisager la prolongation du contrat à l'issue des 12 mois. Les candidats peuvent envoyer un dossier (cv, motivation et éventuelles lettres de recommandation, en pdf) à serge.heiden-_-à-_-ens-lyon.fr. ======================================================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:04:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:04:35 +0200 Subject: Appel: 3emes journees Unitex/Gramlab, 3rd UNITEX/GramLab Message-ID: Date: Mon, 1 Sep 2014 17:46:51 +0200 (CEST) From: Denis Maurel Message-ID: <657913058.1082347.1409586410960.JavaMail.zimbra at univ-tours.fr> X-url: http://www-igm.univ-mlv.fr/~unitex/ English below. Submission deadline: September 5, 2014 3èmes journées Unitex/Gramlab 9-10 octobre 2014, Université François Rabelais Tours Soumission : avant le 5 septembre 2014 Unitex est une plate-forme open-source d’analyse de texte largement utilisée en recherche, dans l’enseignement et l’industrie. Le système GramLab/Unitex offre en plus aux équipes le travail collaboratif (partage de ressources, suivi de versions, etc.). Ces outils reposent sur des technologies de type « automates à états finis » et incorporent des ressources linguistiques à large couverture, disponibles dans de nombreuses langues. Les journées Unitex/GramLab sont un forum qui a pour ambition de rassembler la communauté des chercheurs et industriels utilisant Unitex et GramLab pour leurs travaux (tous domaines confondus) ou participant au développement de cette plate-forme et de ses ressources. L’objectif principal de cet événement est de favoriser le partage d’expérience et les contacts entre utilisateurs et développeurs. Le programme présentera un éventail des recherches en cours et offrira une série de formations pratiques de différents niveaux aux chercheurs qui souhaitent utiliser ce système ou découvrir de nouvelles fonctionnalités. Appel à communications, formations et démonstrations 1) Nous invitons les utilisateurs d’Unitex à soumettre des propositions de communication orale dans les domaines suivants (non exclusifs) : * Les recherches actuelles utilisant Unitex (dans tous les domaines). * Le développement de ressources à destination d'Unitex. * Le développement d'extensions, nouvelles fonctionnalités, etc. * Les développements industriels reposant sur Unitex. * Les initiatives pédagogiques utilisant Unitex (Unitex dans l'enseignement du TAL ou des ressources linguistiques, etc.). * L’intégration d’autres outils à Unitex. 2) Nous invitons les experts ayant une maîtrise particulière du système à proposer des tutoriels dans les domaines suivants ou d’autres : * Utilisation avancée des graphes. * Cascades de transducteurs avec CaSys. * Étiquetage en parties du discours, en parenthèsages minimaux.... * Développement de scripts Unitex / initiation à la programmation Unitex. * Programmation : persistance et optimisation. * Intégration Unitex-UIMA dans une chaine de traitement. * autres. 3) Nous faisons également appel aux auteurs d’applications intégrant des fonctionnalités d’Unitex et leur proposons de faire la démonstration de leurs outils. Procédure de soumission Envoyer un résumé d'une page maximum (3000 caractères) à : j.unitex2014 at univ-tours.fr Ce document reprendra les informations suivantes : - Type de communication : * communication orale de 20 minutes * formation (tutoriel) de 2 heures * démonstration (10 minutes en séance plénière + rencontres) - Nom, prénom, affiliation, adresse de courrier électronique - Titre de la présentation - Résumé de la présentation - Pour les tutoriels : défendre l’intérêt de cette formation et identifier le public visé. Programme provisoire Mercredi 8 octobre Après-midi: Accueil et visite de la région Jeudi 9 octobre Matin:Présentations Après-midi: Tutoriels - Ateliers et Réunion développeurs (en parallèle) Vendredi 10 octobre Matin : Présentations Après-midi : Réunion plénière (questions aux développeurs, nouveautés, orientations, etc.) Publication et communication Les communications pourront être diffusées sous forme électronique sur le site de la conférence, à la demande des auteurs. Calendrier Appel à communication : début juillet Soumission : avant le 5 septembre 2014 Approbation/évaluation : 10-15 septembre Inscriptions : - Avant le 30 septembre : 25 euros/jours - Après le 30 septembre : 35 euros /jours - Inscription gratuite pour les formateurs. - Possibilité de bourse pour les étudiants ne disposant pas de financement (soumettre une lettre de demande) - Les frais d’inscription couvrent les pauses café, deux repas en restaurant d'entreprise et les documents pédagogiques distribués durant les formations. Comité de lecture Antonio Balvet, STL, Université de Lille 3 Matthieu Constant, IGM, Université de Marne-la-Vallée Anne Dister, Université Saint-Louis - Bruxelles Cédrick Fairon, CENTAL, Université catholique de Louvain Nathalie Friburger, LI, Université François Rabelais Tours Cvetana Krstev, Université de Belgrade Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Éric Laporte, IGM, Université de Marne-la-Vallée Denis Maurel, LI, Université François Rabelais Tours Thierry Poibeau, LaTTice, CNRS Agata Savary, LI, Université François Rabelais Tours Duško Vitas, Université de Belgrade Gilles Vollant, Ergonotics Comité d’organisation Nathalie Friburger, Université François Rabelais Tours Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Claude Martineau, LIGM, Université Paris-Est Marne-la-Vallée Denis Maurel, Université François Rabelais Tours Agata Savary, LI, Université François Rabelais Tours Comité de pilotage Cédrick Fairon, CENTAL, Université catholique de Louvain Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Éric Laporte, IGM, Université de Marne-la-Vallée Denis Maurel, Université François Rabelais Tours Gaelle Recource, Kwaga Duško Vitas, Université de Belgrade ------------------------------------------------------------------------ 3 rd UNITEX/GramLab Workshop October 9-10, 2014, Université François Rabelais Tours Submission deadline: September 5, 2014 Unitex is an open-source text analysis software widely used in research, teaching and industry (http://www-igm.univ-mlv.fr/~unitex/). It relies on Finite State technologies and incorporates large-scale language resources for several languages. GramLab is an Integrated Development Environment (IDE), based on Unitex software components but specifically designed for industrial purposes. It integrates tools that help collaborative development, versioning, etc. The Unitex/GramLab Workshop aims at gathering academic and industrial users, developers and researchers contributing to the development of this open-source software and its resources or using them for developing new research or industrial applications. It is also a unique opportunity for new users to learn the basic and advanced Unitex techniques and discuss their projects with experts during hands-on sessions. The program will offer an overview of the current trends: the development of real-life industrial applications based on Unitex, the use of Unitex in various research projects, the improvement of Unitex through the development of new features and the extension of the language resources. Training sessions of various levels will be also offered. Call for communication, training session, demonstrations 1) We invite submissions for communication in the following areas (not exclusive): - Current research projects exploiting Unitex (all domains) - Development of language resources for Unitex - Development of new features or functionalities, optimization of existing programs, etc. - Industrial developements based on Unitex - Pedagogical initiatives using Unitex (for teaching NLP, Corpus linguistics, etc.) - Tools integration in Unitex 2) We invite Unitex experts to offer tutorials in the following domains (or others): * Advanced use of graphs * Cascading Transducers with CaSys * POS tagging * Unitex Scripting (Introduction to Unitex programming) * Persistance and optimization for Unitex-based applications * Building up on Unitex-UIMA * other 3) We also call for developers to demonstrate Unitex-based applications. Submission procedure Send a 1 page abstract (max 3000 characters) to : j.unitex2014 at univ-tours.fr This page will contain the following information: - Type of communication: * Oral communication (20 minutes) * Tutorial (2 hours) * Demonstration (10 minutes in plenary session + poster/demo session) - Name, First name, Institution, e-mail - Title - Abstract - Oral presentation Language (French or English) - For tutorials: explain the rationale for this training and identify target audience Draft program Wednesday 8 october Afternoon possibility to visit the Region of Tours Thursday 9 october : Morning: Presentations Afternoon : Tutorials -Workshop and developpers session (parallel sessions) Friday 10 october : Morning: Presentations Afternoon : Plenary session (questions to developpers, innovations, new orientations, etc.) Proceedings and Publication The Workshop proceedings can be published electronically in the website of the workshop, if the authors wish. Call for papers: Begining of July Submission deadline: September 5, 2014 Author notification: September 10-15, 2014 Registration - Until September 30, 2013: 25 euros/day - After September 30, 2013: 35 euros/day - Free registration for experts in charge of tutorials - A few grants are available for students who do not have access to funding (registration fees waived): submit application letter . - Registration fees cover: coffee breaks, lunches and handouts for the tutorials. Scientific Committee Antonio Balvet, STL, Université de Lille 3 Matthieu Constant, IGM, Université de Marne-la-Vallée Anne Dister, Université Saint-Louis - Bruxelles Cédrick Fairon, CENTAL, Université catholique de Louvain Nathalie Friburger, LI, Université François Rabelais Tours Cvetana Krstev, Université de Belgrade Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Éric Laporte, IGM, Université de Marne-la-Vallée Denis Maurel, LI, Université François Rabelais Tours Thierry Poibeau, LaTTice, CNRS Agata Savary, LI, Université François Rabelais Tours Duško Vitas, Université de Belgrade Gilles Vollant, Ergonotics Organizing Committee Nathalie Friburger, Université François Rabelais Tours Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Claude Martineau, LIGM, Université Paris-Est Marne-la-Vallée Denis Maurel, Université François Rabelais Tours Agata Savary, LI, Université François Rabelais Tours Steering Committee Cédrick Fairon, CENTAL, Université catholique de Louvain Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Éric Laporte, IGM, Université de Marne-la-Vallée Denis Maurel, Université François Rabelais Tours Gaelle Recource, Kwaga Duško Vitas, Université de Belgrade ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:14:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:14:35 +0200 Subject: Appel: Grammaire des genres et des styles, quelles approches privilegier ? Message-ID: Date: Tue, 02 Sep 2014 16:06:09 +0200 From: Thierry Charnois Message-ID: <5405CED1.3010106 at lipn.univ-paris13.fr> (See English Below) **Grammaire des genres et des styles : quelles approches privilégier ?** --------------------------------------------------------- Journée ConSciLa (Confrontations en Sciences du Langage), Paris le 16 janvier 2015 (lieu annoncé ultérieurement) **Appel à communication** La syntaxe moderne s'est généralement constituée autour d'analyses orientées vers les propriétés formelles des phrases et de leurs constituants. Les phrases sont souvent analysées indépendamment de tout ancrage énonciatif et plus encore, générique. Forte de cette perspective, la syntaxe ne considère pas comme centraux dans le champ qu'elle occupe, les phénomènes de variations grammaticales, ni les spécificités relatives à la nature différente des performances linguistiques. De la même façon, les approches textuelles -- dans la tradition de la textométrie ou de l'analyse du discours - ont assez peu pointé les caractéristiques syntaxiques propres aux genres qu'elles étudient, étant plus attentives aux particularités lexicales ou énonciatives. Il s'ensuit qu'un genre textuel est rarement caractérisé par sa spécificité syntaxique. Quant à la stylistique, discipline la plus à même d'étudier les particularités linguistiques, son ancrage trop académique et son manque d'outillage l'obligent souvent à circonscrire son analyse à des unités souvent pertinentes mais restreintes et isolées. Les analyses automatisées permettent cependant depuis quelques années de mieux identifier les spécificités lexico-grammaticales des textes, et donc des genres. Il existe deux grandes approches, la première étant largement plus développée que l'autre : - l'approche « paradigmatique » reposant sur la quantification des catégories morpho-syntaxiques employées. Par exemple, dans son analyse du discours oral en milieu universitaire, Biber (2006) met en évidence le sur-emploi (par rapport à l'écrit) des pronoms de premières personnes, des expressions évaluatives (verbes « mentaux », adverbes énonciatifs, etc.), des WH questions, etc. Par factorisation, il est possible de dégager des faisceaux de propriétés génériques donnant la cartographie d'un genre. - l'approche « syntagmatique » privilégiant la combinatoire des unités lexicales, le repérage des séquences syntagmatiques préférées (ou évitées) par un genre. A titre d'exemple, donnons un patron lexico-grammatical (Larjavaara et Legallois en prép.) - que l'on désigne parfois par le terme de motif (Quiniou et al.2012, Longrée et Mellet 2013) : ce N si ADJ et si ADJ. Ce motif, sémantiquement évaluatif, est spécifique du genre « Mémoires » au 19e siècle (comparé aux genres Récits de voyage, Romans, Correspondances, Essais de la même époque) : Oh ! Tant mieux, tant mieux de n' être pas bornés par ce temps si court et si triste ! E. de Guérin, Journal (1834-1840) Seulement, pour ne pas faire acte de désobéissance et de bravade envers cette mère si tendre et si aimée, Maurice lui annonça [...] un petit voyage au Blanc. G. Sand, Histoire de ma vie, 1855 On éprouve aujourd'hui encore, comme autrefois, une grande douceur intérieure à voir ces lieux si bénis, et maintenant si abandonnés. Mgr Dupanloup, Journal intime, 1876 Cette journée Conscila consacrée à l'analyse de la grammaire et de la stylistique des genres discursifs, a pour objectif de réunir des chercheurs en linguistique ou en TAL dont les travaux portent sur l'identification des caractéristiques lexico-grammaticales des textes. Les travaux soumis devront prendre en compte la contrainte de l'exhaustivité : on ne s'intéressera pas à un seul type de formes, mais à maximum d'éléments spécifiques d'un genre. Les points suivants pourront être abordés : - les techniques d'identification des propriétés génériques ; - la complémentarité ou compétitivité entre approches paradigmatiques et syntagmatiques ; - l'interprétation des données. Les propositions de communication porteront donc sur la caractérisation des genres discursifs (littéraires ou non) ou des styles, dans une perspective exhaustive ; elles aborderont les méthodes, sans négliger la description linguistique. Elles peuvent être étendues à la comparaison entre auteurs, ou porter sur des registres, des pratiques discursives ou encore sur des formes telles que les séquences textuelles (narrative argumentative, descriptive, etc.). Les travaux peuvent porter sur toute langue, et les genres abordés peuvent être oraux ou écrits. Les perspectives peuvent être variables : informatiques, didactiques, stylistiques, discursives, syntaxiques. Les communications se feront en français ou en anglais. **Soumissions** ---------- 1- Une intention de communication sera envoyée mi-septembre aux organisateurs à l'adresse : dominique.legallois at unicaen.fr 2- Une proposition d'une page minimum devra être soumise pour le 1er novembre 2014. La réponse aux auteurs sera transmise le 20 novembre 2014. *Organisation* --------- Thierry Charnois (Université de Paris 13, LIPN) Sascha Diwersy (Université de Cologne) Meri Larjavaara (Åbo Akademi) Dominique Legallois (Université de Caen, Crisco) Réf: Biber D. (2006) University language: A corpus-based study of spoken and written registers. Amsterdam: John Benjamins Biber, D. & S. Conrad 2009: Register, genre and style. Cambridge: Cambridge University Press. Dorgeloh, H. & A. Wanner (eds) 2010: Syntactic variation and genre, Berlin/New York: De Gruyter Mouton. Larjavaara M et Legallois D. (en prép.) « Les genres discursifs et leur grammaire » Longrée D. et Mellet S. (2013. « Le motif : une unité phraséologique englobante ? Étendre le champ de la phraséologie de la langue au discours », Langages 189 (D. Legallois & A. Tutin, coord.), p.68-80 Martin, J. R. & Rose, D. (2008) : Genre relations. Mapping culture. London: Equinox. Quiniou S., Cellier P., Charnois Th. et Legallois D. (2012)« What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics ? » in Lecture Notes in Computer Science, Springer Vol. 7181, pp 166-177 Revue Linx, n° 64-65, « Les genres de discours vus par la grammaire », sous la direction de M. Krazem. ------------------------------------------------------------------------ **Grammar of genres and styles: which approaches to prefer?** ConSciLa (Confrontations en Sciences du Langage), Paris, France, Friday 16 January 2015 (the place will be announced later) **Call for submission** Modern syntactic research consists generally of studies that are oriented towards formal properties of sentences. Sentences are then analyzed independently of any utterer-based perspective, or generic textual features. As a result of this, grammatical variation is not viewed as central, nor are performance-related specificities viewed as pertinent to the field of syntax. In a similar manner, textual studies (in the tradition of textometrics and discourse analysis) rarely focus on the syntactic specificities of the genres under scrutiny, and instead concentrate on lexical and utterer-based specificities. As a consequence, textual genre is rarely characterized by its syntactic features. Whereas stylistics would appear most suited to the study of such linguistic features, its practice is flawed by heavily academic nature and lack of formal tools, restricting any analyses to pertinent yet isolated units of texts. In recent years, automatic text analysis has enabled a more accurate identification of lexical and grammatical features of texts and genres. There are two main approaches, the first being more widespread than the second : The paradigmatic approach rests upon the quantification of morpho-syntactic categories. For instance, in his work on oral discourse in the academic community, Biber 2006 uncovers the over-usage (in comparison with written discourse) of first person pronouns, of evaluative expressions ("mental" verbs, modal adverbs, etc.), of WH- questions, etc. By means of factorisation, it is possible to determine a set of properties particular to a specific genre. The syntagmatic approach focuses on the combination of lexical units, the identification of preferred, or dispreferred, syntagmatic segments by genre. To give an illustration of this, consider the lexico-grammatical structure named "pattern" or motif in Quiniou et al, ce N si ADJ et si ADJ (lit : That N so ADJ and so ADJ). This semantico-evaluative pattern is specific to the 19th century genre of Memoirs, in comparison with Travel narrative, Novels, Correspondence, Essays of the same period : Oh ! Tant mieux, tant mieux de n' être pas bornés par ce temps si court et si triste ! E. de Guérin, Journal (1834-1840) (lit : that time so short and so sad) Seulement, pour ne pas faire acte de désobéissance et de bravade envers cette mère si tendre et si aimée, Maurice lui annonça [...] un petit voyage au Blanc. G. Sand, Histoire de ma vie, 1855 (lit : that mother so tender and so loved) On éprouve aujourd'hui encore, comme autrefois, une grande douceur intérieure à voir ces lieux si bénis, et maintenant si abandonnés. Mgr Dupanloup, Journal intime, 1876 (lit : these places so blessed and now so abandoned) This Conscila Study day devoted to the study of grammar and stylistics of discourse genre, aims to bring together researchers in linguistics or NLP whose work focuses on the identification of lexico- grammatical textual features. Papers submitted must take into account the constraints of comprehensiveness : we will not focus on one type of form, but on a maximum of genre-specific elements. The following issues will be discussed: - Techniques for the identification of generic properties ; - The complementarity or competitivity between paradigmatic or syntagmatic approaches; - Data interpretation. Proposals should therefore focus on the characterization of discourse genre (literary or otherwise) or style, in a comprehensive perspective ; methods can be discussed, without neglecting linguistic description. Also of interest is the comparison between authors, the focus on registers, discourse practices, and textual units (narrative, argumentative, descriptive, etc.). Studies may include any language, and both oral and written genres are welcome. We also welcome a variety of perspectives, including: computing, didactics, stylistics, discourse study, syntax... Communications may be presented in French or in English. **Organization** Thierry Charnois (University of Paris 13, LIPN) Sascha Diwersy (Universität zu Köln) Meri Larjavaara (Åbo Akademi) Dominique Legallois (University of Caen, Crisco) **Submission Deadline** : 1- An intention to submit a paper will be sent by mid-September at dominique.legallois at unicaen.fr 2- A detailed proposal of at least 1 full page should then be submitted by 1 November 2014. Selected papers will be notified by 20 November 2014 . Ref : Biber D. (2006) University language: A corpus-based study of spoken and written registers. Amsterdam: John Benjamins Biber, D. & S. Conrad 2009: Register, genre and style. Cambridge: Cambridge University Press. Dorgeloh, H. & A. Wanner (eds) 2010: Syntactic variation and genre, Berlin/New York: De Gruyter Mouton. Larjavaara M et Legallois D. (en prép.) « Les genres discursifs et leur grammaire » Longrée D. et Mellet S. (2013. « Le motif : une unité phraséologique englobante ? Étendre le champ de la phraséologie de la langue au discours », Langages 189 (D. Legallois & A. Tutin, coord.), p.68-80 Quiniou S., Cellier P., Charnois Th. et Legallois D. (2012)« What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics ? » in Lecture Notes in Computer Science, Springer Vol. 7181, pp 166-177 Martin, J. R. & Rose, D. (2008) : Genre relations. Mapping culture. London: Equinox. revue Linx n° 64-65 , « Les genres de discours vus par la grammaire », sous la direction de M. Krazem ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 20:51:45 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 22:51:45 +0200 Subject: Journee: Ateliers de formation au logiciel TXM (textom=?UTF-8?Q?=C3=A9trie=29=2C_?=dates pour septembre-octobre 2014 Message-ID: Date: Sat, 30 Aug 2014 14:34:09 +0200 From: Serge Heiden Message-ID: <5401C4C1.4040600 at ens-lyon.fr> X-url: http://textometrie.ens-lyon.fr X-url: https://docs.google.com/forms/d/1kZtxgKzVIPkDdjUV1k3DOUMdLk-V71A36dQc-ksL9EQ/viewform X-url: https://groupes.renater.fr/wiki/txm-users/public/ateliers_txm Bonjour, Le logiciel open-source de textométrie TXM permet l'analyse documentaire (qualitative) et statistique (quantitative) de données textuelles (dont l'oral transcrit), pour des corpus de recherche personnels ou pour la mise en ligne de corpus : http://textometrie.ens-lyon.fr Les prochains ateliers de formation au logiciel TXM auront lieu à Lyon, à l'ENS site Descartes, les journées suivantes (9h/9h30-17h30/18h30) : - jeudi 25 septembre : Initiation à TXM ; - vendredi 26 septembre : Préparation de corpus et import dans TXM. Un atelier "TXM avancé" pourra également être organisé si nous pouvons réunir un petit groupe d'utilisateurs expérimentés (faisant déjà des analyses avec TXM sur leurs données). Si vous êtes intéressé(e) par l'une de ces séances, il faut vous inscrire en remplissant le formulaire en ligne : https://docs.google.com/forms/d/1kZtxgKzVIPkDdjUV1k3DOUMdLk-V71A36dQc-ksL9EQ/viewform (l'inscription est nécessaire même si vous aviez répondu à la consultation doodle.) Toute l'information sur les ateliers : https://groupes.renater.fr/wiki/txm-users/public/ateliers_txm Au plaisir de vous retrouver peut-être à l'une de ces journées, Serge Heiden, pour l'équipe TXM. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:02:23 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:02:23 +0200 Subject: Appel: Lidil 53, Phraseologie et genres de discours Message-ID: Date: Mon, 1 Sep 2014 08:30:45 +0200 From: Agnès Tutin Message-ID: <000001cfc5ae$4393e120$cabba360$@u-grenoble3.fr> X-url: http://lidil.revues.org/ Appel à contributions – Lidil – No 53 – juin 2016 Site de Lidil : http://lidil.revues.org/ Phraséologie et genres de discours : patrons, motifs, routines (English version below) Numéro coordonné par Frédérique Sitri (Modyco, Université Paris Ouest) et Agnès Tutin (LIDILEM, Université de Grenoble-Alpes) Dans ce numéro de Lidil, nous souhaitons aborder les points de rencontre entre phraséologie et genres de discours, en nous intéressant particulièrement aux « routines » observables dans les genres institués (au sens de Maingueneau 2004). Le thème abordé se situe dans la continuité du symposium « Phraséologie et routines dans différents genres de l’écrit », organisé lors du congrès Wrab (Nanterre, février 2014). Comme le rappellent Legallois et Tutin (2013), la phraséologie envisagée dans une perspective « étendue », intégrant les outils statistiques développées dans le domaine de la linguistique de corpus, de la textométrie et du Traitement Automatique des Langues, est amenée à prendre en compte des séquences (des unités) moins figées et d’un empan textuel plus large que celles habituellement analysées dans un cadre lexical. Cette perspective étendue rencontre les travaux portant sur des genres institués, comme les genres académiques et scientifiques (Swales 1990, Biber 2006, Poudat 2006, Rinck 2006, Boch et al. 2007, Tutin et Grossmann 2014) ou les genres professionnels (Née et al. 2014), travaux qui font apparaitre des patrons lexico-syntaxiques (plus ou moins) facilement mis en évidence par des calculs de fréquence et de spécificités (concordanciers, segments répétés, n-grammes, cooccurrences, colligations et cadres collostructionnels, etc.) et se proposent de les mettre en relation avec des spécificités propres au genre : on parlera de fonctions rhétorico-argumentatives, de fonctions pragmatiques, de fonctions textuelles ou encore de déterminations discursives et interdiscursives, selon le cadre théorique et la vision du genre que l’on adopte (vision bakhtinienne du genre ou approche plus inductive à la façon de Biber par exemple). Dans une perspective d’analyse de discours, on est attentif aux phénomènes de répétition et de redondance car ils constituent un mode d’accès à des éléments préconstruits, « déjà-là », que l’on peut mettre en relation avec plusieurs niveaux de détermination du discours. Ainsi, les travaux menés au sein du Laboratoire de Saint-Cloud sur les résolutions de congrès syndicaux mettent-ils en évidence, à partir des inventaires de segments répétés et des concordances, plusieurs niveaux de figement : figements en langue mais aussi figements propres au genre, et figements propres au domaine (ou secteur d’activité pour rependre le terme de Bakhtine), comme le discours syndical, le discours de la CGT par exemple (voir Fiala et al. 1987 par exemple). On pourra également citer les travaux de S. Branca sur les écrits des peu-lettrés (lettres de soldats de la guerre 14-18 par exemple). Ces travaux mettent en évidence l’existence de patrons (appelés « formulaires ») qui en plus de fonctions textuelles, pragmatiques et identitaires, permettent la mise en place de « routines », de « prêts-à-écrire » facilitant l’entrée dans l’écriture des peu-lettrés. On pourrait rapprocher ces caractéristiques des « routines » repérées dans les écrits professionnels (Pène 1994). Du point de vue de la modélisation linguistique, la description de l’association de séquences phraséologiques avec des fonctions ou des déterminations génériques est extrêmement foisonnante et diverse : elle a pu être décrite à la fois avec des définitions issues de la lexicométrie en termes de « segments répétés » dans la tradition du discours politique (Salem 1987), les « n-grammes » du traitement automatique des langues (Granger & Paquot 2008), les « blocs lexicaux » (« lexical bundles » de Biber, par ex. 2006), mais aussi dans une perspective discursive à l’aide de « motifs » (Longrée et Mellet 2013) , « motifs séquentiels » (Quiniou et al. 2012) ou « routines discursives » (Née et al. 2014). Il nous apparait opportun de revenir aujourd’hui sur ces objets phraséologiques dont les définitions restent encore parfois sommaires afin d’en préciser les contours et les caractéristiques sémantiques, syntaxiques et énonciatives si l’on souhaite se les approprier dans la description linguistique, en particulier dans une perspective d’analyse du discours. Les aspects méthodologiques associés à cette problématique (méthodes d’extraction, outils d’exploration de corpus) sont également de première importance dans la mesure où les routines extraites sont souvent déterminées par des méthodes quantitatives et des outils de traitement de corpus, dans une démarche de linguistique outillée. Si ces méthodes sont largement utilisées dans les travaux linguistiques de langue anglaise, elles restent encore à promouvoir dans les études sur l’analyse de discours et la phraséologie en français. Ce numéro de Lidil se fixe donc pour objectif de préciser les liens entre les routines phraséologiques et les genres institués en proposant de réfléchir : a) à la catégorisation de ces objets phraséologiques (définition, structure, modélisation) et aux méthodes élaborées pour les mettre en évidence dans les corpus, par exemple aux outils d’exploration de TAL et aux modèles descriptifs. b) aux liens entre routines et genres textuels, y compris les genres institués de l’oral : on pourra s’interroger en particulier sur les différentes fonctions associées à ces routines. En effet, si certaines routines apparaissent constitutives de genres textuels spécifiques il apparait nécessaire d’observer plus en finesse leurs fonctions, en particulier dans l’argumentation. Dans une perspective d’analyse de discours, si l’on considère les séquences phraséologiques comme des « préconstruits », on pourra également s’interroger sur leur niveau de cristallisation : les routines observées sont-elles propres à un genre, à plusieurs genres, à une sphère d’activité, à une formation discursive, etc. ? c) aux liens entre routines discursives et textuelles et processus d’écriture. Dans quelle mesure les scripteurs ont-ils conscience et exploitent-ils ces séquences préfabriquées ? Dans quelle mesure les routines facilitent-elles ou au contraire, contraignent-elles l’écriture ? d) au rôle de ces routines dans la créativité langagière des scripteurs. Les routines correspondent-elles essentiellement à des contenus désémantisés, acquis par acculturation au genre, ou permettent-elles une part de créativité ? Bibliographie Bakhtine M., 1979 [1984 pour la traduction]. Les genres du discours. in Esthétique de la création verbale, Paris, Gallimard. Biber, Douglas. (2006). University Language : a corpus-based study of spoken and written registers. Amsterdam/Philadelphia: John Benjamins. Boch, Françoise, Grossmann, Francis & Rinck, Fanny. (2007). Conformément à nos attentes…’, ou l’étude des marqueurs de convergence/divergence dans l’article de linguistique. Revue Française de Linguistique Appliquée, XII(2), p. 109-122. Branca-Rosoff, Sonia (1997). Modèles de locutionnarité et effets de figement dans le discours politique de l'an II. In: Fiala, P., Lafon, P., Piguet, M.-F. (éds.), p. 285- 293. Branca-Rosoff, Sonia & Schneider, Nathalie (1994). L'écriture des citoyens: une analyse linguistique de l'écriture des peu-lettrés pendant la période révolutionnaire (Vol. 13). ENS Editions. Fiala, Pierre, Habert, Benoît, Lafon, Pierre & Pineira, Carmen (1987). Des mots aux syntagmes, figements et variations dans la Résolution générale du congrès de la CGT de 1978. Mots, 14, p. 45-87. Granger, Sylviane & Paquot, Magali (2008). Disentangling the phraseological web. In: Granger, S., Phraseology: An Interdisciplinary Perspective, Benjamins: Amsterdam and Philadelphia, p. 27-49. Legallois, Dominique & Tutin, Agnès (2013). Présentation : Vers une extension du domaine de la phraséologie. Langages, 189, p. 3-25. Longrée, Dominique & Mellet, Sylvie (2013). Le motif: une unité phraséologique englobante? Étendre le champ de la phraséologie de la langue au discours. Langages, 189, p. 65-79. Maingueneau, Dominique (2004). Retour sur une catégorie : le genre, dans J.-M. Adam, J.-B. Grize et Magid Ali Bouacha, Texte et discours : catégories pour l’analyse, Editions Universitaires de Dijon, p.107-118. Née Emilie, Sitri Frédérique & Veniard Marie (2014). Pour une approche des routines discursives dans les écrits professionnels. Congrès du CMLF, 19-23 juillet 2014, Berlin. Pène Sophie (1994). Analyse de postes, bilan d’entretiens, écritures de procédures. Un « prêt-à-écrire » pour inscrire l’activité. Éducation permanente. 120, p. 39-57. Poudat, Céline (2006). Etude contrastive de l'article scientifique dans une perspective d'analyse des genres. Thèse de doctorat, Université d’Orléans. Quiniou, Solen, Cellier, Peggy, Charnois, Thierry & Legallois, Dominique (2012). Fouille de données pour la stylistique: cas des motifs séquentiels émergents. Actes des Journées Internationales d'Analyse Statistique des Données Textuelles, p. 821-833. Rinck, Fanny (2006). L’article de recherche en Sciences du Langage et en Lettres, Figure de l’auteur et approche disciplinaire du genre. Thèse de doctorat en Sciences du Langage, sous la direction de F. Boch et F. Grossmann, Université de Grenoble. Salem, André (1987). Pratique des segments répétés. Paris : Klincksieck. Swales, John M. (1990). Genre Analysis: English in academic and research settings. Cambridge: Cambridge University Press. Tutin, Agnès & Grossmann, Francis (eds.) (2014). L'écrit scientifique : du lexique au discours. Autour de Scientext. Rennes : Presse universitaire de Rennes. Calendrier pour l’envoi des propositions - Soumission d’une proposition d’article de 4 pages (à fsitri at u-paris10.fr et agnes.tutin at u-grenoble3.fr) : 10 décembre 2014. - Notification d’acceptation de la proposition : 15 janvier 2015 - Envoi des articles rédigés : 1er juin 2015 - Notification d’acceptation : 1er octobre 2015 - Envoi des textes révisés : février 2016 - Publication juin 2016 ------------------------------------------------------------------------ Phraseology and discourse genres: patterns, "motifs”, routine fomulae Guest editors: Frédérique Sitri (MoDyCo, University Paris Ouest) and Agnès Tutin (LIDILEM, University of Grenoble-Alpes) In this issue of LIDIL, we wish to address the intersections between phraseology and discourse genres by focusing on routine formulae found in instituted genres (genres institués as defined by Maingueneau, 2004). This theme is a continuation of the symposium "Phraseology and routines in different written genres", held during the Wrab congress (Nanterre, February 2014). As Legallois and Tutin (2013) have reiterated, an extended perspective of phraseology, including statistical methods of corpus linguistics, natural language processing and textometry, will necessarily treat less fixed sequences (units) and a wider textual span than usually analyzed within a lexical framework. This extended perspective confronts studies on instituted genres, such as academic or scientific texts (Swales 1990, Biber 2006, Poudat 2006, Rinck 2006, Boch et al. 2007, Tutin and Grossmann 2014) or professional genres (Née et al. 2014) which reveal lexico-syntactic patterns, which are (more or less) easily identified through frequency and specificity statistics (concordancers, repeated sequences, n-grams, co-occurrences, colligations, collostructional frames, etc.). These patterns can then be associated with genre-specific functions: rhetorical-argumentative, pragmatic, textual or discursive functions, but also interdiscursive factors, depending upon the adopted theoretical framework (for example, the Bakhtinian vision of genre or Biber’s more inductive approach). From a perspective of discourse analysis, attention to repetition and redundancy provide a means of access to pre-fabricated "already there" components, which can be related to different levels of determination within the discourse. Thus, the St. Cloud Laboratory research, based on n-grams and concordances, has drawn from the resolutions of trade union congresses to reveal several levels of fixed sequences: fixed expressions, but also linguistic features of domain- or genre-specific fixed expressions (or sphere of activity to employ Bakhtin’s term) of, for example, trade union discourse, such as that of the CGT (see Fiala et al. 1987). Also notable is S. Branca’s study on writing by limited-proficiency populations (letters of soldiers from WWI for example). These studies demonstrate the existence of patterns (called "formulas" or formulaires) which, in addition to textual, pragmatic and identity functions, foster the establishment of "routines" and "ready-to-write" formulae, allowing low- or limited-literate individuals to access writing. These features can be compared to routines identified in professional literature (Pène 1994). From the perspective of language modeling, the descriptions of associations of phraseological sequences with linguistic and discursive functions has been widely discussed: calling upon both lexicometry-based definitions in terms of "repeated segments" in the tradition of political discourse (Salem 1987), "n-grams" of natural language processing (Granger & Paquot 2008), "lexical bundles" (Biber 2006) and also in a discursive perspective examined through the lens of "motifs" (Longrée and Mellet 2013), "sequential patterns" (Quiniou et al. 2012) or "discursive routines" (Née et al. 2014). It now appears appropriate to reconsider these phraseological objects, whose definitions may have remained superficial, in order to clarify their boundaries and their semantic, syntactic and enunciative features, especially in a perspective of discourse analysis. Methodological issues associated with this topic (extraction methods or corpus exploration tools) are also crucial as the extracted routines are often determined by quantitative methods and corpus processing tools. While these methods are widely used in English-speaking linguistics, they still remain to be promoted in French-speaking discourse analysis and phraseological studies. This issue of LIDIL therefore aims at clarifying the relationships between linguistic routines and instituted genres by proposing to consider: a) the categorization of these phraseological objects (definition, structure, modeling) and methods developed to identify them in corpora, for example NLP tools or descriptive models. b) the links between routines and textual genres, including oral instituted genres: one might discuss the different functions associated with these routines. While some routines appear specific to given textual genres, it is crucial to closely observe their functions, especially in argumentative texts. To evaluate the degree to which prefabricated patterns are fixed, one might ask if observed routines are specific to a textual genre, to several genres, to a sphere of activity or to a discursive type, etc. c) the links between discursive and textual routines and writing process. To what extent are writers aware of and exploit these prefabricated sequences? To what extent do routines facilitate, or rather, hinder the writing process? d) the role of these routines in the creativity of the writing process. Are routines genre-specific prefabricated patterns nearly devoid of semantic content and acquired by genre acculturation or do they allow a degree of creativity? Schedule for submissions - Submission of abstract (4 pages pages to fsitri at u-paris10.fr and agnes.tutin at u-grenoble3.fr): 10 december 2014 - Notification of acceptance of abstract: 15 january 2014 - Submission of full article: 1 june 2015 - Notification of acceptance of full article: 1 october 2015 - Revisions due: 1 february 2016 - Publication: 1 june 2016 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:07:42 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:07:42 +0200 Subject: Job: CDD Ingenieur TAL, 18 mois, CEA LIST / LVIC, Palaiseau, Ile-de-France Message-ID: Date: Tue, 2 Sep 2014 09:13:19 +0000 From: SEMMAR Nasredine 202247 Message-ID: <50CC12289F0C854FBFF134F270030CD71ECF89DA at EXDAG0-B3.intra.cea.fr> Contexte : ------------ Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ingénierie des Contenus) travaille sur l'analyse de contenus multimédias (analyse de textes, images et vidéos, perception 3D). Dans le domaine de l'analyse de texte, le CEA LIST recherche un CDD ingénieur ou docteur pour travailler sur des techniques de classification et clustering de textes dans un cadre multilingue. Objectifs : ------------ A partir de document textuels provenant de plusieurs sources (par exemple des dépêches d'actualité), pouvant être de langues différentes, l'application visée a pour but de regrouper automatiquement les dépêches traitant des mêmes sujets. Ce regroupement sera dans un premier temps fondé sur des mesures standard de similarité textuelle (représentation vectorielle s'appuyant sur une analyse linguistique des textes), mais des mesures de similarités plus sémantiques, s'appuyant en particulier sur la notion de sémantique distributionnelle, seront également testées. Pour le clustering proprement dit, plusieurs algorithmes seront envisagés (clustering hiérarchique, Shared Nearest Neighbors, Markov Clustering...), mais les algorithmes développés devront être suffisamment robustes pour travailler à large échelle. La tâche du CDD consistera donc en particulier à : - étudier et tester les algorithmes de clustering de documents sur des corpus de différentes langues ; - travailler sur la mise au point d'un espace de représentation des documents commun pour des documents de langues différentes, fondé sur un alignement des lexiques bilingues pour construire des clusters mutlilingues ; - évaluer les différentes solutions sur des corpus de référence ; Profil recherché: -------------------- - Compétences en traitement automatique des langues / recherche d'information / mesures de similarité textuelle - Connaissances des techniques d'apprentissage et de clustering / classification (SVM, CRF, etc.) - Compétences informatiques: C/C++, scripts (perl, python...) Rémunération selon formation. Les candidatures (CV + Lettre de motivation) sont à envoyer le plus rapidement possible à : Olivier Ferret (olivier.ferret at cea.fr) Romaric Besançon (romaric.besancon at cea.fr) Nasredine Semmar (nasredine.semmar at cea.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:27:53 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:27:53 +0200 Subject: Ecole: Formation CLAN, 17-18 Novembre 2014, Poitiers Message-ID: Date: Tue, 2 Sep 2014 18:40:44 +0200 From: FR2559 secretariat-general Message-ID: <5405F30C.1020406 at cnrs.fr> X-url: http://childes.psy.cmu.edu/clan/ X-url: http://childes.psy.cmu.edu/morgrams/ /*DATE LIMITE D'INSCRIPTION AU 15 SEPTEMBRE 2014* / /Bonjour, Le groupe "Multimodalité et modalité gestuo-visuelle" du consortium "Corpus oraux et multimodaux" (IRCOM) propose une formation sur la "NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC CLAN " pendant deux journées les 17 et 18 NOVEMBRE 2014 à Poitiers. Le nombre de participants étant limité pour cet atelier, nous demandons aux personnes intéressées de bien vouloir faire parvenir à Stéhanie Gobet (stephanie.gobet.jacob at univ-poitiers.fr ) un bref CV, une lettre indiquant les intérêts et motivations du candidat pour participer à l’atelier, ainsi que la fiche de pré-inscription dûment complétée avant le 15 septembre 2014. Les candidatures seront examinées par un comité ad hoc du Conseil Scientifique ‘Multimodalité’. Le comité d'organisation Claudia S. Bianchini, PhD MCF Licence SDL-LSF, Univ. Poitiers claudia.savina.bianchini at univ-poitiers.fr Université de Poitiers - UFR Lettres et Langues (Bât. A3) 1 rue Raymond CANTEL - TSA 11102 86073 POITIERS CEDEX 9 ************************************************************************ NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC CLAN** **ATELIER DE FORMATION 17 et 18 NOVEMBRE 2014** **MSHS Bât A5, 5 rue Théodore Lefebvre 86 000 POITIERS* _OBJECTIF_ Le consortium « Corpus oraux et multimodaux » (IRCOM) coordonné par la fédération Typologie et Universaux Linguistiques sous l’égide de la très grande infrastructure de recherche HUMA-NUM a vocation à fédérer les équipes, laboratoires, chercheurs et enseignants-chercheurs engagés dans la constitution et le traitement de corpus oraux et multimodaux, afin de faire converger les pratiques. A cette fin, l’IRCOM propose un certain nombre de formations dans différents domaines liés à l’utilisation de corpus en linguistique. L’un de ces domaines concerne la transcription et l'analyse de corpus multimodaux avec CLAN. Une formation se déroulera les lundi 17 et mardi 18 novembre 2014 à Poitiers. _COMITE D’ORGANISATION ET FORMATEURS_ L’atelier « Transcription et analyse de corpus multimodaux avec le programme CLAN » est organisé par le conseil scientifique du groupe ‘Multimodalité’ de l’IRCOM. Trois formatrices interviendront dans cet atelier : - Stéphanie Caët (Sorbonne Nouvelle – Paris 3) - Annie-Claude Demagny (Structures Formelles du Langage) - Efstathia Soroli (Université Lille 3) _DEROULEMENT DE L’ATELIER_ L’atelier « Transcription et analyse de corpus multimodaux avec le programme CLAN » se déroulera sur 2 jours. Le nombre de participants est limité à 30 au total. Il est demandé aux participants d’apporter leur ordinateur portable et d’avoir téléchargé les programmes requis (voir note). La première journée sera consacrée à la théorie et à la pratique de la transcription. Les corpus seront fournis par l’IRCOM, mais les participants peuvent également apporter leurs propres enregistrements audio ou vidéo (format requis, voir note). La deuxième journée sera consacrée à l’exploitation de transcriptions (fournies par l’IRCOM) à l’aide des commandes de CLAN ainsi qu’à leur exportation vers d’autres programmes, comme le programme ELAN pour lequel une autre formation est organisée les 19 et 20 novembre 2014. _INSCRIPTION ET PRISE EN CHARGE DES FRAIS_ Le nombre de participants étant limité pour cet atelier, nous demandons aux personnes intéressées de bien vouloir faire parvenir à Stéphanie Gobet (stephanie.gobet.jacob at univ-poitiers.fr) un bref CV, une lettre indiquant les intérêts et motivations du candidat pour participer à l’atelier, ainsi que la fiche de pré-inscription dûment complétée avant le 15 avril 2014. Les candidatures seront examinées par un comité ad hoc du Conseil Scientifique ‘Multimodalité’. L’IRCOM prendra en charge les repas de midi et les pauses café qui seront pris sur place. Programme préliminaire de l’atelier : J.1 (lundi 17 novembre 2014) : Transcrire avec CLAN - Matinée – Première étape de la transcription avec CLAN : insérer des balises temporelles associées au média (audio ou vidéo) à transcrire. Implications théoriques et mise en pratique. - Après-midi – Transcription des données. Implications théoriques et mise en pratique. J.2 (mardi 18 novembre 2014) : Les commandes de CLAN - Matinée – Présentation des commandes les plus fréquemment utilisées pour l’analyse de données transcrites (FREQ, COMBO, MOR, MLU), export vers Excel, et mise en pratique. - Après-midi – Export de données transcrites sous CLAN vers d’autres programmes (Excel, ELAN et PRAAT) pour approfondir les analyses. _*Avant d’assister à la formation,*_ il est nécessaire d’avoir téléchargé et installé : - le programme CLAN à cette adresse : http://childes.psy.cmu.edu/clan/ - pour Windows (2000/XP/Vista/7) : cliquez sur « CLANWin » - pour Mac (OS X 10.4 minimum) : cliquez sur « CLAN » - d’autres types d’installation (anciennes versions pour PC, versions zippées pour Mac) sont disponibles sur cette page au cas où les installateurs usuels ne fonctionnent pas ; - la grammaire de la langue étudiée : http://childes.psy.cmu.edu/morgrams/ - le logiciel Quicktime : http://www.apple.com/quicktime/ Si les participants apportent leurs propres données audio, celles-ci doivent être au format .wav ou .mp3 ; s’ils apportent leurs propres données vidéo, celles-ci doivent être au format .mov. *FICHE DE PRE-INSCRIPTION* ____________________________ NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC CLAN ATELIER DE FORMATION 17 et 18 NOVEMBRE 2014 MSHS Bât A5, 5 rue Théodore Lefebvre 86 000 POITIERS L’inscription sera validée après l’examen du dossier de candidature composé : 1) d’un bref CV ; 2) d’une lettre où le candidat expose ses intérêts et motivations à participer à l’atelier ; 3) du formulaire ci-dessous à compléter. Nom, prénom : Adresse personnelle : E-Mail : Téléphone : Statut : □ Doctorant □ Chercheur / ITA □ Post-doctorant □ Enseignant-Chercheur □ Autre (précisez) : Organisme : A renvoyer avant le 15 septembre 2014 à _stephanie.gobet.jacob at univ-poitiers.fr_ /Veuillez nous excuser pour les doublons.../ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:11:20 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:11:20 +0200 Subject: Appel: Journee d'etude ATALA, Ethique et TAL Message-ID: Date: Tue, 2 Sep 2014 15:43:27 +0200 (CEST) From: Karen Fort Message-ID: <1792169344.22120425.1409665407575.JavaMail.zimbra at loria.fr> X-url: http://www.schplaf.org/kf/JE_ATALA.html Bonjour à tous, Le TAL est une discipline au cœur de l'éthique scientifique, à la fois en tant qu'elle fournit des outils pour assurer l'utilisation éthique des données mais également par son long historique de travaux sur des sources sensibles, ou la nécessaire implication de nombreux collaborateurs pour la création de ressources langagières volumineuses. Concernant les outils, l'anonymisation des données, qu'elles soient orales ou écrites, est un enjeu tant industriel qu'académique, avec des contraintes de couverture parfois fortes selon les besoins applicatifs ou de recherche, la nature des ressources et des informations à anonymiser ou encore les limitations légales. D'autres outils du TAL s'inscrivent également dans des préoccupations éthiques, comme les outils de détection de plagiat ou de vérification de faits. La diversification des travaux sur corpus a par ailleurs amené la communauté à traiter des sources de plus de plus sensibles, qu'il s'agisse de données personnelles, médicales, voire à caractère criminel. En outre, l'avènement du Web 2.0. et avec lui le développement de la myriadisation (crowdsourcing), pose de nouvelles questions quant à la manière de considérer les intervenants dans la création de ressources langagières. Enfin, les préoccupations concernant l'utilisation des outils de TAL ne sont pas nouvelles, mais elles deviennent de plus en plus sensibles à l'heure des Big Data et du recoupement des données auquel participe le TAL. Aux questions juridico-économiques (fouille de brevets, droits associés aux données/logiciels), s'ajoutent les enjeux militaires (surveillance des échanges) et sociaux (le « droit à l’oubli » imposé à Google). Cette journée d'étude se veut un lieu d'échange ouvert sur ces sujets. Cet appel à communications s'adresse donc aux chercheur(e)s en traitement automatique des langues ou en linguistique, aux industriel(le)s ayant à utiliser des ressources langagières et aux expert(e)s dans les questions éthiques. Thèmes de la journée La journée commencera par une conférence invitée. Les communications sollicitées concernent aussi bien des travaux de recherche que des expériences industrielles, notamment dans les domaines suivants : * outils éthiques pour le TAL, ou reposant sur des techniques du TAL * méthodes et bonnes pratiques éthiques en TAL * TAL et aspects juridiques * traitement des données sensibles * recherche en TAL et principes éthiques * myriadisation et éthique Modalités de soumission Les propositions seront à envoyer à Karën Fort (karen.fort at paris-sorbonne.fr - merci de préciser [JE ATALA] dans le début du titre) - au plus tard le 15 septembre 2014. Elles devront être rédigées en français pour les francophones, et pourront être rédigées en anglais pour les non-francophones. Les résumés seront publiés après la journée sur le site de l'ATALA. Format de la soumission : résumé de 2 pages (format type LREC, disponible sur le site de la journée : http://www.schplaf.org/kf/JE_ATALA.html ) Comité scientifique * Olivier Baude, LLL, Université d’Orléans * Kevin B. Cohen, Biomedical Text Mining Group, University of Colorado School of Medicine * Alain Couillault, L3i, Université de La Rochelle / Aproged * Cécile Fabre, CLLE-ERSS, Université de Toulouse II * Cédrick Fairon, CENTAL, Université catholique de Louvain * Karën Fort, STIH, Université Paris-Sorbonne * Cyril Grouin, LIMSI CNRS * Joseph Mariani, IMMI / LIMSI CNRS * Adeline Nazarenko, LIPN, Université Paris-Nord * Benoît Sagot, Alpage, INRIA / Paris 7 * Isabelle Tellier, Université Sorbonne Nouvelle Informations pratiques Organisation : Karën Fort (STIH, Université Paris-sorbonne), Benoît Sagot (Alpage, INRIA/Paris 7) Contact : karen.fort at paris-sorbonne.fr Date : samedi 22 novembre Lieu : Sorbonne (à préciser) Dates importantes * Date de la journée : 22 novembre 2014 * Date limite de soumission : 15 septembre 2014 * Date de notification aux auteurs : 15 octobre 2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 20:28:31 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 22:28:31 +0200 Subject: Appel: Deadline extended-CFP WeCA 2014 (IEEE SITIS2014), Track on Web Computing and Applications, Marrakech, Morocco 23-27 November, 2014 Message-ID: Date: Sat, 6 Sep 2014 13:26:04 +0100 From: "Rim FAIZ" Message-ID: <005e01cfc9cd$ba154af0$2e3fe0d0$@Faiz at ihec.rnu.tn> X-url: http://www.sitis-conf.org/ Apologies for multiple diffusion CALL FOR PAPERS New submission deadline : September 22, 2014 ====================================================================== TRACK ON WEB COMPUTING AND APPLICATIONS (WeCA) The 10th International Conference on SIGNAL IMAGE TECHNOLOGY & INTERNET-BASED SYSTEMS (SITIS'14) November 23 - 27, 2014 In cooperation with ACM SIGAPP French Chapter (pending ...) and IEEE Technical Committee on Multimedia Computing (pending ...) Hotel Semiramis, Marrakech, Morocco http://www.sitis-conf.org/ ====================================================================== The focus of the track titled "Web Computing and Applications (WeCA)" is on emerging and novel concepts, architectures, technologies, and methodologies for information management related to the Web and cloud computing. In essence, the Web, with its different versions, has created an interconnected world in which information can be exchanged easily, tasks can be processed collaboratively, communities of users with similarly interests can beformed to achieve efficiency and improve performance, etc. Taking full advantage of these interconnected environments to meet the ever increasing needs of emerging applications requires solutions that address new issues and challenges. The track calls for research papers and reports related, but not limited, to the following topics: Data semantics Ontologies Conceptual Data Modeling Knowledge Representation and Reasoning Metadata Evolution and Change Semantic Caching Data Warehousing and Semantic Semantics in Data Visualization Semantic Services for Mobile Users Applications of Semantic-Driven Approaches Web-Centric Systems Semantic Web Social media and networking Web Services and Service Computing Hypermedia and Adaptation E-Commerce, E-government, and E-Learning Web/Data Mining Machine Learning Crowdsourcing Big Data Foundations and computation Infrastructure and platforms Management Data preservation and provenance Search and Mining Computational Modeling and Data Integration Link and Graph Mining Mobility Multimedia and Multi-structured Data Big Data and Social Media Applications Information System Interoperability Digital Libraries Semantic Interoperability and Semantic Mediators Ontologies Based Systems Contextual Reasoning in Distributed Ontologies Cloud Architectures and platforms Mobile Clouds Storage, Data, and Analytics Clouds Migration, Management, and Quality Composition, Federation, and Integration Resource Virtualization and Composition High Performance Cloud Computing Programming Models and Paradigms Green Computing Innovative Applications and Experiences Computing Consulting Cooperative information and Distributed Systems Information Sharing Grid/cloud Applications Peer To Peer Computing and Applications Knowledge and Semantic Grid Semantics of Peer Data Management Systems Mobile Information Systems and Computing Multimedia and application Image and Video Databases Image and Video Indexing and Retrieval Emergent Semantics in Content Retrieval Systems Semantics and Meta Data in Multimedia Systems Content-Based Indexing, Search, and Retrieval Multimedia Data Modeling and Visualization Tools, Benchmarks, Evaluation Protocols and Standard Information security Security Modeling and Access Control Protocol Intrusion Avoidance, Detection, and Response Web Security and Supporting Systems Security Denial of Service: Attacks and Countermeasures Intellectual Property Protection Fundamental Services on Network and Distributed Systems Security and Privacy for Emerging Technologies Trust based systems Submission and publication The conference will include keynote addresses, tutorials, and regular and workshop sessions. SITIS’14 invites submission of high quality and original papers on the topics listed above. All submitted papers will be peer-reviewed by at least two reviewers for technical merit, originality, significance and relevance to track topics. Papers must be up to 8 pages and follow IEEE double columns publication format. Paper submission will only be online via: SITIS 2014 submission site. The online system will be used to handle and process all papers and to prepare for the final proceedings. https://www.easychair.org/conferences/?conf=sitis2014 Accepted papers will be included in the conference proceedings and published by IEEE Computer Society and referenced in IEEE explore and major indexes Important dates - Paper Submission: September 6, 2014 à September 22, 2014 - Acceptance/Reject notification: October 6, 2014 à October 10, 2014 - Camera ready: October 15, 2014 - Author registration: October 19, 2014 Track Chairs Rim Faiz, IHEC, University of Carthage, Tunisia Gayo Diallo, ISPED, University of Bordeaux, France Peter Eklund, University of Wollongong, Australia Local Organizing Committee Abdelaziz El Fazziki, Cadi Ayyad University, Marrakesh, Morocco (Chair) Mohammed Sadgal, Cadi Ayyad University, Marrakesh, Morocco El Hassan Abdelwahed, Cadi Ayyad University, Marrakesh, Morocco Mehdi Najib, Cadi Ayyad University, Marrakesh, Morocco ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 20:00:09 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 22:00:09 +0200 Subject: Job: Ingenieur ou Post-doc de 6 mois, Annotation semantique d=?UTF-8?Q?=E2=80=99information_?=textuelle en biologie vegetale, INRA, Jouy-en-Josas Message-ID: Date: Fri, 05 Sep 2014 11:32:28 +0200 From: Claire Nedellec Message-ID: <5409832C.9020101 at jouy.inra.fr> =================================== Post-doc ou ingénieur, 6 mois en annotation sémantique de textes ====================================== L’équipe Bibliome de l’unité MIG (INRA) recherche un post-doctorant (niveau thèse) ou ingénieur (niveau Master) à temps plein pour une durée de 5 à 6 mois sur l’annotation manuelle et automatique d’articles scientifiques de biologie guidée par un modèle de connaissance dans le cadre du projet DataChallenge conjoint MIG et LIMSI (CNRS). Il est financé par le Center for Data Science (Idex Paris-Saclay). La personne engagée coordonnera la finalisation de l’annotation manuelle d’articles de biologie moléculaire par des experts biologistes en vue de la préparation d'une tâche pour un challenge d’extraction automatique d’information à partir de textes. Le domaine concerné est le développement de la graine chez l'arabette (Arabidopsis thaliana). Le modèle de connaissances qui est utilisé pour l'annotation devra être comparé à d'autres modèles proposés pour d’autres espèces (humain, procaryotes). Un modèle de représentation des connaissances unifié pourra être proposé pour la représentation des connaissances du texte qui soit approprié à son utilisation en Biologie des Systèmes. Compétences: extraction d’information, annotation manuelle de texte, ingénierie de la connaissance, biologie moléculaire. Candidature : envoi du CV et de publications par email. Contact : Claire Nédellec (claire.nedellec at jouy.inra.fr) et Robert Bossy (robert.bossy at jouy.inra.fr) Lieu de travail : Unité MIG, centre de recherche INRA de Jouy-en-Josas. Date de début de contrat : dès que possible Rémunération : grille de salaire INRA Références: Bibliome : http://genome.jouy.inra.fr/bibliome/ CDS : http://www.campus-paris-saclay.fr/index.php/en/Idex-Paris-Saclay/Les-Lidex/Paris-Saclay-Center-for-Data-Science BioNLP-ST 2013 (tasks GE & GRN): https://sites.google.com/site/bionlpst2013/ ----------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:48:15 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:48:15 +0200 Subject: Ecole: Inscription, Ecole d'Automne en Recherche d=?UTF-8?Q?=E2=80=99Information_?=Et Applications, 15-17 Octobre 2014, Domaine de Parmenie Message-ID: Date: Wed, 03 Sep 2014 16:02:50 +0200 From: Philippe Mulhem Message-ID: <54071F8A.0 at imag.fr> X-url: http://www.asso-aria.org/earia2014 ********************************************************************** Deuxième appel à inscription à l'Ecole d'Automne en Recherche d’Information Et Applications. 15-17 Octobre 2014 Domaine de Parménie – Région Grenobloise ********************************************************************** Nous avons le plaisir de vous annoncer la tenue de l'Ecole d'Automne en Recherche d’Information Et Applications, qui se tiendra à Izeaux, à 30 kilomètres au nord-est de Grenoble. EARIA (École d'Automne en Recherche d'Information et Application) a pour objectif principal la formation des doctorants dans le domaine de la Recherche d'Information (RI). Elle est organisée en 2014 par l'équipe Modélisation et Recherche d'Information Multimédia (MRIM) du Laboratoire d'Informatique de Grenoble (LIG) avec le support de l'Association Francophone de Recherche d'Information et Applications (ARIA http://www.asso-aria.org). L'ARIA est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d'Information. Cette école permet d'échanger et de faire le point sur les dernières avancées scientifiques et technologies liées à l'indexation automatique et à la recherche des textes multilingues, des images, des vidéos, permettant de construire des Systèmes de Recherche d'Information Multimédia. Ces systèmes sont au cœur des futurs moteurs de recherche du WEB. Les cours sont organisés sur 4 demi-journées (du mercredi 15 octobre 2014 midi au vendredi 17 octobre midi) et offrent un cadre d'échange convivial tant autour des fondements que des thèmes novateurs dans le domaine de la RI, abordés par des chercheurs français et européens faisant autorité dans le domaine. EARIA a vocation à se tenir tous les deux ans et offre une occasion privilégiée de rencontres et de discussions entre séniors du domaine et jeunes chercheurs, permettant ainsi à ces derniers de mieux situer leur projet de recherche. Les domaines couverts par les cours de cette école d'automne sont présentés en 8 sessions, et couvrent aussi bien des éléments généraux du domaine (comme une introduction, des éléments de modélisation théoriques, des aspects logiciels, des éléments expérimentaux), et des aspects plus spécialisés. Parmi les thèmes traités par cette école nous avons : - L'introduction à la Recherche d'Information – les bases communes (M. Boughanem, E. Gaussier) - Le Traitement Automatique des Langues Naturelles et l'Extraction d'Information pour la Recherche d'Information (I. Tellier); - La Recherche d'Information multimédia (G. Quénot, G. Linares); - La Recherche d'Information sociale (J. Kamps); - La Recherche d'Informations sémantique (J.-P. Chevallet); - Les systèmes et les évaluations pour la Recherche d'Information (M. Beigbeger, B. Grau). Le comité scientifique présidé par Patrice Bellot, est composé de Catherine Berrut, Sylvie Calabretto, Michel Beigbeder, Jean-Pierre Chevallet, Éric Gaussier, Mohand Boughanem. Toutes les informations, avec le formulaire d'inscription, sont accessibles : http://www.asso-aria.org/earia2014 En vous souhaitant nombreux pour participer à cet événement fondamental pour la communauté Recherche d'Information en France. Philippe Mulhem, Président du comité d'organisation d'EARIA 2014. ********************************************************************** ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:31:21 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:31:21 +0200 Subject: Appel: CLEF 2015, Call for Labs proposals, 10 September 2014 Message-ID: Date: Wed, 03 Sep 2014 01:09:49 +0200 From: Eric SanJuan Message-ID: <54064E3D.3020906 at univ-avignon.fr> X-url: http://clef2015.clef-initiative.eu/ We apologize for cross-postings. ********************************************* CLEF 2015 - Call for Labs proposals ----------------------------------------- http://clef2015.clef-initiative.eu/ Toulouse, France, September 8 - 11, 2015 Important Dates --------------- * Final lab proposals: 10 September 2014 * Notification of lab acceptance: 19 September 2014 * 3 November 2014: Labs registration opens CLEF is a leading annual international conference exploring topics in information access technologies. The CLEF Conference uniquely combines evaluation laboratories and workshops with research presentations, panels, poster and demo sessions interleaved during three and a half days of intense and stimulating research activities. CLEF 2015 will be the sixth edition of the current CLEF conference launched as a continuation of the annual CLEF evaluation campaign series which ran with great success from 2000 to 2009 contributing to the systematic evaluation of information access systems, primarily through experimentation on shared tasks. CLEF 2015 will be held in September at the University of Toulouse, France. Researchers and practitioners from all areas of information access and related communities are invited to submit proposals for evaluation labs for consideration for inclusion in CLEF 2015. Lab proposals will be reviewed by the lab selection committee. Authors of selected proposals will be invited to include their lab in the CLEF 2015 lab programme, possibly subject to small suggested modifications to their proposal to better suit the CLEF lab workflow or timeline. About CLEF ---------- The CLEF Initiative (http://clef2015.clef-initiative.eu/) is a self-organized body whose main mission is to promote research, innovation, and development of information access systems with an emphasis on multilingual information in different modalities - including text and multimedia - with various levels of structure. CLEF promotes research and development by providing an infrastructure for: * independent evaluation of information access systems; * investigation of the use of unstructured, semi-structured, highly-structured, and semantically enriched data in information access; * creation of reusable test collections for benchmarking; * exploration of new evaluation methodologies and innovative ways of using experimental data; * discussion of results, comparison of approaches, exchange of ideas, and transfer of knowledge. Scope of CLEF Labs ------------------ Proposals are accepted for two different types of “labs”: * Evaluation Labs that are a “campaign-style” evaluation for specific information access problems (during the twelve month period preceding the conference), similar in nature to the traditional CLEF campaign “tracks” (see 2014 Labs at http://clef2014.clef-initiative.eu/). Topics covered by campaign-style labs can be inspired by any information access-related domain or task. * Labs that follow a more classical “workshop” pattern, exploring issues of evaluation methodology, metrics, processes etc. in information access and closely related fields, such as natural language processing, machine translation, and human-computer interaction. If the organisers of the proposal are new to CLEF or other shared task evaluation campaigns, we highly recommend that a lab workshop first be organised to discuss the format, the problem space, and the practicalities of the shared task. The CLEF 2015 programme will reserve about half of the conference schedule for lab sessions which will take place within the conference in Toulouse. The labs will present their overall results “overview presentations” during the plenary scientific paper sessions to allow non-participants to get a sense of where the research frontiers are moving. Organisers of each lab are expected to organise the separate sessions for their lab at the conference so that they contain ample time for general discussion and engagement by all participants - not just those presenting campaign results and papers. Organisers should plan time in their sessions for activities such as panels, demos, poster sessions etc. as appropriate. CLEF is always interested in receiving and facilitating innovate and creative lab proposals. Potential task proposers who are unsure of the suitability of their task proposal or its format for inclusion at CLEF are encouraged to contact the CLEF 2015 Lab Organizing Committee Chairs to discuss its suitability or design at an early stage. Proposal Submission ------------------- Lab proposals must provide sufficient information to enable to be able to judge the relevance, timeliness, scientific quality, benefits for the research community, and the competence of the proposers to co-ordinate the lab. Each lab proposal should identify one or more organizers as responsible for ensuring the timely execution of the lab. Proposals should be 2-4 pages long and should provide the following information: 1. Title of the proposed lab. 2. A brief description of the lab topic and goals, its relevance to CLEF and the significance for the field. 3. A brief but clear statement of usage scenarios or domain to which the activity is intended to contribute, including the evaluation setup and metrics. 4. Details on the lab organizer(s), including identifying the task chair(s) responsible for the ensuring the running of the task. This should include details of any previous of involvement in organising or participating in evaluation tasks at CLEF or similar campaigns. 5. The planned format of the lab, i.e. campaign-style (“track”) or workshop. 7. A statement on the intended development/growth path if the proposal is for a continuation of activities previously undertaken at CLEF workshops. 8. Details of the expected target audience, i.e. who do you expect to participate in the task, and how do you propose to reach them. 9. The number of tasks to be carried out in a lab. The proposal should clearly motivate the need for each of the proposed tasks and provide evidence of its capability of attracting enough participation. It is fine for a lab to have a single task, but labs often contain multiple closely related tasks. 10. Expected length of the lab session at the conference: half-day, one day, two days. This should include very high level details of planned structure of the session, e.g. participant presentations, invited speaker(s), panels, etc, to justify the requested session length. 11. Arrangements for the organization of the lab campaign: who will be responsible for activities within the task; how will data to acquired or created, including highlighting any IP issues that need to be addressed to enable data to be distributed to lab participants; tools or methods which will be used, e.g. how will necessary queries be created or relevance assessment carried out; any other information which is relevant to the conduct of your lab. 12. If the lab proposes to set up a steering committee to oversee and advise its activities, include names, addresses, and homepage links of people your propose to be involved. Reviewing Process ----------------- Each submitted proposal will be reviewed by the CLEF 2015 lab organizing committee. The decision will be sent by email to the responsible organizer by September 19, 2014. The final length of the lab session will be determined based on the overall organization of the conference and the number of participant submissions received by a lab. Reviewing criteria can be found on the website of the conference - http://clef2015.clef-initiative.eu/ . Important Dates --------------- * Final lab proposals: 10 September 2014 * Notification of lab acceptance: 19 September 2014 * 3 November 2014: Labs registration opens Submission Details ------------------ Lab proposals (or questions) should be submitted via e-mail (either plain text or PDF format, using “CLEF labs proposal” in the subject line) to both Lab Organizing Committee Chairs: Eric San-Juan , eric.sanjuan at univ-avignon.fr Gareth Jones, gareth.jones at computing.dcu.ie Further information is available at: http://clef2015.clef-initiativeeu/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:41:49 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:41:49 +0200 Subject: Info: Avant le 15 Septembre 2014, Inscription Conseil Scientifique IRCOM Message-ID: Date: Wed, 3 Sep 2014 15:54:24 +0200 From: veronique Brisset-fontana Message-ID: <54071D90.6010505 at cnrs.fr> X-url: http://www.fiap.asso.fr/ X-url: http://ircom.huma-num.fr/site/accueil.php CONSORTIUM CORPUS ORAUX ET MULTIMODAUX Chère et cher collègue, Le comité de pilotage de l'IRCOM, consortium "Corpus Oraux et Multimodaux", vous propose, pour la prochaine réunion plénière du comité scientifique, un nouveau format qui permettra d'articuler le bilan des activités du consortium avec trois ateliers autour de thèmes fondamentaux pour le consortium. Cette réunion sera ouverte à *toute la communauté des chercheurs et enseignants*--chercheurs intéressés aux corpus oraux et multimodaux. Le programme de la journée comprend : - un atelier *"Métadonnées" *pour discuter d'un jeu commun de descripteurs, à partir des propositions initiées lors de la table ronde sur les formats du 23 juin et d'exemples pris dans les différents corpus oraux du projet Orféo. - un atelier *"Annotations"* à partir des travaux du groupe 1 "Corpus linguistiques et finalités scientifiques" qui ré-interrogera les pratiques d'étiquetage dans l'annotation des corpus oraux et plus précisément les interactions entre pratiques d'étiquetage, théorie et objectifs descriptifs, à la lumière des langues peu décrites, non écrites et/ou d'une autre modalité (langues des signes) mais aussi des corpus multimodaux. - un atelier *"Archivage des corpus"* d'après les travaux du groupe 6 "Stockage sécurisé et mutualisation des corpus oraux et multimodaux" illustrera les différentes étapes de l'archivage. Ces étapes vont du dépôt jusqu'à la consultation des ressources déposées, en passant par le nommage des fichiers, les formats de fichiers, le référencement et la valorisation. Les spécificités des principaux acteurs, BnF, Cocoon et Ortolang/SLDR, seront présentées à travers des exemples concrets de corpus. Ces ateliers seront organisés en deux sessions de même format pour vous permettre de participer à deux ateliers sur les trois proposés. La journée se conclura par un bilan des ateliers et une session de discussion. Nous vous invitons à diffuser largement cette information et à convier d'autres personnes de vos unités qui seraient intéressées à développer ces thématiques. La réunion se déroulera au centre *FIAP -- Jean Monnet, 30 rue Cabanis, 75014 PARIS* http://www.fiap.asso.fr/ _Métro_ligne 6, stations Saint-Jacques ou Glacière. _RER_B : Station Denfert Rochereau _Bus_ : N°21 Pour vous inscrire envoyer un courriel à l'adresse suivante : secretariat-general at ling.cnrs.fr *AVANT LE 15 SEPTEMBRE 2014* Vous pouvez consulter le site de l'IRCOM : http://ircom.huma-num.fr/site/accueil.php A titre exceptionnel et à destination des jeunes chercheurs intéressés pour participer à cette réunion, une demande de prise en charge des frais de transport peut être faite à l'adresse mail ci-dessus. Pour être prise en compte, cette demande doit parvenir avant le 15 septembre 2014. **************** *PROGRAMME DE LA JOURNEE* *CONSEIL SCIENTIFIQUE IRCOM* *_Lundi 22 septembre 2014 de 9h15 à 17h00_* Réservé: Centre FIAP Jean Monnet - 30 rue Cabanis - 75014 Paris** *Ordre du jour* *08h 45 -- 09h 15 - ACCUEIL*** *Matinée : Présentation et réalisation d'IRCOM et ateliers* *09h 15 -- 09h 30 :*** - Présentation générale : structure, fonctionnement, réalisations - Dominique Boutet *09h 30 -- 11h 00 :*** - Présentations des 5 groupes de travail du consortium /Corpus linguistiques et finalités scientifiques/ /Interopérabilité/ /Multimodalité et modalité visuo-gestuelle/ /Questions juridiques, droits des personnes et des producteurs de corpus /// /Stockage sécurisé et mutualisation des corpus oraux et multimodaux/ *11h 00 -- 11h 30 - PAUSE* *11h 30 -- 13h 00* _Atelier Métadonnées_ Christophe Benzitoun et Carole Etienne. Cet atelier se propose de discuter d'un jeu commun de métadonnées qui donnerait les informations nécessaires sur les corpus oraux pour faciliter leur réutilisation par des chercheurs ou des enseignants. En évitant de reprendre les débats sur les catégorisations ou de remettre en cause les descriptions existantes, cette étude cherche à définir les bonnes pratiques en matière de métadonnées. Cette réflexion s'inscrit dans la continuité des téléconférences en février et de la table ronde consacrée aux formats communs en juin et bénéficiera de nombreux exemples parmi les corpus du projet Orféo. _Atelier Archivages_ Olivier Baude (pour Cocoon), Audrey Viault (département Archives et Manuscrits, BnF),Jean-Marie Pierrel et Jérôme Blanchard (ORTOLANG/SLDR). Cet atelier présentera les étapes de l'archivage et de la valorisation de corpus oraux et multimodaux à travers quelques réalisations qui illustrent les spécificités de chaque institution. Les participants pourront proposer des corpus pour une simulation du processus d'archivage adapté à leur cas. _Atelier Annotations_ Amina Mettouchi, Anne Lacheret Brigitte Garcia et Paola Pietrandrea. Cet atelier propose d'aborder les questions suivantes, aux fondements mêmes des pratiques d'annotation. Dans quelle mesure les hypothèses et les objectifs qui sous-tendent les travaux en linguistique de corpus peuvent-ils/doivent-ils être explicités pour justifier le jeu d'étiquettes utilisées pour les annotations ? Les questions auxquelles se heurte l'annotation ne doivent-elles pas servir de levier pour impulser des propositions théoriques engageant de nouveaux modes de représentation linguistique ? Jusqu'à quel point peut-on tenir le pari de l'approche a-théorique ou « non-aprioristique » dans l'annotation des corpus ? A partir de quel niveau d'analyse et pourquoi celle-ci ne peut-elle plus être uniquement fixée sur des critères de formes ? N'y a-t-il pas un noyau fonctionnel a minima incontournable ? Si oui, de quelle nature (phonémique, morphologique, syntaxique...) ? Y a-t-il à cet égard des spécificités liées aux différentes langues, au type de modalité utilisée, etc. ? Au final, ces questions convergent vers celle de la définition des unités (minimales, maximales) retenues pour l'annotation. *13h 00 -- 14h 00 - DEJEUNER*** *Après-midi : Ateliers, restitutions et discussions* *14h 00 -- 15h 30* _Atelier Métadonnées_- (Animateurs et sujets identiques à ceux de la matinée) Christophe Benzitoun et Carole Etienne. Cet atelier se propose de discuter d'un jeu commun de métadonnées qui donnerait les informations nécessaires sur les corpus oraux pour faciliter leur réutilisation par des chercheurs ou des enseignants. En évitant de reprendre les débats sur les catégorisations ou de remettre en cause les descriptions existantes, cette étude cherche à définir les bonnes pratiques en matière de métadonnées. Cette réflexion s'inscrit dans la continuité des téléconférences en février et de la table ronde consacrée aux formats communs en juin et bénéficiera de nombreux exemples parmi les corpus du projet Orféo. _Atelier Archivages - _(Animateurs et sujets identiques à ceux de la matinée)__ Olivier Baude (pour Cocoon), Audrey Viault (département Archives et Manuscrits, BnF),Jean-Marie Pierrel et Jérôme Blanchard (ORTOLANG/SLDR). Cet atelier présentera les étapes de l'archivage et de la valorisation de corpus oraux et multimodaux à travers quelques réalisations qui illustrent les spécificités de chaque institution. Les participants pourront proposer des corpus pour une simulation du processus d'archivage adapté à leur cas. - _Atelier Annotations - _(Animateurs et sujets identiques à ceux de la matinée)__ Olivier Baude (pour Cocoon), Audrey Viault (département Archives et Manuscrits, BnF),Jean-Marie Pierrel et Jérôme Blanchard (ORTOLANG/SLDR). Cet atelier présentera les étapes de l'archivage et de la valorisation de corpus oraux et multimodaux à travers quelques réalisations qui illustrent les spécificités de chaque institution. Les participants pourront proposer des corpus pour une simulation du processus d'archivage adapté à leur cas. *15h 30 -- 15h 45 - PAUSE*** *15h 45 -- 17h 00*** - Restitutions et discussions ************************************************************** Veuillez nous excuser pour les envois multiples ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:55:48 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:55:48 +0200 Subject: Ecole: Ecole d'automne en RI EARIFA, 28-31 2014 octobre, Hammamet (Tunisie) Message-ID: Date: Fri, 5 Sep 2014 01:12:58 +0100 From: "Chiraz Latiri" Message-ID: <003001cfc89e$2648b1c0$72da1540$@latiri at gnet.tn> X-url: http://www.asso-aria.org/presentation-earia Premier appel à participation à l'école EARIFA ( http://www.asso-aria.org/presentation-earia École d'Automne en Recherche d'Information : Fondements et Applications) Du 28 au 31 octobre 2014 à Hammamet (Tunisie) ********************************************************************** Nous avons le plaisir de vous annoncer la tenue de la première édition de l'Ecole d'Automne en Recherche d’Information : Fondements Et Applications, qui se tiendra du 28 au 31 octobre 2014 à Diar El Medina, Hammamet (Tunisie). L’intérêt de la recherche d'information mutli-source (texte, web, réseaux sociaux…) est grandissant au Maghreb. C’est dans l'objectif de fédérer les compétences autour de ce domaine, que cette première édition d'une école d'automne en Recherche d'Information (RI) est proposée. Elle vise à promouvoir les échanges entre chercheurs du monde entier, plus particulièrement ceux du Maghreb et autour de la méditerranée, afin de contribuer principalement à la dynamisation de la recherche dans le domaine de la RI et à l’émergence d’une communauté scientifique plus large dans la région méditerranéenne. Nous faisons alors appel à tous les jeunes chercheurs, travaillant sur des problématiques liées à la RI, pour présenter des posters décrivant leurs travaux de recherche et qui seront discutés durant les journées de l'école. L'organisation de cette première édition se fera conjointement entre l'Institut Supérieur des Arts Multimédias (Université de la Manouba , Tunisie) et l'Association de Multimédia et de l'AudioVisuel en Tunisie (AMAVI) du 28 au 31 octobre 2014 à Hammamet (Tunisie). Les cours seront organisés sur 6 demi-journées (du mardi 28 octobre 2014 au vendredi 31 octobre midi) et offrent un cadre d'échange convivial tant autour des fondements que des thèmes novateurs dans le domaine de la RI. Les domaines couverts par les cours de cette école d'automne ainsi que les intervenants sont présentés dans l'appel à participation (voir fichier joint à ce mail). Le comité d'organisation présidé par Chiraz Latiri, est composé de Yahya Slimani, Chiraz Trabelsi , Hajer Baazaoui, Rim Faiz et Hatem Haddad. Le formulaire d'inscription est joint à ce mail. Je compte sur votre collaboration pour une large diffusion de cet appel, en espérant que les chercheurs maghrébins et français participent massivement à cette première édition. Chiraz Latiri, Présidente du comité d'organisation d'EARIFA 2014. Maitre de conférences en informatique à l'ISAMM, université de la Manouba Présidente de l’association AMAVI ********************************************************************** Email : Chiraz.latiri at gnet.tn, chiraz.latiri3 at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:51:13 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:51:13 +0200 Subject: Job: Postes d'Annotateur en langue Fran=?UTF-8?Q?=C3=A7aise_?=/ Anglaise(H/F), CDD, ELDA Message-ID: Date: Thu, 04 Sep 2014 11:40:12 +0200 From: Leixa jérémy Message-ID: <5408337C.9000309 at elda.org> ############################################## *Postes d'Annotateur en langue Française / Anglaise(H/F), CDD à plein-temps*** ELDA (Evaluation and Language resources Distribution Agency, www.elda.org ) a pour activités principales la distribution et la production de ressources linguistiques, ainsi que l'évaluation de technologies de la langue. Dans le cadre de ses activités de production, ELDA offre plusieurs postes d'annotateurs (H/F) à plein-temps. _Contexte_ Dans le cadre d'un projet de recherche, ELDA (Evaluations and Language resources Distribution Agency) recrute plusieurs personnes pour participer à la constitution de corpus annotés en Entités Nommées. Les Entités Nommées (EN) sont des objets textuels (c'est-à-dire un mot, ou un groupe de mot) catégorisables dans des classes prédéfinies (personnes, noms d'organisation, noms de lieux, quantités, distances, dates, etc.) La reconnaissance d'Entités Nommées est une sous-tâche essentielle des systèmes d'extraction d'information dans des corpus documentaires. _Mission_ Il s'agit d'annoter les documents textuels afin d'en fournir la description nécessaire à l'évaluation. Le travail sera effectué via un logiciel spécifique, et selon des conventions d'annotation sur lesquelles les candidats seront formés. _Profil recherché_ - Très bonne connaissance des langues écrites française, anglaise - Bonne maîtrise de l'outil informatique - Capacité à intégrer des règles (d'annotation) et à les suivre scrupuleusement et avec constance _Durée_ Plein-temps, pour une durée de 1 mois. _Salaire_ Selon profil et performances Les candidatures (CV, lettre de motivation) doivent être adressées à leixa at elda.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:26:54 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:26:54 +0200 Subject: Info: Le ministere de la Culture ouvre une consultation publique sur les outils d'aide a la traduction Message-ID: Date: Tue, 09 Sep 2014 17:19:15 +0200 From: Quentin SAMIER Message-ID: <540F1A73.6000103 at culture.gouv.fr> X-url: http://www.apoliade.com/survey/index.php/769372/lang-fr Bonjour, Le ministère de la Culture et de la Communication propose, du 9 au 30 septembre 2014, une grande consultation publique sur les outils d'aide à la traduction, et invite tous les utilisateurs de ces technologies à y participer. Des besoins de traduction se manifestent en effet dans tous les secteurs de la vie sociale : administrations, entreprises, associations, etc. Cette consultation publique a pour objectif d'inventorier les besoins exprimés par les utilisateurs en matière d'aide à la traduction : vos contributions permettront ainsi de réaliser un guide sur les outils auxquels vous pourriez avoir recours. Ce guide sera ensuite diffusé largement auprès des professionnels, du grand public et des éditeurs de solutions. Vous êtes traducteur, formateur, étudiant ou simple utilisateur d'outils d'aide à la traduction, nous vous invitons à participer à cette consultation en cliquant sur le lien : http://www.apoliade.com/survey/index.php/769372/lang-fr N'hésitez pas à diffuser ce message au sein de vos réseaux. Cordialement, La Délégation générale à la langue française et aux langues de France///-- /ministère de la Culture et de la Communication ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:17:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:17:35 +0200 Subject: Seminaire: BLRI, Stefan Elmer, 19 septembre 2014, Aix-en-Provence Message-ID: Date: Mon, 8 Sep 2014 11:57:23 +0200 From: Nadéra Bureau Message-ID: <004801cfcb4b$49f08940$ddd19bc0$@bureau at blri.fr> Vendredi 19 septembre 2014 11h Salle de conférences B011, bât. B 5 avenue Pasteur, Aix-en-Provence Stefan Elmer (Labex BLRI) The influence of expertise on perception, cognition, and brain connectivity. Résumé : A better understanding of the perceptual and cognitive neural underpinnings underlying exceptional behavioural skills has important educational, societal, as well as clinical implications (i.e., for example in the context of developmental dyslexia, aphasia, and foreign language learning). Here, I will present recent data collected from professional musicians with and without absolute pitch, as well as from simultaneous language interpreters, to reveal how expertise and training has an influence on the functional-structural malleability of perceptual and cognitive subdivisions of the human brain. In the same context, I will also provide some evidence for transfer effects from musicianship to specific aspects of speech processing. Finally, since currently there is no doubt that perceptual and cognitive functions do not work in isolation but are embedded in neuronal assemblies consisting of networks influencing each other's in a reciprocal manner, I will propose some novel methodological approaches for evaluating functional and structural connectivity within small-scale perceptual-cognitive networks in musicians with and without absolute pitch. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 19:55:00 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 21:55:00 +0200 Subject: Appel: IRCOM-ORTOLANG 2014, Aide technique et financiere a la finalisation de corpus Message-ID: Date: Wed, 10 Sep 2014 15:23:42 +0200 From: veronique Brisset-fontana Message-ID: <541050DE.4020708 at cnrs.fr> X-url: http://ircom.huma-num.fr/site/p.php?p=corpusaide *Appel IRCOM-ORTOLANG 2014* *Aide technique et financière à la finalisation de corpus* Le consortium IRCOM et l'Equipex Ortolang ont lancé conjointement en juin 2013 un appel pour l'aide à la finalisation de corpus. Vous avez été nombreux à répondre à cet appel. Au total, 20 projets ont été retenus et ont fait, ou feront l'objet, d'une aide technique, parmi lesquels 9 projets ont bénéficié, ou bénéficieront d'une aide financière (http://ircom.huma-num.fr/site/p.php?p=corpusaide). *En 2014, le consortium IRCOM conjointement avec l'équipex Ortolang proposent de poursuivre son accompagnement technique et financier.* L'accompagnement technique a comme objectif d'amener les ressources linguistiques, comportant de préférence des annotations (ex. transcriptions), à être : (1) stockées de manière sécurisée, (2) référencées par un identifiant unique international (3) à être diffusée (publiquement ou sous conditions, immédiatement ou avec délai). Cette aide peut intervenir concrètement à plusieurs niveaux : conversion de format des fichiers, assistance à la documentation (métadonnées compatibles OAI-PMH), mise en relation avec les différents interlocuteurs en fonction de la spécificité des ressources (centres de ressources/BnF). Vous trouverez des descriptions de corpus finalisés sur le site IRCOM (http://ircom.huma-num.fr/site/p.php?p=corpusaide). A titre d'illustration, voici quelques corpus qui ont pu être finalisés après avoir bénéficié de notre aide technique (nom du correspondant entre parenthèses). - Le corpus OTG (Jean-Yves Antoine), composé d'interactions d'une durée totale de 2h a bénéficié de notre aide pour la conversion des 315 fichiers au format brut (.raw) vers le format .aiff, un format accepté pour l'archivage numérique auprès du CINES (qui prend en charge la préservation à long terme des données de la recherche). Cet ensemble a été déposé et est diffusé par SLDR/Ortolang (http://sldr.org/sldr000831). - L'Atlas Linguistique de l'Alsace (Claude Evrard), composé de trois principaux ensembles d'enregistrements réalisés dans les années 60, 80 et 90 (entretiens ethnographiques, atlas linguistique, enquête sur la conscience linguistique) d'un total de 864 ressources audio, et dont les producteurs ne sont plus en activité, a été documenté en recoupant l'information présente sur le site web (http://ala.u-strasbg.fr/index3.php) et plusieurs fichiers excel conservés. Cet atlas a été déposé auprès de CoCoON (http://cocoon.huma-num.fr/exist/crdo/collection_ala.htm). - Le corpus ALIPE (Thierry Chanier), déjà structuré et consultable via un site web universitaire (http://lrl-diffusion.univ-bpclermont.fr/alipe/), a été orienté vers SLDR/Ortolang pour être référencé et stocké de manière sécurisé, et diffusé au format HD (http://sldr.org/alipe-000853). Une attention particulière a été fournie pour que l'arborescence soit conservée, en particulier dans les liens de la documentation (html) vers les fichiers son. - Le corpus VN-Attitude (Dang Khoa Mac), composé d'audio, de vidéo et de signaux électro-glottographiques (EGG), nécessitait une conversion de format de ces derniers pour qu'ils puissent être réellement interopérables (dépôt en cours auprès de CoCoON). En revanche, l'EGG n'étant pas un type de données pris en charge par le CINES, une réflexion est en cours concernant son statut en tant qu'objet archivistique. *Conditions de l'appel 2014 d'IRCOM et d'Ortolang à accompagnement technique et financier pour la diffusion de corpus de langage* Pour palier la grande disparité dans les niveaux de compétences informatiques des personnes et groupes de travail produisant des corpus, L'IRCOM propose une aide personnalisée à la finalisation de corpus. Celle-ci sera réalisée par un ingénieur IRCOM en fonction des demandes formulées et adaptées aux types de besoin, qu'ils soient techniques ou financiers. Les demandes peuvent concerner tout type de traitement : traitements de corpus quasi-finalisés (conversion, anonymisation), alignement de corpus déjà transcrits, conversion depuis des formats « traitement de textes », digitalisation de support ancien. - Les demandes sont à déposer du 10 septembre 2014 au 31 octobre 2014. - Les demandes seront traitées dans l'ordre où elles seront reçues par l'IRCOM. - Les demandes émanant d'EA ou de petites équipes ne disposant pas de support technique « corpus » seront traitées prioritairement. - La décision pour l'aide technique relèvera du comité de pilotage d'IRCOM. - Le montant maximal par projet est de 3300 euros. - Les demandes non traitées en 2014 sont susceptibles de l'être en 2015. - Si vous avez des doutes quant à l'éligibilité de votre projet, n'hésitez pas à nous contacter pour que nous puissions étudier votre demande et adapter nos offres futures, vous pouvez contacter Martine Toda[ martine.toda at cnrs.fr ] ou à [ ircom.appel.corpus at gmail.com ] - Cet appel d'offre est soumis aux conditions formulées ci-dessous. Les conditions nécessaires pour proposer un corpus à finaliser sont : - Pouvoir prendre toutes décisions concernant l'utilisation et la diffusion du corpus (propriété intellectuelle en particulier). - Disposer de toutes les informations concernant les sources des corpus et le consentement des personnes enregistrées ou filmées. - Accorder un droit d'utilisation libre des données ou au minimum un accès libre pour la recherche scientifique. Les propositions de réponse à cet appel d'offre sont à envoyer _avant le 31 octobre 2014_ à ircom.appel.corpus at gmail.com et doivent _utiliser le formulaire de la page suivante_. Dans tous les cas, l'IRCOM vous adressera une réponse personnalisée. Ces propositions doivent présenter les corpus proposés, les données sur les droits d'utilisation et de propriétés et sur la nature des formats ou support utilisés. Cet appel est organisé sous la responsabilité de l'IRCOM avec la participation conjointe de l'IRCOM (http://ircom.huma-num.fr) et de l'EquipEx ORTOLANG (http://www.ortolang.fr). Pour toute information complémentaire, nous rappelons que le site web de l'IRCOM (http://ircom.huma-num.fr) est ouvert et propose des ressources à la communauté : glossaire, inventaire des unités et des corpus, ressources logicielles (tutoriaux, comparatifs, outils de conversion), activités des groupes de travail, actualités des formations, ... L'IRCOM invite les unités à inventorier leur corpus oraux et multimodaux - 70 projets déjà recensés - pour avoir une meilleure visibilité des ressources déjà disponibles même si elles ne sont pas toutes finalisées. /_Le comité de pilotage IRCOM_/ Le Consortium IRCOM appartient au TGIR HUMA-NUM - http://www.huma-num.fr/ *Utiliser ce formulaire pour répondre à l'appel : Merci.* *_Réponse à l'appel 2014 pour la finalisation de corpus oral ou multimodal_* Nom du corpus : Nom de la personne à contacter : Adresse email : Numéro de téléphone : Nature des données de corpus : Existe-t-il des enregistrements : Quel média ? Audio, vidéo, autre... Quelle est la longueur totale des enregistrements ? Nombre de cassettes, nombre d'heures, etc. Quel type de support ? Quel format (si connu) ? Existe-t-il des transcriptions : Quel format ? (papier, traitement de texte, logiciel de transcription) Quelle quantité (en heures, nombre de mots, ou nombre de transcriptions) ? Disposez vous de métadonnées (en particulier de l'information concernant les droits d'auteurs et d'usage) ? Disposez-vous d'une description précise des personnes enregistrées ? Disposez-vous d'une attestation de consentement éclairé pour les personnes ayant été enregistrées ? En quelle année (environ) les enregistrements ont eu lieu ? Quelle est la langue des enregistrements ? Le corpus comprend-il des enregistrements d'enfants ou de personnes ayant un trouble du langage ou une pathologie ? Si oui, de quelle population s'agit-il ? Dans un souci d'efficacité et pour vous conseiller dans les meilleurs délais, il nous faut disposer d'exemples des transcriptions ou des enregistrements en votre possession. Nous vous contacterons à ce sujet, mais vous pouvez d'ores et déjà nous adresser par courrier électronique un exemple des données dont vous disposez (transcriptions, métadonnées, adresse de page web contenant les enregistrements). Nous vous remercions par avance de l'intérêt que vous porterez à notre proposition. *Pour toutes informations complémentaires veuillez contacter Martine Toda * *martine.toda at cnrs.fr* ou *ircom.appel.corpus at gmail.com* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:00:58 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:00:58 +0200 Subject: Job: Research Engineer, NLP on Twitter: Retrieval of Argumentative Structures and Reasoning, Inria Sophia Antipolis, France Message-ID: Date: Mon, 8 Sep 2014 10:24:33 +0200 (CEST) From: Elena Cabrio Message-ID: <1747111419.47469556.1410164673640.JavaMail.zimbra at inria.fr> X-url: http://www.inria.fr/institut/recrutement-metiers/offres/ingenieurs-r-d Research Engineer - Natural Language Argumentation on Twitter: Retrieval of Argumentative Structures and Reasoning We are looking for a Research Engineer with a background in Natural Language Processing and Knowledge Representation and Reasoning to join the Inria WIMMICS team (http://wimmics.inria.fr) and the start-up Vigigloble (http://vigiglobe.com). Understanding and interpreting the flow of messages exchanged in real time on social platforms, like Twitter, raises several important issues. The big amount of information exchanged on these platforms represents a significant value for who is able to read and enrich this multitude of information. Users directly provide this information, and it is interesting to analyze such data both from the quantitative and from the qualitative point of view, especially for what concerns reputation and marketing issues (regarding brands, institutions or public actors). Moreover, the automated treatment of this type of data and the constraints it presents (e.g., limited number of characters, tweets with a particular writing style, amount of data, real-time communication) offer a new and rich context for a challenging use of existing tools for natural language processing. In particular, the goal of the project is to address the following points: - Automated selection and annotation of tweets, i.e., retrieval of those tweets that can be considered as arguments (like for instance those tweets whose content expresses an opinion on a given topic). - Automated assignment of labels to the type of relation holding between arguments (positive relation or negative relation). - Creation of an argumentation graph illustrating the relations between the arguments about a certain subject, and the further application of argumentation semantics to compute the set of "winning" arguments (i.e., the accepted arguments). This graph-based visualization provides a summary of the ongoing discussion on Twitter. The first step of the project will be the creation and annotation of a data set extracted from Twitter. This data set will be used as a benchmark for training and testing NLP algorithms for the automated detection of the relations between arguments. The second step will consist in the adaptation of the framework presented in [Cabrio&Villata, ECAI2012] to the Twitter scenario, with the aim to make it more robust in terms of processing large volumes of data. *Profile* Mandatory requirements for applicants: 1. PhD in Computer Science; 2. Experience in NLP and Knowledge Representation and Reasoning, or in a related field (Artificial Intelligence, Machine Learning...); 3. Hands-on experience of at least one programming language (e.g., Java, C++) ensure autonomy in completing the technical tasks of the project; 4. Self-motivated, goal-oriented and willing to work in an international team; 5. Pragmatic and customer oriented; 6. Fluent English is mandatory. Optional: 1. Good control of scripting tools (bash, Unix/Linux tools) and of web languages; 2. Experience with automation of NLP processing chains; 3. Fluent in French. *Duration* 12 months *Salary* Gross Salary per month according to the level of diploma and the experience in the domain: 2500 – 2800€ / month (corresponding to 2100-2300€ net salary / month) *Deadline* September 15th *Contact* Elena Cabrio: elena.cabrio at inria.fr Valentino Marra: valentino at vigiglobe.com Serena Villata: serena.villata at inria.fr References [Cabrio&Villata, ECAI2012] Cabrio E., Villata S. Natural Language Arguments: A Combined Approach. In Proceedings of the 20th European Conference on Artificial Intelligence (ECAI 2012), p. 205-210, 2012. NoDE Benchmark of Natural Language Arguments http://www-sop.inria.fr/NoDE/ More information are available at http://www.inria.fr/institut/recrutement-metiers/offres/ingenieurs-r-d and at https://wimmics.inria.fr/node/50 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:34:23 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:34:23 +0200 Subject: Job: CDD 18 mois, Ingenieur ou Docteur en Informatique, CEA LIST/LVIC, Palaiseau, Ile-de-France Message-ID: Date: Wed, 10 Sep 2014 16:24:18 +0000 From: SEMMAR Nasredine 202247 Message-ID: <50CC12289F0C854FBFF134F270030CD71ECF974A at EXDAG0-B3.intra.cea.fr> Contexte : ------------ Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ingénierie des Contenus) travaille sur l'analyse de contenus multimédias (analyse de textes, images et vidéos, perception 3D). Dans le cadre de sa participation à un projet européen, le laboratoire recherche un ingénieur ou un docteur en informatique pour intégrer des briques logicielles dans le domaine du Traitement Automatique des Langues (TAL). Objectifs : ------------ A partir des résultats produits par plusieurs applications TAL (Crawl, Filtrage, Extraction de connaissances, etc.), l'intégration a pour but de mettre ces applications dans une même chaine de traitement. Cette intégration sera basée sur une plate-forme open source. La tâche du CDD consistera en particulier à : - Contribuer au choix de la plate-forme logicielle open source. - Assurer l'intégration des applications et infrastructures développées par les partenaires du projet européen. - Réaliser le packaging, définir avec les autres partenaires les environnements, assurer les tests techniques et la compatibilité entre les packages. - Rédiger, contrôler et mettre à jour les documents nécessaires à la mise en exploitation. - Assurer la liaison avec les autres partenaires et prendre en charge le support technique. Profil recherché: -------------------- Ingénieur ou Docteur en informatique, des connaissances en TAL seraient un plus. Le candidat devra posséder une bonne maîtrise du développement en C++ et Java sous Linux, Windows et maitriser les bibliothèques telles que STL, Xerces, Boost, Soap, Rest, etc. Le candidat devra également maîtriser les méthodes, langages et environnements dédiés à la programmation parallèle (MPI, OpenMP, etc.). Le travail devant se réaliser dans le contexte d’un projet européen, une bonne maîtrise de la langue anglaise est également demandée. Rémunération selon formation et expérience. Lieu de travail : Centre d’intégration NanoInnov (plateau de Saclay, proche de Polytechnique) Durée : 18 mois Les candidatures (CV + lettre de motivation) sont à envoyer le plus rapidement possible à : Nasredine Semmar (nasredine.semmar at cea.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 19:57:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 21:57:35 +0200 Subject: Ecole: BigDat 2015, registration deadline 23 September 2014, Tarragona, Spain Message-ID: Date: Sun, 7 Sep 2014 16:27:48 +0200 From: "GRLMC" Message-ID: <33AA45D26CA6486B8048C6ACF46FA207 at Carlos1> X-url: http://grammars.grlmc.com/bigdat2015/ ***************************************************** INTERNATIONAL WINTER SCHOOL ON BIG DATA BigDat 2015 Tarragona, Spain January 26-30, 2015 Organized by Rovira i Virgili University http://grammars.grlmc.com/bigdat2015/ ***************************************************** --- 4th registration deadline: September 23, 2014 --- ***************************************************** AIM: BigDat 2015 is a research training event for graduates and postgraduates in the first steps of their academic career. It aims at updating them about the most recent developments in the fast developing area of big data, which covers a large spectrum of current exciting research, development and innovation with an extraordinary potential for a huge impact on scientific discoveries, medicine, engineering, business models, and society itself. Renowned academics and industry pioneers will lecture and share their views with the audience. All big data subareas will be displayed, namely: foundations, infrastructure, management, search and mining, security and privacy, and applications. Main challenges of analytics, management and storage of big data will be identified through 4 keynote lectures and 24 six-hour courses, which will tackle the most lively and promising topics. The organizers believe outstanding speakers will attract the brightest and most motivated students. Interaction will be a main component of the event. ADDRESSED TO: Graduate and postgraduates from around the world. There are no formal pre-requisites in terms of academic degrees. However, since there will be differences in the course levels, specific knowledge background may be required for some of them. BigDat 2015 is also appropriate for more senior people who want to keep themselves updated on recent developments and future trends. They will surely find it fruitful to listen and discuss with major researchers, industry leaders and innovators. REGIME: In addition to keynotes, 3 courses will run in parallel during the whole event. Participants will be able to freely choose the courses they will be willing to attend as well as to move from one to another. VENUE: BigDat 2015 will take place in Tarragona, located 90 kms. to the south of Barcelona. The venue will be: Campus Catalunya Universitat Rovira i Virgili Av. Catalunya, 35 43002 Tarragona KEYNOTE SPEAKERS: Ian Foster (Argonne National Laboratory), tba Geoffrey C. Fox (Indiana University, Bloomington), Mapping Big Data Applications to Clouds and HPC C. Lee Giles (Pennsylvania State University, University Park), Scholarly Big Data: Information Extraction and Data Mining William D. Gropp (University of Illinois, Urbana-Champaign), tba COURSES AND PROFESSORS: Hendrik Blockeel (KU Leuven), [intermediate] Decision Trees for Big Data Analytics Diego Calvanese (Free University of Bozen-Bolzano), [introductory/intermediate] End-User Access to Big Data Using Ontologies Jiannong Cao (Hong Kong Polytechnic University), [introductory/intermediate] Programming with Big Data Edward Y. Chang (HTC Corporation, New Taipei City), [introductory/advanced] From Design of Distributed and Online Algorithms to Hands-on Code Lab Practice on Real Datasets Ernesto Damiani (University of Milan), [introductory/intermediate] Process Discovery and Predictive Decision Making from Big Data Sets and Streams Gautam Das (University of Texas, Arlington), [intermediate/advanced] Mining Deep Web Repositories Maarten de Rijke (University of Amsterdam), tba Geoffrey C. Fox (Indiana University, Bloomington), [intermediate] Using Software Defined Systems to Address Big Data Problems Minos Garofalakis (Technical University of Crete, Chania) [intermediate/advanced], Querying Continuous Data Streams Vasant G. Honavar (Pennsylvania State University, University Park) [introductory/intermediate], Learning Predictive Models from Big Data Mounia Lalmas (Yahoo! Research Labs, London), [introductory] Measuring User Engagement Tao Li (Florida International University, Miami), [introductory/intermediate] Data Mining Techniques to Understand Textual Data Kwan-Liu Ma (University of California, Davis), [intermediate] Big Data Visualization Christoph Meinel (Hasso Plattner Institute, Potsdam), [introductory/intermediate] New Computing Power by In-Memory and Multicore to Tackle Big Data David Padua (University of Illinois, Urbana-Champaign), [intermediate] Data Parallel Programming Manish Parashar (Rutgers University, Piscataway), [intermediate] Big Data in Simulation-based Science Srinivasan Parthasarathy (Ohio State University, Columbus), [intermediate] Scalable Data Analysis Evaggelia Pitoura (University of Ioannina), [intermediate] Online Social Networks Vijay V. Raghavan (University of Louisiana, Lafayette), [introductory/intermediate] Visual Analytics of Time-evolving Large-scale Graphs Pierangela Samarati (University of Milan), [intermediate], Data Security and Privacy in the Cloud Peter Sanders (Karlsruhe Institute of Technology), [introductory/intermediate] Algorithm Engineering for Large Data Sets Johan Suykens (KU Leuven), [introductory/intermediate] Fixed-size Kernel Models for Big Data Domenico Talia (University of Calabria, Rende), [intermediate] Scalable Data Mining on Parallel, Distributed and Cloud Computing Systems Jieping Ye (Arizona State University, Tempe), [introductory/advanced] Large-Scale Sparse Learning and Low Rank Modeling ORGANIZING COMMITTEE: Adrian Horia Dediu (Tarragona) Carlos Martín-Vide (Tarragona, chair) Florentina Lilica Voicu (Tarragona) REGISTRATION: It has to be done at http://grammars.grlmc.com/bigdat2015/registration.php The selection of up to 8 courses requested in the registration template is only tentative and non-binding. For the sake of organization, it will be helpful to have an approximation of the respective demand for each course. Since the capacity of the venue is limited, registration requests will be processed on a first come first served basis. The registration period will be closed and the on-line registration facility disabled when the capacity of the venue will be complete. It is much recommended to register prior to the event. FEES: As far as possible, participants are expected to stay full-time. Fees are a flat rate covering the attendance to all courses during the week. There are several early registration deadlines. Fees depend on the registration deadline. ACCOMMODATION: Suggestions of accommodation will be provided in due time. CERTIFICATE: Participants will be delivered a certificate of attendance. QUESTIONS AND FURTHER INFORMATION: florentinalilica.voicu at urv.cat POSTAL ADDRESS: BigDat 2015 Lilica Voicu Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34 977 559 543 Fax: +34 977 558 386 ACKNOWLEDGEMENTS: Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:30:18 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:30:18 +0200 Subject: Job: CDD Ingenieur ou Docteur en TAL, 18 mois, CEA LIST/LVIC, Palaiseau, Ile-de-France Message-ID: Date: Wed, 10 Sep 2014 10:34:59 +0000 From: SEMMAR Nasredine 202247 Message-ID: <50CC12289F0C854FBFF134F270030CD71ECF9649 at EXDAG0-B3.intra.cea.fr> Contexte : ------------ Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ingénierie des Contenus) travaille sur l'analyse de contenus multimédias (analyse de textes, images et vidéos, perception 3D). Dans le domaine de l'analyse de textes, le CEA LIST recherche un CDD ingénieur ou docteur pour travailler sur des techniques d’extraction et de clustering de relations à partir de textes. Objectifs : ------------ À partir de document textuels provenant de différentes sources (par exemple des dépêches d'actualité), l'application visée a pour but d’extraire automatiquement à partir de textes des relations entre des entités d’intérêt, le plus souvent des entités nommées, et de regrouper les relations extraites en fonction de leur similarité sémantique. Plus précisément, l’extraction des relations a ici la particularité de s’effectuer de façon non supervisée : le type des relations extraites n’est en effet pas défini a priori. L’extraction, s’appuyant sur des approches à base d’apprentissage automatique, doit donc s’effectuer à partir de critères ne dépendant pas d’un type de relations spécifique. La perspective générale est ainsi celle de la veille : connaissant un ensemble d’acteurs, par exemple des sociétés, l’objectif est d’extraire ce qui caractérise les relations intervenant entre ces acteurs dans un ensemble de textes, sans a priori trop marqué. La définition du type des relations extraites se fait quant à elle a posteriori par le biais du regroupement des relations jugées similaires sur le plan sémantique. Ce regroupement sera dans un premier temps fondé sur des mesures standards de similarité textuelle (représentation vectorielle construite à partir d’une analyse linguistique des textes). Des mesures de similarité plus sémantiques, s'appuyant en particulier sur la notion de sémantique distributionnelle, seront à tester dans un second temps. Les approches développées devront avoir la capacité de travailler à large échelle (plusieurs centaines de milliers de relations). En amont de ces deux tâches principales, une étude concernant la constitution de larges bases d’entités nommées multilingues sera également à mener. Le travail du CDD consistera plus particulièrement à : - étudier, implémenter et évaluer une extraction non supervisée de relations par apprentissage statistique ; - étudier, implémenter et évaluer le regroupement des relations extraites sur des critères de surface ; - étudier, implémenter et évaluer le regroupement des relations extraites sur des critères sémantiques; - inventorier les bases d’entités nommées existantes, les intégrer à l’outil de reconnaissance d’entités nommées du LVIC et étudier la possibilité d’acquérir de nouvelles entités à partir de corpus alignés ou comparables. Profil recherché : -------------------- - Compétences en traitement automatique des langues / recherche d'information - Connaissance des techniques d'apprentissage automatique (SVM, CRF …) et de clustering - Compétences informatiques : C++, langages de script (perl, python ...) Le travail devant se réaliser dans le contexte d’un projet européen, une bonne maîtrise de la langue anglaise est également demandée. Rémunération selon formation et expérience. Lieu de travail : Centre d’intégration NanoInnov (plateau de Saclay, proche de Polytechnique) Durée : 18 mois Les candidatures (CV + lettre de motivation) sont à envoyer le plus rapidement possible à : Nasredine Semmar (nasredine.semmar at cea.fr) avec copie à : Romaric Besançon (romaric.besancon at cea.fr) Olivier Ferret (olivier.ferret at cea.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:39:10 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:39:10 +0200 Subject: Job: NLP, machine learning, Elsevier, Amsterdam Message-ID: Date: Wed, 10 Sep 2014 14:27:06 +0200 From: Véronique Malaisé Message-ID: Dear All, Please find below a job description that could be of interest for the people on the list. Interested candidates can send their CV and motivation letter to Pamela Ostendorf, "p.ostendorf at elsevier.com" Best, Veronique ------------------------------------------------------------------------ Natural Language Processing Expert Do you have extensive machine learning experience combined with software development skills? This might be your next challenge! In line with the Elsevier corporate strategy of greater content volume, types and sophistication, the services that Elsevier provides are becoming increasingly dependent on Smart Content. We are looking for a NLP Expert with a focus on Machine Learning and Statistical NLP techniques to strengthen our Content Enrichment team in executing that strategy. As a NLP Expert you will be working with our business units on developing our content and information offering to end customers. These services may rely on existing text and data mining processes that need application and maintenance, or require improvement in that area based on new industry developments (for example in the area of machine learning). You also will be working in Elsevier Operations with a varied group and cross-functional team of IT and product colleagues to pilot and develop new methods of extracting and surfacing information relevant to our customers for new product development. When successful, the NLP Expert will support the implementation of industry-scale high-quality production systems. Both a publisher and information solutions provider, Elsevier is looking for someone that is able to work on information from internal and external sources and using different (or no) data standards. Our search solutions depend heavily on concept indexing or annotation (for example using ontologies in the medical domain), relationship extraction (for example in disease pathways) or extracting data from images and tables. The ideal candidate will have industry experience solving language-related problems (entity extraction, word-sense disambiguation, information clustering) using statistical methods on vast quantities of data - and apply that experience to all of the above areas. You will be part of a growing team based in Amsterdam, reporting to the Head of Content Enrichment. Your responsibilities Text and data mining - You will bring active experience into the organization on extraction text and data information from structured and unstructured data. Applying and developing on these techniques you will drive the implementation of automated indexing and annotation processes. Also well-versed in machine learning, you will bring new processes into the organization in order to improve (in cost and time-efficiency) the data excerption processes that Elsevier is engaged with. This process will also include the application of Elsevier's taxonomy and ontology assets to a wide variety of content - as well as drive developments in the application of and expansion on these vocabularies. Data analytics to support businesses and products - You will analyze extracted information to drive such processes as automated and manual data cleansing. Data analytics can also be used to identify research trends, or drive decision for our content acquisition strategy. Using visualizations tools to present the extracted data to be ready for consumption will be another key ability. Contribute to the content strategy - You will actively contribute to product and operational content strategies by identifying and ingesting new technical capabilities to forward Elsevier mission of leading the way in advancing science, technology and medicine. Using the available base data, you will actively promote new ideas of using this data to enhance our competitive offerings. Serve as internal and external specialist on data extraction and NLP matters - You will serve as the NLP expert for Content and Innovation as well as across other teams in Elsevier. You will be a trusted resource in new development projects in Elsevier. You will also be able to act as a liaison between IT developers and (content) subject matters experts, translating information needs into software development. A senior member of the team, the NLP expert will coach junior members or outside vendors on a need basis. What you should bring - University graduate (Master of PhD level) computer science, computational linguistics or an associated area. - At least 5 years’ experience working in Natural Language Processing (NLP); especially in entity extraction, word-sense disambiguation, information clustering and data mining. - Proven experience with text normalization and processing, writing NLP, Parsers, and Spell checkers. - Software development experience in C/C++. - Familiarity with agile software development. - Scripting abilities in PHP/Lua and Perl/Python/Java. - Writing SQL queries, and experience using *nix systems, open source software and libraries. - Experience with internationalization, validation techniques, and using statistical techniques in decision making. - Ability to write design specifications, unit tests, maintaining documentation and perform code reviews. - Knowing how to improve efficiency of existing code, always considering performance factors. - Familiarity with taxonomy applications across scientific and healthcare disciplines is a plus. - Experience working with a variety of stakeholders at the mid and senior management level. - Ability to drive new developments and implement process changes and disruptive technologies in the organization. - Good communication and documentations skills with the ability to convey complex technical concepts to non-technical professionals. - Fluent in English What we offer We welcome you to a truly global, dynamic and challenging environment with great opportunities to develop yourself. Elsevier’s benefits are very competitive and the summary below will give you an idea of the kind of things you can expect when joining Elsevier in the Netherlands. - Competitive salary and a 13th month - 27 days of leave - Attractive collective health care insurance package with considerable reduction rates - Solid Pension Plan of which 70% of the premiums is paid by Elsevier - Profit share or bonus plan subject to the company annual results - You can participate in the convertible personnel bond loan scheme - Flexible working arrangements - Travel allowance for commuting between home and work - Reductions to several personal insurance packages due to our collective agreements - Additional benefits, like memberships of Elsevier’s magazines, discount on books and in-house sport facilities - Numerous training, coaching and e-learning modules for long term job opportunities and development - Several local and global networking communities to share best practices and knowledge ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:28:12 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:28:12 +0200 Subject: Job: Contract positions at Google, Junior Linguist (French) Message-ID: Date: Tue, 9 Sep 2014 19:57:27 +0200 From: AdvancedLinguistics Message-ID: *Job title: Junior Linguist [French]* *Job description:* As a Junior Linguist, you will be annotating and reviewing linguistic data in French. You will also contribute to a number of other tasks to improve natural language processing at Google. Work will be done from home, but Junior Linguists must live in the Paris area in order to travel to the Google office for training and meetings. *The tasks include:* - annotating and reviewing linguistic data - labeling text with semantic, syntactic and morphological features - annotating lexicon entries according to guidelines - evaluating current system outputs - deriving NLP data for new and on-going projects *Requirements*: - native-level speaker of French and fluent in English - preferred degree in Linguistics or Computational Linguistics - experience in annotation work - knowledge of semantics, syntax, morphology or lexicography - ability to quickly grasp technical concepts; learn in-house tools - keen interest in technology and computer-literate - excellent oral and written communication skills - attention to detail and good organizational skills - ability to work independently from home with reliable internet connectivity Project duration: 6 months (with potential for extension) For immediate consideration, please email your CV and cover letter in English (in PDF format) with “Junior Linguists [French]” in the subject line. E-mail address for applications: *advancedlinguistics at gmail.com* Application deadline: September 29th. 2014 Contact information: Bruno Cartoni ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:08:04 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:08:04 +0200 Subject: Seminaire: Olivier Le Guen, Cycle ESPaCCE 2014/2015 Toulouse, 26/09/14 Message-ID: Date: Wed, 10 Sep 2014 10:15:07 +0200 From: Michel Aurnague Message-ID: <5410088B.8080204 at univ-tlse2.fr> Olivier le Guen (CIEAS, Mexico) assurera le 26 septembre prochain, à l'Université Toulouse - Jean Jaurès, un séminaire sur le thème : *Une conception géocentrique de l'espace chez les Mayas Yucatèques : langage, cognition et gestualité*. [Maison de la Recherche, salle D155, 14h] Cette intervention s'insère dans le cycle ESPaCCE (2) *"Des Expressions Spatiales à leurs Paramètres Cognitifs, Culturels et Environnementaux" *programmé au cours de l'année universitaire 2014/2015. Résumé : En général, dans la plupart des études concernant l'influence du langage sur la cognition, le langage parlé (speech) est toujours l'unique le canal considéré. Dans le domaine de l'espace, les études conduites chez les mayas yucatèques (Mexique) qui ont eu pour but de déterminer le cadre de référence préféré dans cette communauté n'ont pas généré de consensus (Bohnemeyer & Stolz, 2006; Levinson, 2003 vs. Le Guen, 2006, 2009). Dans cette présentation, je considère une analyse multimodale du langage qui comprend le langage parlé et les gestes, et montre comment le cadre de référence spatial préféré chez les mayas yucatèques est uniquement détectable à travers l'analyse des gestes co-verbaux. Une série de tâches expérimentales compare la connaissance du sens des termes spatiaux, les performances dans des tâches non-verbales et la production gestuelles entre les hommes et les femmes. Les résultats montrent qu'il existe une forte différence entre hommes et femmes dans la connaissance des termes spatiaux mais des performances similaires et un usage préférentiel du cadre de référence géocentrique dans des tâches non-verbales. Finalement, dans une tâche de localisation spatiale, les participants ont utilisé des stratégies variées dans le langage parlé mais, malgré cela, tous ont fait un usage systématique du cadre de référence géocentrique dans la production de leurs gestes spatiaux. Je montrerai comment l'information présente dans les gestes est articulée tant syntaxiquement que sémantiquement au langage parlé, et ce de façon obligatoire en maya yucatèque. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:40:15 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:40:15 +0200 Subject: Appel: IWSLT 2014 Message-ID: Date: Wed, 10 Sep 2014 17:36:39 +0200 From: Francois Yvon Message-ID: <54107007.4030307 at limsi.fr> X-url: http://workshop2014.iwslt.org/ (apologies for cross posting) 11th International Workshop on Spoken Language Translation (IWSLT 2014) Second Call for Papers December 4-5, 2014 Lake Tahoe, Nevada http://workshop2014.iwslt.org/ The International Workshop on Spoken Language Translation (IWSLT) is a yearly scientific workshop, associated with an open evaluation campaign on spoken language translation, where both scientific papers and system descriptions are presented. The 11th International Workshop on Spoken Language Translation will take place in Lake Tahoe, US on Dec. 04-05, 2014. IWSLT 2014 is co-located with the 2014 IEEE Spoken Language Technology Workshop (SLT 2014). SLT will be held in South Lake Tahoe, California and Nevada, on Dec 7-10, 2014. The IWSLT invites submissions of scientific papers to be published in the workshop proceedings and presented in dedicated technical sessions of the workshop, either in oral or poster form. The workshop welcomes original, high quality contributions covering theoretical and practical issues in the fields of automatic speech recognition and machine translation that are applied to spoken language translation. Possible topics include, but are not limited to: * Speech and text MT * Integration of ASR and MT * MT and SLT approaches * MT and SLT evaluation * Language resources for MT and SLT * Open source software for MT and SLT * Adaptation in MT * Simultaneous speech translation * Speech translation of lectures * Spoken language summarization * Efficiency in MT * Stream-based algorithms for MT * Multilingual ASR and TTS * Rich transcription of speech for MT * Translation of non-verbal events IMPORTANT DATES * Sep 25, 2014: Paper Submission due * Nov 3: Author Notification * Nov 13: Camera-ready paper due * Dec 4-5: Workshop starts SUBMISSION: Submission is electronic, using the easychair submission software : https://easychair.org/conferences/?conf=3Diwslt2014 IWSLT 2014 review process is double-blind. Submitted manuscripts will be peer-reviewed. Authors of accepted papers are requested to present their paper at the workshop. Formatting guidelines and style files can be found here: http://workshop2014.iwslt.org/100.php CONTACT François Yvon, LIMSI-CNRS (francois.yvon at limsi.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:18:51 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:18:51 +0200 Subject: Job: Postdoc, Semantique et big data, Orange Labs Rennes Message-ID: Date: Mon, 8 Sep 2014 17:15:01 +0000 From: Message-ID: <10575_1410196502_540DE416_10575_16952_1_ED32B5012BA99F4AA999E2765EF060F214062E53 at PEXCVZYM12.corporate.adroot.infra.ftgroup> X-url: http://orange.jobs/jobs/offer.do?joid=40961&lang=FR Bonjour, Vous trouverez ci-dessous une proposition d'un postdoc à Orange Labs Rennes (Bretagne, France). Le sujet est : Etude d'un algorithme de calcul de profils utilisateur, de type sémantique, dans le domaine des contenus audio-visuels et musicaux. Les candidats intéressés peuvent candidater en ligne (CV et LM). http://orange.jobs/jobs/offer.do?joid=40961&lang=FR Cordialement Malek Boualem R&D Project Manager France Telecom Orange Labs FT/OLNC/OLPS/OPENSERV/CONTENT/FAST Phone : +33 (0)2 96 05 29 83 Mobile : +33 (0)6 85 71 40 63 Email : malek.boualem at orange.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:06:36 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:06:36 +0200 Subject: Conf: L'homme, matiere sensible, Parcours en hommage a Mario Borillo, 15-18 octobre 2014, Toulouse Message-ID: Date: Mon, 08 Sep 2014 11:07:16 +0200 From: Michel Aurnague Message-ID: <540D71C4.9010501 at univ-tlse2.fr> Chers amis, chers collègues, Nous avons le plaisir de vous annoncer qu'un parcours en hommage à Mario Borillo (1934-2013) aura lieu du 15 au 18 octobre prochain dans le cadre du festival "La Novela" 2014, sous le titre "L'homme, matière sensible". Ce parcours comprendra quatre événements dont vous trouverez la présentation et le détail ci-dessous. Par ailleurs, un opuscule sera également édité à cette occasion dans lequel figureront des jalons biographiques retraçant le cheminement personnel et professionnel de Mario Borillo, deux de ses textes ainsi qu'un certain nombre de brefs témoignages-hommages (N. Asher, J. Blaine, L. Fariñas, A. Guénoche, A. Holley, D. Kayser, N. & J. Kehayan, J.M. Larrazabal, E. Morin, F. Nef, H. Prade). Nous espérons vous voir nombreux à cette série d'événements qui sera l'occasion de rendre hommage à Mario Borillo dans un contexte convivial et intellectuellement stimulant. Cordialement, Michel Aurnague & Laure Vieu. ------------------------------------------------------------------------ *L'homme, matière sensible. Parcours en hommage à Mario Borillo - 15-18 octobre, Toulouse* L'homme doté de (cinq) sens et créateur de sens (signification) a constitué un questionnement majeur pour Mario Borillo (1934-2013) auquel ce parcours est dédié. Ce chercheur toulousain de premier plan s'est particulièrement intéressé à la problématique de la compréhension et représentation des actions et raisonnements humains. A travers le fil conducteur du langage (langage naturel, langage de l'art...), les événements de ce parcours proposent divers coups de projecteurs sur l'art, la langue, la perception et les sciences de l'information et de la cognition. >>Mercredi 15 octobre, 10h30-12h30, Université Paul Sabatier, IRIT, auditorium Herbrand *Séminaire de Hans Kamp professeur de logique et philosophie du langage à l'Université de Stuttgart* >>Jeudi 16 octobre, 16h-18h, Université Paul Sabatier, IRIT *Plantation d'un chêne en souvenir de Mario Borillo, allocutions* >>Vendredi 17 octobre, 18h30-20h30, Archives Municipales de Toulouse (2 rue des Archives, métro A arrêt Roseraie ; à 10 mn du métro, traverser le square Tonelli et prendre l'avenue de Lavaur) *L'Odeur des Archives : parcours littéraire et neuronal* Intervenants : Michael Moisseeff (directeur scientifique association Asquali), Isabelle Serça (professeur de langue et littérature française, Université Toulouse - Jean Jaurès), Jean-Marc Devaud (maître de conférences en neurosciences, Université Paul Sabatier) La mémoire de la ville est stockée sur du parchemin, du papier, des pellicules argentiques, des cd, des disques optiques. Mais la mémoire olfactive de la ville où est-elle gardée ? Vous vous souvenez des senteurs prolixes d'une épicerie ? Où pouvez-vous les retrouver, si ce n'est dans votre mémoire ? Quelques auteurs ont exploré ces contrées mnémoniques et en ont rapporté des textes odorants ! Venez assister à la lecture de ces textes et découvrez l'Odeur des Archives ! Une bonne occasion de faire une balade olfactive et littéraire et de découvrir ce lieu exceptionnel que sont les Archives municipales. N'oubliez pas... de venir avec vos narines ! >>Samedi 18 octobre, 15h30-17h30, Muséum d'histoire naturelle, salle Picot Lapeyrouse *Danser, penser : explorations du mouvement et de l'espace [à l'école, à l'écran]* Intervenants : Annie Bozzini (directrice du CDC Toulouse/Midi-Pyrénées), Catherine Gadon (directrice du service de "Diffusion de la culture scientifique et technique" du PRES), Philippe Joly (professeur des universités, IRIT, équipe SAMOVA), Christophe Jouffrais (Chargé de Recherche CNRS, IRIT et laboratoire LACII), Gilles Thomas (réalisateur des documentaires "Kid Birds for Camera" et "Kid Birds OFF") Comment (se) représenter le mouvement ? Comment le décomposer ? Quand le mouvement devient-il danse ?... Prenant comme fil conducteur la démarche du chorégraphe Merce Cunningham, cet événement abordera les questions ci-dessus (ainsi que quelques autres) sous deux angles complémentaires : celui du traitement automatique du mouvement par une machine et de la représentation de l'espace par le cerveau humain ; celui du mouvement et de la danse utilisés comme outils pédagogiques à l'école (projection d'un extrait du documentaire "Kid Birds"). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:02:29 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:02:29 +0200 Subject: Livre: Language Processing with Perl and Prolog, 2nd edition Message-ID: Date: Mon, 8 Sep 2014 09:04:41 +0000 From: Pierre Nugues Message-ID: <1DA5E251-7ACB-4FA3-ACEF-6E5A2D53791B at cs.lth.se> X-url: http://ilppp.cs.lth.se/ X-url: http://www.springer.com/978-3-642-41463-3 X-url: http://www.amazon.com/Language-Processing-Perl-Prolog-Implementation/dp/364241463X/ Apologies for cross-postings. Book announcement: Language Processing with Perl and Prolog, 2nd edition By Pierre Nugues Published by Springer This book has a companion website at http://ilppp.cs.lth.se/ and can be ordered from Springer: http://www.springer.com/978-3-642-41463-3 or Amazon: http://www.amazon.com/Language-Processing-Perl-Prolog-Implementation/dp/364241463X/ Overview: This book teaches the principles of natural language processing, first covering practical linguistics issues such as encoding and annotation schemes, defining words, tokens and parts of speech, and morphology, as well as key concepts in machine learning, such as entropy, regression, and classification, which are used throughout the book. It then details the language-processing functions involved, including part-of-speech tagging using rules and stochastic techniques, using Prolog to write phase-structure grammars, syntactic formalisms and constituent and dependency parsing techniques, semantics, predicate logic, and lexical semantics, and analysis of discourse and applications in dialogue systems. A key feature of the book is the author's hands-on approach throughout, with sample code in Prolog and Perl, extensive exercises, and a detailed introduction to Prolog. The reader is supported with a companion website that contains teaching slides, programs, and additional material. The second edition is a complete revision of the techniques exposed in the first edition to reflect advances in the field. The author redesigned or updated all the chapters, added two new ones, and considerably expanded the sections on machine-learning techniques. Contents: 1 An Overview of Language Processing 2 Corpus Processing Tools 3 Encoding and Annotation Schemes 4 Topics in Information Theory and Machine Learning 5 Counting Words 6 Words, Parts of Speech, and Morphology 7 Part-of-Speech Tagging Using Rules 8 Part-of-Speech Tagging Using Statistical Techniques 9 Phrase-Structure Grammars in Prolog 10 Partial Parsing 11 Syntactic Formalisms 12 Constituent Parsing 13 Dependency Parsing 14 Semantics and Predicate Logic 15 Lexical Semantics 16 Discourse 17 Dialogue Appendix: An Introduction to Prolog Index References From hamon at LIMSI.FR Wed Sep 10 20:25:03 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:25:03 +0200 Subject: Conf: AWNLP, Doha, Qatar, October 25, 2014 Message-ID: Date: Mon, 8 Sep 2014 19:09:43 +0000 From: Houda Bouamor Message-ID: <45AE03F9-42B2-4E0A-A5FE-3652425DF406 at qatar.cmu.edu> X-url: http://www.emnlp2014.org/workshops/anlp/call.html X-url: http://emnlp2014.org/workshops/anlp/acceptedpapers.html ======================================================= Call for Participation Arabic Natural Language Processing Workshop collocated with EMNLP 2014, Doha, Qatar Workshop date: Saturday October 25, 2014 Workshop Website: http://www.emnlp2014.org/workshops/anlp/call.html List of Accepted Papers: http://emnlp2014.org/workshops/anlp/acceptedpapers.html ======================================================= WORKSHOP DESCRIPTION There has been a lot of progress in the last 15 years in the area of Arabic Natural Language Processing (NLP). Many Arabic NLP (or Arabic NLP-related) workshops and conferences have taken place, both in the Arab World and in association with international conferences. This workshop follows in the footsteps of previous efforts to provide a forum for researchers to share and discuss their ongoing work. We invited submissions on topics that include, but are not limited to, the following: * Basic core technologies: morphological analysis, disambiguation, tokenization, POS tagging, named entity detection, chunking, parsing, semantic role labeling, sentiment analysis, Arabic dialect modeling, etc. * Applications: machine translation, speech recognition, speech synthesis, optical character recognition, pedagogy, assistive technologies, social media, etc. * Resources: dictionaries, annotated data, specialized databases etc. Associated with the workshop was a shared task on Arabic text error correction. OVERALL SCHEDULE (October 25, 2014) 9:00-10:30 Session #1 Corpora 10:30-11:00 Break / Poster setup 11:00-12:00 Shared Task Session 11:00-11:30 Task description and summary of results 11:30-11:45 1-minute summary for shared task participants 11:45-12:15 Panel / Group Discussion 12:15-12:30 Poster Teaser 1-minute poster summaries 12:30-14:00 Lunch / Poster Session (Main + Shared Task papers) 14:00-15:30 Session #2 Text Mining 15:30-16:00 Break 16:00-17:10 Session #3 Translation & Transliteration 17:10-18:00 Workshop Group Discussion ACCEPTED PAPERS Main Workshop Papers Al-Bayan: An Arabic Question Answering System for the Holy Quran Heba Abdelnasser, Maha Ragab, Reham Mohamed, Alaa Mohamed, Bassant Farouk, Nagwa El-Makky and Marwan Torki Annotating corpus data for a constructional analysis of motion verbs in Modern Standard Arabic Dana Abdulrahim Building a Corpus for Palestinian Arabic: a Preliminary Study Diyam Akra, Nizar Habash, Mustafa Jarrar and Nasser Zalmout Combining strategies for tagging and parsing Arabic Maytham Alabbas and Allan Ramsay The International Corpus of Arabic: Compilation, Analysis and Evaluation Sameh Alansary Uniform Word Segmentation Improves Dialectal Arabic to English Machine Translation Kamla Al-Mannai, Hassan Sajjad, Alaa Khader, Fahad Al Obaidli, Preslav Nakov and Stephan Vogel Automatic Arabic diacritics restoration based on deep nets Ahmad Al Sallab and Mohsen Rashwan A Large Scale Arabic Sentiment Lexicon for Arabic Opinion Mining Gilbert Badaro, Ramy Baly, Hazem Hajj, Nizar Habash and Wassim El-Hajj Transliteration of Arabizi into Arabic Orthography: Developing a Parallel Annotated Arabizi-Arabic Script SMS/Chat Corpus Ann Bies, Stephen Grimes, Haejoong Lee, Mohamed Maamouri, Zhiyi Song, Jonathan Wright, Ramy Nagah Eskander, Nizar Habash and Owen Rambow Tunisian dialect Wordnet : creation and enrichment using web resources and other Wordnets Rihab Bouchlaghem, Aymen Elkhlifi and Rim Faiz Arabizi Detection and Conversion to Arabic Kareem Darwish A Framework for Creating an MWE Computational Lexical Resource for Dialectal Arabic Abdelati Hawwari, Mohammed Attia and Mona Diab Domain and Dialect Adaptation for Machine Translation into Egyptian Arabic Serena Jeblee, Weston Feely, Houda Bouamor, Alon Lavie, Nizar Habash and Kemal Oflazer Semantic Query Expansion for Arabic Information Retrieval Ashraf Y. Mahgoub, Mohsen A. Rashwan, Hazem Rafaat, Mohamed A. Zahran and Magda B. Fayek Arabic Native Language Identification Shervin Malmasi and Mark Dras Using Twitter to Collect a Multi-Dialectal Corpus of Arabic Hamdy Mubarak and Kareem Darwish Evaluating Distant Supervision for Subjectivity and Sentiment Analysis on Arabic Twitter Feeds Eshrag Refaee and Verena Rieser AIDArabic A Named-Entity Disambiguation Framework for Arabic Text Mohamed Amir Yosef, Marc Spaniol and Gerhard Weikum Named Entity Recognition System for Dialectal Arabic Ayah Zirikly and Mona Diab Shared Task Papers The First shared Task on Automatic Text Correction for Arabic Behrang Mohit, Alla Rozovskaya, Nizar Habash, Wajdi Zaghouani and Ossama Obeid GWU-HASP: Hybrid Arabic Spelling and Punctuation Corrector Mona Diab, Mohammed Attia and Mohamed Al-Badrashiny Arabic Spelling Correction using Supervised Learning Youssef Hassan, Mohamed Aly and Amir Atiya CMUQ at The 2014 Automatic Arabic Error Correction Shared Task Serena Jeblee, Houda Bouamor, Wajdi Zaghouani and Kemal Oflazer TECHLIMED system description for the Shared Task on Automatic Arabic Error Correction Djamel Mostefa, Omar Asbayou and Ramzi Abbes Automatic Correction of Arabic Text: a Cascaded Approach Hamdy Mubarak and Kareem Darwish Fast and Robust Arabic Error Correction System Michael Nawar and Moheb Ragheb The Columbia System in the QALB-2014 Shared Task on Arabic Error Correction Alla Rozovskaya, Nizar Habash, Ramy Eskander, Noura Farra and Wael Salloum A Pipeline Approach to Supervised Automatic Error Correction Nadi Tomeh, Nizar Habash, Ramy Eskander and Joseph Le Roux Autocorrection of arabic common errors for large text corpus Taha Zerrouki, Khaled Alhowaity and Amar Balla ORGANIZERS Program Co-chairs Nizar Habash, Columbia University Stephan Vogel, Qatar Computing Research Institute Publication Co-chairs Nadi Tomeh, Paris 13 University Houda Bouamor, Carnegie Mellon University Qatar Website Committee Kareem Darwish, Qatar Computing Research Institute Noura Farra, Columbia University Shared Task Committee Behrang Mohit (co-chair), Carnegie Mellon University Qatar Alla Rozovskaya (co-chair), Columbia University Wajdi Zaghouani, Carnegie Mellon University Qatar Ossama Obeid, Carnegie Mellon University Qatar Nizar Habash (advisor), Columbia University Program Committee Members Abdelmajid Ben-Hamadou, University of Sfax, Tunisia Abdelhadi Soudi, Ecole Nationale de l’Industrie Minérale, Morocco Abdelsalam Nwesri, University of Tripoli, Libya Achraf Chalabi , Microsoft Research, Egypt Ahmed Ali, Qatar Computing Research Institute, Qatar Ahmed Rafea, The American University in Cairo, Egypt Alexis Nasr, University of Marseille, France Ali Farghaly, Monterey Peninsula College, USA Almoataz B. Al-Said, Cairo University, Egypt Alon Lavie, Carnegie Mellon University, USA Aly Fahmy, Cairo University, Egypt Azadeh Shakery, University of Tehran, Iran Azzeddine Mazroui, University Mohamed I, Morocco Bassam Haddad, University of Petra, Jordan Bayan Abu Shawar, Arab Open University, Jordan Behrang Mohit, Carnegie Mellon University Qatar, Qatar Eric Atwell, University of Leeds, UK Farhad Oroumchian, University of Wollongong, Australia Ghassan Mourad, Université Libanaise, Lebanon Hassan Sawaf, eBay Inc., USA Hazem Hajj, American University of Beirut, Lebanon Hend Alkhalifa, King Saud University, Saudi Arabia Houda Bouamor, Carnegie Mellon University Qatar, Qatar Imed Zitouni, Microsoft Research, USA Joseph Dichy, Université Lyon 2, France Karim Bouzoubaa , Mohammad V University, Morocco Karine Megerdoomian, The MITRE Corporation, USA Katrin Kirchhoff, University of Washington, USA Kemal Oflazer, Carnegie Mellon University Qatar, Qatar Khaled Shaalan, The British University in Dubai, UAE Khaled Shaban, Qatar University, Qatar Khalil Sima’an, Universiteit van Amsterdam, Netherlands Lamia Hadrich Belguith, University of Sfax, Tunisia Michael Rosner, University of Malta, Malta Mohamed Elmahdy, Qatar University, Qatar Mohsen Rashwan, Cairo University, Egypt Mona Diab, George Washington University, USA Mustafa Jarrar, Bir Zeit University, Palestine Nada Ghneim, Higher Institute for Applied Sciences and Technology, Syria Nadi Tomeh, University Paris 13, France Ossama Emam, IBM, USA Otakar Smrž, Džám-e Džam Language Institute, Czech Republic Owen Rambow, Columbia University, USA Preslav Nakov, Qatar Computing Research Institute, Qatar Ramzi Abbes, TECHLIMED, France Salwa Hamada, Cairo University, Egypt Shahram Khadivi, Tehran Polytechnic, Iran Sherri Condon , The MITRE Corporation, USA Taha Zerrouki, University of Bouira, Algeria Violetta Cavalli-Sforza, Al Akhawayn University, Morocco ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 19:51:11 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 21:51:11 +0200 Subject: Appel: Date limite JE Ethique et TAL repoussee Message-ID: Date: Thu, 11 Sep 2014 10:05:23 +0200 From: Karën Fort Message-ID: X-url: http://www.schplaf.org/kf/JE_ATALA.html Bonjour à tous, La date limite d'envoi de vos soumissions pour la JE Ethique et TAL est repoussée au 25 septembre. N'hésitez-plus ! Bien cordialement, Karen Fort ======APPEL======== Le TAL est une discipline au cœur de l'éthique scientifique, à la fois en tant qu'elle fournit des outils pour assurer l'utilisation éthique des données mais également par son long historique de travaux sur des sources sensibles, ou la nécessaire implication de nombreux collaborateurs pour la création de ressources langagières volumineuses. Concernant les outils, l'anonymisation des données, qu'elles soient orales ou écrites, est un enjeu tant industriel qu'académique, avec des contraintes de couverture parfois fortes selon les besoins applicatifs ou de recherche, la nature des ressources et des informations à anonymiser ou encore les limitations légales. D'autres outils du TAL s'inscrivent également dans des préoccupations éthiques, comme les outils de détection de plagiat ou de vérification de faits. La diversification des travaux sur corpus a par ailleurs amené la communauté à traiter des sources de plus de plus sensibles, qu'il s'agisse de données personnelles, médicales, voire à caractère criminel. En outre, l'avènement du Web 2.0. et avec lui le développement de la myriadisation (crowdsourcing), pose de nouvelles questions quant à la manière de considérer les intervenants dans la création de ressources langagières. Enfin, les préoccupations concernant l'utilisation des outils de TAL ne sont pas nouvelles, mais elles deviennent de plus en plus sensibles à l'heure des Big Data et du recoupement des données auquel participe le TAL. Aux questions juridico-économiques (fouille de brevets, droits associés aux données/logiciels), s'ajoutent les enjeux militaires (surveillance des échanges) et sociaux (le « droit à l’oubli » imposé à Google). Cette journée d'étude se veut un lieu d'échange ouvert sur ces sujets. Cet appel à communications s'adresse donc aux chercheur(e)s en traitement automatique des langues ou en linguistique, aux industriel(le)s ayant à utiliser des ressources langagières et aux expert(e)s dans les questions éthiques. Thèmes de la journée La journée commencera par une conférence invitée. Les communications sollicitées concernent aussi bien des travaux de recherche que des expériences industrielles, notamment dans les domaines suivants : * outils éthiques pour le TAL, ou reposant sur des techniques du TAL * méthodes et bonnes pratiques éthiques en TAL * TAL et aspects juridiques * traitement des données sensibles * recherche en TAL et principes éthiques * myriadisation et éthique Modalités de soumission Les propositions seront à envoyer à Karën Fort (karen.fort at paris-sorbonne.fr - merci de préciser [JE ATALA] dans le début du titre) - au plus tard le 15 septembre 2014. Elles devront être rédigées en français pour les francophones, et pourront être rédigées en anglais pour les non-francophones. Les résumés seront publiés après la journée sur le site de l'ATALA. Format de la soumission : résumé de 2 pages (format type LREC, disponible sur le site de la journée : http://www.schplaf.org/kf/JE_ATALA.html ) Comité scientifique * Olivier Baude, LLL, Université d’Orléans * Kevin B. Cohen, Biomedical Text Mining Group, University of Colorado School of Medicine * Alain Couillault, L3i, Université de La Rochelle / Aproged * Cécile Fabre, CLLE-ERSS, Université de Toulouse II * Cédrick Fairon, CENTAL, Université catholique de Louvain * Karën Fort, STIH, Université Paris-Sorbonne * Cyril Grouin, LIMSI CNRS * Joseph Mariani, IMMI / LIMSI CNRS * Adeline Nazarenko, LIPN, Université Paris-Nord * Benoît Sagot, Alpage, INRIA / Paris 7 * Isabelle Tellier, Université Sorbonne Nouvelle Informations pratiques Organisation : Karën Fort (STIH, Université Paris-sorbonne) Contact : karen.fort at paris-sorbonne.fr Date : samedi 22 novembre Lieu : Paris (à préciser) Dates importantes * Date de la journée : 22 novembre 2014 * Date limite de soumission : 25 septembre 2014 * Date de notification aux auteurs : 20 octobre 2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 19:53:04 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 21:53:04 +0200 Subject: Appel: Quo Vadis, Terminologia? Message-ID: Date: Thu, 11 Sep 2014 14:24:06 +0200 From: Kubler Natalie Message-ID: <54119466.1000305 at eila.univ-paris-diderot.fr> X-url: http://quovadis.clillac-arp.univ-paris-diderot.fr/index Chers Collègues, Veuillez trouver ci-dessous le deuxième appel à communication pour /Quo Vadis, Terminologia/? Colloque international en hommage à John Humbley. Site Web: http://quovadis.clillac-arp.univ-paris-diderot.fr/index Colloque: 18-20 février 2015, soumission reportée au 30 septembre 2014, notification aux auteurs: 31 décembre 2014 La soumission se fera sur easychair (https://www.easychair.org/conferences/?conf=qvtparis2015). Les propositions, d'un maximum de 500 mots, plus quelques références bibliographiques, devront clairement faire référence aux thèmes proposés et aux travaux de John Humbley. Les communications portant sur les sujets suivants et intégrant les travaux de John Humbley seront les bienvenues: * l'héritage de Wüster aujourd'hui * l'apport de la linguistique de corpus dans l'évolution de la terminologie * l'apport de la phraséologie dans l'évolution des études en terminologie * terminologie et traduction spécialisée * terminologie et rédaction technique * la néologie dans les langues de spécialité * variation terminologique * emprunts, métaphores et autres matrices à l'oeuvre dans la dynamique terminologique, ressources terminologiques * aménagement terminologique Bien cordialement Professeur NATALIE Kübler, UFR EILA Directrice du CLILLAC-ARP, EA 3967 Directrice du Centre de Ressources en Langues http://www.eila.univ-paris-diderot.fr/user/natalie_kuebler Université Paris Diderot 5, rue Thomas Mann 7520 Paris cedex 13 tel. +33 1 57 27 64 79 fax +33 1 57 27 64 81 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:26:29 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:26:29 +0200 Subject: Soft: Station Sensunique, plateforme web d'acquisition assistee de ressources (orientee Langues Controlees) Message-ID: Date: Fri, 12 Sep 2014 12:20:42 +0200 From: Izabella Thomas Message-ID: X-url: http://www.station-sensunique.fr/ Chers collègues, Nous avons le plaisir de vous annoncer la mise en ligne de la Station Sensunique (http://www.station-sensunique.fr/). La Station Sensunique est une plateforme web modulaire, collaborative et évolutive d'acquisition assistée de vocabulaire (terminologique et non terminologique). Elle a été conçue à l'Université de Franche-Comté durant le projet ANR Sensunique (2010-2012). Elle permet : a) d'accélérer le processus d'établissement du lexique d'un domaine ou d'une Langue Contrôlée, en s'appuyant sur : - la collaboration de plusieurs outils TAL ; - l'interrogation automatique des ressources terminologiques existantes ; - l'intégration et l'interrogation de ressources terminologiques ou lexicales propres ; b) de gérer le lexique, de créer et d'exporter des dictionnaires. Le Guide d'utilisateur de la Station peut être téléchargé sur le site. L'utilisation de la Station est gratuite à des fins de recherche ou d'enseignement. N'hésitez pas à nous faire part de vos remarques et suggestions concernant la plateforme ou son manuel. Bien cordialement Pour l'équipe du projet Izabella Thomas et Marie-Laure Betbeder ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:19:14 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:19:14 +0200 Subject: These: Marie Dupuch-Behar, Detection de termes semantiquement proches par clustering non supervise Message-ID: Date: Thu, 11 Sep 2014 23:13:53 +0200 From: Marie BEHAR Message-ID: Bonjour, J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée : "Détection de termes sémantiquement proches. Clustering non supervisé basé sur les relations sémantiques et le degré d’apparenté sémantique" Elle aura lieu le vendredi 19 septembre 2014 à 15h, au LIMICS, 15 rue de l’école de médecine, Paris 6ème (escalier D, 2ème étage) Métro : Odéon (ligne 4 ou 10) Je vous convie chaleureusement au pot qui suivra et qui se tiendra également au LIMICS. Bien cordialement, Marie Dupuch-Behar ------------------------------------------------ Le jury de soutenance sera composé de : Rapporteurs : Régis BEUSCART, PUPH, CERIM, Université Lille 2 Mathieu ROCHE, DR, CIRAD, UMR TETIS, Montpellier Examinateur : Jean-Marc LABAT, PU, LIP6, Université Paris 6 Frédérique SEGOND, Directrice R&D, VISEO, Grenoble Vincent CLAVEAU, CR, IRISA CNRS, Rennes Directrice : Marie-Christine JAULENT, DR, UMRS 1142 INSERM, Université Paris 6 Encadrante : Natalia GRABAR, CR, UMR 8163 CNRS, Université Lille 3 ------------------------------------------------ Résumé : L'utilisation de termes équivalents ou sémantiquement proches est nécessaire pour augmenter la couverture et la sensibilité d'une application comme la recherche et l'extraction d'information ou l'annotation sémantique de documents. Dans le contexte de l'identification d'effets indésirables susceptibles d'être dûs à un médicament, la sensibilité est aussi recherchée afin de détecter plus exhaustivement les déclarations spontanées et de mieux surveiller le risque médicamenteux. C'est la raison qui motive notre travail. Dans notre travail de thèse, nous cherchons ainsi à détecter des termes sémantiquement proches et à les regrouper en utilisant plusieurs méthodes : des algorithmes de clustering non supervisés, des ressources terminologiques exploitées avec le raisonnement terminologique et des méthodes de Traitement Automatique de la Langue, comme la structuration de terminologies, où nous visons la détection de relations hiérarchiques et synonymiques. Nous avons réalisé de nombreuses expériences et évaluations des clusters générés, qui montrent que les méthodes proposées peuvent contribuer efficacement à la tâche visée. Mots-clés : Terminologie, distance et similarité sémantique, structuration de terminologies, clustering, pharmacovigilance, domaine de spécialité, médecine, TAL, contexte cross-langue, filtrage, évaluation. Abstract : The use of equivalent terms or semantically close is necessary to increase the coverage and sensitivity of applications such as information retrieval and extraction or semantic annotation of documents. In the context of the adverse drug reactions identi_cation, sensitivity is also sought to detect more exhaustively spontaneous reports and better monitor drug risk. This is the reason that motivates our work. In our work, we thus seek to detect semantically close terms and the together using several methods : unsupervised clustering algorithms, terminological resources exploited with terminological reasoning and methods of Natural Language Processing, such as terminology structuring, where we aim to detect hierarchical and synonymous relations. We conducted many experiments and evaluations of clusters generated, which show that the proposed methods can e_ciently contribute to the task in question. Key-words : Terminology, semantic distance and similarity, terminology structuring, clustering, pharmacovigilance, speciality area, medicine, NLP, cross-language context, filtering, evaluation. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:39:46 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:39:46 +0200 Subject: Job: Linguiste annotateur, Weborama Message-ID: Date: Fri, 12 Sep 2014 15:56:50 +0200 From: Rachid Ammari Message-ID: ===================== [JOB] Recherche freelance/auto-entrepreneur Linguiste annotateur pour l'anglais, l'italien, le français, l'espagnol, le russe ou le néerlandais. ===================== Sujet ===== Validation linguistique de clusters de mots pour une langue donnée pour l'entreprise Weborama. Description =========== L'objectif est de constituer, valider et affiner des clusters de mots par thématique. Ces clusters sont utilisés à des fins de ciblages comportementaux anonymes. Cet objectif passe par un enrichissement de lexique. L'annotateur sera amené à constituer ou modifier des groupes de mots, que nous appelons clusters, par thèmes (sports, cuisine, Téléphonie etc). Pour cela nous utilisons un lexique interne que nous enrichissons. L'idée consiste donc à ajouter des lemmes dans ces clusters thématiques. Mais pour cela, les lemmes (et les flexions du mot) doivent être présents dans le lexique. Le cluster contient donc que des lemmes. Il faudra souvent ajouter des entités nommées (des lieux, des marques, des personnalités...) au lexique afin de les ajouter aux clusters. Ou éditer le lexique pour corriger des erreurs ou rediriger des formes fléchies vers certains lemmes. La mission linguistique est donc simple, la mission est principalement une mission d'annotation. Toutefois il est important d'avoir une base de linguistique pour gérer un lexique, repérer les mots polysémiques et ambigus et pour bien lemmatiser. On demandera aussi une grande autonomie et/ou culture afin d'agrémenter les clusters les plus spécialisés. Par exemple enrichir une thématique sport si on n'est pas un passionné de sport nécessite de faire des recherches. Le tout étant destiné à un pays en particulier on prendra bien soin d'orienter chacun des clusters vers la culture du pays. Compétences requises ==================== - Langue maternelle parmi une des langues données : anglais américain, russe, espagnol, italien ou néerlandais - Connaissance en linguistique (lexicologie, sémantique) - Autonomie et curiosité (pour chercher à ajouter des entrées concernant des thématiques très spécifiques) Type de contrat =============== En général ce sont des missions payées à l'heure. C'est pourquoi le statut d'auto-entrepreneur/freelance est préféré. Localisation du poste ===================== L'entreprise Weborama est basée à Paris (75019). Toute la mission peut être réalisé en télétravail. Comment postuler ================ Merci de faire parvenir votre candidature à l'adresse suivante en précisant bien dans le sujet du mail la langue pour laquelle vous postulez : rachid at weborama.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:24:37 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:24:37 +0200 Subject: Appel: JeTou 2015 Message-ID: Date: Fri, 12 Sep 2014 00:37:43 +0200 From: Jean-Philippe Fauconnier Message-ID: <54122437.6090704 at irit.fr> X-url: http://www.jetou2015.fr/index-en.htm ** ENGLISH VERSION BELOW ** ------------------------------------------------------------------------ - Deuxième appel à communications - 5e édition des Journées d'études Toulousaines (JéTou 2015) Colloque international des jeunes chercheurs en Sciences du Langage Le(s) Discours en Sciences du Langage : unités et niveaux d'analyse ------------------------------------------------------------------------ Date : 28 et 29 mai 2015 Lieu : Toulouse - France Site : www.jetou2015.fr Contact : contact.jetou2015 at gmail.com Date limite de soumission des résumés : 10 octobre 2014 Les doctorants en Sciences du Langage des laboratoires de l'Université de Toulouse : - CLLE-ERSS (Équipe de Recherche en Syntaxe et Sémantique) - IRIT (Institut de Recherche en Informatique de Toulouse) - OCTOGONE-Lordat (Centre Interdisciplinaire des Sciences du Langage et de la Cognition) organisent la 5e édition des JéTou (Journées d'études Toulousaines). Ces journées s'adressent aux étudiants en Master, aux doctorants et aux jeunes docteurs (jusqu'à trois ans après la soutenance) en Sciences du Langage. Le terme discours, entendu dans son acception large de production langagière multimodale (orale, écrite, verbale, gestuelle) est au coeur même des Sciences du Langage. Qu'elles s'intéressent à sa production ou à sa réception, les méthodes d'investigation ont amené à des niveaux d'analyse aux granularités variables, où se superposent des unités entretenant des relations d'interdépendance fortes. Ainsi, le discours est fonction à la fois de son objet et du sens qui lui est donné. Les enjeux sont communs : planification, segmentation, organisation, modélisation. Ces défis s'accompagnent de réflexions riches sur des terrains différents ; plus que jamais, une pratique interdisciplinaire est essentielle pour progresser dans une compréhension plus fine des différentes facettes du discours. Les recherches effectuées dans ce sens ont pu prendre de multiples formes. Ces dernières années ont par ailleurs vu se réduire l'écart entre modèles théoriques et études empiriques menées sur des données attestées. Qualitatifs ou quantitatifs, ces travaux soulèvent à leur tour de nouvelles interrogations : choix des unités, recueil et annotation des données, démarches d'évaluation, comparaison et interprétation des résultats - pour n'en citer que quelques-unes. Cette édition sera consacrée aux niveaux d'analyse et aux unités dans le discours. Les communications pourront notamment porter sur les domaines suivants : * Phonétique et phonologie : disponibilité et authenticité des corpus oraux, spécificités phonétiques et phonologiques du discours (monolingue ou bilingue) en production et en perception. * Syntaxe, sémantique et pragmatique : macrosyntaxe, sémantique dynamique, argumentation, actes de langage, cadres organisationnels, cohésion, cohérence. * Terminologie et linguistique textuelle : genres des discours, variations, constitutions de corpus, réseaux termino-ontologiques. * Sociolinguistique : diversité des genres, code-switching, code-mixing, variations dialectales. * Psycholinguistique et neurolinguistique : discours pathologiques, discours bilingues, planification, organisation, traitement, développement et vieillissement cognitifs. * Acquisition et apprentissage des langues : apports réciproques entre l'étude du discours et la didactique en langue première ou seconde, interférences. * Traitement automatique des langues : parsing rhétorique, reconnaissance et synthèse de la parole, extraction d'information, importance du discours dans les traitements locaux (étiquetage morpho- syntaxique, reconnaissance d'entités nommées). Toute soumission en lien avec le discours et les sciences du langage sera examinée avec la plus grande attention. Les propositions articulant réflexions théoriques et données attestées seront particulièrement appréciées. Ces JéTou 2015 proposent ainsi une thématique stimulante et ouverte que chaque courant des Sciences du Langage pourra s'approprier à sa manière. Ces journées seront alors l'occasion pour tous ceux qui le souhaitent de s'interroger, de débattre, et de confronter leurs travaux et leurs réflexions dans un cadre transdisciplinaire propice à des échanges constructifs. Conférenciers invités --------------------- * Anne-Catherine Simon, Valibel, Université catholique de Louvain (Louvain-la-Neuve, Belgique) * Nicholas Asher, IRIT, Université Paul Sabatier (Toulouse, France) Modalités de soumission ------------------------- Les propositions de communication (résumé de trois pages au maximum, références incluses, format libre) seront rédigées, au choix, en français ou en anglais et comprendront nécessairement un titre et cinq mots-clés au maximum. Elles doivent être soumises en ligne, via la plate-forme EasyChair : https://www.easychair.org/conferences/?conf=jtou2015 Le retour du comité d'évaluation précisera si la proposition est retenue pour une communication orale (20 min + 10 min d'échange) ou pour une session posters. S'ils le souhaitent, les auteurs sont invités à préciser (à titre indicatif) leur préférence pour l'un des deux formats. Les communications donneront lieu à une publication dans les actes du colloque (5 pages au maximum pour les posters et 10 pages au maximum pour les articles). Critères d'acceptation ---------------------- Chaque soumission sera examinée par au moins deux spécialistes du domaine. Seront considérées en particulier : * l'importance et l'originalité de la contribution ; * la correction du contenu scientifique ; * la discussion critique des résultats, en particulier par rapport aux travaux existants dans le domaine ; * l'organisation et la clarté de la rédaction ; * l'adéquation au thème de la conférence. Calendrier ----------- Date limite de soumission : 10 octobre 2014 Notification d'acceptation : 21 novembre 2014 Remise des articles pour relecture : 16 janvier 2015 Date limite pour l'envoi des versions définitives : 10 avril 2015 Colloque JéTou : jeudi 28 et vendredi 29 mai 2015 à l'Université Toulouse - Jean Jaurès (campus du Mirail) Comité d'organisation ---------------------- Francesca Cortelazzo Jean-Philippe Fauconnier Laury Garnier Luce Lefeuvre Sophie Mayras-Cauchois Olivier Nocaudie Florian Savreux Maxime Warnier Comité scientifique ------------------- Corine Astésano Michel Aurnague Myriam Bras Joan Busquets Mariella Causa Anne Condamines Karine Duvignau Cécile Fabre Françoise Gadet Claudine Garcia-Debanc Hélène Giraudo Nabil Hathout Lydia-Mai Ho-Dac Marie-Paule Jacques Barbara Köpke Michelle Lecolle Vanda Marijanovic Régis Missire Fabio Montermini Danièle Moore Steven Moore Véronique Moriceau Philippe Muller Jean-Luc Nespoulous Musanji Ngalasso-Mwatha Aurélie Picton Laurent Prévot Josette Rebeyrolle Nathalie Rossi-Gensane Halima Sahraoui Patrick Sauzet Catherine Schnedecker Dejan Stosic Ludovic Tanguy Jean-Michel Tarrier Olga Théophanous Pascale Vergely ------------------------------------------------------------------------ - Second call for papers - JéTou - 5th Edition International Conference for Young Researchers in Linguistics Discourse(s) in Linguistics: Units and Levels of Analysis ------------------------------------------------------------------------ Date: May 28th and 29th 2015 Place: Toulouse - France Web Site: http://www.jetou2015.fr/index-en.htm Contact email: contact.jetou2015 at gmail.com Submission deadline for abstracts: October 10th 2014 The doctoral students in Linguistics of the laboratories at Toulouse University, France: - CLLE-ERSS (Équipe de Recherche en Syntaxe et Sémantique) - IRIT (Institut de Recherche en Informatique de Toulouse) - OCTOGONE-Lordat (Centre Interdisciplinaire des Sciences du Langage et de la Cognition) are organizing the 5th edition of JéTou (Journées d'études Toulousaines), an international conference aiming at gathering Master and doctoral students and young researchers (who have defended their dissertation within the past three years) together, from the different disciplines of Linguistics, on an open and multidisciplinary theme. This 2015 edition will be devoted to a reflection on the following theme: "Discourse(s) in Linguistics: Units and Levels of Analysis". The term discourse, understood in its broadest sense as a multimodal language production (oral, written, verbal, gestural) is at the heart of Linguistics. Both in production and reception, investigation methods have led to analysis levels with variable granularities, where overlapping units maintain relationships with strong interdependence. Therefore, discourse depends on both the object and the meaning given to it. Common issues are: planning, segmentation, organization, modeling. A valuable reflection involving different fields arises from these challenges; more than ever, an interdisciplinary practice is necessary to further the various aspects of discourse. Research in these fields has taken different forms. Besides, the gap between theoretical models and empirical studies based on real data has been significantly reduced in the last few years. Qualitative as well as quantitative, these works have raised new questions: choice of units, collection and annotation of corpora, evaluation procedures, comparison and interpretation of results, etc. This edition will focus mainly on levels of analysis and units in discourse. Possible topics include: * Phonetics and Phonology: availability and authenticity of oral corpora, phonetic and phonological features of discourse (monolingual or bilingual) in perception and production. * Syntax, Semantics and Pragmatics: macrosyntax, dynamic semantics, argumentation, speech acts, organizational frameworks, cohesion, coherence. * Terminology and Text Linguistics: genres of discourse, variations, corpus construction, termino-ontological networks. * Sociolinguistics : genre diversity, code-switching, code-mixing, dialectal variations. * Psycholinguistics and Neurolinguistics: pathological speech, bilingual speech, planning, organizing, processing, development and cognitive aging. * Acquisition and Learning of Languages: mutual contributions between the study of discourse and learning L1 and L2, interference. * Natural Language Processing: parsing rhetoric, synthesis and speech recognition, information extraction, importance of discourse in local use (morpho-syntactic tagging, named entity recognition). Obviously, this list does not include all the research possibilities following from the theme of the conference, which is why every submission that addresses the notions of discourse in the Language Sciences will be read and reviewed. Proposals which include theoretical reflections and actual data will be particularly appreciated. JéTou 2015 offers a challenging theme that every field of Language Sciences can adapt for themselves. This conference will give the opportunity, to those who wish to come, to ask questions, discuss and compare their work, their methods, their reflections in an interdisciplinary context, which favours positive interactions and constructive debates. Invited talks ------------ * Nicholas Asher, IRIT, Université Paul Sabatier (Toulouse, France) * Anne-Catherine Simon, Valibel, Université catholique de Louvain (Louvain-la-Neuve, Belgium) Submission Guidelines ----------------------- Submissions must not exceed 3 pages for an oral presentation as well as for a scientific poster. These three pages must include a title, a summary and up to 5 keywords. You can indicate by email your preference for an oral presentation (20 min + 10 min for questions) or for a scientific poster, but the final decision on the format of the presentation will be made by the organization committee alone. Papers should be submitted via the EasyChair conference system: https://www.easychair.org/conferences/?conf=jtou2015 The conference proceedings will be published and given to the participants (5 pages for a scientific poster and 10 pages for an oral presentation). Selection Criteria ------------------ Each submission will be reviewed by at least two experts in the relevant field. The following elements will be considered: * The importance and originality of the contribution. * The validity of the scientific and technical content. * The critical discussion of the results, especially when compared to existing work in the field. * The adequacy with the conference themes. * The organization and clarity of writing. Important dates ---------------- Deadline for abstracts: October 10, 2014 Notification of acceptance: November 21, 2014 Deadline for long papers: January 16, 2015 Deadline for camera-ready: Avril 10, 2015 Conference: Thursday May 28th and Friday May 29th 2015 at Université Toulouse - Jean Jaurès (Mirail campus) Organizing Committee ---------------------- Francesca Cortelazzo Jean-Philippe Fauconnier Laury Garnier Luce Lefeuvre Sophie Mayras-Cauchois Olivier Nocaudie Florian Savreux Maxime Warnier. Scientific Committee --------------------- Corine Astésano Michel Aurnague Myriam Bras Joan Busquets Mariella Causa Anne Condamines Karine Duvignau Cécile Fabre Françoise Gadet Claudine Garcia-Debanc Hélène Giraudo Nabil Hathout Lydia-Mai Ho-Dac Marie-Paule Jacques Barbara Köpke Michelle Lecolle Vanda Marijanovic Régis Missire Fabio Montermini Danièle Moore Steven Moore Véronique Moriceau Philippe Muller Jean-Luc Nespoulous Musanji Ngalasso-Mwatha Aurélie Picton Laurent Prévot Josette Rebeyrolle Nathalie Rossi-Gensane Halima Sahraoui Patrick Sauzet Catherine Schnedecker Dejan Stosic Ludovic Tanguy Jean-Michel Tarrier Olga Théophanous Pascale Vergely ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:08:20 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:08:20 +0200 Subject: Job: PostDoc Position in Personalised Information Retrieval and Knowledge Discovery, Trinity College, Dublin Message-ID: Date: Thu, 11 Sep 2014 15:43:24 +0100 From: Séamus Lawless Message-Id: X-url: https://www.scss.tcd.ie/seamus.lawless/PD-SD.pdf Fixed term contract up to 31 August, 2015 CNGL Centre for Global Intelligent Content, Knowledge & Data Engineering Group (KDEG), School of Computer Science & Statistics (SCSS) Salary: Appointment will be made on the SFI Level 2B Post-Doctoral Researcher Salary Scale (€42,394 to €46,255) Closing Date and Time: 12 noon on Tuesday 30 September, 2014 A full job spec and application procedure can be found at - https://www.scss.tcd.ie/seamus.lawless/PD-SD.pdf Post Summary CNGL is seeking a Post-Doctoral Researcher to further research within the areas of: Personalised Information Retrieval, Explorative Knowledge Discovery, Web Search, and Result Diversification. This is part of the collaborative research taking place under the Search and Discovery theme within CNGL. Background and Funding The CNGL Centre for Global Intelligent Content is a €50M Academia-Industry partnership, funded jointly by Science Foundation Ireland (SFI) and Industry. CNGL has entered a second cycle of funding and is now seeking researchers to join the team at Trinity College Dublin. CNGL is an active collaboration between researchers at Trinity College Dublin (TCD), Dublin City University (DCU), University College Dublin (UCD), University of Limerick (UL), as well as several industrial partners, including Microsoft, Symantec, Intel, DNP, Welocalize, and a number of SMEs. CNGL comprises over 100 researchers across the various institutions developing novel technologies addressing key challenges in the global digital content and services supply chain. CNGL is also involved in a large number of European FP7 projects, as well as commercial projects in the areas of language technologies, information retrieval and digital content management. Standard Duties and Responsibilities Contribute to high quality collaborative research, and publish the work in top international journals and conferences. Pro-actively work with other researchers in coordinating collaboration across research themes, across research challenge groups and across member institutions to successfully deliver research prototype systems (as part of CNGL’s Showcase Scenario Programme). Assist the Operations team in the planning and organisation of demonstration of collaborative research outcomes at public events. Track, monitor and report on progress and performance. Provide regular updates on progress to relevant stakeholders, alerting them to emerging issues or timeline slippage in a timely fashion. Mitigate risk and take corrective action as required. Liaise closely with CNGL’s Intellectual Property Manager and Commercialisation Manager in assessing research outputs for IP protection and commercial potential. Candidate Specification Qualifications PhD in a relevant field (e.g. Information Retrieval, Cross-Language Information Retrieval, Personalisation, Adaptive Hypermedia, etc.). Knowledge and Experience Background in one or more of CNGL’s research areas (e.g. Search Systems, Personalisation and Adaptivity, Digital Content Management, Natural Language Processing, Machine Translation and Localisation, Multilingual Information Retrieval, etc.). A good publications record in reputable international journals/conferences/workshops. Hands-on experience with developing software components. Experience with research project management within an academic research environment is a plus. Industry experience is a plus and would provide a distinct advantage for the applicant. Skills and Competencies Competency in programming, web development, and databases (desirable: Java, HTML, CSS, Javascript, XML, advanced web development frameworks, any RDBMS tool). Mobile application development is a plus. Strong interest in applied research and in the application of research outcomes to solve societal and industry problems. Excellent communication skills, both written and oral. Excellent academic writing skills (clear, concise and error-free writing; free of grammatical and punctuation errors). Excellent interpersonal skills and an ability to build and nurture work relationships. Strong problem solving and analytical skills and an ability to learn quickly. A strategic thinker that doesn’t lose sight of overall research goals and priorities. A pro-active self-starter with the ability to encourage and stimulate cross-group collaboration. Ability to work effectively cross-organisationally and cross culturally. Ability to operate effectively as part of a team – tolerant, cordial and willing to help others, shares work and information; establishes rapport with others. Ability to handle multiple tasks simultaneously and meet all deadlines. Many thanks, Prof. Séamus Lawless ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 08:51:31 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 10:51:31 +0200 Subject: Seminaire: Seminaire en l'honneur de Hans Kamp, 8 octobre 2014, Nancy Message-ID: Date: Mon, 15 Sep 2014 11:24:24 +0200 From: Maxime Amblard Message-Id: <74C5F283-D666-464D-808B-4E2CA38D41CD at loria.fr> X-url: http://hk-workshop.loria.fr [Excusez les envois multiples] [English version below] Merci de faire suivre aux collègues et étudiants intéressés. ************************************ Appel à participation ************************************ Séminaire en l'honneur de HANS KAMP Mercredi 8 octobre 2014 salle internationale MSH-Lorraine http://hk-workshop.loria.fr ************************************ Un séminaire en l'honneur de Hans KAMP se tiendra à Nancy à l'occasion de la remise du titre de Doctor Honoris Causa de l'Université de Lorraine. Hans Kamp (Johan Anthony Willem Kamp) est un philosophe, linguiste, et logicien néerlandais. Ses travaux en sémantique formelle et plus particulièrement sa théorie des représentations discursives (Discourse Representation Theory) sont largement utilisés tant en linguistique qu'en informatique dans le cadre du traitement automatique de la langue. Le séminaire portera sur la sémantique du discours, en particulier sur les questions de structure et de dynamique, à partir de la DRT. Le séminaire se tiendra en salle internationale de la MSH-Lorraine. Les présentations seront faites en anglais. Le séminaire est organisé par les Archives Poincaré, le LORIA et l'ATILF et il est soutenu par la MSH-Lorraine, l'Université de Lorraine, le CNRS et l'INRIA. La participation est libre mais l'inscription est obligatoire. Le programme et les inscriptions sont accessibles en ligne : http://hk-workshop.loria.fr ************************************ Conférenciers invités : + Nicholas ASHER, Université Paul Sabatier, France + Paul DEKKER, Université d'Amsterdam, Pays-Bas + Bart GEURTS, Université de Nijmegen, Pays-Bas + Irène HEIM, Massachusetts Institute of Technology, États-Unis + Klaus von HEUSINGER, Université de Cologne, Allemagne + Hans KAMP, Université de Stuttgart, Allemagne ************************************ Le Séminaire est organisé par : + Maxime AMBLARD (Loria, Inria, CNRS, Université de Lorraine) + Philippe de GROOTE (Inria) + Michel MUSIOL (ATILF, UFR SHS Nancy, CNRS, Université de Lorraine) + Manuel REBUSCHI (LHSP-Archives Poincaré, CNRS, Université de Lorraine) Avec le soutien de: CNRS, Université de Lorraine, INRIA, MSH Lorraine, LORIA, LHSP– Archives Henri-Poincaré, ATILF, UFR-SHS (Nancy) ------------------------------------------------------------------------ [Apologies for cross-postings] [French version above] Please send it to interested colleagues and students. Thanks! ************************************ Call for participation ************************************ Workshop in honor of HANS KAMP Wednesday, October 8, 2014 International Room, MSH-Lorraine http://hk-workshop.loria.fr ************************************ A workshop in honor of Hans KAMP will be held on the occasion of the award of a Doctor Honoris Causa degree from the University of Lorraine. Hans Kamp (Johan Anthony Willem Kamp) is a Dutch philosopher, linguist and logician. His work in formal semantics, most notably his Discourse Representation Theory, is widely used both in linguistics and in natural language processing. The workshop will focus on discourse semantics, especially on issues of its structure and dynamics, based on DRT. The workshop will be held in the International Room of the MSH-Lorraine. Talks will be in English. The workshop is organised by Archives Poincaré, LORIA and ATILF, and it is supported by MSH-Lorraine, Université de Lorraine, CNRS and INRIA. There is no fees, but you need to be registered. Program and registration are available here: http://hk-workshop.loria.fr ************************************ Invited speakers: + Nicholas ASHER, Université Paul Sabatier, France + Paul DEKKER, Universiteit van Amsterdam, the Netherlands + Bart GEURTS, Universiteit van Nijmegen, the Netherlands + Irène HEIM, Massachusetts Institute of Technology, USA + Klaus von HEUSINGER, Universität zu Köln, Germany + Hans KAMP, Universität zu Stuttgart, Germany ************************************ Organisation commitee: + Maxime AMBLARD (Loria, Inria, CNRS, Université de Lorraine) + Philippe de GROOTE (Inria) + Michel MUSIOL (ATILF, UFR SHS Nancy, CNRS, Université de Lorraine) + Manuel REBUSCHI (LHSP-Archives Poincaré, CNRS, Université de Lorraine) Supported by: CNRS, Université de Lorraine, INRIA, MSH Lorraine, LORIA, LHSP– Archives Henri-Poincaré, ATILF, UFR-SHS (Nancy) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 08:49:51 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 10:49:51 +0200 Subject: Appel: IWSDS 2015 Message-ID: Date: Mon, 15 Sep 2014 11:13:49 +0200 From: pap Message-ID: <5416ADCD.2010100 at limsi.fr> X-url: http://www.iwsds.org/ IWSDS 2015 http://www.iwsds.org/ Call For Papers The Sixth International Workshop on Spoken Dialog System (IWSDS 2015) will be held in Busan, South Korea, on Jan 11-13, 2015. The IWSDS workshop series provides an international forum for the presentation of research and applications and for lively discussions among researchers as well as industrialists, with a special interest to the practical implementation of Spoken Dialog Systems in everyday applications. IWSDS 2015 designates “Dialog System and Intelligent Assistant” as a theme of discussion. Topics Submission of papers in all areas of spoken dialog system is encouraged, with emphasis on the following traditional topics, but not limited to: - Speech recognition and synthesis - Speaker/language recognition - Spoken language understanding - Dialog management - User modeling / simulation - Evaluation of dialog system - Multi-modality / emotion recognition from speech - Question answering from speech - Speech data mining - Language resource and databases - Machine learning for spoken dialog systems - Educational and healthcare applications We would also like to encourage the discussion of the following special topics: - Personal assistant with dialog systems - Proactive and anticipatory computing - Dialog systems connected to knowledge base - Big data for large scale spoken dialog system Important Dates Paper Submission: September 21, 2014 Notification of Acceptance: October 27, 2014 Demo Submission/Acceptance: TBD Submission Procedure Authors are invited to submit full-length, 8-12 page papers (long) or 4-6 page papers (short), including references, to the IWSDS 2015 web site (http:// www.iwsds.org/). As usual, proceedings are to be published by Springer post conference book. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 12:26:21 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 14:26:21 +0200 Subject: Job: Post-doctoral position in NLP, Strasbourg, France Message-ID: Date: Wed, 17 Sep 2014 08:15:08 +0200 From: Delphine Bernhard Message-ID: <541926EC.9080801 at unistra.fr> X-url: http://icube-bfo.unistra.fr/en/index.php/Open_internship,_PhD_and_post-doc_positions The BFO team of ICube proposes a post-doctoral position in Strasbourg (France) for 12 months starting in January 2015 within the NERD (Named Entities in Relational Databases) research project. The goal of the project is to derive knowledge from unstructured and, more importantly, unlabelled data in relational databases. Databases often contain fragmented information such as addresses, descriptions, colours, labels, telephone numbers, etc. As such, they contain information that is not accompanied by the additional context that would be present within a natural language document and would be exploited by current state-of-the-art algorithms (for example the contextual information that would be derived from a sentence's structure or surrounding words). Of course, databases may also contain natural language documents, but this is the exception (in commercial databases) rather than the norm. Nevertheless, the developed algorithms should be applicable to the spectrum of documents that range between sparse (traditional business) databases and dense (natural language) databases. Experiments on real world databases is expected and access to an extensive corpus of data will be provided. The partners of the project are: The BFO group of ICube, specialized in data mining and knowledge engineering The FDT group of LiLPa, specialized in natural language processing The Quantup Laboratory, experienced in the application of machine learning/pattern recognition methods to commercial database systems Candidates applying for this position should have a PhD in Computer Science with a good background in Natural Language Processing, Machine Learning and formal Knowledge Representation. Experience in Java programming and distributed systems (for example using the Map-Reduce framework and/or Spark) is desired. A good knowledge of English is required along with an intermediate level of French. Candidates should send an academic curriculum vitae (including a list of publications and the names and contact details of two referees), along with a cover letter. Deadline for application: 31st October 2014 Expected starting date: January 2015 (flexible) Contact: Delphine Bernhard (dbernhard at unistra.fr) and Tom Lampert (t.lampert at laboquantup.eu) Salary: 2200 € per month (net, not including income tax). Call for applications: http://icube-bfo.unistra.fr/en/index.php/Open_internship,_PhD_and_post-doc_positions ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 13:24:00 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 15:24:00 +0200 Subject: Seminaire: Inria, Big Data, nouvelles partitions de l=?UTF-8?Q?=E2=80=99information=2C_?=5 au 10 octobre 2014, Saint-Paul-Les-Dax (Landes) Message-ID: Date: Wed, 17 Sep 2014 12:34:09 +0200 (CEST) From: Pascale Sebillot Message-ID: <1509243104.6635096.1410950049068.JavaMail.zimbra at irisa.fr> X-url: http://www.inria.fr/actualite/agenda/big-data-nouvelles-partitions-de-l-information Séminaire Inria : "Big Data, nouvelles partitions de l’information" Actualités IST May 18, 2014 "Big Data, nouvelles partitions de l’information " tel est le thème du séminaire IST Inria, qui aura lieu du 5 au 10 octobre 2014. Le thème du "Big Data" est souvent traité ces temps-ci, mais rarement du point de vue des professionnels de l’information et de la documentation : c’est cette lacune que le séminaire 2014 va tenter de combler. Avec les interventions de : * Charles Huot (Temis, Alliance Big Data) : Le Big Data, si nous en parlions ? Les modèles techniques et économiques déjà en place et en œuvre. Pour découvrir la démarche à suivre pour monter un projet Big Data au sein de votre organisation. * Julien Masanès (Internet Memory Foundation) : La magie des séries et des grands nombres : ce que l’on peut faire avec le Big Data et les archives * Pascale Sébillot (IRISA / INSA Rennes) : Le TAL face aux données textuelles volumineuses et potentiellement dégradées : qu’est-ce que cela change? * Jean Carrive (Ina) : Analyse automatique de l’image et du son pour l’enrichissement de contenus audiovisuels * Francis André (Cnrs) : Déluge des données de la recherche ? Petit manuel d’immersion. Curation, infrastructures et partage. * Véronique Mesguich, co-présidente de l’ADBS : Extension du domaine de la veille : l’apport des données massives * Stéphane Grumbach (Inria) : Des données à l’intermédiation, une évolution économique et politique * Dominique Cardon (SENSE/Orange et université de Marne la Vallée / LATTS) : Calculer le web : 1. Typologie des métriques du web ; 2. Les sciences sociales et les données numériques Détails et inscriptions http://www.inria.fr/actualite/agenda/big-data-nouvelles-partitions-de-l-information ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 08:53:20 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 10:53:20 +0200 Subject: Journee: Promotion et Developpement de l'Intelligence Artificielle, Univ. Paris Dauphine, Paris, 2 octobre 2014 Message-ID: Date: Mon, 15 Sep 2014 13:58:19 +0200 From: Secretaire AFIA Message-Id: <481653D4-602E-47AD-8D50-069E1DD21E95 at afia.asso.fr> X-url: http://www.afia.asso.fr/tiki-index.php?page=Journ%C3%A9e+pour+la+Promotion+et+le+D%C3%A9veloppement+de+l%E2%80%99Intelligence+Artificielle+-+2+octobre+2014 --- Merci de relayer ce message auprès des personnes intéressées --- Le 2 octobre 2014, l'Association Française pour l'Intelligence Artificielle organise une journée d'interventions pour la promotion et le développement de l' Intelligence Artificielle. Cette journée est placée sous le Haut Patronage du MESR DGRI, du CNRS INS2I et d’Inria. Programme de la journée : 09:00 - Accueil des participants 09:30 - 10:00 Ouverture (par les représentants de l'AFIA, du MESR DGRI, du CNRS INS2I et d'Inria) 10:00 - 10:45 Andreas Herzig (IRIT, CNRS) - Quelles logiques pour les systèmes multi-agents ? 11:00 - 11:45 François Pachet (Sony CSL, Sony) - Créativité et style : de nouveaux problèmes pour l'IA 11:45 - 12:30 Hélène Fargier (IRIT, CNRS) - Problèmes combinatoires de décision sous incertitude 12:30 - 14:00 BUFFET 14:00 - 14:45 Jérôme Euzenat (LIG, Inria) - Représenter, communiquer, échouer 14:45 - 15:30 Leila Amgoud (IRIT, CNRS) - La théorie computationnelle de l'argumentation Date : 2 Octobre 2014, 9h00-16h00. Lieu : Salle A709, (7ème étage de la nouvelle aile) Université Paris-Dauphinen Place du Maréchal de Lattre de Tassigny 75775 PARIS Cedex 16 Inscription : L’accès à la journée PDIA 2014 sera limité aux seules personnes qui se seront inscrites sur le site des inscriptions avant le 29 septembre 2014. Merci de confirmer votre présence en vous rendant sur ce site : http://inscriptions.afia.asso.fr Plus d'information : http://www.afia.asso.fr/tiki-index.php?page=Journ%C3%A9e+pour+la+Promotion+et+le+D%C3%A9veloppement+de+l%E2%80%99Intelligence+Artificielle+-+2+octobre+2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 13:25:25 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 15:25:25 +0200 Subject: Conf: 3emes journees Unitex/Gramlab, 3rd UNITEX/GramLab Workshop, 9-10 octobre 2014, Universite Francois Rabelais, Tours Message-ID: Date: Wed, 17 Sep 2014 12:56:41 +0200 (CEST) From: Denis Maurel Message-ID: <449956801.2591297.1410951401174.JavaMail.zimbra at univ-tours.fr> X-url: http://tln.li.univ-tours.fr/Tln_Colloques/Tln_JUnitex2014/Tln_JUnitex2014.html X-url: http://tln.li.univ-tours.fr/Tln_Colloques/Tln_JUnitex2014/Tln_JUnitex2014_eng.html English below. 3èmes journées Unitex/Gramlab 9-10 octobre 2014, Université François Rabelais Tours Programme et inscription sur http://tln.li.univ-tours.fr/Tln_Colloques/Tln_JUnitex2014/Tln_JUnitex2014.html Unitex est une plate-forme open-source d’analyse de texte largement utilisée en recherche, dans l’enseignement et l’industrie. Le système GramLab/Unitex offre en plus aux équipes le travail collaboratif (partage de ressources, suivi de versions, etc.). Ces outils reposent sur des technologies de type « automates à états finis » et incorporent des ressources linguistiques à large couverture, disponibles dans de nombreuses langues. Les journées Unitex/GramLab sont un forum qui a pour ambition de rassembler la communauté des chercheurs et industriels utilisant Unitex et GramLab pour leurs travaux (tous domaines confondus) ou participant au développement de cette plate-forme et de ses ressources. L’objectif principal de cet événement est de favoriser le partage d’expérience et les contacts entre utilisateurs et développeurs. Le programme présentera un éventail des recherches en cours et offrira une série de formations pratiques de différents niveaux aux chercheurs qui souhaitent utiliser ce système ou découvrir de nouvelles fonctionnalités. Inscriptions : - Avant le 30 septembre : 25 euros/jours - Après le 30 septembre : 35 euros /jours Comité de lecture Antonio Balvet, STL, Université de Lille 3 Matthieu Constant, IGM, Université de Marne-la-Vallée Anne Dister, Université Saint-Louis - Bruxelles Cédrick Fairon, CENTAL, Université catholique de Louvain Nathalie Friburger, LI, Université François Rabelais Tours Cvetana Krstev, Université de Belgrade Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Éric Laporte, IGM, Université de Marne-la-Vallée Denis Maurel, LI, Université François Rabelais Tours Thierry Poibeau, LaTTice, CNRS Duško Vitas, Université de Belgrade Gilles Vollant, Ergonotics Comité d’organisation Nathalie Friburger, Université François Rabelais Tours Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Claude Martineau, LIGM, Université Paris-Est Marne-la-Vallée Denis Maurel, Université François Rabelais Tours Agata Savary, LI, Université François Rabelais Tours Comité de pilotage Cédrick Fairon, CENTAL, Université catholique de Louvain Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Éric Laporte, IGM, Université de Marne-la-Vallée Denis Maurel, Université François Rabelais Tours Gaelle Recource, Kwaga Duško Vitas, Université de Belgrade ------------------------------------------------------------------------ 3 rd UNITEX/GramLab Workshop October 9-10, 2014, Université François Rabelais Tours Program and registration http://tln.li.univ-tours.fr/Tln_Colloques/Tln_JUnitex2014/Tln_JUnitex2014_eng.html Unitex is an open-source text analysis software widely used in research, teaching and industry (http://www-igm.univ-mlv.fr/~unitex/). It relies on Finite State technologies and incorporates large-scale language resources for several languages. GramLab is an Integrated Development Environment (IDE), based on Unitex software components but specifically designed for industrial purposes. It integrates tools that help collaborative development, versioning, etc. The Unitex/GramLab Workshop aims at gathering academic and industrial users, developers and researchers contributing to the development of this open-source software and its resources or using them for developing new research or industrial applications. It is also a unique opportunity for new users to learn the basic and advanced Unitex techniques and discuss their projects with experts during hands-on sessions. Registration - Until September 30, 2013: 25 euros/day - After September 30, 2013: 35 euros/day Scientific Committee Antonio Balvet, STL, Université de Lille 3 Matthieu Constant, IGM, Université de Marne-la-Vallée Anne Dister, Université Saint-Louis - Bruxelles Cédrick Fairon, CENTAL, Université catholique de Louvain Nathalie Friburger, LI, Université François Rabelais Tours Cvetana Krstev, Université de Belgrade Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Éric Laporte, IGM, Université de Marne-la-Vallée Denis Maurel, LI, Université François Rabelais Tours Thierry Poibeau, LaTTice, CNRS Duško Vitas, Université de Belgrade Gilles Vollant, Ergonotics Organizing Committee Nathalie Friburger, Université François Rabelais Tours Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Claude Martineau, LIGM, Université Paris-Est Marne-la-Vallée Denis Maurel, Université François Rabelais Tours Agata Savary, LI, Université François Rabelais Tours Steering Committee Cédrick Fairon, CENTAL, Université catholique de Louvain Tita Kyriacopoulou, IGM, Université de Marne-la-Vallée Éric Laporte, IGM, Université de Marne-la-Vallée Denis Maurel, Université François Rabelais Tours Gaelle Recource, Kwaga Duško Vitas, Université de Belgrade ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 08:46:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 10:46:35 +0200 Subject: Appel: LATA 2015 Message-ID: Date: Sun, 14 Sep 2014 13:07:39 +0200 From: "GRLMC" Message-ID: <0ACA8161C59F42F2A4910C5720612170 at Carlos1> X-url: http://grammars.grlmc.com/lata2015/ ************************************************************************ 9th INTERNATIONAL CONFERENCE ON LANGUAGE AND AUTOMATA THEORY AND APPLICATIONS LATA 2015 Nice, France March 2-6, 2015 Organized by: CNRS, I3S, UMR 7271 Nice Sophia Antipolis University Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/lata2015/ ************************************************************************ AIMS: LATA is a conference series on theoretical computer science and its applications. Following the tradition of the diverse PhD training events in the field developed at Rovira i Virgili University in Tarragona since 2002, LATA 2015 will reserve significant room for young scholars at the beginning of their career. It will aim at attracting contributions from classical theory fields as well as application areas. VENUE: LATA 2015 will take place in Nice, the second largest French city on the Mediterranean coast. The venue will be the University Castle at Parc Valrose. SCOPE: Topics of either theoretical or applied interest include, but are not limited to: algebraic language theory algorithms for semi-structured data mining algorithms on automata and words automata and logic automata for system analysis and programme verification automata networks automata, concurrency and Petri nets automatic structures cellular automata codes combinatorics on words computational complexity data and image compression descriptional complexity digital libraries and document engineering foundations of finite state technology foundations of XML fuzzy and rough languages grammars (Chomsky hierarchy, contextual, unification, categorial, etc.) grammatical inference and algorithmic learning graphs and graph transformation language varieties and semigroups language-based cryptography parallel and regulated rewriting parsing patterns power series string and combinatorial issues in bioinformatics string processing algorithms symbolic dynamics term rewriting transducers trees, tree languages and tree automata unconventional models of computation weighted automata STRUCTURE: LATA 2015 will consist of: invited talks peer-reviewed contributions INVITED SPEAKERS: Paola Inverardi (L’Aquila), Synthesis of Protocol Adapters Johann A. Makowsky (Technion, Haifa), Hankel Matrices for Graph Parameters and Graph Grammars Giancarlo Mauri (Milano Bicocca), Complexity Classes for Membrane Systems Andreas Podelski (Freiburg), Automated Program Verification Antonio Restivo (Palermo), The Shuffle Product: New Research Directions PROGRAMME COMMITTEE: Andrew Adamatzky (West of England, Bristol, UK) Andris Ambainis (Latvia, Riga, LV) Franz Baader (Dresden Tech, DE) Rajesh Bhatt (Massachusetts, Amherst, US) José-Manuel Colom (Zaragoza, ES) Bruno Courcelle (Bordeaux, FR) Erzsébet Csuhaj-Varjú (Eötvös Loránd, Budapest, HU) Aldo de Luca (Naples Federico II, IT) Susanna Donatelli (Turin, IT) Paola Flocchini (Ottawa, CA) Enrico Formenti (Nice, FR) Tero Harju (Turku, FI) Monika Heiner (Brandenburg Tech, Cottbus, DE) Yiguang Hong (Chinese Academy, Beijing, CN) Kazuo Iwama (Kyoto, JP) Sanjay Jain (National Singapore, SG) Maciej Koutny (Newcastle, UK) Antonín Kučera (Masaryk, Brno, CZ) Thierry Lecroq (Rouen, FR) Salvador Lucas (Valencia Tech, ES) Veli Mäkinen (Helsinki, FI) Carlos Martín-Vide (Rovira i Virgili, Tarragona, ES, chair) Filippo Mignosi (L’Aquila, IT) Victor Mitrana (Madrid Tech, ES) Ilan Newman (Haifa, IL) Joachim Niehren (INRIA, Lille, FR) Enno Ohlebusch (Ulm, DE) Arlindo Oliveira (Lisbon, PT) Joël Ouaknine (Oxford, UK) Wojciech Penczek (Polish Academy, Warsaw, PL) Dominique Perrin (ESIEE, Paris, FR) Alberto Policriti (Udine, IT) Sanguthevar Rajasekaran (Connecticut, Storrs, US) Jörg Rothe (Düsseldorf, DE) Frank Ruskey (Victoria, CA) Helmut Seidl (Munich Tech, DE) Ayumi Shinohara (Tohoku, Sendai, JP) Bernhard Steffen (Dortmund, DE) Frank Stephan (National Singapore, SG) Paul Tarau (North Texas, Denton, US) Andrzej Tarlecki (Warsaw, PL) Jacobo Torán (Ulm, DE) Frits Vaandrager (Nijmegen, NL) Jaco van de Pol (Twente, Enschede, NL) Pierre Wolper (Liège, BE) Zhilin Wu (Chinese Academy, Beijing, CN) Slawomir Zadrozny (Polish Academy, Warsaw, PL) Hans Zantema (Eindhoven Tech, NL) ORGANIZING COMMITTEE: Sébastien Autran (Nice) Adrian Horia Dediu (Tarragona) Enrico Formenti (Nice, co-chair) Sandrine Julia (Nice) Carlos Martín-Vide (Tarragona, co-chair) Christophe Papazian (Nice) Julien Provillard (Nice) Pierre-Alain Scribot (Nice) Bianca Truthe (Giessen) Florentina Lilica Voicu (Tarragona) SUBMISSIONS: Authors are invited to submit non-anonymized papers in English presenting original and unpublished research. Papers should not exceed 12 single-spaced pages (including eventual appendices, references, etc.) and should be prepared according to the standard format for Springer Verlag's LNCS series (see http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0). Submissions have to be uploaded to: https://www.easychair.org/conferences/?conf=lata2015 PUBLICATIONS: A volume of proceedings published by Springer in the LNCS series will be available by the time of the conference. A special issue of the Journal of Computer and System Sciences (Elsevier, 2013 JCR impact factor: 1.0) will be later published containing peer-reviewed substantially extended versions of some of the papers contributed to the conference. Submissions to it will be by invitation. REGISTRATION: The period for registration is open from July 21, 2014 to March 2, 2015. The registration form can be found at: http://grammars.grlmc.com/lata2015/Registration.php DEADLINES: Paper submission: October 10, 2014 (23:59 CET) Notification of paper acceptance or rejection: November 18, 2014 Early registration: November 25, 2014 Final version of the paper for the LNCS proceedings: November 26, 2014 Late registration: February 16, 2015 Submission to the journal special issue: June 6, 2015 QUESTIONS AND FURTHER INFORMATION: florentinalilica.voicu at urv.cat POSTAL ADDRESS: LATA 2015 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34 977 559 543 Fax: +34 977 558 386 ACKNOWLEDGEMENTS: Nice Sophia Antipolis University Rovira i Virgili University ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 19:48:19 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 21:48:19 +0200 Subject: Appel: Journee Ethique et Agents Autonomes, 6/11/14, Paris Message-ID: Date: Wed, 17 Sep 2014 18:29:07 +0200 From: Olivier Boissier Message-Id: <6965B899-ADC9-4E62-9500-7C7D87DF4CDE at emse.fr> X-url: http://ethicaa.org -- Merci de relayer ce message auprès des personnes intéressées --- Journée "Ethique et Agents Autonomes" L'autonomie de décision et d'action d'agents logiciels, humains ou robotiques est une propriété fondamentale des problématiques informatiques actuelles. Elle est devenue une caractéristique essentielle de nombreuses applications qui participent à la numérisation de notre société (commerce électronique, jeux interactifs, intelligence ambiante, assistance aux personnes, robotique sociale ou collective, robotique civile et militaire ...) Dans un tel contexte, la question d'une régulation ou d'un contrôle éthique des agents logiciels ou robotiques ainsi que des systèmes constitués d’humains et d’agents autonomes se pose actuellement de manière prégnante. Cette question est par nature transverse à de multiples disciplines. Le projet ETHICAA (http://ethicaa.org) organise une journée de travail sur ce thème afin de croiser les questionnements et les approches, et de créer une communauté de réflexion sur ces sujets. Le programme de la journée est en cours de construction, sur la base d’interventions invitées. Cependant une session spéciale sera consacrée à des présentations courtes (5 min. / 3 planches) décrivant un défi à étudier dans le cadre de ces problématiques Ethique et Agents Autonomes. Chaque présentation fera l'objet de discussions. Appel à contribution : Les personnes intéressées pour participer à cette session sont invitées à envoyer un court résumé (5 lignes - 70 mots) de leur intervention à contact at ethicaa.org avant le 20 octobre 2014. Modalités pratiques : La journée aura lieu le 6 novembre 2014 de 9h00 à 17h00 à l'Université Pierre et Marie Curie à Jussieu, Paris. Pour des raisons de logistique, inscription auprès de contact at ethicaa.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:19:57 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:19:57 +0200 Subject: Ressources: Release 2014 of DGT-TM (parallel corpus in 24 languages) Message-ID: Date: Thu, 18 Sep 2014 15:35:16 +0200 From: Ralf Steinberger Message-id: <001e01cfd345$61db2630$25917290$@jrc.ec.europa.eu> X-url: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory X-url: http://ec.europa.eu/dgs/translation/index_en.htm X-url: http://europa.eu/abc/eurojargon/index_en.htm X-url: https://ec.europa.eu/jrc/en/language-technologies Readers on this list may be interested to hear that the 2014 release of the DGT-Translation Memory is now available for download. DGT-TM is an extraction of the translation memory of the European Institutions for all official EU languages, produced by the European Commission’s Directorate General for Translation (DGT) and distributed by the Joint Research Centre (JRC). Translation memories are sentences and their manually produced translations. The new release is called DGT-TM-2014. It follows the previous releases, DGT-TM (2007), DGT-TM-2011, DGT-TM-2012 and DGT-TM-2013. DGT-TM-2014 adds over eleven million translation units to the previous 73 million translation units, resulting in almost 85 million translation units in total (almost 1.4 billion words). New features of DGT-TM-2014 are: - Croatian (HR) data is made available for the first time. - Significantly more data for languages with previously less coverage (e.g. Bulgarian, Irish, Maltese, Romanian); - Mostly about 500K new translation units per language. - Most documents of this release were translated in 2013, but it also contains previously unpublished documents from older years. - More data for language pairs involving Maltese are available on request. Languages: All 276 language pairs involving the following 24 languages: Bulgarian, Croatian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Irish, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish and Swedish. URL: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory Creator: European Commission - Directorate General for Translation (http://ec.europa.eu/dgs/translation/index_en.htm - DGT) WHAT IS DGT-TM The ‘Acquis Communautaire’ (http://europa.eu/abc/eurojargon/index_en.htm) is the entire body of European legislation, comprising all the treaties, regulations and directives adopted by the European Union (EU). Since each new country joining the EU is required to accept the whole Acquis Communautaire, this body of legislation has been translated into 23 official languages. For the 24th official EU language, Irish, the Acquis has not been translated on a regular basis; which is why DGT-TM includes less data in Irish. The Acquis Communautaire was split into sentences and aligned automatically at sentence level, resulting in the DGT translation memory, DGT-TM. The text data is accompanied by software that allows to extract all sentences and their translations for any of the 276 possible language pair combinations. MOTIVATION FOR THIS RELEASE The public data release is in line with the general effort of the European Commission to support multilingualism, language diversity and the re-use of Commission information. It follows the release of a number of further multilingual data sets: - the JRC-Acquis parallel corpus in 2006 (over 1 billion words in 22 languages), - the DGT-TM Translation Memory in 2007, - the multilingual named entity resource JRC-Names in 2011, - the multilingual multi-label classification tool (and accompanying text data) JRC EuroVoc Indexer (JEX) (22 languages) in 2012, - the ECDC-TM Translation Memory in 2012 (domain: Public Health) - the DGT-Acquis parallel corpus in 2012, - the EAC-TM Translation Memory in 2013 (domain: Education and Culture), - and further smaller multilingual resources. See https://ec.europa.eu/jrc/en/language-technologies for more information on these resources. WHAT DGT-TM CAN BE USED FOR DGT-TM can be fed into translation memory software to support human translators in their work. As it is a large parallel corpus in electronic form, it can furthermore be used by specialists in computational linguistics to train statistical machine translation software, to generate multilingual dictionaries, to train and test multilingual information extraction software, and more. MORE INFORMATION ON DGT-TM At http://langtech.jrc.ec.europa.eu/JRC_Publications.html , you find detailed publications on the JRC’s multilingual language technology activity (http://langtech.jrc.ec.europa.eu/JRC_Publications.html). For details specifically on DGT-TM, you can read: Steinberger Ralf, Andreas Eisele, Szymon Klocek, Spyridon Pilos & Patrick Schlüter (2012). DGT-TM: A freely Available Translation Memory in 22 Languages. Proceedings of the 8th international conference on Language Resources and Evaluation (LREC'2012), Istanbul, 21-27 May 2012. (http://langtech.jrc.ec.europa.eu/Documents/2012_LREC_DGT-TM_Final.pdf) The following recent article compares all freely available Language Technology resources distributed by the JRC and provides comparative background information: Steinberger Ralf, Mohamed Ebrahim, Alexandros Poulis, Manuel Carrasco-Benitez, Patrick Schlüter, Marek Przybyszewski & Signe Gilbro (2014). An overview of the European Union's highly multilingual parallel corpora. Language Resources and Evaluation Journal (LRE). DOI: 10.1007/s10579-014-9277-0. (http://langtech.jrc.ec.europa.eu/Documents/2014_08_LRE-Journal_JRC-Linguistic-Resources_Manuscript.pdf, http://link.springer.com/article/10.1007/s10579-014-9277-0> WHAT NEXT? The release of the very large new parallel corpus DCEP (http://www.lrec-conf.org/proceedings/lrec2014/pdf/943_Paper.pdf - Digital Corpus of the European Parliament) is pending. Ralf Steinberger (http://langtech.jrc.ec.europa.eu/RS.html) European Commission - Joint Research Centre (JRC) 21027 Ispra (VA), Italy URL – Applications: http://emm.newsbrief.eu/overview.html URL – Resources: https://ec.europa.eu/jrc/en/language-technologies URL – Publications: http://langtech.jrc.ec.europa.eu/JRC_Publications.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:08:43 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:08:43 +0200 Subject: Revue: Discours 14, 2014 Message-ID: Date: Thu, 18 Sep 2014 11:30:14 +0200 From: "laure.sarda at ens.fr" Message-ID: X-url: http://discours.revues.org/ X-url: http://discours.revues.org/index208.html Sorry for multiple posting (English version below) ************************************************************************ Nous sommes très heureux d'annoncer la publication de DISCOURS 14 | 2014 http://discours.revues.org/ Au sommaire : - *Gerda Haßler* Étude comparée de l’usage parenthétique des verbes épistémiques dans trois langues romanes (http://discours.revues.org/8888) - *Annie Risler* Parenthèses et ruptures énonciatives en langue des signes française (http://discours.revues.org/8893) - *Gilles Corminboeuf* La focalisation des conditionnelles (http://discours.revues.org/8903) Nous vous souhaitons une bonne lecture et nous vous invitons par ailleurs à soumettre à tout moment pour les numéros à paraître. Consultez les modalités de soumission http://discours.revues.org/index208.html . Le comité de rédaction ******************************************************************** We are pleased to announce the publication of the 14th issue of DISCOURS 14 | 2014 http://discours.revues.org/ You can read the following articles: - *Gerda Haßler* Étude comparée de l’usage parenthétique des verbes épistémiques dans trois langues romanes (http://discours.revues.org/8888) - *Annie **Risler* Parenthèses et ruptures énonciatives en langue des signes française (http://discours.revues.org/8893) - *Gilles **Corminboeuf* La focalisation des conditionnelles (http://discours.revues.org/8903) We would like to invite contributions for upcoming issues. (Please see submission information http://discours.revues.org/index224.html) The editorial board ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:28:05 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:28:05 +0200 Subject: Appel: Revue TAL, numero non-thematique 56-1 Message-ID: Date: Fri, 19 Sep 2014 09:45:41 +0900 From: Yves Lepage Message-Id: <587D7E7C-BF44-4F31-AD5E-5918889FBE49 at waseda.jp> X-url: http://tal-56-1.sciencesconf.org/ X-url: http://tal-56-1.sciencesconf.org/?lang=en The English version follows the French call for paper. ------------------------------------------------------------------------- Appel à communications : http://tal-56-1.sciencesconf.org/ Revue TAL : Numéro non thématique 2015 Volume 56 Numéro 1. Direction : Éric de la Clergerie, Béatrice Daille, Yves Lepage, Jean-Luc Minel et Pascale Sébillot. Date limite de soumission : 15/12/2014 THÈMES La revue Traitement automatique des langues lance un appel à contributions ouvert. Des propositions de soumissions sont encouragées sur tous les aspects du traitement automatique des langues, notamment : pragmatique, discours, sémantique, syntaxe et lexique ; phonétique, phonologie et morphologie ; analyse et génération du langage parlé et écrit ; modèles logiques, symboliques et statistiques du langage ; extraction d’information et fouille de données textuelles ; traitement multilingue, traduction automatique et aides à la traduction ; interfaces en langue naturelle et systèmes de dialogue ; interfaces multi-modales à composantes linguistiques ; outils et ressources linguistiques ; évaluation de systèmes ; terminologie, acquisition de connaissances à partir de textes ; recherche documentaire ; linguistique de corpus ; utilisation d’outils de TAL pour la modélisation linguistique ; enseignement assisté, enseignement des langues ; applications du TAL. La liste ci-dessus n'est pas exhaustive. Il est bien sûr important, quel que soit le thème, que les aspects liés au traitement automatique des langues soient mis en valeur. LANGUE Les articles sont écrits en français ou en anglais. Les soumissions en anglais ne sont acceptées que pour les auteurs non francophones. LA REVUE La revue TAL (Traitement Automatique des Langues) est une revue internationale éditée depuis 1960 par l’ATALA (Association pour le Traitement Automatique des Langues) avec le concours du CNRS. Elle est maintenant publiée en format électronique, avec accès gratuit immédiat aux articles publiés, et impression annuelle à la demande. Cela ne change aucunement son processus de relecture et de sélection. DATES IMPORTANTES (EVENTUELLEMENT SUJETTES A FLUCTUATION) 15/12/2014 Date limite de soumission 15/03/2015 Décision du comité pour la première relecture 15/05/2015 Date limite de soumission de la version révisée 15/06/2015 Décision du comité pour la seconde relecture 15/07/2015 Date limite de soumission de la version finale Automne 2015 Publication FORMAT Les chercheurs ayant l’intention de soumettre une contribution sont invités à déposer leur résumé puis leur article en cliquant sur le menu "Soumission d'un article" (25 pages maximum, format PDF). Pour cela, si ce n’est déjà fait, s’inscrire sur le site http://www.sciencesconf.org (en haut à gauche, "créer un compte"), puis revenir sur la page http://tal-56-1.sciencesconf.org/, se connecter et effectuer le dépôt. * TAL passe en revue double-veugle. Merci d’anonymiser votre article. * Les feuilles de style sont disponibles en ligne sur le site de la revue (http://www.atala.org/IMG/zip/tal-style.zip). -------------------------------------------------------------------------- Call for papers : http://tal-56-1.sciencesconf.org/?lang=en TAL Journal : Regular issue 2015 Volume 56 Number 1. Editors: Éric de la Clergerie, Béatrice Daille, Yves Lepage, Jean-Luc Minel and Pascale Sébillot. Deadline : December 15th 2014 TOPICS The TAL journal launches a call for papers for an open issue of the journal. We invite papers in any field of natural language processing, including : lexicon, syntax, semantics, discourse and pragmatics ; morphology, phonology and phonetics ; spoken and written language analysis and generation ; logical, symbolic and statistical models of language ; information extraction and text mining ; multilingual processing, machine translation and translation tools ; natural language interfaces and dialogue systems ; multimodal interfaces with language components ; language tools and resources ; system evaluation ; terminology, knowledge acquisition from texts ; information retrieval ; corpus linguistics ; use of NLP tools for linguistic modeling ; computer assisted language learning ; applications of natural language processing. Whatever the topic, papers must stress the natural language processing aspects. LANGUAGE Manuscripts may be submitted in English or French. French-speaking authors are requested to submit in French. THE JOURNAL TAL (Traitement Automatique des Langues / Natural Language Processing) is a forty year old international journal published by ATALA (French Association for Natural Language Processing) with the support of CNRS (National Centre for Scientific Research). It has moved to an electronic mode of publication, with printing on demand. This affects in no way its reviewing and selection process. IMPORTANT DATES (MAY BE SUBJECT TO CHANGE) 15/12/2014 Deadline for submission 15/03/2015 Notification to authors after first review 15/05/2015 Deadline for submission of revised version 15/06/2015 Notification to authors afetr second review 15/07/2015 Deadline for submission of final version Automn 2015 Publication PAPER SUBMISSION Authors who intend to submit a paper are asked to upload their contribution (up to 25 pages, PDF format) via the menu "Paper submission". To do so, you will need to have an account on the sciencesconf platform. To create an account, go to the sciencesconf site and click on "create account" next to the "Connect" button at the top of the page. To submit, come back to the page http://tal-56-1.sciencesconf.org/?lang=en, connect to you account and upload your submission. * TAL has adopted double-blind review. The submitted papers should be anonymized. * Style sheets are available for download on the Web site of the journal (http://www.atala.org/IMG/zip/tal-style.zip). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 19:51:18 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 21:51:18 +0200 Subject: Sujet de these: 3-year PHD funding at Orsay (near Paris, France) Message-ID: Date: Wed, 17 Sep 2014 19:05:17 +0200 From: Brigitte Grau Message-ID: <5419BF4D.3090407 at limsi.fr> X-url: http://www.limsi.fr X-url: http://www.irt-systemx.fr IRT SystemX and LIMSI offer 3-year PHD funding at Orsay (near Paris, France) Subject : Today the number of documents increases rapidly, and moreover they are produced by multiple sources that can be classified by type (texts, speech...), by style (blog, forum, tweet, broadcast news, broadcast conversations, community tv...) and by language (English, French, Chinese...). Reliability of the information contained in these documents depends on each kind of source. Thus, selecting relevant and reliable information from such documents and summarizing it is problematic. The goal of the project is to build knowledge bases about persons, products... (i.e. Named Entities). Knowledge will be extracted from multiple documents and will have to be combined by aggregation and data fusion. Thus the information will result from multi-source, multilingual and multimedia document extraction: - Multi-source: various types of documents (spontaneous, prepared...) and providers of documents (institution, individual, community...); - Multimedia: texts, speech, scanned documents; - Multilingual: different languages. The work will focus on information identification, extraction and structuring. Studied issues will be: - assessment of information reliability; - assessment of information relevance (degree of novelty, scarcity of information); - detection and classification of contradictions. The PHD student will handle participation in international evaluation campaigns. The main location of the PHD student will be IRT, and s/he will be supervised by LIMSI senior researchers. Supervisors: Brigitte Grau, Professor at ENSIIE, LIMSI-CNRS Sophie Rosset, Director of Research, LIMSI-CNRS TECHNICAL REQUIREMENTS - Master in Computer Science, specialized in Machine learning and Natural Language Processing will be appreciated - Solid programming skills - A good command of French is a plus ADDITIONAL INFORMATION Salary: 2300 euros per month Benefits: IRT offers a generous benefit package including health insurance and about 44 days vacation pa. Duration: 3 years Start date: as soon as possible Location: Orsay, greater Paris area, France, is located in a green area about 30 minutes south of Paris. TO APPLY Please send: * a cover letter * a curriculum vitae, including the academic results * the names and contact information of at least one referee to both: Brigitte Grau (bg at limsi.fr) Sophie Rosset (rosset at limsi.fr) ABOUT LIMSI-CNRS http://www.limsi.fr LIMSI is a laboratory of the French National Center for Research (CNRS), a leading research institution in Europe. LIMSI is a multi-disciplinary research unit that covers a number of fields from thermodynamics to cognition, encompassing fluid mechanics, energetics, acoustic and voice synthesis, spoken language and text processing, vision, visualisation and perception, virtual and augmented reality. LIMSI hosts about 200 researchers, professors, research support staff and graduate students. ABOUT IRT-System X http://www.irt-systemx.fr An Institute for Technological Research (IRT) is an interdisciplinary thematic institute that develops economic sectors related to its field through a balanced strategic public-private partnership. For this, it manages research programs coupled with technology platforms, conducts research and development projects at the international level, contributes to the engineering of initial and continuous trainings (qualifying professional training and/or degree delivering); and ensures the exploitation of the obtained results. From hamon at LIMSI.FR Sat Sep 20 20:35:19 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:35:19 +0200 Subject: Job: CDD 24 mois, Caracterisation multimedia a grande echelle de contenus sur le Web, CEA LIST, Saclay Message-ID: Date: Fri, 19 Sep 2014 11:00:31 +0000 From: LE BORGNE Hervé 214777 Message-ID: <8095024FD92B3D4DB88787F07FC9963824235653 at EXDAG0-B3.intra.cea.fr> Contexte Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ingénierie des Contenus) travaille sur l'analyse de contenus multimédias (analyse de textes, images et vidéos, perception 3D). Dans le domaine de l'analyse de textes, le CEA LIST recherche un CDD ingénieur ou docteur pour travailler sur des techniques d'extraction et de clustering de relations à partir de données textuelles en vue de leur application à l'extraction d'information multimédia, incluant une dimension visuelle. Objectifs Dans le cadre d'un projet collaboratif (FUI 17), le CEA LIST travaille à l'extraction d'information multimédia à grande échelle selon trois axes : - [A] Classification multimédia à grande échelle : la classification de contenu sur le web dans des catégories à granularité variable repose aujourd'hui essentiellement sur le contenu textuel. Le but de cet axe de travail est d'y ajouter une dimension visuelle. Les principaux verrous sont liés à la quantité d'information à traiter (aspect « large échelle ») et à la combinaison des informations provenant de différents média. On se souciera du compromis performance/efficience. Ces travaux pourront bénéficier de l'axe C pour définir dynamiquement les classes. - [B] Modélisation temporelle : l'identification de références temporelles dans les documents textuels et l'utilité de l'information temporelle dans la recherche d'information est un problème bien étudié, mais l'accent est plutôt mis sur les documents que sur les entités. Les approches existantes restent étroitement liées à des tâches de recherche d'information et non à une véritable extraction temporellement dynamique des caractéristiques d'entités. En outre, la plupart des approches existantes se concentrent sur des documents purement textuels alors que les données incluses dans les flux de données multimodales sont également intéressantes à suivre temporellement. Ainsi, les innovations de cette tâche sont (B1) le suivi temporel d'entités, puisque ce thème a peu été étudié ; (B2) l'ajout de la dimension visuelle à cette modélisation. - [C] Découverte de connaissances multimédia : les tâches de catégorisation supervisée sur des très grands volumes de données traités en flux, nécessaires pour qualifier l'information du web, nécessite de disposer de données annotées pour effectuer l'apprentissage. À grande échelle, un verrou fondamental est de sélectionner automatiquement les données d'apprentissage. En particulier, le choix des exemples négatifs doit permettre l'apprentissage de modèles à la fois discriminants et généralisables. Le travail du CDD consistera plus particulièrement à (dans cet ordre de priorité) : - étudier, implémenter et évaluer une méthode de modélisation temporelle basée sur les informations textuelles (axe B1) ; - étudier, implémenter et évaluer une méthode de sélection des données d'apprentissage pour des modèles de classification supervisée d'entités visuelles (axe A et C) - étudier, implémenter et évaluer une méthode combinant les deux travaux précédents résultant en une modélisation temporelle d'entités multimédia incluant la dimension visuelle (axe B2). Le CEA LIST dispose déjà de plusieurs outils permettant de supporter les axes A et C. De plus d'autres personnes travailleront en parallèle à ces tâches au sein du laboratoire. Profil recherché: - Compétences en traitement multimédia des données : traitement automatique des langues et/ou vision par ordinateur (un goût pour les deux aspects serait très apprécié). - Connaissance des techniques d'apprentissage automatique - Compétences informatiques : C++, langages de script (perl, python ...) - Une bonne maîtrise de la langue anglaise est également indispensable. - Un travail préalable de recherche, ayant abouti à des publications de bon niveau, sera jugé très positivement. Rémunération selon formation et expérience. Lieu de travail : centre d'intégration NanoInnov (plateau de Saclay, proche de Polytechnique) Durée : 24 mois Les candidatures (CV + lettre de motivation) sont à envoyer le plus rapidement possible à : Hervé Le Borgne (herve.le-borgne at cea.fr) avec copie à : Adrian Popescu (adrian.popescu at cea.fr) Romaric Besançon (romaric.besancon at cea.fr) Olivier Ferret (olivier.ferret at cea.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:32:40 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:32:40 +0200 Subject: Appel: Bulletin AFIA "IA et jeux vid=?UTF-8?Q?=C3=A9o=22?= Message-ID: Date: Fri, 19 Sep 2014 11:28:39 +0200 From: "Carole Adam (IMAG)" Message-ID: ** Avec nos excuses pour les réceptions multiples ** L'association Française pour l'intelligence artificielle (AFIA) édite un bulletin trimestriel d'information à l'attention de ses adhérents. Le numéro 87 sera un bulletin thématique qui regroupera les activités françaises de recherche associant Intelligence Artificielle et Jeux Vidéos. Le contenu du bulletin sera constitué de présentations courtes (1 à 4 pages) des activités de recherche qui sont menées dans les laboratoires publics et en entreprise : - Présentation d'équipes de recherche ou R&D - Présentation d'outils issus de la recherche - Présentation de projets de recherche Nous vous sollicitons pour participer à la rédaction de ce bulletin. C'est une occasion de communiquer sur vos activités, et au travers de ce bulletin de participer à faire le point sur les recherches menées en France sur la thématique IA & Jeux Video. La parution de ce bulletin est prévue en janvier 2015. Si vous êtes intéressés pour y participer, merci de nous envoyer dès que possible et *avant le 15 novembre 2014* une expression d'intérêt précisant simplement l'objet de votre présentation (présentation d'équipe, présentation d'un projet de recherche). Le texte complet correspondant à votre proposition devra alors nous parvenir *pour le 19 décembre 2014*. Attention à bien mettre en avant l'articulation entre jeux vidéo et IA dans la description des travaux. En termes de longueur, l'idéal serait 1 à 2 pages pour un projet, et maximum 4 pages pour une équipe (sachant qu'une page du bulletin AFIA fait environ 650 mots). Le format demandé est le suivant : Titre (nom de l'équipe/de l'outil/du projet) : Page web (si possible) : Contact (Nom, Prénom, adresse mail) : Pour une équipe : description globale des problématiques de l'équipe puis description de quelques outils/projets comme ci-dessous Partenaires éventuels du projet : Financement éventuel du projet (ANR, FUI...) : Objectifs : Résultats (sauf si projet débutant) : Pour toute question concernant ce bulletin, n'hésitez pas à me contacter. Cordialement, Carole Adam ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:24:47 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:24:47 +0200 Subject: Appel: Revue TAL, 56-2, numero special sur la semantique distributionnelle Message-ID: Date: Thu, 18 Sep 2014 16:56:59 +0200 From: Cécile Fabre Message-ID: <541AF2BB.5090507 at univ-tlse2.fr> X-url: http://tal-56-2.sciencesconf.org/ X-url: http://www.atala.org/-Revue-TAL X-url: http://tal-56-2.sciencesconf.org/?eng PREMIER APPEL À CONTRIBUTIONS SEMANTIQUE DISTRIBUTIONNELLE / DISTRIBUTIONAL SEMANTICS -- Call for papers - English version appears below -- UN NUMÉRO SPÉCIAL DE LA REVUE 'TRAITEMENT AUTOMATIQUE DES LANGUES' (TAL) ÉDITEURS INVITÉS - Cécile Fabre (CLLE-ERSS, Université de Toulouse) - Alessandro Lenci (CoLing Lab, Université de Pise) DATE LIMITE DE SOUMISSION : 16 février 2015 THEMATIQUE DU NUMERO : L'utilisation du critère distributionnel pour calculer des liens de proximité sémantique entre les mots est une méthode devenue très courante en TAL. Sa popularité s'explique facilement : elle donne accès à des informations sémantiques en appliquant un principe simple, sans apport de connaissances autres que des informations relatives à la distribution des mots dans un corpus, brut ou annoté. Les systèmes ont généralement recours à des modèles d'espace vectoriel pour représenter et comparer les caractéristiques distributionnelles des unités lexicales. Cette approche a bénéficié ces dernières années de la disponibilité de grandes masses de données textuelles et de capacités informatiques accrues pour les traiter, ce qui a permis de produire des ressources distributionnelles à très grande échelle. On peut dire aujourd'hui que le domaine est arrivé à maturité : des expérimentations nombreuses ont été menées sur plusieurs langues, des travaux de synthèse ont permis de stabiliser les notions et les procédures relatives au calcul distributionnel, divers modèles distributionnels sont disponibles ainsi que des jeux d'évaluation. Néanmoins, de nombreuses questions de recherche restent ouvertes pour mieux contrôler l'application de cette méthode distributionnelle et améliorer la compréhension des types d'information sémantique qu'elle permet de calculer. Une première direction de recherche concerne l'optimisation de la méthode distributionnelle pour traiter des données toujours plus volumineuses, ainsi que le contrôle des nombreux paramètres susceptibles de jouer sur la qualité et la nature des relations sémantiques extraites (mesures de similarité, nature des contextes distributionnels, techniques de réduction de dimension, pondération des contextes, etc.). D'autres travaux s'intéressent plutôt à l'exploitation de ces données sémantiques, qu'il s'agisse de l'intégration d'indices distributionnels dans des applications de TAL (recherche d'information, résumé automatique, classification d'entités nommées, calcul d'inférence, etc.), ou de la construction de réseaux lexicaux permettant de visualiser les relations sémantiques entre les mots d'un corpus. Enfin, depuis quelques années, des travaux ont été consacrés à l'extension du calcul distributionnel à des unités plus larges ou plus petites que le mot, selon un principe de compositionnalité, ou à la modélisation de l'information distributionnelle pour la combiner avec d'autres modes de représentation du sens. Nous souhaitons que ce numéro spécial soit représentatif de la richesse actuelle de ce champ, sur le plan à la fois linguistique et computationnel, et invitons par conséquent des contributions sur l'ensemble de ces aspects. Plus spécifiquement, les thématiques concernées sont (de façon non exclusive) les suivantes : - utilisation d'indices distributionnels pour la construction de ressources lexicales et sémantiques - compositionnalité sémantique dans le cadre distributionnel - repérage de relations sémantiques spécifiques - exploitation de la proximité distributionnelle dans des tâches de TAL - optimisation du calcul de similarité sémantique - visualisation et manipulation graphique des espaces de mots - évaluation de ressources distributionnelles - impact des corpus (taille, contenu, genre, annotations, traitements) sur la méthode distributionnelle - intégration d'informations sémantiques distributionnelles et non-distributionnelles - sémantique distributionnelle et deep learning - évaluation de modèles distributionnels COMITÉ SCIENTIFIQUE (en cours de constitution) Marianna Apidianaki – LIMSI, Orsay Marco Baroni – CIMeC, Trento Ann Bertels -ILT, K.U. Leuven Romaric Besançon – CEA, Gif-sur-Yvette Yves Bestgen - UCL/CECL, Louvain-La-Neuve Gemma Boleda - Université Pompeu Fabra, Barcelone Marie Candito - ALPAGE, Paris Olivier Ferret – CEA, Gif-sur-Yvette Andre Freitas - DERI, National University of Ireland,Galway Gregory Grefenstette - INRIA, Saclay Thierry Hamon - LIMSI, Paris Aurélie Herbelot - Institut für Linguistik, Potsdam Guillaume Jacquet - European Commission, JRC, Ispra Olivier Kraif - LIDILEM, Grenoble Laurent Prévot - LPL, Aix-Marseille Benoît Sagot - ALPAGE, Paris Magnus Sahlgren - Gavagai, Inc., Suède Franck Sajous - CLLE-ERSS, Toulouse Sabine Schulte im Walde - IMS, Stuttgart Ludovic Tanguy, CLLE-ERSS, Toulouse Peter Turney - National Research Council Canada, Ottawa Tim Van de Cruys - IRIT, Toulouse Lonneke Van der Plas - Institute for NLP, Stuttgart DATES IMPORTANTES 16 février 2015 : Date limite de soumission des articles 15 avril : Notification aux auteurs 1er juin : Soumission des versions révisées 9 juillet : Décision finale 1er sept : Version finale Fin 2015 : Publication INFORMATIONS PRATIQUES Informations complémentaires : http://tal-56-2.sciencesconf.org/ Les articles (25 pages environ, format PDF) doivent être déposés sur la plateforme sciencesconf à l'adresse ci-dessus. Les feuilles de style sont disponibles sur le site web de la revue (http://www.atala.org/-Revue-TAL). Le journal ne publie que des contributions originales, en français ou en anglais. ==========ENGLISH VERSION============ TAL journal - special issue on Distributional Semantics GUEST EDITORS - Cécile Fabre (CLLE-ERSS, University of Toulouse) - Alessandro Lenci (CoLing Lab, University of Pisa) SUBMISSION DEADLINE : february 16, 2015 THEMES : The use of distributional information extracted from corpora to compute semantic similarity between words has become a very common method in NLP. Its popularity is easily explained: it provides access to semantic content on the basis of an elementary principle, requiring no sources of knowledge other than corpus-derived information about word distribution in contexts. In recent years, distributional semantics based on vector space models has benefited from the availability of massive amounts of textual data and increased computational power, allowing for the application of these methods on a large scale. Today, the field has reached maturity: many experiments have been carried out on several languages, several survey articles have recently helped to consolidate the concepts and procedures used for distributional computations, various distributional models and evaluation data are now available. Still, many issues remain open to have a better control on the application of the distributional methodology in computational semantics and to improve the understanding of the the types of information that is induced by these methods. Much research effort has focused on optimization methods to handle massive corpora and on the adjustment of the many parameters that are likely to have impact on the quality and nature of semantic relations – such as similarity measures, types of distributional contexts, dimensionality reduction techniques, context weighting schemes, etc. A second important issue relates to the use of distributional semantic information for a large number of applications (information retrieval, summarization, textual entailment, etc.). Distributional features have been incorporated into a wide range of NLP tasks, such as named entity classification and paraphrasing. They are also used for the construction of lexical networks that enable the visualization of the semantic relations that hold between the words of a corpus. Finally, in the last few years, research has focused on combining distributional representations with other kinds of semantic representations, and on modeling semantic compositionality within a distributional framework, such that not only individual words but also larger phrases can be taken into account. We wish that this special issue of the TAL journal on distributional semantics will reflect the current diversity of the field, regarding linguistic and computational issues. We welcome papers that focus on any of the aforementioned topics, and in particular: - construction of distributional semantic models - compositionality within a distributional framework - induction of specific semantic relations - use of distributional methods within NLP tasks - optimization techniques for distributional computations - visualization techniques for word spaces - role of corpora in distributional semantics models - “deep learning” and distributional semantics - integrating distributional and non-distributional semantic information - evaluation of distributional semantic models REVIEW COMMITTEE (to be completed) Marianna Apidianaki – LIMSI, Orsay Marco Baroni – CIMeC, Trento Ann Bertels -ILT, K.U. Leuven Romaric Besançon – CEA, Gif-sur-Yvette Yves Bestgen - UCL/CECL, Louvain-La-Neuve Gemma Boleda - Université Pompeu Fabra, Barcelone Marie Candito - ALPAGE, Paris Olivier Ferret – CEA, Gif-sur-Yvette Andre Freitas - DERI, National University of Ireland,Galway Gregory Grefenstette - INRIA, Saclay Thierry Hamon - LIMSI, Paris Aurélie Herbelot - Institut für Linguistik, Potsdam Guillaume Jacquet - European Commission, JRC, Ispra Olivier Kraif - LIDILEM, Grenoble Laurent Prévot - LPL, Aix-Marseille Benoît Sagot - ALPAGE, Paris Magnus Sahlgren - Gavagai, Inc., Suède Franck Sajous - CLLE-ERSS, Toulouse Sabine Schulte im Walde - IMS, Stuttgart Ludovic Tanguy, CLLE-ERSS, Toulouse Peter Turney - National Research Council Canada, Ottawa Tim Van de Cruys - IRIT, Toulouse Lonneke Van der Plas - Institute for NLP, Stuttgart IMPORTANT DATES February 16, 2015: Submission deadline April 15: First notification to authors June 1: revised submission July 9: final notification September 1: final version End of 2015: Publishing PAPER SUBMISSION Papers must describe original, completed, and unpublished work. Each submission will be reviewed by two programme committee members. Papers must be submitted thorugh the Sciencesconf platform: http://tal-56-2.sciencesconf.org/?eng Accepted papers will be maximum 25 pages long in PDF. Style sheets are available for download on the Web site of the TAL journal. LANGUAGE Manuscripts may be submitted in English or French. French-speaking authors are requested to submit their contributions in French. THE TAL JOURNAL TAL (Traitement Automatique des Langues / Natural Language Processing) is an international journal published by ATALA (French Association for Natural Language Processing, http://www.atala.org) since 1959 with the support of CNRS (National Centre for Scientific Research). It has moved to an electronic mode of publication, with printing on demand. ADDITIONAL INFORMATION http://tal-56-2.sciencesconf.org/?eng ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 23 19:39:01 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:39:01 +0200 Subject: Appel: Workshop TOTh 2014 Message-ID: Date: Mon, 22 Sep 2014 10:47:24 +0200 From: Luc Damas Message-ID: X-url: http://porphyre.org/workshop-toth/2014-en X-url: http://porphyre.org/workshop-toth/files/Workshop-TOTh-2014-Call-for-papers.pdf Workshop TOTh 2014 - Call for papers http://porphyre.org/workshop-toth/2014-en http://porphyre.org/workshop-toth/files/Workshop-TOTh-2014-Call-for-papers.pdf The 2014 TOTh Workshop is organised by the Royal Museums of Art and History of Brussels within the scope of the European Project AthenaPlus (www.athenaplus.eu) Title: "Multilingual Thesaurus and Terminology" Brussels - December 5th 2014 The Cinquantenaire Museum Parc du Cinquantenaire 10 The ever-increasing amount of open data and linked data raises questions concerning its access in a multilingual context. Due to the diversity of the collections, of the institutions that manage them, of the public that has access to them and of the technologies currently available, it is necessary to rethink the notions of thesaurus and terminology, as well as the ways to manage and access these collections. Some of the topics that will be covered by the TOTh 2014 Workshop include (this list is not exhaustive): - Principles, Theories and Methods: Thesauri, Terminology, Ontology, Controlled Vocabulary, Semantic Network; - Embracing and Managing Multilingualism; - Mapping, Alignment and Harmonisation of terminologies, thesauri, ontologies; - Indexing and Research; - The compatibility of the ISO and W3C Standards concerning terminology, thesauri, knowledge systems and interchange format; - Impact and contributions from new domains and technologies connected to Knowledge Engineering and the Semantic Web; - Software Environments. Special attention will be given to the issue of cultural content management. Submission: Abstracts of one or two pages must be sent to: workshop-toth at porphyre.org Official languages: English and French Deadline for submission: September 30th 2014 Information: Eva Coudyzer e.coudyzer at kmkg-mrah.be Scientific coordination : C. Roche, R. Costa, E. Coudyzer http://porphyre.org/workshop-toth/2014-en http://porphyre.org/workshop-toth/files/Workshop-TOTh-2014-Call-for-papers.pdf From hamon at LIMSI.FR Tue Sep 23 19:35:58 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:35:58 +0200 Subject: Conf: SLSP 2014, October 14-16, 2014, Grenoble, France Message-ID: Date: Sun, 21 Sep 2014 09:38:03 +0200 From: "GRLMC" Message-ID: <615E19CABE8D45C0ABAF03EBF2414EC1 at Carlos1> X-url: http://grammars.grlmc.com/slsp2014/ ************************************************************************ 2nd INTERNATIONAL CONFERENCE ON STATISTICAL LANGUAGE AND SPEECH PROCESSING SLSP 2014 Grenoble, France October 14-16, 2014 Organised by: Équipe GETALP Laboratoire d’Informatique de Grenoble Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/slsp2014/ ************************************************************************ PROGRAM Tuesday, October 14 9:00 - 10:00 Registration 10:00 - 10:15 Opening 10:15 - 11:05 Roger K. Moore: Spoken Language Processing: Time to Look Outside? - Invited Lecture 11:05 - 11:35 Coffee Break 11:35 - 12:50 Georgios Kontonatsios, Claudiu Mihaila, Ioannis Korkontzelos, Paul Thompson, and Sophia Ananiadou: A Hybrid Approach to Compiling Bilingual Dictionaries of Medical Terms from Parallel Corpora Wei Liu, Zhipeng Chang, and William J. Teahan: Experiments with a PPM Compression-based Method for English-Chinese Bilingual Sentence Alignment Chi-kiu Lo and Dekai Wu: BiMEANT: Integrating Cross-lingual and Monolingual Semantic Frame Similarities in the MEANT Semantic MT Evaluation Metric 12:50 - 14:20 Lunch 14:20 - 15:35 Mathias Verbeke, Vincent Van Asch, Walter Daelemans, and Luc De Raedt: Lazy and Eager Relational Learning using Graph-Kernels Mohamed Amine Boukhaled, and Jean-Gabriel Ganascia: Probabilistic Anomaly Detection Method for Authorship Verification Uli Fahrenberg, Fabrizio Biondi, Kevin Corre, Cyrille Jegourel, Simon Kongshj, and Axel Legay: Measuring Global Similarity between Texts 16:00 - 18:00 Touristic visit Wednesday, October 15 9:00 - 9:50 Claire Gardent: Syntax and Data-to-Text Generation - Invited Lecture 9:50 - 10:05 Break 10:05 - 11:20 Borbála Siklósi and Attila Novák: Identifying and Clustering Relevant Terms in Clinical Records Using Unsupervised Methods Amine Abdaoui, Jérôme Azé, Sandra Bringay, Natalia Grabar, and Pascal Poncelet: Predicting Medical Roles in Online Health Fora Ekaterina Pronoza, Elena Yagunova, and Svetlana Volskaya: Corpus-based Information Extraction and Opinion Mining for the Restaurant Recommendation System 11:20 - 11:50 Coffee Break and Group Photo 11:50 - 13:05 Raúl Ernesto Gutierrez de Piñerez Reyes and Juan Francisco Díaz-Frías: Informal Mathematical Discourse Parsing with Conditional Random Fields Waad Ben Kheder, Driss Matrouf, Pierre-Michel Bousquet, Jean-François Bonastre and Moez Ajili: Robust Speaker Recognition Using MAP Estimation of Additive Noise in i-vectors Space Arseniy Gorin and Denis Jouvet: Structured GMM Based on Unsupervised Clustering for Recognizing Adult and Child Speech 13:05 - 14:35 Lunch 14:35 - 16:35 Visit to the Domus apartment Thursday, October 16 9:00 - 9:50 Martti Vainio: Phonetics and Machine Learning: Hierarchical Modelling of Prosody in Statistical Speech Synthesis - Invited Lecture 9:50 - 10:05 Break 10:05 - 11:20 Gábor Kiss and Klára Vicsi: Physiological and Cognitive Status Monitoring on the Base of Acoustic-phonetic Speech Parameters Barbara Schuppler, Sebastian Grill, André Menrath, and Juan A. Morales-Cordovilla: Automatic Phonetic Transcription in Two Steps: Forced Alignment and Burst Detection Mian Du, Matthew Pierce, Lidia Pivovarova, and Roman Yangarber: Supervised Classification using Balanced Training 11:20 - 11:50 Coffee Break 11:50 - 13:05 Márius Šajgalík, Michal Barla, and Mária Bieliková: Exploring Multidimensional Continuous Feature Space to Extract Relevant Words Zhemin Zhu, Djoerd Hiemstra, and Peter Apers: Linear Co-occurrence Rate Networks (L-CRNs) for Sequence Labeling Théodore Bluche, Hermann Ney, and Christopher Kermorvant: Handwriting Recognition with Deep and Recurrent Neural Networks 13:05 - 13:15 Closing ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 23 19:45:05 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:45:05 +0200 Subject: Job: Research Associate/Assistant Post, Knowledge Media Institute, Open University Message-ID: Date: Mon, 22 Sep 2014 20:33:04 +0100 From: John Domingue Message-ID: X-url: http://kmi.open.ac.uk/jobs/ [apologies for cross posting] We have a position at our lab in a project which will apply our work on Linked Data/Semantic Web and Web APis in the domains of eLearning and the Future Internet. Duration of Post: until end of May 2016. Salary Scale: 28,695 - 37,394 (British Pounds) Deadline for applications is: October 23rd More details and application forms can be found at: http://kmi.open.ac.uk/jobs/ [Post 10673] Post Job Summary ________________________________________________________________________ Massive Open Online Courses (MOOCs) have recently come to the fore through high profile providers such as Udacity, Coursera, edX and the OU’s own FutureLearn. According to some commentators this new initiative will radically change the higher education landscape through the provision of high quality freely available educational materials. The FORGE project is applying technologies related to rich interactive eBooks, social networking learning platforms and Linked Data to turn large scale Future Internet Research and Experimentation (FIRE) facilities into a learning resource. See http://ict-forge.eu/ The weSPOT project aims at propagating a scientific inquiry approach for science learning and teaching in combination with current curricula and teaching practices. It lowers the threshold for linking everyday life with science teaching in schools through technology. weSPOT supports the meaningful contextualization of scientific concepts by relating them to personal curiosity, experiences, and reasoning founded on a theoretically sound and technology supported personal inquiry approach. See http://wespot.net/ ________________________________________________________________________ Best John ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 23 19:47:01 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:47:01 +0200 Subject: Appel: CHIST-ERA Call 2014, Pre-announcement, Cyber-Physical Systems Message-ID: Date: Tue, 23 Sep 2014 07:26:42 +0200 From: pap Message-ID: <54210492.9070302 at limsi.fr> X-url: http://www.chistera.eu/call-2014-pre-announcement Dear Colleagues, On behalf of the CHIST-ERA ERA-NET, I am pleased to inform you of the publication of the _pre-announcement_ of the Call 2014 (to be open in October). http://www.chistera.eu/call-2014-pre-announcement The Pre-announcement gives an overview of the research themes that have emerged during the Call 2014 preparation conference (last June) in the following topics: - Resilient Trustworthy Cyber-Physical Systems (RTCPS) - Human Language Understanding: Grounding Language Learning (HLU) Researchers are encouraged to start discussing possible projects with prospective partners. The tentative list of interested countries is presented in the Pre-announcement. The call will require that projects are submitted by international consortia with partners in at least three countries (additional partners from other countries may be part of a consortium if they can secure their own funding). Broad distribution of this Pre-announcement is encouraged, Sincerely yours, Mathieu Girerd From hamon at LIMSI.FR Tue Sep 23 19:54:51 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:54:51 +0200 Subject: Job: Post-doctoral position in Dialog System at LIMSI-CNRS, Paris Saclay Message-ID: Date: Tue, 23 Sep 2014 18:06:15 +0200 From: Sophie Rosset Message-ID: <20140923160615.GA3194 at m17.limsi.fr> X-url: http://www.patient-genesys.com/ Veuillez nous excuser pour l'envoi multiple. Le LIMSI propose une offre de post-doctorat en traitement automatique des langues dans le cadre d'un projet collaboratif sur le thème suivant : Gestion de dialogue dans un système de dialogue personne-machine où le système joue le rôle du patient pendant une consultation médicale avec un médecin. Plus de détails ci-dessous. Post-doctoral positions at LIMSI-CNRS, Paris Saclay (Paris Sud) University. LIMSI is a multi-disciplinary research unit that addresses the automatic processing of human language for a range of tasks. LIMSI invites applications for 1 one-year Postdoctoral position in Natural Language Processing. The topic is as follows: Dialogue management in a human-machine dialogue system where the system plays the role of a patient during a medical consultation with a doctor. CONTEXT The postdoctoral fellow will contribute to the following project: Patient Genesys (http://www.patient-genesys.com/): in the framework of continuous medical education, the goal of the project is to design and develop a framework for virtual patient-doctor consultation. This is a collaborative project including a hospital and small and medium enterprises. JOB REQUIREMENTS - Ph.D. in Computer Science, Natural Language Processing, Computational Linguistics - Solid programming skills - Strong publication record - A good command of French is a plus - Knowledge of medical terminologies and ontologies is a plus ADDITIONAL INFORMATION Net salary: between 2000 and 2400 ??? per month according to experience Benefits: LIMSI offers a generous benefit package including health insurance and 44 days vacation pa. Duration: 12 months, renewable depending on performance and funding availability Start date: 1st October 2014 Location: Orsay, greater Paris area, France TO APPLY Please send: * a cover letter * a curriculum vitae, including a list of publications * the names and contact information of at least two referees to both: Sophie Rosset (rosset at limsi.fr) Anne-Laure (annlor at limsi.fr) Pierre Zweigenbaum (pz at limsi.fr) Application deadline: October 15th, 2014 Applications will be examined in the following week. ABOUT LIMSI-CNRS LIMSI is a laboratory of the French National Center for Research (CNRS), a leading research institution in Europe. LIMSI is a multi-disciplinary research unit that covers a number of fields from thermodynamics to cognition, encompassing fluid mechanics, energetics, acoustic and voice synthesis, spoken language and text processing, vision, visualisation and perception, virtual and augmented reality. LIMSI hosts about 200 researchers, professors, research support staff and graduate students. It is located in a green area about 30 minutes south of Paris. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 26 20:36:36 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 26 Sep 2014 22:36:36 +0200 Subject: Journee: (Date limite inscription 29/9) Promotion et Developpement de l'Intelligence Artificielle, Univ. Paris Dauphine, Paris, 2 octobre 2014, Message-ID: Date: Fri, 26 Sep 2014 08:34:28 +0200 From: Secretaire AFIA Message-Id: X-url: http://inscriptions.afia.asso.fr X-url: http://www.afia.asso.fr --- Merci de relayer ce message auprès des personnes intéressées --- Le 2 octobre 2014, l'Association Française pour l'Intelligence Artificielle organise une journée d'interventions pour la promotion et le développement de l' Intelligence Artificielle. Cette journée est placée sous le Haut Patronage du MESR DGRI, du CNRS INS2I et d’Inria. Programme de la journée : 09:00 - Accueil des participants 09:30 - 10:00 Ouverture (par les représentants de l'AFIA, du MESR DGRI, du CNRS INS2I et d'Inria) 10:00 - 10:45 Andreas Herzig (IRIT, CNRS) - Quelles logiques pour les systèmes multi-agents ? 11:00 - 11:45 François Pachet (Sony CSL, Sony) - Créativité et style : de nouveaux problèmes pour l'IA 11:45 - 12:30 Hélène Fargier (IRIT, CNRS) - Problèmes combinatoires de décision sous incertitude 12:30 - 14:00 BUFFET 14:00 - 14:45 Jérôme Euzenat (LIG, Inria) - Représenter, communiquer, échouer 14:45 - 15:30 Leila Amgoud (IRIT, CNRS) - La théorie computationnelle de l'argumentation Date : 2 Octobre 2014, 9h00-16h00. Date limite d'inscription : 29 septembre 2014. Lieu : Salle A709, (7ème étage de la nouvelle aile) Université Paris-Dauphine Place du Maréchal de Lattre de Tassigny 75775 PARIS Cedex 16 Inscription : L’accès à la journée PDIA 2014 sera limité aux seules personnes qui se seront inscrites sur le site des inscriptions avant le 29 septembre 2014 : http://inscriptions.afia.asso.fr Plus d'information et téléchargement du programme : http://www.afia.asso.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 26 20:32:32 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 26 Sep 2014 22:32:32 +0200 Subject: Livre: Fouille de Donnees et Humanites Numeriques Message-ID: Date: Wed, 24 Sep 2014 13:17:25 +0200 From: Nicolas Turenne Message-ID: <5422A845.5000308 at yahoo.fr> X-url: http://editions-rnti.fr/?procid=100158 Chères et chers collègues, J'ai le plaisir de vous informer de la parution de l'ouvrage collectif : "Fouille de Données et Humanités Numériques" sous forme papier et eBook. http://editions-rnti.fr/?procid=100158 Cet ouvrage donne un éclairage sur quelques usages des techniques d'analyse statistique et d'exploration de données dans des datasets issus des Sciences Humaines et Sociales. Bien cordialement, Nicolas Turenne Chargé de Recherches en sciences des données à l'unité INRA-SenS (future UMR LISIS) Université Paris Est. - Bat. Bois de l'Etang. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 26 20:28:53 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 26 Sep 2014 22:28:53 +0200 Subject: Conf: COLDOC2014, programme et inscription en ligne, 13-14 novembre 2014, Universite de Nanterre Paris Ouest Message-ID: Date: Wed, 24 Sep 2014 13:09:57 +0200 From: ColDoc 2014 Message-ID: X-url: http://coldoc2014.free.fr/?lg=fr&p=prog X-url: http://coldoc2014.free.fr/?lg=fr&p=registration X-url: http://coldoc2014.free.fr/ Bonjour, Merci de bien vouloir diffuser cette information largement. La onzième édition de COLDOC - le colloque des Jeunes Chercheurs et Doctorants en Sciences du Langage organisé par le laboratoire MoDyCo - se déroulera cet automne, les 13 et 14 novembre, à l’université de Nanterre Paris Ouest. Cette année, nous avons choisi le thème suivant : La diversité des langues - les universaux linguistiques à l’épreuve des faits de langue. Le programme de COLDOC 2014 est en ligne ! [lien programme : http://coldoc2014.free.fr/?lg=fr&p=prog ] Nous espérons vous voir nombreux pour soutenir les travaux de ces jeunes chercheurs en Sciences du Langage. L’inscription est gratuite et se fait sur le site du colloque. [lien inscription : http://coldoc2014.free.fr/?lg=fr&p=registration ] Bien cordialement, Le comité d'organisation de COLDOC 2014 (http://coldoc2014.free.fr/) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 26 20:38:10 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 26 Sep 2014 22:38:10 +0200 Subject: Appel: 2nd Symposium LKE (LKE'2014) Puebla, Mexico Message-ID: Date: Fri, 26 Sep 2014 09:23:39 +0200 From: Juan-Manuel Torres Message-ID: <5425147B.4040201 at univ-avignon.fr> X-url: http://donaji.cs.buap.mx/lke X-url: https://easychair.org/conferences/?conf=lke2014 2nd Symposium LKE (LKE'2014) ------------------------------------------------------------------------ First Call for Papers 2nd International Symposium on Language & Knowledge Engineering (LKE'2014) December 4th and 5th, Puebla, Mexico http://donaji.cs.buap.mx/lke The 2nd International Symposium on Language & Knowledge Engineering (LKE’2014) will be held in Puebla, Mexico. LKE’2014 is organized by the Language & Knowledge Engineering Lab of the Faculty of Computer Science, Benemérita Universidad Autónoma de Puebla. LKE’2014 will be a forum for exchanging scientific results and experiences, as well as sharing new knowledge, and increasing the co-operation between research groups in natural language processing and related areas. Topics Authors are invited to submit contributions including, but not limited to the following general areas: - Natural Language Processing - Knowledge engineering - Pattern recognition - Artificial Intelligence - Computer Science Some examples of the particular topics would be: - Clustering - Word sense disambiguation - Ontology analysis, creation & evaluation - Plagiarism detection - Sentiment analysis - Fuzzy logic and soft computing - Software tools for AI - Expert systems - Decision support systems - Automated problem solving - Knowledge discovery, representation and/or acquisition - Data and Text mining - Semantic web - Intelligent agents - Databases - AI and evolutionary algorithms - Intelligent tutoring systems - Reasoning strategies - Distributed AI algorithms and techniques - Heuristic searching methods - Languages and programming techniques for AI - Constraint-based reasoning and constraint programming - Evaluation of AI tools - Social intelligence (markets and computational societies) - Emerging technologies - Machine Learning; Models, Technologies and Applications - Pattern Recognition Principles - Robotics & Remote Sensing Applications of Pattern Recognition - Voice and Speech Recognition - Applications (including: computer vision, signal processing, military, surveillance, robotics, medicine, pattern recognition, face recognition, finger print recognition, finance and marketing, stock market, education, emerging applications, …) Paper Submission and Review Process All the papers will be blind submitted (author’s names are not allowed) either in English or Spanish, and could be presented at any of these two languages. All submissions will be peer reviewed by the Scientific Committee, for originality, technical content and relevance. The final acceptance will be based upon double blind peer review of the full-length paper. All accepted papers will be published in an Special issue of the Research in Computing Science Journal, ISSN 1870-4069 (Indexed by DBLP, LatIndex, Periodica). The papers should be submitted electronically before October 16th, 2014 at the easychair system: https://easychair.org/conferences/?conf=lke2014. The format of paper is identical to Springer LNCS series format (though the journal is not published by Springer). You can find useful these formatting tips. Papers that do not follow these format requirements may be rejected without review or may be not included in the journal even if they were accepted for publication. Submission implies the willingness of at least one of the authors to register and to present the communication at the conference, if it is accepted. Local chair - David Pinto, Ph. D., LKE-BUAP, Puebla, México Important Dates - Paper Submission Deadline: October 15th, 2014 - Notification of acceptance: November 3rd, 2014 - Camera-ready submission: November 15th, 2014 - Symposium: December 4th and 5th, 2014 Conference Venue Faculty of Computer Science, Benemérita Universidad Autónoma de Puebla.Av. San Claudio y 14 Sur, Ciudad Universitaria, C.P. 72570, Puebla, Puebla. México. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From aascitNews at TECHNOLOGYDEVELOPPED.NET Sun Sep 28 16:29:24 2014 From: aascitNews at TECHNOLOGYDEVELOPPED.NET (aascitNews) Date: Sun, 28 Sep 2014 10:29:24 -0600 Subject: Invitation for joining AASCIT to get free publication Message-ID: An HTML attachment was scrubbed... URL: From hamon at LIMSI.FR Tue Sep 2 20:48:45 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 22:48:45 +0200 Subject: Livre: Metalangage et expression du sentiment linguistique profane Message-ID: Date: Sat, 30 Aug 2014 11:05:13 +0200 From: Michelle Lecolle Message-ID: <540193C9.2060903 at univ-lorraine.fr> X-url: http://lediscoursetlalangue.wordpress.com/ Avis de parution : Michelle Lecolle, coord., ? M?talangage et expression du sentiment linguistique "profane" ?,/Le Discours et la langue/ 6.1, 2014, - Introduction, /Michelle Lecolle/ - La conscience m?talinguistique ordinaire et la linguistique na?ve dans les travaux russes contemporains, /Mich?le Debrenne/ - ? Fais tes syllabes ! ?: quand le terme th?orique est une unit? op?ratoire, /Corinne Gomila/ - /Un verbe c?est quelque chose/ : emploi ? profane ? ou emploi ? savant ? du m?talangage ? l??cole ?l?mentaire ?, /Patrice Gourdet et Dani?le Cogis/ - Lexique m?talinguistique et classes de Fran?ais Langue ?trang?re/Seconde en France, /Ang?lique Martin-Masset / - M?talangage et sentiment linguistique des experts : regard en langue de sp?cialit?, /Aur?lie Picton/ - ? Sentir des adjectifs ? et ? penser avec le nez ?. Le sentiment linguistique dans les m?tiers du sensoriel, /G?rard Petit et Fanny Rinck/ - Glissements progressifs de ? s?mantique ?, /Anne Le Draoulec, Marie-Paule P?ry-Woodley et Josette Rebeyrolle/ - Le /mot ? la mode/ : usages et enjeux d?une expression m?talinguistique profane, /Gilles Siouffi, Agn?s Steuckardt et Chantal Wionet / - Faux amis / vrais ennemis : r?utilisations de la notion d?anglicisme dans le discours m?talinguistique au Qu?bec, /Bruno Courbon et Myriam Paquet-Gauthier/ *Varia * - Les journalistes en Belgique causent-ils ? belge ?, une fois ? Des belgicismes sur les sites d?information, Antoine Jacquet Site de la revue : Le Discours et la langue http://lediscoursetlalangue.wordpress.com/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:09:48 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:09:48 +0200 Subject: Appel: Workshop Enjeux, methodes et outils pour ameliorer la redaction des textes techniques Message-ID: date: Tue, 02 Sep 2014 14:45:57 +0200 from: "Patrick Saint-Dizier" message-id: <172f-5405bc00-243-50e21380 at 46542121> Workshop: Enjeux, m?thodes et outils pour am?liorer la r?daction des textes techniques IRIT, Universit? Paul Sabatier, Toulouse, 13-14 Novembre 2014 Objectifs La r?daction technique est un secteur en pleine expansion du fait, entre autres, de la complexit? des produits commercialis?s et des processus industriels, des exigences croissantes en s?curit? et du d?veloppement des approches en sp?cification (exigences, r?gles m?tier). Les t?ches d?volues aux r?dacteurs techniques deviennent de plus en plus lourdes. Celles-ci incluent une prise en compte plus importante des interactions avec le m?tier et les op?rateurs, mais aussi la prise en compte des contraintes r?glementaires et un accroissement important en mati?re de qualit? de r?daction. Cette qualit? de r?daction est d?une nature diff?rente des contr?les offerts par les ?diteurs de textes classiques et n?cessite une d?marche particuli?re. L?objectif de ce s?minaire est de faire se rencontrer les diff?rents m?tiers de la r?daction technique, les chercheurs, les enseignants, et les industriels qui d?veloppent des outils d?aide ? la r?daction technique afin d?approfondir une connaissance r?ciproque des m?tiers de la r?daction ainsi que les possibilit?s d?aide que peuvent offrir des syst?mes avanc?s en mati?re de traitement de la langue, intelligence artificielle et ergonomie cognitive. Le s?minaire consistera en pr?sentations, d?monstrations et ?tudes de cas, dans le but de promouvoir des liens entre m?tiers et de d?velopper de nouvelles synergies. Th?mes (non exhaustif) - Pratiques de la r?daction technique (en linguistique, ergonomie, psycholinguistique), protocoles d?analyse de ces pratiques - Le document technique : aspects ?pist?mologiques, fonctionnels, linguistiques, conceptuels. Le document technique, ses ?volutions et ses challenges, incluant la dimension multim?dia - Th?ories et recommandations de la r?daction technique (par ex. minimalisme, diff?rentes d?clinaisons de la langue contr?l?e (par ex. par rapport au domaine, aux t?ches, au type de doc technique)), normes m?tier, - Les attentes et besoins de la r?daction technique, le fonctionnement de la salle de r?daction ; r?daction et cycles de vie des documents, la relation r?dacteur-op?rateur (par ex. le REX), - La r?daction technique dans une langue ?trang?re au r?dacteur (anglais), - R?daction technique et maitrise des risques industriels : mod?les math?matiques, psychologiques, etc., - Les challenges en analyse de la coh?rence et de la coh?sion des documents, - Les syst?mes d?aide ? la r?daction technique au niveau de la langue (Rat-RQA, Rubric, Lelie, etc.), et au niveau fonctionnel (Scenari, plateformes bas?es XML), - M?thodes en correction des erreurs : strat?gies et processus, m?thodes linguistiques, capitalisation des corrections, m?moire de correction, - D?monstrations de syst?mes. Participation : gratuite. repas de midi ? r?gler sur place. S?inscrire avant le 15 Octobre. Pour une intervention, soumettre un r?sum? d?une page en Word, format libre, avant le 15 septembre. R?ponse le 30 Septembre. Les industriels auteurs de solutions de r?daction ainsi que les ?quipes de r?dacteurs sont encourag?e ? participer. Adresser toute correspondance : Patrick Saint-Dizier, stdizier at irit.fr Directeur de recherches au CNRS ? l?IRIT. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:06:15 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:06:15 +0200 Subject: Appel: AAAI FLAIRS special track on Artificial Intelligence for Big Social Data Analysis Message-ID: Date: Tue, 2 Sep 2014 04:03:34 -0500 (EST) From: SenticNet Message-ID: <627620085.3512085.1409648614443.open-xchange at bosoxweb01.eigbox.net> X-url: http://sentic.net/flairs Apologies for cross-posting, Submissions are invited for a FLAIRS-28 special track on Artificial Intelligence for Big Social Data Analysis, in cooperation with the Association for the Advancement of Artificial Intelligence (AAAI), to be held in Florida next May. For more info, please visit http://sentic.net/flairs RATIONALE As the Web rapidly evolves, Web users are evolving with it. In an era of social connectedness, people are becoming increasingly enthusiastic about interacting, sharing, and collaborating through social networks, online communities, blogs, Wikis, and other online collaborative media. In recent years, this collective intelligence has spread to many different areas, with particular focus on fields related to everyday life such as commerce, tourism, education, and health, causing the size of the Social Web to expand exponentially. The distillation of knowledge from such a large amount of unstructured information, however, is an extremely difficult task, as the contents of today's Web are perfectly suitable for human consumption, but remain hardly accessible to machines. The opportunity to capture the opinions of the general public about social events, political movements, company strategies, marketing campaigns, and product preferences has raised growing interest both within the scientific community, leading to many exciting open challenges, as well as in the business world, due to the remarkable benefits to be had from marketing and financial market prediction. The main aim of this Special Track is to explore the new frontiers of big data computing for opinion mining and sentiment analysis through machine learning techniques, knowledge-based systems, adaptive and transfer learning, in order to more efficiently retrieve and extract social information from the Web. TOPICS The Special Track aims to provide an international forum for researchers in the field of big data computing for opinion mining and sentiment analysis to share information on their latest investigations in social information retrieval and their applications both in academic research areas and industrial sectors. The broader context of the Special Track comprehends information retrieval, natural language processing, web mining, semantic web, and artificial intelligence. Topics of interest include but are not limited to: - Machine learning for sentiment mining - Concept-level sentiment analysis - Biologically-inspired opinion mining - Sentiment identification & classification - Association rule learning for opinion mining - Time evolving opinion & sentiment analysis - Multi-modal sentiment analysis - Multi-domain & cross-domain evaluation - Knowledge base construction & integration with opinion analysis - Transfer learning of opinion & sentiment with knowledge bases - Sentiment topic detection & trend discovery - Social ranking - Social network analysis - Opinion spam detection The Special Issue also welcomes papers on specific application domains of knowledge-based systems for big social data analysis, e.g., influence networks, customer experience management, intelligent user interfaces, multimedia management, computer-mediated human-human communication, enterprise feedback management, surveillance, art. TIMEFRAME November 17th, 2014: Paper submission deadline January 19th, 2015: Notification of paper acceptance February 23rd, 2015: Camera-ready of accepted papers May 18th-20th, 2015: Conference dates SUBMISSION AND PROCEEDINGS Submitted papers must be original, and not submitted concurrently to a journal or another conference. Double-blind reviewing will be provided, so submitted papers must use fake author names and affiliations. Papers must use the latest AAAI Press template, and must be submitted as PDF through the EasyChair conference system. There are three kinds of submissions: full papers (up to 6 pages), short papers (up to 4 pages), and poster abstracts (up to 250 words). Acceptance as a full paper entails a 20 minute presentation during a regular session, while short papers and abstracts will be required to participate in the poster session. Rejected full papers may still be accepted as short papers or poster abstracts. Selected, expanded versions of Special Track papers will be published in a follow-on Special Issue of Springer's Cognitive Computation journal. ORGANIZERS - Erik Cambria, Nanyang Technological University (Singapore) - Amir Hussain, University of Stirling (UK) - Newton Howard, MIT Media Laboratory (USA) From hamon at LIMSI.FR Tue Sep 2 21:27:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:27:35 +0200 Subject: Ecole: Formation ELAN, 19-20 Novembre 2014, Poitiers Message-ID: Date: Tue, 2 Sep 2014 18:44:07 +0200 From: FR2559 secretariat-general Message-ID: <5405F3D7.6030605 at cnrs.fr> X-url: http://www.typologie.cnrs.fr X-url: http://www.ilf.cnrs.fr DATE LIMITE D'INSCRIPTION AU 15 SEPTEMBRE 2014 Bonjour, Le groupe "Multimodalit? et modalit? gestuo-visuelle" du consortium "Corpus oraux et multimodaux" (IRCOM) propose une formation sur la "NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC ELAN" pendant deux journ?es les 19 et 20 NOVEMBRE 2014 ? Poitiers. Le nombre de participants ?tant limit? pour cet atelier, nous demandons aux personnes int?ress?es de bien vouloir faire parvenir ? Claudia S. Bianchini (claudia.savina.bianchini at univ-poitiers.fr) un bref CV, une lettre indiquant les int?r?ts et motivations du candidat pour participer ? l'atelier, ainsi que la fiche de pr?-inscription d?ment compl?t?e avant le 15 septembre 2014. Les candidatures seront examin?es par un comit? ad hoc du Conseil Scientifique 'Multimodalit?'. Le comit? d'organisation Claudia S. Bianchini, PhD MCF Licence SDL-LSF, Univ. Poitiers claudia.savina.bianchini at univ-poitiers.fr Universit? de Poitiers - UFR Lettres et Langues (B?t. A3) 1 rue Raymond CANTEL - TSA 11102 86073 POITIERS CEDEX 9 ************************************************************************ NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC ELAN ATELIER DE FORMATION 19 et 20 NOVEMBRE 2014 MSHS B?t A5, 5 rue Th?odore Lefebvre 86 000 POITIERS OBJECTIF Le consortium ? Corpus oraux et multimodaux ? (IRCOM) coordonn? par la f?d?ration Typologie et Universaux Linguistiques sous l'?gide de la tr?s grande infrastructure de recherche HUMA-NUM a vocation ? f?d?rer les ?quipes, laboratoires, chercheurs et enseignants-chercheurs engag?s dans la constitution et le traitement de corpus oraux et multimodaux, afin de faire converger les pratiques. A cette fin, l'IRCOM propose un certain nombre de formations dans diff?rents domaines li?s ? l'utilisation de corpus en linguistique. L'un de ces domaines concerne la notation, l'annotation et l'analyse de corpus multimodaux. Une session de formation ? l'annotation avec le logiciel ELAN se d?roulera les mercredi 19 et jeudi 20 novembre 2014 ? Poitiers. COMITE D'ORGANISATION ET FORMATEURS L'atelier ? Notation, annotation et analyse de corpus multimodaux avec le logiciel ELAN ? est organis? par le groupe de travail multimodalit? et modalit? gestuo-visuelle en charge de ces questions au sein du consortium IRCOM. Trois formateurs interviendront dans cet atelier : - Christophe Parisse (Modyco) - Isabelle Rousset (Lidilem) - Dominique Boutet (SFL) DEROULEMENT DE L'ATELIER La formation se d?roulera sur 2 journ?es. Les participants, limit?s ? 28 au total, seront divis?s en deux groupes de travail selon le niveau d'expertise des participants : niveau d?butant et niveau avanc?. Les participants devront apporter leur ordinateur portable (configurations requises, voir ? Avant d'assister ? la formation ?). Les corpus et sch?mas d'annotation utilis?s seront fournis par l'IRCOM. La formation th?orique alternera avec des sessions de mise en pratique et ce tout au long des deux journ?es. INSCRIPTION ET PRISE EN CHARGE DES FRAIS Le nombre de participants ?tant limit? ? 28 participants, nous demandons aux personnes int?ress?es de bien vouloir faire parvenir ? Claudia S. Bianchini (claudia.savina.bianchini at univ-poitiers.fr) un bref CV, une lettre indiquant les int?r?ts et motivations du candidat pour participer ? l'atelier, ainsi que la fiche de pr?-inscription d?ment compl?t?e avant le 15 avril 2014. Les candidatures seront examin?es par un comit? ad hoc du Conseil Scientifique. L'IRCOM prendra en charge les d?jeuners et les pauses caf? qui seront pris sur place. Programme pr?liminaire de l'atelier : - GROUPE DEBUTANTS Jour 1 (19 novembre 2014) Prise en main du logiciel ELAN - Chargement du logiciel. Pr?sentation des principales fonctionnalit?s d'ELAN (d?couverte du menu), chargement de donn?es primaires multimodales (vid?o et audio), cr?ation de pistes (acteurs), segmentations (manuelle, ? la vol?e), annotations. Synchronisation des donn?es primaires. (C. Parisse) - Sensibilisation aux formats et codecs. Comment importer une annotation effectu?e sous excel, ou d'autres logiciels d'annotation (Praat, Transcriber, Toolbox, Clan). B?tir un template sous ELAN : st?r?otypes et types associ?s aux pistes (acteurs). (C. Parisse) Jour 2 (20 novembre 2014) Template et Fonctions avanc?es - B?tir un template sous ELAN : vocabulaire contr?l?. Associations VC, types linguistiques et pistes d'annotation. Fonctions avanc?es d'ELAN (merge et tokeniser). R?partir les annotations entre annotateurs et fusionner les transcriptions. (D. Boutet) - Corriger une annotation : Fonction rechercher/remplacer (fichier simple ou multiple). Faire de requ?tes sous ELAN, sauvegarde des requ?tes et des r?sultats. Exporter vers Excel. (I. Rousset et C. Parisse) - GROUPE AVANCES Jour 1 (19 novembre 2014) Prise en main du logiciel ELAN (Isabelle Rousset) - Questions pr?sidant ? l'?tablissement d'un sch?ma d'annotation, ?laboration d'un template : structuration de l'annotation (type des pistes et des attributs). Constitution de vocabulaires contr?l?s, insertion de diff?rents m?dias, modalit?s de segmentation, annotations. (I. Rousset) - Import d'annotations, Fonctions avanc?es (merge, filtres, copy, tokeniser), Modifications/ r?utilisation d'un template. Sensibilisation ? la constitution d'un manuel de codage. (I. Rousset) Jour 2 (20 novembre 2014) Requ?tes et analyse - Requ?tes, utilisation d'expressions r?guli?res, enregistrement des requ?tes, recherches sur plusieurs fichiers, exports des r?sultats. Utilisation d'Excel : import, export des donn?es, utilisation des fonctions d'Excel pour modifier des donn?es, pour g?n?rer des tiers ou des donn?es ? r?importer le cas ?ch?ant. (C. Parisse) - Insertion de donn?es primaires de type biom?canique (fichiers li?s), affichage dans ELAN, transformation des donn?es en annotations (import des donn?es depuis excel). (D. Boutet) Avant d'assister ? la formation, il est n?cessaire d'avoir t?l?charg? et install? : Pour Windows et Mac OS : - 4 Go d'espace disque disponible pour l'installation des applications 5 Go suppl?mentaires pour le t?l?chargement du contenu - Carte graphique avec les derni?res versions des pilotes mises ? jour ; R?solution d'?cran 1 024 x 768 - Lecteur DVD-ROM (graveur de DVD compatible requis pour la gravure de DVD ; graveur de Blu-ray requis pour la gravure de disques Blu-ray) - Logiciel QuickTime 7 - Connexion Internet requise pour les services Web Microsoft? Service Pack 2, Windows Media Center, Windows Vista?, Windows 7 ou Windows 8. - 2 Go de m?moire RAM - Ecran couleur avec carte vid?o couleurs 16 bits - Pilote d'affichage et de son compatible avec Microsoft DirectX 9 ou 10 - Windows Media Player (requis en cas d'importation/exportation de formats Windows Media) Mac OS (Privil?giez tout de m?me un ordinateur PC) - Processeur Intel? multicoeur 64 bits - Mac OS X v10.6 ? v10. - 8.2 Go de m?moire RAM T?l?chargez les logiciels ELAN, Excel ou openoffice Calc, notepad ++ FICHE DE PRE-INSCRIPTION _____________________ NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC ELAN ATELIER DE FORMATION 19 et 20 NOVEMBRE 2014 MSHS B?t A5, 5 rue Th?odore Lefebvre 86 000 POITIERS L'inscription sera valid?e apr?s l'examen du dossier de candidature compos? : 1) d'un bref CV ; 2) d'une lettre o? le candidat expose ses int?r?ts et motivations ? participer ? l'atelier ; 3) du pr?sent formulaire. Nom, pr?nom : Adresse personnelle : E-Mail : T?l?phone : Statut : O Doctorant O Chercheur / ITA O Post-doctorant O Enseignant-Chercheur O Autre (pr?cisez) : Organisme : A renvoyer avant le 15 septembre 2014 ? claudia.savina.bianchini at univ-poitiers.fr Veuillez nous excuser pour les doublons... ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 20:50:32 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 22:50:32 +0200 Subject: Job: Poste d'ingenieur en developpement Java, Labex ASLAN, Lyon, Oct 2014 Message-ID: Date: Sat, 30 Aug 2014 13:10:14 +0200 From: Serge Heiden Message-ID: <5401B116.6090607 at ens-lyon.fr> X-url: http://aslan.universite-lyon.fr X-url: http://icar.univ-lyon2.fr X-url: http://textometrie.ens-lyon.fr [merci de diffuser dans les universit?s et les ?coles d'ing?nieurs en informatique] ======================================================================== Poste d'ing?nieur en d?veloppement Java, Labex ASLAN, Lyon, Oct 2014 Dans le cadre des activit?s du Labex ASLAN (http://aslan.universite-lyon.fr), le laboratoire ICAR (http://icar.univ-lyon2.fr) cherche ? pourvoir un **CDD de 12 mois** ? partir de d?but octobre 2014 ax? sur le d?veloppement de la plateforme d'analyse de donn?es textuelles TXM (http://textometrie.ens-lyon.fr). L'ing?nieur int?grera l'?quipe de d?veloppement du site de Lyon au sein du laboratoire. Il participera aux ?volutions de la version portail web de TXM (d?veloppement de services de mise en ligne d'?ditions critiques et int?gration du moteur de recherche syntaxique TIGERSearch) ainsi que de la version pour poste (int?gration d'outils de TAL dans la plateforme et d?veloppement de nouveaux services d'annotation/correction de corpus). D'excellentes comp?tences en conception et en programmation sont attendues. Plus pr?cis?ment les comp?tences recherch?es incluent : - exp?rience en conception et d?veloppement Java open-source : d?veloppement Java (type Eclipse RCP), sp?cification/recettage par gestion de tickets (Redmine), gestion de versions (SVN), r?daction de documentation d?veloppeur (Javadoc) et utilisateur (LibreOffice, Dokuwiki) - d?veloppement web : d?veloppement Java/JavaScript (GWT + Tomcat), web services (REST), standards HTML/CSS - traitement XML (StAX/DOM, XSLT) - traitement relationnel (SQL, JDBC) - r?daction technique en fran?ais et en anglais Connaissances suppl?mentaires appr?ci?es : - connaissance de standards d'encodage XML de textes : Text Encoding Initiative, TIGER XML, TMX - connaissance g?n?rale en TAL : tokenization, ?tiquetage morpho-syntaxique, lemmatisation, annotation syntaxique - connaissance en ergonomie des interfaces graphiques utilisateur - langage de programmation C - langage de script R La personne devra faire preuve d'excellentes capacit?s relationnelles pour le travail en ?quipe avec des d?veloppeurs, des chercheurs et des ?tudiants, ainsi que faire preuve d'autonomie. Salaire annuel brut de 26 000 euros selon dipl?me. Le poste est ouvert aux d?butants (r?cents dipl?m?s d'?cole d'ing?nieur ou de Master) mais aussi aux r?cents docteurs poss?dant de bonnes capacit?s en programmation. Le profil poss?de une forte dominante d?veloppement, toutefois le travail attendu s?inscrit dans les activit?s de recherche de l'?quipe Lincobato, tr?s active dans le domaine de l'analyse informatis?e de corpus textuels et la philologie num?rique en ancien fran?ais, et se pr?te ? publications. En fonction de la qualit? de l'ing?nieur/docteur recrut?, le laboratoire b?n?ficie d'un fond constant de projets permettant d'envisager la prolongation du contrat ? l'issue des 12 mois. Les candidats peuvent envoyer un dossier (cv, motivation et ?ventuelles lettres de recommandation, en pdf) ? serge.heiden-_-?-_-ens-lyon.fr. ======================================================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:04:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:04:35 +0200 Subject: Appel: 3emes journees Unitex/Gramlab, 3rd UNITEX/GramLab Message-ID: Date: Mon, 1 Sep 2014 17:46:51 +0200 (CEST) From: Denis Maurel Message-ID: <657913058.1082347.1409586410960.JavaMail.zimbra at univ-tours.fr> X-url: http://www-igm.univ-mlv.fr/~unitex/ English below. Submission deadline: September 5, 2014 3?mes journ?es Unitex/Gramlab 9-10 octobre 2014, Universit? Fran?ois Rabelais Tours Soumission : avant le 5 septembre 2014 Unitex est une plate-forme open-source d?analyse de texte largement utilis?e en recherche, dans l?enseignement et l?industrie. Le syst?me GramLab/Unitex offre en plus aux ?quipes le travail collaboratif (partage de ressources, suivi de versions, etc.). Ces outils reposent sur des technologies de type ? automates ? ?tats finis ? et incorporent des ressources linguistiques ? large couverture, disponibles dans de nombreuses langues. Les journ?es Unitex/GramLab sont un forum qui a pour ambition de rassembler la communaut? des chercheurs et industriels utilisant Unitex et GramLab pour leurs travaux (tous domaines confondus) ou participant au d?veloppement de cette plate-forme et de ses ressources. L?objectif principal de cet ?v?nement est de favoriser le partage d?exp?rience et les contacts entre utilisateurs et d?veloppeurs. Le programme pr?sentera un ?ventail des recherches en cours et offrira une s?rie de formations pratiques de diff?rents niveaux aux chercheurs qui souhaitent utiliser ce syst?me ou d?couvrir de nouvelles fonctionnalit?s. Appel ? communications, formations et d?monstrations 1) Nous invitons les utilisateurs d?Unitex ? soumettre des propositions de communication orale dans les domaines suivants (non exclusifs) : * Les recherches actuelles utilisant Unitex (dans tous les domaines). * Le d?veloppement de ressources ? destination d'Unitex. * Le d?veloppement d'extensions, nouvelles fonctionnalit?s, etc. * Les d?veloppements industriels reposant sur Unitex. * Les initiatives p?dagogiques utilisant Unitex (Unitex dans l'enseignement du TAL ou des ressources linguistiques, etc.). * L?int?gration d?autres outils ? Unitex. 2) Nous invitons les experts ayant une ma?trise particuli?re du syst?me ? proposer des tutoriels dans les domaines suivants ou d?autres : * Utilisation avanc?e des graphes. * Cascades de transducteurs avec CaSys. * ?tiquetage en parties du discours, en parenth?sages minimaux.... * D?veloppement de scripts Unitex / initiation ? la programmation Unitex. * Programmation : persistance et optimisation. * Int?gration Unitex-UIMA dans une chaine de traitement. * autres. 3) Nous faisons ?galement appel aux auteurs d?applications int?grant des fonctionnalit?s d?Unitex et leur proposons de faire la d?monstration de leurs outils. Proc?dure de soumission Envoyer un r?sum? d'une page maximum (3000 caract?res) ? : j.unitex2014 at univ-tours.fr Ce document reprendra les informations suivantes : - Type de communication : * communication orale de 20 minutes * formation (tutoriel) de 2 heures * d?monstration (10 minutes en s?ance pl?ni?re + rencontres) - Nom, pr?nom, affiliation, adresse de courrier ?lectronique - Titre de la pr?sentation - R?sum? de la pr?sentation - Pour les tutoriels : d?fendre l?int?r?t de cette formation et identifier le public vis?. Programme provisoire Mercredi 8 octobre Apr?s-midi: Accueil et visite de la r?gion Jeudi 9 octobre Matin:Pr?sentations Apr?s-midi: Tutoriels - Ateliers et R?union d?veloppeurs (en parall?le) Vendredi 10 octobre Matin : Pr?sentations Apr?s-midi : R?union pl?ni?re (questions aux d?veloppeurs, nouveaut?s, orientations, etc.) Publication et communication Les communications pourront ?tre diffus?es sous forme ?lectronique sur le site de la conf?rence, ? la demande des auteurs. Calendrier Appel ? communication : d?but juillet Soumission : avant le 5 septembre 2014 Approbation/?valuation : 10-15 septembre Inscriptions : - Avant le 30 septembre : 25 euros/jours - Apr?s le 30 septembre : 35 euros /jours - Inscription gratuite pour les formateurs. - Possibilit? de bourse pour les ?tudiants ne disposant pas de financement (soumettre une lettre de demande) - Les frais d?inscription couvrent les pauses caf?, deux repas en restaurant d'entreprise et les documents p?dagogiques distribu?s durant les formations. Comit? de lecture Antonio Balvet, STL, Universit? de Lille 3 Matthieu Constant, IGM, Universit? de Marne-la-Vall?e Anne Dister, Universit? Saint-Louis - Bruxelles C?drick Fairon, CENTAL, Universit? catholique de Louvain Nathalie Friburger, LI, Universit? Fran?ois Rabelais Tours Cvetana Krstev, Universit? de Belgrade Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e ?ric Laporte, IGM, Universit? de Marne-la-Vall?e Denis Maurel, LI, Universit? Fran?ois Rabelais Tours Thierry Poibeau, LaTTice, CNRS Agata Savary, LI, Universit? Fran?ois Rabelais Tours Du?ko Vitas, Universit? de Belgrade Gilles Vollant, Ergonotics Comit? d?organisation Nathalie Friburger, Universit? Fran?ois Rabelais Tours Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e Claude Martineau, LIGM, Universit? Paris-Est Marne-la-Vall?e Denis Maurel, Universit? Fran?ois Rabelais Tours Agata Savary, LI, Universit? Fran?ois Rabelais Tours Comit? de pilotage C?drick Fairon, CENTAL, Universit? catholique de Louvain Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e ?ric Laporte, IGM, Universit? de Marne-la-Vall?e Denis Maurel, Universit? Fran?ois Rabelais Tours Gaelle Recource, Kwaga Du?ko Vitas, Universit? de Belgrade ------------------------------------------------------------------------ 3 rd UNITEX/GramLab Workshop October 9-10, 2014, Universit? Fran?ois Rabelais Tours Submission deadline: September 5, 2014 Unitex is an open-source text analysis software widely used in research, teaching and industry (http://www-igm.univ-mlv.fr/~unitex/). It relies on Finite State technologies and incorporates large-scale language resources for several languages. GramLab is an Integrated Development Environment (IDE), based on Unitex software components but specifically designed for industrial purposes. It integrates tools that help collaborative development, versioning, etc. The Unitex/GramLab Workshop aims at gathering academic and industrial users, developers and researchers contributing to the development of this open-source software and its resources or using them for developing new research or industrial applications. It is also a unique opportunity for new users to learn the basic and advanced Unitex techniques and discuss their projects with experts during hands-on sessions. The program will offer an overview of the current trends: the development of real-life industrial applications based on Unitex, the use of Unitex in various research projects, the improvement of Unitex through the development of new features and the extension of the language resources. Training sessions of various levels will be also offered. Call for communication, training session, demonstrations 1) We invite submissions for communication in the following areas (not exclusive): - Current research projects exploiting Unitex (all domains) - Development of language resources for Unitex - Development of new features or functionalities, optimization of existing programs, etc. - Industrial developements based on Unitex - Pedagogical initiatives using Unitex (for teaching NLP, Corpus linguistics, etc.) - Tools integration in Unitex 2) We invite Unitex experts to offer tutorials in the following domains (or others): * Advanced use of graphs * Cascading Transducers with CaSys * POS tagging * Unitex Scripting (Introduction to Unitex programming) * Persistance and optimization for Unitex-based applications * Building up on Unitex-UIMA * other 3) We also call for developers to demonstrate Unitex-based applications. Submission procedure Send a 1 page abstract (max 3000 characters) to : j.unitex2014 at univ-tours.fr This page will contain the following information: - Type of communication: * Oral communication (20 minutes) * Tutorial (2 hours) * Demonstration (10 minutes in plenary session + poster/demo session) - Name, First name, Institution, e-mail - Title - Abstract - Oral presentation Language (French or English) - For tutorials: explain the rationale for this training and identify target audience Draft program Wednesday 8 october Afternoon possibility to visit the Region of Tours Thursday 9 october : Morning: Presentations Afternoon : Tutorials -Workshop and developpers session (parallel sessions) Friday 10 october : Morning: Presentations Afternoon : Plenary session (questions to developpers, innovations, new orientations, etc.) Proceedings and Publication The Workshop proceedings can be published electronically in the website of the workshop, if the authors wish. Call for papers: Begining of July Submission deadline: September 5, 2014 Author notification: September 10-15, 2014 Registration - Until September 30, 2013: 25 euros/day - After September 30, 2013: 35 euros/day - Free registration for experts in charge of tutorials - A few grants are available for students who do not have access to funding (registration fees waived): submit application letter . - Registration fees cover: coffee breaks, lunches and handouts for the tutorials. Scientific Committee Antonio Balvet, STL, Universit? de Lille 3 Matthieu Constant, IGM, Universit? de Marne-la-Vall?e Anne Dister, Universit? Saint-Louis - Bruxelles C?drick Fairon, CENTAL, Universit? catholique de Louvain Nathalie Friburger, LI, Universit? Fran?ois Rabelais Tours Cvetana Krstev, Universit? de Belgrade Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e ?ric Laporte, IGM, Universit? de Marne-la-Vall?e Denis Maurel, LI, Universit? Fran?ois Rabelais Tours Thierry Poibeau, LaTTice, CNRS Agata Savary, LI, Universit? Fran?ois Rabelais Tours Du?ko Vitas, Universit? de Belgrade Gilles Vollant, Ergonotics Organizing Committee Nathalie Friburger, Universit? Fran?ois Rabelais Tours Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e Claude Martineau, LIGM, Universit? Paris-Est Marne-la-Vall?e Denis Maurel, Universit? Fran?ois Rabelais Tours Agata Savary, LI, Universit? Fran?ois Rabelais Tours Steering Committee C?drick Fairon, CENTAL, Universit? catholique de Louvain Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e ?ric Laporte, IGM, Universit? de Marne-la-Vall?e Denis Maurel, Universit? Fran?ois Rabelais Tours Gaelle Recource, Kwaga Du?ko Vitas, Universit? de Belgrade ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:14:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:14:35 +0200 Subject: Appel: Grammaire des genres et des styles, quelles approches privilegier ? Message-ID: Date: Tue, 02 Sep 2014 16:06:09 +0200 From: Thierry Charnois Message-ID: <5405CED1.3010106 at lipn.univ-paris13.fr> (See English Below) **Grammaire des genres et des styles : quelles approches privil?gier ?** --------------------------------------------------------- Journ?e ConSciLa (Confrontations en Sciences du Langage), Paris le 16 janvier 2015 (lieu annonc? ult?rieurement) **Appel ? communication** La syntaxe moderne s'est g?n?ralement constitu?e autour d'analyses orient?es vers les propri?t?s formelles des phrases et de leurs constituants. Les phrases sont souvent analys?es ind?pendamment de tout ancrage ?nonciatif et plus encore, g?n?rique. Forte de cette perspective, la syntaxe ne consid?re pas comme centraux dans le champ qu'elle occupe, les ph?nom?nes de variations grammaticales, ni les sp?cificit?s relatives ? la nature diff?rente des performances linguistiques. De la m?me fa?on, les approches textuelles -- dans la tradition de la textom?trie ou de l'analyse du discours - ont assez peu point? les caract?ristiques syntaxiques propres aux genres qu'elles ?tudient, ?tant plus attentives aux particularit?s lexicales ou ?nonciatives. Il s'ensuit qu'un genre textuel est rarement caract?ris? par sa sp?cificit? syntaxique. Quant ? la stylistique, discipline la plus ? m?me d'?tudier les particularit?s linguistiques, son ancrage trop acad?mique et son manque d'outillage l'obligent souvent ? circonscrire son analyse ? des unit?s souvent pertinentes mais restreintes et isol?es. Les analyses automatis?es permettent cependant depuis quelques ann?es de mieux identifier les sp?cificit?s lexico-grammaticales des textes, et donc des genres. Il existe deux grandes approches, la premi?re ?tant largement plus d?velopp?e que l'autre : - l'approche ? paradigmatique ? reposant sur la quantification des cat?gories morpho-syntaxiques employ?es. Par exemple, dans son analyse du discours oral en milieu universitaire, Biber (2006) met en ?vidence le sur-emploi (par rapport ? l'?crit) des pronoms de premi?res personnes, des expressions ?valuatives (verbes ? mentaux ?, adverbes ?nonciatifs, etc.), des WH questions, etc. Par factorisation, il est possible de d?gager des faisceaux de propri?t?s g?n?riques donnant la cartographie d'un genre. - l'approche ? syntagmatique ? privil?giant la combinatoire des unit?s lexicales, le rep?rage des s?quences syntagmatiques pr?f?r?es (ou ?vit?es) par un genre. A titre d'exemple, donnons un patron lexico-grammatical (Larjavaara et Legallois en pr?p.) - que l'on d?signe parfois par le terme de motif (Quiniou et al.2012, Longr?e et Mellet 2013) : ce N si ADJ et si ADJ. Ce motif, s?mantiquement ?valuatif, est sp?cifique du genre ? M?moires ? au 19e si?cle (compar? aux genres R?cits de voyage, Romans, Correspondances, Essais de la m?me ?poque) : Oh ! Tant mieux, tant mieux de n' ?tre pas born?s par ce temps si court et si triste ! E. de Gu?rin, Journal (1834-1840) Seulement, pour ne pas faire acte de d?sob?issance et de bravade envers cette m?re si tendre et si aim?e, Maurice lui annon?a [...] un petit voyage au Blanc. G. Sand, Histoire de ma vie, 1855 On ?prouve aujourd'hui encore, comme autrefois, une grande douceur int?rieure ? voir ces lieux si b?nis, et maintenant si abandonn?s. Mgr Dupanloup, Journal intime, 1876 Cette journ?e Conscila consacr?e ? l'analyse de la grammaire et de la stylistique des genres discursifs, a pour objectif de r?unir des chercheurs en linguistique ou en TAL dont les travaux portent sur l'identification des caract?ristiques lexico-grammaticales des textes. Les travaux soumis devront prendre en compte la contrainte de l'exhaustivit? : on ne s'int?ressera pas ? un seul type de formes, mais ? maximum d'?l?ments sp?cifiques d'un genre. Les points suivants pourront ?tre abord?s : - les techniques d'identification des propri?t?s g?n?riques ; - la compl?mentarit? ou comp?titivit? entre approches paradigmatiques et syntagmatiques ; - l'interpr?tation des donn?es. Les propositions de communication porteront donc sur la caract?risation des genres discursifs (litt?raires ou non) ou des styles, dans une perspective exhaustive ; elles aborderont les m?thodes, sans n?gliger la description linguistique. Elles peuvent ?tre ?tendues ? la comparaison entre auteurs, ou porter sur des registres, des pratiques discursives ou encore sur des formes telles que les s?quences textuelles (narrative argumentative, descriptive, etc.). Les travaux peuvent porter sur toute langue, et les genres abord?s peuvent ?tre oraux ou ?crits. Les perspectives peuvent ?tre variables : informatiques, didactiques, stylistiques, discursives, syntaxiques. Les communications se feront en fran?ais ou en anglais. **Soumissions** ---------- 1- Une intention de communication sera envoy?e mi-septembre aux organisateurs ? l'adresse : dominique.legallois at unicaen.fr 2- Une proposition d'une page minimum devra ?tre soumise pour le 1er novembre 2014. La r?ponse aux auteurs sera transmise le 20 novembre 2014. *Organisation* --------- Thierry Charnois (Universit? de Paris 13, LIPN) Sascha Diwersy (Universit? de Cologne) Meri Larjavaara (?bo Akademi) Dominique Legallois (Universit? de Caen, Crisco) R?f: Biber D. (2006) University language: A corpus-based study of spoken and written registers. Amsterdam: John Benjamins Biber, D. & S. Conrad 2009: Register, genre and style. Cambridge: Cambridge University Press. Dorgeloh, H. & A. Wanner (eds) 2010: Syntactic variation and genre, Berlin/New York: De Gruyter Mouton. Larjavaara M et Legallois D. (en pr?p.) ? Les genres discursifs et leur grammaire ? Longr?e D. et Mellet S. (2013. ? Le motif : une unit? phras?ologique englobante ? ?tendre le champ de la phras?ologie de la langue au discours ?, Langages 189 (D. Legallois & A. Tutin, coord.), p.68-80 Martin, J. R. & Rose, D. (2008) : Genre relations. Mapping culture. London: Equinox. Quiniou S., Cellier P., Charnois Th. et Legallois D. (2012)? What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics ? ? in Lecture Notes in Computer Science, Springer Vol. 7181, pp 166-177 Revue Linx, n? 64-65, ? Les genres de discours vus par la grammaire ?, sous la direction de M. Krazem. ------------------------------------------------------------------------ **Grammar of genres and styles: which approaches to prefer?** ConSciLa (Confrontations en Sciences du Langage), Paris, France, Friday 16 January 2015 (the place will be announced later) **Call for submission** Modern syntactic research consists generally of studies that are oriented towards formal properties of sentences. Sentences are then analyzed independently of any utterer-based perspective, or generic textual features. As a result of this, grammatical variation is not viewed as central, nor are performance-related specificities viewed as pertinent to the field of syntax. In a similar manner, textual studies (in the tradition of textometrics and discourse analysis) rarely focus on the syntactic specificities of the genres under scrutiny, and instead concentrate on lexical and utterer-based specificities. As a consequence, textual genre is rarely characterized by its syntactic features. Whereas stylistics would appear most suited to the study of such linguistic features, its practice is flawed by heavily academic nature and lack of formal tools, restricting any analyses to pertinent yet isolated units of texts. In recent years, automatic text analysis has enabled a more accurate identification of lexical and grammatical features of texts and genres. There are two main approaches, the first being more widespread than the second : The paradigmatic approach rests upon the quantification of morpho-syntactic categories. For instance, in his work on oral discourse in the academic community, Biber 2006 uncovers the over-usage (in comparison with written discourse) of first person pronouns, of evaluative expressions ("mental" verbs, modal adverbs, etc.), of WH- questions, etc. By means of factorisation, it is possible to determine a set of properties particular to a specific genre. The syntagmatic approach focuses on the combination of lexical units, the identification of preferred, or dispreferred, syntagmatic segments by genre. To give an illustration of this, consider the lexico-grammatical structure named "pattern" or motif in Quiniou et al, ce N si ADJ et si ADJ (lit : That N so ADJ and so ADJ). This semantico-evaluative pattern is specific to the 19th century genre of Memoirs, in comparison with Travel narrative, Novels, Correspondence, Essays of the same period : Oh ! Tant mieux, tant mieux de n' ?tre pas born?s par ce temps si court et si triste ! E. de Gu?rin, Journal (1834-1840) (lit : that time so short and so sad) Seulement, pour ne pas faire acte de d?sob?issance et de bravade envers cette m?re si tendre et si aim?e, Maurice lui annon?a [...] un petit voyage au Blanc. G. Sand, Histoire de ma vie, 1855 (lit : that mother so tender and so loved) On ?prouve aujourd'hui encore, comme autrefois, une grande douceur int?rieure ? voir ces lieux si b?nis, et maintenant si abandonn?s. Mgr Dupanloup, Journal intime, 1876 (lit : these places so blessed and now so abandoned) This Conscila Study day devoted to the study of grammar and stylistics of discourse genre, aims to bring together researchers in linguistics or NLP whose work focuses on the identification of lexico- grammatical textual features. Papers submitted must take into account the constraints of comprehensiveness : we will not focus on one type of form, but on a maximum of genre-specific elements. The following issues will be discussed: - Techniques for the identification of generic properties ; - The complementarity or competitivity between paradigmatic or syntagmatic approaches; - Data interpretation. Proposals should therefore focus on the characterization of discourse genre (literary or otherwise) or style, in a comprehensive perspective ; methods can be discussed, without neglecting linguistic description. Also of interest is the comparison between authors, the focus on registers, discourse practices, and textual units (narrative, argumentative, descriptive, etc.). Studies may include any language, and both oral and written genres are welcome. We also welcome a variety of perspectives, including: computing, didactics, stylistics, discourse study, syntax... Communications may be presented in French or in English. **Organization** Thierry Charnois (University of Paris 13, LIPN) Sascha Diwersy (Universit?t zu K?ln) Meri Larjavaara (?bo Akademi) Dominique Legallois (University of Caen, Crisco) **Submission Deadline** : 1- An intention to submit a paper will be sent by mid-September at dominique.legallois at unicaen.fr 2- A detailed proposal of at least 1 full page should then be submitted by 1 November 2014. Selected papers will be notified by 20 November 2014 . Ref : Biber D. (2006) University language: A corpus-based study of spoken and written registers. Amsterdam: John Benjamins Biber, D. & S. Conrad 2009: Register, genre and style. Cambridge: Cambridge University Press. Dorgeloh, H. & A. Wanner (eds) 2010: Syntactic variation and genre, Berlin/New York: De Gruyter Mouton. Larjavaara M et Legallois D. (en pr?p.) ? Les genres discursifs et leur grammaire ? Longr?e D. et Mellet S. (2013. ? Le motif : une unit? phras?ologique englobante ? ?tendre le champ de la phras?ologie de la langue au discours ?, Langages 189 (D. Legallois & A. Tutin, coord.), p.68-80 Quiniou S., Cellier P., Charnois Th. et Legallois D. (2012)? What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics ? ? in Lecture Notes in Computer Science, Springer Vol. 7181, pp 166-177 Martin, J. R. & Rose, D. (2008) : Genre relations. Mapping culture. London: Equinox. revue Linx n? 64-65 , ? Les genres de discours vus par la grammaire ?, sous la direction de M. Krazem ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 20:51:45 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 22:51:45 +0200 Subject: Journee: Ateliers de formation au logiciel TXM (textom=?UTF-8?Q?=C3=A9trie=29=2C_?=dates pour septembre-octobre 2014 Message-ID: Date: Sat, 30 Aug 2014 14:34:09 +0200 From: Serge Heiden Message-ID: <5401C4C1.4040600 at ens-lyon.fr> X-url: http://textometrie.ens-lyon.fr X-url: https://docs.google.com/forms/d/1kZtxgKzVIPkDdjUV1k3DOUMdLk-V71A36dQc-ksL9EQ/viewform X-url: https://groupes.renater.fr/wiki/txm-users/public/ateliers_txm Bonjour, Le logiciel open-source de textom?trie TXM permet l'analyse documentaire (qualitative) et statistique (quantitative) de donn?es textuelles (dont l'oral transcrit), pour des corpus de recherche personnels ou pour la mise en ligne de corpus : http://textometrie.ens-lyon.fr Les prochains ateliers de formation au logiciel TXM auront lieu ? Lyon, ? l'ENS site Descartes, les journ?es suivantes (9h/9h30-17h30/18h30) : - jeudi 25 septembre : Initiation ? TXM ; - vendredi 26 septembre : Pr?paration de corpus et import dans TXM. Un atelier "TXM avanc?" pourra ?galement ?tre organis? si nous pouvons r?unir un petit groupe d'utilisateurs exp?riment?s (faisant d?j? des analyses avec TXM sur leurs donn?es). Si vous ?tes int?ress?(e) par l'une de ces s?ances, il faut vous inscrire en remplissant le formulaire en ligne : https://docs.google.com/forms/d/1kZtxgKzVIPkDdjUV1k3DOUMdLk-V71A36dQc-ksL9EQ/viewform (l'inscription est n?cessaire m?me si vous aviez r?pondu ? la consultation doodle.) Toute l'information sur les ateliers : https://groupes.renater.fr/wiki/txm-users/public/ateliers_txm Au plaisir de vous retrouver peut-?tre ? l'une de ces journ?es, Serge Heiden, pour l'?quipe TXM. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:02:23 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:02:23 +0200 Subject: Appel: Lidil 53, Phraseologie et genres de discours Message-ID: Date: Mon, 1 Sep 2014 08:30:45 +0200 From: Agn?s Tutin Message-ID: <000001cfc5ae$4393e120$cabba360$@u-grenoble3.fr> X-url: http://lidil.revues.org/ Appel ? contributions ? Lidil ? No 53 ? juin 2016 Site de Lidil : http://lidil.revues.org/ Phras?ologie et genres de discours : patrons, motifs, routines (English version below) Num?ro coordonn? par Fr?d?rique Sitri (Modyco, Universit? Paris Ouest) et Agn?s Tutin (LIDILEM, Universit? de Grenoble-Alpes) Dans ce num?ro de Lidil, nous souhaitons aborder les points de rencontre entre phras?ologie et genres de discours, en nous int?ressant particuli?rement aux ? routines ? observables dans les genres institu?s (au sens de Maingueneau 2004). Le th?me abord? se situe dans la continuit? du symposium ? Phras?ologie et routines dans diff?rents genres de l??crit ?, organis? lors du congr?s Wrab (Nanterre, f?vrier 2014). Comme le rappellent Legallois et Tutin (2013), la phras?ologie envisag?e dans une perspective ? ?tendue ?, int?grant les outils statistiques d?velopp?es dans le domaine de la linguistique de corpus, de la textom?trie et du Traitement Automatique des Langues, est amen?e ? prendre en compte des s?quences (des unit?s) moins fig?es et d?un empan textuel plus large que celles habituellement analys?es dans un cadre lexical. Cette perspective ?tendue rencontre les travaux portant sur des genres institu?s, comme les genres acad?miques et scientifiques (Swales 1990, Biber 2006, Poudat 2006, Rinck 2006, Boch et al. 2007, Tutin et Grossmann 2014) ou les genres professionnels (N?e et al. 2014), travaux qui font apparaitre des patrons lexico-syntaxiques (plus ou moins) facilement mis en ?vidence par des calculs de fr?quence et de sp?cificit?s (concordanciers, segments r?p?t?s, n-grammes, cooccurrences, colligations et cadres collostructionnels, etc.) et se proposent de les mettre en relation avec des sp?cificit?s propres au genre : on parlera de fonctions rh?torico-argumentatives, de fonctions pragmatiques, de fonctions textuelles ou encore de d?terminations discursives et interdiscursives, selon le cadre th?orique et la vision du genre que l?on adopte (vision bakhtinienne du genre ou approche plus inductive ? la fa?on de Biber par exemple). Dans une perspective d?analyse de discours, on est attentif aux ph?nom?nes de r?p?tition et de redondance car ils constituent un mode d?acc?s ? des ?l?ments pr?construits, ? d?j?-l? ?, que l?on peut mettre en relation avec plusieurs niveaux de d?termination du discours. Ainsi, les travaux men?s au sein du Laboratoire de Saint-Cloud sur les r?solutions de congr?s syndicaux mettent-ils en ?vidence, ? partir des inventaires de segments r?p?t?s et des concordances, plusieurs niveaux de figement : figements en langue mais aussi figements propres au genre, et figements propres au domaine (ou secteur d?activit? pour rependre le terme de Bakhtine), comme le discours syndical, le discours de la CGT par exemple (voir Fiala et al. 1987 par exemple). On pourra ?galement citer les travaux de S. Branca sur les ?crits des peu-lettr?s (lettres de soldats de la guerre 14-18 par exemple). Ces travaux mettent en ?vidence l?existence de patrons (appel?s ? formulaires ?) qui en plus de fonctions textuelles, pragmatiques et identitaires, permettent la mise en place de ? routines ?, de ? pr?ts-?-?crire ? facilitant l?entr?e dans l??criture des peu-lettr?s. On pourrait rapprocher ces caract?ristiques des ? routines ? rep?r?es dans les ?crits professionnels (P?ne 1994). Du point de vue de la mod?lisation linguistique, la description de l?association de s?quences phras?ologiques avec des fonctions ou des d?terminations g?n?riques est extr?mement foisonnante et diverse : elle a pu ?tre d?crite ? la fois avec des d?finitions issues de la lexicom?trie en termes de ? segments r?p?t?s ? dans la tradition du discours politique (Salem 1987), les ? n-grammes ? du traitement automatique des langues (Granger & Paquot 2008), les ? blocs lexicaux ? (? lexical bundles ? de Biber, par ex. 2006), mais aussi dans une perspective discursive ? l?aide de ? motifs ? (Longr?e et Mellet 2013) , ? motifs s?quentiels ? (Quiniou et al. 2012) ou ? routines discursives ? (N?e et al. 2014). Il nous apparait opportun de revenir aujourd?hui sur ces objets phras?ologiques dont les d?finitions restent encore parfois sommaires afin d?en pr?ciser les contours et les caract?ristiques s?mantiques, syntaxiques et ?nonciatives si l?on souhaite se les approprier dans la description linguistique, en particulier dans une perspective d?analyse du discours. Les aspects m?thodologiques associ?s ? cette probl?matique (m?thodes d?extraction, outils d?exploration de corpus) sont ?galement de premi?re importance dans la mesure o? les routines extraites sont souvent d?termin?es par des m?thodes quantitatives et des outils de traitement de corpus, dans une d?marche de linguistique outill?e. Si ces m?thodes sont largement utilis?es dans les travaux linguistiques de langue anglaise, elles restent encore ? promouvoir dans les ?tudes sur l?analyse de discours et la phras?ologie en fran?ais. Ce num?ro de Lidil se fixe donc pour objectif de pr?ciser les liens entre les routines phras?ologiques et les genres institu?s en proposant de r?fl?chir : a) ? la cat?gorisation de ces objets phras?ologiques (d?finition, structure, mod?lisation) et aux m?thodes ?labor?es pour les mettre en ?vidence dans les corpus, par exemple aux outils d?exploration de TAL et aux mod?les descriptifs. b) aux liens entre routines et genres textuels, y compris les genres institu?s de l?oral : on pourra s?interroger en particulier sur les diff?rentes fonctions associ?es ? ces routines. En effet, si certaines routines apparaissent constitutives de genres textuels sp?cifiques il apparait n?cessaire d?observer plus en finesse leurs fonctions, en particulier dans l?argumentation. Dans une perspective d?analyse de discours, si l?on consid?re les s?quences phras?ologiques comme des ? pr?construits ?, on pourra ?galement s?interroger sur leur niveau de cristallisation : les routines observ?es sont-elles propres ? un genre, ? plusieurs genres, ? une sph?re d?activit?, ? une formation discursive, etc. ? c) aux liens entre routines discursives et textuelles et processus d??criture. Dans quelle mesure les scripteurs ont-ils conscience et exploitent-ils ces s?quences pr?fabriqu?es ? Dans quelle mesure les routines facilitent-elles ou au contraire, contraignent-elles l??criture ? d) au r?le de ces routines dans la cr?ativit? langagi?re des scripteurs. Les routines correspondent-elles essentiellement ? des contenus d?s?mantis?s, acquis par acculturation au genre, ou permettent-elles une part de cr?ativit? ? Bibliographie Bakhtine M., 1979 [1984 pour la traduction]. Les genres du discours. in Esth?tique de la cr?ation verbale, Paris, Gallimard. Biber, Douglas. (2006). University Language : a corpus-based study of spoken and written registers. Amsterdam/Philadelphia: John Benjamins. Boch, Fran?oise, Grossmann, Francis & Rinck, Fanny. (2007). Conform?ment ? nos attentes??, ou l??tude des marqueurs de convergence/divergence dans l?article de linguistique. Revue Fran?aise de Linguistique Appliqu?e, XII(2), p. 109-122. Branca-Rosoff, Sonia (1997). Mod?les de locutionnarit? et effets de figement dans le discours politique de l'an II. In: Fiala, P., Lafon, P., Piguet, M.-F. (?ds.), p. 285- 293. Branca-Rosoff, Sonia & Schneider, Nathalie (1994). L'?criture des citoyens: une analyse linguistique de l'?criture des peu-lettr?s pendant la p?riode r?volutionnaire (Vol. 13). ENS Editions. Fiala, Pierre, Habert, Beno?t, Lafon, Pierre & Pineira, Carmen (1987). Des mots aux syntagmes, figements et variations dans la R?solution g?n?rale du congr?s de la CGT de 1978. Mots, 14, p. 45-87. Granger, Sylviane & Paquot, Magali (2008). Disentangling the phraseological web. In: Granger, S., Phraseology: An Interdisciplinary Perspective, Benjamins: Amsterdam and Philadelphia, p. 27-49. Legallois, Dominique & Tutin, Agn?s (2013). Pr?sentation : Vers une extension du domaine de la phras?ologie. Langages, 189, p. 3-25. Longr?e, Dominique & Mellet, Sylvie (2013). Le motif: une unit? phras?ologique englobante? ?tendre le champ de la phras?ologie de la langue au discours. Langages, 189, p. 65-79. Maingueneau, Dominique (2004). Retour sur une cat?gorie : le genre, dans J.-M. Adam, J.-B. Grize et Magid Ali Bouacha, Texte et discours : cat?gories pour l?analyse, Editions Universitaires de Dijon, p.107-118. N?e Emilie, Sitri Fr?d?rique & Veniard Marie (2014). Pour une approche des routines discursives dans les ?crits professionnels. Congr?s du CMLF, 19-23 juillet 2014, Berlin. P?ne Sophie (1994). Analyse de postes, bilan d?entretiens, ?critures de proc?dures. Un ? pr?t-?-?crire ? pour inscrire l?activit?. ?ducation permanente. 120, p. 39-57. Poudat, C?line (2006). Etude contrastive de l'article scientifique dans une perspective d'analyse des genres. Th?se de doctorat, Universit? d?Orl?ans. Quiniou, Solen, Cellier, Peggy, Charnois, Thierry & Legallois, Dominique (2012). Fouille de donn?es pour la stylistique: cas des motifs s?quentiels ?mergents. Actes des Journ?es Internationales d'Analyse Statistique des Donn?es Textuelles, p. 821-833. Rinck, Fanny (2006). L?article de recherche en Sciences du Langage et en Lettres, Figure de l?auteur et approche disciplinaire du genre. Th?se de doctorat en Sciences du Langage, sous la direction de F. Boch et F. Grossmann, Universit? de Grenoble. Salem, Andr? (1987). Pratique des segments r?p?t?s. Paris : Klincksieck. Swales, John M. (1990). Genre Analysis: English in academic and research settings. Cambridge: Cambridge University Press. Tutin, Agn?s & Grossmann, Francis (eds.) (2014). L'?crit scientifique : du lexique au discours. Autour de Scientext. Rennes : Presse universitaire de Rennes. Calendrier pour l?envoi des propositions - Soumission d?une proposition d?article de 4 pages (? fsitri at u-paris10.fr et agnes.tutin at u-grenoble3.fr) : 10 d?cembre 2014. - Notification d?acceptation de la proposition : 15 janvier 2015 - Envoi des articles r?dig?s : 1er juin 2015 - Notification d?acceptation : 1er octobre 2015 - Envoi des textes r?vis?s : f?vrier 2016 - Publication juin 2016 ------------------------------------------------------------------------ Phraseology and discourse genres: patterns, "motifs?, routine fomulae Guest editors: Fr?d?rique Sitri (MoDyCo, University Paris Ouest) and Agn?s Tutin (LIDILEM, University of Grenoble-Alpes) In this issue of LIDIL, we wish to address the intersections between phraseology and discourse genres by focusing on routine formulae found in instituted genres (genres institu?s as defined by Maingueneau, 2004). This theme is a continuation of the symposium "Phraseology and routines in different written genres", held during the Wrab congress (Nanterre, February 2014). As Legallois and Tutin (2013) have reiterated, an extended perspective of phraseology, including statistical methods of corpus linguistics, natural language processing and textometry, will necessarily treat less fixed sequences (units) and a wider textual span than usually analyzed within a lexical framework. This extended perspective confronts studies on instituted genres, such as academic or scientific texts (Swales 1990, Biber 2006, Poudat 2006, Rinck 2006, Boch et al. 2007, Tutin and Grossmann 2014) or professional genres (N?e et al. 2014) which reveal lexico-syntactic patterns, which are (more or less) easily identified through frequency and specificity statistics (concordancers, repeated sequences, n-grams, co-occurrences, colligations, collostructional frames, etc.). These patterns can then be associated with genre-specific functions: rhetorical-argumentative, pragmatic, textual or discursive functions, but also interdiscursive factors, depending upon the adopted theoretical framework (for example, the Bakhtinian vision of genre or Biber?s more inductive approach). From a perspective of discourse analysis, attention to repetition and redundancy provide a means of access to pre-fabricated "already there" components, which can be related to different levels of determination within the discourse. Thus, the St. Cloud Laboratory research, based on n-grams and concordances, has drawn from the resolutions of trade union congresses to reveal several levels of fixed sequences: fixed expressions, but also linguistic features of domain- or genre-specific fixed expressions (or sphere of activity to employ Bakhtin?s term) of, for example, trade union discourse, such as that of the CGT (see Fiala et al. 1987). Also notable is S. Branca?s study on writing by limited-proficiency populations (letters of soldiers from WWI for example). These studies demonstrate the existence of patterns (called "formulas" or formulaires) which, in addition to textual, pragmatic and identity functions, foster the establishment of "routines" and "ready-to-write" formulae, allowing low- or limited-literate individuals to access writing. These features can be compared to routines identified in professional literature (P?ne 1994). From the perspective of language modeling, the descriptions of associations of phraseological sequences with linguistic and discursive functions has been widely discussed: calling upon both lexicometry-based definitions in terms of "repeated segments" in the tradition of political discourse (Salem 1987), "n-grams" of natural language processing (Granger & Paquot 2008), "lexical bundles" (Biber 2006) and also in a discursive perspective examined through the lens of "motifs" (Longr?e and Mellet 2013), "sequential patterns" (Quiniou et al. 2012) or "discursive routines" (N?e et al. 2014). It now appears appropriate to reconsider these phraseological objects, whose definitions may have remained superficial, in order to clarify their boundaries and their semantic, syntactic and enunciative features, especially in a perspective of discourse analysis. Methodological issues associated with this topic (extraction methods or corpus exploration tools) are also crucial as the extracted routines are often determined by quantitative methods and corpus processing tools. While these methods are widely used in English-speaking linguistics, they still remain to be promoted in French-speaking discourse analysis and phraseological studies. This issue of LIDIL therefore aims at clarifying the relationships between linguistic routines and instituted genres by proposing to consider: a) the categorization of these phraseological objects (definition, structure, modeling) and methods developed to identify them in corpora, for example NLP tools or descriptive models. b) the links between routines and textual genres, including oral instituted genres: one might discuss the different functions associated with these routines. While some routines appear specific to given textual genres, it is crucial to closely observe their functions, especially in argumentative texts. To evaluate the degree to which prefabricated patterns are fixed, one might ask if observed routines are specific to a textual genre, to several genres, to a sphere of activity or to a discursive type, etc. c) the links between discursive and textual routines and writing process. To what extent are writers aware of and exploit these prefabricated sequences? To what extent do routines facilitate, or rather, hinder the writing process? d) the role of these routines in the creativity of the writing process. Are routines genre-specific prefabricated patterns nearly devoid of semantic content and acquired by genre acculturation or do they allow a degree of creativity? Schedule for submissions - Submission of abstract (4 pages pages to fsitri at u-paris10.fr and agnes.tutin at u-grenoble3.fr): 10 december 2014 - Notification of acceptance of abstract: 15 january 2014 - Submission of full article: 1 june 2015 - Notification of acceptance of full article: 1 october 2015 - Revisions due: 1 february 2016 - Publication: 1 june 2016 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:07:42 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:07:42 +0200 Subject: Job: CDD Ingenieur TAL, 18 mois, CEA LIST / LVIC, Palaiseau, Ile-de-France Message-ID: Date: Tue, 2 Sep 2014 09:13:19 +0000 From: SEMMAR Nasredine 202247 Message-ID: <50CC12289F0C854FBFF134F270030CD71ECF89DA at EXDAG0-B3.intra.cea.fr> Contexte : ------------ Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ing?nierie des Contenus) travaille sur l'analyse de contenus multim?dias (analyse de textes, images et vid?os, perception 3D). Dans le domaine de l'analyse de texte, le CEA LIST recherche un CDD ing?nieur ou docteur pour travailler sur des techniques de classification et clustering de textes dans un cadre multilingue. Objectifs : ------------ A partir de document textuels provenant de plusieurs sources (par exemple des d?p?ches d'actualit?), pouvant ?tre de langues diff?rentes, l'application vis?e a pour but de regrouper automatiquement les d?p?ches traitant des m?mes sujets. Ce regroupement sera dans un premier temps fond? sur des mesures standard de similarit? textuelle (repr?sentation vectorielle s'appuyant sur une analyse linguistique des textes), mais des mesures de similarit?s plus s?mantiques, s'appuyant en particulier sur la notion de s?mantique distributionnelle, seront ?galement test?es. Pour le clustering proprement dit, plusieurs algorithmes seront envisag?s (clustering hi?rarchique, Shared Nearest Neighbors, Markov Clustering...), mais les algorithmes d?velopp?s devront ?tre suffisamment robustes pour travailler ? large ?chelle. La t?che du CDD consistera donc en particulier ? : - ?tudier et tester les algorithmes de clustering de documents sur des corpus de diff?rentes langues ; - travailler sur la mise au point d'un espace de repr?sentation des documents commun pour des documents de langues diff?rentes, fond? sur un alignement des lexiques bilingues pour construire des clusters mutlilingues ; - ?valuer les diff?rentes solutions sur des corpus de r?f?rence ; Profil recherch?: -------------------- - Comp?tences en traitement automatique des langues / recherche d'information / mesures de similarit? textuelle - Connaissances des techniques d'apprentissage et de clustering / classification (SVM, CRF, etc.) - Comp?tences informatiques: C/C++, scripts (perl, python...) R?mun?ration selon formation. Les candidatures (CV + Lettre de motivation) sont ? envoyer le plus rapidement possible ? : Olivier Ferret (olivier.ferret at cea.fr) Romaric Besan?on (romaric.besancon at cea.fr) Nasredine Semmar (nasredine.semmar at cea.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:27:53 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:27:53 +0200 Subject: Ecole: Formation CLAN, 17-18 Novembre 2014, Poitiers Message-ID: Date: Tue, 2 Sep 2014 18:40:44 +0200 From: FR2559 secretariat-general Message-ID: <5405F30C.1020406 at cnrs.fr> X-url: http://childes.psy.cmu.edu/clan/ X-url: http://childes.psy.cmu.edu/morgrams/ /*DATE LIMITE D'INSCRIPTION AU 15 SEPTEMBRE 2014* / /Bonjour, Le groupe "Multimodalit? et modalit? gestuo-visuelle" du consortium "Corpus oraux et multimodaux" (IRCOM) propose une formation sur la "NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC CLAN " pendant deux journ?es les 17 et 18 NOVEMBRE 2014 ? Poitiers. Le nombre de participants ?tant limit? pour cet atelier, nous demandons aux personnes int?ress?es de bien vouloir faire parvenir ? St?hanie Gobet (stephanie.gobet.jacob at univ-poitiers.fr ) un bref CV, une lettre indiquant les int?r?ts et motivations du candidat pour participer ? l?atelier, ainsi que la fiche de pr?-inscription d?ment compl?t?e avant le 15 septembre 2014. Les candidatures seront examin?es par un comit? ad hoc du Conseil Scientifique ?Multimodalit??. Le comit? d'organisation Claudia S. Bianchini, PhD MCF Licence SDL-LSF, Univ. Poitiers claudia.savina.bianchini at univ-poitiers.fr Universit? de Poitiers - UFR Lettres et Langues (B?t. A3) 1 rue Raymond CANTEL - TSA 11102 86073 POITIERS CEDEX 9 ************************************************************************ NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC CLAN** **ATELIER DE FORMATION 17 et 18 NOVEMBRE 2014** **MSHS B?t A5, 5 rue Th?odore Lefebvre 86 000 POITIERS* _OBJECTIF_ Le consortium ? Corpus oraux et multimodaux ? (IRCOM) coordonn? par la f?d?ration Typologie et Universaux Linguistiques sous l??gide de la tr?s grande infrastructure de recherche HUMA-NUM a vocation ? f?d?rer les ?quipes, laboratoires, chercheurs et enseignants-chercheurs engag?s dans la constitution et le traitement de corpus oraux et multimodaux, afin de faire converger les pratiques. A cette fin, l?IRCOM propose un certain nombre de formations dans diff?rents domaines li?s ? l?utilisation de corpus en linguistique. L?un de ces domaines concerne la transcription et l'analyse de corpus multimodaux avec CLAN. Une formation se d?roulera les lundi 17 et mardi 18 novembre 2014 ? Poitiers. _COMITE D?ORGANISATION ET FORMATEURS_ L?atelier ? Transcription et analyse de corpus multimodaux avec le programme CLAN ? est organis? par le conseil scientifique du groupe ?Multimodalit?? de l?IRCOM. Trois formatrices interviendront dans cet atelier : - St?phanie Ca?t (Sorbonne Nouvelle ? Paris 3) - Annie-Claude Demagny (Structures Formelles du Langage) - Efstathia Soroli (Universit? Lille 3) _DEROULEMENT DE L?ATELIER_ L?atelier ? Transcription et analyse de corpus multimodaux avec le programme CLAN ? se d?roulera sur 2 jours. Le nombre de participants est limit? ? 30 au total. Il est demand? aux participants d?apporter leur ordinateur portable et d?avoir t?l?charg? les programmes requis (voir note). La premi?re journ?e sera consacr?e ? la th?orie et ? la pratique de la transcription. Les corpus seront fournis par l?IRCOM, mais les participants peuvent ?galement apporter leurs propres enregistrements audio ou vid?o (format requis, voir note). La deuxi?me journ?e sera consacr?e ? l?exploitation de transcriptions (fournies par l?IRCOM) ? l?aide des commandes de CLAN ainsi qu?? leur exportation vers d?autres programmes, comme le programme ELAN pour lequel une autre formation est organis?e les 19 et 20 novembre 2014. _INSCRIPTION ET PRISE EN CHARGE DES FRAIS_ Le nombre de participants ?tant limit? pour cet atelier, nous demandons aux personnes int?ress?es de bien vouloir faire parvenir ? St?phanie Gobet (stephanie.gobet.jacob at univ-poitiers.fr) un bref CV, une lettre indiquant les int?r?ts et motivations du candidat pour participer ? l?atelier, ainsi que la fiche de pr?-inscription d?ment compl?t?e avant le 15 avril 2014. Les candidatures seront examin?es par un comit? ad hoc du Conseil Scientifique ?Multimodalit??. L?IRCOM prendra en charge les repas de midi et les pauses caf? qui seront pris sur place. Programme pr?liminaire de l?atelier : J.1 (lundi 17 novembre 2014) : Transcrire avec CLAN - Matin?e ? Premi?re ?tape de la transcription avec CLAN : ins?rer des balises temporelles associ?es au m?dia (audio ou vid?o) ? transcrire. Implications th?oriques et mise en pratique. - Apr?s-midi ? Transcription des donn?es. Implications th?oriques et mise en pratique. J.2 (mardi 18 novembre 2014) : Les commandes de CLAN - Matin?e ? Pr?sentation des commandes les plus fr?quemment utilis?es pour l?analyse de donn?es transcrites (FREQ, COMBO, MOR, MLU), export vers Excel, et mise en pratique. - Apr?s-midi ? Export de donn?es transcrites sous CLAN vers d?autres programmes (Excel, ELAN et PRAAT) pour approfondir les analyses. _*Avant d?assister ? la formation,*_ il est n?cessaire d?avoir t?l?charg? et install? : - le programme CLAN ? cette adresse : http://childes.psy.cmu.edu/clan/ - pour Windows (2000/XP/Vista/7) : cliquez sur ? CLANWin ? - pour Mac (OS X 10.4 minimum) : cliquez sur ? CLAN ? - d?autres types d?installation (anciennes versions pour PC, versions zipp?es pour Mac) sont disponibles sur cette page au cas o? les installateurs usuels ne fonctionnent pas ; - la grammaire de la langue ?tudi?e : http://childes.psy.cmu.edu/morgrams/ - le logiciel Quicktime : http://www.apple.com/quicktime/ Si les participants apportent leurs propres donn?es audio, celles-ci doivent ?tre au format .wav ou .mp3 ; s?ils apportent leurs propres donn?es vid?o, celles-ci doivent ?tre au format .mov. *FICHE DE PRE-INSCRIPTION* ____________________________ NOTATION, ANNOTATION ET ANALYSE DE CORPUS MULTIMODAUX AVEC CLAN ATELIER DE FORMATION 17 et 18 NOVEMBRE 2014 MSHS B?t A5, 5 rue Th?odore Lefebvre 86 000 POITIERS L?inscription sera valid?e apr?s l?examen du dossier de candidature compos? : 1) d?un bref CV ; 2) d?une lettre o? le candidat expose ses int?r?ts et motivations ? participer ? l?atelier ; 3) du formulaire ci-dessous ? compl?ter. Nom, pr?nom : Adresse personnelle : E-Mail : T?l?phone : Statut : ? Doctorant ? Chercheur / ITA ? Post-doctorant ? Enseignant-Chercheur ? Autre (pr?cisez) : Organisme : A renvoyer avant le 15 septembre 2014 ? _stephanie.gobet.jacob at univ-poitiers.fr_ /Veuillez nous excuser pour les doublons.../ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 2 21:11:20 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 2 Sep 2014 23:11:20 +0200 Subject: Appel: Journee d'etude ATALA, Ethique et TAL Message-ID: Date: Tue, 2 Sep 2014 15:43:27 +0200 (CEST) From: Karen Fort Message-ID: <1792169344.22120425.1409665407575.JavaMail.zimbra at loria.fr> X-url: http://www.schplaf.org/kf/JE_ATALA.html Bonjour ? tous, Le TAL est une discipline au c?ur de l'?thique scientifique, ? la fois en tant qu'elle fournit des outils pour assurer l'utilisation ?thique des donn?es mais ?galement par son long historique de travaux sur des sources sensibles, ou la n?cessaire implication de nombreux collaborateurs pour la cr?ation de ressources langagi?res volumineuses. Concernant les outils, l'anonymisation des donn?es, qu'elles soient orales ou ?crites, est un enjeu tant industriel qu'acad?mique, avec des contraintes de couverture parfois fortes selon les besoins applicatifs ou de recherche, la nature des ressources et des informations ? anonymiser ou encore les limitations l?gales. D'autres outils du TAL s'inscrivent ?galement dans des pr?occupations ?thiques, comme les outils de d?tection de plagiat ou de v?rification de faits. La diversification des travaux sur corpus a par ailleurs amen? la communaut? ? traiter des sources de plus de plus sensibles, qu'il s'agisse de donn?es personnelles, m?dicales, voire ? caract?re criminel. En outre, l'av?nement du Web 2.0. et avec lui le d?veloppement de la myriadisation (crowdsourcing), pose de nouvelles questions quant ? la mani?re de consid?rer les intervenants dans la cr?ation de ressources langagi?res. Enfin, les pr?occupations concernant l'utilisation des outils de TAL ne sont pas nouvelles, mais elles deviennent de plus en plus sensibles ? l'heure des Big Data et du recoupement des donn?es auquel participe le TAL. Aux questions juridico-?conomiques (fouille de brevets, droits associ?s aux donn?es/logiciels), s'ajoutent les enjeux militaires (surveillance des ?changes) et sociaux (le ? droit ? l?oubli ? impos? ? Google). Cette journ?e d'?tude se veut un lieu d'?change ouvert sur ces sujets. Cet appel ? communications s'adresse donc aux chercheur(e)s en traitement automatique des langues ou en linguistique, aux industriel(le)s ayant ? utiliser des ressources langagi?res et aux expert(e)s dans les questions ?thiques. Th?mes de la journ?e La journ?e commencera par une conf?rence invit?e. Les communications sollicit?es concernent aussi bien des travaux de recherche que des exp?riences industrielles, notamment dans les domaines suivants : * outils ?thiques pour le TAL, ou reposant sur des techniques du TAL * m?thodes et bonnes pratiques ?thiques en TAL * TAL et aspects juridiques * traitement des donn?es sensibles * recherche en TAL et principes ?thiques * myriadisation et ?thique Modalit?s de soumission Les propositions seront ? envoyer ? Kar?n Fort (karen.fort at paris-sorbonne.fr - merci de pr?ciser [JE ATALA] dans le d?but du titre) - au plus tard le 15 septembre 2014. Elles devront ?tre r?dig?es en fran?ais pour les francophones, et pourront ?tre r?dig?es en anglais pour les non-francophones. Les r?sum?s seront publi?s apr?s la journ?e sur le site de l'ATALA. Format de la soumission : r?sum? de 2 pages (format type LREC, disponible sur le site de la journ?e : http://www.schplaf.org/kf/JE_ATALA.html ) Comit? scientifique * Olivier Baude, LLL, Universit? d?Orl?ans * Kevin B. Cohen, Biomedical Text Mining Group, University of Colorado School of Medicine * Alain Couillault, L3i, Universit? de La Rochelle / Aproged * C?cile Fabre, CLLE-ERSS, Universit? de Toulouse II * C?drick Fairon, CENTAL, Universit? catholique de Louvain * Kar?n Fort, STIH, Universit? Paris-Sorbonne * Cyril Grouin, LIMSI CNRS * Joseph Mariani, IMMI / LIMSI CNRS * Adeline Nazarenko, LIPN, Universit? Paris-Nord * Beno?t Sagot, Alpage, INRIA / Paris 7 * Isabelle Tellier, Universit? Sorbonne Nouvelle Informations pratiques Organisation : Kar?n Fort (STIH, Universit? Paris-sorbonne), Beno?t Sagot (Alpage, INRIA/Paris 7) Contact : karen.fort at paris-sorbonne.fr Date : samedi 22 novembre Lieu : Sorbonne (? pr?ciser) Dates importantes * Date de la journ?e : 22 novembre 2014 * Date limite de soumission : 15 septembre 2014 * Date de notification aux auteurs : 15 octobre 2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 20:28:31 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 22:28:31 +0200 Subject: Appel: Deadline extended-CFP WeCA 2014 (IEEE SITIS2014), Track on Web Computing and Applications, Marrakech, Morocco 23-27 November, 2014 Message-ID: Date: Sat, 6 Sep 2014 13:26:04 +0100 From: "Rim FAIZ" Message-ID: <005e01cfc9cd$ba154af0$2e3fe0d0$@Faiz at ihec.rnu.tn> X-url: http://www.sitis-conf.org/ Apologies for multiple diffusion CALL FOR PAPERS New submission deadline : September 22, 2014 ====================================================================== TRACK ON WEB COMPUTING AND APPLICATIONS (WeCA) The 10th International Conference on SIGNAL IMAGE TECHNOLOGY & INTERNET-BASED SYSTEMS (SITIS'14) November 23 - 27, 2014 In cooperation with ACM SIGAPP French Chapter (pending ...) and IEEE Technical Committee on Multimedia Computing (pending ...) Hotel Semiramis, Marrakech, Morocco http://www.sitis-conf.org/ ====================================================================== The focus of the track titled "Web Computing and Applications (WeCA)" is on emerging and novel concepts, architectures, technologies, and methodologies for information management related to the Web and cloud computing. In essence, the Web, with its different versions, has created an interconnected world in which information can be exchanged easily, tasks can be processed collaboratively, communities of users with similarly interests can beformed to achieve efficiency and improve performance, etc. Taking full advantage of these interconnected environments to meet the ever increasing needs of emerging applications requires solutions that address new issues and challenges. The track calls for research papers and reports related, but not limited, to the following topics: Data semantics Ontologies Conceptual Data Modeling Knowledge Representation and Reasoning Metadata Evolution and Change Semantic Caching Data Warehousing and Semantic Semantics in Data Visualization Semantic Services for Mobile Users Applications of Semantic-Driven Approaches Web-Centric Systems Semantic Web Social media and networking Web Services and Service Computing Hypermedia and Adaptation E-Commerce, E-government, and E-Learning Web/Data Mining Machine Learning Crowdsourcing Big Data Foundations and computation Infrastructure and platforms Management Data preservation and provenance Search and Mining Computational Modeling and Data Integration Link and Graph Mining Mobility Multimedia and Multi-structured Data Big Data and Social Media Applications Information System Interoperability Digital Libraries Semantic Interoperability and Semantic Mediators Ontologies Based Systems Contextual Reasoning in Distributed Ontologies Cloud Architectures and platforms Mobile Clouds Storage, Data, and Analytics Clouds Migration, Management, and Quality Composition, Federation, and Integration Resource Virtualization and Composition High Performance Cloud Computing Programming Models and Paradigms Green Computing Innovative Applications and Experiences Computing Consulting Cooperative information and Distributed Systems Information Sharing Grid/cloud Applications Peer To Peer Computing and Applications Knowledge and Semantic Grid Semantics of Peer Data Management Systems Mobile Information Systems and Computing Multimedia and application Image and Video Databases Image and Video Indexing and Retrieval Emergent Semantics in Content Retrieval Systems Semantics and Meta Data in Multimedia Systems Content-Based Indexing, Search, and Retrieval Multimedia Data Modeling and Visualization Tools, Benchmarks, Evaluation Protocols and Standard Information security Security Modeling and Access Control Protocol Intrusion Avoidance, Detection, and Response Web Security and Supporting Systems Security Denial of Service: Attacks and Countermeasures Intellectual Property Protection Fundamental Services on Network and Distributed Systems Security and Privacy for Emerging Technologies Trust based systems Submission and publication The conference will include keynote addresses, tutorials, and regular and workshop sessions. SITIS?14 invites submission of high quality and original papers on the topics listed above. All submitted papers will be peer-reviewed by at least two reviewers for technical merit, originality, significance and relevance to track topics. Papers must be up to 8 pages and follow IEEE double columns publication format. Paper submission will only be online via: SITIS 2014 submission site. The online system will be used to handle and process all papers and to prepare for the final proceedings. https://www.easychair.org/conferences/?conf=sitis2014 Accepted papers will be included in the conference proceedings and published by IEEE Computer Society and referenced in IEEE explore and major indexes Important dates - Paper Submission: September 6, 2014 ? September 22, 2014 - Acceptance/Reject notification: October 6, 2014 ? October 10, 2014 - Camera ready: October 15, 2014 - Author registration: October 19, 2014 Track Chairs Rim Faiz, IHEC, University of Carthage, Tunisia Gayo Diallo, ISPED, University of Bordeaux, France Peter Eklund, University of Wollongong, Australia Local Organizing Committee Abdelaziz El Fazziki, Cadi Ayyad University, Marrakesh, Morocco (Chair) Mohammed Sadgal, Cadi Ayyad University, Marrakesh, Morocco El Hassan Abdelwahed, Cadi Ayyad University, Marrakesh, Morocco Mehdi Najib, Cadi Ayyad University, Marrakesh, Morocco ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 20:00:09 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 22:00:09 +0200 Subject: Job: Ingenieur ou Post-doc de 6 mois, Annotation semantique d=?UTF-8?Q?=E2=80=99information_?=textuelle en biologie vegetale, INRA, Jouy-en-Josas Message-ID: Date: Fri, 05 Sep 2014 11:32:28 +0200 From: Claire Nedellec Message-ID: <5409832C.9020101 at jouy.inra.fr> =================================== Post-doc ou ing?nieur, 6 mois en annotation s?mantique de textes ====================================== L??quipe Bibliome de l?unit? MIG (INRA) recherche un post-doctorant (niveau th?se) ou ing?nieur (niveau Master) ? temps plein pour une dur?e de 5 ? 6 mois sur l?annotation manuelle et automatique d?articles scientifiques de biologie guid?e par un mod?le de connaissance dans le cadre du projet DataChallenge conjoint MIG et LIMSI (CNRS). Il est financ? par le Center for Data Science (Idex Paris-Saclay). La personne engag?e coordonnera la finalisation de l?annotation manuelle d?articles de biologie mol?culaire par des experts biologistes en vue de la pr?paration d'une t?che pour un challenge d?extraction automatique d?information ? partir de textes. Le domaine concern? est le d?veloppement de la graine chez l'arabette (Arabidopsis thaliana). Le mod?le de connaissances qui est utilis? pour l'annotation devra ?tre compar? ? d'autres mod?les propos?s pour d?autres esp?ces (humain, procaryotes). Un mod?le de repr?sentation des connaissances unifi? pourra ?tre propos? pour la repr?sentation des connaissances du texte qui soit appropri? ? son utilisation en Biologie des Syst?mes. Comp?tences: extraction d?information, annotation manuelle de texte, ing?nierie de la connaissance, biologie mol?culaire. Candidature : envoi du CV et de publications par email. Contact : Claire N?dellec (claire.nedellec at jouy.inra.fr) et Robert Bossy (robert.bossy at jouy.inra.fr) Lieu de travail : Unit? MIG, centre de recherche INRA de Jouy-en-Josas. Date de d?but de contrat : d?s que possible R?mun?ration : grille de salaire INRA R?f?rences: Bibliome : http://genome.jouy.inra.fr/bibliome/ CDS : http://www.campus-paris-saclay.fr/index.php/en/Idex-Paris-Saclay/Les-Lidex/Paris-Saclay-Center-for-Data-Science BioNLP-ST 2013 (tasks GE & GRN): https://sites.google.com/site/bionlpst2013/ ----------- ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:48:15 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:48:15 +0200 Subject: Ecole: Inscription, Ecole d'Automne en Recherche d=?UTF-8?Q?=E2=80=99Information_?=Et Applications, 15-17 Octobre 2014, Domaine de Parmenie Message-ID: Date: Wed, 03 Sep 2014 16:02:50 +0200 From: Philippe Mulhem Message-ID: <54071F8A.0 at imag.fr> X-url: http://www.asso-aria.org/earia2014 ********************************************************************** Deuxi?me appel ? inscription ? l'Ecole d'Automne en Recherche d?Information Et Applications. 15-17 Octobre 2014 Domaine de Parm?nie ? R?gion Grenobloise ********************************************************************** Nous avons le plaisir de vous annoncer la tenue de l'Ecole d'Automne en Recherche d?Information Et Applications, qui se tiendra ? Izeaux, ? 30 kilom?tres au nord-est de Grenoble. EARIA (?cole d'Automne en Recherche d'Information et Application) a pour objectif principal la formation des doctorants dans le domaine de la Recherche d'Information (RI). Elle est organis?e en 2014 par l'?quipe Mod?lisation et Recherche d'Information Multim?dia (MRIM) du Laboratoire d'Informatique de Grenoble (LIG) avec le support de l'Association Francophone de Recherche d'Information et Applications (ARIA http://www.asso-aria.org). L'ARIA est une soci?t? savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d'Information. Cette ?cole permet d'?changer et de faire le point sur les derni?res avanc?es scientifiques et technologies li?es ? l'indexation automatique et ? la recherche des textes multilingues, des images, des vid?os, permettant de construire des Syst?mes de Recherche d'Information Multim?dia. Ces syst?mes sont au c?ur des futurs moteurs de recherche du WEB. Les cours sont organis?s sur 4 demi-journ?es (du mercredi 15 octobre 2014 midi au vendredi 17 octobre midi) et offrent un cadre d'?change convivial tant autour des fondements que des th?mes novateurs dans le domaine de la RI, abord?s par des chercheurs fran?ais et europ?ens faisant autorit? dans le domaine. EARIA a vocation ? se tenir tous les deux ans et offre une occasion privil?gi?e de rencontres et de discussions entre s?niors du domaine et jeunes chercheurs, permettant ainsi ? ces derniers de mieux situer leur projet de recherche. Les domaines couverts par les cours de cette ?cole d'automne sont pr?sent?s en 8 sessions, et couvrent aussi bien des ?l?ments g?n?raux du domaine (comme une introduction, des ?l?ments de mod?lisation th?oriques, des aspects logiciels, des ?l?ments exp?rimentaux), et des aspects plus sp?cialis?s. Parmi les th?mes trait?s par cette ?cole nous avons : - L'introduction ? la Recherche d'Information ? les bases communes (M. Boughanem, E. Gaussier) - Le Traitement Automatique des Langues Naturelles et l'Extraction d'Information pour la Recherche d'Information (I. Tellier); - La Recherche d'Information multim?dia (G. Qu?not, G. Linares); - La Recherche d'Information sociale (J. Kamps); - La Recherche d'Informations s?mantique (J.-P. Chevallet); - Les syst?mes et les ?valuations pour la Recherche d'Information (M. Beigbeger, B. Grau). Le comit? scientifique pr?sid? par Patrice Bellot, est compos? de Catherine Berrut, Sylvie Calabretto, Michel Beigbeder, Jean-Pierre Chevallet, ?ric Gaussier, Mohand Boughanem. Toutes les informations, avec le formulaire d'inscription, sont accessibles : http://www.asso-aria.org/earia2014 En vous souhaitant nombreux pour participer ? cet ?v?nement fondamental pour la communaut? Recherche d'Information en France. Philippe Mulhem, Pr?sident du comit? d'organisation d'EARIA 2014. ********************************************************************** ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:31:21 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:31:21 +0200 Subject: Appel: CLEF 2015, Call for Labs proposals, 10 September 2014 Message-ID: Date: Wed, 03 Sep 2014 01:09:49 +0200 From: Eric SanJuan Message-ID: <54064E3D.3020906 at univ-avignon.fr> X-url: http://clef2015.clef-initiative.eu/ We apologize for cross-postings. ********************************************* CLEF 2015 - Call for Labs proposals ----------------------------------------- http://clef2015.clef-initiative.eu/ Toulouse, France, September 8 - 11, 2015 Important Dates --------------- * Final lab proposals: 10 September 2014 * Notification of lab acceptance: 19 September 2014 * 3 November 2014: Labs registration opens CLEF is a leading annual international conference exploring topics in information access technologies. The CLEF Conference uniquely combines evaluation laboratories and workshops with research presentations, panels, poster and demo sessions interleaved during three and a half days of intense and stimulating research activities. CLEF 2015 will be the sixth edition of the current CLEF conference launched as a continuation of the annual CLEF evaluation campaign series which ran with great success from 2000 to 2009 contributing to the systematic evaluation of information access systems, primarily through experimentation on shared tasks. CLEF 2015 will be held in September at the University of Toulouse, France. Researchers and practitioners from all areas of information access and related communities are invited to submit proposals for evaluation labs for consideration for inclusion in CLEF 2015. Lab proposals will be reviewed by the lab selection committee. Authors of selected proposals will be invited to include their lab in the CLEF 2015 lab programme, possibly subject to small suggested modifications to their proposal to better suit the CLEF lab workflow or timeline. About CLEF ---------- The CLEF Initiative (http://clef2015.clef-initiative.eu/) is a self-organized body whose main mission is to promote research, innovation, and development of information access systems with an emphasis on multilingual information in different modalities - including text and multimedia - with various levels of structure. CLEF promotes research and development by providing an infrastructure for: * independent evaluation of information access systems; * investigation of the use of unstructured, semi-structured, highly-structured, and semantically enriched data in information access; * creation of reusable test collections for benchmarking; * exploration of new evaluation methodologies and innovative ways of using experimental data; * discussion of results, comparison of approaches, exchange of ideas, and transfer of knowledge. Scope of CLEF Labs ------------------ Proposals are accepted for two different types of ?labs?: * Evaluation Labs that are a ?campaign-style? evaluation for specific information access problems (during the twelve month period preceding the conference), similar in nature to the traditional CLEF campaign ?tracks? (see 2014 Labs at http://clef2014.clef-initiative.eu/). Topics covered by campaign-style labs can be inspired by any information access-related domain or task. * Labs that follow a more classical ?workshop? pattern, exploring issues of evaluation methodology, metrics, processes etc. in information access and closely related fields, such as natural language processing, machine translation, and human-computer interaction. If the organisers of the proposal are new to CLEF or other shared task evaluation campaigns, we highly recommend that a lab workshop first be organised to discuss the format, the problem space, and the practicalities of the shared task. The CLEF 2015 programme will reserve about half of the conference schedule for lab sessions which will take place within the conference in Toulouse. The labs will present their overall results ?overview presentations? during the plenary scientific paper sessions to allow non-participants to get a sense of where the research frontiers are moving. Organisers of each lab are expected to organise the separate sessions for their lab at the conference so that they contain ample time for general discussion and engagement by all participants - not just those presenting campaign results and papers. Organisers should plan time in their sessions for activities such as panels, demos, poster sessions etc. as appropriate. CLEF is always interested in receiving and facilitating innovate and creative lab proposals. Potential task proposers who are unsure of the suitability of their task proposal or its format for inclusion at CLEF are encouraged to contact the CLEF 2015 Lab Organizing Committee Chairs to discuss its suitability or design at an early stage. Proposal Submission ------------------- Lab proposals must provide sufficient information to enable to be able to judge the relevance, timeliness, scientific quality, benefits for the research community, and the competence of the proposers to co-ordinate the lab. Each lab proposal should identify one or more organizers as responsible for ensuring the timely execution of the lab. Proposals should be 2-4 pages long and should provide the following information: 1. Title of the proposed lab. 2. A brief description of the lab topic and goals, its relevance to CLEF and the significance for the field. 3. A brief but clear statement of usage scenarios or domain to which the activity is intended to contribute, including the evaluation setup and metrics. 4. Details on the lab organizer(s), including identifying the task chair(s) responsible for the ensuring the running of the task. This should include details of any previous of involvement in organising or participating in evaluation tasks at CLEF or similar campaigns. 5. The planned format of the lab, i.e. campaign-style (?track?) or workshop. 7. A statement on the intended development/growth path if the proposal is for a continuation of activities previously undertaken at CLEF workshops. 8. Details of the expected target audience, i.e. who do you expect to participate in the task, and how do you propose to reach them. 9. The number of tasks to be carried out in a lab. The proposal should clearly motivate the need for each of the proposed tasks and provide evidence of its capability of attracting enough participation. It is fine for a lab to have a single task, but labs often contain multiple closely related tasks. 10. Expected length of the lab session at the conference: half-day, one day, two days. This should include very high level details of planned structure of the session, e.g. participant presentations, invited speaker(s), panels, etc, to justify the requested session length. 11. Arrangements for the organization of the lab campaign: who will be responsible for activities within the task; how will data to acquired or created, including highlighting any IP issues that need to be addressed to enable data to be distributed to lab participants; tools or methods which will be used, e.g. how will necessary queries be created or relevance assessment carried out; any other information which is relevant to the conduct of your lab. 12. If the lab proposes to set up a steering committee to oversee and advise its activities, include names, addresses, and homepage links of people your propose to be involved. Reviewing Process ----------------- Each submitted proposal will be reviewed by the CLEF 2015 lab organizing committee. The decision will be sent by email to the responsible organizer by September 19, 2014. The final length of the lab session will be determined based on the overall organization of the conference and the number of participant submissions received by a lab. Reviewing criteria can be found on the website of the conference - http://clef2015.clef-initiative.eu/ . Important Dates --------------- * Final lab proposals: 10 September 2014 * Notification of lab acceptance: 19 September 2014 * 3 November 2014: Labs registration opens Submission Details ------------------ Lab proposals (or questions) should be submitted via e-mail (either plain text or PDF format, using ?CLEF labs proposal? in the subject line) to both Lab Organizing Committee Chairs: Eric San-Juan , eric.sanjuan at univ-avignon.fr Gareth Jones, gareth.jones at computing.dcu.ie Further information is available at: http://clef2015.clef-initiativeeu/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:41:49 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:41:49 +0200 Subject: Info: Avant le 15 Septembre 2014, Inscription Conseil Scientifique IRCOM Message-ID: Date: Wed, 3 Sep 2014 15:54:24 +0200 From: veronique Brisset-fontana Message-ID: <54071D90.6010505 at cnrs.fr> X-url: http://www.fiap.asso.fr/ X-url: http://ircom.huma-num.fr/site/accueil.php CONSORTIUM CORPUS ORAUX ET MULTIMODAUX Ch?re et cher coll?gue, Le comit? de pilotage de l'IRCOM, consortium "Corpus Oraux et Multimodaux", vous propose, pour la prochaine r?union pl?ni?re du comit? scientifique, un nouveau format qui permettra d'articuler le bilan des activit?s du consortium avec trois ateliers autour de th?mes fondamentaux pour le consortium. Cette r?union sera ouverte ? *toute la communaut? des chercheurs et enseignants*--chercheurs int?ress?s aux corpus oraux et multimodaux. Le programme de la journ?e comprend : - un atelier *"M?tadonn?es" *pour discuter d'un jeu commun de descripteurs, ? partir des propositions initi?es lors de la table ronde sur les formats du 23 juin et d'exemples pris dans les diff?rents corpus oraux du projet Orf?o. - un atelier *"Annotations"* ? partir des travaux du groupe 1 "Corpus linguistiques et finalit?s scientifiques" qui r?-interrogera les pratiques d'?tiquetage dans l'annotation des corpus oraux et plus pr?cis?ment les interactions entre pratiques d'?tiquetage, th?orie et objectifs descriptifs, ? la lumi?re des langues peu d?crites, non ?crites et/ou d'une autre modalit? (langues des signes) mais aussi des corpus multimodaux. - un atelier *"Archivage des corpus"* d'apr?s les travaux du groupe 6 "Stockage s?curis? et mutualisation des corpus oraux et multimodaux" illustrera les diff?rentes ?tapes de l'archivage. Ces ?tapes vont du d?p?t jusqu'? la consultation des ressources d?pos?es, en passant par le nommage des fichiers, les formats de fichiers, le r?f?rencement et la valorisation. Les sp?cificit?s des principaux acteurs, BnF, Cocoon et Ortolang/SLDR, seront pr?sent?es ? travers des exemples concrets de corpus. Ces ateliers seront organis?s en deux sessions de m?me format pour vous permettre de participer ? deux ateliers sur les trois propos?s. La journ?e se conclura par un bilan des ateliers et une session de discussion. Nous vous invitons ? diffuser largement cette information et ? convier d'autres personnes de vos unit?s qui seraient int?ress?es ? d?velopper ces th?matiques. La r?union se d?roulera au centre *FIAP -- Jean Monnet, 30 rue Cabanis, 75014 PARIS* http://www.fiap.asso.fr/ _M?tro_ligne 6, stations Saint-Jacques ou Glaci?re. _RER_B : Station Denfert Rochereau _Bus_ : N?21 Pour vous inscrire envoyer un courriel ? l'adresse suivante : secretariat-general at ling.cnrs.fr *AVANT LE 15 SEPTEMBRE 2014* Vous pouvez consulter le site de l'IRCOM : http://ircom.huma-num.fr/site/accueil.php A titre exceptionnel et ? destination des jeunes chercheurs int?ress?s pour participer ? cette r?union, une demande de prise en charge des frais de transport peut ?tre faite ? l'adresse mail ci-dessus. Pour ?tre prise en compte, cette demande doit parvenir avant le 15 septembre 2014. **************** *PROGRAMME DE LA JOURNEE* *CONSEIL SCIENTIFIQUE IRCOM* *_Lundi 22 septembre 2014 de 9h15 ? 17h00_* R?serv?: Centre FIAP Jean Monnet - 30 rue Cabanis - 75014 Paris** *Ordre du jour* *08h 45 -- 09h 15 - ACCUEIL*** *Matin?e : Pr?sentation et r?alisation d'IRCOM et ateliers* *09h 15 -- 09h 30 :*** - Pr?sentation g?n?rale : structure, fonctionnement, r?alisations - Dominique Boutet *09h 30 -- 11h 00 :*** - Pr?sentations des 5 groupes de travail du consortium /Corpus linguistiques et finalit?s scientifiques/ /Interop?rabilit?/ /Multimodalit? et modalit? visuo-gestuelle/ /Questions juridiques, droits des personnes et des producteurs de corpus /// /Stockage s?curis? et mutualisation des corpus oraux et multimodaux/ *11h 00 -- 11h 30 - PAUSE* *11h 30 -- 13h 00* _Atelier M?tadonn?es_ Christophe Benzitoun et Carole Etienne. Cet atelier se propose de discuter d'un jeu commun de m?tadonn?es qui donnerait les informations n?cessaires sur les corpus oraux pour faciliter leur r?utilisation par des chercheurs ou des enseignants. En ?vitant de reprendre les d?bats sur les cat?gorisations ou de remettre en cause les descriptions existantes, cette ?tude cherche ? d?finir les bonnes pratiques en mati?re de m?tadonn?es. Cette r?flexion s'inscrit dans la continuit? des t?l?conf?rences en f?vrier et de la table ronde consacr?e aux formats communs en juin et b?n?ficiera de nombreux exemples parmi les corpus du projet Orf?o. _Atelier Archivages_ Olivier Baude (pour Cocoon), Audrey Viault (d?partement Archives et Manuscrits, BnF),Jean-Marie Pierrel et J?r?me Blanchard (ORTOLANG/SLDR). Cet atelier pr?sentera les ?tapes de l'archivage et de la valorisation de corpus oraux et multimodaux ? travers quelques r?alisations qui illustrent les sp?cificit?s de chaque institution. Les participants pourront proposer des corpus pour une simulation du processus d'archivage adapt? ? leur cas. _Atelier Annotations_ Amina Mettouchi, Anne Lacheret Brigitte Garcia et Paola Pietrandrea. Cet atelier propose d'aborder les questions suivantes, aux fondements m?mes des pratiques d'annotation. Dans quelle mesure les hypoth?ses et les objectifs qui sous-tendent les travaux en linguistique de corpus peuvent-ils/doivent-ils ?tre explicit?s pour justifier le jeu d'?tiquettes utilis?es pour les annotations ? Les questions auxquelles se heurte l'annotation ne doivent-elles pas servir de levier pour impulser des propositions th?oriques engageant de nouveaux modes de repr?sentation linguistique ? Jusqu'? quel point peut-on tenir le pari de l'approche a-th?orique ou ? non-aprioristique ? dans l'annotation des corpus ? A partir de quel niveau d'analyse et pourquoi celle-ci ne peut-elle plus ?tre uniquement fix?e sur des crit?res de formes ? N'y a-t-il pas un noyau fonctionnel a minima incontournable ? Si oui, de quelle nature (phon?mique, morphologique, syntaxique...) ? Y a-t-il ? cet ?gard des sp?cificit?s li?es aux diff?rentes langues, au type de modalit? utilis?e, etc. ? Au final, ces questions convergent vers celle de la d?finition des unit?s (minimales, maximales) retenues pour l'annotation. *13h 00 -- 14h 00 - DEJEUNER*** *Apr?s-midi : Ateliers, restitutions et discussions* *14h 00 -- 15h 30* _Atelier M?tadonn?es_- (Animateurs et sujets identiques ? ceux de la matin?e) Christophe Benzitoun et Carole Etienne. Cet atelier se propose de discuter d'un jeu commun de m?tadonn?es qui donnerait les informations n?cessaires sur les corpus oraux pour faciliter leur r?utilisation par des chercheurs ou des enseignants. En ?vitant de reprendre les d?bats sur les cat?gorisations ou de remettre en cause les descriptions existantes, cette ?tude cherche ? d?finir les bonnes pratiques en mati?re de m?tadonn?es. Cette r?flexion s'inscrit dans la continuit? des t?l?conf?rences en f?vrier et de la table ronde consacr?e aux formats communs en juin et b?n?ficiera de nombreux exemples parmi les corpus du projet Orf?o. _Atelier Archivages - _(Animateurs et sujets identiques ? ceux de la matin?e)__ Olivier Baude (pour Cocoon), Audrey Viault (d?partement Archives et Manuscrits, BnF),Jean-Marie Pierrel et J?r?me Blanchard (ORTOLANG/SLDR). Cet atelier pr?sentera les ?tapes de l'archivage et de la valorisation de corpus oraux et multimodaux ? travers quelques r?alisations qui illustrent les sp?cificit?s de chaque institution. Les participants pourront proposer des corpus pour une simulation du processus d'archivage adapt? ? leur cas. - _Atelier Annotations - _(Animateurs et sujets identiques ? ceux de la matin?e)__ Olivier Baude (pour Cocoon), Audrey Viault (d?partement Archives et Manuscrits, BnF),Jean-Marie Pierrel et J?r?me Blanchard (ORTOLANG/SLDR). Cet atelier pr?sentera les ?tapes de l'archivage et de la valorisation de corpus oraux et multimodaux ? travers quelques r?alisations qui illustrent les sp?cificit?s de chaque institution. Les participants pourront proposer des corpus pour une simulation du processus d'archivage adapt? ? leur cas. *15h 30 -- 15h 45 - PAUSE*** *15h 45 -- 17h 00*** - Restitutions et discussions ************************************************************** Veuillez nous excuser pour les envois multiples ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:55:48 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:55:48 +0200 Subject: Ecole: Ecole d'automne en RI EARIFA, 28-31 2014 octobre, Hammamet (Tunisie) Message-ID: Date: Fri, 5 Sep 2014 01:12:58 +0100 From: "Chiraz Latiri" Message-ID: <003001cfc89e$2648b1c0$72da1540$@latiri at gnet.tn> X-url: http://www.asso-aria.org/presentation-earia Premier appel ? participation ? l'?cole EARIFA ( http://www.asso-aria.org/presentation-earia ?cole d'Automne en Recherche d'Information : Fondements et Applications) Du 28 au 31 octobre 2014 ? Hammamet (Tunisie) ********************************************************************** Nous avons le plaisir de vous annoncer la tenue de la premi?re ?dition de l'Ecole d'Automne en Recherche d?Information : Fondements Et Applications, qui se tiendra du 28 au 31 octobre 2014 ? Diar El Medina, Hammamet (Tunisie). L?int?r?t de la recherche d'information mutli-source (texte, web, r?seaux sociaux?) est grandissant au Maghreb. C?est dans l'objectif de f?d?rer les comp?tences autour de ce domaine, que cette premi?re ?dition d'une ?cole d'automne en Recherche d'Information (RI) est propos?e. Elle vise ? promouvoir les ?changes entre chercheurs du monde entier, plus particuli?rement ceux du Maghreb et autour de la m?diterran?e, afin de contribuer principalement ? la dynamisation de la recherche dans le domaine de la RI et ? l??mergence d?une communaut? scientifique plus large dans la r?gion m?diterran?enne. Nous faisons alors appel ? tous les jeunes chercheurs, travaillant sur des probl?matiques li?es ? la RI, pour pr?senter des posters d?crivant leurs travaux de recherche et qui seront discut?s durant les journ?es de l'?cole. L'organisation de cette premi?re ?dition se fera conjointement entre l'Institut Sup?rieur des Arts Multim?dias (Universit? de la Manouba , Tunisie) et l'Association de Multim?dia et de l'AudioVisuel en Tunisie (AMAVI) du 28 au 31 octobre 2014 ? Hammamet (Tunisie). Les cours seront organis?s sur 6 demi-journ?es (du mardi 28 octobre 2014 au vendredi 31 octobre midi) et offrent un cadre d'?change convivial tant autour des fondements que des th?mes novateurs dans le domaine de la RI. Les domaines couverts par les cours de cette ?cole d'automne ainsi que les intervenants sont pr?sent?s dans l'appel ? participation (voir fichier joint ? ce mail). Le comit? d'organisation pr?sid? par Chiraz Latiri, est compos? de Yahya Slimani, Chiraz Trabelsi , Hajer Baazaoui, Rim Faiz et Hatem Haddad. Le formulaire d'inscription est joint ? ce mail. Je compte sur votre collaboration pour une large diffusion de cet appel, en esp?rant que les chercheurs maghr?bins et fran?ais participent massivement ? cette premi?re ?dition. Chiraz Latiri, Pr?sidente du comit? d'organisation d'EARIFA 2014. Maitre de conf?rences en informatique ? l'ISAMM, universit? de la Manouba Pr?sidente de l?association AMAVI ********************************************************************** Email : Chiraz.latiri at gnet.tn, chiraz.latiri3 at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 6 19:51:13 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 6 Sep 2014 21:51:13 +0200 Subject: Job: Postes d'Annotateur en langue Fran=?UTF-8?Q?=C3=A7aise_?=/ Anglaise(H/F), CDD, ELDA Message-ID: Date: Thu, 04 Sep 2014 11:40:12 +0200 From: Leixa j?r?my Message-ID: <5408337C.9000309 at elda.org> ############################################## *Postes d'Annotateur en langue Fran?aise / Anglaise(H/F), CDD ? plein-temps*** ELDA (Evaluation and Language resources Distribution Agency, www.elda.org ) a pour activit?s principales la distribution et la production de ressources linguistiques, ainsi que l'?valuation de technologies de la langue. Dans le cadre de ses activit?s de production, ELDA offre plusieurs postes d'annotateurs (H/F) ? plein-temps. _Contexte_ Dans le cadre d'un projet de recherche, ELDA (Evaluations and Language resources Distribution Agency) recrute plusieurs personnes pour participer ? la constitution de corpus annot?s en Entit?s Nomm?es. Les Entit?s Nomm?es (EN) sont des objets textuels (c'est-?-dire un mot, ou un groupe de mot) cat?gorisables dans des classes pr?d?finies (personnes, noms d'organisation, noms de lieux, quantit?s, distances, dates, etc.) La reconnaissance d'Entit?s Nomm?es est une sous-t?che essentielle des syst?mes d'extraction d'information dans des corpus documentaires. _Mission_ Il s'agit d'annoter les documents textuels afin d'en fournir la description n?cessaire ? l'?valuation. Le travail sera effectu? via un logiciel sp?cifique, et selon des conventions d'annotation sur lesquelles les candidats seront form?s. _Profil recherch?_ - Tr?s bonne connaissance des langues ?crites fran?aise, anglaise - Bonne ma?trise de l'outil informatique - Capacit? ? int?grer des r?gles (d'annotation) et ? les suivre scrupuleusement et avec constance _Dur?e_ Plein-temps, pour une dur?e de 1 mois. _Salaire_ Selon profil et performances Les candidatures (CV, lettre de motivation) doivent ?tre adress?es ? leixa at elda.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:26:54 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:26:54 +0200 Subject: Info: Le ministere de la Culture ouvre une consultation publique sur les outils d'aide a la traduction Message-ID: Date: Tue, 09 Sep 2014 17:19:15 +0200 From: Quentin SAMIER Message-ID: <540F1A73.6000103 at culture.gouv.fr> X-url: http://www.apoliade.com/survey/index.php/769372/lang-fr Bonjour, Le minist?re de la Culture et de la Communication propose, du 9 au 30 septembre 2014, une grande consultation publique sur les outils d'aide ? la traduction, et invite tous les utilisateurs de ces technologies ? y participer. Des besoins de traduction se manifestent en effet dans tous les secteurs de la vie sociale : administrations, entreprises, associations, etc. Cette consultation publique a pour objectif d'inventorier les besoins exprim?s par les utilisateurs en mati?re d'aide ? la traduction : vos contributions permettront ainsi de r?aliser un guide sur les outils auxquels vous pourriez avoir recours. Ce guide sera ensuite diffus? largement aupr?s des professionnels, du grand public et des ?diteurs de solutions. Vous ?tes traducteur, formateur, ?tudiant ou simple utilisateur d'outils d'aide ? la traduction, nous vous invitons ? participer ? cette consultation en cliquant sur le lien : http://www.apoliade.com/survey/index.php/769372/lang-fr N'h?sitez pas ? diffuser ce message au sein de vos r?seaux. Cordialement, La D?l?gation g?n?rale ? la langue fran?aise et aux langues de France///-- /minist?re de la Culture et de la Communication ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:17:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:17:35 +0200 Subject: Seminaire: BLRI, Stefan Elmer, 19 septembre 2014, Aix-en-Provence Message-ID: Date: Mon, 8 Sep 2014 11:57:23 +0200 From: Nad?ra Bureau Message-ID: <004801cfcb4b$49f08940$ddd19bc0$@bureau at blri.fr> Vendredi 19 septembre 2014 11h Salle de conf?rences B011, b?t. B 5 avenue Pasteur, Aix-en-Provence Stefan Elmer (Labex BLRI) The influence of expertise on perception, cognition, and brain connectivity. R?sum? : A better understanding of the perceptual and cognitive neural underpinnings underlying exceptional behavioural skills has important educational, societal, as well as clinical implications (i.e., for example in the context of developmental dyslexia, aphasia, and foreign language learning). Here, I will present recent data collected from professional musicians with and without absolute pitch, as well as from simultaneous language interpreters, to reveal how expertise and training has an influence on the functional-structural malleability of perceptual and cognitive subdivisions of the human brain. In the same context, I will also provide some evidence for transfer effects from musicianship to specific aspects of speech processing. Finally, since currently there is no doubt that perceptual and cognitive functions do not work in isolation but are embedded in neuronal assemblies consisting of networks influencing each other's in a reciprocal manner, I will propose some novel methodological approaches for evaluating functional and structural connectivity within small-scale perceptual-cognitive networks in musicians with and without absolute pitch. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 19:55:00 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 21:55:00 +0200 Subject: Appel: IRCOM-ORTOLANG 2014, Aide technique et financiere a la finalisation de corpus Message-ID: Date: Wed, 10 Sep 2014 15:23:42 +0200 From: veronique Brisset-fontana Message-ID: <541050DE.4020708 at cnrs.fr> X-url: http://ircom.huma-num.fr/site/p.php?p=corpusaide *Appel IRCOM-ORTOLANG 2014* *Aide technique et financi?re ? la finalisation de corpus* Le consortium IRCOM et l'Equipex Ortolang ont lanc? conjointement en juin 2013 un appel pour l'aide ? la finalisation de corpus. Vous avez ?t? nombreux ? r?pondre ? cet appel. Au total, 20 projets ont ?t? retenus et ont fait, ou feront l'objet, d'une aide technique, parmi lesquels 9 projets ont b?n?fici?, ou b?n?ficieront d'une aide financi?re (http://ircom.huma-num.fr/site/p.php?p=corpusaide). *En 2014, le consortium IRCOM conjointement avec l'?quipex Ortolang proposent de poursuivre son accompagnement technique et financier.* L'accompagnement technique a comme objectif d'amener les ressources linguistiques, comportant de pr?f?rence des annotations (ex. transcriptions), ? ?tre : (1) stock?es de mani?re s?curis?e, (2) r?f?renc?es par un identifiant unique international (3) ? ?tre diffus?e (publiquement ou sous conditions, imm?diatement ou avec d?lai). Cette aide peut intervenir concr?tement ? plusieurs niveaux : conversion de format des fichiers, assistance ? la documentation (m?tadonn?es compatibles OAI-PMH), mise en relation avec les diff?rents interlocuteurs en fonction de la sp?cificit? des ressources (centres de ressources/BnF). Vous trouverez des descriptions de corpus finalis?s sur le site IRCOM (http://ircom.huma-num.fr/site/p.php?p=corpusaide). A titre d'illustration, voici quelques corpus qui ont pu ?tre finalis?s apr?s avoir b?n?fici? de notre aide technique (nom du correspondant entre parenth?ses). - Le corpus OTG (Jean-Yves Antoine), compos? d'interactions d'une dur?e totale de 2h a b?n?fici? de notre aide pour la conversion des 315 fichiers au format brut (.raw) vers le format .aiff, un format accept? pour l'archivage num?rique aupr?s du CINES (qui prend en charge la pr?servation ? long terme des donn?es de la recherche). Cet ensemble a ?t? d?pos? et est diffus? par SLDR/Ortolang (http://sldr.org/sldr000831). - L'Atlas Linguistique de l'Alsace (Claude Evrard), compos? de trois principaux ensembles d'enregistrements r?alis?s dans les ann?es 60, 80 et 90 (entretiens ethnographiques, atlas linguistique, enqu?te sur la conscience linguistique) d'un total de 864 ressources audio, et dont les producteurs ne sont plus en activit?, a ?t? document? en recoupant l'information pr?sente sur le site web (http://ala.u-strasbg.fr/index3.php) et plusieurs fichiers excel conserv?s. Cet atlas a ?t? d?pos? aupr?s de CoCoON (http://cocoon.huma-num.fr/exist/crdo/collection_ala.htm). - Le corpus ALIPE (Thierry Chanier), d?j? structur? et consultable via un site web universitaire (http://lrl-diffusion.univ-bpclermont.fr/alipe/), a ?t? orient? vers SLDR/Ortolang pour ?tre r?f?renc? et stock? de mani?re s?curis?, et diffus? au format HD (http://sldr.org/alipe-000853). Une attention particuli?re a ?t? fournie pour que l'arborescence soit conserv?e, en particulier dans les liens de la documentation (html) vers les fichiers son. - Le corpus VN-Attitude (Dang Khoa Mac), compos? d'audio, de vid?o et de signaux ?lectro-glottographiques (EGG), n?cessitait une conversion de format de ces derniers pour qu'ils puissent ?tre r?ellement interop?rables (d?p?t en cours aupr?s de CoCoON). En revanche, l'EGG n'?tant pas un type de donn?es pris en charge par le CINES, une r?flexion est en cours concernant son statut en tant qu'objet archivistique. *Conditions de l'appel 2014 d'IRCOM et d'Ortolang ? accompagnement technique et financier pour la diffusion de corpus de langage* Pour palier la grande disparit? dans les niveaux de comp?tences informatiques des personnes et groupes de travail produisant des corpus, L'IRCOM propose une aide personnalis?e ? la finalisation de corpus. Celle-ci sera r?alis?e par un ing?nieur IRCOM en fonction des demandes formul?es et adapt?es aux types de besoin, qu'ils soient techniques ou financiers. Les demandes peuvent concerner tout type de traitement : traitements de corpus quasi-finalis?s (conversion, anonymisation), alignement de corpus d?j? transcrits, conversion depuis des formats ? traitement de textes ?, digitalisation de support ancien. - Les demandes sont ? d?poser du 10 septembre 2014 au 31 octobre 2014. - Les demandes seront trait?es dans l'ordre o? elles seront re?ues par l'IRCOM. - Les demandes ?manant d'EA ou de petites ?quipes ne disposant pas de support technique ? corpus ? seront trait?es prioritairement. - La d?cision pour l'aide technique rel?vera du comit? de pilotage d'IRCOM. - Le montant maximal par projet est de 3300 euros. - Les demandes non trait?es en 2014 sont susceptibles de l'?tre en 2015. - Si vous avez des doutes quant ? l'?ligibilit? de votre projet, n'h?sitez pas ? nous contacter pour que nous puissions ?tudier votre demande et adapter nos offres futures, vous pouvez contacter Martine Toda[ martine.toda at cnrs.fr ] ou ? [ ircom.appel.corpus at gmail.com ] - Cet appel d'offre est soumis aux conditions formul?es ci-dessous. Les conditions n?cessaires pour proposer un corpus ? finaliser sont : - Pouvoir prendre toutes d?cisions concernant l'utilisation et la diffusion du corpus (propri?t? intellectuelle en particulier). - Disposer de toutes les informations concernant les sources des corpus et le consentement des personnes enregistr?es ou film?es. - Accorder un droit d'utilisation libre des donn?es ou au minimum un acc?s libre pour la recherche scientifique. Les propositions de r?ponse ? cet appel d'offre sont ? envoyer _avant le 31 octobre 2014_ ? ircom.appel.corpus at gmail.com et doivent _utiliser le formulaire de la page suivante_. Dans tous les cas, l'IRCOM vous adressera une r?ponse personnalis?e. Ces propositions doivent pr?senter les corpus propos?s, les donn?es sur les droits d'utilisation et de propri?t?s et sur la nature des formats ou support utilis?s. Cet appel est organis? sous la responsabilit? de l'IRCOM avec la participation conjointe de l'IRCOM (http://ircom.huma-num.fr) et de l'EquipEx ORTOLANG (http://www.ortolang.fr). Pour toute information compl?mentaire, nous rappelons que le site web de l'IRCOM (http://ircom.huma-num.fr) est ouvert et propose des ressources ? la communaut? : glossaire, inventaire des unit?s et des corpus, ressources logicielles (tutoriaux, comparatifs, outils de conversion), activit?s des groupes de travail, actualit?s des formations, ... L'IRCOM invite les unit?s ? inventorier leur corpus oraux et multimodaux - 70 projets d?j? recens?s - pour avoir une meilleure visibilit? des ressources d?j? disponibles m?me si elles ne sont pas toutes finalis?es. /_Le comit? de pilotage IRCOM_/ Le Consortium IRCOM appartient au TGIR HUMA-NUM - http://www.huma-num.fr/ *Utiliser ce formulaire pour r?pondre ? l'appel : Merci.* *_R?ponse ? l'appel 2014 pour la finalisation de corpus oral ou multimodal_* Nom du corpus : Nom de la personne ? contacter : Adresse email : Num?ro de t?l?phone : Nature des donn?es de corpus : Existe-t-il des enregistrements : Quel m?dia ? Audio, vid?o, autre... Quelle est la longueur totale des enregistrements ? Nombre de cassettes, nombre d'heures, etc. Quel type de support ? Quel format (si connu) ? Existe-t-il des transcriptions : Quel format ? (papier, traitement de texte, logiciel de transcription) Quelle quantit? (en heures, nombre de mots, ou nombre de transcriptions) ? Disposez vous de m?tadonn?es (en particulier de l'information concernant les droits d'auteurs et d'usage) ? Disposez-vous d'une description pr?cise des personnes enregistr?es ? Disposez-vous d'une attestation de consentement ?clair? pour les personnes ayant ?t? enregistr?es ? En quelle ann?e (environ) les enregistrements ont eu lieu ? Quelle est la langue des enregistrements ? Le corpus comprend-il des enregistrements d'enfants ou de personnes ayant un trouble du langage ou une pathologie ? Si oui, de quelle population s'agit-il ? Dans un souci d'efficacit? et pour vous conseiller dans les meilleurs d?lais, il nous faut disposer d'exemples des transcriptions ou des enregistrements en votre possession. Nous vous contacterons ? ce sujet, mais vous pouvez d'ores et d?j? nous adresser par courrier ?lectronique un exemple des donn?es dont vous disposez (transcriptions, m?tadonn?es, adresse de page web contenant les enregistrements). Nous vous remercions par avance de l'int?r?t que vous porterez ? notre proposition. *Pour toutes informations compl?mentaires veuillez contacter Martine Toda * *martine.toda at cnrs.fr* ou *ircom.appel.corpus at gmail.com* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:00:58 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:00:58 +0200 Subject: Job: Research Engineer, NLP on Twitter: Retrieval of Argumentative Structures and Reasoning, Inria Sophia Antipolis, France Message-ID: Date: Mon, 8 Sep 2014 10:24:33 +0200 (CEST) From: Elena Cabrio Message-ID: <1747111419.47469556.1410164673640.JavaMail.zimbra at inria.fr> X-url: http://www.inria.fr/institut/recrutement-metiers/offres/ingenieurs-r-d Research Engineer - Natural Language Argumentation on Twitter: Retrieval of Argumentative Structures and Reasoning We are looking for a Research Engineer with a background in Natural Language Processing and Knowledge Representation and Reasoning to join the Inria WIMMICS team (http://wimmics.inria.fr) and the start-up Vigigloble (http://vigiglobe.com). Understanding and interpreting the flow of messages exchanged in real time on social platforms, like Twitter, raises several important issues. The big amount of information exchanged on these platforms represents a significant value for who is able to read and enrich this multitude of information. Users directly provide this information, and it is interesting to analyze such data both from the quantitative and from the qualitative point of view, especially for what concerns reputation and marketing issues (regarding brands, institutions or public actors). Moreover, the automated treatment of this type of data and the constraints it presents (e.g., limited number of characters, tweets with a particular writing style, amount of data, real-time communication) offer a new and rich context for a challenging use of existing tools for natural language processing. In particular, the goal of the project is to address the following points: - Automated selection and annotation of tweets, i.e., retrieval of those tweets that can be considered as arguments (like for instance those tweets whose content expresses an opinion on a given topic). - Automated assignment of labels to the type of relation holding between arguments (positive relation or negative relation). - Creation of an argumentation graph illustrating the relations between the arguments about a certain subject, and the further application of argumentation semantics to compute the set of "winning" arguments (i.e., the accepted arguments). This graph-based visualization provides a summary of the ongoing discussion on Twitter. The first step of the project will be the creation and annotation of a data set extracted from Twitter. This data set will be used as a benchmark for training and testing NLP algorithms for the automated detection of the relations between arguments. The second step will consist in the adaptation of the framework presented in [Cabrio&Villata, ECAI2012] to the Twitter scenario, with the aim to make it more robust in terms of processing large volumes of data. *Profile* Mandatory requirements for applicants: 1. PhD in Computer Science; 2. Experience in NLP and Knowledge Representation and Reasoning, or in a related field (Artificial Intelligence, Machine Learning...); 3. Hands-on experience of at least one programming language (e.g., Java, C++) ensure autonomy in completing the technical tasks of the project; 4. Self-motivated, goal-oriented and willing to work in an international team; 5. Pragmatic and customer oriented; 6. Fluent English is mandatory. Optional: 1. Good control of scripting tools (bash, Unix/Linux tools) and of web languages; 2. Experience with automation of NLP processing chains; 3. Fluent in French. *Duration* 12 months *Salary* Gross Salary per month according to the level of diploma and the experience in the domain: 2500 ? 2800? / month (corresponding to 2100-2300? net salary / month) *Deadline* September 15th *Contact* Elena Cabrio: elena.cabrio at inria.fr Valentino Marra: valentino at vigiglobe.com Serena Villata: serena.villata at inria.fr References [Cabrio&Villata, ECAI2012] Cabrio E., Villata S. Natural Language Arguments: A Combined Approach. In Proceedings of the 20th European Conference on Artificial Intelligence (ECAI 2012), p. 205-210, 2012. NoDE Benchmark of Natural Language Arguments http://www-sop.inria.fr/NoDE/ More information are available at http://www.inria.fr/institut/recrutement-metiers/offres/ingenieurs-r-d and at https://wimmics.inria.fr/node/50 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:34:23 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:34:23 +0200 Subject: Job: CDD 18 mois, Ingenieur ou Docteur en Informatique, CEA LIST/LVIC, Palaiseau, Ile-de-France Message-ID: Date: Wed, 10 Sep 2014 16:24:18 +0000 From: SEMMAR Nasredine 202247 Message-ID: <50CC12289F0C854FBFF134F270030CD71ECF974A at EXDAG0-B3.intra.cea.fr> Contexte : ------------ Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ing?nierie des Contenus) travaille sur l'analyse de contenus multim?dias (analyse de textes, images et vid?os, perception 3D). Dans le cadre de sa participation ? un projet europ?en, le laboratoire recherche un ing?nieur ou un docteur en informatique pour int?grer des briques logicielles dans le domaine du Traitement Automatique des Langues (TAL). Objectifs : ------------ A partir des r?sultats produits par plusieurs applications TAL (Crawl, Filtrage, Extraction de connaissances, etc.), l'int?gration a pour but de mettre ces applications dans une m?me chaine de traitement. Cette int?gration sera bas?e sur une plate-forme open source. La t?che du CDD consistera en particulier ? : - Contribuer au choix de la plate-forme logicielle open source. - Assurer l'int?gration des applications et infrastructures d?velopp?es par les partenaires du projet europ?en. - R?aliser le packaging, d?finir avec les autres partenaires les environnements, assurer les tests techniques et la compatibilit? entre les packages. - R?diger, contr?ler et mettre ? jour les documents n?cessaires ? la mise en exploitation. - Assurer la liaison avec les autres partenaires et prendre en charge le support technique. Profil recherch?: -------------------- Ing?nieur ou Docteur en informatique, des connaissances en TAL seraient un plus. Le candidat devra poss?der une bonne ma?trise du d?veloppement en C++ et Java sous Linux, Windows et maitriser les biblioth?ques telles que STL, Xerces, Boost, Soap, Rest, etc. Le candidat devra ?galement ma?triser les m?thodes, langages et environnements d?di?s ? la programmation parall?le (MPI, OpenMP, etc.). Le travail devant se r?aliser dans le contexte d?un projet europ?en, une bonne ma?trise de la langue anglaise est ?galement demand?e. R?mun?ration selon formation et exp?rience. Lieu de travail : Centre d?int?gration NanoInnov (plateau de Saclay, proche de Polytechnique) Dur?e : 18 mois Les candidatures (CV + lettre de motivation) sont ? envoyer le plus rapidement possible ? : Nasredine Semmar (nasredine.semmar at cea.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 19:57:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 21:57:35 +0200 Subject: Ecole: BigDat 2015, registration deadline 23 September 2014, Tarragona, Spain Message-ID: Date: Sun, 7 Sep 2014 16:27:48 +0200 From: "GRLMC" Message-ID: <33AA45D26CA6486B8048C6ACF46FA207 at Carlos1> X-url: http://grammars.grlmc.com/bigdat2015/ ***************************************************** INTERNATIONAL WINTER SCHOOL ON BIG DATA BigDat 2015 Tarragona, Spain January 26-30, 2015 Organized by Rovira i Virgili University http://grammars.grlmc.com/bigdat2015/ ***************************************************** --- 4th registration deadline: September 23, 2014 --- ***************************************************** AIM: BigDat 2015 is a research training event for graduates and postgraduates in the first steps of their academic career. It aims at updating them about the most recent developments in the fast developing area of big data, which covers a large spectrum of current exciting research, development and innovation with an extraordinary potential for a huge impact on scientific discoveries, medicine, engineering, business models, and society itself. Renowned academics and industry pioneers will lecture and share their views with the audience. All big data subareas will be displayed, namely: foundations, infrastructure, management, search and mining, security and privacy, and applications. Main challenges of analytics, management and storage of big data will be identified through 4 keynote lectures and 24 six-hour courses, which will tackle the most lively and promising topics. The organizers believe outstanding speakers will attract the brightest and most motivated students. Interaction will be a main component of the event. ADDRESSED TO: Graduate and postgraduates from around the world. There are no formal pre-requisites in terms of academic degrees. However, since there will be differences in the course levels, specific knowledge background may be required for some of them. BigDat 2015 is also appropriate for more senior people who want to keep themselves updated on recent developments and future trends. They will surely find it fruitful to listen and discuss with major researchers, industry leaders and innovators. REGIME: In addition to keynotes, 3 courses will run in parallel during the whole event. Participants will be able to freely choose the courses they will be willing to attend as well as to move from one to another. VENUE: BigDat 2015 will take place in Tarragona, located 90 kms. to the south of Barcelona. The venue will be: Campus Catalunya Universitat Rovira i Virgili Av. Catalunya, 35 43002 Tarragona KEYNOTE SPEAKERS: Ian Foster (Argonne National Laboratory), tba Geoffrey C. Fox (Indiana University, Bloomington), Mapping Big Data Applications to Clouds and HPC C. Lee Giles (Pennsylvania State University, University Park), Scholarly Big Data: Information Extraction and Data Mining William D. Gropp (University of Illinois, Urbana-Champaign), tba COURSES AND PROFESSORS: Hendrik Blockeel (KU Leuven), [intermediate] Decision Trees for Big Data Analytics Diego Calvanese (Free University of Bozen-Bolzano), [introductory/intermediate] End-User Access to Big Data Using Ontologies Jiannong Cao (Hong Kong Polytechnic University), [introductory/intermediate] Programming with Big Data Edward Y. Chang (HTC Corporation, New Taipei City), [introductory/advanced] From Design of Distributed and Online Algorithms to Hands-on Code Lab Practice on Real Datasets Ernesto Damiani (University of Milan), [introductory/intermediate] Process Discovery and Predictive Decision Making from Big Data Sets and Streams Gautam Das (University of Texas, Arlington), [intermediate/advanced] Mining Deep Web Repositories Maarten de Rijke (University of Amsterdam), tba Geoffrey C. Fox (Indiana University, Bloomington), [intermediate] Using Software Defined Systems to Address Big Data Problems Minos Garofalakis (Technical University of Crete, Chania) [intermediate/advanced], Querying Continuous Data Streams Vasant G. Honavar (Pennsylvania State University, University Park) [introductory/intermediate], Learning Predictive Models from Big Data Mounia Lalmas (Yahoo! Research Labs, London), [introductory] Measuring User Engagement Tao Li (Florida International University, Miami), [introductory/intermediate] Data Mining Techniques to Understand Textual Data Kwan-Liu Ma (University of California, Davis), [intermediate] Big Data Visualization Christoph Meinel (Hasso Plattner Institute, Potsdam), [introductory/intermediate] New Computing Power by In-Memory and Multicore to Tackle Big Data David Padua (University of Illinois, Urbana-Champaign), [intermediate] Data Parallel Programming Manish Parashar (Rutgers University, Piscataway), [intermediate] Big Data in Simulation-based Science Srinivasan Parthasarathy (Ohio State University, Columbus), [intermediate] Scalable Data Analysis Evaggelia Pitoura (University of Ioannina), [intermediate] Online Social Networks Vijay V. Raghavan (University of Louisiana, Lafayette), [introductory/intermediate] Visual Analytics of Time-evolving Large-scale Graphs Pierangela Samarati (University of Milan), [intermediate], Data Security and Privacy in the Cloud Peter Sanders (Karlsruhe Institute of Technology), [introductory/intermediate] Algorithm Engineering for Large Data Sets Johan Suykens (KU Leuven), [introductory/intermediate] Fixed-size Kernel Models for Big Data Domenico Talia (University of Calabria, Rende), [intermediate] Scalable Data Mining on Parallel, Distributed and Cloud Computing Systems Jieping Ye (Arizona State University, Tempe), [introductory/advanced] Large-Scale Sparse Learning and Low Rank Modeling ORGANIZING COMMITTEE: Adrian Horia Dediu (Tarragona) Carlos Mart?n-Vide (Tarragona, chair) Florentina Lilica Voicu (Tarragona) REGISTRATION: It has to be done at http://grammars.grlmc.com/bigdat2015/registration.php The selection of up to 8 courses requested in the registration template is only tentative and non-binding. For the sake of organization, it will be helpful to have an approximation of the respective demand for each course. Since the capacity of the venue is limited, registration requests will be processed on a first come first served basis. The registration period will be closed and the on-line registration facility disabled when the capacity of the venue will be complete. It is much recommended to register prior to the event. FEES: As far as possible, participants are expected to stay full-time. Fees are a flat rate covering the attendance to all courses during the week. There are several early registration deadlines. Fees depend on the registration deadline. ACCOMMODATION: Suggestions of accommodation will be provided in due time. CERTIFICATE: Participants will be delivered a certificate of attendance. QUESTIONS AND FURTHER INFORMATION: florentinalilica.voicu at urv.cat POSTAL ADDRESS: BigDat 2015 Lilica Voicu Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34 977 559 543 Fax: +34 977 558 386 ACKNOWLEDGEMENTS: Universitat Rovira i Virgili ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:30:18 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:30:18 +0200 Subject: Job: CDD Ingenieur ou Docteur en TAL, 18 mois, CEA LIST/LVIC, Palaiseau, Ile-de-France Message-ID: Date: Wed, 10 Sep 2014 10:34:59 +0000 From: SEMMAR Nasredine 202247 Message-ID: <50CC12289F0C854FBFF134F270030CD71ECF9649 at EXDAG0-B3.intra.cea.fr> Contexte : ------------ Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ing?nierie des Contenus) travaille sur l'analyse de contenus multim?dias (analyse de textes, images et vid?os, perception 3D). Dans le domaine de l'analyse de textes, le CEA LIST recherche un CDD ing?nieur ou docteur pour travailler sur des techniques d?extraction et de clustering de relations ? partir de textes. Objectifs : ------------ ? partir de document textuels provenant de diff?rentes sources (par exemple des d?p?ches d'actualit?), l'application vis?e a pour but d?extraire automatiquement ? partir de textes des relations entre des entit?s d?int?r?t, le plus souvent des entit?s nomm?es, et de regrouper les relations extraites en fonction de leur similarit? s?mantique. Plus pr?cis?ment, l?extraction des relations a ici la particularit? de s?effectuer de fa?on non supervis?e : le type des relations extraites n?est en effet pas d?fini a priori. L?extraction, s?appuyant sur des approches ? base d?apprentissage automatique, doit donc s?effectuer ? partir de crit?res ne d?pendant pas d?un type de relations sp?cifique. La perspective g?n?rale est ainsi celle de la veille : connaissant un ensemble d?acteurs, par exemple des soci?t?s, l?objectif est d?extraire ce qui caract?rise les relations intervenant entre ces acteurs dans un ensemble de textes, sans a priori trop marqu?. La d?finition du type des relations extraites se fait quant ? elle a posteriori par le biais du regroupement des relations jug?es similaires sur le plan s?mantique. Ce regroupement sera dans un premier temps fond? sur des mesures standards de similarit? textuelle (repr?sentation vectorielle construite ? partir d?une analyse linguistique des textes). Des mesures de similarit? plus s?mantiques, s'appuyant en particulier sur la notion de s?mantique distributionnelle, seront ? tester dans un second temps. Les approches d?velopp?es devront avoir la capacit? de travailler ? large ?chelle (plusieurs centaines de milliers de relations). En amont de ces deux t?ches principales, une ?tude concernant la constitution de larges bases d?entit?s nomm?es multilingues sera ?galement ? mener. Le travail du CDD consistera plus particuli?rement ? : - ?tudier, impl?menter et ?valuer une extraction non supervis?e de relations par apprentissage statistique ; - ?tudier, impl?menter et ?valuer le regroupement des relations extraites sur des crit?res de surface ; - ?tudier, impl?menter et ?valuer le regroupement des relations extraites sur des crit?res s?mantiques; - inventorier les bases d?entit?s nomm?es existantes, les int?grer ? l?outil de reconnaissance d?entit?s nomm?es du LVIC et ?tudier la possibilit? d?acqu?rir de nouvelles entit?s ? partir de corpus align?s ou comparables. Profil recherch? : -------------------- - Comp?tences en traitement automatique des langues / recherche d'information - Connaissance des techniques d'apprentissage automatique (SVM, CRF ?) et de clustering - Comp?tences informatiques : C++, langages de script (perl, python ...) Le travail devant se r?aliser dans le contexte d?un projet europ?en, une bonne ma?trise de la langue anglaise est ?galement demand?e. R?mun?ration selon formation et exp?rience. Lieu de travail : Centre d?int?gration NanoInnov (plateau de Saclay, proche de Polytechnique) Dur?e : 18 mois Les candidatures (CV + lettre de motivation) sont ? envoyer le plus rapidement possible ? : Nasredine Semmar (nasredine.semmar at cea.fr) avec copie ? : Romaric Besan?on (romaric.besancon at cea.fr) Olivier Ferret (olivier.ferret at cea.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:39:10 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:39:10 +0200 Subject: Job: NLP, machine learning, Elsevier, Amsterdam Message-ID: Date: Wed, 10 Sep 2014 14:27:06 +0200 From: V?ronique Malais? Message-ID: Dear All, Please find below a job description that could be of interest for the people on the list. Interested candidates can send their CV and motivation letter to Pamela Ostendorf, "p.ostendorf at elsevier.com" Best, Veronique ------------------------------------------------------------------------ Natural Language Processing Expert Do you have extensive machine learning experience combined with software development skills? This might be your next challenge! In line with the Elsevier corporate strategy of greater content volume, types and sophistication, the services that Elsevier provides are becoming increasingly dependent on Smart Content. We are looking for a NLP Expert with a focus on Machine Learning and Statistical NLP techniques to strengthen our Content Enrichment team in executing that strategy. As a NLP Expert you will be working with our business units on developing our content and information offering to end customers. These services may rely on existing text and data mining processes that need application and maintenance, or require improvement in that area based on new industry developments (for example in the area of machine learning). You also will be working in Elsevier Operations with a varied group and cross-functional team of IT and product colleagues to pilot and develop new methods of extracting and surfacing information relevant to our customers for new product development. When successful, the NLP Expert will support the implementation of industry-scale high-quality production systems. Both a publisher and information solutions provider, Elsevier is looking for someone that is able to work on information from internal and external sources and using different (or no) data standards. Our search solutions depend heavily on concept indexing or annotation (for example using ontologies in the medical domain), relationship extraction (for example in disease pathways) or extracting data from images and tables. The ideal candidate will have industry experience solving language-related problems (entity extraction, word-sense disambiguation, information clustering) using statistical methods on vast quantities of data - and apply that experience to all of the above areas. You will be part of a growing team based in Amsterdam, reporting to the Head of Content Enrichment. Your responsibilities Text and data mining - You will bring active experience into the organization on extraction text and data information from structured and unstructured data. Applying and developing on these techniques you will drive the implementation of automated indexing and annotation processes. Also well-versed in machine learning, you will bring new processes into the organization in order to improve (in cost and time-efficiency) the data excerption processes that Elsevier is engaged with. This process will also include the application of Elsevier's taxonomy and ontology assets to a wide variety of content - as well as drive developments in the application of and expansion on these vocabularies. Data analytics to support businesses and products - You will analyze extracted information to drive such processes as automated and manual data cleansing. Data analytics can also be used to identify research trends, or drive decision for our content acquisition strategy. Using visualizations tools to present the extracted data to be ready for consumption will be another key ability. Contribute to the content strategy - You will actively contribute to product and operational content strategies by identifying and ingesting new technical capabilities to forward Elsevier mission of leading the way in advancing science, technology and medicine. Using the available base data, you will actively promote new ideas of using this data to enhance our competitive offerings. Serve as internal and external specialist on data extraction and NLP matters - You will serve as the NLP expert for Content and Innovation as well as across other teams in Elsevier. You will be a trusted resource in new development projects in Elsevier. You will also be able to act as a liaison between IT developers and (content) subject matters experts, translating information needs into software development. A senior member of the team, the NLP expert will coach junior members or outside vendors on a need basis. What you should bring - University graduate (Master of PhD level) computer science, computational linguistics or an associated area. - At least 5 years? experience working in Natural Language Processing (NLP); especially in entity extraction, word-sense disambiguation, information clustering and data mining. - Proven experience with text normalization and processing, writing NLP, Parsers, and Spell checkers. - Software development experience in C/C++. - Familiarity with agile software development. - Scripting abilities in PHP/Lua and Perl/Python/Java. - Writing SQL queries, and experience using *nix systems, open source software and libraries. - Experience with internationalization, validation techniques, and using statistical techniques in decision making. - Ability to write design specifications, unit tests, maintaining documentation and perform code reviews. - Knowing how to improve efficiency of existing code, always considering performance factors. - Familiarity with taxonomy applications across scientific and healthcare disciplines is a plus. - Experience working with a variety of stakeholders at the mid and senior management level. - Ability to drive new developments and implement process changes and disruptive technologies in the organization. - Good communication and documentations skills with the ability to convey complex technical concepts to non-technical professionals. - Fluent in English What we offer We welcome you to a truly global, dynamic and challenging environment with great opportunities to develop yourself. Elsevier?s benefits are very competitive and the summary below will give you an idea of the kind of things you can expect when joining Elsevier in the Netherlands. - Competitive salary and a 13th month - 27 days of leave - Attractive collective health care insurance package with considerable reduction rates - Solid Pension Plan of which 70% of the premiums is paid by Elsevier - Profit share or bonus plan subject to the company annual results - You can participate in the convertible personnel bond loan scheme - Flexible working arrangements - Travel allowance for commuting between home and work - Reductions to several personal insurance packages due to our collective agreements - Additional benefits, like memberships of Elsevier?s magazines, discount on books and in-house sport facilities - Numerous training, coaching and e-learning modules for long term job opportunities and development - Several local and global networking communities to share best practices and knowledge ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:28:12 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:28:12 +0200 Subject: Job: Contract positions at Google, Junior Linguist (French) Message-ID: Date: Tue, 9 Sep 2014 19:57:27 +0200 From: AdvancedLinguistics Message-ID: *Job title: Junior Linguist [French]* *Job description:* As a Junior Linguist, you will be annotating and reviewing linguistic data in French. You will also contribute to a number of other tasks to improve natural language processing at Google. Work will be done from home, but Junior Linguists must live in the Paris area in order to travel to the Google office for training and meetings. *The tasks include:* - annotating and reviewing linguistic data - labeling text with semantic, syntactic and morphological features - annotating lexicon entries according to guidelines - evaluating current system outputs - deriving NLP data for new and on-going projects *Requirements*: - native-level speaker of French and fluent in English - preferred degree in Linguistics or Computational Linguistics - experience in annotation work - knowledge of semantics, syntax, morphology or lexicography - ability to quickly grasp technical concepts; learn in-house tools - keen interest in technology and computer-literate - excellent oral and written communication skills - attention to detail and good organizational skills - ability to work independently from home with reliable internet connectivity Project duration: 6 months (with potential for extension) For immediate consideration, please email your CV and cover letter in English (in PDF format) with ?Junior Linguists [French]? in the subject line. E-mail address for applications: *advancedlinguistics at gmail.com* Application deadline: September 29th. 2014 Contact information: Bruno Cartoni ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:08:04 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:08:04 +0200 Subject: Seminaire: Olivier Le Guen, Cycle ESPaCCE 2014/2015 Toulouse, 26/09/14 Message-ID: Date: Wed, 10 Sep 2014 10:15:07 +0200 From: Michel Aurnague Message-ID: <5410088B.8080204 at univ-tlse2.fr> Olivier le Guen (CIEAS, Mexico) assurera le 26 septembre prochain, ? l'Universit? Toulouse - Jean Jaur?s, un s?minaire sur le th?me : *Une conception g?ocentrique de l'espace chez les Mayas Yucat?ques : langage, cognition et gestualit?*. [Maison de la Recherche, salle D155, 14h] Cette intervention s'ins?re dans le cycle ESPaCCE (2) *"Des Expressions Spatiales ? leurs Param?tres Cognitifs, Culturels et Environnementaux" *programm? au cours de l'ann?e universitaire 2014/2015. R?sum? : En g?n?ral, dans la plupart des ?tudes concernant l'influence du langage sur la cognition, le langage parl? (speech) est toujours l'unique le canal consid?r?. Dans le domaine de l'espace, les ?tudes conduites chez les mayas yucat?ques (Mexique) qui ont eu pour but de d?terminer le cadre de r?f?rence pr?f?r? dans cette communaut? n'ont pas g?n?r? de consensus (Bohnemeyer & Stolz, 2006; Levinson, 2003 vs. Le Guen, 2006, 2009). Dans cette pr?sentation, je consid?re une analyse multimodale du langage qui comprend le langage parl? et les gestes, et montre comment le cadre de r?f?rence spatial pr?f?r? chez les mayas yucat?ques est uniquement d?tectable ? travers l'analyse des gestes co-verbaux. Une s?rie de t?ches exp?rimentales compare la connaissance du sens des termes spatiaux, les performances dans des t?ches non-verbales et la production gestuelles entre les hommes et les femmes. Les r?sultats montrent qu'il existe une forte diff?rence entre hommes et femmes dans la connaissance des termes spatiaux mais des performances similaires et un usage pr?f?rentiel du cadre de r?f?rence g?ocentrique dans des t?ches non-verbales. Finalement, dans une t?che de localisation spatiale, les participants ont utilis? des strat?gies vari?es dans le langage parl? mais, malgr? cela, tous ont fait un usage syst?matique du cadre de r?f?rence g?ocentrique dans la production de leurs gestes spatiaux. Je montrerai comment l'information pr?sente dans les gestes est articul?e tant syntaxiquement que s?mantiquement au langage parl?, et ce de fa?on obligatoire en maya yucat?que. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:40:15 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:40:15 +0200 Subject: Appel: IWSLT 2014 Message-ID: Date: Wed, 10 Sep 2014 17:36:39 +0200 From: Francois Yvon Message-ID: <54107007.4030307 at limsi.fr> X-url: http://workshop2014.iwslt.org/ (apologies for cross posting) 11th International Workshop on Spoken Language Translation (IWSLT 2014) Second Call for Papers December 4-5, 2014 Lake Tahoe, Nevada http://workshop2014.iwslt.org/ The International Workshop on Spoken Language Translation (IWSLT) is a yearly scientific workshop, associated with an open evaluation campaign on spoken language translation, where both scientific papers and system descriptions are presented. The 11th International Workshop on Spoken Language Translation will take place in Lake Tahoe, US on Dec. 04-05, 2014. IWSLT 2014 is co-located with the 2014 IEEE Spoken Language Technology Workshop (SLT 2014). SLT will be held in South Lake Tahoe, California and Nevada, on Dec 7-10, 2014. The IWSLT invites submissions of scientific papers to be published in the workshop proceedings and presented in dedicated technical sessions of the workshop, either in oral or poster form. The workshop welcomes original, high quality contributions covering theoretical and practical issues in the fields of automatic speech recognition and machine translation that are applied to spoken language translation. Possible topics include, but are not limited to: * Speech and text MT * Integration of ASR and MT * MT and SLT approaches * MT and SLT evaluation * Language resources for MT and SLT * Open source software for MT and SLT * Adaptation in MT * Simultaneous speech translation * Speech translation of lectures * Spoken language summarization * Efficiency in MT * Stream-based algorithms for MT * Multilingual ASR and TTS * Rich transcription of speech for MT * Translation of non-verbal events IMPORTANT DATES * Sep 25, 2014: Paper Submission due * Nov 3: Author Notification * Nov 13: Camera-ready paper due * Dec 4-5: Workshop starts SUBMISSION: Submission is electronic, using the easychair submission software : https://easychair.org/conferences/?conf=3Diwslt2014 IWSLT 2014 review process is double-blind. Submitted manuscripts will be peer-reviewed. Authors of accepted papers are requested to present their paper at the workshop. Formatting guidelines and style files can be found here: http://workshop2014.iwslt.org/100.php CONTACT Fran?ois Yvon, LIMSI-CNRS (francois.yvon at limsi.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:18:51 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:18:51 +0200 Subject: Job: Postdoc, Semantique et big data, Orange Labs Rennes Message-ID: Date: Mon, 8 Sep 2014 17:15:01 +0000 From: Message-ID: <10575_1410196502_540DE416_10575_16952_1_ED32B5012BA99F4AA999E2765EF060F214062E53 at PEXCVZYM12.corporate.adroot.infra.ftgroup> X-url: http://orange.jobs/jobs/offer.do?joid=40961&lang=FR Bonjour, Vous trouverez ci-dessous une proposition d'un postdoc ? Orange Labs Rennes (Bretagne, France). Le sujet est : Etude d'un algorithme de calcul de profils utilisateur, de type s?mantique, dans le domaine des contenus audio-visuels et musicaux. Les candidats int?ress?s peuvent candidater en ligne (CV et LM). http://orange.jobs/jobs/offer.do?joid=40961&lang=FR Cordialement Malek Boualem R&D Project Manager France Telecom Orange Labs FT/OLNC/OLPS/OPENSERV/CONTENT/FAST Phone : +33 (0)2 96 05 29 83 Mobile : +33 (0)6 85 71 40 63 Email : malek.boualem at orange.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:06:36 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:06:36 +0200 Subject: Conf: L'homme, matiere sensible, Parcours en hommage a Mario Borillo, 15-18 octobre 2014, Toulouse Message-ID: Date: Mon, 08 Sep 2014 11:07:16 +0200 From: Michel Aurnague Message-ID: <540D71C4.9010501 at univ-tlse2.fr> Chers amis, chers coll?gues, Nous avons le plaisir de vous annoncer qu'un parcours en hommage ? Mario Borillo (1934-2013) aura lieu du 15 au 18 octobre prochain dans le cadre du festival "La Novela" 2014, sous le titre "L'homme, mati?re sensible". Ce parcours comprendra quatre ?v?nements dont vous trouverez la pr?sentation et le d?tail ci-dessous. Par ailleurs, un opuscule sera ?galement ?dit? ? cette occasion dans lequel figureront des jalons biographiques retra?ant le cheminement personnel et professionnel de Mario Borillo, deux de ses textes ainsi qu'un certain nombre de brefs t?moignages-hommages (N. Asher, J. Blaine, L. Fari?as, A. Gu?noche, A. Holley, D. Kayser, N. & J. Kehayan, J.M. Larrazabal, E. Morin, F. Nef, H. Prade). Nous esp?rons vous voir nombreux ? cette s?rie d'?v?nements qui sera l'occasion de rendre hommage ? Mario Borillo dans un contexte convivial et intellectuellement stimulant. Cordialement, Michel Aurnague & Laure Vieu. ------------------------------------------------------------------------ *L'homme, mati?re sensible. Parcours en hommage ? Mario Borillo - 15-18 octobre, Toulouse* L'homme dot? de (cinq) sens et cr?ateur de sens (signification) a constitu? un questionnement majeur pour Mario Borillo (1934-2013) auquel ce parcours est d?di?. Ce chercheur toulousain de premier plan s'est particuli?rement int?ress? ? la probl?matique de la compr?hension et repr?sentation des actions et raisonnements humains. A travers le fil conducteur du langage (langage naturel, langage de l'art...), les ?v?nements de ce parcours proposent divers coups de projecteurs sur l'art, la langue, la perception et les sciences de l'information et de la cognition. >>Mercredi 15 octobre, 10h30-12h30, Universit? Paul Sabatier, IRIT, auditorium Herbrand *S?minaire de Hans Kamp professeur de logique et philosophie du langage ? l'Universit? de Stuttgart* >>Jeudi 16 octobre, 16h-18h, Universit? Paul Sabatier, IRIT *Plantation d'un ch?ne en souvenir de Mario Borillo, allocutions* >>Vendredi 17 octobre, 18h30-20h30, Archives Municipales de Toulouse (2 rue des Archives, m?tro A arr?t Roseraie ; ? 10 mn du m?tro, traverser le square Tonelli et prendre l'avenue de Lavaur) *L'Odeur des Archives : parcours litt?raire et neuronal* Intervenants : Michael Moisseeff (directeur scientifique association Asquali), Isabelle Ser?a (professeur de langue et litt?rature fran?aise, Universit? Toulouse - Jean Jaur?s), Jean-Marc Devaud (ma?tre de conf?rences en neurosciences, Universit? Paul Sabatier) La m?moire de la ville est stock?e sur du parchemin, du papier, des pellicules argentiques, des cd, des disques optiques. Mais la m?moire olfactive de la ville o? est-elle gard?e ? Vous vous souvenez des senteurs prolixes d'une ?picerie ? O? pouvez-vous les retrouver, si ce n'est dans votre m?moire ? Quelques auteurs ont explor? ces contr?es mn?moniques et en ont rapport? des textes odorants ! Venez assister ? la lecture de ces textes et d?couvrez l'Odeur des Archives ! Une bonne occasion de faire une balade olfactive et litt?raire et de d?couvrir ce lieu exceptionnel que sont les Archives municipales. N'oubliez pas... de venir avec vos narines ! >>Samedi 18 octobre, 15h30-17h30, Mus?um d'histoire naturelle, salle Picot Lapeyrouse *Danser, penser : explorations du mouvement et de l'espace [? l'?cole, ? l'?cran]* Intervenants : Annie Bozzini (directrice du CDC Toulouse/Midi-Pyr?n?es), Catherine Gadon (directrice du service de "Diffusion de la culture scientifique et technique" du PRES), Philippe Joly (professeur des universit?s, IRIT, ?quipe SAMOVA), Christophe Jouffrais (Charg? de Recherche CNRS, IRIT et laboratoire LACII), Gilles Thomas (r?alisateur des documentaires "Kid Birds for Camera" et "Kid Birds OFF") Comment (se) repr?senter le mouvement ? Comment le d?composer ? Quand le mouvement devient-il danse ?... Prenant comme fil conducteur la d?marche du chor?graphe Merce Cunningham, cet ?v?nement abordera les questions ci-dessus (ainsi que quelques autres) sous deux angles compl?mentaires : celui du traitement automatique du mouvement par une machine et de la repr?sentation de l'espace par le cerveau humain ; celui du mouvement et de la danse utilis?s comme outils p?dagogiques ? l'?cole (projection d'un extrait du documentaire "Kid Birds"). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 10 20:02:29 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:02:29 +0200 Subject: Livre: Language Processing with Perl and Prolog, 2nd edition Message-ID: Date: Mon, 8 Sep 2014 09:04:41 +0000 From: Pierre Nugues Message-ID: <1DA5E251-7ACB-4FA3-ACEF-6E5A2D53791B at cs.lth.se> X-url: http://ilppp.cs.lth.se/ X-url: http://www.springer.com/978-3-642-41463-3 X-url: http://www.amazon.com/Language-Processing-Perl-Prolog-Implementation/dp/364241463X/ Apologies for cross-postings. Book announcement: Language Processing with Perl and Prolog, 2nd edition By Pierre Nugues Published by Springer This book has a companion website at http://ilppp.cs.lth.se/ and can be ordered from Springer: http://www.springer.com/978-3-642-41463-3 or Amazon: http://www.amazon.com/Language-Processing-Perl-Prolog-Implementation/dp/364241463X/ Overview: This book teaches the principles of natural language processing, first covering practical linguistics issues such as encoding and annotation schemes, defining words, tokens and parts of speech, and morphology, as well as key concepts in machine learning, such as entropy, regression, and classification, which are used throughout the book. It then details the language-processing functions involved, including part-of-speech tagging using rules and stochastic techniques, using Prolog to write phase-structure grammars, syntactic formalisms and constituent and dependency parsing techniques, semantics, predicate logic, and lexical semantics, and analysis of discourse and applications in dialogue systems. A key feature of the book is the author's hands-on approach throughout, with sample code in Prolog and Perl, extensive exercises, and a detailed introduction to Prolog. The reader is supported with a companion website that contains teaching slides, programs, and additional material. The second edition is a complete revision of the techniques exposed in the first edition to reflect advances in the field. The author redesigned or updated all the chapters, added two new ones, and considerably expanded the sections on machine-learning techniques. Contents: 1 An Overview of Language Processing 2 Corpus Processing Tools 3 Encoding and Annotation Schemes 4 Topics in Information Theory and Machine Learning 5 Counting Words 6 Words, Parts of Speech, and Morphology 7 Part-of-Speech Tagging Using Rules 8 Part-of-Speech Tagging Using Statistical Techniques 9 Phrase-Structure Grammars in Prolog 10 Partial Parsing 11 Syntactic Formalisms 12 Constituent Parsing 13 Dependency Parsing 14 Semantics and Predicate Logic 15 Lexical Semantics 16 Discourse 17 Dialogue Appendix: An Introduction to Prolog Index References From hamon at LIMSI.FR Wed Sep 10 20:25:03 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 10 Sep 2014 22:25:03 +0200 Subject: Conf: AWNLP, Doha, Qatar, October 25, 2014 Message-ID: Date: Mon, 8 Sep 2014 19:09:43 +0000 From: Houda Bouamor Message-ID: <45AE03F9-42B2-4E0A-A5FE-3652425DF406 at qatar.cmu.edu> X-url: http://www.emnlp2014.org/workshops/anlp/call.html X-url: http://emnlp2014.org/workshops/anlp/acceptedpapers.html ======================================================= Call for Participation Arabic Natural Language Processing Workshop collocated with EMNLP 2014, Doha, Qatar Workshop date: Saturday October 25, 2014 Workshop Website: http://www.emnlp2014.org/workshops/anlp/call.html List of Accepted Papers: http://emnlp2014.org/workshops/anlp/acceptedpapers.html ======================================================= WORKSHOP DESCRIPTION There has been a lot of progress in the last 15 years in the area of Arabic Natural Language Processing (NLP). Many Arabic NLP (or Arabic NLP-related) workshops and conferences have taken place, both in the Arab World and in association with international conferences. This workshop follows in the footsteps of previous efforts to provide a forum for researchers to share and discuss their ongoing work. We invited submissions on topics that include, but are not limited to, the following: * Basic core technologies: morphological analysis, disambiguation, tokenization, POS tagging, named entity detection, chunking, parsing, semantic role labeling, sentiment analysis, Arabic dialect modeling, etc. * Applications: machine translation, speech recognition, speech synthesis, optical character recognition, pedagogy, assistive technologies, social media, etc. * Resources: dictionaries, annotated data, specialized databases etc. Associated with the workshop was a shared task on Arabic text error correction. OVERALL SCHEDULE (October 25, 2014) 9:00-10:30 Session #1 Corpora 10:30-11:00 Break / Poster setup 11:00-12:00 Shared Task Session 11:00-11:30 Task description and summary of results 11:30-11:45 1-minute summary for shared task participants 11:45-12:15 Panel / Group Discussion 12:15-12:30 Poster Teaser 1-minute poster summaries 12:30-14:00 Lunch / Poster Session (Main + Shared Task papers) 14:00-15:30 Session #2 Text Mining 15:30-16:00 Break 16:00-17:10 Session #3 Translation & Transliteration 17:10-18:00 Workshop Group Discussion ACCEPTED PAPERS Main Workshop Papers Al-Bayan: An Arabic Question Answering System for the Holy Quran Heba Abdelnasser, Maha Ragab, Reham Mohamed, Alaa Mohamed, Bassant Farouk, Nagwa El-Makky and Marwan Torki Annotating corpus data for a constructional analysis of motion verbs in Modern Standard Arabic Dana Abdulrahim Building a Corpus for Palestinian Arabic: a Preliminary Study Diyam Akra, Nizar Habash, Mustafa Jarrar and Nasser Zalmout Combining strategies for tagging and parsing Arabic Maytham Alabbas and Allan Ramsay The International Corpus of Arabic: Compilation, Analysis and Evaluation Sameh Alansary Uniform Word Segmentation Improves Dialectal Arabic to English Machine Translation Kamla Al-Mannai, Hassan Sajjad, Alaa Khader, Fahad Al Obaidli, Preslav Nakov and Stephan Vogel Automatic Arabic diacritics restoration based on deep nets Ahmad Al Sallab and Mohsen Rashwan A Large Scale Arabic Sentiment Lexicon for Arabic Opinion Mining Gilbert Badaro, Ramy Baly, Hazem Hajj, Nizar Habash and Wassim El-Hajj Transliteration of Arabizi into Arabic Orthography: Developing a Parallel Annotated Arabizi-Arabic Script SMS/Chat Corpus Ann Bies, Stephen Grimes, Haejoong Lee, Mohamed Maamouri, Zhiyi Song, Jonathan Wright, Ramy Nagah Eskander, Nizar Habash and Owen Rambow Tunisian dialect Wordnet : creation and enrichment using web resources and other Wordnets Rihab Bouchlaghem, Aymen Elkhlifi and Rim Faiz Arabizi Detection and Conversion to Arabic Kareem Darwish A Framework for Creating an MWE Computational Lexical Resource for Dialectal Arabic Abdelati Hawwari, Mohammed Attia and Mona Diab Domain and Dialect Adaptation for Machine Translation into Egyptian Arabic Serena Jeblee, Weston Feely, Houda Bouamor, Alon Lavie, Nizar Habash and Kemal Oflazer Semantic Query Expansion for Arabic Information Retrieval Ashraf Y. Mahgoub, Mohsen A. Rashwan, Hazem Rafaat, Mohamed A. Zahran and Magda B. Fayek Arabic Native Language Identification Shervin Malmasi and Mark Dras Using Twitter to Collect a Multi-Dialectal Corpus of Arabic Hamdy Mubarak and Kareem Darwish Evaluating Distant Supervision for Subjectivity and Sentiment Analysis on Arabic Twitter Feeds Eshrag Refaee and Verena Rieser AIDArabic A Named-Entity Disambiguation Framework for Arabic Text Mohamed Amir Yosef, Marc Spaniol and Gerhard Weikum Named Entity Recognition System for Dialectal Arabic Ayah Zirikly and Mona Diab Shared Task Papers The First shared Task on Automatic Text Correction for Arabic Behrang Mohit, Alla Rozovskaya, Nizar Habash, Wajdi Zaghouani and Ossama Obeid GWU-HASP: Hybrid Arabic Spelling and Punctuation Corrector Mona Diab, Mohammed Attia and Mohamed Al-Badrashiny Arabic Spelling Correction using Supervised Learning Youssef Hassan, Mohamed Aly and Amir Atiya CMUQ at The 2014 Automatic Arabic Error Correction Shared Task Serena Jeblee, Houda Bouamor, Wajdi Zaghouani and Kemal Oflazer TECHLIMED system description for the Shared Task on Automatic Arabic Error Correction Djamel Mostefa, Omar Asbayou and Ramzi Abbes Automatic Correction of Arabic Text: a Cascaded Approach Hamdy Mubarak and Kareem Darwish Fast and Robust Arabic Error Correction System Michael Nawar and Moheb Ragheb The Columbia System in the QALB-2014 Shared Task on Arabic Error Correction Alla Rozovskaya, Nizar Habash, Ramy Eskander, Noura Farra and Wael Salloum A Pipeline Approach to Supervised Automatic Error Correction Nadi Tomeh, Nizar Habash, Ramy Eskander and Joseph Le Roux Autocorrection of arabic common errors for large text corpus Taha Zerrouki, Khaled Alhowaity and Amar Balla ORGANIZERS Program Co-chairs Nizar Habash, Columbia University Stephan Vogel, Qatar Computing Research Institute Publication Co-chairs Nadi Tomeh, Paris 13 University Houda Bouamor, Carnegie Mellon University Qatar Website Committee Kareem Darwish, Qatar Computing Research Institute Noura Farra, Columbia University Shared Task Committee Behrang Mohit (co-chair), Carnegie Mellon University Qatar Alla Rozovskaya (co-chair), Columbia University Wajdi Zaghouani, Carnegie Mellon University Qatar Ossama Obeid, Carnegie Mellon University Qatar Nizar Habash (advisor), Columbia University Program Committee Members Abdelmajid Ben-Hamadou, University of Sfax, Tunisia Abdelhadi Soudi, Ecole Nationale de l?Industrie Min?rale, Morocco Abdelsalam Nwesri, University of Tripoli, Libya Achraf Chalabi , Microsoft Research, Egypt Ahmed Ali, Qatar Computing Research Institute, Qatar Ahmed Rafea, The American University in Cairo, Egypt Alexis Nasr, University of Marseille, France Ali Farghaly, Monterey Peninsula College, USA Almoataz B. Al-Said, Cairo University, Egypt Alon Lavie, Carnegie Mellon University, USA Aly Fahmy, Cairo University, Egypt Azadeh Shakery, University of Tehran, Iran Azzeddine Mazroui, University Mohamed I, Morocco Bassam Haddad, University of Petra, Jordan Bayan Abu Shawar, Arab Open University, Jordan Behrang Mohit, Carnegie Mellon University Qatar, Qatar Eric Atwell, University of Leeds, UK Farhad Oroumchian, University of Wollongong, Australia Ghassan Mourad, Universit? Libanaise, Lebanon Hassan Sawaf, eBay Inc., USA Hazem Hajj, American University of Beirut, Lebanon Hend Alkhalifa, King Saud University, Saudi Arabia Houda Bouamor, Carnegie Mellon University Qatar, Qatar Imed Zitouni, Microsoft Research, USA Joseph Dichy, Universit? Lyon 2, France Karim Bouzoubaa , Mohammad V University, Morocco Karine Megerdoomian, The MITRE Corporation, USA Katrin Kirchhoff, University of Washington, USA Kemal Oflazer, Carnegie Mellon University Qatar, Qatar Khaled Shaalan, The British University in Dubai, UAE Khaled Shaban, Qatar University, Qatar Khalil Sima?an, Universiteit van Amsterdam, Netherlands Lamia Hadrich Belguith, University of Sfax, Tunisia Michael Rosner, University of Malta, Malta Mohamed Elmahdy, Qatar University, Qatar Mohsen Rashwan, Cairo University, Egypt Mona Diab, George Washington University, USA Mustafa Jarrar, Bir Zeit University, Palestine Nada Ghneim, Higher Institute for Applied Sciences and Technology, Syria Nadi Tomeh, University Paris 13, France Ossama Emam, IBM, USA Otakar Smr?, D??m-e D?am Language Institute, Czech Republic Owen Rambow, Columbia University, USA Preslav Nakov, Qatar Computing Research Institute, Qatar Ramzi Abbes, TECHLIMED, France Salwa Hamada, Cairo University, Egypt Shahram Khadivi, Tehran Polytechnic, Iran Sherri Condon , The MITRE Corporation, USA Taha Zerrouki, University of Bouira, Algeria Violetta Cavalli-Sforza, Al Akhawayn University, Morocco ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 19:51:11 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 21:51:11 +0200 Subject: Appel: Date limite JE Ethique et TAL repoussee Message-ID: Date: Thu, 11 Sep 2014 10:05:23 +0200 From: Kar?n Fort Message-ID: X-url: http://www.schplaf.org/kf/JE_ATALA.html Bonjour ? tous, La date limite d'envoi de vos soumissions pour la JE Ethique et TAL est repouss?e au 25 septembre. N'h?sitez-plus ! Bien cordialement, Karen Fort ======APPEL======== Le TAL est une discipline au c?ur de l'?thique scientifique, ? la fois en tant qu'elle fournit des outils pour assurer l'utilisation ?thique des donn?es mais ?galement par son long historique de travaux sur des sources sensibles, ou la n?cessaire implication de nombreux collaborateurs pour la cr?ation de ressources langagi?res volumineuses. Concernant les outils, l'anonymisation des donn?es, qu'elles soient orales ou ?crites, est un enjeu tant industriel qu'acad?mique, avec des contraintes de couverture parfois fortes selon les besoins applicatifs ou de recherche, la nature des ressources et des informations ? anonymiser ou encore les limitations l?gales. D'autres outils du TAL s'inscrivent ?galement dans des pr?occupations ?thiques, comme les outils de d?tection de plagiat ou de v?rification de faits. La diversification des travaux sur corpus a par ailleurs amen? la communaut? ? traiter des sources de plus de plus sensibles, qu'il s'agisse de donn?es personnelles, m?dicales, voire ? caract?re criminel. En outre, l'av?nement du Web 2.0. et avec lui le d?veloppement de la myriadisation (crowdsourcing), pose de nouvelles questions quant ? la mani?re de consid?rer les intervenants dans la cr?ation de ressources langagi?res. Enfin, les pr?occupations concernant l'utilisation des outils de TAL ne sont pas nouvelles, mais elles deviennent de plus en plus sensibles ? l'heure des Big Data et du recoupement des donn?es auquel participe le TAL. Aux questions juridico-?conomiques (fouille de brevets, droits associ?s aux donn?es/logiciels), s'ajoutent les enjeux militaires (surveillance des ?changes) et sociaux (le ? droit ? l?oubli ? impos? ? Google). Cette journ?e d'?tude se veut un lieu d'?change ouvert sur ces sujets. Cet appel ? communications s'adresse donc aux chercheur(e)s en traitement automatique des langues ou en linguistique, aux industriel(le)s ayant ? utiliser des ressources langagi?res et aux expert(e)s dans les questions ?thiques. Th?mes de la journ?e La journ?e commencera par une conf?rence invit?e. Les communications sollicit?es concernent aussi bien des travaux de recherche que des exp?riences industrielles, notamment dans les domaines suivants : * outils ?thiques pour le TAL, ou reposant sur des techniques du TAL * m?thodes et bonnes pratiques ?thiques en TAL * TAL et aspects juridiques * traitement des donn?es sensibles * recherche en TAL et principes ?thiques * myriadisation et ?thique Modalit?s de soumission Les propositions seront ? envoyer ? Kar?n Fort (karen.fort at paris-sorbonne.fr - merci de pr?ciser [JE ATALA] dans le d?but du titre) - au plus tard le 15 septembre 2014. Elles devront ?tre r?dig?es en fran?ais pour les francophones, et pourront ?tre r?dig?es en anglais pour les non-francophones. Les r?sum?s seront publi?s apr?s la journ?e sur le site de l'ATALA. Format de la soumission : r?sum? de 2 pages (format type LREC, disponible sur le site de la journ?e : http://www.schplaf.org/kf/JE_ATALA.html ) Comit? scientifique * Olivier Baude, LLL, Universit? d?Orl?ans * Kevin B. Cohen, Biomedical Text Mining Group, University of Colorado School of Medicine * Alain Couillault, L3i, Universit? de La Rochelle / Aproged * C?cile Fabre, CLLE-ERSS, Universit? de Toulouse II * C?drick Fairon, CENTAL, Universit? catholique de Louvain * Kar?n Fort, STIH, Universit? Paris-Sorbonne * Cyril Grouin, LIMSI CNRS * Joseph Mariani, IMMI / LIMSI CNRS * Adeline Nazarenko, LIPN, Universit? Paris-Nord * Beno?t Sagot, Alpage, INRIA / Paris 7 * Isabelle Tellier, Universit? Sorbonne Nouvelle Informations pratiques Organisation : Kar?n Fort (STIH, Universit? Paris-sorbonne) Contact : karen.fort at paris-sorbonne.fr Date : samedi 22 novembre Lieu : Paris (? pr?ciser) Dates importantes * Date de la journ?e : 22 novembre 2014 * Date limite de soumission : 25 septembre 2014 * Date de notification aux auteurs : 20 octobre 2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 19:53:04 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 21:53:04 +0200 Subject: Appel: Quo Vadis, Terminologia? Message-ID: Date: Thu, 11 Sep 2014 14:24:06 +0200 From: Kubler Natalie Message-ID: <54119466.1000305 at eila.univ-paris-diderot.fr> X-url: http://quovadis.clillac-arp.univ-paris-diderot.fr/index Chers Coll?gues, Veuillez trouver ci-dessous le deuxi?me appel ? communication pour /Quo Vadis, Terminologia/? Colloque international en hommage ? John Humbley. Site Web: http://quovadis.clillac-arp.univ-paris-diderot.fr/index Colloque: 18-20 f?vrier 2015, soumission report?e au 30 septembre 2014, notification aux auteurs: 31 d?cembre 2014 La soumission se fera sur easychair (https://www.easychair.org/conferences/?conf=qvtparis2015). Les propositions, d'un maximum de 500 mots, plus quelques r?f?rences bibliographiques, devront clairement faire r?f?rence aux th?mes propos?s et aux travaux de John Humbley. Les communications portant sur les sujets suivants et int?grant les travaux de John Humbley seront les bienvenues: * l'h?ritage de W?ster aujourd'hui * l'apport de la linguistique de corpus dans l'?volution de la terminologie * l'apport de la phras?ologie dans l'?volution des ?tudes en terminologie * terminologie et traduction sp?cialis?e * terminologie et r?daction technique * la n?ologie dans les langues de sp?cialit? * variation terminologique * emprunts, m?taphores et autres matrices ? l'oeuvre dans la dynamique terminologique, ressources terminologiques * am?nagement terminologique Bien cordialement Professeur NATALIE K?bler, UFR EILA Directrice du CLILLAC-ARP, EA 3967 Directrice du Centre de Ressources en Langues http://www.eila.univ-paris-diderot.fr/user/natalie_kuebler Universit? Paris Diderot 5, rue Thomas Mann 7520 Paris cedex 13 tel. +33 1 57 27 64 79 fax +33 1 57 27 64 81 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:26:29 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:26:29 +0200 Subject: Soft: Station Sensunique, plateforme web d'acquisition assistee de ressources (orientee Langues Controlees) Message-ID: Date: Fri, 12 Sep 2014 12:20:42 +0200 From: Izabella Thomas Message-ID: X-url: http://www.station-sensunique.fr/ Chers coll?gues, Nous avons le plaisir de vous annoncer la mise en ligne de la Station Sensunique (http://www.station-sensunique.fr/). La Station Sensunique est une plateforme web modulaire, collaborative et ?volutive d'acquisition assist?e de vocabulaire (terminologique et non terminologique). Elle a ?t? con?ue ? l'Universit? de Franche-Comt? durant le projet ANR Sensunique (2010-2012). Elle permet : a) d'acc?l?rer le processus d'?tablissement du lexique d'un domaine ou d'une Langue Contr?l?e, en s'appuyant sur : - la collaboration de plusieurs outils TAL ; - l'interrogation automatique des ressources terminologiques existantes ; - l'int?gration et l'interrogation de ressources terminologiques ou lexicales propres ; b) de g?rer le lexique, de cr?er et d'exporter des dictionnaires. Le Guide d'utilisateur de la Station peut ?tre t?l?charg? sur le site. L'utilisation de la Station est gratuite ? des fins de recherche ou d'enseignement. N'h?sitez pas ? nous faire part de vos remarques et suggestions concernant la plateforme ou son manuel. Bien cordialement Pour l'?quipe du projet Izabella Thomas et Marie-Laure Betbeder ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:19:14 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:19:14 +0200 Subject: These: Marie Dupuch-Behar, Detection de termes semantiquement proches par clustering non supervise Message-ID: Date: Thu, 11 Sep 2014 23:13:53 +0200 From: Marie BEHAR Message-ID: Bonjour, J'ai le plaisir de vous inviter ? ma soutenance de th?se intitul?e : "D?tection de termes s?mantiquement proches. Clustering non supervis? bas? sur les relations s?mantiques et le degr? d?apparent? s?mantique" Elle aura lieu le vendredi 19 septembre 2014 ? 15h, au LIMICS, 15 rue de l??cole de m?decine, Paris 6?me (escalier D, 2?me ?tage) M?tro : Od?on (ligne 4 ou 10) Je vous convie chaleureusement au pot qui suivra et qui se tiendra ?galement au LIMICS. Bien cordialement, Marie Dupuch-Behar ------------------------------------------------ Le jury de soutenance sera compos? de : Rapporteurs : R?gis BEUSCART, PUPH, CERIM, Universit? Lille 2 Mathieu ROCHE, DR, CIRAD, UMR TETIS, Montpellier Examinateur : Jean-Marc LABAT, PU, LIP6, Universit? Paris 6 Fr?d?rique SEGOND, Directrice R&D, VISEO, Grenoble Vincent CLAVEAU, CR, IRISA CNRS, Rennes Directrice : Marie-Christine JAULENT, DR, UMRS 1142 INSERM, Universit? Paris 6 Encadrante : Natalia GRABAR, CR, UMR 8163 CNRS, Universit? Lille 3 ------------------------------------------------ R?sum? : L'utilisation de termes ?quivalents ou s?mantiquement proches est n?cessaire pour augmenter la couverture et la sensibilit? d'une application comme la recherche et l'extraction d'information ou l'annotation s?mantique de documents. Dans le contexte de l'identification d'effets ind?sirables susceptibles d'?tre d?s ? un m?dicament, la sensibilit? est aussi recherch?e afin de d?tecter plus exhaustivement les d?clarations spontan?es et de mieux surveiller le risque m?dicamenteux. C'est la raison qui motive notre travail. Dans notre travail de th?se, nous cherchons ainsi ? d?tecter des termes s?mantiquement proches et ? les regrouper en utilisant plusieurs m?thodes : des algorithmes de clustering non supervis?s, des ressources terminologiques exploit?es avec le raisonnement terminologique et des m?thodes de Traitement Automatique de la Langue, comme la structuration de terminologies, o? nous visons la d?tection de relations hi?rarchiques et synonymiques. Nous avons r?alis? de nombreuses exp?riences et ?valuations des clusters g?n?r?s, qui montrent que les m?thodes propos?es peuvent contribuer efficacement ? la t?che vis?e. Mots-cl?s : Terminologie, distance et similarit? s?mantique, structuration de terminologies, clustering, pharmacovigilance, domaine de sp?cialit?, m?decine, TAL, contexte cross-langue, filtrage, ?valuation. Abstract : The use of equivalent terms or semantically close is necessary to increase the coverage and sensitivity of applications such as information retrieval and extraction or semantic annotation of documents. In the context of the adverse drug reactions identi_cation, sensitivity is also sought to detect more exhaustively spontaneous reports and better monitor drug risk. This is the reason that motivates our work. In our work, we thus seek to detect semantically close terms and the together using several methods : unsupervised clustering algorithms, terminological resources exploited with terminological reasoning and methods of Natural Language Processing, such as terminology structuring, where we aim to detect hierarchical and synonymous relations. We conducted many experiments and evaluations of clusters generated, which show that the proposed methods can e_ciently contribute to the task in question. Key-words : Terminology, semantic distance and similarity, terminology structuring, clustering, pharmacovigilance, speciality area, medicine, NLP, cross-language context, filtering, evaluation. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:39:46 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:39:46 +0200 Subject: Job: Linguiste annotateur, Weborama Message-ID: Date: Fri, 12 Sep 2014 15:56:50 +0200 From: Rachid Ammari Message-ID: ===================== [JOB] Recherche freelance/auto-entrepreneur Linguiste annotateur pour l'anglais, l'italien, le fran?ais, l'espagnol, le russe ou le n?erlandais. ===================== Sujet ===== Validation linguistique de clusters de mots pour une langue donn?e pour l'entreprise Weborama. Description =========== L'objectif est de constituer, valider et affiner des clusters de mots par th?matique. Ces clusters sont utilis?s ? des fins de ciblages comportementaux anonymes. Cet objectif passe par un enrichissement de lexique. L'annotateur sera amen? ? constituer ou modifier des groupes de mots, que nous appelons clusters, par th?mes (sports, cuisine, T?l?phonie etc). Pour cela nous utilisons un lexique interne que nous enrichissons. L'id?e consiste donc ? ajouter des lemmes dans ces clusters th?matiques. Mais pour cela, les lemmes (et les flexions du mot) doivent ?tre pr?sents dans le lexique. Le cluster contient donc que des lemmes. Il faudra souvent ajouter des entit?s nomm?es (des lieux, des marques, des personnalit?s...) au lexique afin de les ajouter aux clusters. Ou ?diter le lexique pour corriger des erreurs ou rediriger des formes fl?chies vers certains lemmes. La mission linguistique est donc simple, la mission est principalement une mission d'annotation. Toutefois il est important d'avoir une base de linguistique pour g?rer un lexique, rep?rer les mots polys?miques et ambigus et pour bien lemmatiser. On demandera aussi une grande autonomie et/ou culture afin d'agr?menter les clusters les plus sp?cialis?s. Par exemple enrichir une th?matique sport si on n'est pas un passionn? de sport n?cessite de faire des recherches. Le tout ?tant destin? ? un pays en particulier on prendra bien soin d'orienter chacun des clusters vers la culture du pays. Comp?tences requises ==================== - Langue maternelle parmi une des langues donn?es : anglais am?ricain, russe, espagnol, italien ou n?erlandais - Connaissance en linguistique (lexicologie, s?mantique) - Autonomie et curiosit? (pour chercher ? ajouter des entr?es concernant des th?matiques tr?s sp?cifiques) Type de contrat =============== En g?n?ral ce sont des missions pay?es ? l'heure. C'est pourquoi le statut d'auto-entrepreneur/freelance est pr?f?r?. Localisation du poste ===================== L'entreprise Weborama est bas?e ? Paris (75019). Toute la mission peut ?tre r?alis? en t?l?travail. Comment postuler ================ Merci de faire parvenir votre candidature ? l'adresse suivante en pr?cisant bien dans le sujet du mail la langue pour laquelle vous postulez : rachid at weborama.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:24:37 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:24:37 +0200 Subject: Appel: JeTou 2015 Message-ID: Date: Fri, 12 Sep 2014 00:37:43 +0200 From: Jean-Philippe Fauconnier Message-ID: <54122437.6090704 at irit.fr> X-url: http://www.jetou2015.fr/index-en.htm ** ENGLISH VERSION BELOW ** ------------------------------------------------------------------------ - Deuxi?me appel ? communications - 5e ?dition des Journ?es d'?tudes Toulousaines (J?Tou 2015) Colloque international des jeunes chercheurs en Sciences du Langage Le(s) Discours en Sciences du Langage : unit?s et niveaux d'analyse ------------------------------------------------------------------------ Date : 28 et 29 mai 2015 Lieu : Toulouse - France Site : www.jetou2015.fr Contact : contact.jetou2015 at gmail.com Date limite de soumission des r?sum?s : 10 octobre 2014 Les doctorants en Sciences du Langage des laboratoires de l'Universit? de Toulouse : - CLLE-ERSS (?quipe de Recherche en Syntaxe et S?mantique) - IRIT (Institut de Recherche en Informatique de Toulouse) - OCTOGONE-Lordat (Centre Interdisciplinaire des Sciences du Langage et de la Cognition) organisent la 5e ?dition des J?Tou (Journ?es d'?tudes Toulousaines). Ces journ?es s'adressent aux ?tudiants en Master, aux doctorants et aux jeunes docteurs (jusqu'? trois ans apr?s la soutenance) en Sciences du Langage. Le terme discours, entendu dans son acception large de production langagi?re multimodale (orale, ?crite, verbale, gestuelle) est au coeur m?me des Sciences du Langage. Qu'elles s'int?ressent ? sa production ou ? sa r?ception, les m?thodes d'investigation ont amen? ? des niveaux d'analyse aux granularit?s variables, o? se superposent des unit?s entretenant des relations d'interd?pendance fortes. Ainsi, le discours est fonction ? la fois de son objet et du sens qui lui est donn?. Les enjeux sont communs : planification, segmentation, organisation, mod?lisation. Ces d?fis s'accompagnent de r?flexions riches sur des terrains diff?rents ; plus que jamais, une pratique interdisciplinaire est essentielle pour progresser dans une compr?hension plus fine des diff?rentes facettes du discours. Les recherches effectu?es dans ce sens ont pu prendre de multiples formes. Ces derni?res ann?es ont par ailleurs vu se r?duire l'?cart entre mod?les th?oriques et ?tudes empiriques men?es sur des donn?es attest?es. Qualitatifs ou quantitatifs, ces travaux soul?vent ? leur tour de nouvelles interrogations : choix des unit?s, recueil et annotation des donn?es, d?marches d'?valuation, comparaison et interpr?tation des r?sultats - pour n'en citer que quelques-unes. Cette ?dition sera consacr?e aux niveaux d'analyse et aux unit?s dans le discours. Les communications pourront notamment porter sur les domaines suivants : * Phon?tique et phonologie : disponibilit? et authenticit? des corpus oraux, sp?cificit?s phon?tiques et phonologiques du discours (monolingue ou bilingue) en production et en perception. * Syntaxe, s?mantique et pragmatique : macrosyntaxe, s?mantique dynamique, argumentation, actes de langage, cadres organisationnels, coh?sion, coh?rence. * Terminologie et linguistique textuelle : genres des discours, variations, constitutions de corpus, r?seaux termino-ontologiques. * Sociolinguistique : diversit? des genres, code-switching, code-mixing, variations dialectales. * Psycholinguistique et neurolinguistique : discours pathologiques, discours bilingues, planification, organisation, traitement, d?veloppement et vieillissement cognitifs. * Acquisition et apprentissage des langues : apports r?ciproques entre l'?tude du discours et la didactique en langue premi?re ou seconde, interf?rences. * Traitement automatique des langues : parsing rh?torique, reconnaissance et synth?se de la parole, extraction d'information, importance du discours dans les traitements locaux (?tiquetage morpho- syntaxique, reconnaissance d'entit?s nomm?es). Toute soumission en lien avec le discours et les sciences du langage sera examin?e avec la plus grande attention. Les propositions articulant r?flexions th?oriques et donn?es attest?es seront particuli?rement appr?ci?es. Ces J?Tou 2015 proposent ainsi une th?matique stimulante et ouverte que chaque courant des Sciences du Langage pourra s'approprier ? sa mani?re. Ces journ?es seront alors l'occasion pour tous ceux qui le souhaitent de s'interroger, de d?battre, et de confronter leurs travaux et leurs r?flexions dans un cadre transdisciplinaire propice ? des ?changes constructifs. Conf?renciers invit?s --------------------- * Anne-Catherine Simon, Valibel, Universit? catholique de Louvain (Louvain-la-Neuve, Belgique) * Nicholas Asher, IRIT, Universit? Paul Sabatier (Toulouse, France) Modalit?s de soumission ------------------------- Les propositions de communication (r?sum? de trois pages au maximum, r?f?rences incluses, format libre) seront r?dig?es, au choix, en fran?ais ou en anglais et comprendront n?cessairement un titre et cinq mots-cl?s au maximum. Elles doivent ?tre soumises en ligne, via la plate-forme EasyChair : https://www.easychair.org/conferences/?conf=jtou2015 Le retour du comit? d'?valuation pr?cisera si la proposition est retenue pour une communication orale (20 min + 10 min d'?change) ou pour une session posters. S'ils le souhaitent, les auteurs sont invit?s ? pr?ciser (? titre indicatif) leur pr?f?rence pour l'un des deux formats. Les communications donneront lieu ? une publication dans les actes du colloque (5 pages au maximum pour les posters et 10 pages au maximum pour les articles). Crit?res d'acceptation ---------------------- Chaque soumission sera examin?e par au moins deux sp?cialistes du domaine. Seront consid?r?es en particulier : * l'importance et l'originalit? de la contribution ; * la correction du contenu scientifique ; * la discussion critique des r?sultats, en particulier par rapport aux travaux existants dans le domaine ; * l'organisation et la clart? de la r?daction ; * l'ad?quation au th?me de la conf?rence. Calendrier ----------- Date limite de soumission : 10 octobre 2014 Notification d'acceptation : 21 novembre 2014 Remise des articles pour relecture : 16 janvier 2015 Date limite pour l'envoi des versions d?finitives : 10 avril 2015 Colloque J?Tou : jeudi 28 et vendredi 29 mai 2015 ? l'Universit? Toulouse - Jean Jaur?s (campus du Mirail) Comit? d'organisation ---------------------- Francesca Cortelazzo Jean-Philippe Fauconnier Laury Garnier Luce Lefeuvre Sophie Mayras-Cauchois Olivier Nocaudie Florian Savreux Maxime Warnier Comit? scientifique ------------------- Corine Ast?sano Michel Aurnague Myriam Bras Joan Busquets Mariella Causa Anne Condamines Karine Duvignau C?cile Fabre Fran?oise Gadet Claudine Garcia-Debanc H?l?ne Giraudo Nabil Hathout Lydia-Mai Ho-Dac Marie-Paule Jacques Barbara K?pke Michelle Lecolle Vanda Marijanovic R?gis Missire Fabio Montermini Dani?le Moore Steven Moore V?ronique Moriceau Philippe Muller Jean-Luc Nespoulous Musanji Ngalasso-Mwatha Aur?lie Picton Laurent Pr?vot Josette Rebeyrolle Nathalie Rossi-Gensane Halima Sahraoui Patrick Sauzet Catherine Schnedecker Dejan Stosic Ludovic Tanguy Jean-Michel Tarrier Olga Th?ophanous Pascale Vergely ------------------------------------------------------------------------ - Second call for papers - J?Tou - 5th Edition International Conference for Young Researchers in Linguistics Discourse(s) in Linguistics: Units and Levels of Analysis ------------------------------------------------------------------------ Date: May 28th and 29th 2015 Place: Toulouse - France Web Site: http://www.jetou2015.fr/index-en.htm Contact email: contact.jetou2015 at gmail.com Submission deadline for abstracts: October 10th 2014 The doctoral students in Linguistics of the laboratories at Toulouse University, France: - CLLE-ERSS (?quipe de Recherche en Syntaxe et S?mantique) - IRIT (Institut de Recherche en Informatique de Toulouse) - OCTOGONE-Lordat (Centre Interdisciplinaire des Sciences du Langage et de la Cognition) are organizing the 5th edition of J?Tou (Journ?es d'?tudes Toulousaines), an international conference aiming at gathering Master and doctoral students and young researchers (who have defended their dissertation within the past three years) together, from the different disciplines of Linguistics, on an open and multidisciplinary theme. This 2015 edition will be devoted to a reflection on the following theme: "Discourse(s) in Linguistics: Units and Levels of Analysis". The term discourse, understood in its broadest sense as a multimodal language production (oral, written, verbal, gestural) is at the heart of Linguistics. Both in production and reception, investigation methods have led to analysis levels with variable granularities, where overlapping units maintain relationships with strong interdependence. Therefore, discourse depends on both the object and the meaning given to it. Common issues are: planning, segmentation, organization, modeling. A valuable reflection involving different fields arises from these challenges; more than ever, an interdisciplinary practice is necessary to further the various aspects of discourse. Research in these fields has taken different forms. Besides, the gap between theoretical models and empirical studies based on real data has been significantly reduced in the last few years. Qualitative as well as quantitative, these works have raised new questions: choice of units, collection and annotation of corpora, evaluation procedures, comparison and interpretation of results, etc. This edition will focus mainly on levels of analysis and units in discourse. Possible topics include: * Phonetics and Phonology: availability and authenticity of oral corpora, phonetic and phonological features of discourse (monolingual or bilingual) in perception and production. * Syntax, Semantics and Pragmatics: macrosyntax, dynamic semantics, argumentation, speech acts, organizational frameworks, cohesion, coherence. * Terminology and Text Linguistics: genres of discourse, variations, corpus construction, termino-ontological networks. * Sociolinguistics : genre diversity, code-switching, code-mixing, dialectal variations. * Psycholinguistics and Neurolinguistics: pathological speech, bilingual speech, planning, organizing, processing, development and cognitive aging. * Acquisition and Learning of Languages: mutual contributions between the study of discourse and learning L1 and L2, interference. * Natural Language Processing: parsing rhetoric, synthesis and speech recognition, information extraction, importance of discourse in local use (morpho-syntactic tagging, named entity recognition). Obviously, this list does not include all the research possibilities following from the theme of the conference, which is why every submission that addresses the notions of discourse in the Language Sciences will be read and reviewed. Proposals which include theoretical reflections and actual data will be particularly appreciated. J?Tou 2015 offers a challenging theme that every field of Language Sciences can adapt for themselves. This conference will give the opportunity, to those who wish to come, to ask questions, discuss and compare their work, their methods, their reflections in an interdisciplinary context, which favours positive interactions and constructive debates. Invited talks ------------ * Nicholas Asher, IRIT, Universit? Paul Sabatier (Toulouse, France) * Anne-Catherine Simon, Valibel, Universit? catholique de Louvain (Louvain-la-Neuve, Belgium) Submission Guidelines ----------------------- Submissions must not exceed 3 pages for an oral presentation as well as for a scientific poster. These three pages must include a title, a summary and up to 5 keywords. You can indicate by email your preference for an oral presentation (20 min + 10 min for questions) or for a scientific poster, but the final decision on the format of the presentation will be made by the organization committee alone. Papers should be submitted via the EasyChair conference system: https://www.easychair.org/conferences/?conf=jtou2015 The conference proceedings will be published and given to the participants (5 pages for a scientific poster and 10 pages for an oral presentation). Selection Criteria ------------------ Each submission will be reviewed by at least two experts in the relevant field. The following elements will be considered: * The importance and originality of the contribution. * The validity of the scientific and technical content. * The critical discussion of the results, especially when compared to existing work in the field. * The adequacy with the conference themes. * The organization and clarity of writing. Important dates ---------------- Deadline for abstracts: October 10, 2014 Notification of acceptance: November 21, 2014 Deadline for long papers: January 16, 2015 Deadline for camera-ready: Avril 10, 2015 Conference: Thursday May 28th and Friday May 29th 2015 at Universit? Toulouse - Jean Jaur?s (Mirail campus) Organizing Committee ---------------------- Francesca Cortelazzo Jean-Philippe Fauconnier Laury Garnier Luce Lefeuvre Sophie Mayras-Cauchois Olivier Nocaudie Florian Savreux Maxime Warnier. Scientific Committee --------------------- Corine Ast?sano Michel Aurnague Myriam Bras Joan Busquets Mariella Causa Anne Condamines Karine Duvignau C?cile Fabre Fran?oise Gadet Claudine Garcia-Debanc H?l?ne Giraudo Nabil Hathout Lydia-Mai Ho-Dac Marie-Paule Jacques Barbara K?pke Michelle Lecolle Vanda Marijanovic R?gis Missire Fabio Montermini Dani?le Moore Steven Moore V?ronique Moriceau Philippe Muller Jean-Luc Nespoulous Musanji Ngalasso-Mwatha Aur?lie Picton Laurent Pr?vot Josette Rebeyrolle Nathalie Rossi-Gensane Halima Sahraoui Patrick Sauzet Catherine Schnedecker Dejan Stosic Ludovic Tanguy Jean-Michel Tarrier Olga Th?ophanous Pascale Vergely ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 12 20:08:20 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 12 Sep 2014 22:08:20 +0200 Subject: Job: PostDoc Position in Personalised Information Retrieval and Knowledge Discovery, Trinity College, Dublin Message-ID: Date: Thu, 11 Sep 2014 15:43:24 +0100 From: S?amus Lawless Message-Id: X-url: https://www.scss.tcd.ie/seamus.lawless/PD-SD.pdf Fixed term contract up to 31 August, 2015 CNGL Centre for Global Intelligent Content, Knowledge & Data Engineering Group (KDEG), School of Computer Science & Statistics (SCSS) Salary: Appointment will be made on the SFI Level 2B Post-Doctoral Researcher Salary Scale (?42,394 to ?46,255) Closing Date and Time: 12 noon on Tuesday 30 September, 2014 A full job spec and application procedure can be found at - https://www.scss.tcd.ie/seamus.lawless/PD-SD.pdf Post Summary CNGL is seeking a Post-Doctoral Researcher to further research within the areas of: Personalised Information Retrieval, Explorative Knowledge Discovery, Web Search, and Result Diversification. This is part of the collaborative research taking place under the Search and Discovery theme within CNGL. Background and Funding The CNGL Centre for Global Intelligent Content is a ?50M Academia-Industry partnership, funded jointly by Science Foundation Ireland (SFI) and Industry. CNGL has entered a second cycle of funding and is now seeking researchers to join the team at Trinity College Dublin. CNGL is an active collaboration between researchers at Trinity College Dublin (TCD), Dublin City University (DCU), University College Dublin (UCD), University of Limerick (UL), as well as several industrial partners, including Microsoft, Symantec, Intel, DNP, Welocalize, and a number of SMEs. CNGL comprises over 100 researchers across the various institutions developing novel technologies addressing key challenges in the global digital content and services supply chain. CNGL is also involved in a large number of European FP7 projects, as well as commercial projects in the areas of language technologies, information retrieval and digital content management. Standard Duties and Responsibilities Contribute to high quality collaborative research, and publish the work in top international journals and conferences. Pro-actively work with other researchers in coordinating collaboration across research themes, across research challenge groups and across member institutions to successfully deliver research prototype systems (as part of CNGL?s Showcase Scenario Programme). Assist the Operations team in the planning and organisation of demonstration of collaborative research outcomes at public events. Track, monitor and report on progress and performance. Provide regular updates on progress to relevant stakeholders, alerting them to emerging issues or timeline slippage in a timely fashion. Mitigate risk and take corrective action as required. Liaise closely with CNGL?s Intellectual Property Manager and Commercialisation Manager in assessing research outputs for IP protection and commercial potential. Candidate Specification Qualifications PhD in a relevant field (e.g. Information Retrieval, Cross-Language Information Retrieval, Personalisation, Adaptive Hypermedia, etc.). Knowledge and Experience Background in one or more of CNGL?s research areas (e.g. Search Systems, Personalisation and Adaptivity, Digital Content Management, Natural Language Processing, Machine Translation and Localisation, Multilingual Information Retrieval, etc.). A good publications record in reputable international journals/conferences/workshops. Hands-on experience with developing software components. Experience with research project management within an academic research environment is a plus. Industry experience is a plus and would provide a distinct advantage for the applicant. Skills and Competencies Competency in programming, web development, and databases (desirable: Java, HTML, CSS, Javascript, XML, advanced web development frameworks, any RDBMS tool). Mobile application development is a plus. Strong interest in applied research and in the application of research outcomes to solve societal and industry problems. Excellent communication skills, both written and oral. Excellent academic writing skills (clear, concise and error-free writing; free of grammatical and punctuation errors). Excellent interpersonal skills and an ability to build and nurture work relationships. Strong problem solving and analytical skills and an ability to learn quickly. A strategic thinker that doesn?t lose sight of overall research goals and priorities. A pro-active self-starter with the ability to encourage and stimulate cross-group collaboration. Ability to work effectively cross-organisationally and cross culturally. Ability to operate effectively as part of a team ? tolerant, cordial and willing to help others, shares work and information; establishes rapport with others. Ability to handle multiple tasks simultaneously and meet all deadlines. Many thanks, Prof. S?amus Lawless ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 08:51:31 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 10:51:31 +0200 Subject: Seminaire: Seminaire en l'honneur de Hans Kamp, 8 octobre 2014, Nancy Message-ID: Date: Mon, 15 Sep 2014 11:24:24 +0200 From: Maxime Amblard Message-Id: <74C5F283-D666-464D-808B-4E2CA38D41CD at loria.fr> X-url: http://hk-workshop.loria.fr [Excusez les envois multiples] [English version below] Merci de faire suivre aux coll?gues et ?tudiants int?ress?s. ************************************ Appel ? participation ************************************ S?minaire en l'honneur de HANS KAMP Mercredi 8 octobre 2014 salle internationale MSH-Lorraine http://hk-workshop.loria.fr ************************************ Un s?minaire en l'honneur de Hans KAMP se tiendra ? Nancy ? l'occasion de la remise du titre de Doctor Honoris Causa de l'Universit? de Lorraine. Hans Kamp (Johan Anthony Willem Kamp) est un philosophe, linguiste, et logicien n?erlandais. Ses travaux en s?mantique formelle et plus particuli?rement sa th?orie des repr?sentations discursives (Discourse Representation Theory) sont largement utilis?s tant en linguistique qu'en informatique dans le cadre du traitement automatique de la langue. Le s?minaire portera sur la s?mantique du discours, en particulier sur les questions de structure et de dynamique, ? partir de la DRT. Le s?minaire se tiendra en salle internationale de la MSH-Lorraine. Les pr?sentations seront faites en anglais. Le s?minaire est organis? par les Archives Poincar?, le LORIA et l'ATILF et il est soutenu par la MSH-Lorraine, l'Universit? de Lorraine, le CNRS et l'INRIA. La participation est libre mais l'inscription est obligatoire. Le programme et les inscriptions sont accessibles en ligne : http://hk-workshop.loria.fr ************************************ Conf?renciers invit?s : + Nicholas ASHER, Universit? Paul Sabatier, France + Paul DEKKER, Universit? d'Amsterdam, Pays-Bas + Bart GEURTS, Universit? de Nijmegen, Pays-Bas + Ir?ne HEIM, Massachusetts Institute of Technology, ?tats-Unis + Klaus von HEUSINGER, Universit? de Cologne, Allemagne + Hans KAMP, Universit? de Stuttgart, Allemagne ************************************ Le S?minaire est organis? par : + Maxime AMBLARD (Loria, Inria, CNRS, Universit? de Lorraine) + Philippe de GROOTE (Inria) + Michel MUSIOL (ATILF, UFR SHS Nancy, CNRS, Universit? de Lorraine) + Manuel REBUSCHI (LHSP-Archives Poincar?, CNRS, Universit? de Lorraine) Avec le soutien de: CNRS, Universit? de Lorraine, INRIA, MSH Lorraine, LORIA, LHSP? Archives Henri-Poincar?, ATILF, UFR-SHS (Nancy) ------------------------------------------------------------------------ [Apologies for cross-postings] [French version above] Please send it to interested colleagues and students. Thanks! ************************************ Call for participation ************************************ Workshop in honor of HANS KAMP Wednesday, October 8, 2014 International Room, MSH-Lorraine http://hk-workshop.loria.fr ************************************ A workshop in honor of Hans KAMP will be held on the occasion of the award of a Doctor Honoris Causa degree from the University of Lorraine. Hans Kamp (Johan Anthony Willem Kamp) is a Dutch philosopher, linguist and logician. His work in formal semantics, most notably his Discourse Representation Theory, is widely used both in linguistics and in natural language processing. The workshop will focus on discourse semantics, especially on issues of its structure and dynamics, based on DRT. The workshop will be held in the International Room of the MSH-Lorraine. Talks will be in English. The workshop is organised by Archives Poincar?, LORIA and ATILF, and it is supported by MSH-Lorraine, Universit? de Lorraine, CNRS and INRIA. There is no fees, but you need to be registered. Program and registration are available here: http://hk-workshop.loria.fr ************************************ Invited speakers: + Nicholas ASHER, Universit? Paul Sabatier, France + Paul DEKKER, Universiteit van Amsterdam, the Netherlands + Bart GEURTS, Universiteit van Nijmegen, the Netherlands + Ir?ne HEIM, Massachusetts Institute of Technology, USA + Klaus von HEUSINGER, Universit?t zu K?ln, Germany + Hans KAMP, Universit?t zu Stuttgart, Germany ************************************ Organisation commitee: + Maxime AMBLARD (Loria, Inria, CNRS, Universit? de Lorraine) + Philippe de GROOTE (Inria) + Michel MUSIOL (ATILF, UFR SHS Nancy, CNRS, Universit? de Lorraine) + Manuel REBUSCHI (LHSP-Archives Poincar?, CNRS, Universit? de Lorraine) Supported by: CNRS, Universit? de Lorraine, INRIA, MSH Lorraine, LORIA, LHSP? Archives Henri-Poincar?, ATILF, UFR-SHS (Nancy) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 08:49:51 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 10:49:51 +0200 Subject: Appel: IWSDS 2015 Message-ID: Date: Mon, 15 Sep 2014 11:13:49 +0200 From: pap Message-ID: <5416ADCD.2010100 at limsi.fr> X-url: http://www.iwsds.org/ IWSDS 2015 http://www.iwsds.org/ Call For Papers The Sixth International Workshop on Spoken Dialog System (IWSDS 2015) will be held in Busan, South Korea, on Jan 11-13, 2015. The IWSDS workshop series provides an international forum for the presentation of research and applications and for lively discussions among researchers as well as industrialists, with a special interest to the practical implementation of Spoken Dialog Systems in everyday applications. IWSDS 2015 designates ?Dialog System and Intelligent Assistant? as a theme of discussion. Topics Submission of papers in all areas of spoken dialog system is encouraged, with emphasis on the following traditional topics, but not limited to: - Speech recognition and synthesis - Speaker/language recognition - Spoken language understanding - Dialog management - User modeling / simulation - Evaluation of dialog system - Multi-modality / emotion recognition from speech - Question answering from speech - Speech data mining - Language resource and databases - Machine learning for spoken dialog systems - Educational and healthcare applications We would also like to encourage the discussion of the following special topics: - Personal assistant with dialog systems - Proactive and anticipatory computing - Dialog systems connected to knowledge base - Big data for large scale spoken dialog system Important Dates Paper Submission: September 21, 2014 Notification of Acceptance: October 27, 2014 Demo Submission/Acceptance: TBD Submission Procedure Authors are invited to submit full-length, 8-12 page papers (long) or 4-6 page papers (short), including references, to the IWSDS 2015 web site (http:// www.iwsds.org/). As usual, proceedings are to be published by Springer post conference book. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 12:26:21 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 14:26:21 +0200 Subject: Job: Post-doctoral position in NLP, Strasbourg, France Message-ID: Date: Wed, 17 Sep 2014 08:15:08 +0200 From: Delphine Bernhard Message-ID: <541926EC.9080801 at unistra.fr> X-url: http://icube-bfo.unistra.fr/en/index.php/Open_internship,_PhD_and_post-doc_positions The BFO team of ICube proposes a post-doctoral position in Strasbourg (France) for 12 months starting in January 2015 within the NERD (Named Entities in Relational Databases) research project. The goal of the project is to derive knowledge from unstructured and, more importantly, unlabelled data in relational databases. Databases often contain fragmented information such as addresses, descriptions, colours, labels, telephone numbers, etc. As such, they contain information that is not accompanied by the additional context that would be present within a natural language document and would be exploited by current state-of-the-art algorithms (for example the contextual information that would be derived from a sentence's structure or surrounding words). Of course, databases may also contain natural language documents, but this is the exception (in commercial databases) rather than the norm. Nevertheless, the developed algorithms should be applicable to the spectrum of documents that range between sparse (traditional business) databases and dense (natural language) databases. Experiments on real world databases is expected and access to an extensive corpus of data will be provided. The partners of the project are: The BFO group of ICube, specialized in data mining and knowledge engineering The FDT group of LiLPa, specialized in natural language processing The Quantup Laboratory, experienced in the application of machine learning/pattern recognition methods to commercial database systems Candidates applying for this position should have a PhD in Computer Science with a good background in Natural Language Processing, Machine Learning and formal Knowledge Representation. Experience in Java programming and distributed systems (for example using the Map-Reduce framework and/or Spark) is desired. A good knowledge of English is required along with an intermediate level of French. Candidates should send an academic curriculum vitae (including a list of publications and the names and contact details of two referees), along with a cover letter. Deadline for application: 31st October 2014 Expected starting date: January 2015 (flexible) Contact: Delphine Bernhard (dbernhard at unistra.fr) and Tom Lampert (t.lampert at laboquantup.eu) Salary: 2200 ? per month (net, not including income tax). Call for applications: http://icube-bfo.unistra.fr/en/index.php/Open_internship,_PhD_and_post-doc_positions ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 13:24:00 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 15:24:00 +0200 Subject: Seminaire: Inria, Big Data, nouvelles partitions de l=?UTF-8?Q?=E2=80=99information=2C_?=5 au 10 octobre 2014, Saint-Paul-Les-Dax (Landes) Message-ID: Date: Wed, 17 Sep 2014 12:34:09 +0200 (CEST) From: Pascale Sebillot Message-ID: <1509243104.6635096.1410950049068.JavaMail.zimbra at irisa.fr> X-url: http://www.inria.fr/actualite/agenda/big-data-nouvelles-partitions-de-l-information S?minaire Inria : "Big Data, nouvelles partitions de l?information" Actualit?s IST May 18, 2014 "Big Data, nouvelles partitions de l?information " tel est le th?me du s?minaire IST Inria, qui aura lieu du 5 au 10 octobre 2014. Le th?me du "Big Data" est souvent trait? ces temps-ci, mais rarement du point de vue des professionnels de l?information et de la documentation : c?est cette lacune que le s?minaire 2014 va tenter de combler. Avec les interventions de : * Charles Huot (Temis, Alliance Big Data) : Le Big Data, si nous en parlions ? Les mod?les techniques et ?conomiques d?j? en place et en ?uvre. Pour d?couvrir la d?marche ? suivre pour monter un projet Big Data au sein de votre organisation. * Julien Masan?s (Internet Memory Foundation) : La magie des s?ries et des grands nombres : ce que l?on peut faire avec le Big Data et les archives * Pascale S?billot (IRISA / INSA Rennes) : Le TAL face aux donn?es textuelles volumineuses et potentiellement d?grad?es : qu?est-ce que cela change? * Jean Carrive (Ina) : Analyse automatique de l?image et du son pour l?enrichissement de contenus audiovisuels * Francis Andr? (Cnrs) : D?luge des donn?es de la recherche ? Petit manuel d?immersion. Curation, infrastructures et partage. * V?ronique Mesguich, co-pr?sidente de l?ADBS : Extension du domaine de la veille : l?apport des donn?es massives * St?phane Grumbach (Inria) : Des donn?es ? l?interm?diation, une ?volution ?conomique et politique * Dominique Cardon (SENSE/Orange et universit? de Marne la Vall?e / LATTS) : Calculer le web : 1. Typologie des m?triques du web ; 2. Les sciences sociales et les donn?es num?riques D?tails et inscriptions http://www.inria.fr/actualite/agenda/big-data-nouvelles-partitions-de-l-information ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 08:53:20 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 10:53:20 +0200 Subject: Journee: Promotion et Developpement de l'Intelligence Artificielle, Univ. Paris Dauphine, Paris, 2 octobre 2014 Message-ID: Date: Mon, 15 Sep 2014 13:58:19 +0200 From: Secretaire AFIA Message-Id: <481653D4-602E-47AD-8D50-069E1DD21E95 at afia.asso.fr> X-url: http://www.afia.asso.fr/tiki-index.php?page=Journ%C3%A9e+pour+la+Promotion+et+le+D%C3%A9veloppement+de+l%E2%80%99Intelligence+Artificielle+-+2+octobre+2014 --- Merci de relayer ce message aupr?s des personnes int?ress?es --- Le 2 octobre 2014, l'Association Fran?aise pour l'Intelligence Artificielle organise une journ?e d'interventions pour la promotion et le d?veloppement de l' Intelligence Artificielle. Cette journ?e est plac?e sous le Haut Patronage du MESR DGRI, du CNRS INS2I et d?Inria. Programme de la journ?e : 09:00 - Accueil des participants 09:30 - 10:00 Ouverture (par les repr?sentants de l'AFIA, du MESR DGRI, du CNRS INS2I et d'Inria) 10:00 - 10:45 Andreas Herzig (IRIT, CNRS) - Quelles logiques pour les syst?mes multi-agents ? 11:00 - 11:45 Fran?ois Pachet (Sony CSL, Sony) - Cr?ativit? et style : de nouveaux probl?mes pour l'IA 11:45 - 12:30 H?l?ne Fargier (IRIT, CNRS) - Probl?mes combinatoires de d?cision sous incertitude 12:30 - 14:00 BUFFET 14:00 - 14:45 J?r?me Euzenat (LIG, Inria) - Repr?senter, communiquer, ?chouer 14:45 - 15:30 Leila Amgoud (IRIT, CNRS) - La th?orie computationnelle de l'argumentation Date : 2 Octobre 2014, 9h00-16h00. Lieu : Salle A709, (7?me ?tage de la nouvelle aile) Universit? Paris-Dauphinen Place du Mar?chal de Lattre de Tassigny 75775 PARIS Cedex 16 Inscription : L?acc?s ? la journ?e PDIA 2014 sera limit? aux seules personnes qui se seront inscrites sur le site des inscriptions avant le 29 septembre 2014. Merci de confirmer votre pr?sence en vous rendant sur ce site : http://inscriptions.afia.asso.fr Plus d'information : http://www.afia.asso.fr/tiki-index.php?page=Journ%C3%A9e+pour+la+Promotion+et+le+D%C3%A9veloppement+de+l%E2%80%99Intelligence+Artificielle+-+2+octobre+2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 13:25:25 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 15:25:25 +0200 Subject: Conf: 3emes journees Unitex/Gramlab, 3rd UNITEX/GramLab Workshop, 9-10 octobre 2014, Universite Francois Rabelais, Tours Message-ID: Date: Wed, 17 Sep 2014 12:56:41 +0200 (CEST) From: Denis Maurel Message-ID: <449956801.2591297.1410951401174.JavaMail.zimbra at univ-tours.fr> X-url: http://tln.li.univ-tours.fr/Tln_Colloques/Tln_JUnitex2014/Tln_JUnitex2014.html X-url: http://tln.li.univ-tours.fr/Tln_Colloques/Tln_JUnitex2014/Tln_JUnitex2014_eng.html English below. 3?mes journ?es Unitex/Gramlab 9-10 octobre 2014, Universit? Fran?ois Rabelais Tours Programme et inscription sur http://tln.li.univ-tours.fr/Tln_Colloques/Tln_JUnitex2014/Tln_JUnitex2014.html Unitex est une plate-forme open-source d?analyse de texte largement utilis?e en recherche, dans l?enseignement et l?industrie. Le syst?me GramLab/Unitex offre en plus aux ?quipes le travail collaboratif (partage de ressources, suivi de versions, etc.). Ces outils reposent sur des technologies de type ? automates ? ?tats finis ? et incorporent des ressources linguistiques ? large couverture, disponibles dans de nombreuses langues. Les journ?es Unitex/GramLab sont un forum qui a pour ambition de rassembler la communaut? des chercheurs et industriels utilisant Unitex et GramLab pour leurs travaux (tous domaines confondus) ou participant au d?veloppement de cette plate-forme et de ses ressources. L?objectif principal de cet ?v?nement est de favoriser le partage d?exp?rience et les contacts entre utilisateurs et d?veloppeurs. Le programme pr?sentera un ?ventail des recherches en cours et offrira une s?rie de formations pratiques de diff?rents niveaux aux chercheurs qui souhaitent utiliser ce syst?me ou d?couvrir de nouvelles fonctionnalit?s. Inscriptions : - Avant le 30 septembre : 25 euros/jours - Apr?s le 30 septembre : 35 euros /jours Comit? de lecture Antonio Balvet, STL, Universit? de Lille 3 Matthieu Constant, IGM, Universit? de Marne-la-Vall?e Anne Dister, Universit? Saint-Louis - Bruxelles C?drick Fairon, CENTAL, Universit? catholique de Louvain Nathalie Friburger, LI, Universit? Fran?ois Rabelais Tours Cvetana Krstev, Universit? de Belgrade Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e ?ric Laporte, IGM, Universit? de Marne-la-Vall?e Denis Maurel, LI, Universit? Fran?ois Rabelais Tours Thierry Poibeau, LaTTice, CNRS Du?ko Vitas, Universit? de Belgrade Gilles Vollant, Ergonotics Comit? d?organisation Nathalie Friburger, Universit? Fran?ois Rabelais Tours Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e Claude Martineau, LIGM, Universit? Paris-Est Marne-la-Vall?e Denis Maurel, Universit? Fran?ois Rabelais Tours Agata Savary, LI, Universit? Fran?ois Rabelais Tours Comit? de pilotage C?drick Fairon, CENTAL, Universit? catholique de Louvain Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e ?ric Laporte, IGM, Universit? de Marne-la-Vall?e Denis Maurel, Universit? Fran?ois Rabelais Tours Gaelle Recource, Kwaga Du?ko Vitas, Universit? de Belgrade ------------------------------------------------------------------------ 3 rd UNITEX/GramLab Workshop October 9-10, 2014, Universit? Fran?ois Rabelais Tours Program and registration http://tln.li.univ-tours.fr/Tln_Colloques/Tln_JUnitex2014/Tln_JUnitex2014_eng.html Unitex is an open-source text analysis software widely used in research, teaching and industry (http://www-igm.univ-mlv.fr/~unitex/). It relies on Finite State technologies and incorporates large-scale language resources for several languages. GramLab is an Integrated Development Environment (IDE), based on Unitex software components but specifically designed for industrial purposes. It integrates tools that help collaborative development, versioning, etc. The Unitex/GramLab Workshop aims at gathering academic and industrial users, developers and researchers contributing to the development of this open-source software and its resources or using them for developing new research or industrial applications. It is also a unique opportunity for new users to learn the basic and advanced Unitex techniques and discuss their projects with experts during hands-on sessions. Registration - Until September 30, 2013: 25 euros/day - After September 30, 2013: 35 euros/day Scientific Committee Antonio Balvet, STL, Universit? de Lille 3 Matthieu Constant, IGM, Universit? de Marne-la-Vall?e Anne Dister, Universit? Saint-Louis - Bruxelles C?drick Fairon, CENTAL, Universit? catholique de Louvain Nathalie Friburger, LI, Universit? Fran?ois Rabelais Tours Cvetana Krstev, Universit? de Belgrade Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e ?ric Laporte, IGM, Universit? de Marne-la-Vall?e Denis Maurel, LI, Universit? Fran?ois Rabelais Tours Thierry Poibeau, LaTTice, CNRS Du?ko Vitas, Universit? de Belgrade Gilles Vollant, Ergonotics Organizing Committee Nathalie Friburger, Universit? Fran?ois Rabelais Tours Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e Claude Martineau, LIGM, Universit? Paris-Est Marne-la-Vall?e Denis Maurel, Universit? Fran?ois Rabelais Tours Agata Savary, LI, Universit? Fran?ois Rabelais Tours Steering Committee C?drick Fairon, CENTAL, Universit? catholique de Louvain Tita Kyriacopoulou, IGM, Universit? de Marne-la-Vall?e ?ric Laporte, IGM, Universit? de Marne-la-Vall?e Denis Maurel, Universit? Fran?ois Rabelais Tours Gaelle Recource, Kwaga Du?ko Vitas, Universit? de Belgrade ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Wed Sep 17 08:46:35 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Wed, 17 Sep 2014 10:46:35 +0200 Subject: Appel: LATA 2015 Message-ID: Date: Sun, 14 Sep 2014 13:07:39 +0200 From: "GRLMC" Message-ID: <0ACA8161C59F42F2A4910C5720612170 at Carlos1> X-url: http://grammars.grlmc.com/lata2015/ ************************************************************************ 9th INTERNATIONAL CONFERENCE ON LANGUAGE AND AUTOMATA THEORY AND APPLICATIONS LATA 2015 Nice, France March 2-6, 2015 Organized by: CNRS, I3S, UMR 7271 Nice Sophia Antipolis University Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/lata2015/ ************************************************************************ AIMS: LATA is a conference series on theoretical computer science and its applications. Following the tradition of the diverse PhD training events in the field developed at Rovira i Virgili University in Tarragona since 2002, LATA 2015 will reserve significant room for young scholars at the beginning of their career. It will aim at attracting contributions from classical theory fields as well as application areas. VENUE: LATA 2015 will take place in Nice, the second largest French city on the Mediterranean coast. The venue will be the University Castle at Parc Valrose. SCOPE: Topics of either theoretical or applied interest include, but are not limited to: algebraic language theory algorithms for semi-structured data mining algorithms on automata and words automata and logic automata for system analysis and programme verification automata networks automata, concurrency and Petri nets automatic structures cellular automata codes combinatorics on words computational complexity data and image compression descriptional complexity digital libraries and document engineering foundations of finite state technology foundations of XML fuzzy and rough languages grammars (Chomsky hierarchy, contextual, unification, categorial, etc.) grammatical inference and algorithmic learning graphs and graph transformation language varieties and semigroups language-based cryptography parallel and regulated rewriting parsing patterns power series string and combinatorial issues in bioinformatics string processing algorithms symbolic dynamics term rewriting transducers trees, tree languages and tree automata unconventional models of computation weighted automata STRUCTURE: LATA 2015 will consist of: invited talks peer-reviewed contributions INVITED SPEAKERS: Paola Inverardi (L?Aquila), Synthesis of Protocol Adapters Johann A. Makowsky (Technion, Haifa), Hankel Matrices for Graph Parameters and Graph Grammars Giancarlo Mauri (Milano Bicocca), Complexity Classes for Membrane Systems Andreas Podelski (Freiburg), Automated Program Verification Antonio Restivo (Palermo), The Shuffle Product: New Research Directions PROGRAMME COMMITTEE: Andrew Adamatzky (West of England, Bristol, UK) Andris Ambainis (Latvia, Riga, LV) Franz Baader (Dresden Tech, DE) Rajesh Bhatt (Massachusetts, Amherst, US) Jos?-Manuel Colom (Zaragoza, ES) Bruno Courcelle (Bordeaux, FR) Erzs?bet Csuhaj-Varj? (E?tv?s Lor?nd, Budapest, HU) Aldo de Luca (Naples Federico II, IT) Susanna Donatelli (Turin, IT) Paola Flocchini (Ottawa, CA) Enrico Formenti (Nice, FR) Tero Harju (Turku, FI) Monika Heiner (Brandenburg Tech, Cottbus, DE) Yiguang Hong (Chinese Academy, Beijing, CN) Kazuo Iwama (Kyoto, JP) Sanjay Jain (National Singapore, SG) Maciej Koutny (Newcastle, UK) Anton?n Ku?era (Masaryk, Brno, CZ) Thierry Lecroq (Rouen, FR) Salvador Lucas (Valencia Tech, ES) Veli M?kinen (Helsinki, FI) Carlos Mart?n-Vide (Rovira i Virgili, Tarragona, ES, chair) Filippo Mignosi (L?Aquila, IT) Victor Mitrana (Madrid Tech, ES) Ilan Newman (Haifa, IL) Joachim Niehren (INRIA, Lille, FR) Enno Ohlebusch (Ulm, DE) Arlindo Oliveira (Lisbon, PT) Jo?l Ouaknine (Oxford, UK) Wojciech Penczek (Polish Academy, Warsaw, PL) Dominique Perrin (ESIEE, Paris, FR) Alberto Policriti (Udine, IT) Sanguthevar Rajasekaran (Connecticut, Storrs, US) J?rg Rothe (D?sseldorf, DE) Frank Ruskey (Victoria, CA) Helmut Seidl (Munich Tech, DE) Ayumi Shinohara (Tohoku, Sendai, JP) Bernhard Steffen (Dortmund, DE) Frank Stephan (National Singapore, SG) Paul Tarau (North Texas, Denton, US) Andrzej Tarlecki (Warsaw, PL) Jacobo Tor?n (Ulm, DE) Frits Vaandrager (Nijmegen, NL) Jaco van de Pol (Twente, Enschede, NL) Pierre Wolper (Li?ge, BE) Zhilin Wu (Chinese Academy, Beijing, CN) Slawomir Zadrozny (Polish Academy, Warsaw, PL) Hans Zantema (Eindhoven Tech, NL) ORGANIZING COMMITTEE: S?bastien Autran (Nice) Adrian Horia Dediu (Tarragona) Enrico Formenti (Nice, co-chair) Sandrine Julia (Nice) Carlos Mart?n-Vide (Tarragona, co-chair) Christophe Papazian (Nice) Julien Provillard (Nice) Pierre-Alain Scribot (Nice) Bianca Truthe (Giessen) Florentina Lilica Voicu (Tarragona) SUBMISSIONS: Authors are invited to submit non-anonymized papers in English presenting original and unpublished research. Papers should not exceed 12 single-spaced pages (including eventual appendices, references, etc.) and should be prepared according to the standard format for Springer Verlag's LNCS series (see http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0). Submissions have to be uploaded to: https://www.easychair.org/conferences/?conf=lata2015 PUBLICATIONS: A volume of proceedings published by Springer in the LNCS series will be available by the time of the conference. A special issue of the Journal of Computer and System Sciences (Elsevier, 2013 JCR impact factor: 1.0) will be later published containing peer-reviewed substantially extended versions of some of the papers contributed to the conference. Submissions to it will be by invitation. REGISTRATION: The period for registration is open from July 21, 2014 to March 2, 2015. The registration form can be found at: http://grammars.grlmc.com/lata2015/Registration.php DEADLINES: Paper submission: October 10, 2014 (23:59 CET) Notification of paper acceptance or rejection: November 18, 2014 Early registration: November 25, 2014 Final version of the paper for the LNCS proceedings: November 26, 2014 Late registration: February 16, 2015 Submission to the journal special issue: June 6, 2015 QUESTIONS AND FURTHER INFORMATION: florentinalilica.voicu at urv.cat POSTAL ADDRESS: LATA 2015 Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University Av. Catalunya, 35 43002 Tarragona, Spain Phone: +34 977 559 543 Fax: +34 977 558 386 ACKNOWLEDGEMENTS: Nice Sophia Antipolis University Rovira i Virgili University ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 19:48:19 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 21:48:19 +0200 Subject: Appel: Journee Ethique et Agents Autonomes, 6/11/14, Paris Message-ID: Date: Wed, 17 Sep 2014 18:29:07 +0200 From: Olivier Boissier Message-Id: <6965B899-ADC9-4E62-9500-7C7D87DF4CDE at emse.fr> X-url: http://ethicaa.org -- Merci de relayer ce message aupr?s des personnes int?ress?es --- Journ?e "Ethique et Agents Autonomes" L'autonomie de d?cision et d'action d'agents logiciels, humains ou robotiques est une propri?t? fondamentale des probl?matiques informatiques actuelles. Elle est devenue une caract?ristique essentielle de nombreuses applications qui participent ? la num?risation de notre soci?t? (commerce ?lectronique, jeux interactifs, intelligence ambiante, assistance aux personnes, robotique sociale ou collective, robotique civile et militaire ...) Dans un tel contexte, la question d'une r?gulation ou d'un contr?le ?thique des agents logiciels ou robotiques ainsi que des syst?mes constitu?s d?humains et d?agents autonomes se pose actuellement de mani?re pr?gnante. Cette question est par nature transverse ? de multiples disciplines. Le projet ETHICAA (http://ethicaa.org) organise une journ?e de travail sur ce th?me afin de croiser les questionnements et les approches, et de cr?er une communaut? de r?flexion sur ces sujets. Le programme de la journ?e est en cours de construction, sur la base d?interventions invit?es. Cependant une session sp?ciale sera consacr?e ? des pr?sentations courtes (5 min. / 3 planches) d?crivant un d?fi ? ?tudier dans le cadre de ces probl?matiques Ethique et Agents Autonomes. Chaque pr?sentation fera l'objet de discussions. Appel ? contribution : Les personnes int?ress?es pour participer ? cette session sont invit?es ? envoyer un court r?sum? (5 lignes - 70 mots) de leur intervention ? contact at ethicaa.org avant le 20 octobre 2014. Modalit?s pratiques : La journ?e aura lieu le 6 novembre 2014 de 9h00 ? 17h00 ? l'Universit? Pierre et Marie Curie ? Jussieu, Paris. Pour des raisons de logistique, inscription aupr?s de contact at ethicaa.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:19:57 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:19:57 +0200 Subject: Ressources: Release 2014 of DGT-TM (parallel corpus in 24 languages) Message-ID: Date: Thu, 18 Sep 2014 15:35:16 +0200 From: Ralf Steinberger Message-id: <001e01cfd345$61db2630$25917290$@jrc.ec.europa.eu> X-url: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory X-url: http://ec.europa.eu/dgs/translation/index_en.htm X-url: http://europa.eu/abc/eurojargon/index_en.htm X-url: https://ec.europa.eu/jrc/en/language-technologies Readers on this list may be interested to hear that the 2014 release of the DGT-Translation Memory is now available for download. DGT-TM is an extraction of the translation memory of the European Institutions for all official EU languages, produced by the European Commission?s Directorate General for Translation (DGT) and distributed by the Joint Research Centre (JRC). Translation memories are sentences and their manually produced translations. The new release is called DGT-TM-2014. It follows the previous releases, DGT-TM (2007), DGT-TM-2011, DGT-TM-2012 and DGT-TM-2013. DGT-TM-2014 adds over eleven million translation units to the previous 73 million translation units, resulting in almost 85 million translation units in total (almost 1.4 billion words). New features of DGT-TM-2014 are: - Croatian (HR) data is made available for the first time. - Significantly more data for languages with previously less coverage (e.g. Bulgarian, Irish, Maltese, Romanian); - Mostly about 500K new translation units per language. - Most documents of this release were translated in 2013, but it also contains previously unpublished documents from older years. - More data for language pairs involving Maltese are available on request. Languages: All 276 language pairs involving the following 24 languages: Bulgarian, Croatian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Irish, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish and Swedish. URL: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory Creator: European Commission - Directorate General for Translation (http://ec.europa.eu/dgs/translation/index_en.htm - DGT) WHAT IS DGT-TM The ?Acquis Communautaire? (http://europa.eu/abc/eurojargon/index_en.htm) is the entire body of European legislation, comprising all the treaties, regulations and directives adopted by the European Union (EU). Since each new country joining the EU is required to accept the whole Acquis Communautaire, this body of legislation has been translated into 23 official languages. For the 24th official EU language, Irish, the Acquis has not been translated on a regular basis; which is why DGT-TM includes less data in Irish. The Acquis Communautaire was split into sentences and aligned automatically at sentence level, resulting in the DGT translation memory, DGT-TM. The text data is accompanied by software that allows to extract all sentences and their translations for any of the 276 possible language pair combinations. MOTIVATION FOR THIS RELEASE The public data release is in line with the general effort of the European Commission to support multilingualism, language diversity and the re-use of Commission information. It follows the release of a number of further multilingual data sets: - the JRC-Acquis parallel corpus in 2006 (over 1 billion words in 22 languages), - the DGT-TM Translation Memory in 2007, - the multilingual named entity resource JRC-Names in 2011, - the multilingual multi-label classification tool (and accompanying text data) JRC EuroVoc Indexer (JEX) (22 languages) in 2012, - the ECDC-TM Translation Memory in 2012 (domain: Public Health) - the DGT-Acquis parallel corpus in 2012, - the EAC-TM Translation Memory in 2013 (domain: Education and Culture), - and further smaller multilingual resources. See https://ec.europa.eu/jrc/en/language-technologies for more information on these resources. WHAT DGT-TM CAN BE USED FOR DGT-TM can be fed into translation memory software to support human translators in their work. As it is a large parallel corpus in electronic form, it can furthermore be used by specialists in computational linguistics to train statistical machine translation software, to generate multilingual dictionaries, to train and test multilingual information extraction software, and more. MORE INFORMATION ON DGT-TM At http://langtech.jrc.ec.europa.eu/JRC_Publications.html , you find detailed publications on the JRC?s multilingual language technology activity (http://langtech.jrc.ec.europa.eu/JRC_Publications.html). For details specifically on DGT-TM, you can read: Steinberger Ralf, Andreas Eisele, Szymon Klocek, Spyridon Pilos & Patrick Schl?ter (2012). DGT-TM: A freely Available Translation Memory in 22 Languages. Proceedings of the 8th international conference on Language Resources and Evaluation (LREC'2012), Istanbul, 21-27 May 2012. (http://langtech.jrc.ec.europa.eu/Documents/2012_LREC_DGT-TM_Final.pdf) The following recent article compares all freely available Language Technology resources distributed by the JRC and provides comparative background information: Steinberger Ralf, Mohamed Ebrahim, Alexandros Poulis, Manuel Carrasco-Benitez, Patrick Schl?ter, Marek Przybyszewski & Signe Gilbro (2014). An overview of the European Union's highly multilingual parallel corpora. Language Resources and Evaluation Journal (LRE). DOI: 10.1007/s10579-014-9277-0. (http://langtech.jrc.ec.europa.eu/Documents/2014_08_LRE-Journal_JRC-Linguistic-Resources_Manuscript.pdf, http://link.springer.com/article/10.1007/s10579-014-9277-0> WHAT NEXT? The release of the very large new parallel corpus DCEP (http://www.lrec-conf.org/proceedings/lrec2014/pdf/943_Paper.pdf - Digital Corpus of the European Parliament) is pending. Ralf Steinberger (http://langtech.jrc.ec.europa.eu/RS.html) European Commission - Joint Research Centre (JRC) 21027 Ispra (VA), Italy URL ? Applications: http://emm.newsbrief.eu/overview.html URL ? Resources: https://ec.europa.eu/jrc/en/language-technologies URL ? Publications: http://langtech.jrc.ec.europa.eu/JRC_Publications.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:08:43 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:08:43 +0200 Subject: Revue: Discours 14, 2014 Message-ID: Date: Thu, 18 Sep 2014 11:30:14 +0200 From: "laure.sarda at ens.fr" Message-ID: X-url: http://discours.revues.org/ X-url: http://discours.revues.org/index208.html Sorry for multiple posting (English version below) ************************************************************************ Nous sommes tr?s heureux d'annoncer la publication de DISCOURS 14 | 2014 http://discours.revues.org/ Au sommaire : - *Gerda Ha?ler* ?tude compar?e de l?usage parenth?tique des verbes ?pist?miques dans trois langues romanes (http://discours.revues.org/8888) - *Annie Risler* Parenth?ses et ruptures ?nonciatives en langue des signes fran?aise (http://discours.revues.org/8893) - *Gilles Corminboeuf* La focalisation des conditionnelles (http://discours.revues.org/8903) Nous vous souhaitons une bonne lecture et nous vous invitons par ailleurs ? soumettre ? tout moment pour les num?ros ? para?tre. Consultez les modalit?s de soumission http://discours.revues.org/index208.html . Le comit? de r?daction ******************************************************************** We are pleased to announce the publication of the 14th issue of DISCOURS 14 | 2014 http://discours.revues.org/ You can read the following articles: - *Gerda Ha?ler* ?tude compar?e de l?usage parenth?tique des verbes ?pist?miques dans trois langues romanes (http://discours.revues.org/8888) - *Annie **Risler* Parenth?ses et ruptures ?nonciatives en langue des signes fran?aise (http://discours.revues.org/8893) - *Gilles **Corminboeuf* La focalisation des conditionnelles (http://discours.revues.org/8903) We would like to invite contributions for upcoming issues. (Please see submission information http://discours.revues.org/index224.html) The editorial board ************************************************************************ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:28:05 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:28:05 +0200 Subject: Appel: Revue TAL, numero non-thematique 56-1 Message-ID: Date: Fri, 19 Sep 2014 09:45:41 +0900 From: Yves Lepage Message-Id: <587D7E7C-BF44-4F31-AD5E-5918889FBE49 at waseda.jp> X-url: http://tal-56-1.sciencesconf.org/ X-url: http://tal-56-1.sciencesconf.org/?lang=en The English version follows the French call for paper. ------------------------------------------------------------------------- Appel ? communications : http://tal-56-1.sciencesconf.org/ Revue TAL : Num?ro non th?matique 2015 Volume 56 Num?ro 1. Direction : ?ric de la Clergerie, B?atrice Daille, Yves Lepage, Jean-Luc Minel et Pascale S?billot. Date limite de soumission : 15/12/2014 TH?MES La revue Traitement automatique des langues lance un appel ? contributions ouvert. Des propositions de soumissions sont encourag?es sur tous les aspects du traitement automatique des langues, notamment : pragmatique, discours, s?mantique, syntaxe et lexique ; phon?tique, phonologie et morphologie ; analyse et g?n?ration du langage parl? et ?crit ; mod?les logiques, symboliques et statistiques du langage ; extraction d?information et fouille de donn?es textuelles ; traitement multilingue, traduction automatique et aides ? la traduction ; interfaces en langue naturelle et syst?mes de dialogue ; interfaces multi-modales ? composantes linguistiques ; outils et ressources linguistiques ; ?valuation de syst?mes ; terminologie, acquisition de connaissances ? partir de textes ; recherche documentaire ; linguistique de corpus ; utilisation d?outils de TAL pour la mod?lisation linguistique ; enseignement assist?, enseignement des langues ; applications du TAL. La liste ci-dessus n'est pas exhaustive. Il est bien s?r important, quel que soit le th?me, que les aspects li?s au traitement automatique des langues soient mis en valeur. LANGUE Les articles sont ?crits en fran?ais ou en anglais. Les soumissions en anglais ne sont accept?es que pour les auteurs non francophones. LA REVUE La revue TAL (Traitement Automatique des Langues) est une revue internationale ?dit?e depuis 1960 par l?ATALA (Association pour le Traitement Automatique des Langues) avec le concours du CNRS. Elle est maintenant publi?e en format ?lectronique, avec acc?s gratuit imm?diat aux articles publi?s, et impression annuelle ? la demande. Cela ne change aucunement son processus de relecture et de s?lection. DATES IMPORTANTES (EVENTUELLEMENT SUJETTES A FLUCTUATION) 15/12/2014 Date limite de soumission 15/03/2015 D?cision du comit? pour la premi?re relecture 15/05/2015 Date limite de soumission de la version r?vis?e 15/06/2015 D?cision du comit? pour la seconde relecture 15/07/2015 Date limite de soumission de la version finale Automne 2015 Publication FORMAT Les chercheurs ayant l?intention de soumettre une contribution sont invit?s ? d?poser leur r?sum? puis leur article en cliquant sur le menu "Soumission d'un article" (25 pages maximum, format PDF). Pour cela, si ce n?est d?j? fait, s?inscrire sur le site http://www.sciencesconf.org (en haut ? gauche, "cr?er un compte"), puis revenir sur la page http://tal-56-1.sciencesconf.org/, se connecter et effectuer le d?p?t. * TAL passe en revue double-veugle. Merci d?anonymiser votre article. * Les feuilles de style sont disponibles en ligne sur le site de la revue (http://www.atala.org/IMG/zip/tal-style.zip). -------------------------------------------------------------------------- Call for papers : http://tal-56-1.sciencesconf.org/?lang=en TAL Journal : Regular issue 2015 Volume 56 Number 1. Editors: ?ric de la Clergerie, B?atrice Daille, Yves Lepage, Jean-Luc Minel and Pascale S?billot. Deadline : December 15th 2014 TOPICS The TAL journal launches a call for papers for an open issue of the journal. We invite papers in any field of natural language processing, including : lexicon, syntax, semantics, discourse and pragmatics ; morphology, phonology and phonetics ; spoken and written language analysis and generation ; logical, symbolic and statistical models of language ; information extraction and text mining ; multilingual processing, machine translation and translation tools ; natural language interfaces and dialogue systems ; multimodal interfaces with language components ; language tools and resources ; system evaluation ; terminology, knowledge acquisition from texts ; information retrieval ; corpus linguistics ; use of NLP tools for linguistic modeling ; computer assisted language learning ; applications of natural language processing. Whatever the topic, papers must stress the natural language processing aspects. LANGUAGE Manuscripts may be submitted in English or French. French-speaking authors are requested to submit in French. THE JOURNAL TAL (Traitement Automatique des Langues / Natural Language Processing) is a forty year old international journal published by ATALA (French Association for Natural Language Processing) with the support of CNRS (National Centre for Scientific Research). It has moved to an electronic mode of publication, with printing on demand. This affects in no way its reviewing and selection process. IMPORTANT DATES (MAY BE SUBJECT TO CHANGE) 15/12/2014 Deadline for submission 15/03/2015 Notification to authors after first review 15/05/2015 Deadline for submission of revised version 15/06/2015 Notification to authors afetr second review 15/07/2015 Deadline for submission of final version Automn 2015 Publication PAPER SUBMISSION Authors who intend to submit a paper are asked to upload their contribution (up to 25 pages, PDF format) via the menu "Paper submission". To do so, you will need to have an account on the sciencesconf platform. To create an account, go to the sciencesconf site and click on "create account" next to the "Connect" button at the top of the page. To submit, come back to the page http://tal-56-1.sciencesconf.org/?lang=en, connect to you account and upload your submission. * TAL has adopted double-blind review. The submitted papers should be anonymized. * Style sheets are available for download on the Web site of the journal (http://www.atala.org/IMG/zip/tal-style.zip). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 19:51:18 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 21:51:18 +0200 Subject: Sujet de these: 3-year PHD funding at Orsay (near Paris, France) Message-ID: Date: Wed, 17 Sep 2014 19:05:17 +0200 From: Brigitte Grau Message-ID: <5419BF4D.3090407 at limsi.fr> X-url: http://www.limsi.fr X-url: http://www.irt-systemx.fr IRT SystemX and LIMSI offer 3-year PHD funding at Orsay (near Paris, France) Subject : Today the number of documents increases rapidly, and moreover they are produced by multiple sources that can be classified by type (texts, speech...), by style (blog, forum, tweet, broadcast news, broadcast conversations, community tv...) and by language (English, French, Chinese...). Reliability of the information contained in these documents depends on each kind of source. Thus, selecting relevant and reliable information from such documents and summarizing it is problematic. The goal of the project is to build knowledge bases about persons, products... (i.e. Named Entities). Knowledge will be extracted from multiple documents and will have to be combined by aggregation and data fusion. Thus the information will result from multi-source, multilingual and multimedia document extraction: - Multi-source: various types of documents (spontaneous, prepared...) and providers of documents (institution, individual, community...); - Multimedia: texts, speech, scanned documents; - Multilingual: different languages. The work will focus on information identification, extraction and structuring. Studied issues will be: - assessment of information reliability; - assessment of information relevance (degree of novelty, scarcity of information); - detection and classification of contradictions. The PHD student will handle participation in international evaluation campaigns. The main location of the PHD student will be IRT, and s/he will be supervised by LIMSI senior researchers. Supervisors: Brigitte Grau, Professor at ENSIIE, LIMSI-CNRS Sophie Rosset, Director of Research, LIMSI-CNRS TECHNICAL REQUIREMENTS - Master in Computer Science, specialized in Machine learning and Natural Language Processing will be appreciated - Solid programming skills - A good command of French is a plus ADDITIONAL INFORMATION Salary: 2300 euros per month Benefits: IRT offers a generous benefit package including health insurance and about 44 days vacation pa. Duration: 3 years Start date: as soon as possible Location: Orsay, greater Paris area, France, is located in a green area about 30 minutes south of Paris. TO APPLY Please send: * a cover letter * a curriculum vitae, including the academic results * the names and contact information of at least one referee to both: Brigitte Grau (bg at limsi.fr) Sophie Rosset (rosset at limsi.fr) ABOUT LIMSI-CNRS http://www.limsi.fr LIMSI is a laboratory of the French National Center for Research (CNRS), a leading research institution in Europe. LIMSI is a multi-disciplinary research unit that covers a number of fields from thermodynamics to cognition, encompassing fluid mechanics, energetics, acoustic and voice synthesis, spoken language and text processing, vision, visualisation and perception, virtual and augmented reality. LIMSI hosts about 200 researchers, professors, research support staff and graduate students. ABOUT IRT-System X http://www.irt-systemx.fr An Institute for Technological Research (IRT) is an interdisciplinary thematic institute that develops economic sectors related to its field through a balanced strategic public-private partnership. For this, it manages research programs coupled with technology platforms, conducts research and development projects at the international level, contributes to the engineering of initial and continuous trainings (qualifying professional training and/or degree delivering); and ensures the exploitation of the obtained results. From hamon at LIMSI.FR Sat Sep 20 20:35:19 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:35:19 +0200 Subject: Job: CDD 24 mois, Caracterisation multimedia a grande echelle de contenus sur le Web, CEA LIST, Saclay Message-ID: Date: Fri, 19 Sep 2014 11:00:31 +0000 From: LE BORGNE Herv? 214777 Message-ID: <8095024FD92B3D4DB88787F07FC9963824235653 at EXDAG0-B3.intra.cea.fr> Contexte Au sein du CEA LIST, le Laboratoire LVIC (Vision et Ing?nierie des Contenus) travaille sur l'analyse de contenus multim?dias (analyse de textes, images et vid?os, perception 3D). Dans le domaine de l'analyse de textes, le CEA LIST recherche un CDD ing?nieur ou docteur pour travailler sur des techniques d'extraction et de clustering de relations ? partir de donn?es textuelles en vue de leur application ? l'extraction d'information multim?dia, incluant une dimension visuelle. Objectifs Dans le cadre d'un projet collaboratif (FUI 17), le CEA LIST travaille ? l'extraction d'information multim?dia ? grande ?chelle selon trois axes : - [A] Classification multim?dia ? grande ?chelle : la classification de contenu sur le web dans des cat?gories ? granularit? variable repose aujourd'hui essentiellement sur le contenu textuel. Le but de cet axe de travail est d'y ajouter une dimension visuelle. Les principaux verrous sont li?s ? la quantit? d'information ? traiter (aspect ? large ?chelle ?) et ? la combinaison des informations provenant de diff?rents m?dia. On se souciera du compromis performance/efficience. Ces travaux pourront b?n?ficier de l'axe C pour d?finir dynamiquement les classes. - [B] Mod?lisation temporelle : l'identification de r?f?rences temporelles dans les documents textuels et l'utilit? de l'information temporelle dans la recherche d'information est un probl?me bien ?tudi?, mais l'accent est plut?t mis sur les documents que sur les entit?s. Les approches existantes restent ?troitement li?es ? des t?ches de recherche d'information et non ? une v?ritable extraction temporellement dynamique des caract?ristiques d'entit?s. En outre, la plupart des approches existantes se concentrent sur des documents purement textuels alors que les donn?es incluses dans les flux de donn?es multimodales sont ?galement int?ressantes ? suivre temporellement. Ainsi, les innovations de cette t?che sont (B1) le suivi temporel d'entit?s, puisque ce th?me a peu ?t? ?tudi? ; (B2) l'ajout de la dimension visuelle ? cette mod?lisation. - [C] D?couverte de connaissances multim?dia : les t?ches de cat?gorisation supervis?e sur des tr?s grands volumes de donn?es trait?s en flux, n?cessaires pour qualifier l'information du web, n?cessite de disposer de donn?es annot?es pour effectuer l'apprentissage. ? grande ?chelle, un verrou fondamental est de s?lectionner automatiquement les donn?es d'apprentissage. En particulier, le choix des exemples n?gatifs doit permettre l'apprentissage de mod?les ? la fois discriminants et g?n?ralisables. Le travail du CDD consistera plus particuli?rement ? (dans cet ordre de priorit?) : - ?tudier, impl?menter et ?valuer une m?thode de mod?lisation temporelle bas?e sur les informations textuelles (axe B1) ; - ?tudier, impl?menter et ?valuer une m?thode de s?lection des donn?es d'apprentissage pour des mod?les de classification supervis?e d'entit?s visuelles (axe A et C) - ?tudier, impl?menter et ?valuer une m?thode combinant les deux travaux pr?c?dents r?sultant en une mod?lisation temporelle d'entit?s multim?dia incluant la dimension visuelle (axe B2). Le CEA LIST dispose d?j? de plusieurs outils permettant de supporter les axes A et C. De plus d'autres personnes travailleront en parall?le ? ces t?ches au sein du laboratoire. Profil recherch?: - Comp?tences en traitement multim?dia des donn?es : traitement automatique des langues et/ou vision par ordinateur (un go?t pour les deux aspects serait tr?s appr?ci?). - Connaissance des techniques d'apprentissage automatique - Comp?tences informatiques : C++, langages de script (perl, python ...) - Une bonne ma?trise de la langue anglaise est ?galement indispensable. - Un travail pr?alable de recherche, ayant abouti ? des publications de bon niveau, sera jug? tr?s positivement. R?mun?ration selon formation et exp?rience. Lieu de travail : centre d'int?gration NanoInnov (plateau de Saclay, proche de Polytechnique) Dur?e : 24 mois Les candidatures (CV + lettre de motivation) sont ? envoyer le plus rapidement possible ? : Herv? Le Borgne (herve.le-borgne at cea.fr) avec copie ? : Adrian Popescu (adrian.popescu at cea.fr) Romaric Besan?on (romaric.besancon at cea.fr) Olivier Ferret (olivier.ferret at cea.fr) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:32:40 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:32:40 +0200 Subject: Appel: Bulletin AFIA "IA et jeux vid=?UTF-8?Q?=C3=A9o=22?= Message-ID: Date: Fri, 19 Sep 2014 11:28:39 +0200 From: "Carole Adam (IMAG)" Message-ID: ** Avec nos excuses pour les r?ceptions multiples ** L'association Fran?aise pour l'intelligence artificielle (AFIA) ?dite un bulletin trimestriel d'information ? l'attention de ses adh?rents. Le num?ro 87 sera un bulletin th?matique qui regroupera les activit?s fran?aises de recherche associant Intelligence Artificielle et Jeux Vid?os. Le contenu du bulletin sera constitu? de pr?sentations courtes (1 ? 4 pages) des activit?s de recherche qui sont men?es dans les laboratoires publics et en entreprise : - Pr?sentation d'?quipes de recherche ou R&D - Pr?sentation d'outils issus de la recherche - Pr?sentation de projets de recherche Nous vous sollicitons pour participer ? la r?daction de ce bulletin. C'est une occasion de communiquer sur vos activit?s, et au travers de ce bulletin de participer ? faire le point sur les recherches men?es en France sur la th?matique IA & Jeux Video. La parution de ce bulletin est pr?vue en janvier 2015. Si vous ?tes int?ress?s pour y participer, merci de nous envoyer d?s que possible et *avant le 15 novembre 2014* une expression d'int?r?t pr?cisant simplement l'objet de votre pr?sentation (pr?sentation d'?quipe, pr?sentation d'un projet de recherche). Le texte complet correspondant ? votre proposition devra alors nous parvenir *pour le 19 d?cembre 2014*. Attention ? bien mettre en avant l'articulation entre jeux vid?o et IA dans la description des travaux. En termes de longueur, l'id?al serait 1 ? 2 pages pour un projet, et maximum 4 pages pour une ?quipe (sachant qu'une page du bulletin AFIA fait environ 650 mots). Le format demand? est le suivant : Titre (nom de l'?quipe/de l'outil/du projet) : Page web (si possible) : Contact (Nom, Pr?nom, adresse mail) : Pour une ?quipe : description globale des probl?matiques de l'?quipe puis description de quelques outils/projets comme ci-dessous Partenaires ?ventuels du projet : Financement ?ventuel du projet (ANR, FUI...) : Objectifs : R?sultats (sauf si projet d?butant) : Pour toute question concernant ce bulletin, n'h?sitez pas ? me contacter. Cordialement, Carole Adam ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Sat Sep 20 20:24:47 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Sat, 20 Sep 2014 22:24:47 +0200 Subject: Appel: Revue TAL, 56-2, numero special sur la semantique distributionnelle Message-ID: Date: Thu, 18 Sep 2014 16:56:59 +0200 From: C?cile Fabre Message-ID: <541AF2BB.5090507 at univ-tlse2.fr> X-url: http://tal-56-2.sciencesconf.org/ X-url: http://www.atala.org/-Revue-TAL X-url: http://tal-56-2.sciencesconf.org/?eng PREMIER APPEL ? CONTRIBUTIONS SEMANTIQUE DISTRIBUTIONNELLE / DISTRIBUTIONAL SEMANTICS -- Call for papers - English version appears below -- UN NUM?RO SP?CIAL DE LA REVUE 'TRAITEMENT AUTOMATIQUE DES LANGUES' (TAL) ?DITEURS INVIT?S - C?cile Fabre (CLLE-ERSS, Universit? de Toulouse) - Alessandro Lenci (CoLing Lab, Universit? de Pise) DATE LIMITE DE SOUMISSION : 16 f?vrier 2015 THEMATIQUE DU NUMERO : L'utilisation du crit?re distributionnel pour calculer des liens de proximit? s?mantique entre les mots est une m?thode devenue tr?s courante en TAL. Sa popularit? s'explique facilement : elle donne acc?s ? des informations s?mantiques en appliquant un principe simple, sans apport de connaissances autres que des informations relatives ? la distribution des mots dans un corpus, brut ou annot?. Les syst?mes ont g?n?ralement recours ? des mod?les d'espace vectoriel pour repr?senter et comparer les caract?ristiques distributionnelles des unit?s lexicales. Cette approche a b?n?fici? ces derni?res ann?es de la disponibilit? de grandes masses de donn?es textuelles et de capacit?s informatiques accrues pour les traiter, ce qui a permis de produire des ressources distributionnelles ? tr?s grande ?chelle. On peut dire aujourd'hui que le domaine est arriv? ? maturit? : des exp?rimentations nombreuses ont ?t? men?es sur plusieurs langues, des travaux de synth?se ont permis de stabiliser les notions et les proc?dures relatives au calcul distributionnel, divers mod?les distributionnels sont disponibles ainsi que des jeux d'?valuation. N?anmoins, de nombreuses questions de recherche restent ouvertes pour mieux contr?ler l'application de cette m?thode distributionnelle et am?liorer la compr?hension des types d'information s?mantique qu'elle permet de calculer. Une premi?re direction de recherche concerne l'optimisation de la m?thode distributionnelle pour traiter des donn?es toujours plus volumineuses, ainsi que le contr?le des nombreux param?tres susceptibles de jouer sur la qualit? et la nature des relations s?mantiques extraites (mesures de similarit?, nature des contextes distributionnels, techniques de r?duction de dimension, pond?ration des contextes, etc.). D'autres travaux s'int?ressent plut?t ? l'exploitation de ces donn?es s?mantiques, qu'il s'agisse de l'int?gration d'indices distributionnels dans des applications de TAL (recherche d'information, r?sum? automatique, classification d'entit?s nomm?es, calcul d'inf?rence, etc.), ou de la construction de r?seaux lexicaux permettant de visualiser les relations s?mantiques entre les mots d'un corpus. Enfin, depuis quelques ann?es, des travaux ont ?t? consacr?s ? l'extension du calcul distributionnel ? des unit?s plus larges ou plus petites que le mot, selon un principe de compositionnalit?, ou ? la mod?lisation de l'information distributionnelle pour la combiner avec d'autres modes de repr?sentation du sens. Nous souhaitons que ce num?ro sp?cial soit repr?sentatif de la richesse actuelle de ce champ, sur le plan ? la fois linguistique et computationnel, et invitons par cons?quent des contributions sur l'ensemble de ces aspects. Plus sp?cifiquement, les th?matiques concern?es sont (de fa?on non exclusive) les suivantes : - utilisation d'indices distributionnels pour la construction de ressources lexicales et s?mantiques - compositionnalit? s?mantique dans le cadre distributionnel - rep?rage de relations s?mantiques sp?cifiques - exploitation de la proximit? distributionnelle dans des t?ches de TAL - optimisation du calcul de similarit? s?mantique - visualisation et manipulation graphique des espaces de mots - ?valuation de ressources distributionnelles - impact des corpus (taille, contenu, genre, annotations, traitements) sur la m?thode distributionnelle - int?gration d'informations s?mantiques distributionnelles et non-distributionnelles - s?mantique distributionnelle et deep learning - ?valuation de mod?les distributionnels COMIT? SCIENTIFIQUE (en cours de constitution) Marianna Apidianaki ? LIMSI, Orsay Marco Baroni ? CIMeC, Trento Ann Bertels -ILT, K.U. Leuven Romaric Besan?on ? CEA, Gif-sur-Yvette Yves Bestgen - UCL/CECL, Louvain-La-Neuve Gemma Boleda - Universit? Pompeu Fabra, Barcelone Marie Candito - ALPAGE, Paris Olivier Ferret ? CEA, Gif-sur-Yvette Andre Freitas - DERI, National University of Ireland,Galway Gregory Grefenstette - INRIA, Saclay Thierry Hamon - LIMSI, Paris Aur?lie Herbelot - Institut f?r Linguistik, Potsdam Guillaume Jacquet - European Commission, JRC, Ispra Olivier Kraif - LIDILEM, Grenoble Laurent Pr?vot - LPL, Aix-Marseille Beno?t Sagot - ALPAGE, Paris Magnus Sahlgren - Gavagai, Inc., Su?de Franck Sajous - CLLE-ERSS, Toulouse Sabine Schulte im Walde - IMS, Stuttgart Ludovic Tanguy, CLLE-ERSS, Toulouse Peter Turney - National Research Council Canada, Ottawa Tim Van de Cruys - IRIT, Toulouse Lonneke Van der Plas - Institute for NLP, Stuttgart DATES IMPORTANTES 16 f?vrier 2015 : Date limite de soumission des articles 15 avril : Notification aux auteurs 1er juin : Soumission des versions r?vis?es 9 juillet : D?cision finale 1er sept : Version finale Fin 2015 : Publication INFORMATIONS PRATIQUES Informations compl?mentaires : http://tal-56-2.sciencesconf.org/ Les articles (25 pages environ, format PDF) doivent ?tre d?pos?s sur la plateforme sciencesconf ? l'adresse ci-dessus. Les feuilles de style sont disponibles sur le site web de la revue (http://www.atala.org/-Revue-TAL). Le journal ne publie que des contributions originales, en fran?ais ou en anglais. ==========ENGLISH VERSION============ TAL journal - special issue on Distributional Semantics GUEST EDITORS - C?cile Fabre (CLLE-ERSS, University of Toulouse) - Alessandro Lenci (CoLing Lab, University of Pisa) SUBMISSION DEADLINE : february 16, 2015 THEMES : The use of distributional information extracted from corpora to compute semantic similarity between words has become a very common method in NLP. Its popularity is easily explained: it provides access to semantic content on the basis of an elementary principle, requiring no sources of knowledge other than corpus-derived information about word distribution in contexts. In recent years, distributional semantics based on vector space models has benefited from the availability of massive amounts of textual data and increased computational power, allowing for the application of these methods on a large scale. Today, the field has reached maturity: many experiments have been carried out on several languages, several survey articles have recently helped to consolidate the concepts and procedures used for distributional computations, various distributional models and evaluation data are now available. Still, many issues remain open to have a better control on the application of the distributional methodology in computational semantics and to improve the understanding of the the types of information that is induced by these methods. Much research effort has focused on optimization methods to handle massive corpora and on the adjustment of the many parameters that are likely to have impact on the quality and nature of semantic relations ? such as similarity measures, types of distributional contexts, dimensionality reduction techniques, context weighting schemes, etc. A second important issue relates to the use of distributional semantic information for a large number of applications (information retrieval, summarization, textual entailment, etc.). Distributional features have been incorporated into a wide range of NLP tasks, such as named entity classification and paraphrasing. They are also used for the construction of lexical networks that enable the visualization of the semantic relations that hold between the words of a corpus. Finally, in the last few years, research has focused on combining distributional representations with other kinds of semantic representations, and on modeling semantic compositionality within a distributional framework, such that not only individual words but also larger phrases can be taken into account. We wish that this special issue of the TAL journal on distributional semantics will reflect the current diversity of the field, regarding linguistic and computational issues. We welcome papers that focus on any of the aforementioned topics, and in particular: - construction of distributional semantic models - compositionality within a distributional framework - induction of specific semantic relations - use of distributional methods within NLP tasks - optimization techniques for distributional computations - visualization techniques for word spaces - role of corpora in distributional semantics models - ?deep learning? and distributional semantics - integrating distributional and non-distributional semantic information - evaluation of distributional semantic models REVIEW COMMITTEE (to be completed) Marianna Apidianaki ? LIMSI, Orsay Marco Baroni ? CIMeC, Trento Ann Bertels -ILT, K.U. Leuven Romaric Besan?on ? CEA, Gif-sur-Yvette Yves Bestgen - UCL/CECL, Louvain-La-Neuve Gemma Boleda - Universit? Pompeu Fabra, Barcelone Marie Candito - ALPAGE, Paris Olivier Ferret ? CEA, Gif-sur-Yvette Andre Freitas - DERI, National University of Ireland,Galway Gregory Grefenstette - INRIA, Saclay Thierry Hamon - LIMSI, Paris Aur?lie Herbelot - Institut f?r Linguistik, Potsdam Guillaume Jacquet - European Commission, JRC, Ispra Olivier Kraif - LIDILEM, Grenoble Laurent Pr?vot - LPL, Aix-Marseille Beno?t Sagot - ALPAGE, Paris Magnus Sahlgren - Gavagai, Inc., Su?de Franck Sajous - CLLE-ERSS, Toulouse Sabine Schulte im Walde - IMS, Stuttgart Ludovic Tanguy, CLLE-ERSS, Toulouse Peter Turney - National Research Council Canada, Ottawa Tim Van de Cruys - IRIT, Toulouse Lonneke Van der Plas - Institute for NLP, Stuttgart IMPORTANT DATES February 16, 2015: Submission deadline April 15: First notification to authors June 1: revised submission July 9: final notification September 1: final version End of 2015: Publishing PAPER SUBMISSION Papers must describe original, completed, and unpublished work. Each submission will be reviewed by two programme committee members. Papers must be submitted thorugh the Sciencesconf platform: http://tal-56-2.sciencesconf.org/?eng Accepted papers will be maximum 25 pages long in PDF. Style sheets are available for download on the Web site of the TAL journal. LANGUAGE Manuscripts may be submitted in English or French. French-speaking authors are requested to submit their contributions in French. THE TAL JOURNAL TAL (Traitement Automatique des Langues / Natural Language Processing) is an international journal published by ATALA (French Association for Natural Language Processing, http://www.atala.org) since 1959 with the support of CNRS (National Centre for Scientific Research). It has moved to an electronic mode of publication, with printing on demand. ADDITIONAL INFORMATION http://tal-56-2.sciencesconf.org/?eng ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 23 19:39:01 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:39:01 +0200 Subject: Appel: Workshop TOTh 2014 Message-ID: Date: Mon, 22 Sep 2014 10:47:24 +0200 From: Luc Damas Message-ID: X-url: http://porphyre.org/workshop-toth/2014-en X-url: http://porphyre.org/workshop-toth/files/Workshop-TOTh-2014-Call-for-papers.pdf Workshop TOTh 2014 - Call for papers http://porphyre.org/workshop-toth/2014-en http://porphyre.org/workshop-toth/files/Workshop-TOTh-2014-Call-for-papers.pdf The 2014 TOTh Workshop is organised by the Royal Museums of Art and History of Brussels within the scope of the European Project AthenaPlus (www.athenaplus.eu) Title: "Multilingual Thesaurus and Terminology" Brussels - December 5th 2014 The Cinquantenaire Museum Parc du Cinquantenaire 10 The ever-increasing amount of open data and linked data raises questions concerning its access in a multilingual context. Due to the diversity of the collections, of the institutions that manage them, of the public that has access to them and of the technologies currently available, it is necessary to rethink the notions of thesaurus and terminology, as well as the ways to manage and access these collections. Some of the topics that will be covered by the TOTh 2014 Workshop include (this list is not exhaustive): - Principles, Theories and Methods: Thesauri, Terminology, Ontology, Controlled Vocabulary, Semantic Network; - Embracing and Managing Multilingualism; - Mapping, Alignment and Harmonisation of terminologies, thesauri, ontologies; - Indexing and Research; - The compatibility of the ISO and W3C Standards concerning terminology, thesauri, knowledge systems and interchange format; - Impact and contributions from new domains and technologies connected to Knowledge Engineering and the Semantic Web; - Software Environments. Special attention will be given to the issue of cultural content management. Submission: Abstracts of one or two pages must be sent to: workshop-toth at porphyre.org Official languages: English and French Deadline for submission: September 30th 2014 Information: Eva Coudyzer e.coudyzer at kmkg-mrah.be Scientific coordination : C. Roche, R. Costa, E. Coudyzer http://porphyre.org/workshop-toth/2014-en http://porphyre.org/workshop-toth/files/Workshop-TOTh-2014-Call-for-papers.pdf From hamon at LIMSI.FR Tue Sep 23 19:35:58 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:35:58 +0200 Subject: Conf: SLSP 2014, October 14-16, 2014, Grenoble, France Message-ID: Date: Sun, 21 Sep 2014 09:38:03 +0200 From: "GRLMC" Message-ID: <615E19CABE8D45C0ABAF03EBF2414EC1 at Carlos1> X-url: http://grammars.grlmc.com/slsp2014/ ************************************************************************ 2nd INTERNATIONAL CONFERENCE ON STATISTICAL LANGUAGE AND SPEECH PROCESSING SLSP 2014 Grenoble, France October 14-16, 2014 Organised by: ?quipe GETALP Laboratoire d?Informatique de Grenoble Research Group on Mathematical Linguistics (GRLMC) Rovira i Virgili University http://grammars.grlmc.com/slsp2014/ ************************************************************************ PROGRAM Tuesday, October 14 9:00 - 10:00 Registration 10:00 - 10:15 Opening 10:15 - 11:05 Roger K. Moore: Spoken Language Processing: Time to Look Outside? - Invited Lecture 11:05 - 11:35 Coffee Break 11:35 - 12:50 Georgios Kontonatsios, Claudiu Mihaila, Ioannis Korkontzelos, Paul Thompson, and Sophia Ananiadou: A Hybrid Approach to Compiling Bilingual Dictionaries of Medical Terms from Parallel Corpora Wei Liu, Zhipeng Chang, and William J. Teahan: Experiments with a PPM Compression-based Method for English-Chinese Bilingual Sentence Alignment Chi-kiu Lo and Dekai Wu: BiMEANT: Integrating Cross-lingual and Monolingual Semantic Frame Similarities in the MEANT Semantic MT Evaluation Metric 12:50 - 14:20 Lunch 14:20 - 15:35 Mathias Verbeke, Vincent Van Asch, Walter Daelemans, and Luc De Raedt: Lazy and Eager Relational Learning using Graph-Kernels Mohamed Amine Boukhaled, and Jean-Gabriel Ganascia: Probabilistic Anomaly Detection Method for Authorship Verification Uli Fahrenberg, Fabrizio Biondi, Kevin Corre, Cyrille Jegourel, Simon Kongsh j, and Axel Legay: Measuring Global Similarity between Texts 16:00 - 18:00 Touristic visit Wednesday, October 15 9:00 - 9:50 Claire Gardent: Syntax and Data-to-Text Generation - Invited Lecture 9:50 - 10:05 Break 10:05 - 11:20 Borb?la Sikl?si and Attila Nov?k: Identifying and Clustering Relevant Terms in Clinical Records Using Unsupervised Methods Amine Abdaoui, J?r?me Az?, Sandra Bringay, Natalia Grabar, and Pascal Poncelet: Predicting Medical Roles in Online Health Fora Ekaterina Pronoza, Elena Yagunova, and Svetlana Volskaya: Corpus-based Information Extraction and Opinion Mining for the Restaurant Recommendation System 11:20 - 11:50 Coffee Break and Group Photo 11:50 - 13:05 Ra?l Ernesto Gutierrez de Pi?erez Reyes and Juan Francisco D?az-Fr?as: Informal Mathematical Discourse Parsing with Conditional Random Fields Waad Ben Kheder, Driss Matrouf, Pierre-Michel Bousquet, Jean-Fran?ois Bonastre and Moez Ajili: Robust Speaker Recognition Using MAP Estimation of Additive Noise in i-vectors Space Arseniy Gorin and Denis Jouvet: Structured GMM Based on Unsupervised Clustering for Recognizing Adult and Child Speech 13:05 - 14:35 Lunch 14:35 - 16:35 Visit to the Domus apartment Thursday, October 16 9:00 - 9:50 Martti Vainio: Phonetics and Machine Learning: Hierarchical Modelling of Prosody in Statistical Speech Synthesis - Invited Lecture 9:50 - 10:05 Break 10:05 - 11:20 G?bor Kiss and Kl?ra Vicsi: Physiological and Cognitive Status Monitoring on the Base of Acoustic-phonetic Speech Parameters Barbara Schuppler, Sebastian Grill, Andr? Menrath, and Juan A. Morales-Cordovilla: Automatic Phonetic Transcription in Two Steps: Forced Alignment and Burst Detection Mian Du, Matthew Pierce, Lidia Pivovarova, and Roman Yangarber: Supervised Classification using Balanced Training 11:20 - 11:50 Coffee Break 11:50 - 13:05 M?rius ?ajgal?k, Michal Barla, and M?ria Bielikov?: Exploring Multidimensional Continuous Feature Space to Extract Relevant Words Zhemin Zhu, Djoerd Hiemstra, and Peter Apers: Linear Co-occurrence Rate Networks (L-CRNs) for Sequence Labeling Th?odore Bluche, Hermann Ney, and Christopher Kermorvant: Handwriting Recognition with Deep and Recurrent Neural Networks 13:05 - 13:15 Closing ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 23 19:45:05 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:45:05 +0200 Subject: Job: Research Associate/Assistant Post, Knowledge Media Institute, Open University Message-ID: Date: Mon, 22 Sep 2014 20:33:04 +0100 From: John Domingue Message-ID: X-url: http://kmi.open.ac.uk/jobs/ [apologies for cross posting] We have a position at our lab in a project which will apply our work on Linked Data/Semantic Web and Web APis in the domains of eLearning and the Future Internet. Duration of Post: until end of May 2016. Salary Scale: 28,695 - 37,394 (British Pounds) Deadline for applications is: October 23rd More details and application forms can be found at: http://kmi.open.ac.uk/jobs/ [Post 10673] Post Job Summary ________________________________________________________________________ Massive Open Online Courses (MOOCs) have recently come to the fore through high profile providers such as Udacity, Coursera, edX and the OU?s own FutureLearn. According to some commentators this new initiative will radically change the higher education landscape through the provision of high quality freely available educational materials. The FORGE project is applying technologies related to rich interactive eBooks, social networking learning platforms and Linked Data to turn large scale Future Internet Research and Experimentation (FIRE) facilities into a learning resource. See http://ict-forge.eu/ The weSPOT project aims at propagating a scientific inquiry approach for science learning and teaching in combination with current curricula and teaching practices. It lowers the threshold for linking everyday life with science teaching in schools through technology. weSPOT supports the meaningful contextualization of scientific concepts by relating them to personal curiosity, experiences, and reasoning founded on a theoretically sound and technology supported personal inquiry approach. See http://wespot.net/ ________________________________________________________________________ Best John ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Tue Sep 23 19:47:01 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:47:01 +0200 Subject: Appel: CHIST-ERA Call 2014, Pre-announcement, Cyber-Physical Systems Message-ID: Date: Tue, 23 Sep 2014 07:26:42 +0200 From: pap Message-ID: <54210492.9070302 at limsi.fr> X-url: http://www.chistera.eu/call-2014-pre-announcement Dear Colleagues, On behalf of the CHIST-ERA ERA-NET, I am pleased to inform you of the publication of the _pre-announcement_ of the Call 2014 (to be open in October). http://www.chistera.eu/call-2014-pre-announcement The Pre-announcement gives an overview of the research themes that have emerged during the Call 2014 preparation conference (last June) in the following topics: - Resilient Trustworthy Cyber-Physical Systems (RTCPS) - Human Language Understanding: Grounding Language Learning (HLU) Researchers are encouraged to start discussing possible projects with prospective partners. The tentative list of interested countries is presented in the Pre-announcement. The call will require that projects are submitted by international consortia with partners in at least three countries (additional partners from other countries may be part of a consortium if they can secure their own funding). Broad distribution of this Pre-announcement is encouraged, Sincerely yours, Mathieu Girerd From hamon at LIMSI.FR Tue Sep 23 19:54:51 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Tue, 23 Sep 2014 21:54:51 +0200 Subject: Job: Post-doctoral position in Dialog System at LIMSI-CNRS, Paris Saclay Message-ID: Date: Tue, 23 Sep 2014 18:06:15 +0200 From: Sophie Rosset Message-ID: <20140923160615.GA3194 at m17.limsi.fr> X-url: http://www.patient-genesys.com/ Veuillez nous excuser pour l'envoi multiple. Le LIMSI propose une offre de post-doctorat en traitement automatique des langues dans le cadre d'un projet collaboratif sur le th?me suivant : Gestion de dialogue dans un syst?me de dialogue personne-machine o? le syst?me joue le r?le du patient pendant une consultation m?dicale avec un m?decin. Plus de d?tails ci-dessous. Post-doctoral positions at LIMSI-CNRS, Paris Saclay (Paris Sud) University. LIMSI is a multi-disciplinary research unit that addresses the automatic processing of human language for a range of tasks. LIMSI invites applications for 1 one-year Postdoctoral position in Natural Language Processing. The topic is as follows: Dialogue management in a human-machine dialogue system where the system plays the role of a patient during a medical consultation with a doctor. CONTEXT The postdoctoral fellow will contribute to the following project: Patient Genesys (http://www.patient-genesys.com/): in the framework of continuous medical education, the goal of the project is to design and develop a framework for virtual patient-doctor consultation. This is a collaborative project including a hospital and small and medium enterprises. JOB REQUIREMENTS - Ph.D. in Computer Science, Natural Language Processing, Computational Linguistics - Solid programming skills - Strong publication record - A good command of French is a plus - Knowledge of medical terminologies and ontologies is a plus ADDITIONAL INFORMATION Net salary: between 2000 and 2400 ??? per month according to experience Benefits: LIMSI offers a generous benefit package including health insurance and 44 days vacation pa. Duration: 12 months, renewable depending on performance and funding availability Start date: 1st October 2014 Location: Orsay, greater Paris area, France TO APPLY Please send: * a cover letter * a curriculum vitae, including a list of publications * the names and contact information of at least two referees to both: Sophie Rosset (rosset at limsi.fr) Anne-Laure (annlor at limsi.fr) Pierre Zweigenbaum (pz at limsi.fr) Application deadline: October 15th, 2014 Applications will be examined in the following week. ABOUT LIMSI-CNRS LIMSI is a laboratory of the French National Center for Research (CNRS), a leading research institution in Europe. LIMSI is a multi-disciplinary research unit that covers a number of fields from thermodynamics to cognition, encompassing fluid mechanics, energetics, acoustic and voice synthesis, spoken language and text processing, vision, visualisation and perception, virtual and augmented reality. LIMSI hosts about 200 researchers, professors, research support staff and graduate students. It is located in a green area about 30 minutes south of Paris. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 26 20:36:36 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 26 Sep 2014 22:36:36 +0200 Subject: Journee: (Date limite inscription 29/9) Promotion et Developpement de l'Intelligence Artificielle, Univ. Paris Dauphine, Paris, 2 octobre 2014, Message-ID: Date: Fri, 26 Sep 2014 08:34:28 +0200 From: Secretaire AFIA Message-Id: X-url: http://inscriptions.afia.asso.fr X-url: http://www.afia.asso.fr --- Merci de relayer ce message aupr?s des personnes int?ress?es --- Le 2 octobre 2014, l'Association Fran?aise pour l'Intelligence Artificielle organise une journ?e d'interventions pour la promotion et le d?veloppement de l' Intelligence Artificielle. Cette journ?e est plac?e sous le Haut Patronage du MESR DGRI, du CNRS INS2I et d?Inria. Programme de la journ?e : 09:00 - Accueil des participants 09:30 - 10:00 Ouverture (par les repr?sentants de l'AFIA, du MESR DGRI, du CNRS INS2I et d'Inria) 10:00 - 10:45 Andreas Herzig (IRIT, CNRS) - Quelles logiques pour les syst?mes multi-agents ? 11:00 - 11:45 Fran?ois Pachet (Sony CSL, Sony) - Cr?ativit? et style : de nouveaux probl?mes pour l'IA 11:45 - 12:30 H?l?ne Fargier (IRIT, CNRS) - Probl?mes combinatoires de d?cision sous incertitude 12:30 - 14:00 BUFFET 14:00 - 14:45 J?r?me Euzenat (LIG, Inria) - Repr?senter, communiquer, ?chouer 14:45 - 15:30 Leila Amgoud (IRIT, CNRS) - La th?orie computationnelle de l'argumentation Date : 2 Octobre 2014, 9h00-16h00. Date limite d'inscription : 29 septembre 2014. Lieu : Salle A709, (7?me ?tage de la nouvelle aile) Universit? Paris-Dauphine Place du Mar?chal de Lattre de Tassigny 75775 PARIS Cedex 16 Inscription : L?acc?s ? la journ?e PDIA 2014 sera limit? aux seules personnes qui se seront inscrites sur le site des inscriptions avant le 29 septembre 2014 : http://inscriptions.afia.asso.fr Plus d'information et t?l?chargement du programme : http://www.afia.asso.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 26 20:32:32 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 26 Sep 2014 22:32:32 +0200 Subject: Livre: Fouille de Donnees et Humanites Numeriques Message-ID: Date: Wed, 24 Sep 2014 13:17:25 +0200 From: Nicolas Turenne Message-ID: <5422A845.5000308 at yahoo.fr> X-url: http://editions-rnti.fr/?procid=100158 Ch?res et chers coll?gues, J'ai le plaisir de vous informer de la parution de l'ouvrage collectif : "Fouille de Donn?es et Humanit?s Num?riques" sous forme papier et eBook. http://editions-rnti.fr/?procid=100158 Cet ouvrage donne un ?clairage sur quelques usages des techniques d'analyse statistique et d'exploration de donn?es dans des datasets issus des Sciences Humaines et Sociales. Bien cordialement, Nicolas Turenne Charg? de Recherches en sciences des donn?es ? l'unit? INRA-SenS (future UMR LISIS) Universit? Paris Est. - Bat. Bois de l'Etang. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 26 20:28:53 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 26 Sep 2014 22:28:53 +0200 Subject: Conf: COLDOC2014, programme et inscription en ligne, 13-14 novembre 2014, Universite de Nanterre Paris Ouest Message-ID: Date: Wed, 24 Sep 2014 13:09:57 +0200 From: ColDoc 2014 Message-ID: X-url: http://coldoc2014.free.fr/?lg=fr&p=prog X-url: http://coldoc2014.free.fr/?lg=fr&p=registration X-url: http://coldoc2014.free.fr/ Bonjour, Merci de bien vouloir diffuser cette information largement. La onzi?me ?dition de COLDOC - le colloque des Jeunes Chercheurs et Doctorants en Sciences du Langage organis? par le laboratoire MoDyCo - se d?roulera cet automne, les 13 et 14 novembre, ? l?universit? de Nanterre Paris Ouest. Cette ann?e, nous avons choisi le th?me suivant : La diversit? des langues - les universaux linguistiques ? l??preuve des faits de langue. Le programme de COLDOC 2014 est en ligne ! [lien programme : http://coldoc2014.free.fr/?lg=fr&p=prog ] Nous esp?rons vous voir nombreux pour soutenir les travaux de ces jeunes chercheurs en Sciences du Langage. L?inscription est gratuite et se fait sur le site du colloque. [lien inscription : http://coldoc2014.free.fr/?lg=fr&p=registration ] Bien cordialement, Le comit? d'organisation de COLDOC 2014 (http://coldoc2014.free.fr/) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Sep 26 20:38:10 2014 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 26 Sep 2014 22:38:10 +0200 Subject: Appel: 2nd Symposium LKE (LKE'2014) Puebla, Mexico Message-ID: Date: Fri, 26 Sep 2014 09:23:39 +0200 From: Juan-Manuel Torres Message-ID: <5425147B.4040201 at univ-avignon.fr> X-url: http://donaji.cs.buap.mx/lke X-url: https://easychair.org/conferences/?conf=lke2014 2nd Symposium LKE (LKE'2014) ------------------------------------------------------------------------ First Call for Papers 2nd International Symposium on Language & Knowledge Engineering (LKE'2014) December 4th and 5th, Puebla, Mexico http://donaji.cs.buap.mx/lke The 2nd International Symposium on Language & Knowledge Engineering (LKE?2014) will be held in Puebla, Mexico. LKE?2014 is organized by the Language & Knowledge Engineering Lab of the Faculty of Computer Science, Benem?rita Universidad Aut?noma de Puebla. LKE?2014 will be a forum for exchanging scientific results and experiences, as well as sharing new knowledge, and increasing the co-operation between research groups in natural language processing and related areas. Topics Authors are invited to submit contributions including, but not limited to the following general areas: - Natural Language Processing - Knowledge engineering - Pattern recognition - Artificial Intelligence - Computer Science Some examples of the particular topics would be: - Clustering - Word sense disambiguation - Ontology analysis, creation & evaluation - Plagiarism detection - Sentiment analysis - Fuzzy logic and soft computing - Software tools for AI - Expert systems - Decision support systems - Automated problem solving - Knowledge discovery, representation and/or acquisition - Data and Text mining - Semantic web - Intelligent agents - Databases - AI and evolutionary algorithms - Intelligent tutoring systems - Reasoning strategies - Distributed AI algorithms and techniques - Heuristic searching methods - Languages and programming techniques for AI - Constraint-based reasoning and constraint programming - Evaluation of AI tools - Social intelligence (markets and computational societies) - Emerging technologies - Machine Learning; Models, Technologies and Applications - Pattern Recognition Principles - Robotics & Remote Sensing Applications of Pattern Recognition - Voice and Speech Recognition - Applications (including: computer vision, signal processing, military, surveillance, robotics, medicine, pattern recognition, face recognition, finger print recognition, finance and marketing, stock market, education, emerging applications, ?) Paper Submission and Review Process All the papers will be blind submitted (author?s names are not allowed) either in English or Spanish, and could be presented at any of these two languages. All submissions will be peer reviewed by the Scientific Committee, for originality, technical content and relevance. The final acceptance will be based upon double blind peer review of the full-length paper. All accepted papers will be published in an Special issue of the Research in Computing Science Journal, ISSN 1870-4069 (Indexed by DBLP, LatIndex, Periodica). The papers should be submitted electronically before October 16th, 2014 at the easychair system: https://easychair.org/conferences/?conf=lke2014. The format of paper is identical to Springer LNCS series format (though the journal is not published by Springer). You can find useful these formatting tips. Papers that do not follow these format requirements may be rejected without review or may be not included in the journal even if they were accepted for publication. Submission implies the willingness of at least one of the authors to register and to present the communication at the conference, if it is accepted. Local chair - David Pinto, Ph. D., LKE-BUAP, Puebla, M?xico Important Dates - Paper Submission Deadline: October 15th, 2014 - Notification of acceptance: November 3rd, 2014 - Camera-ready submission: November 15th, 2014 - Symposium: December 4th and 5th, 2014 Conference Venue Faculty of Computer Science, Benem?rita Universidad Aut?noma de Puebla.Av. San Claudio y 14 Sur, Ciudad Universitaria, C.P. 72570, Puebla, Puebla. M?xico. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From aascitNews at TECHNOLOGYDEVELOPPED.NET Sun Sep 28 16:29:24 2014 From: aascitNews at TECHNOLOGYDEVELOPPED.NET (aascitNews) Date: Sun, 28 Sep 2014 10:29:24 -0600 Subject: Invitation for joining AASCIT to get free publication Message-ID: An HTML attachment was scrubbed... URL: