From thierry.hamon at UNIV-PARIS13.FR Sun Nov 3 17:08:11 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 3 Nov 2013 18:08:11 +0100 Subject: Appel: NooJ 2014 International Conference Message-ID: Date: Thu, 31 Oct 2013 23:08:27 +0100 From: "MONTI JOHANNA -Professore associato scienze umanistiche e sociali-d" Message-Id: <20131031215718.M21698 at uniss.it> X-url: http://nooj2014.uniss.it X-url: http://www.nooj4nlp.net/ International Nooj 2014 Conference June 3-5, University of Sassari - Italy Call for Papers http://nooj2014.uniss.it Submission deadline: 1 February 2014 at 24:00 CET (GMT+1) NooJ is a linguistic development environment that allows linguists to formalize several levels of linguistic phenomena: - typography and spelling; - lexicons of simple words, multiword units and discontinuous expressions; - inflectional, derivational and agglutinative morphology; - local and structural syntax; - transformational syntax and paraphrase generation; - semantic analysis and machine translation. For each of these levels NooJ provides linguists with one or more formal tools specifically designed to facilitate the description of each phenomenon, aswell as parsing/development/debugging tools designed to be as computationallyefficient as possible, from Finite-State to Turing machines. The integrationof all the linguistic levels in one compatible platform distinguishes NooJfrom other computational linguistic frameworks which provide a uniqueformalism, incompatible with others. As a corpus processing tool, NooJ allows researchers in various socialsciences to extract information from corpora by applying sophisticated queriesbased on concepts and relations (rather than word forms) and automaticallybuild concordances, add semantic annotations, and perform statistical analyses. NooJ has been endorsed by the Meta-Share CESAR Project of theEuropean Community, is now available as a JAVA open source package and runsunder Windows LINUX and Mac OSX platforms. NooJ linguistic modules for over 20languages are freely available at www.nooj4nlp.net. The NooJ conference intends to: - give NooJ users and researchers in Linguistics and in ComputationalLinguistics the opportunity to meet and share their experience as developers, researchers and teachers; - present to NooJ users the latest linguistic resources and NLP applications developed for/with NooJ, its latest functionalities, as well as its futuredevelopments; - offer researchers and graduate students two tutorials (one basic and oneadvanced) to help them parse corpora and build NLP applications using NooJ; - provide the occasion to present and discover the recent developments of NooJitself (v3). Topics of interest Linguistic resources: Typography, Spelling, Morphology, Lexical Analysis,Local Syntax, Structural Syntax, Transformational Analysis, ParaphraseGeneration, Semantic annotations, Semantic analysis. Corpus processing: Corpus Linguistics, Information extraction, DiscourseAnalysis, Business Intelligence, NLP applications. Submission of abstracts Please send one abstract (up to 1 page, 400-600 words) in English to https://www.easychair.org/conferences/?conf=nooj2014. The deadline for the submission of the abstracts is February 1st, 2014. Notifications of acceptance will be sent by March 17th, 2014. Scientific Committee Abdelmajid Ben Hamadou (Institut Supérieur d'Informatique, Sfax, Tunisia) Xavier Blanco (Autonomous University of Barcelona, Spain) Krzysztof Bogacki (University of Warsaw, Poland) Pierrette Bouillon (University of Geneva, Switzerland) Thierry Declerck (DFKI GmbH, Germany) Svetla Koeva (University of Sofia, Bulgaria) Kimmo Koskenniemi (University of Helsinki, Finland) Peter Machonis (Florida International University, USA) Bernardo Magnini (FBK-Irst, Italy) Slim Mesfar (RIADI, ENSI, University of Manouba, Tunisia) Ruslan Mitkov (University of Wolverhampton, UK) Mario Monteleone (University of Salerno, Italy) Johanna Monti (University of Sassari, Italy) Adam Przepiórkowski (ICS, Polish Academy of Sciences, Poland) Jan Radimsky (University of South Bohemia, Czech Republic) Max Silberztein (Université de Franche-Comté, France) Marko Tadic (University of Zagreb, Croatia) François Trouilleux (Université Blaise-Pascal, France) Tamás Váradi (Hungarian Academy of Sciences, Hungary) Simonetta Vietri (University of Salerno, Italy) Organizing Committee Johanna Monti (University of Sassari, Italy) Max Silberztein (University de Franche-Comté, France) Mario Monteleone (University of Salerno, Italy) Maria Pia di Buono (University of Salerno, Italy) Marco Javarone (University of Sassari, Italy) Contact For any enquiries regarding the workshop please send an email to Johanna Monti (nooj2014 at uniss.it). Important dates Abstract submission: February 1st. Notification of acceptance: March 17th. Registration starts April 15th. Conference web site: nooj2014.uniss.it ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Nov 3 17:04:02 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 3 Nov 2013 18:04:02 +0100 Subject: Job: Ingenieur(e) R&D Traitement Automatique des Langues Polyvalent, XiKO Message-ID: Date: Wed, 30 Oct 2013 23:19:02 +0100 From: Gaël Patin Message-ID: Ingénieur(e) R&D Traitement Automatique des Langues Polyvalent XiKO Technologies se lance dans le développement de sa solution d’analyse de données conversationnelles. Elle recherche pour cela un ingénieur R&D spécialisée dans le traitement automatique des langues. Nous recherchons de préférence un profil de type scientifique (Doctorant(e) ou Jeune Docteur(e)) ou ingénieur R&D. Le/la candidat(e) doit avoir un esprit curieux et ouvert. Il/Elle doit être en capacité d’émettre et de recevoir des critiques constructives. Pragmatique, il/elle doit être capable d’imaginer des solutions en prenant en compte les contraintes de temps, de complexité et de ressources disponibles. L’ingénieur(e) va être techniquement et scientifiquement confronté à des problématiques complexes : techniques de catégorisation agiles, systèmes de gestion rationnelle des ressources linguistiques, remise en cause des paradigmes de normalisation linguistique pour traitement automatique des langues, algorithmique pour la gestion de plusieurs millions de documents, etc. Fonctions : * Aide à la conception fonctionnelle et technique du système. * Participation à la conception de technologies innovantes pour l’analyse et la découverte d’information dans les textes. * Développement de la solution logicielle. * Soutien au développement de l’infrastructure technique de l’entreprise. Intérêts attendus : * Intérêt certain pour le Traitement Automatique des Langues en général. * Bonne connaissance des techniques de recherche d’information. * Intérêt pour le web sémantique et la gestion des connaissances. Compétences requises : * Développement Java confirmé, connaissance éventuelle de JEE. * Bonnes pratiques dans le développement des applications (cycles de vie, design pattern, agilité). * Bonne connaissance système Linux. Expériences appréciées : * Système d’indexation (i.e. Solr/Lucence). * Machine Learning (supervisé et non supervisé). * Montage de Webservice type Saas et mise à l’échelle d’applications en ligne. * Maitrise d’une langue autre que le français ou l’anglais. Salaire : * A négocier selon le profil et l’expérience. * Convention CIFRE envisageable. Avantages sociaux : * Mutuelle : excellente couverture avec prise en charge à 70%. * Ticket Restaurants. Envoyez votre CV ou profil Linkedin et lettre ou mail de motivation à : contact at xiko.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Nov 3 17:05:17 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 3 Nov 2013 18:05:17 +0100 Subject: Appel: Deadline Extension, Elsevier KBS special issue on Big Data for Social Analysis (BDSA) Message-ID: Date: Thu, 31 Oct 2013 11:58:32 +0800 From: Erik Cambria Message-ID: X-url: http://sentic.net/bigdata Apologies for cross-posting, The deadline for the Elsevier KBS special issue on Big Data for Social Analysis (http://sentic.net/bigdata) has been extended to November 22nd. RATIONALE The textual information available on the Web can be broadly grouped into two main categories: facts and opinions. Facts are objective expressions about entities or events. Opinions are usually subjective expressions that describe people's sentiments, appraisals, or feelings towards such entities and events. Much of the existing research on textual information processing has been focused on mining and retrieval of factual information, e.g., text classification, text recognition, text clustering, and many other text mining and natural language processing (NLP) tasks. Little work had been done on the processing of opinions until only recently. One of the main reasons for the lack of study on opinions is the fact that there was little opinionated text available before the recent passage from a read-only to a read-write Web. Before that, in fact, when people needed to make a decision, they typically asked for opinions from friends and family. Similarly, when organizations wanted to find the opinions or sentiments of the general public about their products and services, they had to specifically ask people by conducting opinion polls and surveys. However, with the advent of the Social Web, the way people express their views and opinions has dramatically changed. They can now post reviews of products at merchant sites and express their views on almost anything in Internet forums, discussion groups, and blogs. Such online word-of-mouth behavior represents new and measurable sources of information with many practical applications. Nonetheless, finding opinion sources and monitoring them can be a formidable task because there are a large number of diverse sources and each source may also have a huge volume of opinionated text. In many cases, in fact, opinions are hidden in long forum posts and blogs. It is extremely time-consuming for a human reader to find relevant sources, extract related sentences with opinions, read them, summarize them, and organize them into usable forms. Thus, automated opinion discovery and summarization systems are needed. Big social data analysis grows out of this need and it includes disciplines such as social network analysis, multimedia management, social media analytics, trend discovery, and opinion mining. The opportunity to capture the opinions of the general public about social events, political movements, company strategies, marketing campaigns, and product preferences, in particular, has raised growing interest both within the scientific community. All the opinion-mining tasks, however, are very challenging. Our understanding and knowledge of the problem and its solution are still limited. The main reason is that it is a NLP task, and NLP has no easy problems. Another reason may be due to our popular ways of doing research. So far, in fact, researchers have probably relied too much on traditional machine-learning algorithms. Some of the most effective machine-learning algorithms, in fact, produce no human understandable results such that, although they may achieve improved accuracy, little about how and why is known, apart from some superficial knowledge gained in the manual feature engineering process. All such approaches, moreover, rely on syntactical structure of text, which is far from the way human mind processes natural language. TOPICS Articles are thus invited in area of knowledge-based systems for big social data analysis. The broader context of the Special Issue comprehends artificial intelligence, knowledge representation and reasoning, natural language processing, and data mining. Topics include, but are not limited to: - Knowledge-based systems for big social data analysis - Biologically inspired opinion mining - Concept-level opinion and sentiment analysis - Knowledge-based systems for social media retrieval and analysis - Knowledge-based systems for social media marketing - Social network modeling, simulation, and visualization - Semantic multi-dimensional scaling for sentiment analysis - Knowledge-based systems for patient opinion mining - Sentic computing - Multilingual and multimodal sentiment analysis - Multimodal fusion for continuous interpretation of semantics - Knowledge-based systems for time-evolving sentiment tracking - Knowledge-based systems for cognitive agent-based computing - Human-agent, -computer, and -robot interaction - Domain adaptation for sentiment classification - Affective common-sense reasoning - Knowledge-based systems for user profiling and personalization The Special Issue also welcomes papers on specific application domains of knowledge-based systems for big social data analysis, e.g., influence networks, customer experience management, intelligent user interfaces, multimedia management, computer-mediated human-human communication, enterprise feedback management, surveillance, art. TIMEFRAME November 22nd, 2013: Paper submission deadline December 24th, 2013: Notification of acceptance January 24th, 2014: Final manuscript due April/May, 2014: Publication SUBMISSION AND PROCEEDINGS The Special Issue will consist of papers on novel methods and approaches that further develop and apply knowledge-based techniques in the context of natural language processing and big social data analysis. Some papers may survey various aspects of the topic. The balance between these will be adjusted to maximize the issue's impact. All articles are expected to successfully negotiate the standard review procedures for Elsevier Knowledge-Based Systems. Contributions are invited in the form of original high-quality research and review papers (preferably no more than 20 double line spaced manuscript pages, including tables and figures), following the formatting style for Elsevier. A submission that has already been published in conference proceedings has to be submitted as more than 45% update in comparison to the published version. The title page should not include name, affiliation, and e-mail address of the authors. All paper has to be submitted through thejournal electronic submission EES via the dedicated special issue. ORGANIZERS - Erik Cambria, National University of Singapore (Singapore) - Haixun Wang, Google Research (USA) - Bebo White, Stanford University (USA) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Nov 3 17:06:57 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 3 Nov 2013 18:06:57 +0100 Subject: Stage: Stage M2 recherche TAL, Lattice Message-ID: Date: Thu, 31 Oct 2013 16:07:59 +0100 From: Isabelle Tellier Message-Id: X-url: http://www.projet-orfeo.fr proposition de stage M2 recherche en informatique/TAL au Lattice (http://www.lattice.cnrs.fr) à Montrouge (tout près de Paris) Ce stage a pour objectifs de tester et adapter des algorithmes d'apprentissage automatique pour le repérage des expressions référentielles dans des textes écrits ainsi que pour l'identification des chaînes de coréférence. Pour ce faire, le travail s'appuiera sur l'exploitation d'un corpus de petite taille, déjà annoté en référence et en coréférence (projet MC4, Modélisation Contrastive et Computationnelle des Chaînes de Coréférence). Un premier aspect du travail consistera à faire passer sur le texte de départ un ensemble d'outils libres et/ou développés à Lattice : analyse morphosyntaxique, segmentation en chunk, repérage d'entités nommées. Les résultats obtenus permettront d'enrichir les données initiales, qui serviront ensuite pour la deuxième étape, au coeur du sujet, consistant à tester différentes méthodes d'apprentissage automatique pour l'identification des expressions référentielles et des chaînes de coréférence (plusieurs passes pourront être nécessaires pour cela). Pour que ce stage de M2 puisse s'opérer efficacement, le candidat devra avoir des connaissances solides en linguistique de corpus et traitement automatique des langues, des compétences pour l'écriture de scripts (PERL, PYTHON, voire JAVA : il faudra traiter des problèmes de transformation de formats de fichiers) et des connaissances ainsi qu'un intérêt pour les techniques d'apprentissage automatique. Le stage peut durer de 4 à 6 mois au sein du Lattice, à partir de 2014, il sera encadré par Frédéric Landragin (http://fred.landragin.free.fr) et Isabelle Tellier (http://www.lattice.cnrs.fr/sites/itellier/) et sera financé (au tarif stage : ⅓ Smic) par le projet ANR Orfeo (http://www.projet-orfeo.fr). envoyer CV + lettre de motivation à frederic.landragin at ens.fr et isabelle.tellier at univ-paris3.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 20:31:53 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 21:31:53 +0100 Subject: Ecole: Stage NooJ, INALCO, 20-24 janvier 2014 Message-ID: Date: Mon, 4 Nov 2013 12:43:21 +0100 From: Max Silberztein Message-Id: *************************** Stage intensif NooJ à l’INALCO 20-24 janvier 2014 65 rue des Grands Moulins, 75013 Paris *************************** NooJ est un environnement de développement utilisé pour formaliser huit niveaux de phénomènes linguistiques : orthographe et typographie, morphologie flexionnelle et dérivationnelle, syntaxe locale et structurelle, grammaire transformationnelle et analyse sémantique. NooJ contient des outils informatiques adaptés à chaque type de phénomène (grammaires rationnelles, hors contexte, contextuelles et non restreintes) et permet de développer des ressources à large couverture dans une perspective de linguistique descriptive. NooJ est utilisé par des linguistes pour formaliser les langues et appliquer les descriptions linguistiques à des corpus de textes, par des chercheurs en sciences sociales pour effectuer des analyses historiques, littéraires, sociologiques ou psychologiques de corpus, et aussi par des entreprises pour extraire et annoter des informations scientifiques et techniques, notamment en intelligence économique. NooJ est gratuit, est disponible en open source JAVA et fonctionne sous Windows, Mac OSX, LINUX et Unix cf. www.nooj4nlp.net. Le stage s’adresse particulièrement aux étudiants de Master, doctorants et chercheurs intéressés par la linguistique descriptive et la linguistique de corpus ainsi que par l’analyse automatique de textes dans une perspective de sciences humaines et industrielle. Les étudiants en Master qui peuvent et désirent valider le stage auprès de leur université doivent me prévenir dès leur inscription. Le stage est gratuit et dure une semaine. **** ATTENTION **** : les places sont limitées : il faut s’inscrire en envoyant son nom, son statut (étudiant / doctorant / chercheur / industriel / autre) et le nom de son institution à : max.silberztein at univ-fcomte.fr. Les matins sont dédiés au cours et aux travaux dirigés ; pendant les après-midis, des chercheurs et doctorants présenteront diverses applications de NooJ en linguistique, en science sociale et dans le monde industriel. Voici le programme : Lundi 20 janvier 9H-12H30 : Fouille de texte : textes et corpus, requêtes et concordances, analyses statistiques. 14H-16H : Deux conférences Mardi 21 janvier 9H-12H30 : Lexique & morphologie : Unités Linguistiques Atomiques, dictionnaires, flexion et dérivation. 14H-16H : Deux conférences Mercredi 22 janvier 9H-12H30 : Syntaxe locale : requêtes syntaxiques, grammaires locales, annotation automatique de textes, extraction d’entités nommées. 14H-16H : Deux conférences Jeudi 23 janvier 9H-12H30 : Syntaxe structurelle : Grammaires hors contexte, contraintes d’accord et arbres structurels. 14H-16H : Deux conférences Vendredi 24 janvier 9H-12H30 : Sémantique : Analyse transformationnelle et génération de paraphrase automatique, levée d’ambiguïté sémantique, traduction 14H-16H : Deux conférences ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 21:02:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 22:02:04 +0100 Subject: Seminaire: Centre d'Alembert, Programme 2013-2014 Message-ID: Date: Tue, 5 Nov 2013 11:20:58 +0100 From: Centre d'Alembert Message-Id: X-url: http://www.centre-dalembert.u-psud.fr Bonjour, Nous sommes heureux de vous annoncer le nouveau programme de séminaires du Centre d'Alembert, pour l'année 2013-2014 : "Les sciences comme biens communs" La notion de « biens communs » renvoie à l'idée d'une ressource relevant d'une appropriation, d'un usage et d'une exploitation collectifs. Il s'agit donc d'un ensemble de biens, pas nécessairement matériels - il peut par exemple s'agir d'une culture, de méthodes de pensées, de façons d'agir, de savoirs divers - qui appartiennent à une communauté ou dont une communauté a un usage partagé. Ce partage d'une ressource collective implique l'idée de règles d'accès qui permettent la préservation de la ressource et garantissent son usage commun. La notion de « biens communs » renvoie donc aussi à la question de la gestion démocratique de ces biens. Qu'est-ce qui dans les sciences, dans leur pluralité d'objets, de disciplines, peut faire « biens communs »? Le séminaire de cette année sera l'occasion de réfléchir à ce qui, dans les pratiques disciplinaires, et/ou dans l'usage social qui est fait des productions scientifiques, relève ou non de ces différents aspects de la notion de « biens communs ». Nous nous demanderons, par exemple, si nous pouvons comprendre nos différentes disciplines comme « culture » et si cette culture devient un « bien commun ». Et si les sciences et les savoirs qu'elles produisent sont des « biens communs », quelles conséquences cela a-t-il pour un « usage social » de la science comme « biens communs » ? Première séance le mercredi 20 novembre. Programme détaillé mis à jour et contact : Web : http://www.centre-dalembert.u-psud.fr Mél. : centre.dalembert at u-psud.fr Les séances ont lieu à la Faculté des Sciences d'Orsay, bâtiment des colloques (338) de 13h45 à 15h45 (entrée libre) Accès : http://goo.gl/maps/cXezZ -------------------------------- Séance du mercredi 20 novembre 2013 "LES MATHÉMATIQUES : DES BIENS COMMUNS ?" Bernard BRU Ancien professeur de mathématiques à l'Université Paris 5, spécialiste d'histoire du calcul des probabilités et de la statistique. Jeu de dés et biens communs On présentera rapidement le calcul des probabilités et ses applications, avec un point de vue d'historien. On se demandera ensuite dans quelle mesure et de quelles façons la théorie des probabilités peut être profitable à la nation en général et à chacun de ses citoyens en particulier. On évoquera à ce propos les thèses classiques de Condorcet sur le rôle du calcul dans la recherche de la vérité et de la justice. Pierre PANSU Professeur à l'Université Paris-Sud, Laboratoire de Mathématiques d'Orsay. Les Mathématiques pour la Planète Terre en partage. A l'aide de quelques pages du site mpt2013.fr, on décrira la genèse de progrès mathématiques récents qui ont eu un impact direct sur la société. D'autres sciences y sont mêlées indirectement, ce qui nous conduira à un second constat : la construction du savoir mathématique n'est pas réservée aux mathématiciens, elle est partagée. Animateur de la séance : Yves LE JAN Laboratoire de Mathématiques d'Orsay, Université Paris-Sud -------------------------------- Dates 2013-2014 : - 20/11/2013 - 04/12/2013 - 18/12/2013 - 15/01/2014 - 29/01/2014 - 12/02/2014 - 13/03/2014 - 26/03/2014 - 09/04/2014 NB : Nous vous invitons à consulter régulièrement notre site Internet, des modifications pouvant intervenir, en cas de force majeure, dans la planification. Nous vous remercions pour l'intérêt que vous portez aux activités du Centre. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 20:57:29 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 21:57:29 +0100 Subject: Stage: stage M2 en TAL, Syllabs (Paris) Message-ID: Date: Tue, 5 Nov 2013 12:38:59 +0100 From: Helena Blancafort Message-ID: ------------------------------------------------------------------------ Offre de stage M2 en TAL à Syllabs (Paris) ------------------------------------------------------------------------ ------------------------------------------------------------------------ Caractérisation des objets touristiques pour l'extraction de facettes dans le tourisme ------------------------------------------------------------------------ Syllabs travaille depuis un certain temps sur des outils de TAL appliqués au tourisme, que ce soit dans un contexte de web mining, de text mining ou de production de contenus.Dans le cadre de Tourinflux, projet de recherche multi-partenaire en cours, Syllabs doit produire des bases de connaissances se rapportant à des objets touristiques (hôtels, etc.). Ce projet vise à apporter aux acteurs du tourisme (d’abord les institutionnels mais aussi les acteurs privés) un ensemble d’outils leur permettant de gérer à la fois leurs données internes et les informations disponibles sur le web afin de mieux comprendre comment un territoire est perçu et de mieux agir sur cette perception. C’est dans ce contexte que se situe le stage. Celui-ci comporte plusieurs étapes et objectifs. La durée du stage ne permettra peut-être pas de tout couvrir. ---------------------------- Descriptif du stage ---------------------------- 1) Modélisation d’une base de connaissances des objets touristiques - Créer une taxonomie (simple) des différents objets touristiques et étudier les facettes communes à plusieurs objets. - Déterminer les facettes utilisables pour la génération automatique des descriptifs - Déterminer les facettes nécessaires pour l’analyse d’avis d’internautes 2) Extraction des facettes via LOL (outil dédié à base de règles linguistiques) - Extraction des facettes présents dans les “descriptifs marchands” - Extraction des facettes présents dans les “avis internautes” 3) Création de la base à partir de la sortie d’extraction - Créer une base de données à partir de la sortie d’extraction, manipulation des objets extraits 4) Génération de descriptifs d’objets touristiques - écrire des règles de génération pour 2 objets touristiques différents en fonction de la base obtenue ------------------------ Profil souhaité ------------------------ - Aptitude pour la représentation formelle du langage. - Excellente capacité de communication et aptitude pour le travail d’équipe. - Bon niveau en python serait un plus. - Excellentes qualités rédactionnelles, goût pour l’écriture. Formation en cours : Linguistique Informatique, TAL ou similaire. Durée du stage : 6 mois (début entre janvier et avril, en fonction du cursus universitaire) Merci d’envoyer votre candidature à l’adresse jobs at syllabs.com en indiquant dans l’objet du mél « Stage TAL ». Lieu : Syllabs, 26 rue Notre Dame de Nazareth, 75003 Paris. Contrat : stage conventionné rémunéré en fonction du niveau d’étude. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 20:59:09 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 21:59:09 +0100 Subject: Appel: ESWC 2014 Message-ID: Date: Tue, 5 Nov 2013 17:39:31 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131105163951.CF3D6F986B at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/call-workshops ** apologies for cross-posting ** ==== Second Call for Workshops ==== http://2014.eswc-conferences.org/important-dates/call-workshops The organizers of the 11th ESWC 2014 cordially invite you to submit a workshop proposal. ESWC is a major venue for discussing the latest scientific results and innovations in the field of semantic technologies on the Web and Linked Data, attracting a high number of high quality submissions and participants from academia and industry alike. Co-located workshops at ESWC conferences are distinguished meeting points for discussing ongoing work and latest ideas related to semantic technologies and the Semantic Web. Of particular interest are workshop proposals with an interdisciplinary standpoint, proposals focusing on a specific technology of general interest, or gathering a sub-community. We encourage the submission of workshop proposals on: * Fundamental problems of the Semantic Web / Linked Data such as ontology mining, heterogeneity, scalability and distribution, uncertainty, etc. * Applications of Semantic Web technologies in specific domains, * Important enabling technologies and their adaptation to the needs of the Semantic Web, and * Aspects of Semantic Web research that have been neglected so far, * Techniques from other research fields that are of relevance for Semantic Web research (e.g., machine learning, NLP, data mining) # General Information and Criteria Each proposal will be reviewed by the members of the workshop programme committee, and ranked based on the overall quality of the proposal and the workshop's fit to the conference as detailed below. Their recommendation will determine the final decision on the acceptance/rejection of each proposal, which is to be taken by the workshop and tutorial chairs as well as by the local and the general chair of ESWC 2014. The criteria for judging the quality of workshop proposals are as follows: * Co-located workshops cover topics falling in the general scope of the ESWC conference. * Workshops are intended to be genuine interactive events and not mini-conferences. * We welcome workshops with creative structures and organizations that attract various types of contributions and ensure rich interactions. * Workshops should have a clear focus on a specific technology, problem or application. * There is potentially a significant community interested in the workshop's topic. * Workshop duration can be half a day or a full day. * We strongly advise having more than one organizer and no more than four, preferably from different institutions, bringing different perspectives to the workshop topic. In case overlapping workshops are proposed, the workshop chair may contact the organisers to discuss the possibility of merging workshops. Please note that the duration of a workshop might need to be adjusted based on the overall number of submissions received. Further, workshops that receive less than 5 submissions or have less than 10 people registered at the early registration deadline might be canceled. The organizers of accepted workshops will be responsible for their own reviewing process, publicity (e.g., website, timelines and call for papers), and proceedings production. They will be required to closely cooperate with the Workshop Chair and the ESWC 2014 local organizers to finalize all organizational details. Workshop attendees must pay the ESWC 2014 workshop registration fee, as well as the conference registration fee. Organizers of workshops and tutorials will get a free registration for workshops and tutorials at the pre-conference days, i.e. they will only have to pay the main conference fee. # Important Dates Workshop proposals due: Nov 22, 2013 - 23:59 Hawaii Time Notification of acceptance: Dec 6, 2013 - 23:59 Hawaii Time Workshop Web site due: Dec 16, 2013 - 23:59 Hawaii Time Workshop camera-ready proceedings due: Apr 25, 2014 - 23:59 Hawaii Time Workshop days: May 25 and May 26, 2014 # Suggested Timeline for Workshops Submission deadline: March 6, 2014 Notifications: April 1, 2014 Camera ready version: April 15, 2014 # Submission Guidelines Workshop proposals have to be submitted via Easychair. Each proposal must consist of a single PDF document written in English, not longer than 3 pages, which contains the following information: 1. The title and brief technical description of the workshop, specifying its goals and motivation. 2. A brief discussion of why the topic is of particular interest at this time. 3. A brief description of why and to whom the workshop is of interest, the workshop audience, as well as the expected number of participants. 4. A brief description (draft outline) of the proposed workshop format, discussing the mix of events and activities such as paper presentations, invited talks, panels, hacking session, or general discussion, and and an approximate timeline. 5. A list of (potential) members of the program committee (at least 50% have to be known and confirmed at the time of the proposal). 6. An indication of whether the workshop should be considered for a half-day or full-day event. 7. Related Workshops and Conferences: Is this the continuation of a workshop series or a new workshop to address an emerging issue? Please provide information about past versions of this workshop and other related workshops (including URLs and submission/acceptance counts, if available). 8. Names and contact information of the workshop organizers/chair(s) (name, affiliation, email address, homepage and short (one paragraph) biography of each chair, explaining the chair's expertise for the workshop including past experience in organizing/facilitating workshops). Preferably a single contact person per submission. The best papers of each workshop will be included in the supplementary proceedings of ESWC 2014, which will appear in the Springer LNCS series. # Workshop Chair Harald Sack (Hasso-Plattner Institute for IT Systems Engineering, DE) email: harald.sack at hpi.uni-potsdam.de # Programme Committee Abraham Bernstein (University of Zuerich, CH) Chris Bizer (University of Mannheim, DE) Jerome Euzenat (INRIA Grenoble Rhone-Alpes, FR) Dieter Fensel (University of Innsbruck, AT) Aldo Gangemi (CNR Institute of Cognitive Sciences and Technology, IT) Asuncion Gomez-Perez (Universidad Politecnica de Madrid, ES) Frank van Harmelen (VU University Amsterdam, NL) Manfred Hauswirth (DERI, National University of Ireland, Galway, IE) Pascal Hitzler (Kno.e.sis Center, Wright State University, Dayton, US) Enrico Motta (The Open University, Milton Keynes, UK) Rudi Studer (Karlsruhe Institute of Technology, DE) From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 20:45:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 21:45:03 +0100 Subject: Info: assemblee generale Consortium Corpus Ecrits, 22 novembre 2013, Paris Message-ID: Date: Mon, 04 Nov 2013 14:42:17 +0100 From: Secretariat General Message-ID: <5277A439.7070809 at ling.cnrs.fr> X-url: http://corpusecrits.corpus-ir.fr/ *Consortium « Corpus Écrits »* *Assemblée générale du 22 novembre 2013* ILF - Paris, le 4novembre 2013 Chères Collègues, ChersCollègues, Nous organisons notre réunion plénière annuelle le vendredi 22 novembre 2013, de 9h30 à 18h,à l'INALCO, 62 rue des Grands Moulins à Paris dans le 13^ème arrondissement. Cette réunion sera consacrée à la présentation de notre bilan et aux perspectives. *_PROGRAMME_*__ - Présentation - Bilans par thèmes des réalisations - Présentation des actions des groupes de travail - Formations réalisées et/ou nécessaires - Présentation de l'Initiative Corpus de références du Français - Appel d'offres 2014 : Quels critères, quelles thématiques, quel budget ? - Quelles attentes, quels projets en 2014 et 2015 pour le Consortium Corpus Ecrits La participation de toutes les personnes intéressées par cette journée est vive ment encouragée par le comité de pilotage, qu'elles soient ou non inscrites à un groupe de travail. Si la participation à ces journées est libre, l'inscription est obligatoire et très rapide. Il vous convient de vous enregistrer en vous connectant à : http://french.jotform.com/form/32943348795872 Le consortium peut contribuer au financement des missions des participants actifs des groupes de travail. Au plaisir de vous accueillir nombreux ce 22 novembre 2013, Pour le comité de pilotage du Consortium « Corpus écrits » Franck Neveu, Directeur de l'ILF http://corpusecrits.corpus-ir.fr/ Le comité de pilotage du Consortium « Corpus écrits » : Franck Neveu pour l'ILF, FR 2393 - Porteur du consortium Sylvie Archaimbault pour HTL - UMR 7597 - Université Denis Diderot - Paris 7 Thierry Chanier pour le LRL - EA 999 - Université Blaise Pascal - Clermont-Ferrand Serge Heiden pour ICAR - UMR 5191 - Université Lumière Lyon 2 Véronique Magri pour BCL - UMR 6039 - Université Nice Sophia Antipolis Jean-Marie Pierrel pour l'ATILF - UMR 7118 - Nancy - Université Clément Plancq pour le LLF - UMR 7110 - Université Denis Diderot - Paris 7 Céline Poudat pour le LDI - UMR 7187 - Université de Paris 13 Benoît Sagot pour ALPAGE - INRIA- Université Denis Diderot - Paris 7 Rudolph Sock pour LILPA - EA 1339 - Université de Strasbourg Agnès Tutin pour le LIDILEM - EA 609 - Université Grenoble 3 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:43:22 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:43:22 +0100 Subject: Appel: VitrineHN/DHShowcase 2014, Montreal Message-ID: Date: Wed, 6 Nov 2013 18:59:22 -0500 From: Louis Chartrand Message-ID: X-url: http://www.lanci.uqam.ca/DHShowcase/ ——————————————— *English follows* *Appel d'activité – VitrineHN 2014* Les technologies numériques déferlent sur les sciences sociales et les lettres, apportant avec elles l'espoir des grands changements. Cependant, sous la surface des avancées prometteuses en termes de démocratisation du savoir et de facilitation du travail de recherche, le potentiel de l'informatique en nos disciplines est largement inexploré. Aussi ces eaux sont-elles le domaine privilégié de la créativité et de l'audace. La VitrineHN est un espace informel où les chercheur·ses des humanités numériques peuvent partager leur ingéniosité, et réinventer ensemble la façon dont les lettres et les sciences sociales seront étudiées, enseignées et appréciées. Format Cette année, VitrineHN vous demande de faire une affiche, que vous devrez exposer dans une présentation-éclair de 5 minutes, qui sera suivie d'une période de questions. Après un blitz de présentations, les participant· es seront invitées discuter des affiches en prenant bouchées et raffraichissements. La prochaine édition de VitrineHN aura lieu à l'UQAM (Montréal) le vendredi 24 janvier 2014. Inscription Vous travaillez dans les humanités numériques ? Que votre projet soit bien achevé ou en développement, qu'il s'agisse d'application ou de théorie, on veut vous entendre ! Inscrivez-vous maintenant ! (http://www.lanci.uqam.ca/DHShowcase/inscription.html) *Date limite* : vendredi 20 décembre 2013 *Adresse *: http://www.lanci.uqam.ca/DHShowcase/ * * * *Call for papers – DHShowcase 2014* As digital technologies are pouring out on the shores of social science and humanities, they are bringing about promises of change and improvements. However, despite impressive progress in democratizing content and facilitating research, the potential of computers remains largely underdeveloped. As such, these waters are full of opportunities for audacious and creative people. DHShowcase is an informal space where digital humanities students and researchers are invited to share their ingeniosity, and reinvent the way we study and enjoy social science and humanities. Format In this 2014 edition, DHShowcase invites you to make a poster and present your research in 5 minutes (followed with a short question period). After a blitz of presentations, participants will be invited to discuss posters with snacks and beverages. DHShowcase will be held in UQAM, Montréal, on Friday, January 24, 2014. Submissions You or your team are working with the digital humanities? Whether your project is complete or in development, whether it is application or theory, we want to hear about it! Please submit a proposition ! (http://www.lanci.uqam.ca/DHShowcase/inscription.en.html) *Deadline* : December 20, 2013 *URL *: http://www.lanci.uqam.ca/DHShowcase/index.en.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:15:01 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:15:01 +0100 Subject: Job: CDD 18 mois Extraction d'entites specifiques (Apprentissage, Desambiguisation et Linking), CEA LIST Message-ID: Date: Thu, 07 Nov 2013 17:16:33 +0100 From: Message-ID: Le Laboratoire de Vision et d'Ingénierie des Contenus du CEA LIST emploie une cinquantaine chercheurs et ingénieurs travaillant sur l'analyse et l'interprétation de données multimédia (texte, image et analyse de vidéos). Le LVIC développe des algorithmes robustes pour l'extraction, l'analyse et le filtrage de grands volumes de données multimédia (texte, image, vidéo). La fusion de ces media permet une meilleure interprétation ou compréhension des scènes ou des documents. Nos technologies ont contribué à l'émergence de nouvelles activités économiques. En effet, ces technologies ont permis la création de startups comme Senseetive ou Ant’Inno. Par ailleurs, le laboratoire participe à de nombreux projets collaboratifs (ANR, Europe FP7, Pôle de Compétitivité) avec des partenaires académiques, PMEs ou grands industriels. Dans le cadre de plusieurs projets de la thématique "Traitement Automatique des Langues", le laboratoire LVIC recherche un ingénieur pour assister les chercheurs du laboratoire dans la conception, l'implémentation et l’évaluation de modules logiciels pour l’identification et le typage d’entités nommées. Les objectifs sont plus précisément : - intégrer plusieurs modèles d’identification et de typage d’entités nommées : modèle à base de règles (déjà implémenté dans le laboratoire) et modèle fondé sur un apprentissage statistique; - intégrer des bases de connaissances existantes de type encyclopédique (DBPedia, Geonames, etc.) dans ces modèles d’identification et de typage d’entités en gérant le problème du passage à l’échelle ; - développer des méthodes permettant d’identifier dans les textes des entités présentes dans une base de connaissances de référence et de lever les éventuelles ambiguïtés de rattachement lors de cette identification (entity linking) Le candidat devra candidat devra posséder une bonne maîtrise du développement en C++ sous Linux (base de code installée de plusieurs centaines de milliers de lignes) et connaître (ou être capable de se familiariser rapidement avec) des bibliothèques telles que STL, Xerces-C, Boost, gSoap, etc. Les compétences requises incluent également la maîtrise de principes de conception de type Design Patterns et d'outils développement tels que tels que gdb, valgrind, etc. Enfin, une connaissance des techniques du TAL (Traitement Automatique des Langues) ou des techniques d'apprentissage et de classification (SVM, CRF, etc.) est considérée comme fortement souhaitable. Le poste proposé est un CDD de 18 mois, rémunéré selon les grilles de salaire du CEA (dépendant de la formation et de l'expérience). Il sera basé sur le centre Nano'Innov, situé près du Campus de l’école Polytechnique à Palaiseau (91). Contact: Faiza GARA Email : faiza.gara at cea.fr Tel : 01 69 08 01 48 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:04:47 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:04:47 +0100 Subject: Appel: CORIA / CIFED 2014, Semaine du document numerique Message-ID: Date: Fri, 8 Nov 2013 10:55:30 +0100 From: Patrice Bellot Message-Id: <0134BFB9-49DF-4045-8D24-0460F40CC491 at univ-amu.fr> X-url: http://sdnri2014.loria.fr Semaine du Document Numérique et de la Recherche d'Information http://sdnri2014.loria.fr Date : 19-21 mars 2014 Lieu : Nancy L'ARIA (Association francophone de Recherche d'Information et Applications) et le GRCE (Groupement de Recherche en Communication écrite) ont décidé d'organiser simultanément les conférences CORIA et CIFED dans le cadre de la semaine du document numérique et de la recherche d’information (SDNRI) en mars 2014 à Nancy. CORIA et CIFED sont les points de rassemblement des communautés francophones respectivement en recherche d'information et en analyse de l'écrit et des documents numérisés. Tout en préservant les spécificités de chaque conférence, cette édition constituera une opportunité pour les deux communautés de se retrouver autour de thématiques pour lesquelles il existe des synergies de recherche (recherche de documents multimédia, modèle d'interaction avec l'utilisateur, passage à l'échelle de système de recherche de d'information, outils d'évaluation de performance pour la recherche d'information). L'objectif est le rassemblement de plus de 120 participants autour de sessions thématiques, spécifiques et communes. Pendant la conférence CIFED-CORIA 2014 seront également organisées les Rencontres Jeunes Chercheurs (RJC) en recherche d'information et en analyse de l'écrit et des documents numérisés. Elles ont pour objectif de permettre à tous les doctorants de présenter leur problématique de recherche, d’établir des contacts avec des équipes travaillant sur des domaines similaires ou connexes, et d’offrir à l’ensemble de la communauté un aperçu des axes de recherche actuels. Les travaux sélectionnés pour les RJC donneront lieu à une présentation orale et sous forme de poster. Les soumissions conjointes RJC et CIFED-CORIA sont autorisées. ============================================= Thématiques CIFED - Théorie et modèles pour la reconnaissance de formes en écrit et document - Méthodes d’analyse d’images, de segmentation et de reconnaissance de l’écrit - Numérisation, acquisition et compression - Analyse de dessins, plans, cartes, reconnaissance de graphiques, formules mathématiques - Traitement de documents en ligne, multimédia et web - Architectures matérielles et logicielles pour l’analyse d’images et la reconnaissance des formes - Extraction et structuration d’informations graphiques, manuscrites, structurées - Indexation de grandes base d’images de documents (bibliothèques, archives, formulaires, …) - Recherche/fouille d’information dans les images de documents et les écrits - Interrogation par l’exemple (CBIR, word spotting, symbol spotting, ...) - Reconnaissance de symboles, de l’écrit, des structures - O.C.R. et dématérialisation - Format et codage des documents et plasticité des documents - Encre électronique, nouvelles modalités d’acquisition et d’interaction - Interaction multipoints en conception de documents structurés - Camera-OCR, nouveaux dispositifs mobiles, ... - Reconnaissance de textes incrustés dans les vidéos - Reconnaissance de textes dans les scènes naturelles - Identification, authentification des écritures et des signatures manuscrites - Évaluation de performances ============================================= Thématiques CORIA - Théorie et modèles formels pour la RI : modèle logique, modèles de langages - Multilinguisme : Recherche d’information multilingue, traduction automatique - Multimédia (images, audio, vidéos, son, musique) : indexation, navigation, accès, interactions avec le texte, recherche d’information cross-média, fusion des informations - Passage à l’échelle : indexation, performances, architectures - Classification automatique, clustering, ranking, apprentissage automatique - Filtrage, routage, détection de nouveautés - Modélisation du contexte, personnalisation - Traitement Automatique de la Langue Naturelle pour la recherche d’information - Systèmes de Questions Réponses - Extraction d’informations : ontologies, ressources et recherche d’informations, détection d’entités nommées et des relations - Web : grands graphes, utilisation de la topologie du web, lois de puissances, citations, analyse de liens - RI et documents structurés : RI et XML, RI précise et recherche de passages - Réseaux sociaux : analyse de blogs et de sites communautaires, suivi de conversations, analyse de rumeurs, analyse de sentiments, détection d’opinion et des styles de vie - Recherche collaborative : filtrage, systèmes de recommandation - Interaction utilisateur : interrogation flexible, interfaces, visualisation, modélisation de l’utilisateur, accessibilité, indexation collaborative - Traitement et représentation des connaissances : logique floue, métadonnées, ontologies, web sémantique, web de données, ingénierie des connaissances - Bibliothèques numériques : RI sur des livres numérisés, robustesse, OCR et indexabilité - Systèmes de recherche d’information dédiés : recherche d’information génomique, géographique - RI distribuée : recherche d’information mobile, située, P2P - Outils pour la recherche d’information : évaluation, bancs d’essais, métriques, expérimentations qualitatives des systèmes Soumission des articles Les soumissions peuvent être faites en anglais ou en français. Les contributions peuvent concerner des travaux académiques ou des applications industrielles. Les textes de communications doivent comporter 16 pages maximum pour les soumissions à CIFED et CORIA et 10 pages maximum pour les journées RJC. Les articles soumis ou récemment acceptés à des conférences internationales sont recevables, sous réserve qu’ils soient traduits et adaptés pour CORIA ou CIFED. Une version étendue des meilleurs articles sera publiée dans une revue ou dans un livre. ============================================= Dates importantes - Soumission des articles : 15 décembre 2013 - Réponse aux auteurs : 15 janvier 2014 - Dépôt des articles définitifs : 15 février 2014 - Conférence : mercredi 19-21 mars 2014 Présidents des comités de programme CORIA-CIFED - Marie-Francine Moens (Computer Science, KU Leuven, Belgique) - Christian Viard-Gaudin (IRCCyN - Université de Nantes) Présidents du comité de programme RJC - Haïfa Zargayouna, LIPN, Université Paris 13 - Oriol Ramos-Terrades, Universitat Autònoma de Barcelona Président du comité d’organisation - Salvatore-Antoine Tabbone, LORIA-Université de Lorraine Vous trouverez sur le site http://sdnri2014.loria.fr toutes les informations sur les thématiques spécifiques et communes des conférences. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:23:40 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:23:40 +0100 Subject: Appel: The 37th Annual ACM SIGIR 2014 conference, Gold Coast Australia, July 6-11 Message-ID: Date: Wed, 6 Nov 2013 10:00:52 +1000 From: Richi Nayak Message-ID: X-url: http://sigir.org/sigir2014/ CALL FOR PAPERS, Submission Due: JAN 27, 2014 ACM SIGIR 2014: THE 37th ANNUAL CONFERENCE 6-11 July, 2014, Gold Coast, Australia Conference website: http://sigir.org/sigir2014/ SIGIR is the major international forum for the presentation of new research results and for the demonstration of new systems and techniques in the broad field of information retrieval (IR). The Conference and Program Chairs invite all those working in areas related to IR to submit original papers for review. SIGIR 2014 welcomes contributions related to any aspect of IR theory and foundation, techniques, and applications. Relevant topics include, but are not limited to: TOPICS * Document Representation and Content Analysis (e.g., text representation, document structure, linguistic analysis, NLP for IR, cross- and multi-lingual IR, information extraction, sentiment analysis, clustering, classification, topic models, facets, text streams) * Queries and Query Analysis (e.g., query intent, query suggestion and prediction, query representation and reformulation, query log analysis, conversational search and dialogue, spoken queries, summarization, question answering) * Retrieval Models and Ranking (e.g., IR theory, language models, probabilistic retrieval models, learning to rank, combining searches, diversity and aggregated search) * Search Engine Architectures and Scalability (e.g., indexing, compression, distributed IR, P2P IR, mobile IR, cloud IR) * Users and Interactive IR (e.g., user studies, user and task models, interaction analysis, session analysis, exploratory search, personalized search, social and collaborative search, search interface, whole session support) * Filtering and Recommending (e.g., content-based filtering, collaborative filtering, recommender systems) * Evaluation (e.g., test collections, experimental design, effectiveness measures, session-based evaluation, simulation) * Web IR and Social Media Search (e.g., link analysis, click models/behavioral modeling, social tagging, social network analysis, blog and microblog search, forum search, community-based QA, adversarial IR and spam, vertical and local search) * IR and Structured Data (e.g., XML search, ranking in databases, desktop search, entity search) * Multimedia IR (e.g., image search, video search, speech/audio search, music search) * Other Applications (e.g., digital libraries, enterprise search, genomics IR, legal IR, patent search, text reuse, new retrieval problems) CONTRIBUTION TYPES * Full papers (10 pages), Short papers (4 pages), Demos (3 pages), Tutorials, Workshops INSTRUCTION Requirements for paper format and appropriate content are described in the content guidelines. The requirements will be strictly enforced. Papers which do not conform to the requirements may be rejected without review, so please be sure to read this page carefully. SIGIR 2014 solicits proposals for tutorials of either half-day (3 hours plus breaks) or full day (6 hours plus breaks) on all topics of information retrieval and its applications. Each tutorial should cover a single topic in detail. Submissions should include a cover sheet and an extended abstract. Proposals for workshops to be held at ACM SIGIR 2014 are also solicited. Workshops will usually last for one day and will be held on Friday 11th July 2014. IMPORTANT DATES * 20 January 2014: Abstracts for full research papers due * 27 January 2014: Full research papers due * 3 February 2014: Workshop proposals due * 17 February 2014: Short paper, demonstration, and tutorial submission deadline * 18 April 2014: Paper, short paper, tutorial, and demonstration acceptance notifications * 11 May 2014: Camera ready copy due (note the short timeline due to early conference date) * 16 May 2014: Early bird registration deadline ORGANIZERS * General Chairs: Shlomo Geva, Andrew Trotman * PC Chairs: Peter Bruza, Charles L. A. Clarke, Kalervo Järvelin @Richi Nayak - Publicity Chair ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:33:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:33:23 +0100 Subject: Appel: Computer Speech and Language Special Issue on Hybrid Machine Translation Message-ID: Date: Wed, 6 Nov 2013 12:05:56 -0600 From: Marta Ruiz Message-ID: X-url: http://ees.elsevier.com/csl Hybrid Machine Translation focuses on combining the best properties of different Machine Translation (MT) paradigms. Nowadays, it is very popular to include linguistic features in Statistical Machine Translation (SMT) systems or to modify the standard Rule-based Machine Translation (RBMT) architecture to include statistical knowledge. Other ways of hybridization include the system combination techniques which may combine a rich variety of translation paradigms. This special issue in the prestigious Computer Speech and Language journal will cover different approaches from Hybrid Machine Translation and take advantage of the latest and leading research to discuss the progress in the field. This special issue invites contributions related to (but not limited): 1. theoretical and experimental design of hybrid MT architectures 2. experimental results with hybrid MT systems guided by corpus-based or rule-based systems 3. introduction of linguistics in corpus-based approaches 4. rule-based systems extended or built with statistical information 5. induction of lexical or grammatical transfer rules from corpora 6. description of open source tools and language resources for hybrid MT 7. description of computationally efficient algorithms for hybrid MT 8. applications of hybrid MT systems 9. hybrid methods applied to spoken language translation (SLT) 10. hybrid evaluation methods 11. system combination of different MT and SLT paradigms. *Submission procedure* Prospective authors should follow the regular guidelines of the Computer Speech and Language Journal for electronic submission (*http://ees.elsevier.com/csl*). During submission authors must select "SI: Hybrid Machine Translation" as Article Type. *Important dates: * 1st March 2014: Deadline for Submissions 1st June 2014: Notification of Resubmission 1st July 2014: Deadline for Resubmission 1st August 2014: Final Decision *Guest Editors:* Dr. Marta R. Costa-jussà, Institute for Infocomm Research, Singapore, *martaruizcostajussa at gmail.com* Prof. José A. R. Fonollosa, Universitat Politècnica de Catalunya, Barcelona, *jose.fonollosa at upc.edu* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:29:05 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:29:05 +0100 Subject: Appel: SWIP-Swiss Workshop on Prosody, PhonoGenres and Speaking Styles, Geneve, 10-11 septembre 2014 Message-ID: Date: Wed, 6 Nov 2013 17:49:31 +0100 From: Jean-Philippe Goldman Message-ID: X-url: http://www.unige.ch/lettres/linguistique/actualites/swip2014.html Second appel à communications 3ème SWIP - Swiss Workshop on Prosody Special Theme : PhonoGenres and Speaking Styles 10-11 Septembre 2014 - Université de Genève http://www.unige.ch/lettres/linguistique/actualites/swip2014.html SWIP (Swiss Workshop on Prosody) est un évènement annuel sur les avancées de recherches en prosodie, organisé en Suisse. Après le 1er SWIP à Zurich en 2012, et le 2ème à Neuchâtel en 2013, le 3ème SWIP aura lieu à Genève les 10 et 11 septembre 2014. Pour cette édition, la thématique principale porte sur les phonogenres et les styles de parole. Elle marquera la clôture des trois ans du projet FNS "Caractérisation prosodique et linguistique de phonogenres". La variation phonostylistique prosodique, qu’elle soit régionale, sociale, ou situationnelle, fait aujourd’hui l’objet de nombreuses études. Elles sont ponctuelles ou systématiques, empiriquement fondées sur l’étude phonétique-phonologique de corpus de grandes dimensions ou sur l’examen d’échantillons restreints. Les approches sont variées, entre les méthodologies systématiques et des procédures ad hoc. Ainsi, l’un des objectifs principaux de la conférence est de répertorier les différentes approches et de confronter leurs résultats. Les thèmes suivants peuvent être abordés: * phonogenres: dimensions phonético-prosodiques; variation situationnelle, communicative, micro- ou macro-sociale; analyses comparatives * styles de parole - clichés, idiosyncrasies, particularités remarquables * variation diachronique des phonostyles * identification des genres et des styles de discours * méthodologies et outils de traitement de corpus, avec un intérêt particulier pour l’étude phonostylistique et la variation phonostylistique Les contributions en dehors de ces thèmes sont également les bienvenues. Conférenciers Invités: Julia Hirschberg Philippe Boula de Mareüil Format de soumission: La soumission de la contribution consiste en deux étapes. Dans un premier temps, nous attendons pour le 1er février 2014 les propositions de contribution (une page + références) en français, ou en anglais. La soumission se fait au moyen de cette page EasyChair. https://www.easychair.org/conferences/?conf=swip3 Dans un deuxième temps, nous attendons pour le 1er juin 2014 la version définitive de l'article, en version courte (6 pages max., environ 2000 mots) ou longue (12 pages max., environ 4000 mots) en vue d'une publication dans les Nouveaux cahiers de linguistique française (papier et format électronique), à paraître pour le colloque. Les articles peuvent être rédigés en français ou en anglais avec un résumé dans l'autre langue. La mise en forme doit impérativement suivre ces consignes. http://clf.unige.ch/AppelPublication.php Veuillez noter que la langue de la conférence est l'anglais. Dates à retenir: Soumission de la contribution : 1er février 2014 Notification d’acceptation: 1er mars 2014 Envoi de l'article complet pour les actes : 1er juin 2014 Dates de la conférence: 10-11 septembre 2014 Comité scientifique: Antoine Auchlin Mathieu Avanzi Philippe Boula de Mareüil Nick Campbell Elisabeth Delais-Roussarie Céline De Looze Volker Dellwo Jean-Philippe Goldman Julia Hirschberg Daniel Hirst Ingrid Hove Adrian Leemann Joaquim Llisterri Philippe Martin Piet Mertens Anne Lacheret Nicolas Obin Tea Pršir Stephan Schmid Sandra Schwab Elizabeth Shriberg Anne Catherine Simon Comité d'organisation: Antoine Auchlin Jean-Philippe Goldman Tea Pršir ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:51:33 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:51:33 +0100 Subject: Conf: Symposium franco-japonais, Analyse des donnees sonores et corpus de reference, Paris, 18 =?WINDOWS-1252?Q?=96_?=20 novembre 2013 Message-ID: Date: Thu, 7 Nov 2013 13:25:29 +0000 (GMT) From: Layal Kanaan Message-ID: <1383830729.57988.YahooMailNeo at web171403.mail.ir2.yahoo.com> X-url: http://www.lll.cnrs.fr/lll-ninjal-symposium X-url: http://www.lll.cnrs.fr/en/lll-ninjal-symposium Bonjour, Vous trouverez en document attaché l’annonce d'un symposium organisé conjointement par le Laboratoire Ligérien de Linguistique (LLL / UMR 7270 – Université d’Orléans – Université de Tours – BnF – CNRS) et le NINJAL (National Institute of Japanese Language and Linguistics). Cette manifestation bénéficie du soutien de la Bibliothèque nationale de France, de la Délégation Générale à la Langue Française et aux Langues de France, de l’IRCOM (consortium Corpus Oraux et Multimodaux d’HUMA-NUM), de la Maison de la Culture du Japon à Paris, de l’Association des Enseignants de Japonais en France et de la Société Japonaise de Didactique du Français. Pour des raisons d’accès dans les institutions qui nous accueillent, l’inscription est obligatoire et une pièce d’identité sera demandée à l’entrée. Afin de pouvoir assister à une séance (les réservations se prennent par demi-journée), il convient d’envoyer un message à Layal Kanaan-Caillol (layal.kanaan at univ-orleans.fr) qui recensera les inscriptions, à l’exception de celle concernant le mardi après-midi pour laquelle les renseignements se prendront auprès de Jean Bazantay (jean.bazantay at univ-orleans.fr) et la demande d’inscription, à l’adresse suivante : nihongo.mcjp at gmail.com. Les capacités d’accueil étant limitées, il est recommandé de se manifester sans attendre et de nous informer si vous aviez un empêchement ultérieur. Un message de confirmation vous sera adressé en retour. Le programme et les informations pratiques d'accès sont disponibles sur le lien suivant : http://www.lll.cnrs.fr/lll-ninjal-symposium Program and access information are available on the following link: http://www.lll.cnrs.fr/en/lll-ninjal-symposium Pour le comité d’organisation, L. Kanaan-Caillol et J. Bazantay ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:53:36 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:53:36 +0100 Subject: Appel: Third Workshop on Computational Linguistics for Literature, EACL 2014 Message-ID: Date: Thu, 07 Nov 2013 10:15:14 -0500 From: Stan Szpakowicz Message-ID: <527BAE82.50404 at eecs.uottawa.ca> Third Workshop on Computational Linguistics for Literature April 26 or 27, 2014, Göteborg, Sweden, co-located with EACL 2014 https://sites.google.com/site/clfl2014a/ First Call for Papers [Our apologies for multiple postings.] The purpose of the series of ACL workshops on Computational Linguistics for Literature is to bring together researchers fascinated with literature as a unique type of data which pose distinct challenges. We invite papers on original unpublished work in this broad area. In particular, we hope to see papers which explore how the state-of-the-art NLP methods can help solve existing research problems in the humanities, or perhaps suggest new problems. Literary texts revolve around the human condition, emotions, social life and inner life. Naturally, such data abound in common-sense knowledge but are very thin on technical jargon. Can tools and methods developed in the ACL community help process literary data? When do they work, when do they fail and why? What new instruments do we need in order to work with prose and poetry, on a large or small scale? Are there computational solutions of noteworthy problems in the Humanities, Information Science, Library Sciences and other similar disciplines? Here are some of the topics of interest to the workshop: - the needs of the readers and how these needs translate into meaningful NLP tasks; - searching for literature; - recommendation systems for literature; - computational modelling of narratives, computational narratology, computational folkloristics; - summarization of literature; - differences between literature and other types of writing as relevant to computational linguistics; - discourse structure in literature; - emotion analysis for literature; - profiling and authorship attribution; - identification and analysis of literary genres; - building and analyzing social networks of characters; - generation of literary narrative, dialogue or poetry; - modelling literary dialogue for generation. We will consider regular papers which describe experimental methods or theoretical work, and we will gladly welcome position papers. The NLP community does not study literature often enough, so it is important to discuss and formulate the problems before proposing solutions. The (tentative) submission deadline is January 23, 2014. Anna Feldman, Anna Kazantseva, Stan Szpakowicz ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:01:15 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:01:15 +0100 Subject: Conf: SocInfo2013, 25-27 November 2013, Kyoto, Japan Message-ID: Date: Fri, 08 Nov 2013 10:05:29 +0100 From: Antoine Doucet Message-ID: <527CA959.8050503 at unicaen.fr> X-url: http://www.socinfo2013.org ----Apologies for cross-posting--- The Fifth International Conference on Social Informatics (SocInfo2013) 25-27 November 2013, Kyoto, Japan http://www.socinfo2013.org -----Call for Participation--------- ---------------------------------------------------------------------- The Fifth International Conference on Social Informatics (SocInfo2013) is an interdisciplinary venue for researchers from informatics and the social & management sciences to come together to share ideas and opinions, and to present original research work. The goal is to create an opportunity for the dissemination of knowledge between the two communities, as well as to enable mutual critical discussion of current research. ---------------------------------------------------------------------- Keynote Speakers: -------------------------- Paul Resnick (University of Michigan) Yoshiyuki Hashimoto (University of Tokyo) Irwin King (Chinese University of Hong Kong) Co-located Events: -------------------------- TUTORIAL: Towards a Spatial and Temporal Representation of Social Processes by Christophe Claramunt (Naval Academy Research Institute, France) WORKSHOPS: 1st Workshop on Quality, Motivation and Coordination of open Collaboration (QMC 2013) (http://qmc2013.socinfo.eu/ ) 1st International Workshop on Histoinformatics (http://www.histoinformatics.org ) Accepted Papers: ---------------- FULL PAPERS: Modeling Analogies for Human-Centered Information Systems Christoph Lofi and Christian Nieke Resilience of Social Networks Under Different Attack Strategies Mohammad Ayub Latif, Muhammad Naveed and Faraz Zaidi Follow My Friends This Friday! An Analysis of Human-generated Friendship Recommendations Ruth Garcia Gavilanes, Neil O'fHare, Luca Maria Aiello and Alejandro Jaimes A Divide-and-Conquer Approach for Crowdsourced Data Enumeration Hideto Aoki and Atsuyuki Morishima Passive Participation in Communities of Practice: Scope and Motivations Azi Lev-On and Odelia Adler An Ontology-based Approach to Sentiment Classification of Mixed Opinions in Online Restaurant Reviews Hea-Jin Kim and Min Song Automating Credibility Assessment of Arabic News Mohamed Hammad and Elsayed Hemayed The Study of Social Mechanisms of Organization, Boundary Capabilities, and Information System Shiuann-Shuoh Chen, Pei-Yi Chen, Yu Min and Yu-Wei Chuang Predicting User'fs Political Party using Ideological Stances Swapna Gottipati, Minghui Qiu, Liu Yang, Feida Zhu and Jing Jiang A Fast Method for Detecting Communities from Tripartite Networks Kyohei Ikematsu and Tsuyoshi Murata Information vs Interaction: An Alternative User Ranking Model for Social Networks Wei Xie, Ai Phuong Hoang, Feida Zhu and Ee-Peng Lim Feature Extraction and Summarization of Recipes using Flow Graph Yoko Yamakata, Shinji Imahori, Yuichi Sugiyama, Shinsuke Mori and Katsumi Tanaka Unsupervised Opinion Targets Expansion and Modification Relation Identification for Microblog Sentiment Analysis Jenq-Haur Wang and Ting-Wei Yeh An Ontology-based Technique for Online Profile Resolution Keith Cortis, Simon Scerri, Ismael Rivera and Siegfried Handschuh The Three Dimensions of Social Prominence Diego Pennacchioli, Giulio Rossetti, Luca Pappalardo, Fosca Giannotti, Dino Pedreschi and Michele Coscia Automatic Thematic Content Analysis: Finding Frames in News Daan Odijk, Bjorn Burscher, Rens Vliegenthart and Maarten de Rijke Optimal scales in weighted networks Diego Garlaschelli, Sebastian E. Ahnert, Thomas M. A. Fink and Guido Caldarelli Diversity-Based HITS: Web Page Ranking by Referrer and Referral Diversity Yoshiyuki Shoji and Katsumi Tanaka The Babel of Software Development: Linguistic Diversity in Open Source Bogdan Vasilescu, Alexander Serebrenik and Mark G. J. van den Brand Using and Asking: APIs Used in the Android Market and Asked About in StackOverflow David Kavaler, Daryl Posnett, Clint Gibler, Hao Chen, Premkumar Devanbu and Vladimir Filkov Social-Urban Neighborhood Search based on Crowd Footprints Network Shoko Wakamiya, Ryong Lee and Kazutoshi Sumiya A Notification-centric Mobile Interaction Survey and Framework Jonas Elslander and Katsumi Tanaka Social Sensing for Urban Crisis Management: The Case of Singapore Haze Philips Kokoh Prasetyo, Ming Gao, Ee-Peng Lim and Christie Napa Scollon SHORT PAPERS: Changing with Time: Modelling and Detecting User Lifecycle Periods in Online Community Platforms Matthew Rowe A Novel Social Event Recommendation Method Based on Social and Collaborative Friendships Yu-Chun Sun and Chien Chin Chen Factors that Influence Social Networking Service Private Information Disclosure at Diverse Openness and Scopes Basilisa Mvungi and Mizuho Iwaihara An Approach to Building High-Quality Tag Hierarchies from Crowdsourced Taxonomic Tag Pairs Fahad Almoqhim, David E. Millard and Nigel Shadbolt Polarity Detection of Foursquare Tips Felipe Moraes, Marisa Vasconcelos, Patrick Prado, Daniel Dalip, Jussara Almeida and Marcos Goncalves Predicting Social Density in Mass Events to Prevent Crowd Disasters Bernhard Anzengruber, Danilo Pianini, Jussi Nieminen and Alois Ferscha Modeling Social Capital of Bureaucratic Hierarchy for Analyzing Promotion Decisions Jyi-Shane Liu, Zhuan-Yao Lin and Ke-Chih Ning The estimation of aNobii users'f reading diversity using book co-ownership data: a social analytical approach Muhchyun Tang, Yi-Ling Ke and Yi-Jin Sie Aspects of Rumor Spreading on a Microblog Network Sejeong Kwon, Meeyoung Cha, Kyomin Jung, Wei Chen and Yajun Wang Traffic Condition is More than Colored Lines on a Map: Characterization of Waze Alerts Thiago H. Silva, Pedro Olmo Vaz de Melo, Aline Carneiro Viana, Jussara M. Almeida, Juliana Salles and Antonio A. F. Loureiro Why Do I Retweet It? An Information Propagation Model for Microblogs Fabio Pezzoni, Jisun An, Andrea Passarella, Jon Crowcroft and Marco Conti Society as a Life Teacher ? Automatic Recognition of Instincts Underneath Human Actions by Using Blog Corpus Rafal Rzepka and Kenji Araki Temporal, cultural and thematic aspects of web credibility Radoslaw Nielek, Aleksander Wawer, Michal Jakowski-Lorek and Adam Wierzbicki How do Students Search during Class and Homework? A query log analysis for academic purposes Rafael Lopez-Garcia, Makoto P. Kato, Yoko Yamakata and Katsumi On Constrained Adding Friends in Social Networks Hoang Bao Thien and Abdessamad Imine DEMO PAPERS: Metro: Exploring Participation in Public Events Luca Chiarandini, Luca Maria Aiello, Neil O'fHare and Alejandro Jaimes Social Listening for Customer Acquisition Juan Du, Biying Tan, Feida Zhu and Ee-Peng Lim Pilot Study toward realizing Social Effect in O2O Commerce Services Tse-Ming Tsai, Ping-Che Yang and Wen-Nan Wang Organizing Committee: ---------------- General Co-Chairs: - Katsumi Tanaka (Kyoto University, Japan) - Andrew Flanagin (University of California, Santa Barbara, USA) Program Co-Chairs: - Ee Peng Lim (Singapore Management University, Singapore) - Adam Jatowt (Kyoto University, Japan) - Ying Ding (Indiana University, Bloomington, USA) - Asako Miura (Kwansei Gakuin University, Japan) - Keishi Tajima (Kyoto University, Japan) Workshop/Tutorial Co-Chairs: - Akiyo Nadamoto (Konan University, Japan) - Jochen Leidner (Thomson Reuters, Switzerland) Demo Co-Chairs: - Taro Tezuka (Tsukuba University, Japan) - Gael Dias (Normandie University, Caen, France) Publicity Co-Chairs: - Yoshinori Hijikata (Osaka University, Japan) - Antoine Doucet (Normandie University, Caen, France) - Ricardo Campos (Polytechnic Institute of Tomar, Portugal) - Goh Hoe Lian Dion (Nanyang Technological University, Singapore) - Atsuyuki Morishima (University of Tsukuba, Japan) - Leonard Bolc (Polish-Japanese Institute of Information Technology, Poland) Treasurers: - Chair: Kazutoshi Sumiya (University of Hyogo, Japan) - Hiroaki Ohshima (Kyoto University, Japan) - Daisuke Kitayama (Kogakuin University, Japan) Web Chair: - Makoto P. Kato (Kyoto University, Japan) Local Arrangement Co-Chairs: - Takehiro Yamamoto (Kyoto University, Japan) - Toshiyuki Shimizu (Kyoto University, Japan) From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:45:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:45:44 +0100 Subject: Stage: Stage de master recherche en TAL et Lexicographie, LIDILEM Message-ID: Date: Thu, 7 Nov 2013 08:34:30 +0100 From: Agnès Tutin Message-ID: <000901cedb8b$cc2f1da0$648d58e0$@u-grenoble3.fr> X-url: http://www.atilf.fr/ressources/termith/ Stage de recherche M1 ou M2 Traitement automatique des langues, Lexicographie ou Linguistique appliquée Conception et développement d’un dictionnaire électronique de collocations du langage scientifique Lieu : LIDILEM, Université Grenoble 3 – Stendhal, Durée : de 3 à 5 mois, Période : janvier à juin 2014. Stage rémunéré : indemnité (436 euros/mois) Personnes à contacter : Agnès Tutin (agnes.tutin at u-grenoble3.fr) Dans le cadre du projet Termith (Projet ANR-Content : http://www.atilf.fr/ressources/termith/) impliquant plusieurs laboratoires de recherche (ATILF, LINA, INRIA, LORIA, LIDILEM), nous souhaitons élaborer un lexique d’expressions spécifiques du français scientifique, par exemple faire une hypothèse, en premier lieu, contrairement à nos attentes … Cette phraséologie transdisciplinaire des écrits scientifiques traverse en large partie les disciplines et est surreprésentée dans ce genre (Pecman 2007 ; Tutin 2007 ; Granger & Paquot 2010). Dans le cadre du projet Termith, ces expressions seront utilisées dans un système d’indexation automatique des écrits scientifiques afin de mieux repérer les concepts spécifiques des textes. Dans cette phraséologie, les collocations, ici définies comme des associations binaires privilégiées et compositionnelles sur le plan sémantique, constituent les expressions les plus productives. Il s’agit d’expressions comme faire une hypothèse, résultats encourageants, hypothèse de travail, etc. Le sujet du stage consistera à adapter un format d’encodage pour ces expressions à partir des extractions effectuées automatiquement d’un grand corpus d’écrits scientifiques. L’extraction sera réalisée semi-automatiquement dans notre équipe à partir d’un corpus analysé syntaxiquement en dépendances en utilisant des mesures d’association (Kraif & Diwersy 2012 ; Cf aussi Seretan 2010). Le stagiaire sera chargé de réfléchir au codage linguistique des propriétés pertinentes à associer à ces collocations (alternances syntaxiques, détermination, information d’usage) à partir des observations en corpus, de sélectionner les collocations adaptées et de proposer une adaptation pour ces expressions du standard Lexical Markup Framework (Francopoulo et al. 2006). Francopoulo, G., George, M., Calzolari, N., Monachini, M., Bel, N., Pet, M., & Soria, C. (2006). Lexical markup framework (LMF). In International Conference on Language Resources and Evaluation-LREC 2006. Granger, S., Paquot, M., (2010. The Louvain EAP Dictionary (LEAD) », Proceedings of the XIV EURALEX International Congress , Leeuwarden (The Netherlands), 6-10 July 2010, 321-326. Kraif. O & Diwersy S. (2012). Le Lexicoscope : un outil pour l'étude de profils combinatoires et l'extraction de constructions lexico-syntaxiques. Actes de la conférence conjointe JEP-TALN-RECITAL 2012, volume 2: TALN. Grenoble, France. 399—406. Pecman, M. (2007) : Approche onomasiologique de la langue scientifique générale. Revue française de linguistique appliquée. « Lexique des écrits scientifiques », vol. XII-2. 79-96. Seretan V. (2010). Syntax-based collocation extraction. Springer. Tutin, A. (2004). Pour une modélisation dynamique des collocations dans les textes. In Proceedings of the Eleventh EURALEX International Congress, Lorient, France. 207-219. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:12:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:12:55 +0100 Subject: Job: CDD 18 mois Classification et Filtrage + Integration Web Service, CEA LIST Message-ID: Date: Thu, 07 Nov 2013 17:15:51 +0100 From: Message-ID: Le Laboratoire de Vision et d'Ingénierie des Contenus du CEA LIST emploie une cinquantaine chercheurs et ingénieurs travaillant sur l'analyse et l'interprétation de données multimédia (texte, image et analyse de vidéos). Le LVIC développe des algorithmes robustes pour l'extraction, l'analyse et le filtrage de grands volumes de données multimédia (texte, image, vidéo). La fusion de ces media permet une meilleure interprétation ou compréhension des scènes ou des documents. Nos technologies ont contribuées à l'émergence de nouvelles activités économiques. En effet, ces technologies ont permis la création de startups comme Senseetive ou Ant’Inno. Par ailleurs, le laboratoire participe à de nombreux projets collaboratifs (ANR, Europe FP7, Pôle de Compétitivité) avec des partenaires académiques, PMEs ou grands industriels. Dans le cadre de plusieurs projets en cours de la thématique "Traitement Automatique des Langues", le laboratoire LVIC recherche un ingénieur pour assister les chercheurs du laboratoire dans la conception, l'implémentation et l’évaluation de modules logiciels de filtrage et de classification thématique de documents hétérogènes ainsi que leur intégration dans une architecture orientée service. Le candidat devra : - concevoir et implémenter des algorithmes de classification en utilisant des classifieurs statistiques, en particulier de type SVM ; - évaluer et améliorer ces classifieurs. - intégrer les modules développés ainsi que d’autres modules disponibles au sein du laboratoire dans une architecture orientée service. Le candidat devra posséder une bonne maîtrise du développement en C++ sous Linux (base de code installée de plusieurs centaines de milliers de lignes) et connaître (ou être capable de se familiariser rapidement avec) des bibliothèques telles que STL, Xerces-C, Boost, gSoap, etc. Les compétences requises incluent également la maîtrise de principes de conception de type Design Patterns et d'outils développement tels que, gdb, valgrind, etc. Le candidat devra en outre être capable de se familiariser rapidement avec les architectures orientées service. Enfin, une connaissance minimale des techniques d'apprentissage et de classification (SVM, etc.) est considérée comme fortement souhaitable. Le poste proposé est un CDD de 18 mois, rémunéré selon les grilles de salaire du CEA (dépendant de la formation et de l'expérience). Il sera basé sur le centre Nano'Innov, situé près du Campus de l’école Polytechnique à Palaiseau (91). Contact: Faiza GARA Email : faiza.gara at cea.fr Tel : 01 69 08 01 48 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:55:47 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:55:47 +0100 Subject: Seminaire: Seminaire Alpage, Quentin Pradet et Laurence Danlos, 15 novembre 2013, Paris Message-ID: Date: Fri, 8 Nov 2013 09:40:33 +0100 From: Marie Candito Message-ID: ************** Séminaire de l'équipe Alpage ********* Il s'agit du séminaire de recherche en linguistique informatique organisé par l'équipe Alpage, équipe mixte INRIA - Paris Diderot, spécialisée en analyse syntaxique automatique et en traitement du discours. Vendredi 15 novembre de 11h à 12h30, ATTENTION: bâtiment inhabituel : le séminaire aura lieu en salle 264E à la *Halle aux Farines* 10 rue Françoise Dolto 75013 Paris (la salle est plutôt côté Seine du bâtiment, et à l'opposé des Grands Moulins) Toute personne intéressée est la bienvenue. ********************************************************** Vers la création semi-automatique d’un VerbNet du français. Quentin Pradet (CEA LIST) et Laurence Danlos (Université Paris Diderot, ALPAGE) VerbNet est une ressource lexicale pour les verbes anglais organisée autour de classes sémantiques et de sous-classes syntaxiques. Cette ressource est très utilisée, notamment pour l'annotation en rôles sémantiques (Swier et Stevenson, 2005 ; Palmer et al., 2013). Il paraît donc nécessaire d’avoir une ressource équivalente pour le français. Les seuls efforts qui ont été faits pour l’instant se limitent à des constructions automatiques bruitées dont l'évaluation se limite à quelques verbes (Messiant et al., 2010 ; Falk et al., 2012). De plus ces efforts font abstraction des ressources lexicales qui existent pour le français, or celles–ci existent et sont de qualité. Pour les verbes, nous pensons en particulier à LVF+1 (http://pageperso.lif.univ-mrs.fr/~paul.sabatier/Contribution_FondamenTAL.html) et au Lexique-Grammaire (http://infolingu.univ-mlv.fr/DonneesLinguistiques/Lexiques-Grammaires/Telechargement.html). Nous avons donc l’objectif de réaliser un VerbeNet du français semi-automatiquement en nous appuyant sur ces ressources, en particulier sur LVF+1 et LG, la première plus centrée sur les informations sémantiques, la seconde sur les informations syntaxiques. Ce VerbeNet garde la hiérarchie des classes sémantiques du VerbNet anglais, ce qui permet de garder à l'identique les informations sémantiques, entre autres les rôles thématiques. Ce travail est en cours. Nous présenterons les premiers résultats, les difficultés rencontrées et les futurs liens que nous envisageons vers d'autres ressources du français utilisées en TAL. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:07:11 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:07:11 +0100 Subject: Revue: Numero Texto ! Textes & Cultures, Volume XVIII, 4 (2013) Message-ID: Date: Fri, 8 Nov 2013 18:29:54 +0100 From: Carine Duteil-Mougel Message-Id: X-url: http://www.revue-texto.net/index.php?id=3326 Bonjour, Au sommaire du nouveau numéro de Texto ! Textes & Cultures : VOLUME XVIII - n°4 (2013), coordonné par François LAURENT http://www.revue-texto.net/index.php?id=3326 Dits et inédits " Interprétation, traduction et rationalité clinique dans l’anthropologie de Clifford Geertz " Philippe LACOUR URL : http://www.revue-texto.net/index.php?id=3352. Corpus et méthodes " La ruée linguistique vers le Web " Ludovic TANGUY URL : http://www.revue-texto.net/index.php?id=3335. Arts du langage Essai de sémantique textuelle à partir d’un extrait de La Recherche du temps perdu de Proust " Guillaume MARVIER URL : http://www.revue-texto.net/index.php?id=3324. Saussurismes et sémiotiques / Petite historiographie du saussurisme " La perspective fonctionnelle de la phrase " Tomáš HOSKOVEC URL : http://www.revue-texto.net/index.php?id=3389. Repères pour l'étude " Sémiologie des pictogrammes " Pascal VAILLANT URL : http://www.revue-texto.net/index.php?id=3336. " L'analyse des textes littéraires : vingt méthodes " Louis HÉBERT (LIEN) Parutions et trésors " Faussaires ou bienfaiteurs ? Le problème public des « faux » médicaments dans les médias " Marine AL DAHDAH et Mathieu QUET URL : http://www.revue-texto.net/index.php?id=3310. " Dépsychiatriser dit-elle " Arnaud ALESSANDRIN URL : http://www.revue-texto.net/index.php?id=3311. " L'alcoolisation adolescente : un problème de santé publique dans la presse quotidienne nationale ? " Audrey ARNOULT URL : http://www.revue-texto.net/index.php?id=3312. " Un défi permanent pour les médias " Paul BENKIMOUN URL : http://www.revue-texto.net/index.php?id=3314. " La greffe de visage comme « événement durable » ? " Philippe CHAVOT et Anne MASSERAN URL : http://www.revue-texto.net/index.php?id=3316. " Scénarisation médiatique et enjeux désignatifs autour de deux crises sanitaires : la Grippe A et la Bactérie tueuse " Carine DUTEIL-MOUGEL et Pascale VERGELY URL : http://www.revue-texto.net/index.php?id=3317. " L'affaire du Médiator au prisme de la textométrie " Philippe GAMBETTE et William MARTINEZ URL : http://www.revue-texto.net/index.php?id=3318. " Cancer et Médecines non conventionnelles : vers une évolution du discours médiatique " Sarah JEZIORSKI LAHBIB URL : http://www.revue-texto.net/index.php?id=3319. " Des accidents médicaux à la « crise systémique ». Le traitement médiatique des cas de surirradiations des hôpitaux d'Épinal et de Toulouse. " Florian PEDROT URL : http://www.revue-texto.net/index.php?id=3320. " Médias/Santé/Censure. Autour de la publicité " Laura SANTONE " Santé-médias-Sport : Responsabilité sociale et l’impérieuse nécessité de l’interdisciplinarité " Denis THEUNYNCK, Fabien WILLE, Gilles VANLERBERGHE et François POTDEVIN URL : http://www.revue-texto.net/index.php?id=3322. " Incertitude, processus d’individualisation, et perception des risques : l’exemple de la controverse sur la vaccination contre la grippe A(H1N1) " Jeremy WARD URL : http://www.revue-texto.net/index.php?id=3323. " Du corpus au genre: l'exemple de linguistique " Céline POUDAT URL : http://www.revue-texto.net/index.php?id=3355. " Interprétation et fréquence textuelle " Sylvain LOISEAU URL : http://www.revue-texto.net/index.php?id=3356. " Comment se constituent les genres à l'ère du texte numérique? " Valérie BEAUDOUIN URL : http://www.revue-texto.net/index.php?id=3357. " L'analyse des textes littéraires : une méthodologie complète " Louis HÉBERT (LIEN) Bien cordialement, Carine DM ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:40:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:40:44 +0100 Subject: Appel: Special issue, ACM TACCESS on Speech and Language Interaction for Daily Assistive Technology (SLPAT) Message-ID: Date: Wed, 06 Nov 2013 21:22:25 +0100 From: François Portet Message-ID: <527AA501.40709 at imag.fr> *Call for Papers - Special Issue of ACM Transactions on Accessible Computing (TACCESS) On Speech and Language Interaction for Daily Assistive Technology * /Guest Editors: François Portet, Frank Rudzicz, Jan Alexandersson, Heidi Christensen/ Assistive technologies (AT) allow individuals with disabilities to do things that would otherwise be difficult or impossible. Many assistive technologies involve providing universal access, such as modifications to televisions or telephones to make them accessible to those with vision or hearing impairments. An important sub-discipline within this community is Augmentative and Alternative Communication (AAC), which has its focus on communication technologies for those with impairments that interfere with some aspect of human communication, including spoken or written modalities. Another important sub-discipline is Ambient Assisted Living (AAL) which facilitates independent living; these technologies break down the barriers faced by people with physical or cognitive impairments and support their relatives and caregivers. These technologies are expected to improve quality-of-life of users and promote independence, accessibility, learning, and social connectivity. Speech and natural language processing (NLP) can be used in AT/AAC in a variety of ways including, improving the intelligibility of unintelligible speech, and providing communicative assistance for frail individuals or those with severe motor impairments. The range of applications and technologies in AAL that can rely on speech and NLP technologies is very large, and the number of individuals actively working within these research communities is growing, as evidenced by the successful INTERSPEECH 2013 satellite workshop on Speech and Language Processing for Assistive Technologies (SLPAT). In particular, one of the greatest challenges in AAL is to design smart spaces (e.g., at home, work, hospital) and intelligent companions that anticipate user needs and enable them to interact with and in their daily environment and provide ways to communicate with others. This technology can benefit each of visually-, physically-, speech- or cognitively- impaired persons. Topics of interest for submission to this special issue include (but are not limited to): - Speech, natural language and multimodal interfaces designed for people with physical or cognitive impairments - Applications of speech and NLP technology (automatic speech recognition, synthesis, dialogue, natural language generation) for AT applications - Novel modeling and machine learning approaches for AT applications - Long-term adaptation of speech/NLP based AT system to user's change - User studies, overview of speech/NLP technology for AT: understanding the user's needs and future speech and language based technologies. - Understanding, modeling and recognition of aged or disordered speech - Speech analysis and diagnosis: automatic recognition and detection of speech pathologies and speech capability loss - Speech-based distress recognition - Automated processing of symbol languages, sign language and nonverbal communication including translation systems. - Text and audio processing for improved comprehension and intelligibility, e.g., sentence simplification or text-to-speech - Evaluation methodology of systems and components in the lab and in the wild. - Resources; corpora and annotation schemes - Other topics in AAC, AAL, and AT *Submission process* Contributions must not have been previously published or be under consideration for publication elsewhere, although substantial extensions of conference or workshop papers will be considered. as long as they adhere to ACM's minimum standards regarding prior publication (http://www.acm.org/pubs/sim_submissions.html). Studies involving experimentations with real target users will be appreciated. All submissions have to be prepared according to the Guide for Authors as published in the Journal website at http://www.rit.edu/gccis/taccess/. Submissions should follow the journal's suggested writing format (http://www.gccis.rit.edu/taccess/authors.html) and should be submitted through Manuscript Central http://mc.manuscriptcentral.com/taccess, indicating that the paper is intended for the Special Issue. All papers will be subject to the peer review process and final decisions regarding publication will be based on this review. *Important dates:* - Full paper submission: 31^st March 2014 - Response to authors: 30^th June 2014 - Revised submission deadline: 31^st August 2014 - Notification of acceptance: 31^st October 2014 - Final manuscripts due: 30^th November 2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:32:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:32:48 +0100 Subject: Appel: EACL 2014 Workshop on Multiword Expressions (MWE 2014) Message-ID: Date: Wed, 13 Nov 2013 12:32:47 +0100 From: Agata Savary Message-ID: <5283635F.9080400 at univ-tours.fr> X-url: http://multiword.sourceforge.net/mwe2014 Apologies for multiple postings ----------------------- First CALL FOR PAPERS The 10th Workshop on Multiword Expressions (MWE 2014) http://multiword.sourceforge.net/mwe2014 Workshop at EACL 2014 (Gothenburg, Sweden), April 26-27, 2014 Endorsed by the Special Interest Group on the Lexicon of the Association for Computational Linguistics (SIGLEX; http://www.siglex.org/); SIGLEX’s Multiword Expressions Section (SIGLEX-MWE; http://multiword.sourceforge.net/PHITE.php?sitesig=MWE); and PARSEME, European IC1207 COST Action (http://www.parseme.eu) Submission deadline: Long & short papers - January 23, 2014 at 23:59 PDT (GMT-7) ------------------------- Call For Papers Under the denomination "multiword expression", one assumes a wide range of linguistic constructions such as idioms (“storm in a teacup”, “sweep under the rug”), fixed phrases (“in vitro”, “by and large”, “rock'n roll”), noun compounds (“olive oil”, “laser printer”), compound verbs (“take a nap”, “bring about”), etc. While easily mastered by native speakers, their interpretation poses a major challenge for computational systems, due to their flexible and heterogeneous nature. For a start, MWEs are not nearly as frequent in NLP resources as they are in real-world text, and this problem of coverage may impact the performance of many NLP tasks. Moreover, treating MWEs also involves problems like determining their semantics, which is not always compositional (“to kick the bucket” meaning “to die”). In sum, MWEs are a key issue and a current weakness for natural language parsing and generation, as well as real-life applications depending on language technology, such as machine translation, just to name a prominent one among many. Thanks to the joint efforts of researchers from several fields working on MWEs, significant progress has been made in recent years, especially concerning the construction of large-scale language resources. For instance, there is a large number of recent papers which focus on acquisition of MWEs from corpora, and others that describe a variety of techniques to find paraphrases for MWEs. Current methods use a plethora of tools such as association measures, machine learning, syntactic patterns, web queries, etc. A considerable body of techniques, resources and tools to perform these tasks are now available, and are indicative of the growing importance of the field within the NLP community. Many of these advances are described as part of the annual workshop on MWEs, which attracts the attention of an ever-growing community working on a variety of languages and MWE types. The workshop has been held since 2001 in conjunction with major computational linguistics conferences (ACL, EACL, NAACL, COLING, LREC), providing an important venue for the community to interact, share resources and tools and collaborate on efforts for advancing the computational treatment of MWEs. Additionally, special issues on MWEs have been published by leading journals in computational linguistics. The latest such effort is the special issue on “Multiword Expressions: from Theory to Practice and Use”, which has recently been published by the ACM Transactions on Speech and Language Processing (http://multiword.sourceforge.net/tslp2011si). MWE 2014 will be the 10th event in the series. We will be interested in major challenges in the overall process of MWE treatment, both from the theoretical and the computational viewpoint, focusing on original research related (but not limited) to the following topics: * Manually and automatically constructed resources * Representation of MWEs in dictionaries and ontologies * MWEs and user interaction * Multilingual acquisition * Multilingualism and MWE processing * Models of first and second language acquisition of MWEs * Crosslinguistic studies on MWEs * The role of MWEs in the domain adaptation of parsers * Integration of MWEs into NLP applications * Evaluation of MWE treatment techniques * Lexical, syntactic or semantic aspects of MWEs The workshop will feature a “Special Track on Parsing and MWEs” dedicated to “deep” parsing of MWEs, inviting submissions on the following and related challenges: * Lexicon-grammar interface: representing, at the lexical level, phenomena such as agreement, discontinuity and free word order; construction of MWE lexicons which would be easily convertible and maximally reusable in different parsing frameworks. * “Deep” parsing techniques for MWEs: optimal representation of MWEs within linguistic frameworks, such CCG, HPSG, LFG, TAG, minimalism, etc; processing MWEs before, during or after parsing; representing the semantics of MWEs. * Hybrid parsing of MWEs: combining data-driven and knowledge-based approaches for efficient and linguistically precise parsers; using unannotated data for improving models based on annotated data. * Annotating MWEs in treebanks: MWE-aware methodologies of treebank construction, and their increased usability in parsing. This special track is endorsed by PARSEME, European IC1207 COST Action, dedicated to parsing and MWEs (www.parseme.eu). A separate time slot will be allocated to the special track within the workshop. Authors may submit papers either to the special track or to the regular workshop. They should follow common submission instructions. ------------------------- Submission modalities For MWE 2014, we will accept the following two types of submissions: Regular long papers (8 content pages + 1 page for references): Long papers should report on solid and finished research including new experimental results, resources and/or techniques. Regular short papers (4 content pages + 1 page for references): Short papers should report on small experiments, focused contributions, ongoing research, negative results and/or philosophical discussion. The reported research should be substantially original. The papers will be presented orally or as posters. The decision as to which papers will be presented orally and which as posters will be made by the program committee based on the nature rather than on the quality of the work. All submissions must be in PDF format and must follow the EACL 2014 formatting requirements (available at the EACL 2014 website). We strongly advise the use of the provided Word or LaTeX template files. Reviewing will be double-blind, and thus no author information should be included in the papers; self-reference should be avoided as well. Resources submitted with the papers should be anonymized for submission. Papers and/or resources that do not conform to these requirements will be rejected without review. Accepted papers will appear in the workshop proceedings, where no distinction will be made between papers presented orally or as posters. More details about the submission procedure (e.g. online submission system) will be available soon. ------------------------- Important dates 23 January 2014: Long & short paper submission deadline 23:59 PDT (GMT-7) 20 February 2014: Notification of Acceptance 03 March 2014: Camera-ready papers due 26-27 April 2014: Workshop Dates ------------------------- Program Committee Iñaki Alegria, University of the Basque Country (Spain) Dimitra Anastasiou, University of Bremen (Germany) Doug Arnold, University of Essex (UK) Eleftherios Avramidis, DFKI GmbH (Germany) Tim Baldwin, University of Melbourne (Australia) Núria Bel, Universitat Pompeu Fabra (Spain) Chris Biemann, Technische Universität Darmstadt (Germany) Francis Bond, Nanyang Technological University (Singapore) Lars Borin, University of Gothenburg (Sweden) António Branco, University of Lisbon (Portugal) Miriam Butt, Universität Konstanz (Germany) Aoife Cahill, ETS (USA) Ken Church, IBM Research (USA) Matthieu Constant, Université Paris-Est Marne-la-Vallée (France) Paul Cook, University of Melbourne (Australia) Béatrice Daille, Nantes University (France) Koenraad De Smedt, University of Bergen (Norway) Gaël Dias, University of Caen Basse-Normandie (France) Gülşen Eryiğit, Istanbul Technical University (Turkey) Tomaž Erjavec, Jožef Stefan Institute (Slovenia) Joaquim Ferreira da Silva, New University of Lisbon (Portugal) Roxana Girju, University of Illinois at Urbana-Champaign (USA) Jan Hajič, Charles University in Prague (Czech Republic) Chikara Hashimoto, National Institute of Information and Communications Technology (Japan) Ulrich Heid, University of Stuttgart (Germany) Kyo Kageura, University of Tokyo (Japan) Su Nam Kim, Monash University (VIC, Australia) Ioannis Korkontzelos, University of Manchester (UK) Brigitte Krenn, Austrian Research Institute for Artificial Intelligence (Austria) Cvetana Krstev, University of Belgrade (Serbia) Marie-Catherine de Marneffe, The Ohio State University (USA) Takuya Matsuzaki, National Institute of Informatics (Japan) Preslav Nakov, Qatar Computing Research Institute (Qatar) Malvina Nissim, University of Bologna (Italy) Joakim Nivre, Uppsala University (Sweden) Diarmuid Ó Séaghdha, University of Cambridge (UK) Jan Odijk, University of Utrecht (The Netherlands) Yannick Parmentier, Université d'Orléans (France) Pavel Pecina, Charles University in Prague (Czech Republic) Scott Piao, Lancaster University (UK) Adam Przepiórkowski, Polish Academy of Sciences (Poland) Victoria Rosén, University of Bergen (Norway) Carlos Ramisch, Aix-Marseille University (France) Manfred Sailer, Goethe University Frankfurt am Main (Germany) Magali Sanches Duran, University of São Paulo (Brazil) Violeta Seretan, University of Geneva (Switzerland) Ekaterina Shutova, University of California, Berkeley (USA) Jan Šnajder, University of Zagreb (Croatia) Pavel Straňák, Charles University in Prague (Czech Republic) Sara Stymne, Uppsala University (Sweden) Stan Szpakowicz, University of Ottawa (Canada) Beata Trawinski, Institut für Deutsche Sprache (IDS), Mannheim (Germany) Yulia Tsvetkov, Carnegie Mellon University (USA) Yuancheng Tu, Microsoft (USA) Ruben Urizar, University of the Basque Country (Spain) Gertjan van Noord, University of Groningen (The Netherlands) Aline Villavicencio, Federal University of Rio Grande do Sul (Brazil) Veronika Vincze, Hungarian Academy of Sciences (Hungary) Martin Volk, University of Zurich (Switzerland) Tom Wasow, Stanford University (USA) Shuly Wintner, University of Haifa (Israel) Dekai Wu, The Hong Kong University of Science & Technology (Hong Kong) ------------------------- Workshop Organizers Valia Kordoni (Humboldt-Universität zu Berlin, Germany) Markus Egg (Humboldt-Universität zu Berlin, Germany) Agata Savary (Université François Rabelais Tours, France; Special Track Organiser) Eric Wehrli (Université de Genève, Switzerland; Special Track Organiser) Stefan Evert (Friedrich-Alexander-Universität Erlangen-Nürnberg, Germany) ------------------------- Contact For any inquiries regarding the workshop please send an email to mweworkshop.eacl2014 at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:12:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:12:31 +0100 Subject: Stage: Stage de master recherche en TAL, Paris Message-ID: Date: Sat, 9 Nov 2013 10:13:35 +0100 From: Frederic.Landragin at ens.fr Message-ID: <1383988415.527dfcbfec64a at mail.canoe.ens.fr> Proposition de stage de M2 Laboratoire Lattice & LTCI Telecom-ParisTech Titre : Modélisation d’actes communicatifs multimodaux pour un agent conversationnel animé dans les dialogues humain-machine Descriptif : Les Agents Conversationnels Animés (ACA) sont des personnages virtuels permettant à la machine de dialoguer avec les humains de manière naturelle. Ils peuvent prendre le rôle d’assistant comme les agents conversationnels présents sur les sites de vente, de tuteur dans le cadre des Jeux Sérieux (Serious Games). Comment obtenir chez un ACA une expression naturelle des actes communicatifs? Avec quelles postures, quelles expressions faciales, quels gestes, quelle intonation, doit-on faire accompagner le discours d’un ACA dans un dialogue humain-machine ? Une attention particulière sera donnée à l’agencement des niveaux acoustique (intonation) et visuel (geste, regard, etc.) avec les aspects linguistiques de l’énoncé (syntaxe, sémantique). On interrogera notamment les analyses classiques qui tendent à simplifier, par exemple en considérant qu'à une question est associé un contour prosodique montant, alors qu'un contour plat est souvent bien plus naturel. On interrogera également les matérialisations d'un ordre en fonction du contexte socio-émotionnel : si en théorie l'ordre fait partie des trois actes de langage classiques (par exemple au sens de la Théorie de la Pertinence, Sperber & Wilson 1995), en pratique l'ordre direct est ressenti comme agressif et on lui préfère un acte de langage indirect, comme une question à valeur (cachée) d'ordre. La notion d’acte de langage sera étendue à celle d’acte communicatif afin d’intégrer les modalités non-verbales (Poggi et Pelachaud, 2000) et le sujet portera sur la modélisation des actes communicatifs multimodaux, et sur les conséquences des choix qu’un système de dialogue humain-machine peut effectuer. Les modèles construits s’intégreront dans la plateforme Greta (Niewiadomski et al., 2011), qui permet de communiquer avec l’humain en générant chez l’agent une large palette de comportements expressifs verbaux et non verbaux (Bevacqua et al., 2012). Plusieurs cas d’application pourront être envisagés : dialogues d’entraînement de jeunes en insertion sociale aux entretiens d’embauche (projet Tardis), dialogues entre un ACA et les visiteurs d’un musée (projet A1:1) Pour ce faire, le travail comportera les étapes suivantes : - Etude de dialogues Humain-Humain (TCOF, CID...), des dialogues Humain-Machine (SCNF, CIO) et de dialogues humain-ACA multimodaux (Corpus Semaine (Schröder et al., 2011)), en comparant les actes communicatifs et actes de langage présents dans ces corpus et leur réalisation verbale et non verbale ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:30:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:30:31 +0100 Subject: Appel: EACL 2014 Workshop on Continuous Vector Space Models and their Compositionality Message-ID: Date: Wed, 13 Nov 2013 12:07:48 +0100 From: Alexandre Allauzen Message-ID: <52835D84.90709 at limsi.fr> ************************************************************************ Workshop on Continuous Vector Space Models and their Compositionality (2nd edition) Co-located with EACL 2014, Gothenburg, Sweden April 27, 2014 Submission deadline: January 23, 2014 https://sites.google.com/site/cvscworkshop2014 ************************************************************************ First Call for Papers (Apologies for multiple postings) In recent years, there has been a growing interest in algorithms that learn and use continuous representations for words, phrases, or documents in many natural language processing applications. Among many others, influential proposals that illustrate this trend include latent Dirichlet allocation, neural network based language models and spectral methods. These approaches are motivated by improving the generalization power of the discrete standard models, by dealing with the data sparsity issue and by efficiently handling a wide context. Despite the success of single word vector space models, they are limited since they do not capture compositionality. This prevents them from gaining a deeper understanding of the semantics of longer phrases or sentences. With the growing popularity of these neural and probabilistic methods of language processing, the scope of this second workshop is extended to theoretical and conceptual questions regarding: * their relation to unsupervised distributional representations, * the encompassing of the compositional aspects of formal models of semantics, * the role of linguistic theory in the design and development of these methods. Some such pertinent questions include: Should phrase representations and word representations be of the same sort? Could different linguistic levels require different modelling approaches? Is compositionality determined by syntax, and if so, how do we learn/define it? Should word representations be fixed and obtained distributionally, or should the encoding be variable? Should word representations be task-specific, or should they be general? In this workshop, we invite submissions of papers on continuous vector space models for natural language processing. Topics of interest include, but are not limited to: * learning algorithms for continuous vector space models, * their compositionality, * their use in NLP applications, * spectral learning for NLP, * neural networks for NLP, * phrase, sentence, and document-level distributional representations, * tensor models, * distributed semantic representations, * the role of syntax in compositional models, * formal and distributional semantic models. INVITED SPEAKERS The workshop will showcase presentations from two invited speakers : Geoffrey Zweig (Microsoft Research) and a second presenter to be announced soon. SUBMISSION INFORMATION Authors should submit a full paper of up to 8 pages in electronic, PDF format, with up to 2 additional pages for references. The reported research should be substantially original. The papers will be presented orally or as posters. All submissions must be in PDF format and must follow the EACL 2014 formatting requirements (http://www.eacl2014.org/files/eacl-2014-styles.zip ). Reviewing will be double-blind, and thus no author information should be included in the papers; self-reference should be avoided as well. Submissions must be made through the Softconf website set up for this workshop: https://www.softconf.com/eacl2014/CVSC/ Accepted papers will appear in the workshop proceedings, where no distinction will be made between papers presented orally or as posters. IMPORTANT DATES 23 January 2014 : Submission deadline 20 February 2014 : Notification of acceptance 3 March 2014 : Camera-ready deadline 27 April 2014 : Workshop ORGANIZERS Alexandre Allauzen (LIMSI-CNRS/Université Paris-Sud, France) Raffaella Bernardi (University of Trento, Italy) Edward Grefenstette (University of Oxford, UK) Hugo Larochelle (Université de de Sherbrooke, Canada) Christopher Manning (Stanford University, USA) Scott Wen-tau Yih (Microsoft Research, USA) PROGRAM COMMITTEE Nicholas Asher (IRIT-Toulouse) Marco Baroni (University of Trento) Yoshua Bengio (Université de Montréal) Gemma Boleda (University of Texas) Antoine Bordes (Université Technologique de Compiègne) Johan Bos (University of Groningen) Léon Bottou (Microsoft Research) Xavier Carreras (Universitat Politècnica de Catalunya) Lucas Champollion (New-York University) Stephen Clark (University of Cambridge) Shay Cohen (Columbia University) Ido Dagan (Bar Ilan University) Ronan Collobert (IDIAP Research Institute, Switzerland) Pino Di Fabbrizio (Amazon) Georgiana Dinu (University of Trento) Kevin Duh (Nara Institute of Science and Technology) Dean Foster (University of Pennsylvania) Alessandro Lenci (University of Pisa) Louise McNally (Universitat Pompeu Fabra) Fabio Massimo Zanzotto (Università degli Studi di Roma) Mirella Lapata (University of Edinburgh) Andriy Mnih (Gatsby Computational Neuroscience Unit) Larry Moss (Indiana University) Diarmuid Ó Seaghdha (University of Cambridge) Sebastian Pado (Universität Stuttgart) Martha Palmer (University of Colorado) John Platt (Microsoft Research) Maarten de Rijke (University of Amsterdam) Mehrnoosh Sadrzadeh (University of London) Mark Steedman (University of Edinburgh) Chung-chieh Shan (Indiana University) Peter Turney (NRC) Jason Weston (Google) Guillaume Wisniewski (LIMSI-CNRS/Université Paris-Sud) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:27:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:27:10 +0100 Subject: Appel: IC 2014 Message-ID: Date: Tue, 12 Nov 2013 12:15:59 +0100 From: Nathalie Aussenac-Gilles Message-ID: <52820DEF.7090900 at irit.fr> X-url: http://www.irit.fr/IC2014 Appel à communications pour les 25es Journées Francophones d'Ingénierie des Connaissances : Connaissances pervasives: des utilisateurs plongés dans des systèmes à base de connaissances et des systèmes à base de connaissances plongés dans le monde http://www.irit.fr/IC2014 du 12 au 16 mai 2014 à Clermont-Ferrand ------------------------------------------------------------------------ Dates importantes : Date limite de soumission des communications : jeudi 19 décembre 2013 Date de notification aux auteurs : jeudi 13 février 2014 Date limite de réception des textes définitifs : lundi 17 mars 2014 Dates de la conférence : du 12 au 16 mai 2014 ------------------------------------------------------------------------ La conférence d'Ingénierie des Connaissances fête cette année ses 25 ans! Elle est le rendez-vous annuel de la communauté française et francophone qui s'intéresse aux problématiques liées à l'ingénierie des connaissances. Académiques et industriels s'y retrouvent pour échanger et réfléchir sur des problèmes de recherche qui se posent en acquisition, représentation et gestion des connaissances. L'essor des sciences et technologies de l'information et de la communication, et notamment des technologies du web, dans l''ensemble de la société engendre des mutations dans les pratiques individuelles et collectives. L'ingénierie des connaissances accompagne cette évolution, en inventant les modèles, méthodes et outils permettant l''intégration de connaissances et de raisonnements sur ces connaissances dans des environnements informatiques. De fait, on constate aujourd'hui une omniprésence des connaissances, en même temps qu'un décloisonnement des communautés de recherche en Intelligence Artificielle pour répondre aux problèmes qui se posent. Ainsi, la construction des systèmes à base de connaissances fait appel à l'ingénierie des connaissances, au traitement automatique des langues, à l'apprentissage automatique et à la fouille de données; le traitement des connaissances associe ingénierie des connaissances avec recherche d'information, recherche opérationnelle, analyse de données; la modélisation des environnements informatiques, de ses acteurs humains ou logiciels, allie ingénierie des connaissances et systèmes multi-agents; enfin l'ingénierie des connaissances touche à des thématiques classiques dans les communautés de l'interaction homme-machine et des environnements informatiques pour l'apprentissage humain. En plaçant ainsi l'utilisateur au coeur des systèmes informatiques, l'ingénierie des connaissances est sollicitée pour assister l'utilisateur dans le traitement de la masse de données disponibles sur le web, pour les visualiser, contextualiser, expliquer, recommander, classer, prédire, approximer, sécuriser, fiabiliser, pour pallier à leur imprécision voire incohérence. Les thèmes d'IC 2014 sont les suivants (liste non exhaustive): Représentation des connaissances et raisonnement - modèles, formalismes, langages formels et informels de représentation de connaissances - échange, interopérabilité et réutilisation des modèles, standardisation - terminologies, thesauri, ontologies et lexiques - types d''ontologies et rôle des ontologies de référence - méthodes et outils pour le cycle de vie des représentations - gestion de la dynamique des ontologies (versionnement, évolution, intégration et alignement) - raisonnements logiques, inférences, raisonnements à base de règles, - approximations, raisonnements statistiques, raisonnements par analogie, raisonnements à partir de cas, raisonnements dans les logiques non classiques Conception et construction de modèles de connaissances et d'ontologies - peuplement de modèles de connaissances - acquisition de connaissances à partir de textes - découverte interactive de connaissances dans les données, dans les historiques, dans les interactions, sur le web, etc. - inférence et règles métier : acquisition, conception, réutilisation, évolution, évaluation, exploitations - métrique et évaluation de la qualité des ontologies Web de données, web sémantique - ouverture et interconnexion des données - impact de l'ouverture des données sur le web et de l'externalisation ouverte (crowdsourcing) sur l'ingénierie des connaissances - réseaux sociaux - gestion de flux de données - passage à l'échelle : traitement de données massives - traitement de données hétérogènes - provenance et confiance dans les données - métrique et évaluation de la qualité des données Ingénierie des connaissances centrée utilisateurs - visualisation de connaissances, d'ontologies - visualisation d'interconnexions de données, de raisonnements sur les données - explication des raisonnements - profils utilisateurs, modèles de contexte et adaptation, modèles d'émotion - personnalisation de l'accès aux connaissances: confiance, recommandation, classement (ranking), résumé - assistance d'applications et de services: agents conversationnels - environnements informatiques pour l'apprentissage humain - conception et évaluation d'interactions et d'interfaces avec des systèmes à base de connaissances Interdisciplinarité de l'ingénierie des connaissances - épistémologie de l'ingénierie des connaissances - théorie des organisations et ingénierie des connaissances - sciences humaines et sciences cognitives et ingénierie des connaissances - ingénierie des connaissances scientifiques Ingénierie des connaissances pervasive : IC dans... - le traitement automatique des langues - l'apprentissage symbolique - la fouille de données - la recherche d'information, l'indexation - la recherche opérationnelle - l'analyse de données - les systèmes multi-agents - les environnements informatiques pour l'apprentissage humain - les interfaces homme-machine Applications - applications dans les domaines de la santé, de l'éducation et de l'apprentissage, de la culture, de la recherche documentaire, des transports intelligents, de l'informatique décisionnelle (BI), etc. - émergence de nouveaux domaines applicatifs - mémoires d'entreprises - systèmes pour la collaboration et la coopération dans les organisations et les collectifs ------------------------------------------------------------------------ Soumissions : Articles longs(12 pages (nouveau format), présentation orale de 20 mn, 10 mn discussion) : Sont concernés des travaux aboutis, présentant des résultats validés ou des synthèses fouillées. Articles courts(6 pages (nouveau format), présentation orale de 10 mn, 5 mn discussion) : Sont concernés des travaux en cours ou au stade de résultats partiels de recherche ou appliqués. Ce type de soumission correspond à des travaux innovants de qualité, mais dont la maturité ne permet pas des élaborations complètes et des conclusions définitives. Les articles devront respecter les styles de documents indiqués sur le site de la conférence: http://www.irit.fr/IC2014. Les auteurs sont invités à soumettre leurs communications au format PDF sur EasyChair: https://www.easychair.org/conferences/?conf=ic2014. Les articles acceptés feront l'objet d''actes en version électronique, publiés sur HAL, et disponibles sur une clé USB distribuée aux participants de la conférence. Un prix AFIA du meilleur article sera décerné par un jury composé de membres du comité de pilotage de la conférence. ------------------------------------------------------------------------ La conférence d'Ingénierie des Connaissances est placée sous l'égide du collège IC de l'AFIA ------------------------------------------------------------------------ Présidente du comité de programme : Catherine Faron Zucker (I3S, Université Nice Sophia Antipolis) Présidente du comité d'organisation : Catherine Roussey (Irstea) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:20:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:20:31 +0100 Subject: Appel: MediaEval 2014, Call for Task Proposals Message-ID: Date: Mon, 11 Nov 2013 09:37:58 +0000 From: POPESCU Adrian 211643 Message-ID: X-url: http://www.multimediaeval.org/mediaeval2014 MediaEval 2014 Call for Task Proposals MediaEval Multimedia Benchmark http://www.multimediaeval.org/mediaeval2014 ***Task proposal submission deadline: 21 December 2013*** __________________________________________________________ MediaEval is a benchmarking initiative dedicated to evaluating new algorithms for multimedia access and retrieval. It emphasizes the 'multi' in multimedia and focuses on human and social aspects of multimedia tasks. MediaEval is calling for proposals for tasks from researchers in academia and industry to run in the 2014 benchmarking season. The proposal should contain the following elements: - Name of the task, - Short description of the use scenario underlying the task (Who would ultimately use the technology developed to address this task?), - Short description of the task (What is the problem that task participants will be expected to solve?), - Description of the data to be used, including a statement on how it is to be licensed (Note that MediaEval encourages the use of Creative Commons data wherever possible.), - Description of how the ground truth will be obtained, - Statement of the evaluation metric and/or methodology, - Brief statement of how the task is different from existing tasks in other benchmarks and/or how it extends the previous year’s MediaEval task (if applicable), - Brief statement of why the task is a MediaEval task (Does the task involve a strong social or human component?), - Examples (2-3) of recommended reading (i.e., references of papers that you would expect participants to have read before attempting the task), - Name and contact information for the members of the proposing team (Please include a couple sentences about the composition/history of the team. New collaborations are explicitly encouraged.), - Summary (200-300 words) of the motivation, task, data and evaluation in a form suitable for the survey (i.e., a condensed version including the most important points from above), - The survey asks if people are interested in the task, and also asks questions that gather people's input on certain task design decisions. Please add 4-7 questions that you would like potential participants to ask about the task. For the last two points, it is helpful to refer to last years survey to see the format of the task description and the type of questions. http://www.multimediaeval.org/docs/MediaEval2013_SurveyForm_FInal.pdf There is no particular length specification for the proposal, some tasks will require more explanation than others. However, proposals are easier to manage if they are concise: in general, they should not exceed two pages. Please email your proposal (as a .pdf) to Martha Larson m.a.larson at tudelft.nl and Gareth Jones gareth.jones at computing.dcu.ie by December 21, 2013. __________________________________________________________ Task proposals are accepted on the basis of the existence of a community of task supporters (i.e., researchers who are interested and would plan to participate in the task). Support is determined using a survey, which is circulated widely to the multimedia research community at the beginning of the year (January 2014). Task decisions are made mid-February. Tasks must also be viable given the design of the task and the resources available to the task organization team. We encourage task proposers to join forces with colleagues from other institutions and other projects to create an organizing team large enough to bear the burden of data set generation, results evaluation, and working notes paper review. Please contact Martha Larson m.a.larson at tudelft.nl if you have questions about task organization or if you are interested in being connected up with other people with similar interests and who could join together to form a task organizer team. MediaEval has been experiencing steady growth since it was founded in 2008 as a track called "VideoCLEF" within the CLEF benchmark campaign. In 2010, it became an independent benchmark and in 2012 it ran for the first time as a fully "bottom-up benchmark", meaning that it is organized for the community, by the community, independently of a "parent" project. The MediaEval benchmarking season culminates with the MediaEval workshop. Participants come together at the workshop to present and discuss their results, build collaborations, and develop future task editions or entirely new tasks. Past working notes proceedings of the workshop include: MediaEval 2012: http://ceur-ws.org/Vol-807/ MediaEval 2013: http://ceur-ws.org/Vol-1043/ Example tasks that have run in past years are: - Placing Task: Predict the geo-coordinates of user-contributed photos. - Tagging Task: Automatically assign tags to user-generated videos. - Spoken Web Search: Search FOR audio content WITHIN audio content USING an audio content query. - Search and Hyperlinking: Multi-modal search and automated hyperlinking of user-generated and commercial video. - Social Event Detection: Find multimedia items related to a particular event within a social multimedia collection. - Violent Scenes Detection Task: Automatically detect violence in movies. We expect the MediaEval 2014 workshop to be held in October 2014 in Europe, possibly returning to the venue of the MediaEval 2013 workshop in Barcelona. For more information on the MediaEval Multimedia benchmark, please visit http://www.multimediaeval.org/ or contact Martha Larson m.a.larson at tudelft.nl. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:16:05 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:16:05 +0100 Subject: Appel: EACL 2014 Workshop on Cognitive Aspects of Computational Language Learning Message-ID: Date: Sat, 9 Nov 2013 21:52:56 +0100 From: Thierry Poibeau Message-Id: [Apologies for cross-postings] ================================================== First Call for Papers ================================================== EACL 2014 Workshop on Cognitive Aspects of Computational Language Learning April 26, 2014 Gothenburg, Sweden https://sites.google.com/site/cognitivews2014/ Deadline for Paper Submissions: January, 23rd, 2014 (11:59pm GMT -12) --------------------------------------------------------------- The human ability to acquire and process language has long attracted interest and generated much debate due to the apparent ease with which such a complex and dynamic system is learnt and used on the face of ambiguity, noise and uncertainty. This subject raises many questions ranging from the nature vs. nurture debate of how much needs to be innate and how much needs to be learned for acquisition to be successful, to the mechanisms involved in this process (general vs specific) and their representations in the human brain. There are also developmental issues related to the different stages consistently found during acquisition (e.g. one word vs. two words) and possible organizations of this knowledge. These have been discussed in the context of first and second language acquisition and bilingualism, with cross linguistic studies shedding light on the influence of the language and the environment. The past decades have seen a massive expansion in the application of statistical and machine learning methods to natural language processing (NLP). This work has yielded impressive results in numerous speech and language processing tasks, including e.g. speech recognition, morphological analysis, parsing, lexical acquisition, semantic interpretation, and dialogue management. The good results have generally been viewed as engineering achievements. Recently researchers have begun to investigate the relevance of computational learning methods for research on human language acquisition and change. The use of computational modeling is a relatively recent trend boosted by advances in machine learning techniques, and the availability of resources like corpora of child and child-directed sentences, and data from psycholinguistic tasks by normal and pathological groups. Many of the existing computational models attempt to study language tasks under cognitively plausible criteria (such as memory and processing limitations that humans face), and to explain the developmental stages observed in the acquisition and evolution of the language abilities. In doing so, computational modeling provides insight into the plausible mechanisms involved in human language processes, and inspires the development of better language models and techniques. These investigations are very important since if computational techniques can be used to improve our understanding of human language acquisition and change, these will not only benefit cognitive sciences in general but will reflect back to NLP and place us in a better position to develop useful language models. Success in this type of research requires close collaboration between the NLP, linguistics, psychology and cognitive science communities. The workshop is targeted at anyone interested in the relevance of computational techniques for understanding first, second and bilingual language acquisition and language change in normal and clinical conditions. Long and short papers are invited on, but not limited to, the following topics: * Computational learning theory and analysis of language learning and organization * Computational models of first, second and bilingual language acquisition * Computational models of language changes in clinical conditions * Computational models and analysis of factors that influence language acquisition and use in different age groups and cultures * Computational models of various aspects of language and their interaction effect in acquisition, processing and change * Computational models of the evolution of language * Data resources and tools for investigating computational models of human language processes * Empirical and theoretical comparisons of the learning environment and its impact on language processes * Cognitively oriented Bayesian models of language processes * Computational methods for acquiring various linguistic information (related to e.g. speech, morphology, lexicon, syntax, semantics, and discourse) and their relevance to research on human language acquisition * Investigations and comparisons of supervised, unsupervised and weakly-supervised methods for learning (e.g. machine learning, statistical, symbolic, biologically-inspired, active learning, various hybrid models) from a cognitive perspective --------------------------------------------------------------- SUBMISSIONS We invite three different submission modalities: * Regular long papers (8 content pages + 1 page for references): Long papers should report on original, solid and finished research including new experimental results, resources and/or techniques. * Regular short papers (4 content pages + 1 page for references): Short papers should report on small experiments, focused contributions, ongoing research, negative results and/or philosophical discussion. * System demonstration (2 pages): System demonstration papers should describe and document the demonstrated system or resources. We encourage the demonstration of both early research prototypes and mature systems, that will be presented in a separate demo session. All submissions must be in PDF format and must follow the EACL 2014 formatting requirements (available at http://www.eacl2014.org/files/eacl-2014-styles.zip). We strongly advise the use of the provided Word or LaTeX template files. For long and short papers, the reported research should be substantially original. The papers will be presented orally or as posters. The decision as to which paper will be presented orally and which as poster will be made by the program committee based on the nature rather than on the quality of the work. Reviewing will be double-blind, and thus no author information should be included in the papers; self-reference should be avoided as well. Papers that do not conform to these requirements will be rejected without review. Accepted papers will appear in the workshop proceedings, where no distinction will be made between papers presented orally or as posters. Submission and reviewing will be electronic, managed by the START system. Submissions must be uploaded onto the START system by the submission deadline: January 23rd, 2014 (11:59pm GMT -12 hours) Please choose the appropriate submission type from the START submission page, according to the category of your paper. --------------------------------------------------------------- IMPORTANT DATES Jan 23, 2014 Long and Short Paper submission deadline Feb 05, 2014 System Demonstrations submission deadline Feb 20, 2014 Notification of acceptance Mar 03, 2014 Camera-ready deadline Apr 26, 2014 Workshop --------------------------------------------------------------- PROGRAM COMMITTEE Afra Alishahi Tilburg University (Netherlands) Colin J Bannard University of Texas at Austin (USA) Marco Baroni University of Trento (Italy) Robert Berwick Massachusetts Institute of Technology (USA) Philippe Blache LPL, CNRS (France) Jim Blevins University of Cambridge (UK) Antal van den Bosch Radboud University Nijmegen (Netherlands) Chris Brew Nuance Communications (USA) Ted Briscoe University of Cambridge (UK) Alexander Clark Royal Holloway, University of London (UK) Robin Clark University of Pennsylvania (USA) Stephen Clark University of Cambridge (UK) Matthew W. Crocker Saarland University (Germany) Walter Daelemans University of Antwerp (Belgium) Dan Dediu Max Planck Institute for Psycholinguistics (The Netherlands) Barry Devereux University of Cambridge (UK) Benjamin Fagard Lattice-CNRS (France) Jeroen Geertzen University of Cambridge (UK) Ted Gibson Massachusetts Institute of Technology (USA) Henriette Hendriks University of Cambridge (UK) Marco Idiart Federal University of Rio Grande do Sul (Brazil) Mark Johnson Brown University (USA) Aravind Joshi University of Pennsylvania (USA) Gianluca Lebani University of Pisa (Italy) Igor Malioutov Massachusetts Institute of Technology (USA) Marie-Catherine de Marneffe The Ohio State University (USA) Maria Alice Parente Federal University of ABC (Brazil) Massimo Poesio University of Trento (Italy) Brechtje Post University of Cambridge (UK) Ari Rappoport The Hebrew University of Jerusalem (Israel) Anne Reboul L2C2-CNRS (France) Kenji Sagae University of Southern California (USA) Sabine Schulte im Walde University of Stuttgart (Germany) Ekaterina Shutova University of California, Berkeley (USA) Maity Siqueira Federal University of Rio Grande do Sul (Brazil) Mark Steedman University of Edinburgh (UK) Suzanne Stevenson University of Toronto (Canada) Remi van Trijp Sony Computer Science Laboratory Paris (France) Shuly Wintner University of Haifa (Israel) Charles Yang University of Pennsylvania (USA) Beracah Yankama Massachusetts Institute of Technology (USA) Menno van Zaanen Tilburg University (Netherlands) Alessandra Zarcone University of Stuttgart (Germany) --------------------------------------------------------------- WORKSHOP ORGANIZERS AND CONTACT Alessandro Lenci (University of Pisa, Italy) Muntsa Padró (Federal University of Rio Grande do Sul, Brazil) Thierry Poibeau (LATTICE-CNRS, France) Aline Villavicencio (Federal University of Rio Grande do Sul, Brazil) For any inquiries regarding the workshop please send an email to cognitive2014 at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:28:50 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:28:50 +0100 Subject: Appel: RJCIA 2014 Message-ID: Date: Tue, 12 Nov 2013 17:59:56 +0100 From: Grégory Bonnet Message-ID: <52825E8C.3060902 at unicaen.fr> X-url: http://rjcia2014.greyc.fr X-url: http://rfia2014.univ-rouen.fr/ -- Merci de diffuser aussi largement que possible cet appel, en particulier au sein des associations de doctorants et des listes de diffusion de vos écoles doctorales et laboratoires. Veuillez excuser les réceptions multiples. -- ********************************************************************** Appel à communications RJCIA 2014 12èmes Rencontres des Jeunes Chercheurs en Intelligence Artificielle 30 juin - 1er juillet 2014, Rouen, France http://rjcia2014.greyc.fr ********************************************************************** Présentation Les douzièmes rencontres des jeunes chercheurs en Intelligence Artificielle (RJCIA 2014) se dérouleront du 30 juin au 1er juillet 2014 à Rouen. Ces rencontres sont hébergées par RFIA'14 (Reconnaissance des Formes et l'Intelligence Artificielle), organisée par le laboratoire LITIS et ses établissements de tutelle l'INSA de Rouen, l'Université de Rouen et l'Université du Havre, au nom de l'Association Française d'Intelligence Artificielle (AFIA) et de l'Association Française de Reconnaissance et d'Interprétation des Formes (AFRIF). Les RJCIA 2014 sont destinées aux jeunes chercheurs en Intelligence Artificielle : doctorants ou titulaires d'un doctorat depuis moins d'un an. L'objectif de cette manifestation est double : 1) permettre aux jeunes chercheurs préparant une thèse en Intelligence Artificielle, ou l'ayant soutenue depuis peu, de se rencontrer et de présenter leurs travaux, et ainsi de former des contacts avec d'autres jeunes chercheurs et d'élargir leurs perspectives en échangeant avec des spécialistes d'autres domaines de l'Intelligence Artificielle ; 2) former les jeunes chercheurs à la préparation d'un article, à sa révision pour tenir compte des observations du comité de programme, et à sa présentation devant un auditoire de spécialistes, leur permettant ainsi d'obtenir des retours de chercheurs de leur domaine ou de domaines connexes. Pour tout renseignement complémentaire, s'adresser à Grégory Bonnet (gregory.bonnet[at]unicaen.fr), président du comité de programme. Appel à communication Les RJCIA 2014 ont pour vocation de compléter le panorama de la recherche francophone en Intelligence Artificielle proposé par RFIA'14 en présentant des travaux de jeunes chercheurs dans ce domaine. Ainsi, toute contribution relevant de l'Intelligence Artificielle est la bienvenue. La liste indicative des thématiques ci-dessous n'est pas exhaustive. Apprentissage artificiel (supervisé, non supervisé, par renforcement) Fouille de masse de données, fouille de grands graphes, fouille de texte Extraction et utilisation de connaissances par et pour la fouille (de masses) de données Satisfaction de contraintes Représentation des connaissances, modèles de raisonnement, raisonnement, planification Agents autonomes et systèmes multi-agents (décision individuelle, collective, interactions) Informatique émotionnelle, agent virtuel socio-émotionnel, interaction humain-agent Robotique autonome, contrôle intelligent, aide à la décision dans les systèmes robotiques Gestion des connaissances : modélisation, organisation, optimisation et traitement Traitement automatique des langues Données liées, données ouvertes, publication de données Masse de données, Web de données, web sémantique, ontologies. Extraction d'information, indexation sémantique de contenu Visualisation de données et de connaissances Validation, évaluation des systèmes d'Intelligence Artificielle Applications de l'Intelligence Artificielle (médecine, transport, agronomie, droit) Conditions de soumission Les auteurs sont invités à soumettre des propositions d'articles de 6 pages double colonne maximum selon le style proposé par RFIA'14. dans l'une des deux catégories suivantes : Communications de synthèse : Les RJCIA 2014 sont l'occasion pour les doctorants de première année de présenter leur sujet de thèse au travers d'une communication de synthèse. Cette dernière permet de présenter un état de l'art, d'identifier des problématiques et/ou de proposer de première pistes de travail. Les auteurs sont encouragés à clairement décrire le contexte de leur travaux et de mettre en lumière les problèmes rencontrés. Communications de recherche : Les RJCIA 2014 invitent aussi les jeunes chercheurs plus confirmés à présenter des travaux de recherche originaux théoriques, expérimentaux ou à vocation opérationnelle. Une rigueur devra être apportée à la rédaction des articles, tant sur le plan de la forme que sur celui du contenu scientifique. Les jeunes chercheurs qui le souhaitent sont également invités à soumettre leur communication à la session IA de RFIA'14. Les auteurs sont invités à indiquer lors de la soumission la catégorie dans laquelle s'inscrit leur proposition. Le premier auteur de la communication doit être doctorant ou docteur depuis moins d'un an (thèse en cours, ou soutenue en 2013). Aucune exclusivité n'est demandée : nous souhaitons que les articles soumis dans les conférences ou ateliers internationaux puissent également être proposés aux RJCIA 2014. La langue de la conférence est le français de préférence, ou l'anglais sinon. Chaque soumission sera relue par au moins trois membres du comité de programme. Les critères de relecture incluent l'originalité des idées, la qualité technique, l'importance des résultats et la qualité de la présentation. Dates importantes Ouverture du site de soumissions : 6 janvier 2014 Date limite de soumission : 17 février 2014 Notification aux auteurs : 25 avril 2014 Réception des versions définitives : 16 mai 2014 RJCIA 2014 : lundi 30 juin et mardi 1er juillet 2014 Soumission d'articles Le format de soumission est disponible sur le site de la conférence : http://rjcia2014.greyc.fr Les soumissions se sont font via Easychair : https://www.easychair.org/conferences/?conf=rjcia2014 Comité de programme (en cours de constitution) Nicolas Béchet, IRISA, Université de Bretage-Sud Lamia Belouaer, IRENav, Ecole Navale Grégory Bonnet, GREYC, Université de Caen Basse-Normandie Elise Bonzon, LIPADE, Université Paris Descartes Gauvain Bourgne, LIP6, Université Pierre et Marie Curie Sylvain Bouveret, LIG, INP Grenoble Amélie Cordier, LIRIS, Université Lyon 1 Jean-Marie Lagniez, CRIL, Université d'Artois Marie Lefevre, LIRIS, Université Lyon 1 Benoit Mathern, LIRIS, Université Lyon 1 Laëtitia Matignon, LIRIS, Université Lyon 1 Alexandre Niveau, GREYC, Université de Caen Basse-Normandie Antoine Nongaillard, DISP, Université Lyon 2 Alexandre Pauchet, LITIS, INSA Rouen Cédric Pralet, Onera Mathieu Roche, TETIS, Cirad Stéphanie Roussel, CRIL Karima Sedki, Lim&Bio, Université Paris 13 Informations pratiques Consultez le site de RFIA'14 (http://rfia2014.univ-rouen.fr/) afin d'obtenir les informations pratiques pour s'inscrire et se rendre au LITIS. Pour le comité de programme des RJCIA 2014, Grégory Bonnet ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:25:07 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:25:07 +0100 Subject: Appel: ESWC 2014, Second Call for Tutorials Message-ID: Date: Mon, 11 Nov 2013 19:45:25 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131111184545.4003DDBA9E at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/call-tutorials ** apologies for cross-posting ** ==== Second Call for Tutorials ==== http://2014.eswc-conferences.org/important-dates/call-tutorials ESWC 2014 invites tutorials that address the interests of its varied audience: people new to the Semantic Web, Semantic Web researchers and practitioners that wish to learn new technologies, users of Semantic Web technologies, and representatives of government and funding agencies as well as potential private investors in Semantic Web technologies. We welcome submissions of tutorial proposals on all major topics related to semantic technologies. We especially solicit proposals for tutorials of the following types: - Tutorials with a coherent theme providing an introduction to new semantic technologies and trends. - Tutorials describing the application of semantic technologies in specific domains (e.g., life-sciences, e-government, e-commerce, cultural heritage, etc.). - Tutorials presenting techniques from other research fields that are of relevance for Semantic Web research especially in relationship to the tracks of the conference (e.g., techniques from social science, database techniques, NLP techniques etc.). Tutorials can be half a day or a full day. We advise having more than one presenter and no more than three, preferably from different institutions, bringing different perspectives to the tutorial topic. Tutorials may focus entirely on theoretical aspects; however, we encourage organisers to incorporate hands-on sessions where appropriate. The tutorials should reach a good balance between the topic coverage and its relevance to the community. Timeline for Tutorials ----------- Proposals due: Nov 22, 2013 - 23:59 Hawaii Time Notification of acceptance: Dec 6, 2013 - 23:59 Hawaii Time Tutorial Web site due: Dec 16, 2013 - 23:59 Hawaii Time Camera-ready material due: Apr 25, 2014 - 23:59 Hawaii Time Tutorial days: May 25 and May 26, 2014 Responsibilities ----------- Organizers of accepted tutorials are responsible for preparing and maintaining a Web site that describes the tutorial and includes all relevant information. Organizers are also responsible for submitting the material for attendees (slide sets, additional teaching material, software installation and usage guides for practical hands-on sessions, etc.) to the Tutorial Chair. The ESWC 2014 Organizing Committee is responsible for providing publicity for the tutorials as part of the conference publicity activities, and on-site logistical support to the organizers and attendees. Tutorial attendees must pay the ESWC 2014 workshop registration fee, as well as the conference registration fee. General Information ----------- Each tutorial will have one reduced registration fee (pre-conference days registration will be free i.e. one of the chairs will only have to pay the main conference fees). In the interest of the overall quality of the conference, the Tutorial Chair reserves the right to merge tutorials and/or adjust the scope thereof in case a mimimum number of registrations is not reached by the early registration deadline. Submission details ----------- Tutorial proposals should not exceed 5 pages, using an 11 pt font for the body of the text of the proposal and should contain the following information: - Abstract (200 words maximum, for inclusion on the ESWC 2014 website). - Tutorial description: More specifically, it should specify the objectives of the tutorial and relevance to ESWC 2014, include enough details on the scope of the material to be covered and the depth to which it will be covered and specify the intended audience and any prerequisite knowledge. Appropriate references to the material to be covered by the tutorial must be included. - Tutorial length. The tutorial can be full or half day (if the tutorial can be either length, please be sure to identify which material is included for each length). - Specify other venues to which the tutorial or part thereof has or will be presented, in addition to explaining how the current tutorial differs from the other editions. Links to the slides of those tutorial editions should be included in the proposal. - Brief professional biography of the presenter(s) indicating previous training and speaking experience (such as teaching and tutorial presentation). Each proposal will be reviewed by the members of the tutorial programme committee, and ranked based on the overall quality of the proposal and the tutorial's fit to the conference. Their recommendation will determine the final decision on the acceptance/rejection of each proposal. Submission ----------- Submission will be through the Easychair system (please note that it is the same site to submit workshops and tutorials) https://www.easychair.org/conferences/?conf=eswc2014workshops-tutorials Tutorials Chair Nathalie Aussenac-Gilles (IRIT-CNRS, Toulouse, Fr) email: aussenac at irit.fr From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:22:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:22:37 +0100 Subject: Appel: PITR Workshop at EACL 2014 Message-ID: Date: Mon, 11 Nov 2013 18:05:10 +0000 From: Sandra.Williams Message-ID: <54822479-0E2A-4911-A14F-608429BCAAA8 at open.ac.uk> X-url: http://mcs.open.ac.uk/nlg/pitr2014/ First Call for Papers: The 3rd Workshop on Predicting and Improving Text Readability for Target Reader Populations (PITR2014) 27th April 2014 in conjunction with EACL 2014, Gothenburg, Sweden http://mcs.open.ac.uk/nlg/pitr2014/ Submission deadline: 23rd January 2014 Many NLP systems generate or reformulate human languages but how readable is the output? What makes language easy, difficult, or, indeed, a pleasure to read for different types of readers? How can existing text be manipulated to improve information access? How does the style of writing, formal vs informal, informational vs. entertaining, affect readability, user comprehension, and/or appreciation of text? The last few years have seen a resurgence of interest in these questions amongst computational linguists as attention turns to more sophisticated techniques for textual presentation and to address the widely differing needs of end users. PITR is a cross-disciplinary workshop bringing together researchers in fields concerned with the readability, accessibility, and quality of text. We are keen to widen the scope to include researchers who might not normally attend a computational linguistics conference, e.g., psycholinguists, sociolinguists, assistive technology and educational researchers. We would welcome papers on: * Reformulation of existing text (text-to-text systems) * Generation of readable language from data (data-to-text systems) * Generation of text in specific styles and registers for readability * Evaluation of language simplification strategies * Evaluation of the readability and quality of computer-generated text * Evaluation of the readability and quality of machine translation output * Prediction of aspects of text style related to readability * Prediction of the readability of documents * Readability issues in specialist texts such as questionnaires, exam questions, safety instructions, etc. * Novel evaluation strategies for assessing text readability * Novel readability metrics * Techniques for simplifying lexis * Techniques for simplifying syntax * Techniques for simplifying discourse properties (making text more transparent, etc.) * Techniques for manipulating textual layout to improve accessibility * Techniques for making descriptions of numerical quantities more accessible * Techniques for making technical terminology more accessible * Techniques for making descriptions of logical statements more accessible * Techniques for explaining complex ideas through accessible text * Systems aimed at adults with poor literacy * Systems aimed at children learning to read * Systems aimed at 2nd language learners * Systems aimed at people with language deficits (aphasia, deafness, neurodegeneration, etc.) * Systems aimed at non-experts accessing technical material * Models of text quality for competent language users * Models to predict reader interest and engagement * Models of text style with application to readability SUBMISSIONS Papers should prepared in EACL format (see under 'Submission Format' at http://eacl2014.org/call-for-papers). They should not exceed 8 pages in length plus up to 2 additional pages for references. These are maximum lengths; shorter papers are also acceptable. Papers should be anonymised for blind reviewing. Please submit your paper via the online START Conference Manager system: https://www.softconf.com/eacl2014/PITR/ Some authors will be invited to give oral presentations. All accepted authors will be expected to present a poster. Last year, the poster session was very lively, giving poster-only authors and oral-presentation authors ample opportunities to discuss their research. IMPORTANT DATES Submission deadline: 23rd January 2014 Notification: 20th February 2014 Camera-ready: 3rd March 2014 Workshop: 27th April 2014 PROGRAMME COMMITTEE Stefan Bott, Universitat Pompeu Fabra, Spain Kevyn Collins-Thompson, University of Michigan, USA Siobhan Devlin, University of Sunderland, UK Micha Elsner, Ohio State University, USA Richard Evans, University of Wolverhampton, UK Oliver Ferschke (instead of Iryna) Thomas Francois, University of Louvain, Belgium Caroline Gasperin, SwiftKey, UK Albert Gatt, University of Malta, Malta Raquel Hervas, Universidad Complutense de Madrid, Spain Veronique Hoste, University College Ghent, Belgium Matt Huenerfauth, The City University of New York (CUNY), USA David Kauchak, Middlebury College, USA Annie Louis, University of Edinburgh, UK Ruslan Mitkov, University of Wolverhampton, UK Hitoshi Nishikawa, NTT, Japan Ehud Reiter, University of Aberdeen, UK Matthew Shardlow, Uni of Manchester, UK Lucia Specia, University of Sheffield, UK Ivelina Stoyanova, BAS, Bulgaria Irina Temnikova, University of Wolverhampton, UK Sowmya Vajjala, Uni Tuebingen, Germany Ielka van der Sluis, University of Groningen, The Netherlands Jennifer Williams, MIT, USA Kristian Woodsend, University of Edinburgh, UK ORGANISERS Sandra Williams, The Open University, UK Advaith Siddharthan, University of Aberdeen, UK Ani Nenkova, University of Pennsylvania, USA From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:49:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:49:10 +0100 Subject: Appel: Journal of Language Modelling Message-ID: Date: Thu, 14 Nov 2013 11:10:56 +0100 From: Yannick Parmentier Message-ID: <20131114101056.GD3777 at nausicaa> X-url: http://jlm.ipipan.waw.pl/ **Apologies for cross-posting. Please post or distribute.** 2nd CALL FOR PAPERS Journal of Language Modelling SPECIAL ISSUE ON High-level Methodologies for Grammar Engineering http://jlm.ipipan.waw.pl/ Special Issue Description ------------------------- Many grammatical frameworks have been proposed over the last decades to describe the syntax (and semantics) of natural language. Among the most widely used, one may cite (in chronological order) Tree-Adjoining Grammar (TAG) [Joshi et al., 1975], Lexical-Functional Grammar (LFG) [Bresnan and Kaplan, 1982], Combinatory Categorial Grammar (CCG) [Steedman, 1987], or Head- driven Phrase Structure Grammar (HPSG) [Pollard and Sag, 1994]. These frameworks present theoretical and practical interests. From a theoretical point of view, they provide a formal device for the linguist to experiment with her/his theories. >From a practical point of view, they make it possible to automatically process natural language in applications such as dialog systems, machine translation, etc. They differ in their expressivity and complexity. Some prove more suitable for the description of a given language than others. Still, for many of these frameworks, large resources (e.g., grammars) have been designed, at first by hand, and later via dedicated tools (e.g., integrated grammar environments such as XLE for LFG [King et al., 2000]). In this Special Issue, we are concerned with this complex task of grammar engineering, keeping in mind the two above-mentioned theoretical and practical interests. Topics of Interest ------------------ This special issue welcomes contributions from the following topics (without being limited to these): 1. New or updated work on the traditional topics of GEAF workshops The traditional topics in the series of "Grammar Engineering Accross Frameworks" workshops, "Formal Grammar" conferences and / or the "High-level Methodologies for Grammar Engineering" ESSLLI 2013 workshop are appropriate. The submitted paper must clearly deal with language modelling. An extended version of a workshop/conference paper can be submitted, provided that the contribution has been substantially updated. The forums for any preliminary versions of the paper must be indicated. 2. Study of new fundamental and / or applied results in relation with grammar development, maintenance and enhancement - dedicated description languages for grammar engineering - semi-automatic acquisition of grammars - development of grammars for under-resourced languages - cross-framework grammar engineering - cross-language grammar engineering - seamless construction of grammars from dynamically changing linguistic descriptions - designs of weighted grammars - efficient and dynamic construction of structures from updated rules or logical formulas 3. Study of new methods for grammar engineering and their applications - debugging environments for grammar design - systems based on large-scale grammars 4. In addition, the topics of interest include reports on implementations - new kinds of implementations of grammar compilers, libraries and on-demand operations - benchmarks suitable for evaluation of grammars - methods that construct, minimize or decompose grammars Important Dates --------------- - Deadline for submissions: 2 February 2014 - First decision: 12 May 2014 - Submission of revised version: 17 July 2014 - Final decision: 22 September 2014 - Submission of camera-ready versions: 19 October 2014 Submission ---------- Articles submitted to this special issue must adhere to the JLM instructions for contributors and use the JLM's style files, see: http://jlm.ipipan.waw.pl/about/submissions#authorGuidelines Paper submissions should be made through JLM's electronic submission system: http://jlm.ipipan.waw.pl/about/submissions#onlineSubmissions All submitted articles should be anonymous and any obvious self-references should be avoided. The contribution of the paper must be substantial. All articles will be evaluated by at least 3 reviewers, including at least one member of JLM's Editorial Board, and at least one member of the issue's Guest Editorial Board. Editorial Board --------------- Guest Editors - Denys Duchier, Université d'Orléans, FRANCE - Yannick Parmentier, Université d'Orléans, FRANCE Guest Editorial Board - Emily Bender, University of Washington, USA - Philippe Blache, CNRS, Université d'Aix-en-Provence, FRANCE - Eric De La Clergerie, INRIA Paris, FRANCE - Benoît Crabbé, Université Diderot Paris 7, FRANCE - Berthold Crysmann, CNRS Paris, FRANCE - Denys Duchier, Université d'Orléans, FRANCE - Claire Gardent, CNRS/LORIA, Nancy, FRANCE - Joseph Le Roux, Université Paris Nord, FRANCE - Timm Lichte, Universität Düsseldorf, GERMANY - Montserrat Marimon, Universitat de Barcelona, SPAIN - Yusuke Miyao, National Institute of Informatics, Tokyo, JAPAN - Stefan Müller, Freie Universität Berlin, GERMANY - Yannick Parmentier, Université d'Orléans, FRANCE Contact ------- Yannick Parmentier Department of Computer Science, University Institute of Technology University of Orléans firstname (dot) lastname (at) univ-orleans (dot) fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:49:57 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:49:57 +0100 Subject: Appel: CICLing 2014 / NLP - Nepal - Springer LNCS Message-ID: Date: Thu, 14 Nov 2013 05:54:02 -0600 From: "Alexander Gelbukh \(CFP\)" Message-ID: <000b01cee130$3a010bf0$ae0323d0$@cicling.org> CICLing 2014 15th International Conference on Intelligent Text Processing and Computational Linguistics Kathmandu, Nepal - April 6-12, 2014 Springer LNCS, journals Deadline: Dec 31 / Jan 7 www.CICLing.org/2014 TOPICS: All topics related to computational linguistics, natural language processing, human language technologies, information retrieval, opinion mining, etc. PUBLICATION: LNCS - Springer Lecture Notes in Computer Science; poster session: special issues of journals KEYNOTE SPEAKERS: Four first-class experts, see webpage. CULTURAL PROGRAM: Three days of cultural activities: tours by Kathmandu, Buddhist monasteries, Chariot festival AWARDS: Best paper, best student paper, best presentation, best poster, best software SUBMISSION DEADLINES: December 31: registration of tentative abstract (why not register your tentative abstract now?), January 7: full text of the registered papers See complete CFP and contact on www.CICLing.org/2014 PLEASE CIRCULATE this CFP among your colleagues and students. I apologize if you receive multiple copies. Respond to this message to be removed from my list. From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:38:56 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:38:56 +0100 Subject: Stage: Stage de master recherche en TAL, Paris - CORRECTION Message-ID: Date: Thu, 14 Nov 2013 10:19:36 +0100 From: Frederic Landragin Message-ID: <528495A8.60406 at ens.fr> Proposition de stage de M2 Laboratoire Lattice & LTCI Telecom-ParisTech Titre : Modélisation d’actes communicatifs multimodaux pour un agent conversationnel animé dans les dialogues humain-machine Descriptif : Les Agents Conversationnels Animés (ACA) sont des personnages virtuels permettant à la machine de dialoguer avec les humains de manière naturelle. Ils peuvent prendre le rôle d’assistant comme les agents conversationnels présents sur les sites de vente, de tuteur dans le cadre des Jeux Sérieux (Serious Games). Comment obtenir chez un ACA une expression naturelle des actes communicatifs? Avec quelles postures, quelles expressions faciales, quels gestes, quelle intonation, doit-on faire accompagner le discours d’un ACA dans un dialogue humain-machine ? Une attention particulière sera donnée à l’agencement des niveaux acoustique (intonation) et visuel (geste, regard, etc.) avec les aspects linguistiques de l’énoncé (syntaxe, sémantique). On interrogera notamment les analyses classiques qui tendent à simplifier, par exemple en considérant qu'à une question est associé un contour prosodique montant, alors qu'un contour plat est souvent bien plus naturel. On interrogera également les matérialisations d'un ordre en fonction du contexte socio-émotionnel : si en théorie l'ordre fait partie des trois actes de langage classiques (par exemple au sens de la Théorie de la Pertinence, Sperber & Wilson 1995), en pratique l'ordre direct est ressenti comme agressif et on lui préfère un acte de langage indirect, comme une question à valeur (cachée) d'ordre. La notion d’acte de langage sera étendue à celle d’acte communicatif afin d’intégrer les modalités non-verbales (Poggi et Pelachaud, 2000) et le sujet portera sur la modélisation des actes communicatifs multimodaux, et sur les conséquences des choix qu’un système de dialogue humain-machine peut effectuer. Les modèles construits s’intégreront dans la plateforme Greta (Niewiadomski et al., 2011), qui permet de communiquer avec l’humain en générant chez l’agent une large palette de comportements expressifs verbaux et non verbaux (Bevacqua et al., 2012). Plusieurs cas d’application pourront être envisagés : dialogues d’entraînement de jeunes en insertion sociale aux entretiens d’embauche (projet Tardis), dialogues entre un ACA et les visiteurs d’un musée (projet A1:1) Pour ce faire, le travail comportera les étapes suivantes : - Etude de dialogues Humain-Humain (TCOF, CID...), des dialogues Humain-Machine (SCNF, CIO) et de dialogues humain-ACA multimodaux (Corpus Semaine (Schröder et al., 2011)), en comparant les actes communicatifs et actes de langage présents dans ces corpus et leur réalisation verbale et non verbale. - Construction d'un modèle spécifiant des paramètres de synthèse multimodale retenus pour un ACA. - Vérification du modèle en situations de communication (soit simulées soit via un paramétrage adéquat des ACA de la plateforme GRETA (Niewiadomski et al., 2011)). Compétences requises : - Connaissances en interaction homme-machine, - Intérêt pour les aspects linguistiques et pragmatiques de la communication, - Compétences en programmation (Java), - Bon niveau en anglais. Conditions du stage : - Niveau requis : M2 ou diplôme d’ingénieur en informatique. - Rémunération : ⅓ du SMIC. - Durée : 6 mois en commençant début 2014. - Lieu : première partie du stage au laboratoire Lattice (1 rue Maurice Arnoux, Montrouge - métro Porte d’Orléans ou trawmay Jean Moulin), et deuxième partie à Telecom Paris-Tech (37 rue Dareau, Paris 14e - métro Saint-Jacques ou Denfert). Contacts : Frédéric Landragin, chercheur CNRS, laboratoire Lattice. Tel: +33 (0)1 58 07 66 21 E-Mail: frederic.landragin [at] ens.fr Chloé Clavel, maître de conférences, GRETA team, Télécom ParisTech. Tel:+33 (0)1 45 81 75 93 E-Mail: chloe.clavel [at] telecom-paristech.fr Références : E. Bevacqua, E. de Sevin, S.J. Hyniewska, C. Pelachaud (2012), A listener model : Introducing personality traits, Journal on Multimodal User Interfaces, special issue Interacting ECAs, Elisabeth André, Marc Cavazza and Catherine Pelachaud (Guest Editors), 6:27–38, 2012 C. Kerbrat-Orecchioni (2001) Les actes de langage dans le discours. Théorie et fonctionnement, Paris : Nathan Université. F. Landragin (2013) Dialogue homme-machine. Conception et enjeux, Paris : Hermès-Lavoisier. G. McKeown, M. Valstar, R. Cowie, R., M. Pantic, M. Schroder (2012) The SEMAINE Database: Annotated Multimodal Records of Emotionally Colored Conversations between a Person and a Limited Agent, IEEE Transactions on Affective Computing, Volume : 3 , Issue : 1, Page(s) : 5- 17, Jan.-March 2012 R. Niewiadomski, S. Hyniewska, C. Pelachaud (2011), Constraint-Based Model for Synthesis of Multimodal Sequential Expressions of Emotions, IEEE Transactions of Affective Computing, vol. 2, no. 3, 134-146, Juillet 2011 Poggi , C . Pelachaud , Performative facial Expressions in Animated Faces , In J . Cassell , J . Sullivan , S . Prevost , E . Churchill ( Eds .), Embodied Conversational Agents , Cambridge ( Mass .): MIT Press , 2000 Riviere, J., Adam, C., Pesty, S., Pelachaud, C., Guiraud, N., Longin, D., & Lorini, E. (2011). Expressive Multimodal Conversational Acts for SAIBA Agents, 316–323. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:58:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:58:44 +0100 Subject: Job: Proposition de stage Master / Ingenieur, Enrichissement de lexique emotionnel pour l'informatique affective Message-ID: Date: Fri, 15 Nov 2013 02:41:01 +0100 From: Jean Yves ANTOINE Message-ID: <52857BAD.7000804 at univ-tours.fr> X-url: http://li.univ-tours.fr/equipes/equipe-bdtln-198022.kjsp X-url: http://www-seaside.irisa.fr/ Proposition de stage ------------------------------- Proposition de stage de fin d’études (Master, Ecole Ingénieur) en informatique appliqué au Traitement Automatique des Langues Naturelles, d’une durée minimale de 4 mois. Titre : Enrichissement de lexique émotionnel pour l’informatique affective Contexte scientifique -------------------------------- En collaboration avec le Laboratoire d’Informatique de l’Université de Tours, le laboratoire IRISA, antenne de Lorient (56 – Morbihan) propose un sujet de stage dans le cadre du projet de recherche DAPAI-EMO financé par la société BAMSOO. Le projet DAPAI-EMO fait suite à un projet (EmotiRob) concernant le développement d’un robot compagnon affectif pour des enfants en hospitalisation longue. Cette poursuite de travaux fait abstraction ici de sa dimension robotique pour se concentrer sur ses aspects liés à la compréhension émotionnelle de la langue. Au cours du projet EmotiRob, nous avons développé EmoLogus, un système de détection des émotions qui intervient à la suite d’un système logique de compréhension de message appelé Logus. EmoLogus utilise la structure sémantique de l’énoncé fourni par Logus pour mettre en œuvre un calcul de la valence émotionnelle portée par l’énoncé, c'est-à-dire pour savoir si celui-ci porte une émotion positive, négative ou neutre. Ce calcul logique se base principalement sur l’utilisation de normes lexicales émotionnelles qui décrivent le système de valeurs du système : à chaque mot du vocabulaire est associée une valence (positif, neutre, négatif) et une intensité (nul, faible, fort) émotive. Le lexique émotionnel sur lequel se base le système a été élaboré en collaboration avec l’équipe de psycholinguistique d’Arielle Syssau, de l’Université Montpellier 2. Basé sur des jugements évaluatifs contrôlés auprès d’une population de test échantillonnée avec soin, il nous garantit la représentativité du système de valeurs d’EmoLogus. Le système a montré une bonne robustesse de détection dans le cadre restrictif d’une communication enfantine. Il souffre toutefois du manque de couverture de son lexique émotionnel. A l’heure actuelle, le système EmoLogus intègre en effet un lexique limité à un millier de mots, alors que la langue française générale compte entre 50 000 et 100 000 entrées lexicales. Dans le cadre de ce projet, nous proposons d’utiliser des techniques d’extension automatique de lexique émotionnel à partir d’une ressource initiale telle que celle du système EmoLogus. Parmi les méthodes proposées pour étendre automatiquement un lexique émotionnel étendu, on distingue deux types d'approches : - celles basées sur des réseaux sémantiques comme WordNet, où sont décrits des relations de synonymies entre tous les mots d’une langue. On peut alors rechercher des synonymes des mots germes présents dans le lexique originel et leur appliquer un algorithme de propagation de valence, - celles basées sur des techniques d’analyse de données sur des corpus textuels. Dans ce second cas, on va étudier les cooccurrences de mots dans un corpus pour calculer des similarités sémantiques (remplaçant les liens de synonymie explicites de Wordnet) et les intégrer dans le calcul de la valence des mots du lexique. Dans le cadre de ce stage, on se propose ainsi d’utiliser la technique de l’analyse sémantique latente (LSA : Latent Semantic Analysis) pour calculer ces proximités sémantiques et s’en servir pour estimer la valence d’un mot. Les mots germes déjà présents dans la norme lexicale émotionnelle actuelle serviront de base à l’espace vectoriel sur lequel sera opérée l’analyse de données permettant l’extension du lexique. Ce stage visera à développer au moins une de ces deux techniques pour étendre le lexique émotionnel d’EmoLogus, et tester l’apport de cette extension sur un corpus de test. En cas d’avancée significative, ce travail pourra donner lieu à communication dans une conférence scientifique à laquelle sera invité à participer le stagiaire. Travail à réaliser ---------------------- La personne recrutée sera en charge de la conception de nouvelles techniques d’extension de lexique émotionnel, du développement d’un lexique à large couverture pour le système EmoLogus ainsi que de la réalisation de tests d’évaluation du système étendu obtenu. Le stage se déroulera en trois étapes successives : - Phase n°1 – Préparation des données (T0 – T0+1) : Veille technologie sur le sujet, définition des formats d’échange entre les différentes techniques d’extension du lexique, caractérisation d’une ou plusieurs application test et définition des données de test en relation et du protocole d’évaluation final. - Phase n°2 – Extension de lexique par relations sémantiques (T0+1 – T0+3) : Extension du lexique germe par analyse des relations de synonymie et d’antinomie entre éléments (synsets) de Wordnet, évaluation de l’approche sur données de test (comparaison des performances d’EmoLogus avec ou sans le lexique étendu). - Phase n°3 – Extension de lexique par analyse de données (T0+4 – T0+6) : Extension du lexique germe par analyse sémantique latente. Évaluation sur tests unitaires de l’approche, évaluation de l’approche sur données de test (comparaison des performances d’EmoLogus avec ou sans le lexique étendu). Cette phase ne sera abordée qu’en cas de stage de durée supérieure à quatre mois. Profil recherché --------------------- La personne recrutée sera en cycle terminal d’études en informatique, de niveau Bac+5 (Master informatique professionnel, recherche ou indifférencié, école d’ingénieur). Des connaissances en Traitement Automatique des Langues et en analyse de données seront appréciées, sans être un pré-requis à recrutement. Dans le cas d’un(e) étudiant(e) en Master Recherche, le sujet de stage pourra être adapté aux attentes de l’étudiant. Rémunération ------------------ Rémunération minimale prévue par la règlementation à savoir 436,05 € par mois. Cette rémunération sera assurée dans le cadre d’un projet industriel financé par la société BAMSOO. Durée du stage et lieu d’exercice ------------------------------------------ La personne recrutée travaillera au sein du laboratoire IRISA, dans les locaux de l’ENSIBS, à Lorient (Morbihan). Il s’intégrera dans une équipe projet composée de Jeanne Villaneau (IRISA, équipe SEASIDE) et Jean-Yves Antoine (Laboratoire d’Informatique de l’Université François Rabelais de Tours, équipe BDTLN). La durée minimale de stage sera de 4 mois. Une prolongation de stage est envisageable à la demande du stagiaire ou de son établissement. Contact – Dépôts de candidature ------------------------------------------- Contact : Jeanne.Villaneau at univ-ubs.fr Dépôt des candidatures : auprès de Jeanne Villaneau. Merci de déposer un CV détaillé de vos activités passées, accompagné d’une lettre de motivation et de vos relevés de notes des deux dernières années d’études. Un développement Java sera demandé pour la sélection du candidat. Liens utiles --------------- Laboratoire LI, équipe BDTLN : http://li.univ-tours.fr/equipes/equipe-bdtln-198022.kjsp Laboratoire IRISA, équipe SEASIDE : http://www-seaside.irisa.fr/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:55:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:55:24 +0100 Subject: Conf: (In)Coherence du discours, 12-13/12/13, Loria, Nancy Message-ID: Date: Thu, 14 Nov 2013 17:05:15 +0100 From: amblard Message-Id: <5F89EABF-651B-4E3D-BA59-9A5FB462748A at loria.fr> X-url: http://webloria.loria.fr/~amblard/SLAM/index.php?n=Main.In-coh%E9rence13 Le projet de recherche SLAM (Schizophrénie et Langage : Analyse et Modélisation), organise un workshop à Nancy. ************ (In)Cohérence du discours 12 et 13 décembre 2013 -- Loria C005 programme ci-dessous ************ Le projet SLAM vise à systématiser l’étude des conversations pathologiques dans le cadre d’une approche interdisciplinaire alliant psychologie, linguistique informatique et philosophie. Il se concentre notamment sur les conversations impliquant des personnes souffrant de troubles psychiatriques (comme la schizophrénie). A cet effet, il est constitué par trois axes : corpus, formalisation, épistémologie. (In)Cohérence du discours propose de discuter la question de la représentation du discours tant du point de vue linguistique que formel. La représentation sémantique de la langue naturelle montre qu'elle ne peut être complète sans considérer un contexte plus large. Une perspective pour y parvenir est de considérer non pas l'énoncé mais le discours dont il est une partie. Plusieurs questions apparaissent alors, notamment aux niveaux pragmatique et formel (cohésion, référence, présupposition, liens rhétoriques, ...) Les journées se tiendront en salle C005 du Loria à Nancy. Les présentations seront en anglais ou en français. Le workshop est financé par un PEPS CNRS HuMaIn. Le projet Slam est par ailleurs soutenu par la MSH Lorraine (axe 6. Cognition). Pour des raisons d'organisation, si vous souhaitez participer à cette rencontre, merci de prendre contact avec : maxime.amblard[at]loria.fr http://webloria.loria.fr/~amblard/SLAM/index.php?n=Main.In-coh%E9rence13 ************ Programme Jeudi 12 décembre : 10h -11h Michel Musiol / Maxime Amblard / Manuel Rebuschi L'experimentation du lien entre troubles cognitifs et (in)coherences du discours: les risques de la formalisation 11h -12h Christian Retoré CoLan : Complexité et langage 14h - 15h Mathilde Dargnat et Jaques Jayez Le fonctionnement hyperdéictique : l'exemple des particules discursives 15h - 16h Philippe de Groote tba 16h30 - 17H30 Bernard Combettes Dans quelle mesure peut-on parler d'une évolution de la cohérence textuelle ? Vendredi 13 décembre : 9h - 10h Yvan Leudar Pragmatics of verbal hallucinations 10h 30 - 11h30 Laure Vieu The rhetorical component of the semantics of discourse relations 11h 30 - 12h30 Jacques Jayez Les déclencheurs présuppositionnels : premières approches expérimentales 14h - 15h Michel Charolles (In)cohérence des discours : de la pertinence à l'intégration conceptuelle en passant par l'analyse des marques de cohésion 15h - 16h Denis Apothéloz Opacité référentielle et cohérence du discours ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:46:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:46:27 +0100 Subject: Conf: SocInfo2013, 25-27 November 2013, Kyoto, Japan Message-ID: Date: Sat, 9 Nov 2013 12:15:15 -0000 From: "Ricardo Campos" Message-ID: <00c801cedd45$688e9620$39abc260$@inescporto.pt> X-url: http://www.socinfo2013.org The Fifth International Conference on Social Informatics (SocInfo2013) 25-27 November 2013, Kyoto, Japan http://www.socinfo2013.org -----Call for Participation--------- ---------------------------------------------------------------------- The Fifth International Conference on Social Informatics (SocInfo2013) is an interdisciplinary venue for researchers from informatics and the social & management sciences to come together to share ideas and opinions, and to present original research work. The goal is to create an opportunity for the dissemination of knowledge between the two communities, as well as to enable mutual critical discussion of current research. ---------------------------------------------------------------------- Keynote Speakers: -------------------------- Paul Resnick (University of Michigan) Yoshiyuki Hashimoto (University of Tokyo) Irwin King (Chinese University of Hong Kong) Co-located Events: -------------------------- TUTORIAL: Towards a Spatial and Temporal Representation of Social Processes by Christophe Claramunt (Naval Academy Research Institute, France) WORKSHOPS: 1st Workshop on Quality, Motivation and Coordination of open Collaboration (QMC 2013) ( http://qmc2013.socinfo.eu/ ) 1st International Workshop on Histoinformatics ( http://www.histoinformatics.org ) Accepted Papers: ---------------- FULL PAPERS: Modeling Analogies for Human-Centered Information Systems Christoph Lofi and Christian Nieke Resilience of Social Networks Under Different Attack Strategies Mohammad Ayub Latif, Muhammad Naveed and Faraz Zaidi Follow My Friends This Friday! An Analysis of Human-generated Friendship Recommendations Ruth Garcia Gavilanes, Neil O_fHare, Luca Maria Aiello and Alejandro Jaimes A Divide-and-Conquer Approach for Crowdsourced Data Enumeration Hideto Aoki and Atsuyuki Morishima Passive Participation in Communities of Practice: Scope and Motivations Azi Lev-On and Odelia Adler An Ontology-based Approach to Sentiment Classification of Mixed Opinions in Online Restaurant Reviews Hea-Jin Kim and Min Song Automating Credibility Assessment of Arabic News Mohamed Hammad and Elsayed Hemayed The Study of Social Mechanisms of Organization, Boundary Capabilities, and Information System Shiuann-Shuoh Chen, Pei-Yi Chen, Yu Min and Yu-Wei Chuang Predicting User_fs Political Party using Ideological Stances Swapna Gottipati, Minghui Qiu, Liu Yang, Feida Zhu and Jing Jiang A Fast Method for Detecting Communities from Tripartite Networks Kyohei Ikematsu and Tsuyoshi Murata Information vs Interaction: An Alternative User Ranking Model for Social Networks Wei Xie, Ai Phuong Hoang, Feida Zhu and Ee-Peng Lim Feature Extraction and Summarization of Recipes using Flow Graph Yoko Yamakata, Shinji Imahori, Yuichi Sugiyama, Shinsuke Mori and Katsumi Tanaka Unsupervised Opinion Targets Expansion and Modification Relation Identification for Microblog Sentiment Analysis Jenq-Haur Wang and Ting-Wei Yeh An Ontology-based Technique for Online Profile Resolution Keith Cortis, Simon Scerri, Ismael Rivera and Siegfried Handschuh The Three Dimensions of Social Prominence Diego Pennacchioli, Giulio Rossetti, Luca Pappalardo, Fosca Giannotti, Dino Pedreschi and Michele Coscia Automatic Thematic Content Analysis: Finding Frames in News Daan Odijk, Bjorn Burscher, Rens Vliegenthart and Maarten de Rijke Optimal scales in weighted networks Diego Garlaschelli, Sebastian E. Ahnert, Thomas M. A. Fink and Guido Caldarelli Diversity-Based HITS: Web Page Ranking by Referrer and Referral Diversity Yoshiyuki Shoji and Katsumi Tanaka The Babel of Software Development: Linguistic Diversity in Open Source Bogdan Vasilescu, Alexander Serebrenik and Mark G. J. van den Brand Using and Asking: APIs Used in the Android Market and Asked About in StackOverflow David Kavaler, Daryl Posnett, Clint Gibler, Hao Chen, Premkumar Devanbu and Vladimir Filkov Social-Urban Neighborhood Search based on Crowd Footprints Network Shoko Wakamiya, Ryong Lee and Kazutoshi Sumiya A Notification-centric Mobile Interaction Survey and Framework Jonas Elslander and Katsumi Tanaka Social Sensing for Urban Crisis Management: The Case of Singapore Haze Philips Kokoh Prasetyo, Ming Gao, Ee-Peng Lim and Christie Napa Scollon SHORT PAPERS: Changing with Time: Modelling and Detecting User Lifecycle Periods in Online Community Platforms Matthew Rowe A Novel Social Event Recommendation Method Based on Social and Collaborative Friendships Yu-Chun Sun and Chien Chin Chen Factors that Influence Social Networking Service Private Information Disclosure at Diverse Openness and Scopes Basilisa Mvungi and Mizuho Iwaihara An Approach to Building High-Quality Tag Hierarchies from Crowdsourced Taxonomic Tag Pairs Fahad Almoqhim, David E. Millard and Nigel Shadbolt Polarity Detection of Foursquare Tips Felipe Moraes, Marisa Vasconcelos, Patrick Prado, Daniel Dalip, Jussara Almeida and Marcos Goncalves Predicting Social Density in Mass Events to Prevent Crowd Disasters Bernhard Anzengruber, Danilo Pianini, Jussi Nieminen and Alois Ferscha Modeling Social Capital of Bureaucratic Hierarchy for Analyzing Promotion Decisions Jyi-Shane Liu, Zhuan-Yao Lin and Ke-Chih Ning The estimation of aNobii users_f reading diversity using book co-ownership data: a social analytical approach Muhchyun Tang, Yi-Ling Ke and Yi-Jin Sie Aspects of Rumor Spreading on a Microblog Network Sejeong Kwon, Meeyoung Cha, Kyomin Jung, Wei Chen and Yajun Wang Traffic Condition is More than Colored Lines on a Map: Characterization of Waze Alerts Thiago H. Silva, Pedro Olmo Vaz de Melo, Aline Carneiro Viana, Jussara M. Almeida, Juliana Salles and Antonio A. F. Loureiro Why Do I Retweet It? An Information Propagation Model for Microblogs Fabio Pezzoni, Jisun An, Andrea Passarella, Jon Crowcroft and Marco Conti Society as a Life Teacher ? Automatic Recognition of Instincts Underneath Human Actions by Using Blog Corpus Rafal Rzepka and Kenji Araki Temporal, cultural and thematic aspects of web credibility Radoslaw Nielek, Aleksander Wawer, Michal Jakowski-Lorek and Adam Wierzbicki How do Students Search during Class and Homework? A query log analysis for academic purposes Rafael Lopez-Garcia, Makoto P. Kato, Yoko Yamakata and Katsumi On Constrained Adding Friends in Social Networks Hoang Bao Thien and Abdessamad Imine DEMO PAPERS: Metro: Exploring Participation in Public Events Luca Chiarandini, Luca Maria Aiello, Neil O_fHare and Alejandro Jaimes Social Listening for Customer Acquisition Juan Du, Biying Tan, Feida Zhu and Ee-Peng Lim Pilot Study toward realizing Social Effect in O2O Commerce Services Tse-Ming Tsai, Ping-Che Yang and Wen-Nan Wang Organizing Committee: ---------------- General Co-Chairs: - Katsumi Tanaka (Kyoto University, Japan) - Andrew Flanagin (University of California, Santa Barbara, USA) Program Co-Chairs: - Ee Peng Lim (Singapore Management University, Singapore) - Adam Jatowt (Kyoto University, Japan) - Ying Ding (Indiana University, Bloomington, USA) - Asako Miura (Kwansei Gakuin University, Japan) - Keishi Tajima (Kyoto University, Japan) Workshop/Tutorial Co-Chairs: - Akiyo Nadamoto (Konan University, Japan) - Jochen Leidner (Thomson Reuters, Switzerland) Demo Co-Chairs: - Taro Tezuka (Tsukuba University, Japan) - Gael Dias (Normandie University, Caen, France) Publicity Co-Chairs: - Yoshinori Hijikata (Osaka University, Japan) - Antoine Doucet (Normandie University, Caen, France) - Ricardo Campos (Polytechnic Institute of Tomar, Portugal) - Goh Hoe Lian Dion (Nanyang Technological University, Singapore) - Atsuyuki Morishima (University of Tsukuba, Japan) - Leonard Bolc (Polish-Japanese Institute of Information Technology, Poland) Treasurers: - Chair: Kazutoshi Sumiya (University of Hyogo, Japan) - Hiroaki Ohshima (Kyoto University, Japan) - Daisuke Kitayama (Kogakuin University, Japan) Web Chair: - Makoto P. Kato (Kyoto University, Japan) Local Arrangement Co-Chairs: - Takehiro Yamamoto (Kyoto University, Japan) - Toshiyuki Shimizu (Kyoto University, Japan) From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 21:05:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 22:05:48 +0100 Subject: Journee: Saussure et l'Essence double du langage, 22 novembre 2013, Paris Message-ID: Date: Fri, 15 Nov 2013 08:46:12 +0100 From: François Rastier Message-ID: X-url: http://www.revue-texto.net Vendredi 22 novembre 10h-17h Maison des sciences de l'homme 190 avenue de France, 75013 Paris Salle 2 Saussure et l'Essence double du langage Journée d’études organisée par le Centre culturel franco-norvégien en sciences sociales et humaines, avec le soutien du Département de langues étrangères de l’Université de Bergen, de l’Institut Ferdinand de Saussure et de l’Ertim-INaLCO, à l’occasion de la publication du numéro de la revue Arena Romanistica, 12, intitulé « De l’essence double du langage et le renouveau du saussurisme » — numéro spécial à l’occasion du centenaire de la mort de Ferdinand de Saussure (1857–1913). Organisateurs : Anje Müller Gjesdal (Université de Bergen) et François Rastier (ERTIM-INaLCO). Argument. — La découverte du manuscrit publié sous le titre De l’essence double du langage conduit à une révision d’ensemble du corpus des œuvres de Saussure et permet de modifier l’interprétation de sa pensée, tout à la fois obscurcie et simplifiée par l’histoire de sa réception. Nous étudierons donc les problèmes philologiques et herméneutiques que posent alors l’établissement et l’interprétation du corpus saussurien. En inspirant le courant de recherche récent du néo-saussurisme, De l’essence double du langage peut conduire à reconsidérer le statut même de la linguistique contemporaine, tant dans ses rapports avec la tradition grammaticale qu’avec la philosophie du langage. - 10h-10h15 Anje Müller Gjesdal, Université de Bergen Présentation - 10h15-11h François Rastier, Directeur de recherche, INaLCO-ERTIM, Paris De l’essence double du langage, un projet révélateur Pause - 11h15-12h Simon Bouquet, Université Paris-Ouest Nanterre Triple articulation de la langue et articulation herméneutique du langage - 12h-12h45 Arild Utaker, Université de Bergen Le retour de Saussure Pause repas - 14h15-15h Marie-José Béguelin, Université de Neuchâtel De la diachronie à la synchronie, et retour - 15h-15h45 Régis Missire, Université Toulouse 2 Avoir un sens et faire sens : sémiosis textuelle et signifiance en linguistique textuelle néo-saussurienne - 15h45-16h30 Pierre-Yves Testenoire, Université Paris 3 Les Anagrammes homériques de Saussure. Pause - 16h30-17h15 Table-ronde présidée par Enrique Ballon-Aguirre, Université d’Etat de l'Arizona : La reconception saussurienne du langage ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 21:15:02 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 22:15:02 +0100 Subject: Stage: Stage Master / Ecole d'Ingenieur, Techniques de fouille de donnees pour la recherche d'information Message-ID: Date: Fri, 15 Nov 2013 21:34:03 +0100 From: Damien Nouvel Message-ID: X-url: http://damien.nouvels.net/fr/mxs Proposition de stage Master / Ecole d'Ingénieur LI, Université François Rabelais de Tours LIMSI-CNRS, Université Paris XI Techniques de fouille de données pour la recherche d'information : évaluation des ressources et traitements pour la reconnaissance d'entités nommées Résumé : Proposition de stage de fin d'études ou de Recherche de niveau Bac+5 (Master, Ecole d'Ingénieur) en Informatique appliquée au Traitement Automatique des Langues d'une durée de 4 mois minimum. Contexte scientifique : Le Laboratoire LI et le LIMSI-CNRS proposent un sujet de stage commun dans le cadre du projet de recherche TMH (Télécommunications, Mobilité et Handicap) financé par la société BAMSOO. Le sujet porte sur le Traitement Automatique des Langues (TAL) appliqué à des tâches d'extraction d'information textuelle à l'aide de techniques de fouille de données. Parmi les tâches relevant de l'extraction d'information se trouve la reconnaissance automatique des entités nommées (REN) qui consiste à rechercher des références à des noms de personnes, de lieux, d'organisation, d'unités monétaire ou temporelles dans de grands flux de données. Ces entités nommées peuvent présenter des formes linguistiques très variées. Par exemple, les systèmes de REN doivent reconnaître que François Hollande, le président de la République, le président normal ou le locataire de l'Elysée désignent toutes la même personne, qui est une personnalité politique. C'est sur cette tâche de reconnaissance d'entités nommées que portera spécifiquement ce stage. Le système que nous avons développé (mXS) propose une approche de type fouille de données dont une des caractéristiques est de rechercher séparément le début et la fin de chaque entité nommée. Dans ses fondements, mXS repose sur l'énumération de motifs en s'appuyant sur des techniques bien établies en TAL (catégorisation morpho-syntaxique, lemmatisation, utilisation de lexiques à large couverture) comme en fouille de données (motifs séquentiels, hiérarchies, règles d'association). Il a obtenu de bonnes performances dans le cadre de la campagne d'évaluation ETAPE, en particulier dans des contextes bruités (transcriptions automatiques). Au delà des performances globales du système, il reste difficile de déterminer quels sont les choix de modélisation effectués qui avantagent ou pénalisent le système. Outre une étape de ré-ingénierie logicielle, ce stage a pour objectif de mener des travaux expérimentaux permettant de mieux cerner les apports de notre démarche. Travail à réaliser : Le travail à réaliser vise à consolider le code du système existant puis à mieux étudier son comportement et éventuellement dresser un état des lieux des utilisations possibles de la fouille de données pour diverses tâches tournées vers le TAL. Il comportera deux phases successives principales : Phase 1 (2 mois) : ré-ingénierie logicielle. Cette étape consistera à factoriser et optimiser le code existant, afin de le rendre plus évolutif, de le mettre à disposition en ligne et de favoriser sa large diffusion dans la communauté scientifique. En pratique, il s'agira ici de mieux modulariser les différents traitements TAL qui le composent : - prétraitements (morpho-syntaxe, lexiques) pour enrichir les textes selon la langue et les outils disponibles, - extraction de motifs séquentiels hiérarchiques, - modèles (symboliques ou statistiques) qui exploitent les motifs pour l'annotation. Phase 2 (2 mois minimum) : étude du comportement du système. Une étude approfondie sera menée sur l'intérêt de rechercher des marques de début et de fin d'entités nommées, plutôt que d'adopter une approche plus classique de classification mot-à-mot. Pour cela, une analyse sera conduite sur la comparaison des performances et des sorties de différents types de systèmes : à base de règles et DAG (graphes dirigés sans cycle) comme le système CasEN développé également au LI, mais aussi de CRF. A terme, ce travail permettra de définir les perspectives d'évolution les plus prometteuses pour les systèmes traitant cette tâche. Phase complémentaire (si extension de stage). En cas d'avancée satisfaisante du travail, on cherchera à étudier comment mieux manipuler les motifs à des fins d'extraction de connaissances. Ce travail commencera par se doter des outils nécessaires à la caractérisation d'un corpus à partir des motifs qui en ont été extraits automatiquement. L'objectif étant d'être à même de sélectionner les motifs d'intérêt par utilisation de méthodes formelles, les motifs étant organisés au sein de treillis. Profil recherché : La personne recrutée sera en cycle terminal d'études en informatique, de niveau Bac+5 (Master informatique professionnel, recherche ou indifférencié, école d'ingénieur). Des compétences en Traitement Automatique des Langues et/ou en Fouille de Données seront appréciées. Dans le cas d'un(e) étudiant(e) en Master Recherche, le sujet de stage pourra être adapté aux attentes de l'étudiant. Potentiellement, ce travail pourra donner lieu à communication dans des conférences scientifiques. Rémunération : Rémunération maximale prévue par la réglementation à savoir 436,05€ par mois, pour une durée de 4 mois de stage minimum (prolongation de la durée du stage jusqu'à 6 mois à la demande de l'étudiant ou de son établissement). Cette rémunération sera assurée dans le cadre d'un projet industriel financé par la société BAMSOO. Lieu d'exercice : Le stage se déroulera dans les locaux du Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI-CNRS), Université Paris-Sud, Rue John von Neumann, 91403 Orsay, au sein de l'équipe ILES (Information, Langue Ecrite et Signée). Le stage sera encadré part Damien Nouvel, postdoc au LIMSI et Jean-Yves Antoine, professeur de l'Université François Rabelais de Tours (équipe BDLTN). Dépôts de candidature : Contact : damien.nouvel at limsi.fr Merci de déposer un CV détaillé de vos activités passées, accompagné d'une lettre de motivation et de vos relevés de notes des deux dernières années d'études. Liens utiles : - Système mXS : http://damien.nouvels.net/fr/mxs - Laboratoire LIMSI (groupe ILES) : http://www.limsi.fr/Scientifique/iles/ - Laboratoire LI (équipe BDTLN) : http://li.univ-tours.fr/equipes/equipe-bdtln-198022.kjsp - Campagne Etape : http://www.afcp-parole.org/etape.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:47:18 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:47:18 +0100 Subject: Appel: ACL 2014 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA 2014) Message-ID: Date: Mon, 18 Nov 2013 14:13:00 +0100 From: Alexandra Balahur Dobrescu Message-id: <528A125C.1070107 at jrc.ec.europa.eu> X-url: http://optima.jrc.it/wassa2014/ Apologies for cross-postings. ------------------------------------------------------------------------ ------------------------------------------------------------------------ 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA 2014) ************************************************************************ http://optima.jrc.it/wassa2014/ ************************************************************************ ******************************************************* BACKGROUND ******************************************************* Research in automatic Subjectivity and Sentiment Analysis (SSA), as subtasks of Affective Computing and Natural Language Processing (NLP), has flourished in the past years. The growth in interest in these tasks was motivated by the birth and rapid expansion of the Social Web that made it possible for people all over the world to share, comment or consult content on any given topic. In this context, opinions, sentiments and emotions expressed in Social Media texts have been shown to have a high influence on the social and economic behaviour worldwide. SSA systems are highly relevant to many real-world applications (e.g. marketing, eGovernance, business intelligent, social analysis) and also to many tasks in Natural Language Processing (NLP) -- information extraction, question answering, textual entailment, to name just a few. The importance of this field has been proven by the high number of approaches proposed in research in the past decade, as well as by the interest that it raised from other disciplines (Economics, Sociology, Psychology) and the applications that were created using its technology. In spite of the growing body of research in the area in the past years, dealing with affective phenomena in text has proven to be a complex, interdisciplinary problem that remains far from being solved. Its challenges include the need to address the issue from different perspectives and at different levels, depending on the characteristics of the textual genre, the language(s) treated and the final application for which the analysis is done. ******************************************************* ENVISAGED SCOPE OF WASSA 2014 ******************************************************* The aim of the 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA 2014) is to continue the line of the previous editions, bringing together researchers in Computational Linguistics working on Subjectivity and Sentiment Analysis and researchers working on interdisciplinary aspects of affect computation from text. Additionally, starting with WASSA 2013, we extended the focus to Social Media phenomena and the impact of affect-related phenomena in this context. In this new proposed edition, we would like to encourage the submission of long and short research and demo papers including, but not restricted to the following topics related to subjectivity and sentiment analysis: . Resources for subjectivity, sentiment and social media analysis; (semi-)automatic corpora generation and annotation . Opinion retrieval, extraction, categorization, aggregation and summarization . Trend detection in social media using subjectivity and sentiment analysis techniques . Data linking through social networks based on affect-related NLP methods . Impact of affective data from social media . Mass opinion estimation based on NLP and statistical models . Online reputation management . Topic and sentiment studies and applications of topic-sentiment analysis . Domain, topic and genre dependency of sentiment analysis . Ambiguity issues and word sense disambiguation of subjective language . Pragmatic analysis of the opinion mining task . Use of Semantic Web technologies for subjectivity and sentiment analysis . Improvement of NLP tasks using subjectivity and/or sentiment analysis . Intrinsic and extrinsic evaluations subjectivity and sentiment analysis . Subjectivity, sentiment and emotion detection in social networks . Classification of stance in dialogues . Applications of sentiment and social media analysis systems In addition, in the light of the fact that different sentiment analysis systems have been proposed and showcased in the past years, we feel there is a growing need to make users familiar with these systems and have them employed for building an end application. To this aim, we would like to organize a "Hackathon" (please see details below). ******************************************************* SENTIMENT ANALYSIS SYSTEMS HACKATHON ******************************************************* In the light of the fact that different sentiment analysis systems have been proposed and showcased in the past years, we feel there is a growing need to make other researchers and users familiar with these systems and have them employ them for building an end application. The Hackathon word stands for "Hacking Marathon", and its purpose is to introduce some. The activity will be open to all the people who will sign up for the workshop. We plan to organize a half a day session, in the first half presenting the participating systems and their use and creating teams for "application" development and leaving the second half of the day for working on the systems and presenting the results. We plan to give the participants the possibility to vote on the best application created and reward the winner with a gadget. ******************************************************* ORGANIZERS ******************************************************* Alexandra Balahur European Commission Joint Research Centre Via E. Fermi 2749, T.P. 267, 21027 Ispra (VA), Italy alexandra.balahur at jrc.ec.europa.eu Erik van der Goot European Commission Joint Research Centre Via E. Fermi 2749, T.P. 267, 21027 Ispra (VA), Italy Erik.van-der-Goot at jrc.ec.europa.eu Ralf Steinberger European Commission Joint Research Centre Via E. Fermi 2749, T.P. 267, 21027 Ispra (VA), Italy Ralf.Steinberger at jrc.ec.europa.eu Andrés Montoyo University of Alicante, DLSI, Ap. De Correos 99, 03080 Alicante, Spain montoyo at dlsi.ua.es ******************************************************* PROGRAM COMMITTEE ******************************************************* . Khurshid Ahmad -- Trinity College Dublin, Ireland . Nicoletta Calzolari - CNR Pisa, Italy . Erik Cambria -- University of Stirling, U.K. . José Carlos Cortizo - European University Madrid, Spain . Michael Gamon -- Microsoft, U.S.A. . Jesús M. Hermida - University of Alicante, Spain . Veronique Hoste - University of Ghent, Belgium . Mijail Kabadjov -- University of Wolverhampton, U.K. . Zornitsa Kozareva - Information Sciences Institute California, U.S.A. . Rada Mihalcea - University of North Texas, U.S.A. . Saif Mohammad - National Research Council, Canada . Karo Moilanen -- Google . Rafael Muñoz - University of Alicante, Spain . Günter Neumann - DFKI, Germany . Alena Neviarouskaia -- University of Tokyo, Japan . Constantin Orasan - University of Wolverhampton, U.K. . Viktor Pekar - University of Wolverhampton, U.K. . Paolo Rosso - Polytechnic University of Valencia, Spain . Josef Steinberger -- EC- Joint Research Centre, Italy . Ralf Steinberger - EC- Joint Research Centre, Italy . Veselin Stoyanov -- John Hopkins University, U.S.A. . Maite Taboada - Simon Fraser University, Canada . Mike Thelwall - University of Wolverhampton, U.K. . José Antonio Troyano - University of Seville, Spain . Dan Tufis - RACAI, Romania . Alfonso Ureña -- University of Jaén, Spain . Piek Vossen - Vrije Universiteit Amsterdam, The Netherlands . Marilyn Walker - University of California Santa Cruz, U.S.A. . Janyce Wiebe - University of Pittsburgh, U.S.A. . Michael Wiegand -- Saarland University, Germany . Theresa Wilson -- John Hopkins University, U.S.A. . Taras Zagibalov - Brantwatch, U.K. ******************************************************* IMPORTANT DATES ******************************************************* - Paper submission deadline: March 21, 2014 - Notification of acceptance: April 11, 2014 - Camera-ready deadline: April 29, 2014 - Workshop to take part at ACL 2014: June 27, 2014 ******************************************************* SUBMISSIONS ******************************************************* We encourage the submission of long, short and demo papers (especially describing systems participating in the hackathon) Long papers for WASSA 2014 must not exceed eight (8) pages without references. Short papers must not exceed five (5) pages without references. Papers for WASSA should be submitted using the ACL 2014 Style Files, available at: Reviewing for WASSA 2014 will be double blind: reviewers will not be presented with the identity of paper authors. Authors should avoid writing anything that makes their identity obvious in the text. Submissions should be original, and in particular should not previously have been formally published. Accepted papers will be published in the ACL WASSA proceedings. The best papers will be chosen for a special issue of an ISI- indexed journal. Previous special issues of WASSA were/are in the process of being published in the Decision Support Systems, Computer Speech and Language and Information Processing and Management journals (Elsevier). To submit a paper, please access: https://www.softconf.com/acl2014/WASSA/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:54:29 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:54:29 +0100 Subject: Appel: ESWC 2014 Message-ID: Date: Mon, 18 Nov 2013 15:24:35 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131118142455.91724DBB6D at vina.cines.fr> X-url: http://2014.eswc-conferences.org ** apologies for cross-posting ** ==== Second Call for Papers ==== http://2014.eswc-conferences.org/important-dates/call-papers CFP: 11th ESWC Conference 2014 Dates: May 25 - 29, 2014 Venue: Anissaras, Crete, Greece Hashtag: #eswc2014 Feed: @eswc_conf Site: http://2014.eswc-conferences.org General Chair: Valentina Presutti (STLab, ISTC-CNR, IT) Program Chairs: - Claudia d'Amato (Department of Computer Science, University of Bari, IT) - Fabien Gandon (Wimmics, Inria, I3S, CNRS, University of Nice Sophia Antipolis, FR) ESWC is a A rank conference according to CORE classificarion and a major venue for discussing the latest scientific results and technology innovations related to the Semantic Web. The 11th edition of ESWC will take place from May 25th, 2014 to May 29th, 2014 in Anissaras, Crete, Greece. Besides a main focus on advances in Semantic Web research and technologies, ESWC 2014 is seeking to broaden its attention to span other relevant research areas in which Web semantics plays an important role. The goal of the Semantic Web is to create a Web of knowledge and services in which the semantics of content is made explicit and content is linked to both other content and services. This arrangement of knowledge-based functionalities is weaving together a large network of human knowledge, and making this knowledge machine-processable to support intelligent behaviour by machines. Additionally, it supports novel applications allowing content from heterogeneous sources to be combined in unforeseen ways and support enhanced matching between users needs, software functionalities and online content. Creating such an interlinked Web of knowledge which bridges between heterogeneous content and services requires collaboration between several computer science domains. Also, within this hybrid space that the Web has become, where humans and software interact in a complex manner, fundamentally requires an inter-disciplinary approach to find novel solutions to the problems generated. ESWC 2014 will feature twelve thematic research tracks (see below) and an in-use and industrial track. Submissions of interdisciplinary research papers, covering more than one thematic track, are also encouraged. In addition, the in-use and industrial track will provide an opportunity for dialogue and discussion on industrial applications, tools, deployment experiences, case studies and usage analysis. Submitted papers should describe original work, present significant results, and provide rigorous, principled, and repeatable evaluation. We strongly encourage and appreciate the submission of papers incorporating links to data sets and other material used for evaluation as well as to live demos and software source code. We therefore encourage submissions addressing several conference research topics. However, each paper should be associated with at least one of the topics of the conference. The main research topics this year are: - Vocabularies, Schemas, Ontologies; - Reasoning; - Linked Open Data; - Social Web; - Web Science; - Data Management, Big data, Scalability; - Natural Language Processing; - Information Retrieval; - Machine Learning; - Mobile Web; - Sensors; - Streams; - Services, processes, and cloud computing. Additional special research topics this year are: - Cognition and Semantic Web; - Policies, Rights, Governance; - Semantic multimedia web. *Important Dates* Abstract submission: Wednesday 8th January 2014 (sharp) - 23:59 Hawaii Time Full-paper submission: Monday 13th January 2014 (sharp) - 23:59 Hawaii Time Authors' Rebuttals: Wednesday 19th-Friday 21 Feb 2014 Acceptance notifications: Wednesday 26 February 2014 Camera-ready papers: Monday 10th of March 2014 *Submission Information* ESWC2014 welcomes the submission of original research and application papers dealing with all aspects of representing and using semantics on the Web. We encourage theoretical, methodological, empirical, and applications papers. The proceedings of this conference will be published in Springer's Lecture Notes in Computer Science series. This year three of the best papers presented at the conference will have the opportunity to submit an extended version to a special issue of the journal "Semantic Web - Interoperability, Usability, Applicability" (IOS Press). Papers should not exceed fifteen (15) pages in length and must be formatted according to the information for LNCS authors. Papers must be submitted in PDF (Adobe's Portable Document Format) format. Papers that exceed 15 pages or do not follow the LNCS guidelines will be automatically rejected without a review. Authors of accepted papers will be required to provide semantic annotations for the abstract of their submission - details of this process will be given on the conference Web page at the time of acceptance. At least one author of each accepted paper must register for the conference. More information about the Springer's Lecture Notes in Computer Science (LNCS) are available on the Springer LNCS Web site (http://www.springer.com/computer/lncs/lncs+authors). Submissions and reviewing will be supported by the EasyChair system: https://www.easychair.org/account/signin.cgi?conf=eswc2014 From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:30:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:30:55 +0100 Subject: Journee: Journee thematique, Optimisation et traitement automatique du langage, Universite Paris 13, 16 decembre 2013 Message-ID: Date: Mon, 18 Nov 2013 12:45:55 +0100 From: Joseph Le Roux Message-ID: Bonjour, Les méthodes d'optimisation sont de plus en plus utilisées en traitement automatique des langues pour concevoir des méthodes efficaces tant pour l'apprentissage de modèles que pour le décodage, notamment en offrant un cadre formel qui distingue clairement les contraintes globales des contraintes locales, tout en permettant de les combiner. L'équipe RCLN du Laboratoire d'Informatique de Paris Nord s'intéresse de près à ces méthodes pour la modélisation conjointe des différents niveaux de description linguistique. Dans le cadre du pôle math/stic de Paris 13, avec le soutien du LABEX EFL, et en collaboration avec l'équipe AOC du LIPN, l'équipe RCLN organise une journée de séminaires autour des thèmes de l'optimisation et du traitement automatique des langues. Cette journée aura lieu sur le campus de l'Université Paris 13 à Villetaneuse, dans l'amphithéâtre Euler : 09h30-10h00 :: Accueil (Amphi Euler) 10h00-11h00 :: Exposé d'André Martins (Amphi Euler) 11h15-12h15 :: Exposé de Sebastian Riedel (Amphi Euler) Pause déjeuner (LIPN) 13h45-14h45 :: Exposé de Xavier Carreras (Amphi Euler) 15h00-16h00 :: Exposé de Joseph Le Roux (Amphi Euler) 16h00 :: goûter au LIPN ! La participation à cette journée est libre. Si vous comptez y assister, nous vous demandons, pour des raisons pratiques (organisation du buffet notamment), de nous l'indiquer à cette adresse [[http://doodle.com/87mnbcdbzdmytffc]] . Résumé des quatre exposés prévus : ------------------------------------------------------------------------ André Martins, Priberam, Lisbon Title: AD3: A New Decoder for Structured Prediction Abstract: In this talk, I will present AD3 ("Alternating Directions Dual Decomposition"), a new consensus-based decoder for problems representable as factor graphs. AD3 is an approximate decoder that ignores global effects caused by the cycles of the graph, solving a linear relaxation of the original problem. It can handle many scenarios often encountered in NLP and IR applications, such as models with constraints in first-order logic; models involving budget or knapsack constraints; and combinations of structured models which are individually tractable, but hard to decode jointly. Like other dual decomposition algorithms, AD3 has a modular architecture, where local subproblems are solved independently, and their solutions are gathered to compute a global update. The key characteristic of AD3 is that each local subproblem has a quadratic regularizer, leading to faster convergence (both theoretically and in practice). After providing closed-form solutions for several of these subproblems, I will proceed to discuss a recent active set method that works for arbitrary factors, requiring only a local maximization oracle (the same oracle required in subgradient-based dual decomposition). In the second part of the talk, I will discuss two recent applications of AD3 in NLP problems: dependency parsing and compressive summarization. I will present "Turbo Parser," an open source dependency parser, which was recently improved with AD3 and the active set method to permit fast decoding of non-projective third-order models. Experiments in 14 languages yield state-of-art results, with parsing speeds ranging between 700 and 4,000 tokens per second. For compressive summarization, the use of AD3 leads to a system which is modular in the three qualities that define a good summary (conciseness, informativeness, and grammaticality), with state-of-the-art ROUGE scores, and runtimes close to extractive summarizers. This work was done in collaboration with Noah Smith, Mário Figueiredo, Eric Xing, Pedro Aguiar, and Miguel Almeida. ------------------------------------------------------------------------ Sebastian Riedel, UCL, London. Title: Predict, Price and Cut: Column and Row Generation for Structured Prediction. Abstract: Many problems in NLP, and structured prediction in general, can be cast as finding high-scoring structures based on a large set of candidate parts. For example, In second order tagging, we have to select high-scoring transitions between tags in a globally consistent fashion. In second order graph-based dependency parsing we have to choose a quadratic number of first order and a cubic number of second order edges such that the graph is both high-scoring and a tree. What makes such problems challenging is the large number of possible parts to consider. This number not only affects the cost of search or optimization but also slows down the process of scoring parts before they enter the optimisation problem, and extracting features. In this talk I present an approach that can solve problems with large sets of candidate parts without considering all of these parts in either optimization or scoring. In contrast to most pruning heuristics, our algorithm can give certificates of optimality before having optimized over, or even scored, all parts. It does so without the need of auxiliary models or tuning of threshold parameters. This is achieved by a delayed column and row generation algorithm that iteratively solves an LP relaxation over a small subset of current candidate parts, and then finds new candidates with high scores that can be inserted into the current optimal solution without removing high scoring existing structure. The latter step subtracts from the cost of a part the price of resources the part requires, and is often referred as pricing. Sometimes parts may score highly after pricing, but are necessary in order to make the current solution feasible. We add such parts in a step that roughly amounts to violated cuts to the LP. We evaluate our approach on two applications: second order dependency parsing and first order tagging with large domains. In both cases we dramatically reduce the number of parts considered, and observe about an order of magnitude speed-up. This is possible without loss of optimality guarantees, and hence accuracy. ------------------------------------------------------------------------ Xavier Carreras, UPC, Barcelona Title: Learning Automata and Grammars: From Spectral Algorithms to Convex Optimizations There is an increasing interest in spectral methods to learn latent-variable language models in the form of weighted automata and context-free grammars. Spectral methods provide an algebraic formulation to the problem of inducing automata or grammars from data, and directly exploit the recurrence relations behind the model. I will review the spectral method from an algebraic perspective, making use of Hankel matrices as the key object behind the method: a Hankel matrix collects all necessary statistics of the distribution we want to learn; and finding a low-rank factorization of this matrix results in the automata or grammar. Under mild assumptions, it can be shown that this method nicely approximates the target model. From here, I will show how we can reformulate the spectral learning algorithm as a low-rank convex optimization. This will be useful to adapt the method to other settings, by adding linear constraints. I will focus in "unsupervised" induction of context-free grammars, that is, learning a grammar from plain strings. Our formulation involves optimizing for a low-rank Hankel matrix that is linearly constrained to satisfy inside-outside recursions. An analogous method method can be formulated to learn finite-state transducers from unaligned parallel strings. ------------------------------------------------------------------------ Joseph Le Roux, LIPN, Paris Title: Combining PCFG-LA Models with Dual Decomposition: A case Study with Function Labels and Binarization Abstract: It has recently been shown that different NLP models can be effectively combined using dual decomposition. In this talk, we present how PCFG-LAs (Probabilistic Context-Free Grammars with Latent Annotations, the state-of-the-art model for unlexicalized constituent parsing) are suitable for combination in this way. We first show how the intractable problem of exact PCFG-LA decoding is approximated with anchored PCFGs. Then we present a method for combining anchored PCFGs based on the partial superposition of tree structures. We experiment with the different models which result from alternative methods of extracting a grammar from a treebank (retaining or discarding function labels, left binarization versus right binarization) and achieve state-of-the-art parsing performance, with a labeled Parseval F-score of 92.4 on Wall Street Journal Section 23 – this represents an error reduction rate of 7% over a strong PCFG-LA product-model baseline. This work was done in collaboration with Antoine Rozenknop and Jennifer Foster. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 21:05:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 22:05:10 +0100 Subject: Ressource: corpus ANCOR_Centre, annotation en coreference, 488 000 mots, fran=?ISO-8859-1?Q?=E7ais_?=parle, licence CC-BY-SA Message-ID: Date: Mon, 18 Nov 2013 17:08:41 +0100 From: Jean Yves ANTOINE Message-ID: <528A3B89.3030603 at univ-tours.fr> X-url: http://tln.li.univ-tours.fr/Tln_Corpus_Ancor.html ======================================================================= Nous avons le plaisir de vous annoncer la diffusion d'ANCOR_Centre, le plus grand corpus francophone annoté en relations anaphoriques et de coréférence. Ce corpus a été réalisé par une équipe projet issue du Laboratoire d'Informatique de l'Université François Rabelais de Tours (LI) et du Laboratoire Ligérien de Linguistique (UMR 7270, Université d'Orléans & Université de Tours). Centré sur l'annotation de mentions nominales ou pronominales, le corpus ANCOR_Centre concerne quatre corpus de dialogue ou interview oraux correspondant à autant de situations discursives. Il constitue au total une ressource de 488 000 mots (30,5 h d'enregistrement) sur laquelle ont été délimitées 116 071 mentions et 51337 relations de coréférence ou anaphoriques auxquelles sont associés un riche ensemble de traits linguistiques. Ce corpus, qui peut servir aussi bien aux besoins du TAL que de la linguistique de corpus, est diffusé librement sous licence Creative Commons CC-BY-SA. La création de cette ressource a été financée en majeure partie dans le cadre d'un appel à projet d'initiative académique de la région Centre (projet ANCOR) Le corpus ANCOR_Centre est accessible depuis les sites suivants : - projet ANCOR : http://tln.li.univ-tours.fr/Tln_Corpus_Ancor.html - Parole_Publique (diffusion libre de corpus oraux) : www.info.univ-tours.fr/~antoine/parole_publique/ En espérant que cette ressource rencontrera votre intérêt. L'équipe projet ANCOR : LI : Anaïs Lefeuvre, Jean-Yves Antoine, Denis Maurel LLL : Judith Muzerelle, Emmanuel Schang, Aurore Pelletier, Iris Eshkol ============================================================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:56:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:56:27 +0100 Subject: Appel: ESWC 2014, Call for PhD Symposium Message-ID: Date: Mon, 18 Nov 2013 15:45:57 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131118144618.31DD6DBB6F at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/phd-symposium ** apologies for cross-posting ** ==== Call for PhD Symposium ==== http://2014.eswc-conferences.org/important-dates/phd-symposium The ESWC 2014 PhD Symposium is a chance for PhD students working in all areas of Semantic Web research to present their work, meet with peers and experienced researchers, obtain feedback and learn from each other's experiences. It aims at helping future researchers in building up the skills and confidence required to conduct and promote their research, as well as providing them with an opportunity to attend one of the most important research conferences on the Semantic Web. The ESWC PhD Symposium will give to students the opportunity to: 1. Learn from a mentor: Established researchers and PhD student advisors will provide direct feedback. Each selected student will be assigned a member of the programme committee with whom they will interact on the revision of the paper and the preparation of the presentation. 2. Learn about research in general: Doing good research goes beyond writing a good paper; it includes perspectives on research as an endeavour and a career. Besides the presentations, coffee breaks and the PhD Symposium lunch will be used to exchange ideas and ask questions about all aspects of conducting a PhD and a research career in general. 3. Learn by constructive criticism: Thinking and writing about strengths and weaknesses of other research contributions shapes your own research capabilities. As a participant to the PhD symposium, you will be expected to also review submissions from others, allowing you to juxtapose and learn from convergence and divergence of opinions. 4. Learn by presenting: Accepted contributions will be presented in the PhD symposium. All accepted contributions will also appear at the general poster session of ESWC. Students' posters will be presented alongside posters and demonstrations of the main conference. Submissions will be considered from two different categories depending on the advancement into the PhD: - Early Stage PhD: For students who may have identified the main research problem they want to address, the relevant literature, and are building their research methodology, but might not yet have obtained significant results, or only preliminary ones. - Late Stage PhD: For students who have already defined their approach (even if incompletely) and obtained significant results (e.g., that might already have been published). These categories do not affect the chances of being selected. They will however be taken into account by reviewers in their feedback, and in the length and format of the presentation. The organisers might decide to move a submission from one category to the other, if they think it is justified. *Submission Information* PhD students in all areas of Semantic Web research are invited to submit papers having 5 to 10 pages describing their PhD research, in the PDF format following the LNCS template. Submissions should be sent using the PhD Symposium submission system, through which participants will be also asked to decide on the category of their submission and to write a paragraph regarding their motivation for participating in the ESWC PhD Symposium. Submissions should follow the following template of sections: 1. Introduction/Motivation Give a general introduction to the domain/area/topic and indication of its importance/impact in Semantic Web research or other domains. 2. State of the Art Describe existing work in the area, work focusing on the same/similar problems or that might be useful to realising your PhD. 3. Problem Statement and Contributions Based on motivation and state of the art, formulate the problem you intend to solve, and how you intend to contribute to Semantic Web research. This section should include a clear formulation of one (or very few) research hypothesis (what you will validate through your methodology, approach and evaluation) and the research questions that need to be answered. Late Stage PhD submissions should focus on contributions to such a hypothesis. 4. Research Methodology and Approach Describe the research methodology you will apply in your research, including the different steps from the formulation of your research questions to answering them. Also describe the approach you are taking (or you intend to take for Early Stage PhD submissions) to instantiate the research methodology, hence contributing to solve the problem described in Section 3 and confirm or reject your hypothesis. Discuss how this approach is innovative and novel, and how it is (might be) implemented. 5. Preliminary or Intermediate Results In a full conference paper, the approach would be fully described (in section 4) and fully evaluated (in section 6). Being at an intermediate stage, you should report here about the results achieved up to now in applying your approach that might not yet be sufficient for a full evaluation. . 6. Evaluation Plan Describe your evaluation plan, which is the way you intend to validate your hypothesis, your results, and the value of your approach. For Early Stage PhD submissions, this might be only partially defined, and details might be ommited. For Late Stage PhD submissions, you might have partial evaluation results. 7. Conclusion Describe how your results will or might impact research or the world at large. *Important dates* Submission deadline: 13th January 2014 Notification: 10th February 2014 Revised version of submission to mentor: 24th February 2014 Final version: 10th March 2014 Draft presentation to mentor: 12th May 2014 *PhD Symposium Chairs* Steffen Staab (Institute for Web Science and Technologies - WeST, University of Koblenz-Landau, DE) Mathieu d'Aquin (Knowledge Media Institute, The Open University, UK) From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 21:16:36 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 22:16:36 +0100 Subject: Stage: Stage M2, Ressources semantiques pour l'analyse de la factualite Message-ID: Date: Tue, 19 Nov 2013 16:19:18 +0100 From: delphine battistelli Message-ID: X-url: http://chronolines.fr/ X-url: http://noopsis.fr/ X-url: http://www.mitpressjournals.org/toc/coli/38/2 *** *** Proposition de stage de M2 en TAL *** Le laboratoire MoDyCo (UMR CNRS-Université Paris Ouest Nanterre), en collaboration avec le laboratoire GREYC (UMR CNRS-Université de Caen), propose un sujet de stage en TAL de niveau Master 2 d’une durée minimale de 4 mois, à partir de janvier 2014. Titre : Enrichissement de ressources sémantiques pour l’analyse de la factualité pour des systèmes de recherche d’information. Rémunération : celle prévue par la règlementation à savoir 436,05 € par mois. *- Contexte applicatif et enjeux théoriques *: L’analyse automatique du degré de factualité des situations (ou évènements) dénotées dans les textes s’impose depuis quelques années comme un enjeu important dans le domaine de la recherche d’information. Parmi les applications visées : les systèmes de questions/réponses, les moteurs de recherche et, intégrés ou non à ces derniers, les systèmes visant à proposer en sortie une visualisation des informations sur une ligne du temps (ou *timeline*). Ces applications visent alors à distinguer les évènements présentés comme déjà réalisés et avérés des événements présentés comme incertains ou seulement possibles ou encore des événements présentés par l’auteur d’un texte comme certains selon un co-énonciateur dont l’auteur ne fait que citer les propos en montrant qu’il n’y adhère pas lui-même. Dans une autre terminologie, on parle de l’analyse et de la modélisation des caractéristiques modales (voire énonciatives) des situations. Un numéro entier de la revue *Computational Linguistics* (ModNeg, 2012) a dernièrement été consacré à cette problématique. Il met l’accent sur sa complexité théorique, en termes notamment de catégorisation sémantique des divers indices (lexicaux et grammaticaux) qui participent à l’expression du degré de factualité d’un évènement, celui-ci pouvant être passé ou à venir. Un autre aspect fondamental, encore cependant peu décrit dans la littérature tant linguistique que TAL, a trait aux modes de calcul de ce degré étant donné plusieurs indices co-présents. Les exemples ci-après donnent un aperçu des types d’énoncés qu’il s’agit de pouvoir traiter en montrant la variation du statut véri-conditionnel d’un même contenu propositionnel () fonction des indices sous la portée sémantique desquels il tombe : *Paul est venu* *Paul est peut-être venu* *Je crois que Paul est venu * *On dit que Paul est venu * *Il semblerait que Paul est venu * *Selon Marie, Paul est venu * *Selon Marie, Paul est sûrement venu * *Marie prétend que Paul est venu* *Paul devrait venir* *Paul doit venir* *Paul pourrait venir* *- Sujet de stage :* On note que peu de ressources ont été élaborées pour le français jusqu’à présent. Le stage visera à combler en partie ce déficit et s’intéressera à une analyse sémantique fine d’indices lexicaux (verbes, noms, adjectifs, adverbes). Cette analyse s’appuiera sur une méthodologie et des ressources déjà constituées (Battistelli et Damiani, 2012, Damiani et Battistelli 2013, (Enjalbert et Mathet, 2013) ainsi que sur des conceptions linguistiques issues de (Authier-Revuz, 1995) ou (Gosselin, 1999). Ces ressources et cette méthodologie seront testées et évaluées sur deux types de corpus de textes dans une perspective comparationniste : des dépêches d’agence journalistique et des news technologiques publiées sur le net. Le premier type de corpus est actuellement plus particulièrement analysé dans le cadre d’un système développé pour le projet ANR ChronoLines dont MoDyCo est le pilote (http://chronolines.fr/) ; le second type de corpus est lui plus particulièrement analysé dans le cadre d’une application développée au sein de l’entreprise Noopsis (http://noopsis.fr/), partenaire du laboratoire GREYC. Le travail visera en outre à préciser les zones de recouvrement théorique comme applicatives avec le domaine de l’annotation des opinions (Béthard et al., 2004, Wilson et Wiebe, 2003). *- Profil du candidat:* Le candidat devra être inscrit dans un Master en traitement automatique des langues ou en linguistique appliquée. - Compétences demandées * compétences en traitement automatique des langues et/ou en linguistique. * compétences de base en informatique et plus spécifiquement maitrise des langages de type perl et python. - Comment candidater ? Envoyer un CV (avec le détail des cours et notes des deux années de Master) et une lettre de motivation à : Delphine Battistelli : del.battistelli at gmail.com Patrice Enjalbert : patrice.enjalbert at unicaen.fr *- Références * Authier-Revuz J. (1995). Ces mots qui ne vont pas de soi, Boucles réflexives et non-coïncidences du dire, Paris: Larousse, 1995 Battistelli D., Damiani M. (2013) - « Analyzing modal and enunciative discursive heterogeneity: how to combine semantic resources and a syntactic parser analysis », in Actes WAMM (Workshop on Annotation of Modal Meaning in Natural Language), held in conjunction with IWCS'13, Potsdam, Allemagne. Bethard S., Yu H., Thornton A., Hatzivassiloglou V., Jurafsky D. (2004). « Automatic extraction of opinion propositions and their holders”, in Working Notes of the AAAI Spring Symposium on Exploring Attitude and Affect in Text: Theories and Applications, March 22-24, 2004, Stanford Damiani M., Battistelli D. (2013) - « Enunciative and modal variations in newswire texts in French: From guideline to automatic annotation », in Actes de The 7th Linguistic Annotation Workshop & Interoperability with Discourse, held in conjunction with ACL’2013, Sofia, Bulgarie. Enjalbert, P., Mathet, Y. (2013) — « Constructions ‘Verbe + Verbe infinitif’: étude de corpus et lexique sémantique », Document interne GREYC-Noopsis, Octobre 2013. Gosselin L. (2005). *Temporalité et modalité*, Bruxelles, De Boeck Supérieur « Champs linguistiques », 2005. ModNeg, 2012. Modality and Negation, Computational Linguistics, Special Issue - Volume 38, Issue 2 - June 2012 (http://www.mitpressjournals.org/toc/coli/38/2). Sauri R., Pustejovsky J. (2007). “Determining Modality and Factuality for Text Entailment”, in Actes ICSC 2007, Irvine, California, 2007. Wilson T., Wiebe J. (2003). “Annotating opinions in the world Press”, in Actes 4th SIGdial Workshop on Discourse and Dialogue (SIGdial-03), ACL SIGdial, 2003. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 21:04:02 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 22:04:02 +0100 Subject: Appel: Assemblee Generale Consortium Corpus Ecrits, ILF, 22 novembre 2013 Message-ID: Date: Mon, 18 Nov 2013 16:20:55 +0100 From: Secretariat General Message-ID: <528A3057.70905 at ling.cnrs.fr> X-url: http://corpusecrits.corpus-ir.fr/ Veuillez nous excuser pour les doublons dans les envois ... MERCI http://www.huma-num.fr/sites/default/files/ressourcesdoc/couleur-cmjn-petit.jpg Consortium « Corpus Écrits » Assemblée générale du 22 novembre 2013 ILF - Paris, le 18novembre 2013 Chères Collègues, ChersCollègues, Nous organisons notre réunion plénière annuelle le vendredi 22 novembre 2013, de 9h30 à 18h,à l'INALCO, 62 rue des Grands Moulins à Paris dans le 13^ème arrondissement, Amphithéâtre N°5 au 2ème étage. Cette réunion sera consacrée à la présentation de notre bilan et aux perspectives. PROGRAMME - Présentation - Bilans par thèmes des réalisations - Présentation des actions des groupes de travail - Formations réalisées et/ou nécessaires - Présentation de l'Initiative Corpus de références du Français - Appel d'offres 2014 : Quels critères, quelles thématiques, quel budget ? - Quelles attentes, quels projets en 2014 et 2015 pour le Consortium Corpus Ecrits La participation de toutes les personnes intéressées par cette journée est vivement encouragée par le comité de pilotage, qu'elles soient ou non inscrites à un groupe de travail. Si la participation à ces journées est libre, l'inscription est obligatoire et...très rapide. Il vous convient de vous enregistrer en vous connectant à : http://french.jotform.com/form/32943348795872 Le consortium peut contribuer au financement des missions des participants actifs des groupes de travail. Au plaisir devous accueillir nombreux ce 22 novembre 2013, Pour le comité de pilotage du Consortium « Corpus écrits » FranckNeveu, Directeurde l'ILF http://corpusecrits.corpus-ir.fr/ Le comité depilotage duConsortium« Corpus écrits » : Franck Neveu pour l'ILF, FR 2393 - Porteur du consortium Sylvie Archaimbault pour HTL - UMR 7597 - Université Denis Diderot - Paris 7 Thierry Chanier pour le LRL - EA 999 - Université Blaise Pascal - Clermont-Ferrand Serge Heiden pour ICAR - UMR 5191 - Université Lumière Lyon 2 Véronique Magri pour BCL - UMR 6039 - Université Nice Sophia Antipolis Jean-Marie Pierrel pour l'ATILF - UMR 7118 - Nancy - Université Clément Plancq pour le LLF - UMR 7110 - Université Denis Diderot - Paris 7 Céline Poudat pour le LDI - UMR 7187 - Université de Paris 13 Benoît Sagot pour ALPAGE - INRIA- Université Denis Diderot - Paris 7 Rudolph Sock pour LILPA - EA 1339 - Université de Strasbourg Agnès Tutin pour le LIDILEM - EA 609 - Université Grenoble 3 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:49:20 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:49:20 +0100 Subject: Seminaire: Traces digitales, Universite de Paris Est Marne la Vallee, 12 decembre 2013 Message-ID: Date: Mon, 18 Nov 2013 15:20:37 +0100 From: Nicolas Turenne Message-ID: <528A2235.1070209 at yahoo.fr> X-url: http://www.inra-ifris.org/axes-de-recherche-thematique/groupe-plateforme-cortext/seminaire-de-l-axe-traces-digitales-groupe-cortext.html/ [désolé pour les réception multiples] Chers collègues, Dans le cadre de la douzième séance du séminaire 'traces digitales' du groupe CorText, nous avons le plaisir d'accueillir /Julien Bonneau/ (post-doc, Ceditec, UPEC) qui nous parlera de lexicométrie . Cette matinée aura lieu le *jeudi 12 décembre de 10h à 13h*, dans la salle de réunion C219 du Latts (Université Paris-Est Marne la Vallée - rue Galilée, bâtiment du Bois de l'Etang - 2ème étage - aile C). /Voir http://www.inra-ifris.org/axes-de-recherche-thematique/groupe-plateforme-cortext/seminaire-de-l-axe-traces-digitales-groupe-cortext.html/ Julien Bonneau /(post-doc, Ceditec, UPEC)/ *Variété et variation : émergence d'une synergie (co-)textuelle interprétable ?* Pour chaque mot d'un texte, la cooccurrence asymétrique (Luong et al. 2010) définit deux mesures de la variété lexicale en cotexte : une moyenne locale (énergie) et une mesure globale (disponibilité). Après avoir exposé et prolongé ces deux notions, nous généraliserons leur utilisation à l'ensemble du vocabulaire d'un texte (Bonneau 2012a). Nous décrirons les propriétés du nuage lexical obtenu et nous interrogerons sur les mots présentant des corrélation (Rastier 2008) quantitatives saillantes car remarquables : deux parcours émergent - et s'opposent - dont diverses hypothèses d'interprétation seront discutées : fonds vs. formes (Poudat et al. 2012) ; discours persuasif vs. informatif (Bonneau 2012b). " Une bibliographie succinte : Bonneau JADT, Liège 2012a Bonneau Thèse, Nice 2012b Luong et al. JADT, Rome 2010 Poudat et al. Colloque La cooccurrence. Du fait statistique au fait textuel, Besançon 2012 Rastier JADT, Lyon 2008 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From SciencePG at HUYAMONT.COM Tue Nov 19 22:09:54 2013 From: SciencePG at HUYAMONT.COM (=?utf-8?B?U2NpZW5jZVBH?=) Date: Wed, 20 Nov 2013 06:09:54 +0800 Subject: SciencePG: Fast Publication Message-ID: An HTML attachment was scrubbed... URL: From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:18:19 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:18:19 +0100 Subject: Appel: Congres Mondial de Linguistique Francaise, Report date limite (CMLF, Berlin, 2014) Message-ID: Date: Thu, 21 Nov 2013 08:29:48 +0100 From: Alice Krieg-Planque Message-ID: <528DB66C.9050706 at club-internet.fr> X-url: http://www.ilf.cnrs.fr/spip.php?rubrique111 X-url: http://www.ilf.cnrs.fr/spip.php?article223 Report de date limite. - - - appel - - - appel - - - appel - - - appel - - - appel - - La date limite pour proposer une communication au prochain Congrès Mondial de Linguistique Française a été reportée au 15 décembre 2013. Les personnes souhaitant présenter une communication à ce congrès sont invitées à déposer leur proposition jusqu'à cette date sur la plateforme de dépôt, à l'adresse : http://www.ilf.cnrs.fr/spip.php?rubrique111 Les réponses à l'appel doivent se présenter sous forme de textes de 10 à 15 pages comprenant une bibliographie. Le quatrième Congrès Mondial de Linguistique Française (CMLF) se tiendra à Berlin (Allemagne, Freie Universität Berlin) du 19 au 23 juillet 2014. Il est organisé en différentes sessions thématiques : - Histoire du français : perspectives diachronique et synchronique - Linguistique et Didactique (français langue première, français langue seconde) - Discours, Pragmatique et Interaction, - Francophonie, - Histoire, Épistémologie, Réflexivité, - Lexique(s), - Linguistique de l'écrit, Linguistique du texte, Sémiotique, Stylistique, - Morphologie, - Phonétique, Phonologie et Interfaces, - Psycholinguistique et Acquisition, - Sémantique, - Sociolinguistique, Dialectologies et Écologie des langues, - Syntaxe, - Ressources et Outils pour l'analyse linguistique A ces quatorze sessions thématiques a été ajoutée une quatorzième session "pluri-thématique", laissant ouverte la possibilité de travailler dans plusieurs domaines, voire en marge des territoires disciplinaires traditionnels. Informations supplémentaires : http://www.ilf.cnrs.fr/spip.php?article223 - - - appel - - - appel - - - appel - - - appel - - - appel - - ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 21:12:42 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 22:12:42 +0100 Subject: These: Romain Deveaud, Vers une representation du contexte thematique en Recherche d'Information Message-ID: Date: Wed, 20 Nov 2013 15:48:49 +0000 From: Romain Deveaud Message-ID: Bonjour, j'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée "Vers une représentation du contexte thématique en Recherche d'Information". La soutenance aura lieu le vendre 29 novembre 2013 à 14h30 dans l'amphithéatre de l'IUT de l'Université d'Avignon (337, chemin des Meinajariès 84911 Avignon, iut.univ-avignon.fr). L'IUT est situé juste à côté du Centre d'Enseignement et de Recherche en Informatique. Vous êtes également conviés au pot de thèse qui suivra la soutenance. Bien cordialement, Romain Deveaud ----------------------------------------------------------------------- Le jury de soutenance sera composé de : Mme Josiane Mothe - Professeur, IRIT, Toulouse - Présidente du jury M. Jian-Yun Nie - Professeur, RALI, Montréal - Rapporteur M. Philippe Mulhem - Chargé de recherche CNRS, LIG, Grenoble - Rapporteur M. Jacques Savoy - Professeur, IIUN, Neuchâtel - Examinateur M. Jaap Kamps - Associate professor, ILLC, Amsterdam - Examinateur M. Benjamin Piwowarski - Chargé de recherche CNRS, LIP6, Paris - Examinateur M. Eric SanJuan - Maître de conférences, LIA, Avignon - Co-Directeur de thèse M. Patrice Bellot - Professeur, LSIS, Marseille - Directeur de thèse Résumé de la thèse : Quand des humains cherchent des informations au sein de bases de connaissances ou de collections de documents, ils utilisent un système de recherche d'information (SRI) faisant office d'interface. Les utilisateurs doivent alors transmettre au SRI une représentation de leur besoin d'information afin que celui-ci puisse chercher des documents contenant des informations pertinentes. De nos jours, la représentation du besoin d'information est constituée d'un petit ensemble de mots-clés plus souvent connu sous la dénomination de "requête". Or, quelques mots peuvent ne pas être suffisants pour représenter précisément et efficacement l'état cognitif complet d'un humain par rapport à son besoin d'information initial. Sans une certaine forme de contexte thématique complémentaire, le SRI peut ne pas renvoyer certains documents pertinents exprimant des concepts n'étant pas explicitement évoqués dans la requête. Dans cette thèse, nous explorons et proposons différentes méthodes statistiques, automatiques et non supervisées pour la représentation du contexte thématique de la requête. Plus spécifiquement, nous cherchons à identifier les différents concepts implicites d'une requête formulée par un utilisateur sans qu'aucune action de sa part ne soit nécessaire. Nous expérimentons pour cela l'utilisation et la combinaison de différentes sources d'information générales représentant les grands types d'information auxquels nous sommes confrontés quotidiennement sur internet. Nous tirons également parti d'algorithmes de modélisation thématique probabiliste (tels que l'allocation de Dirichlet latente) dans le cadre d'un retour de pertinence simulé. Nous proposons par ailleurs une méthode permettant d'estimer conjointement le nombre de concepts implicites d'une requête ainsi que l'ensemble de documents pseudo-pertinent le plus approprié afin de modéliser ces concepts. Nous évaluons nos approches en utilisant quatre collections de test standards de TREC de grande taille. En annexes, nous proposons également une approche de contextualisation de messages courts exploitant des méthodes de recherche d'information et de résumé automatique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 21:07:14 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 22:07:14 +0100 Subject: Journee: Alain Berthoz, simplexite et langage, la vicariance, Universite Paris Ouest Message-ID: Date: Wed, 20 Nov 2013 10:10:08 +0100 From: "Didier Bottineau" Message-ID: <007601cee5d0$512c0240$f38406c0$@bottineau at free.fr> CONFERENCE D’ALAIN BERTHOZ ET JOURNEE D’ETUDE SIMPLEXITE ET LANGAGE Alain Berthoz, Professeur au Collège de France, Membre de l'Académie des Sciences et de l'Académie des Technologies, prononcera la Conférence inaugurale de l’Ecole Doctorale 139, Université Paris Ouest Nanterre la Défense Le mercredi 27 novembre, à 17h, Bâtiment A, Amphithéâtre A2 : La vicariance, une propriété simplexe pour la perception, l'action, la mémoire et les décisions Cette conférence sera précédée d’une journée d’étude SIMPLEXITE ET LANGAGE : rencontre avec Alain Berthoz Université Paris Ouest Nanterre, Bâtiment C, salle C 102a (1e étage), 9h-16h30 Vous êtes cordialement invités à participer aux deux évènements. Accès : RER A Nanterre Université ou SNCF Nanterre Université (depuis la Gare Saint Lazare) Journée d’étude SIMPLEXITE ET LANGAGE La simplexité dans sa conception actuelle est un processus « osé » et renouvelé par Alain Berthoz (La simplexité, Odile Jacob, 2009). La simplexité n’est pas l’art de rendre simple la complexité écrasante ni d’en simplifier la présentation par un réductionnisme, mais la capacité pour un être vivant ou une entité dynamique de produire a priori un monde ou environnement simple, ouvert à la compréhension prédictive et propice à l’engagement et à l’interaction, à travers des actions et processus dynamiques naturels et culturels, individuels et collectifs, biologiques et techniques, spontanés ou cultivés, pragmatiques et adaptatifs. La simplexité serait de nature à rendre compte de l’abîme paradoxal qui sépare la complexité des modélisations et l’apparente aisance des agents confrontés à l’expérience des environnements et systèmes dynamiques. La question de la simplexité a jusqu’ici été appliquée à divers domaines disciplines telles que la biologie du vivant, l’organisation des mécanismes neuronaux, la mémoire, l’action, la perception, la relation raison / émotion. Elle fait l’objet d’applications dans des domaines aussi divers que le management (la décision), le design, l’interaction homme-machine (l’ergonomie), et elle commence à susciter l’intérêt de recherches appliquées en didactique. Que peut apporter la simplexité aux sciences du langage ? Peut-on modéliser une langue humaine ou un comportement de communication animale comme un système complexe dont des individus produisent par leur action une aperception simple qui en expliquerait l’ergonomie apparente ? A travers quels processus d’acquisition, d’apprentissage, de production et de compréhension de parole, d’interaction, de reformulation ? Les descriptions de faits lexicaux, morphologiques, syntaxiques, prosodiques, sémantiques, pragmatiques peuvent-elles mettre en évidence certains des processus simplexes en question ? La didactique de la langue première ou seconde peut-elle prendre en compte des « propositions simplexes », et dans quelle mesure et en quoi le fait-elle déjà ? Quels types de « détours simplexes » les théories linguistiques peuvent-elles développer ou empruntent-elles déjà ? L’objet de la présente journée d’étude est de promouvoir ce type de questionnement en sciences du langage en vue d’esquisser un premier tour d’horizon de travaux envisagés ou en cours dans cet esprit et d’ouvrir la voie à des actions de recherche collaboratives ultérieures de plus grande envergure. Pour ce faire, elle est constituée d’une série de brèves interventions sur thèmes ciblés suivis de moments de discussion. Elle comprendra une présentation de la simplexité par Alain Berthoz et se terminera par une discussion générale. Elle sera suivie de la conférence inaugurale de l’ED 139 par Alain Berthoz sur La vicariance (Odile Jacob, 2013). Veuillez trouver infra le programme de la journée. UMR CNRS 7114 MoDyCo, Université Paris Ouest Nanterre Journée d’études SIMPLEXITE ET LANGAGE Rencontre avec le Professeur Alain Berthoz Collège de France, Chaire de physiologie de la perception et de l’action Membre de l'Académie des Sciences et de l'Académie des Technologies Mercredi 27 novembre 2013, Bâtiment C, salle C102a MATIN 09:00-09:20 Didier Bottineau (MoDyCo, Université Paris Ouest Nanterre) Ouverture Simplexité et diversité linguistique en morphologie et en syntaxe 09:20-09:40 Christophe Parisse (MoDyCo, Université Paris Ouest Nanterre) Peut-on retrouver la simplexité dans l'interaction pré-langagière chez l'enfant ? 09:40-10:00 Claire Martinot (EA 4509 Sens Textes Informatique Histoire (STIH), Université Paris Sorbonne) Comment la reformulation peut simplexifier la langue ? Exemples de l'oral des enfants. 10:00-10:20 Anne Lacheret (MoDyCo, Université Paris Ouest Nanterre) Du complexe au simplexe dans l’étude de la prosodie des langues : une alternative à creuser Pause (10:20-10:40) 10:40-11:00 Sylvain Kahane (MoDyCo, Université Paris Ouest Nanterre) La simplexité des distorsions dans l'interface sémantique-syntaxe 11h-12h : Alain Berthoz (Collège de France) La simplexité présentée à des linguistes APRES-MIDI 14:00-14:20 Serge Sakhno (MoDyCo, Université Paris Ouest Nanterre) Simplexité et explication des faits de langue comme construction d’un discours didactique efficient : une expérience de stratégie didactique impliquant différentes langues (russe, français, langues romanes, latin) 14:20-14:40 Jörg Eschenauer (Ecole des Ponts ParisTech, UPLEGESS) Enseignement des langues dans les Grandes Ecoles et simplexité : Terrain fertile pour des projets innovants de recherche – action ? 14:40-15:00 Michel Kreutzer (Laboratoire d'Ethologie et Cognition comparées (EA 3456), Université Paris Ouest Nanterre) Le rôle des performances vocales et de la vie sociale des oiseaux chanteurs sur leurs compétences pour identifier des chants 15:00-15:20 René-Joseph Lavie (MoDyCo, Université Paris Ouest Nanterre) La linguistique n'a pas manqué de simplexionnistes! Mais ont-ils fait le bon 'détour'? Pause (15:20-15:40) 15:40-16:30 Discussion générale et projets La journée d’étude sera suivie de la conférence de la session inaugurale de l’E.D. 139 Amphithéâtre A2, 17h Alain Berthoz (Collège de France) La vicariance, une propriété simplexe pour la perception, l'action, la mémoire et les décisions ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 21:01:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 22:01:55 +0100 Subject: Stage: Grammaires d'extraction de marqueurs temporels Message-ID: Date: Wed, 20 Nov 2013 09:27:01 +0100 From: Alain Couillault Message-ID: <528C7255.4090309 at aproged.org> *Sujet de stage :* *Développement de grammaires d'extractions de descriptions temporelles.* ** *Résumé du travail proposé :* L'objectif de ce stage est de développer une grammaire d'extraction de marqueurs temporels dans le domaine du tourisme. La plupart des informations contenues dans une base de données touristiques (événements, manifestations, hôtels, restaurants, musées...) contiennent des marqueurs temporels (date, durée, horaires d'ouvertures, conditions d'ouvertures ou de tarifs...) qu'il s'agira d'identifier au moyen d'une grammaire adaptée. A partir de données réelles, vous aurez à développer une grammaire locale de reconnaissance de ces marqueurs, en utilisant les outils Unitex (http://www-igm.univ-mlv.fr/~unitex/) et GramLab (http://www.gramlab.org/fr/). *Mots clés :* Traitement automatique des langues, grammaires locales, Unitex, GramLab, expressions temporelles *Informations complémentaires :* *Encadrant(s) *: Alain Couillault, Mickaël Coustaty, Jean-Marc Ogier *Axe thématique*://IDDC/(Image, Documents, Données Complexes)/ *Axe stratégique *: Pertinence Contenu-Interaction *Cadre de coopération* : Projet TourInflux (Investissement d'Avenir) *Date de début du stage *: Janvier 2014 *Durée du stage *: 5 à 6 mois *Contexte de l'étude:* Les travaux menés par le candidat se dérouleront au sein du L3i et s'inscriront dans le projet Tourinflux. . Le projet Tourinflux, sélectionné dans le cadre de l'appel à projets Big Data du Fonds National pour la Société Numérique et financé dans le programme d'investissements d'avenir, rassemble deux entreprises, une association d'entreprises et le laboratoire L3i, et sera réalisé en partenariat avec plusieurs acteurs du tourisme de France. Ce projet vise à apporter aux acteurs du tourisme (d'abord les institutionnels mais aussi les acteurs privés) un ensemble d'outils leur permettant de gérer à la fois leurs données internes et les informations disponibles sur le web afin de mieux comprendre comment un territoire est perçu et de mieux agir sur cette perception. Les outils actuellement à disposition des institutionnels du tourisme sont insuffisants pour répondre à ce besoin du fait des problèmes de collecte, d'analyse, de manipulation et d'échange d'informations réalisés de manière beaucoup trop artisanale. L'objectif de Tourinflux est de proposer un tableau de bord complet permettant aux institutionnels du tourisme, quelle que soit leur taille, de visualiser et interpréter l'information disponible par rapport à leur territoire (aux niveaux micro et macro) afin de prendre les décisions les plus efficaces. *Le laboratoire:* Le laboratoire L3i, EA 2118 créé en 1993, représente la seule et unique composante de recherche du domaine STIC sur l'Université de la Rochelle associant très efficacement les chercheurs de l'IUT de la Rochelle, et du Pôle Sciences en informatique. Dans le cadre de la politique quadriennale (désormais quinquennale) de l'université de la Rochelle, le L3i vient d'être évalué A par l'AERES. Le laboratoire Informatique, Image et Interaction a choisi d'axer son projet de laboratoire autour de deux thèmes (Axes Thématiques) que sont « Image, Document et Données Complexes » et « Systèmes Interactifs et Images », véritables coeurs de métier du laboratoire. Par ailleurs, le laboratoire propose de mettre en avant ASPIC (Axe Stratégique Pertinence Intraction/Contenus), vecteur de visibilité de son action scientifique au sein de projets structurants et en articulation avec le monde socio-économique. Ainsi, plus d'une dizaine de projets sont actuellement menés autour de l'analyse de documents et de données complexes d'une part (en lien avec le centre européen de valorisation des contenus numériques -- Valconum), et autour de l'interaction appliquée aux jeux vidéos et l'e-Education d'autre part. Par ses activités de ces six dernières années, le L3i a développé des outils et des compétences dans l'analyse de données récurrentes dans le temps et l'espace, mais également l'analyse de contenus et de données complexes et hétérogènes. *Description du sujet :* Le candidat retenu devra, à partir de corpus dans le domaine du tourisme, développement une grammaire d'analyse d'évènements touristiques, récurrents ou non, dans le temps et/ou dans l'espace (« tous les lundi », « tous les ans », « dans toutes les boutiques du réseau », «tous les mardis sur la place du marché sauf veille de jours fériés », « Hôtel ouvert toute l'année, restauration sur place seulement en été »...). *Qualifications :* Le candidat devra justifier de compétences de recherche dans au moins deux des quatre domaines suivants : - Traitement Automatique des Langues, Fouille de texte - Raisonnement temporel et/ou spatial - Annotation et évaluation - Ecriture de grammaires d'extraction *Contacts -- liens : * *Email *: mickael.coustaty at univ-lr.fr ; alain.couillault at univ-lr.fr ; jean-marc.ogier at univ-lr.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 21:08:42 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 22:08:42 +0100 Subject: Stage: Stage M2 / EDF, Etude des outils de Text Mining Message-ID: Date: Wed, 20 Nov 2013 17:23:57 +0100 From: Delphine LAGARDE Message-ID: ------------------------------------------------------------ STAGE INGÉNIERIE LINGUISTIQUE SUJET 2014: ÉVALUATION D'OUTILS TEXT MINING DURÉE : 6 MOIS ENVIRON 1. CONTEXTE Le volume des données numériques textuelles, disponibles sur l’Internet (forums, twitters etc.) ou relatives à des contacts client (enquêtes, centre d’appel etc.), augmente chaque année. L’analyse de ces informations, structurées ou non, est, aujourd’hui, un impératif stratégique pour une entreprise telle qu’EDF. Dans ce cadre, et dans l’objectif de toujours mieux connaître les besoins des clients, l’exploitation de ces documents implique l’utilisation de méthodes et d’outils adaptés. Au cœur de ces problématiques les outils de Text Mining sont de plus en plus nombreux et performants, ainsi nous souhaitons étudier les principaux outils évoluant sur le marché aujourd’hui. 2. SUJET DU STAGE Depuis 2003, les données textuelles sont essentiellement traitées à la R&D via des solutions développées par l’éditeur TEMIS (Text-Mining Solution). Ce choix fait suite à différentes campagnes de veille sur les outils de Text Mining. Un protocole de test d’outils de Text Mining avait été défini et appliqué à l’étude approfondie de différents logiciels. Dans le cadre du suivi des évolutions des outils de Text Mining, nous souhaitons effectuer une nouvelle évaluation des outils d’analyse de données contenant du texte. Ce stage se décomposera en 3 parties : - Veille d’outils de Text Mining : Il s’agira de mener une étude de marché des outils existants aujourd’hui. - Evaluation : A partir des solutions émergentes du marché, il s’agira d’évaluer une sélection d’outils (entre 3 et 4) jugés à priori intéressants par rapport aux besoins d’EDF. - Perspectives : Dans un second temps, il s’agira d’identifier les perspectives envisageables quant à l’alliance du Text Mining et du Web sémantique au regard des besoins EDF. INFORMATIONS PRATIQUES Interlocuteurs: Delphine Lagarde 01.47.65.39.75 delphine.lagarde at edf.fr Anne Peradotto 01.47.65.44.89 anne.peradotto at edf.fr Lieu du stage: EDF R&D – Département ICAME 1, avenue du Général de Gaulle 92141 Clamart Cedex Date & Durée : Début 2014 - 6 mois environ Rémunération: A définir (environ 1.000€/mois) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 20:59:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 21:59:48 +0100 Subject: Appel: ESWC 2014, Final Call for Workshops Message-ID: Date: Thu, 21 Nov 2013 19:01:22 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131121180143.054B8DDA94 at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/call-workshops ** apologies for cross-posting ** ==== Final Call for Workshops ==== http://2014.eswc-conferences.org/important-dates/call-workshops The organizers of the 11th ESWC 2014 cordially invite you to submit a workshop proposal. ESWC is a major venue for discussing the latest scientific results and innovations in the field of semantic technologies on the Web and Linked Data, attracting a high number of high quality submissions and participants from academia and industry alike. Co-located workshops at ESWC conferences are distinguished meeting points for discussing ongoing work and latest ideas related to semantic technologies and the Semantic Web. Of particular interest are workshop proposals with an interdisciplinary standpoint, proposals focusing on a specific technology of general interest, or gathering a sub-community. We encourage the submission of workshop proposals on: * Fundamental problems of the Semantic Web / Linked Data such as ontology mining, heterogeneity, scalability and distribution, uncertainty, etc. * Applications of Semantic Web technologies in specific domains, * Important enabling technologies and their adaptation to the needs of the Semantic Web, and * Aspects of Semantic Web research that have been neglected so far, * Techniques from other research fields that are of relevance for Semantic Web research (e.g., machine learning, NLP, data mining) # General Information and Criteria Each proposal will be reviewed by the members of the workshop programme committee, and ranked based on the overall quality of the proposal and the workshop's fit to the conference as detailed below. Their recommendation will determine the final decision on the acceptance/rejection of each proposal, which is to be taken by the workshop and tutorial chairs as well as by the local and the general chair of ESWC 2014. The criteria for judging the quality of workshop proposals are as follows: * Co-located workshops cover topics falling in the general scope of the ESWC conference. * Workshops are intended to be genuine interactive events and not mini-conferences. * We welcome workshops with creative structures and organizations that attract various types of contributions and ensure rich interactions. * Workshops should have a clear focus on a specific technology, problem or application. * There is potentially a significant community interested in the workshop's topic. * Workshop duration can be half a day or a full day. * We strongly advise having more than one organizer and no more than four, preferably from different institutions, bringing different perspectives to the workshop topic. In case overlapping workshops are proposed, the workshop chair may contact the organisers to discuss the possibility of merging workshops. Please note that the duration of a workshop might need to be adjusted based on the overall number of submissions received. Further, workshops that receive less than 5 submissions or have less than 10 people registered at the early registration deadline might be canceled. The organizers of accepted workshops will be responsible for their own reviewing process, publicity (e.g., website, timelines and call for papers), and proceedings production. They will be required to closely cooperate with the Workshop Chair and the ESWC 2014 local organizers to finalize all organizational details. Workshop attendees must pay the ESWC 2014 workshop registration fee, as well as the conference registration fee. Organizers of workshops and tutorials will get a free registration for workshops and tutorials at the pre-conference days, i.e. they will only have to pay the main conference fee. # Important Dates Workshop proposals due: Nov 22, 2013 - 23:59 Hawaii Time Notification of acceptance: Dec 6, 2013 - 23:59 Hawaii Time Workshop Web site due: Dec 16, 2013 - 23:59 Hawaii Time Workshop camera-ready proceedings due: Apr 25, 2014 - 23:59 Hawaii Time Workshop days: May 25 and May 26, 2014 # Suggested Timeline for Workshops Submission deadline: March 6, 2014 Notifications: April 1, 2014 Camera ready version: April 15, 2014 # Submission Guidelines Workshop proposals have to be submitted via Easychair at https://www.easychair.org/conferences/?conf=eswc2014workshops-tutorials. Each proposal must consist of a single PDF document written in English, not longer than 3 pages, which contains the following information: 1. The title and brief technical description of the workshop, specifying its goals and motivation. 2. A brief discussion of why the topic is of particular interest at this time. 3. A brief description of why and to whom the workshop is of interest, the workshop audience, as well as the expected number of participants. 4. A brief description (draft outline) of the proposed workshop format, discussing the mix of events and activities such as paper presentations, invited talks, panels, hacking session, or general discussion, and and an approximate timeline. 5. A list of (potential) members of the program committee (at least 50% have to be known and confirmed at the time of the proposal). 6. An indication of whether the workshop should be considered for a half-day or full-day event. 7. Related Workshops and Conferences: Is this the continuation of a workshop series or a new workshop to address an emerging issue? Please provide information about past versions of this workshop and other related workshops (including URLs and submission/acceptance counts, if available). 8. Names and contact information of the workshop organizers/chair(s) (name, affiliation, email address, homepage and short (one paragraph) biography of each chair, explaining the chair's expertise for the workshop including past experience in organizing/facilitating workshops). Preferably a single contact person per submission. The best papers of each workshop will be included in the supplementary proceedings of ESWC 2014, which will appear in the Springer LNCS series. # Workshop Chair Harald Sack (Hasso-Plattner Institute for IT Systems Engineering, DE) email: harald.sack at hpi.uni-potsdam.de # Programme Committee Abraham Bernstein (University of Zuerich, CH) Chris Bizer (University of Mannheim, DE) Jerome Euzenat (INRIA Grenoble Rhone-Alpes, FR) Dieter Fensel (University of Innsbruck, AT) Aldo Gangemi (CNR Institute of Cognitive Sciences and Technology, IT) Asuncion Gomez-Perez (Universidad Politecnica de Madrid, ES) Frank van Harmelen (VU University Amsterdam, NL) Manfred Hauswirth (DERI, National University of Ireland, Galway, IE) Pascal Hitzler (Kno.e.sis Center, Wright State University, Dayton, US) Enrico Motta (The Open University, Milton Keynes, UK) Rudi Studer (Karlsruhe Institute of Technology, DE) From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 20:56:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 21:56:10 +0100 Subject: Appel: ESWC 2014, Final Call for Tutorials Message-ID: Date: Thu, 21 Nov 2013 18:50:42 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131121175102.D9D3411976F at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/call-tutorials ** apologies for cross-posting ** ==== Final Call for Tutorials ==== http://2014.eswc-conferences.org/important-dates/call-tutorials ESWC 2014 invites tutorials that address the interests of its varied audience: people new to the Semantic Web, Semantic Web researchers and practitioners that wish to learn new technologies, users of Semantic Web technologies, and representatives of government and funding agencies as well as potential private investors in Semantic Web technologies. We welcome submissions of tutorial proposals on all major topics related to semantic technologies. We especially solicit proposals for tutorials of the following types: - Tutorials with a coherent theme providing an introduction to new semantic technologies and trends. - Tutorials describing the application of semantic technologies in specific domains (e.g., life-sciences, e-government, e-commerce, cultural heritage, etc.). - Tutorials presenting techniques from other research fields that are of relevance for Semantic Web research especially in relationship to the tracks of the conference (e.g., techniques from social science, database techniques, NLP techniques etc.). Tutorials can be half a day or a full day. We advise having more than one presenter and no more than three, preferably from different institutions, bringing different perspectives to the tutorial topic. Tutorials may focus entirely on theoretical aspects; however, we encourage organisers to incorporate hands-on sessions where appropriate. The tutorials should reach a good balance between the topic coverage and its relevance to the community. Timeline for Tutorials ----------- Proposals due: Nov 22, 2013 - 23:59 Hawaii Time Notification of acceptance: Dec 6, 2013 - 23:59 Hawaii Time Tutorial Web site due: Dec 16, 2013 - 23:59 Hawaii Time Camera-ready material due: Apr 25, 2014 - 23:59 Hawaii Time Tutorial days: May 25 and May 26, 2014 Responsibilities ----------- Organizers of accepted tutorials are responsible for preparing and maintaining a Web site that describes the tutorial and includes all relevant information. Organizers are also responsible for submitting the material for attendees (slide sets, additional teaching material, software installation and usage guides for practical hands-on sessions, etc.) to the Tutorial Chair. The ESWC 2014 Organizing Committee is responsible for providing publicity for the tutorials as part of the conference publicity activities, and on-site logistical support to the organizers and attendees. Tutorial attendees must pay the ESWC 2014 workshop registration fee, as well as the conference registration fee. General Information ----------- Each tutorial will have one reduced registration fee (pre-conference days registration will be free i.e. one of the chairs will only have to pay the main conference fees). In the interest of the overall quality of the conference, the Tutorial Chair reserves the right to merge tutorials and/or adjust the scope thereof in case a mimimum number of registrations is not reached by the early registration deadline. Submission details ----------- Tutorial proposals should not exceed 5 pages, using an 11 pt font for the body of the text of the proposal and should contain the following information: - Abstract (200 words maximum, for inclusion on the ESWC 2014 website). - Tutorial description: More specifically, it should specify the objectives of the tutorial and relevance to ESWC 2014, include enough details on the scope of the material to be covered and the depth to which it will be covered and specify the intended audience and any prerequisite knowledge. Appropriate references to the material to be covered by the tutorial must be included. - Tutorial length. The tutorial can be full or half day (if the tutorial can be either length, please be sure to identify which material is included for each length). - Specify other venues to which the tutorial or part thereof has or will be presented, in addition to explaining how the current tutorial differs from the other editions. Links to the slides of those tutorial editions should be included in the proposal. - Brief professional biography of the presenter(s) indicating previous training and speaking experience (such as teaching and tutorial presentation). Each proposal will be reviewed by the members of the tutorial programme committee, and ranked based on the overall quality of the proposal and the tutorial's fit to the conference. Their recommendation will determine the final decision on the acceptance/rejection of each proposal. Submission ----------- Submission will be through the Easychair system (please note that it is the same site to submit workshops and tutorials) https://www.easychair.org/conferences/?conf=eswc2014workshops-tutorials Tutorials Chair Nathalie Aussenac-Gilles (IRIT-CNRS, Toulouse, Fr) email: aussenac at irit.fr From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:33:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:33:27 +0100 Subject: These: Anais Cadilhac, Extraction et Raisonnement sur les preferences dans des dialogues de negociation Message-ID: Date: Fri, 22 Nov 2013 13:41:00 +0100 From: Anaïs CADILHAC Message-ID: <528F50DC.6070303 at irit.fr> X-url: http://www.irit.fr/documentation/plan_irit/planirit.html Bonjour, J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée : "Extraction et Raisonnement sur les préférences dans des dialogues de négociation". Elle aura lieu le vendredi 29 novembre 2013 à 10h30 à l'auditorium J. Herbrand de l'IRIT, à Toulouse. (plan : http://www.irit.fr/documentation/plan_irit/planirit.html) Bien cordialement, Anaïs Cadilhac ---------- Composition du Jury : --------------------- . Rapporteur : M. Jonathan Ginzburg, Professeur, Université Paris Diderot . Rapporteur : M. Bruno Zanuttini, Maître de Conférence, UCBN Caen . Directeur de thèse : M. Nicholas Asher, Directeur de Recherche CNRS, IRIT Toulouse . CoDirecteur de thèse : Mme Farah Benamara, Maître de Conférence, UPS Toulouse . Examinateur : Mme Claudette Cayrol, Professeur, UPS Toulouse . Examinateur : Mme Béatrice Daille, Professeur, Université de Nantes . Examinateur : M. Jérôme Lang, Directeur de Recherche CNRS, LAMSADE Paris Résumé : -------- Modéliser les préférences des utilisateurs est incontournable dans de nombreux problèmes de la vie courante, que ce soit pour la prise de décision individuelle ou collective ou le raisonnement stratégique par exemple. Cependant, il n'est pas facile de travailler avec les préférences. Comme les agents ne connaissent pas complètement leurs préférences à l'avance, nous avons seulement deux moyens de les déterminer pour pouvoir raisonner ensuite : nous pouvons les inférer soit de ce que les agents disent, soit de leurs actions non-linguistiques. Plusieurs méthodes ont été proposées en Intelligence Artificielle pour apprendre les préférences à partir d'actions non-linguistiques mais à notre connaissance très peu de travaux ont étudié comment éliciter efficacement les préférences verbalisées par les utilisateurs grâce à des méthodes de Traitement Automatique des Langues (TAL). Dans ce travail, nous proposons une nouvelle approche pour extraire et raisonner sur les préférences exprimées dans des dialogues de négociation. Après avoir extrait les préférences de chaque tour de dialogue, nous utilisons la structure discursive pour suivre leur évolution au fur et à mesure de la conversation. Nous utilisons les CP-nets, un modèle de représentation des préférences, pour formaliser et raisonner sur ces préférences extraites. Cette méthode est d'abord évaluée sur différents corpus de négociation pour lesquels les résultats montrent que la méthode est prometteuse. Nous l'appliquons ensuite dans sa globalité avec des raisonnements issus de la Théorie des Jeux pour prédire les échanges effectués, ou non, dans le jeu de marchandage Les Colons de Catane. Les résultats obtenus montrent des prédictions significativement meilleures que celles de quatre baselines qui ne gèrent pas correctement le raisonnement stratégique. Cette thèse présente donc une nouvelle approche à la croisée de plusieurs domaines : le Traitement Automatique des Langues (pour l'extraction automatique des préférences et le raisonnement sur leur verbalisation), l'Intelligence Artificielle (pour la modélisation et le raisonnement sur les préférences extraites) et la Théorie des Jeux (pour la prédiction des actions stratégiques dans un jeu de marchandage). Mots-clés : ----------- Préférences, Dialogues, CP-nets, Structure discursive, Traitement Automatique des Langues (TAL). Abstract : ---------- Preference Extraction and Reasoning in Negotiation Dialogues Modelling user preferences is crucial in many real-life problems, ranging from individual and collective decision-making to strategic interactions between agents for example. But handling preferences is not easy. Since agents don't come with their preferences transparently given in advance, we have only two means to determine what they are if we wish to exploit them in reasoning: we can infer them from what an agent says or from his nonlinguistic actions. Preference acquisition from nonlinguistic actions has been wildly studied within the Artificial Intelligence community. However, to our knowledge, there has been little work that has so far investigated how preferences can be efficiently elicited from users using Natural Language Processing (NLP) techniques. In this work, we propose a new approach to extract and reason on preferences expressed in negotiation dialogues. After having extracted the preferences expressed in each dialogue turn, we use the discursive structure to follow their evolution as the dialogue progresses. We use CP-nets, a model used for the representation of preferences, to formalize and reason about these extracted preferences. The method is first evaluated on different negotiation corpora for which we obtain promising results. We then apply the end-to-end method with principles from Game Theory to predict trades in the win-lose game The Settlers of Catan. Our method shows good results, beating baselines that don't adequately track or reason about preferences. This work thus presents a new approach at the intersection of several research domains: Natural Language Processing (for the automatic preference extraction and the reasoning on their verbalisation), Artificial Intelligence (for the modelling and reasoning on the extracted preferences) and Game Theory (for strategic action prediction in a bargaining game). Keywords: --------- Preferences, Dialogues, CP-nets, Discursive structure, Natural Language Processing (NLP). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:23:42 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:23:42 +0100 Subject: Stage: Stage M2, Detection de communautes, Nimes Message-ID: Date: Thu, 21 Nov 2013 16:53:22 +0100 From: Plantié Michel Message-ID: <528E2C72.8000000 at mines-ales.fr> X-url: http://www.lgi2p.ema.fr:8090/plantie/site/index.php/sujet-master-recherche Le laboratoire LGI2P à Nîmes de l’École des Mines d'Ales, propose le stage Master 2 suivant : *Lieu : *Nîmes, site EERIE, EMA, parc Georges Besse, 30000 Nîmes *Sujet : *SÉMANTIQUE, ÉQUILIBRES ET STABILITÉS DE CONSTRUCTION DE COMMUNAUTÉS RECOUVRANTES DANS LES RÉSEAUX SOCIAUX *Descriptif succinct* /(pour une description plus détaillée, voir adresse ci-dessous)/ Les réseaux sociaux occupent une part de plus en plus importante dans l’échange de données sur le web. La recommandation de produits et de services, les modèles utilisateurs enrichis par des données sociales peuvent revêtir une grande importance. Le sujet proposé a pour objectif de déterminer des communautés extraites à partir de données sociales et de rechercher les optimums de stabilité et d’équilibre tout en tenant compte de leur sémantique. La signification et la stabilité de ces communautés ainsi constituées n’est que peu abordée dans les travaux actuels. Les auteurs appliquent un algorithme unique d’optimisation et observent ensuite les performances. Le travail de stage aura les objectifs suivants à partir des travaux déjà effectués au laboratoire : - Approfondir les travaux de recherche de stabilité dans la construction de communautés recouvrantes. - Établir les fondements de la sémantique attachés à la construction de communautés - Définir des procédures de validation de communautés - etc. Pour plus de détails voir la description à l'adresse suivante : http://www.lgi2p.ema.fr:8090/plantie/site/index.php/sujet-master-recherche *Direction de stage* (à contacter pour plus d’informations) – Michel Plantié, LGI2P (michel.plantie at mines-ales.fr) – Michel Crampes, LGI2P (michel.crampes at mines-ales.fr) *Remarque importante :* Un support financier est possible pour une poursuite en thèse de doctorat. Si les compétences et le niveau académique du (de la) candidat(e) le justifient, sa candidature sera notamment soutenue pour l’obtention d’un tel financement, afin qu’il (elle) puisse accomplir une thèse à la suite de ce stage. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:42:41 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:42:41 +0100 Subject: Job: Five Early-Stage Researcher (pre-doctoral) and two Experienced Researcher (post-doctoral) positions Message-ID: Date: Fri, 22 Nov 2013 11:27:38 +0100 (CET) From: Fausto Giunchiglia Message-ID: <52422.127.0.0.1.1385116058.squirrel at mail.disi.unitn.it> X-url: http://www.essence-network.eu/hiring The ESSENCE (Evolution of Shared SEmaNtics in Computational Environments, www.essence-network.eu) Marie Curie Initial Training Network is offering five Early-Stage Researcher (pre-doctoral) and two Experienced Researcher (post-doctoral) positions, to start in February 2014. The application deadline for these posts is 15th December 2013. This is a rare opportunity to be involved in a highly prestigious European training network for outstanding applicants in an emergent and important research area, led by internationally leading groups in their fields! ESSENCE conducts research and provides research training in various aspects of translating human capabilities for negotiating meaning to open computational environments such as the web, multi-robot systems, and sensor networks. The network will support 15 pre- and post-doctoral fellows who will work toward a set of different research projects within this overall theme, ranging from symbol grounding and ontological reasoning to game-theoretic models of communication and crowdsourcing. ESSENCE involves a top-quality consortium of internationally leading research institutions which will act as hosts for the following projects in the current recruitment round: Early-Stage Researchers (36 months): - Communication Planning (CISA, Informatics, The University of Edinburgh, UK) - Concept Convergence: Argumentation and Agreement over Meaning (IIIA-CSIC, Barcelona, Spain) - The Social Construction of Conceptual Space (ILLC, Universiteit van Amsterdam, The Netherlands) - Sociolinguistics and Network Games (ILLC, Universiteit van Amsterdam, The Netherlands) - Open-ended Robot Interaction (AI Lab, Vrije Universiteit Brussel, Belgium) Early-Stage Researchers must, at the time of recruitment by the host organisation be in the first 4 years (full-time equivalent research experience) of their research careers, and not yet have a doctoral degree. Experienced Researchers (24 months): - The ESSENCE Platform: Architecture (CISA, Informatics, The University of Edinburgh, UK) - The ESSENCE Challenge (Information Engineering and Computer Science, Università degli Studi di Trento, Italy) Experienced Researchers must (at the time of recruitment by the host organisation) be in possession of a doctoral degree, or have at least four years of full-time equivalent research experience, and have less than five years of full-time equivalent research experience (including time spent on doctoral research). For both categories, research experience is measured from the date when they obtained the degree which formally entitled them to embark on a doctorate. All positions are very competitively remunerated (significantly above the respective average national salaries/studentships for pre- and post-doctoral positions) and aimed at outstanding candidates. Please consult the individual descriptions of projects at http://www.essence-network.eu/hiring for detailled salary information. Researchers can be of any nationality, though at the time of recruitment by the host organisation, researchers must not have resided or carried out their main activity (work, studies, etc) in the country of their host organisation for more than 12 months in the 3 years immediately prior to the reference date. (Short stays such as holidays and/or compulsory national service are not taken into account.) All applicants are asked to pre-apply at http://www.essence-network.eu/hiring. Please contact Dr Michael Rovatsos (mrovatso at inf.ed.ac.uk) for informal enquiries. Fausto Giunchiglia ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:26:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:26:45 +0100 Subject: Appel: WIMS'14 Message-ID: Date: Thu, 21 Nov 2013 17:33:00 +0100 From: Plantié Michel Message-ID: <528E35BC.4090501 at mines-ales.fr> X-url: http://wims14.csd.auth.gr/ WIMS' 14 [multiple calls]: 4th International Conference on Web Intelligence, Mining and Semantics CALL FOR RESEARCH / APPLICATION & CASE STUDY PAPERS / POSTERS CALL FOR WORKSHOPS / TUTORIALS / DEMONSTRATIONS WIMS' 14: 4th International Conference on Web Intelligence, Mining and Semantics Thessaloniki, Greece, 2-4 June 2014 http://wims14.csd.auth.gr/ About WIMSメ14 Conference ------------------------- WIMS is a series of peer-reviewed International Computer Science conferences. It is a forum for researchers and practitioners to present their state-of-the-art results in building Intelligent Web, to examine performance characteristics of various approaches in Web-based intelligent information technology, and to cross-fertilize their ideas on the development of Web-based intelligent information management solutions across different domains. Objectives ----------- The purpose of the WIMS series is: - To provide a forum for established researchers and practitioners to present their contributions to the state of the art research and development in Web technology and applications. - To give doctoral students an opportunity to present their research to a friendly and knowledgeable audience and receive valuable feedback. - To provide an informal social event where Web technology researchers and practitioners can meet. Call for Research Papers/Posters -------------------------------- WIMS'14 is intended to foster the dissemination of state-of-the-art research in the area of Web intelligence, Web mining, Web semantics and the fundamental interaction between them. Authors are invited to submit regular (12 pages) or short (6 pages) research papers or posters (4 pages) on all related areas. Papers exploring new directions or areas will receive a thorough and encouraging review. More details on the nature of the different submission types can be found at: http://wims14.csd.auth.gr/?page_id=23 The papers in all the categories should describe original results that have not been accepted or submitted for publication elsewhere. All submissions will be evaluated by at least three members of the international program committee. Submissions should be made electronically in PDF or DOC/DOCX (MS/Open Word) format via the electronic submission system of the WIMSメ14 Conference Management system at https://www.easychair.org/conferences/?conf=wims14 The submissions should be typeset using the templates of the ACM International Conference Proceedings Series (ICPS). The templates could be retrieved fromhttp://www.acm.org/sigs/publications/proceedings-templates Call for Application and Case Study Track Papers ------------------------------------------------- The goal of this track is to provide opportunities for researchers, innovators, industry leaders, and practitioners to present and exchange ideas, results, and experiences in the applications of Web Intelligence, Mining, and Semantics (WIMS). The Application & Case Studies Track invites submissions describing implementations of Web Intelligence, Mining, and Semantics in industrial or government or other ムreal worldメ settings. Papers must include descriptions of how the applications have been conceived, developed, and (probably) deployed. Details about the submission types and the submission procedure of this track can be found at: http://wims14.csd.auth.gr/?page_id=154 Call for Tutorials/Demonstration Proposals ------------------------------------------- WIMS'14 also welcomes Tutorial and/or Demonstration proposals. WIMSメ14 will include tutorials and/or demonstrations (on new applications) providing in-depth background on subjects that are of broad interest to the Web Mining and Web Semantics community. The tutorials will be part of the main conference technical program. Proposal papers must be no less than 5 pages and no more than 12 pages, and must provide a sense of both the scope of the tutorial and depth within the scope. Details about the submissions of the tutorial/demonstration proposals can be found at: http://wims14.csd.auth.gr/?page_id=148 Call for Workshop Proposals ---------------------------- WIMS'14 invites proposals for workshops to be held in conjunction with the conference. Organizers may structure workshops as they see fit, possibly including invited talks, panel discussions, presentations of work in progress, peer-reviewed papers, or some combination. A workshop could be scheduled for a half a day or a full day, depending on potential interest and organizers preference. The organizers of successful workshops will be responsible for their own reviewing process, website, and to co-ordinate the collection and delivery of camera ready material and ACM copyright transfer. Accepted papers in workshops will be published in the WIMSメ14 proceedings and disseminated through the ACM Digital Library. Selected extended papers will be invited to appear in a special issue of a reputed journal in the field. Details about the submissions of the workshop proposals can be found at: http://wims14.csd.auth.gr/?page_id=150 Conference Scope ----------------- WIMS solicits regular and work-in-progress research, discussion papers and industry experience report papers in related fields. Papers exploring new directions or areas are also welcome. In particular but not exclusively the submissions within the following major areas are relevant: - Scalable Web and Data Architectures and Infrastructures - Web Intelligence - Web Mining, Information and Knowledge Extraction - Web Semantics and Reasoning - WIMS Applications - Evaluation and Validation of WIMS Technologies and Applications More details about the conference scope and topics can be found at: http://wims14.csd.auth.gr/?page_id=146 Publications ------------- Accepted papers/tutorials/posters will be published by ACM and disseminated through the ACM Digital Library through the International Conference Proceedings Series (ICPS). A selection of the best WIMS'14 papers will be invited to be revised and extended for the post-conference publication in the Special Issue of the International Journal on Artificial Intelligence Tools (IJAIT). The proceedings of the previous WIMS conferences could be checked at: - WIMSメ11:https://dl.acm.org/citation.cfm?id=1988688 - WIMSメ12:https://dl.acm.org/citation.cfm?id=2254129 - WIMSメ13:https://dl.acm.org/citation.cfm?id=2479787 Keynotes --------- WIMS'14 organizing committee is happy to announce the following significant keynote speakers for this year's conference: - Large-Scale Reasoning with (Semantic) Data: Grigoris Antoniou, Professor, University of Huddersfield. - Semantic Technology for online, broadcast and print media: Jem Rayfield, Head Architect, Financial Times. - Big Data ? from Hype to Reality: Richard Benjamins, Dr., Director of Business Intelligence, Telefonica. Important Dates ---------------- 25.11.2013 - submission of abstracts for Application and Case Study Track Papers 09.12.2013 - submission of Research Track papers & Application and Case Study Track papers & posters 13.12.2013 - submission of tutorial and workshop proposals 20.12.2013 - notification of acceptance for tutorials & workshops 24.01.2014 - notification of acceptance for (all tracks) papers/posters 24.02.2014 - camera ready versions of the accepted (all tracks) papers, posters, tutorial papers 07.04.2014 - author registration deadline 02-04.06.2014 - Conference Organization ------------- WIMS'14 is organized under the auspices of the Dept. of Informatics at the Aristotle University of Thessaloniki, Greece. (http://www.csd.auth.gr/en/) WIMS Conferences Chair ---------------------- Rajendra Akerkar, Western Norway Research Institute, Norway General Chairs --------------- Ioannis Vlahavas, Aristotle University of Thessaloniki, Greece Takahira Yamaguchi, Keio University, Japan Program Committee Chairs ------------------------- Nick Bassiliades, Aristotle University of Thessaloniki, Greece Vadim Ermolayev, Zaporizhzhya National University, Ukraine Advisory Committee ------------------- Grigoris Antoniou, University of Huddersfield, UK Harold Boley, Faculty of Computer Science, University of New Brunswick, Fredericton, Canada James Hendler, Rensselaer Polytechnic Institute, Troy, NY, USA Guus Schreiber, VU University, Amsterdam, the Netherlands Amit Sheth, Ohio Center of Excellence on Knowledge-enabled Computing, Ohio, USA Workshops and Tutorials Chairs ------------------------------- Costin Badica, University of Craiova, Romania Dimitris Vrakas, Aristotle University of Thessaloniki, Greece Industrial Track Chair ---------------------- John Davies, BT Research & Innovation, UK Publicity Chair ---------------- Athena Vakali, Aristotle University of Thessaloniki, Greece Local Organization Chair ------------------------ Yannis Manolopoulos, Aristotle University of Thessaloniki, Greece Web Chairs ----------- Efstratios Kontopoulos, International Hellenic University, Greece Fotis Kokkoras, T.E.I. of Thessaly, Greece ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 11:13:34 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 12:13:34 +0100 Subject: Appel: EACL 2014 Student Research Workshop, Deadline extension Message-ID: Date: Fri, 22 Nov 2013 22:47:05 +0100 From: peter ljunglöf Message-Id: <566E9480-9DE8-4B33-97FD-AF4C42143D19 at heatherleaf.se> X-url: http://eacl2014.org/ EACL 2014 STUDENT RESEARCH WORKSHOP The 14th Conference of the European Chapter of the Association for Computational Linguistics Gothenburg, Sweden 26-30 April 2014 http://eacl2014.org/ CALL FOR PAPERS ** Deadline extension! ** The Submission deadline has been extended to Friday, 13 December 2013; 11:59pm CET I. General Invitation for Submissions ------------------------------------- EACL 2014 continues the tradition of providing a forum for student researchers who are investigating various areas related to Computational Linguistics and Natural Language Processing. The workshop provides an excellent opportunity for student participants to present their work and receive valuable feedback from the international research community as well as from selected panelists - experienced researchers who will prepare in-depth comments and questions in advance of the presentation. The workshop's goal is to aid students at multiple stages of their education: from those in the final stages of undergraduate training to those active with graduate thesis research. We invite papers in two separate categories: 1. Thesis/Research Proposals: This category is appropriate for students who wish to get feedback on the progress of their thesis work and broader ideas from the field in order to identify the most promising directions for the remaining thesis work. 2. Research Papers: Most appropriate for students who are new to academic conferences. Papers in this category can describe completed original work or work in progress with preliminary results. Topics relevant to the workshop aim to cover all aspects of Computational Linguistics and Natural Language Processing, including, but not limited to (in alphabetical order): - Cognitive modeling of language processing and psycholinguistics - Dialogue and interactive systems - Discourse, coreference and pragmatics - Evaluation methods - Information retrieval - Language resources - Lexical semantics and ontologies - Machine translation: methods, applications and evaluation - Multilinguality in NLP - NLP applications - NLP and creativity - NLP for low-resource languages - NLP for the Web and social media - Question answering - Semantics - Sentiment analysis, opinion mining and text classification - Spoken language processing - Statistical and Machine Learning methods in NLP - Summarization and generation - Syntax and parsing - Tagging and chunking - Text mining and information extraction - Word segmentation Subject to the availability of established researcher volunteers, each accepted paper will be assigned a mentor, an experienced researcher who will provide feedback on the work to the student at the conference. Details on this service will be provided in the acceptance notification. II. Submission guidelines ------------------------- A) Submission requirements 1. Thesis/Research Proposals may contain previously published work and must include specific research directions. They may also be in the style of a position paper that surveys and critiques existing literature, but must suggest future research directions. Proposals may only have one author, who must be a student. 2. Research Papers must describe original completed work or work in progress. Since the main purpose of presenting at the workshop is to exchange ideas with other researchers and to receive helpful feedback for further development of the work, papers should clearly indicate directions for future research wherever appropriate. The first author of multi-author papers must be a student, but additional co-authors need not be students. Research Papers are eligible for this workshop only if they have not been presented at any other meeting with publicly available published proceedings. Students who have already presented at a past ACL/EACL/NAACL Student Research Workshop may not submit to this track as a first author (though they may still be a co-author, or the first author of a Thesis/Research Proposal). These students are instead encouraged to submit their work to the main conference or to the Thesis Proposal track. During submission, students must clearly indicate whether a paper has been submitted to another conference or workshop. Double submissions to the EACL main conference and the Student Research Workshop are not allowed. One student can only submit one paper to the Research Papers track as the first author. B) Submission procedure Both paper and proposal submissions to the EACL 2014 Student Research Workshop should follow the standard two-column format of the EACL 2014 proceedings and they must be submitted as a PDF file. Authors are strongly recommended to use the style files from the conference web site. The style files are available here: - http://www.eacl2014.org/files/eacl-2014-styles.zip All submissions may consist of up to nine (9) pages of content only. Any number of additional pages containing references is allowed. The reviewing process will be double-blind; therefore, please ensure that the paper does not include the authors' names and affiliations. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ...", should be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ...". Further guidelines are provided in the template style files. References to your own work in thesis proposals should also be anonymized. You may for example write it as "in X (2000) we showed", etc. and do not add your papers in the reference list. Authors should not use other anonymous citations in both research papers and thesis proposals, and should not include any acknowledgments. Papers that do not conform to these requirements will be rejected without review. The deadline for submission has been extended to 11:59pm CET on Friday, 13 December 2013. Submission will be electronic using the paper submission web page: - https://www.softconf.com/eacl2014/srw/ Papers will be presented orally or as posters during the main EACL conference as determined by the program committee. Decisions on presentation format will be based on the nature rather than the quality of the work. There will be no distinction in the proceedings between long papers presented orally and as posters. C) Multiple-submission policy Papers that have been or will be submitted to other meetings or publications must indicate this at submission time. Authors of papers accepted for presentation at EACL SRW 2014 must notify the program chairs whether the paper will be presented. All accepted papers must be presented at the workshop in order for them to appear in the proceedings. We will not accept for publication or presentation papers that overlap significantly in content or results with papers that will be (or have been) published elsewhere. Double submissions to the EACL main conference and the Student Research Workshop are not allowed, and the authors must ensure that these submissions do not overlap significantly (> 50%) with each other in content or results. D) Reviewing procedure The reviewing of the papers will be double-blind. Reviewing will be managed by the Student Workshop Co-Chairs and a team of reviewers. Each submission will be matched with a mixed panel of student and senior researchers for review. The final acceptance decision will be based on the results of the review. III. Important dates -------------------- - Submission deadline has been extended to: 13 December 2013 - Notification of acceptance: 20 January 2014 - Camera-ready submission deadline: 17 February 2014 - Conference dates: 26-30 April 2014 (The workshop will be held during the main conference, in a mode similar to the conference's regular sessions. The exact format will be decided by the workshop co-chairs and conference chairs.) IV. Student Research Workshop Committee --------------------------------------- Student chairs: - Desmond Elliott (University of Edinburgh, UK) - Konstantina Garoufi (University of Potsdam, Germany) - Douwe Kiela (University of Cambridge, UK) - Ivan Vulić (KU Leuven, Belgium) Faculty advisor: - Sebastian Padó (University of Stuttgart, Germany) Contact information: - students at eacl.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:35:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:35:44 +0100 Subject: Stage: Stage M2, Amelioration du module de desambiguisation du Moteur de Recherche Semantique d'inbenta Message-ID: Date: Mon, 25 Nov 2013 10:01:52 +0100 From: Manon Quintana Message-ID: *Présentation société* ------------------------------ inbenta est une société pionnière dans le *Traitement Automatique du Langage Naturel et la recherche sémantique*. Basée sur ces concepts novateurs, inbenta développe depuis 2005 des solutions logicielles pour les sites internet de Grands Comptes. *Description de l’offre* ------------------------------ Inbenta a développé un moteur de recherche intelligent appelé *Inbenta Semantic Search Engine* (ISSE). Les deux tâches principales de ce moteur sont d’analyser les questions des utilisateurs et de trouver la réponse appropriée à la requête en effectuant une recherche dans une base de connaissances. Un *module de désambiguïsation syntaxique et sémantique* est intégré dans notre moteur de recherche. Ce module est très important car il fait partie intégrante du bon fonctionnement de la solution. L’objet du stage proposé par inbenta sera d’améliorer le module de désambiguïsation. Les missions de stage seront : - Gestion linguistique et éditoriale d’un projet de FAQ dynamique afin que le stagiaire s’approprie l’existant - Enrichissement du module de désambiguïsation par l’ajout de règles, de descriptions lexicales et de grammaires locales + évaluation du travail - Réflexion d’amélioration du module de désambiguïsation à un niveau algorithmique *Profil recherché* ------------------------------ Nous recherchons une personne enthousiaste, organisée et sérieuse et ayant l’envie d’intégrer une équipe internationale. Le stagiaire devra également avoir les compétences suivantes : - Études en Traitement Automatique du Langage Naturel - Excellente maîtrise de la langue française et bonne communication écrite et orale en espagnol, anglais ou catalan Bonus : - Maîtrise d’au moins un langage de programmation (PHP de préférence) - Maitrise des expressions régulières et du SQL *Modalités du poste* ------------------------------ - Stage de 5 à 6 mois (avec possibilité d’embauche en CDI) - Rémunération prévue: 30% du SMIC (+ prime en fonction des résultats) - Début : à partir de Février / Mars 2013 - Lieu : Toulouse Merci d’adresser CV et lettre de motivation à Quintana Manon à l’adresse mail suivante : *mquintana at inbenta.com* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:27:01 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:27:01 +0100 Subject: Revue: Nommer la segregation en sociolinguistique urbaine, Cahiers internationaux de sociolinguistique n3 Message-ID: Date: Sat, 23 Nov 2013 13:39:25 +0100 From: "gudrun.ledegen" Message-ID: <0a1e01cee849$0b136480$213a2d80$@wanadoo.fr> Les Cahiers internationaux de sociolinguistique n° 3 viennent de sortir sous le titre Nommer la ségrégation en sociolinguistique urbaine. Les dimensions socio-spatiales du processus (ISBN : 978-2-343-01031-1). Vous trouverez ci-dessous la présentation de la 4° de couverture et la table des matières. Très cordialement, Gudrun Ledegen PREFics 4246-Université Rennes II Le présent recueil centré sur la mise en mots de la ségrégation en situation urbanisée tente de rendre compte de la complexité des situations sociolinguistiques que le chercheur est amené à rencontrer et à partir desquelles il souhaite mettre en place une intervention. Un premier volet concerne la dynamique ségrégative en cours dans la société mauricienne, qui voit arriver une nouvelle économie de « migration externe de luxe », ou dans la société allemande et française, pour les jeunes qui vivent dans la marge. Un second volet porte sur la nomination d’un groupe « autre », qu’il soit habitant de grands ensembles voués à la destruction, mahorais ou comorien à La Réunion, ou tsigane dans la presse française du début du siècle. TABLE DES MATIÈRES INTRODUCTION. LA SÉGRÉGATION MISE EN MOTS : QUELQUES RÉFLEXIONS SUR LA DIMENSION SOCIOLINGUISTIQUE DU PROCESSUS (GUDRUN LEDEGEN / THIERRY BULOT) 1. Les dimensions socio-spatiales du processus ségrégatif 2. Corpus et/ou observables en sociolinguistique urbaine 3. Espace et ségrégation 4. Nommer 5. Bibliographie PRATIQUES SÉGRÉGATIVES DANS LA STRUCTURATION DE L’ESPACE MAURICIEN (YANNICK BOSQUET-BALLAH) 1. Introduction 2. Considérations conceptuelles et méthodologiques 3. Organisation socio-spatiale de l’île Maurice 4. Les villages de Tamarin et de Grande Rivière Noire 5. Le marquage de l’espace 6. Conclusion 7. Bibliographie 8. Annexes CES JEUNES QUI VIVENT EN MARGE : DOCUMENTARISATION ET INTERVENTION SOCIOLINGUISTIQUE (SABINE BASTIAN) 1. Introduction 2. La situation des jeunes dans les quartiers marginalisés : l’exemple de l’Allemagne (comparé à la France) 3. Nouvelles approches pour la recherche 4. En guise de conclusion 5. Bibliographie LA FIGURE DE L’HABITANT (DISCOURS ET RÉNOVATION URBAINE) (FRÉDÉRIC PUGNIÈRE-SAAVEDRA) 1. Introduction 2. Le corpus 3. Cadre théorique : double approche 4. Conclusion 5. Bibliographie 6. Annexes LES DISCOURS ETHNICISÉS, MÉDIATIQUEMENT DICIBLE ET IMPLICITE : CAS DU MODÈLE RÉUNIONNAIS DANS LA PRESSE ÉCRITE (FRANCK MARC) 1. Introduction 2. La dialectique de l’ethnicité : « ton identité s’arrête là où commence la « mienne » 3. Continuum de formulabilité des discours 4. Conclusion 5. Bibliographie INTRODUCTEURS NORMATIFS ET DISCRIMINATION. UN REGARD SUR LES TSIGANES DANS LES JOURNAUX DU DÉBUT DU XXE SIÈCLE (BÉATRICE TURPIN) 1. Introduction 2. Les inducteurs normatifs de la langue 3. Le discours de presse et la norme 4. Les inducteurs juridiques 5. Les inducteurs évaluatifs 6. Les inducteurs déontiques 7. Les inducteurs rhétoriques 8. Bibliographie ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:22:39 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:22:39 +0100 Subject: Appel: EACL 2014 Type Theory and Natural Language Semantics Workshop Message-ID: Date: Sun, 24 Nov 2013 20:21:34 +0100 From: retore Message-Id: X-url: http://clt.gu.se/event/2014-04-27/type-theory-workshop-eacl-2014 Call for Papers - Submission Deadline 23 January 2014 TTNLS: EACL 2014 Type Theory and Natural Language Semantics Workshop Co-located with EACL 2014, Gothenburg, Sweden 27th of April, 2014 http://clt.gu.se/event/2014-04-27/type-theory-workshop-eacl-2014 http://eacl2014.org/ WORKSHOP DESCRIPTION Type theory has been a central area of research in logic, the semantics of programming languages, and natural language semantics over the past fifty years. Recent developments in type theory have been used to reconstruct the formal foundations of computational semantics (Ranta (1994), Fox and Lappin (2005), Ginzburg (2012), Retoré (2012), Cooper (2012), Cooper et al. (2013)). These theories are generally intensional and polymorphic in character, and they allow for structured, fine-grained encoding of information across a diverse set of linguistic domains. The work in this area has opened up new approaches to modeling the relations between, inter alia, syntax, semantic interpretation, dialogue, inference, and cognition, from a largely proof theoretic perspective. The workshop provides a forum for the presentation of leading edge research in this fast developing subfield of computational linguistics. To the best of our knowledge it will be the first major conference on this topic hosted by the ACL. TOPICS We invite papers on topics including, but not limited to, the following: * subtyping * lexical semantics * record types * intensionality * probabilistic type theory * type theory and the interface among syntax, semantics, phonology * type theory and functional programming * type theory, logic, and inference Programme Committee: * Krasimir Angelov (Chalmers, Gothenburg) * Patrick Blackburn (Roskilde) * Stergios Chatzikyriakidis (Royal Holloway, London) * Steve Clark (Cambridge) * Jan van Eijck (Amsterdam) * Raquel Fernández (Amsterdam) * Tim Fernando (Trinity College, Dublin) * Chris Fox (Essex) * Jonathan Ginzburg (Paris 7) * Zhaohui Luo (Royal Holloway, London) * Bruno Mery (LaBRI, Bordeaux) * Glyn Morrill (Politècnica de Catalunya, Barcelona) * Larry Moss (Indiana) * Reinhard Muskens (Tilburg) * Bengt Nordström (Chalmers, Gothenburg) * Valeria de Paiva (Nuance, Sunnyvale California) * Carl Pollard (Ohio State University) * Ian Pratt-Hartmann (Manchester) * Steve Pulman (Oxford) * Matt Purver (Queen Mary, London) * Aarne Ranta (Chalmers, Gothenburg) * Christian Retoré (LaBRI, Bordeaux) * Ray Turner (Essex) SUBMISSION All papers should be submitted in English as PDF documents. Note that submissions must be anonymous. We welcome full papers of up to 8 pages and 1 additional page for references formatted in accordance with the EACL'14 style files (seehttp://www.eacl2014.org/files/eacl-2014-styles.zip ). Submissions can be made via the TTNLS START Conference Management's system website: https://www.softconf.com/eacl2014/TT/ CONTACT For any queries please contact us at: simon.dobnik <- at -> gu <-.-> se IMPORTANT DATES Submission Deadline 23 January 2014 Notification 20 February 2014 Camera Ready Deadline 3 March 2014 Workshop Day 27 April 2014 WORKSHOP ORGANISERS Robin Cooper (University of Gothenburg), Simon Dobnik (University of Gothenburg), Shalom Lappin (King's College, London), and Staffan Larsson ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:50:46 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:50:46 +0100 Subject: Stage: Detection automatique multilingue de sous-parties de mots (morphemes), Vision Objects Message-ID: Date: Tue, 26 Nov 2013 11:57:19 +0100 From: prajol shrestha Message-ID: X-url: http://www.prajol.net.np *Stage en Traitement Automatique des Langues H/F :* *SUJET : Détection automatique multilingue de sous-parties de mots (morphèmes)* Avec plus de 90% de son CA à l’international, et plus de 100 millions d’utilisateurs dans le monde, Vision Objects est un éditeur de logiciels leader mondial sur le marché des interfaces homme-machine basées sur la reconnaissance d’écriture manuscrite. Disponible dans plus de 85 langues, ses produits concernent les marchés de la mobilité (saisie de texte, prise de notes, …), de l’éducation (apprentissage de l’écriture, des mathématiques, de la géométrie, …) de l’entreprise (prise de notes et traitement de formulaires), et de l’automobile (saisie de texte à partir d’une surface tactile, interaction avec GPS). Vision Objects est une entreprise d’innovation et de hautes technologies. Le cœur de sa technologie MyScript est diffusé sous forme de kit de développement logiciel, de « Cloud service », de composants à intégrer ou sous forme d’applications prêtes à l’emploi. Le moteur de reconnaissance de Vision Objects se classe régulièrement aux premières places des compétitions scientifiques internationales (cf., par exemple, ICDAR). Dans le cadre de sa forte croissance, Vision Objects (Nantes, France) est à la recherche d'un: *Stagiaire Ingénieur Informaticien en Traitement Automatique des Langues (TAL)* Dans l'équipe *Ressources Linguistiques*, vous serez amené à travailler sur la mission suivante : *SUJET : Détection automatique multilingue de sous-parties de mots (morphèmes)* *Les langues fortement agglutinantes posent des problèmes spécifiques en modélisation statistique des langues, notamment le très grand nombre d'unités lexicales possibles. Une approche est de découper ce qui est couramment appelé mot en unités plus petites.* *Le stage consiste à étudier et implémenter des algorithmes non supervisés (sans exemples de découpage dans la langue cible) de découpage de mots en morphèmes. Il s'agit ensuite d'appliquer ces algorithmes dans un contexte fortement multilingue car notre solution est disponible en 64 langues.* *Une suite possible de ce travail sera l'étude de techniques également non supervisées et multilingues d'analyse grammaticale (PoS tagging).* Stage basé à Nantes, démarrage dès que possible en 2013 ou 2014. Rigoureux, dynamique et d’un relationnel facile, vous saurez rapidement vous intégrer au sein des équipes. Au sein de VisionObjects, vous travaillerez sur des technologies à la pointe de la recherche et pourrez identifier les applications directes et concrètes de votre travail. Un ancien stagiaire, promotion ECN 2010-2013, a ainsi contribué à l’élaboration de l’application Android MyScript Calculator: une calculatrice manuscrite utilisant la reconnaissance d’équations de VisionObjects. Les applications réalisées et publiées par VisionObjects à partir du travail de ce stage ont depuis totalisé plus de 10 millions de téléchargements. Vous pouvez trouver gratuitement MyScript Calculator sur les stores Android et iOS. Contact : job at visionobjects.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:48:14 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:48:14 +0100 Subject: Stage: Influence des types de corpus sur la reconnaissance d'ecriture, Vision Objects Message-ID: Date: Tue, 26 Nov 2013 11:53:24 +0100 From: prajol shrestha Message-ID: X-url: http://www.prajol.net.np *Stage en Traitement Automatique des Langues H/F :* *SUJET : Influence des types de corpus sur la reconnaissance d'écriture* Avec plus de 90% de son CA à l’international, et plus de 100 millions d’utilisateurs dans le monde, Vision Objects est un éditeur de logiciels leader mondial sur le marché des interfaces homme-machine basées sur la reconnaissance d’écriture manuscrite. Disponible dans plus de 85 langues, ses produits concernent les marchés de la mobilité (saisie de texte, prise de notes, …), de l’éducation (apprentissage de l’écriture, des mathématiques, de la géométrie, …) de l’entreprise (prise de notes et traitement de formulaires), et de l’automobile (saisie de texte à partir d’une surface tactile, interaction avec GPS). Vision Objects est une entreprise d’innovation et de hautes technologies. Le cœur de sa technologie MyScript est diffusé sous forme de kit de développement logiciel, de « Cloud service », de composants à intégrer ou sous forme d’applications prêtes à l’emploi. Le moteur de reconnaissance de Vision Objects se classe régulièrement aux premières places des compétitions scientifiques internationales (cf., par exemple, ICDAR). Dans le cadre de sa forte croissance, Vision Objects (Nantes, France) est à la recherche d'un: *Stagiaire Ingénieur Informaticien en Traitement Automatique des Langues (TAL)* Dans l'équipe *Ressources Linguistiques*, vous serez amené à travailler sur la mission suivante : *SUJET : Influence des types de corpus sur la reconnaissance d'écriture* *Les nouveaux usages du Web ont fait émerger de nouveaux registres de langue. On n'écrit pas de la même façon un e-mail, un sms, un tweet ou un article plus formel.* *Le stage consiste à enrichir en diversité les corpus utilisés pour la construction des modèles de langue et à évaluer la façon de combiner ces corpus. On s'intéresse en particulier aux contenus extractibles des réseaux sociaux ainsi qu'aux corpus disponibles dans de nombreuses langues car notre solution est disponible dans 64 langues, dont certaines peu dotées en termes de ressources.* Stage basé à Nantes, démarrage dès que possible en 2013 ou 2014. Au sein de VisionObjects, vous travaillerez sur des technologies à la pointe de la recherche et pourrez identifier les applications directes et concrètes de votre travail. Un ancien stagiaire, promotion ECN 2010-2013, a ainsi contribué à l’élaboration de l’application Android MyScript Calculator: une calculatrice manuscrite utilisant la reconnaissance d’équations de VisionObjects. Les applications réalisées et publiées par VisionObjects à partir du travail de ce stage ont depuis totalisé plus de 10 millions de téléchargements. Vous pouvez trouver gratuitement MyScript Calculator sur les stores Android et iOS. Contact : job at visionobjects.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:41:38 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:41:38 +0100 Subject: Conf: Colloque Le langage en sciences humaines et sociales, 5 decembre 2013, Paris Message-ID: Date: Tue, 26 Nov 2013 09:26:48 +0100 From: Alice Krieg-Planque Message-ID: <52945B48.6030100 at club-internet.fr> X-url: http://www.shs.parisdescartes.fr/ACTUALITES/Colloque-international-LE-LANGAGE-EN-SCIENCES-HUMAINES-ET-SOCIALES Pour rappel, ci-dessous le programme du colloque "Le langage en sciences humaines et sociales" qui aura lieu jeudi de la semaine prochaine, à Paris. Entrée libre dans la limite des places disponibles. - colloque - - - colloque - - - colloque - - - colloque - - - Colloque "Le langage en sciences humaines et sociales" jeudi 5 décembre 2013 Université Paris Descartes - Sorbonne Paris Cité Amphithéâtre Durkheim - Sorbonne - Galerie Claude Bernard - esc. I 1 rue Victor Cousin - 75005 Paris Le langage constitue la matière première de l'ensemble des disciplines en sciences humaines et sociales : que les individus soient sollicités pour des entretiens, des récits de vie, des questionnaires ou observés par l'intermédiaire de productions verbales indépendantes du travail de recherche, que leurs productions soient orales ou écrites, c'est bien toujours par le discours que s'opère la relation entre les chercheurs et les sujets, qui sont souvent leurs interlocuteurs. C'est aussi essentiellement par leurs dires (même en leur absence, lors d'études de textes ou de discours écrits) que se construisent la plupart des analyses scientifiques, en interaction avec d'autres composantes (comportements, attitudes, etc.). L'analyse de discours, la sociolinguistique et l'anthropologie du langage développées à la faculté de sciences humaines et sociales de Paris Descartes se situent à l'interface de multiples approches, intégrant les dimensions sociologiques, anthropologiques, historiques, éducatives, voire philosophiques. Elles proposent une approche des praxis langagières qui fait nécessairement appel à des disciplines autres que les sciences du langage, l'articulation avec ces dernières pouvant se faire de différentes manières. Inversement, les autres sciences humaines et sociales font constamment appel au langage à toutes les étapes de la recherche, que ce soit lors du recueil des données, lors de leur exploitation ou lors de la construction de cadres d'interprétation. Le colloque " Le langage en sciences humaines et sociales " réunira toutes les disciplines de la faculté ainsi que des collègues rattachés à d'autres institutions, en France et à l'étranger, et donnera lieu à un dialogue sur les façons dont l'interdisciplinarité " autour du langage " pourrait être pratiquée d'une façon générale et en particulier dans ce lieu de rencontres entre sciences humaines et sociales que constitue notre faculté. Programme : 9 h 00 : Accueil 9 h 15 Ouverture : Frédéric Dardel, Président de l'université Paris Descartes, Sorbonne Paris Cité Joël Lebeaume, Doyen de la faculté de sciences humaines et sociales Sorbonne 9 h 30 - 10 h 30 Conférence : Bernard Lahire (ENS Lyon, Centre Max Weber) : " De la nécessité d'articuler le langagier et le social " 10 h 30-10 h 45 : Pause café 10 h 45 - 12 h 45 Communications : Cécile Canut (Université Paris Descartes, CEPED) : " Matérialités langagières et praxis sociales : le langage au coeur des sciences humaines et sociales " Erwann Dianteill (Université Paris Descartes, IUF, CANTHEL) : " Comment les dieux parlent aux hommes : anthropologie du discours divinatoire dans le vaudou (Porto-Novo, Bénin) " Johannes Angermüller (Université de Warwick, Grande-Bretagne, CEMS/EHESS) : " Le discours comme pratique langagière. Construire sa place dans le social " Sabine Caillaud (Université Paris Descartes, Laboratoire de psychologie des menaces sociales et environnementales) : " La triangulation des méthodes d'analyse du discours en psychologie sociale : deux exemples d'études sur les représentations sociales de l'écologie " 12 h 45-14 h 45 Pause déjeuner 14 h 45-16 h 45 Communications : Marie Veniard et Bernard Pechberty (Université Paris Descartes, EDA) : " Approche clinique et linguistique d'entretiens non directifs avec des professionnels de l'éducation spécialisée " Alice Krieg-Planque (Université Paris-Est Créteil, CEDITEC) : " La communication des organisations et des institutions au prisme de l'analyse du discours " Elsa Ramos (Université Paris Descartes, CERLIS) : " Du discours de l'enquêté à l'analyse du sociologue " Patricia von Münchow (Université Paris Descartes, EDA) : " Discours et cultures éducatives " 16 h 45-17 h 00 Pause café 17 h 00-18 h 00 Conférence : Dominique Maingueneau (Université Paris Sorbonne, STIH) : " Discours et analyse du discours " 18 h 00-18 h 30 Discussion 18 h 45 Cocktail Contacts : Patricia von Münchow : patricia.vonmunchow at parisdescartes.fr, Cécile Canut : cecile.canut at parisdescartes.fr URL : http://www.shs.parisdescartes.fr/ACTUALITES/Colloque-international-LE-LANGAGE-EN-SCIENCES-HUMAINES-ET-SOCIALES - colloque - - - colloque - - - colloque - - - colloque - - - ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:47:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:47:03 +0100 Subject: Job: Contract positions at Google, Junior Linguist [French] (multiple positions) Message-ID: Date: Tue, 26 Nov 2013 10:55:06 +0100 From: Advanced Linguistics Message-ID: Job title: Junior Linguist [French] (multiple positions) Linguistic Field(s): Morphology, Semantics, Syntax, Lexicography, NLP This is a full-time contract position. Work will be done from home, but Junior Linguists should be able to come to Google Paris Office for training and meetings. Job description: As a Junior Linguist, you will be reviewing and annotating linguistic data and carrying out a number of tasks to improve Google’s natural language processing. This includes: - reviewing and annotating linguistic data - labeling text for semantic, syntactic and morphological characteristics - providing transcriptions for lexicon entries according to guidelines - deriving NLP data for new and on-going projects Job requirements: - native-level speaker of French and fluent in English - degree in Linguistics or Computational Linguistics with knowledge of semantics, syntax, morphology or lexicography - ability to quickly grasp technical concepts; should have an interest in natural language processing - excellent oral and written communication skills - keen interest in technology and computer-literate (should feel comfortable using in-house tools and should have an interest in linguistics and linguistic resources) - attention to detail and good organizational skills Project duration: 9 months (with potential for extension) For immediate consideration, please email your CV and cover letter in English (PDF format preferred) with “Junior Linguists” [French] in the subject line. Application Deadline: (Open until filled) Email Address for Applications: AdvancedLinguistics at gmail.com Contact information: Linne Ha: AdvancedLinguistics at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:52:15 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:52:15 +0100 Subject: Appel: NLDB'2014 Message-ID: Date: Tue, 26 Nov 2013 12:45:59 +0100 From: Mathieu Roche Message-ID: X-url: http://www.nldb.org/ ============== CALL FOR PAPERS - NLDB'2014 19th International Conference on Application of Natural Language to Information Systems 18-20 June 2014 - Montpellier, France http://www.nldb.org/ Submission deadline: February 3, 2014 ============== Since 1995, the NLDB conference aims at bringing together researcher, industrials and potential users interested in various application of Natural Language in the Database and Information Systems field. The integration of databases and natural language has been an utopia for many years. However, progress has been made and this is now an established field thanks to developments in Natural Language and technologies that made the storage and manipulation of large electronic dictionaries possible. As Information Systems are now evolving into the communication area, the term databases should be considered in the broader sense of information and communication systems. The use of Natural Language in Software Engineering has contributed to both improving the development process from the viewpoints of developers (improve the process of conceptual modeling, validation, etc) and the usability of applications by users (natural language query interfaces, semantic webs, etc). NLDB'2014 will take place in Montpellier (France). The conference invites researchers from academia and industry to submit papers for oral or poster presentations on recent, unpublished research that addresses theoretical aspects, algorithms, applications, architectures for applied and integrated NLP, resources for applied NLP, and other aspects of NLP, as well as review and discussion papers. Topics of interest include but are not limited to: - Applications of NLP in Information Systems: Multilingual Information Systems, NLP in Requirement Engineering, NLP in Knowledge Management, Semantic Data Integration and Data Cleaning - Social Media and Web Data: Corpus analysis, Language identification, Text normalization, Robust NLP for social media, Text classification, Information Extraction and Sentiment Analysis for social media - Big Data and Natural Language - Semantic Web Open Linked Data: Ontology Learning and Alignment, Populating ontologies, Querying Ontologies and linked data, Semantic tagging and classification, Ontology-driven NLP - Question Answering (QA): NL interfaces to databases, QA using web data, multi-lingual QA, Non-factoid QA (how/why/opinion questions, lists), geographical QA, QA corpora and training sets - Natural language and Ubiquitous Computing: Pervasive Computing, Embedded, Robotic and Mobile Applications. - Natural Language in Conceptual Modeling: Analysis of Natural Language Descriptions, Terminological Ontologies, Consistency Checking, Metadata Creation and Harvesting, Ontology-driven Systems Integration, Ontology Management - NLP Applications: Business Intelligence, Subjectivity and Sentiment Analysis, QA systems, Event Detection, Named Entity and Event Detection, Information Extraction, Summarization, NLP for Data Mining, NLP for Data Warehouses, Plagiarism detection, Identity detection ============== Submission guidelines: Authors should follow the LNCS format and submit their manuscripts in pdf. Submissions can be full papers (12 pages maximum including references), short papers (6 pages) or papers for a poster presentation (4 pages). The programme committee may decide to accept some full papers as short papers or poster contributions. The Proceedings of NLDB 2014 will be published by Springer LNCS Series. We plan to publish extended versions of a selection of the best papers after the conference in the 'Data and Knowledge Engineering Journal' as a special issue. ============== Conference Chair: - Elisabeth Métais, Conservatoire National des Arts et Métiers, Paris, France Programme Committee Chairs: - Mathieu Roche, Cirad, TETIS, France - Maguelonne Teisseire, Irstea, TETIS, France ============== Important dates: - Paper submission: February 3, 2014 - Notification of acceptance: March 24, 2014 - Camera-ready papers: April 7, 2014 - Conference: 18-20 June 2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:49:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:49:10 +0100 Subject: Stage: Developpement d'un outil d'analyse de resultats, Vision Objects Message-ID: Date: Tue, 26 Nov 2013 11:56:22 +0100 From: prajol shrestha Message-ID: X-url: http://www.prajol.net.np *STAGE EQUIPE TAL – VISION OBJECTS* Avec plus de 90% de son CA à l’international, et plus de 100 millions d’utilisateurs dans le monde, Vision Objects est un éditeur de logiciels leader mondial sur le marché des interfaces homme-machine basées sur la reconnaissance d’écriture manuscrite. Disponible dans plus de 85 langues, ses produits concernent les marchés de la mobilité (saisie de texte, prise de notes, …), de l’éducation (apprentissage de l’écriture, des mathématiques, de la géométrie, …) de l’entreprise (prise de notes et traitement de formulaires), et de l’automobile (saisie de texte à partir d’une surface tactile, interaction avec GPS). Vision Objects est une entreprise d’innovation et de hautes technologies. Le cœur de sa technologie MyScript est diffusé sous forme de kit de développement logiciel, de « Cloud service », de composants à intégrer ou sous forme d’applications prêtes à l’emploi. Le moteur de reconnaissance de Vision Objects se classe régulièrement aux premières places des compétitions scientifiques internationales (cf., par exemple, ICDAR). *Stagiaire – Développement d’un outil d’analyse de résultats* *Une problématique de la recherche en reconnaissance d'écriture est d'évaluer globalement les avantages et inconvénients de différents algorithmes, tout en étudiant les comportements de ces algorithmes sur quelques cas spécifiques. Ce passage de la vérité générale au cas particuliers, et inversement, peut être grandement facilité par un outillage adéquat.* *Dans ce stage, on s'intéressera au développement d'un nouvel outil de détection de cas intéressants à partir de bases de test globales. Au sein du département R&D, le stagiaire aura l'occasion de comprendre le fonctionnement du moteur de reconnaissance d'écriture, tout en acquérant des compétences de programmation utilisables dans bien d'autres contextes. Le travail comprend des aspects algorithmiques et d'analyse de données pour factoriser l'information, ainsi que des aspects interface graphique et intégration dans les outils existants pour la présenter de façon optimale à l'utilisateur.* Stage basé à Nantes, démarrage dès que possible en 2013 ou 2014. Rigoureux, dynamique et d’un relationnel facile, vous saurez rapidement vous intégrer au sein d’équipes de haut niveau et dans un environnement stimulant. Au sein de VisionObjects, vous travaillerez sur des technologies à la pointe de la recherche et pourrez identifier les applications directes et concrètes de votre travail. Un ancien stagiaire, promotion ECN 2010-2013, a ainsi contribué à l’élaboration de l’application Android MyScript Calculator: une calculatrice manuscrite utilisant la reconnaissance d’équations de VisionObjects. Les applications réalisées et publiées par VisionObjects à partir du travail de ce stage ont depuis totalisé plus de 10 millions de téléchargements. Vous pouvez trouver gratuitement MyScript Calculator sur les stores Android et iOS. Contact : job at visionobjects.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:37:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:37:04 +0100 Subject: Appel: Atelier JADT 2014, Actualite des corpus multilingues en analyse statistiques des donn=?ISO-8859-1?Q?=E9es_?=textuelles Message-ID: Date: Tue, 26 Nov 2013 00:08:57 +0100 From: Mathieu Valette Message-Id: X-url: http://jadt.org Actualité des corpus multilingues en analyse statistiques des données textuelles : enjeux théoriques, méthodologies, applications Qu’ils soient parallèles ou comparables, les corpus multilingues sont aujourd’hui couramment utilisés dans le domaine du traitement automatique des langues, notamment comme corpus d’entraînement dans les applications en traduction automatique et en recherche d’information translingue. La terminologie et la lexicographie ont elles aussi recours aux corpus multilingues pour l’extraction de ressources langagières. D'autres disciplines appliquées, telles que la traductique ou la didactique des langues, bénéficient notamment de telles ressources. Encore peu exploitée dans un contexte académique, l'analyse statistique des corpus comparables offre, quant à elle, de prometteuses perspectives en termes de description des langues, des textes et des cultures, et pour l'insertion de la linguistique de corpus dans le champ des humanités numériques. Dans le cadre des Journées internationales d’Analyse statistique des Données Textuelles (JADT 2014), un atelier est organisé en amont de la conférence, le mardi 3 juin 2014, dont l'objectif est de faire un état des lieux prospectif sur l’utilisation des statistiques textuelles pour l’analyse de corpus multilingues. Les thèmes attendus sont les suivants : Enjeux théoriques des corpus multilingues pour l’analyse statistique des données textuelles - humanités numériques et multilinguisme - corpus multilingues et linguistique comparée - actualité du concept de comparabilité et comparatisme - corpus multilingues et sciences de la culture Méthodologie, outils et heuristiques pour le traitement statistique des corpus multilingues - constitution et alignement de corpus parallèles - conception, identification et constitution de corpus comparables - typologie des corpus comparables - méthodes contrastives et analyses différentielles de corpus multilingues - textométrie multilingue Applications de l’analyse statistique des données textuelles multilingues - lexicographie, terminologie, didactique, traductique, fouille de textes, etc. Les propositions de communications seront soumises suivant les normes éditoriales de la conférence elle-même. Site de la conférence http://jadt.org Date limite de soumission : 1er février 2014 Notification aux auteurs : 1er mars 2014 Date limite d'inscription : 15 mars 2014 Tenue de l'atelier : 3 juin 2014 ==================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:15:15 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:15:15 +0100 Subject: Stage: Adaptation de la ressource lexico-syntaxique VerbNet au francais (2eme diffusion) Message-ID: Date: Wed, 27 Nov 2013 16:59:14 +0100 From: Gaël de Chalendar Message-ID: <3122853.0tXvOHeGyz at brezhoneg.intra.cea.fr> INTRODUCTION Dans le cadre de la thèse de Quentin Pradet, sous la direction du Pr. Laurence Danlos et du Dr. Gaël de Chalendar, le CEA LIST et l'INRIA ALPAGE ont entamé l'adaptation au français de la ressource lexico-syntaxique VerbNet. Le présent stage vise à contribuer à cette traduction. CONTEXTE VerbNet est une ressource lexicale pour les verbes anglais organisée autour de classes sémantiques et de sous-classes syntaxiques. Cette ressource est très utilisée, notamment pour l'annotation en rôles sémantiques. Il paraît donc nécessaire d'avoir une ressource équivalente pour le français. Les seuls efforts qui ont été faits pour l'instant se limitent à des constructions automatiques bruitées dont l'évaluation se limite à quelques verbes. De plus ces efforts font abstraction des ressources lexicales qui existent pour le français, or celles-ci existent et sont de qualité. Pour les verbes, nous pensons en particulier à LVF+1, au Lexique-Grammaire et à Dicovalence. Nous avons donc l'objectif de réaliser un VerbeNet du français semi-automatiquement en nous appuyant sur ces ressources, en particulier sur LVF+1 et LG, la première plus centrée sur les informations sémantiques, la seconde sur les informations syntaxiques. Ce VerbeNet garde la hiérarchie des classes sémantiques du VerbNet anglais, ce qui permet de garder à l'identique les informations sémantiques, entre autres les rôles thématiques. OBJECTIFS La partie automatique exploitant les liens disponibles entre ressources et un réseau lexico-syntaxique est terminée. Le but de ce stage est de participer en collaboration étroite avec Laurence Danlos et Quentin Pradet à la correction manuelle de la ressource à l'aide d'une interface Web développée en interne. Pour chaque classe ou sous-classe VerbNet, on dispose des constructions syntaxiques possibles en anglais, des liens obtenus automatiquement avec les classes LVF+1 et LG correspondantes et d'une liste de verbes pouvant appartenir à cette classe. Le travail consiste en l'édition des frames lexico- syntactico-sémantiques en réorganisant si nécessaire la hiérarchie de classes, en acceptant ou refusant les verbes proposés, en modifiant les constructions syntaxiques et en traduisant les exemples. CANDIDAT ET DEROULEMENT Nous recherchons pour ce stage un étudiant en linguistique avec si possible des notions de lexicographie. Le stage se déroulera au laboratoire LVIC du CEA LIST, dans les locaux de Nano Innov à Palaiseau, en étroite collaboration avec Laurence Danlos à Paris. La rémunération est autour de 700€ pour un étudiant de M2, plus une éventuelle prime de fin de stage. CONTACT Gaël de Chalendar gael.de-chalendar at cea.fr 01 69 08 01 50 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:24:55 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:24:55 +0100 Subject: Carnet: Deces de Pierre Cadiot Message-ID: Date: Thu, 28 Nov 2013 08:46:16 +0100 From: "Didier Bottineau" Message-ID: <00cf01ceec0d$ec638c40$c52aa4c0$@bottineau at free.fr> Message de la part de Florence Lautel-Ribstein (florence.lautel at gmail.com) -------------------------------------------------------------- Chers collègues, chers amis, C'est avec une profonde tristesse que je vous informe du décès de Pierre Cadiot le mardi 26 novembre. Pierre Cadiot était l'un des plus grands sémanticiens français de ces dernières années. Pour tous ceux qui l'ont connu, c'était aussi un homme inoubliable. Les obsèques auront lieu le vendredi 29 novembre à l'église Saint Sulpice de Paris à 11h. Une journée rassemblant ses amis et collègues sera bientôt organisée. Me contacter. Tristement, Florence Lautel-Ribstein ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:23:38 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:23:38 +0100 Subject: Appel: 15th International Workshop on Non-Monotonic Reasoning (NMR 2014) Message-ID: Date: Wed, 27 Nov 2013 19:21:13 +0100 From: Sébastien Konieczny Message-Id: <00C7780F-381A-4D13-B85E-C7DF91E23C9A at cril.fr> X-url: http://www.kr.tuwien.ac.at/nmr14/ ______________________________________________________________________ CALL FOR PAPERS 15th International Workshop on Non-Monotonic Reasoning (NMR 2014) http://www.kr.tuwien.ac.at/nmr14/ Vienna, Austria, July 17–19, 2014 Co-located with KR 2014 [http://kr.org/KR2014/], DL 2014 [http://www.dbai.tuwien.ac.at/dl2014/], FLoC 2014, and Logic Colloquium 2014. KR 2014 is part of the Vienna Summer of Logic [http://vsl2014.at/] ______________________________________________________________________ * Aims and Scope * The NMR workshop series is the premier specialized forum for researchers in non-monotonic reasoning and related areas. This will be the 15th workshop in this series. Its aim is to bring together active researchers in the broad area of non-monotonic reasoning, including belief revision, reasoning about actions, argumentation, declarative programming, preferences, non-monotonic reasoning for ontologies, uncertainty, and other related topics. NMR will share a joint session with the 27th International Workshop on Description Logics (DL 2014). * Topics * NMR 2014 welcomes the submission of papers broadly centered on issues and research in non-monotonic reasoning. We welcome papers of either theoretical or practical nature. Topics of interest include (but are not limited to): - abductive reasoning and diagnosis, - algorithms and complexity analysis, - argumentation and dialog, - answer-set programming, - belief revision, belief update, and belief merging, - benchmarks for non-monotonic reasoning, - declarative programming for non-monotonic reasoning, - default reasoning, - empirical studies of reasoning strategies, - foundations of non-monotonic reasoning, - hybrid approaches (non-monotonic reasoning combined with other computing paradigms), - inconsistency handling, - implementations and systems, - non-monotonic logics in multi-agent interaction, including negotiation and dispute resolution, - non-monotonic reasoning for ontologies, - reasoning and decision making under uncertainty, - reasoning with preferences, - representing actions and planning, - causal reasoning, and - similarity based-reasoning. * Tracks * To focus the different topics of submissions, the workshop comprises the following thematic tracks: 1. Actions, Causality, and Belief Change; 2. Declarative Programming; 3. Argumentation and Dialog; 4. Preferences, Norms, and Trust; 5. NMR and Uncertainty; 6. Commonsense and NMR for Ontologies; as well as the following special tracks: 7. Systems and Applications; 8. Benchmarks for NMR. * Systems and Applications Track * Recent years witnessed the development of mature solver technology for some NMR based formalisms and, accordingly, successful real-world applications. This track welcomes papers on describing implemented NMR systems as well as papers presenting applications of NMR formalisms and systems. Topics of interest include pure system descriptions (providing information on the basic functionality and usability of the respective systems), the comparison and evaluation of NMR systems, NMR applications in industry and academia, software engineering and modeling methodology aspects, and reports from the field. * Benchmarks for NMR special track * The aim of the Benchmarks for NMR special track is to discuss the construction of benchmarks for NMR. Benchmarks proved useful in a variety of domains in order to develop efficient algorithms and methods. They are for the moment insufficiently developed for main NMR areas. We want to discuss this issue in NMR 2014. Typical questions of interested could be: - How to obtain benchmarks from real application cases? - How to build sensible random benchmarks? - How to export existing benchmarks in some formalism into other domains formalisms? - Etc. Papers related to these issues, description of existing systems of benchmarks, etc., are welcome. * Submissions * Papers should be between 4 and 10 pages in AAAI style (http://www.aaai.org/Publications/Author/author.php) including references, figures, and appendixes if any. System descriptions can typically be on the lower bound of the page range. Papers submission will be handled electronically by means of the easychair system. Papers must be submitted in PDF only. The submission page is available at http://www.easychair.org/conferences/?conf=nmr2014 Papers already published at other conferences and that can be of interest for an NMR audience are welcomed to NMR 2014, provided that the initial publication is mentioned in a footnote on the first page. Submissions will have to indicate to which of the above listed tracks it is intended to belong to, as well as whether it constitutes new research or recently published research. * Proceedings * There are no formal proceedings for NMR. The accepted papers will be published as a technical report and will be made available in the CoRR Computing Research Repository, see http://arxiv.org/corr/home. The copyright of the papers lies with the authors, and as far as NMR is concerned, they are free to submit to other conferences and workshops as well. Similarly, papers already published can be submitted (but this has to be indicated in the submission). * Important Dates * Submission deadline: February 14, 2014 Notification: April 2, 2014 Camera-ready articles due: April 25, 2014 NMR 2014: July 17-19, 2014 * Location * NMR 2014 will be held at the Vienna University of Technology and is part of the Vienna Summer of Logic, http://vsl2014.at/, which will probably be the largest scientific logic event in known history. * Workshop Chairs * Sébastien Konieczny (CNRS, Université d'Artois, France) Hans Tompits (Vienna University of Technology, Austria) Email: nmr14 [at] kr [dot] tuwien [dot] ac [dot] at * Homepage * http://www.kr.tuwien.ac.at/nmr14/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:14:24 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:14:24 +0100 Subject: Stage: Creating and maintaining test validation corpus, Trooclick France Message-ID: Date: Wed, 27 Nov 2013 09:15:56 +0100 From: Dhouha Bouamor Message-ID: Trooclick France is a company that specializes in the development of web applications for the automatic processing of information. Our goal is to create services that rebuild the user’s trust in digital content. Up to now, Web players were able to enhance the relevance of this content; we go a step further and contribute to improve its reliability. Trooclick was created in November 2012. Just a few months later, in April 2013, it received financial support from the BPI (French public investment bank) and in June 2013 the French government granted it the Status of "Young Innovative Company" (JEI), recognizing its innovative nature. It now counts twelve committed and passionate members in its tight-knit team. The company carries out R&D projects in search of technical solutions in the Artificial Intelligence field. Due to its growth, Trooclick is now looking for candidates for a 6 month internship for its office in Paris (17ème). Missions: As a member of the technical team, you will benefit from ongoing training and you will help us design and build our information extraction framework based on advanced NLP technologies. You will turn ideas into well-documented and reliable linguistic resources (both dictionaries and extraction rules) to ensure efficiency, quality, performance and scalability. A great team player, you will interact with other departments to understand and fine tune specifications. You will carry out unitary testing, create and maintain our test validation corpus and participate in editing technical documents. All developments will be done in English. Qualifications: - BSc/MSc - Experience with NLP tools such as Gate, Treetagger, NooJ, Stanford for linguistic annotation, named entity recognition, relationship and fact extraction, sentiment analysis, etc. - Experience in scripting languages such as Perl or Python as well as XML format to be autonomous in completing some technical tasks. - Experience with basic database management operations (SQL language) Knowledge of Semantic Web technologies (RDF, OWL, SKOS, etc.) will be a plus. - Excellent communication skills in English and French - We are open to new ideas that will significantly contribute to our success. Our friendly team will provide the opportunity for valuable collaboration. - We offer you career perspectives in a young and dynamic company with an interesting and diversified scope of duties at the cutting edge of research. We welcome applications from highly motivated individuals able to learn new techniques and share knowledge and experience with the team. Interested? Then send your application to jobs at trooclick.com! ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:27:52 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:27:52 +0100 Subject: Appel: Call for poster proposals, PARSEME COST action meeting, 10-11 March 2014, Athens Message-ID: Date: Fri, 29 Nov 2013 17:27:38 +0100 From: Agata Savary Message-ID: <5298C07A.1050001 at univ-tours.fr> X-url: http://typo.uni-konstanz.de/parseme/index.php/event/meetings/59-2nd-general-meeting-10-11-march-2014-athens X-url: http://www.cost.eu/domains_actions/ict/Actions/IC1207?parties CALL FOR POSTER PROPOSALS COST Action IC1207 PARSEME meeting, 10–11 March 2014, Athens http://typo.uni-konstanz.de/parseme/index.php/event/meetings/59-2nd-general-meeting-10-11-march-2014-athens The second general meeting of the PARSEME COST Action IC1207 (www.parseme.eu) will take place on 10–11 March 2014 in Athens. It will be organized by the Institute for Language and Speech Processing of the Athena Research Center. The meeting will start on Monday 10.03.2014 morning with a plenary session, and will continue on Monday p.m. and Tuesday 11.03.2014 with poster sessions and partly parallel Working Group (WG) sessions. Poster proposals should be related to the scientific program of any of the four Working Groups: WG1: Lexicon/Grammar Interface WG2: Parsing Techniques for MWEs WG3: Statistical, Hybrid and Multilingual Processing of MWEs WG4: Annotating MWEs in Treebanks The presentation of the posters based on selected proposals will be twofold: - a brief presentation (of about 3 minutes) of each poster will be done in a dedicated plenary session, - posters will be displayed in the meeting rooms and a classical poster session will allow for parallel discussions. Submission format: PDF, up to 2 pages (12pt font, 1in margins). Please include your name and affiliation, the title of the poster, and the Working Group concerned. You may refer to results published previously in another venue or journal. Submissions are not anonymous and are open to all researchers and language technology experts from the Action's member countries (http://www.cost.eu/domains_actions/ict/Actions/IC1207?parties). Please send your submissions via e-mail to parseme-steer at chopin.ipipan.waw.pl The final acceptance decisions will be made by the PARSEME Steering Committee. The authors of the selected proposals will be reimbursed for their travel and stay. Important dates: - 10 January 2014: poster submission deadline - 22 January 2014: notifications sent out - 10-11 March 2013: poster sessions and WG sessions Note that there will be no long paper presentations at this meeting. The Working Group sessions will be dedicated mostly to brain-storming and discussion. We are looking forward to your submissions and to an exciting and fruitful meeting! ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:32:20 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:32:20 +0100 Subject: These: Nicolas Foucault, Questions-Reponses en domaine ouvert Message-ID: Date: Fri, 29 Nov 2013 19:04:48 +0100 From: foucault Message-ID: <2857b5a678fb66dda08f361daa06a0df at limsi.fr> Bonjour à toutes et à tous, J'ai le plaisir de vous inviter à ma soutenance de thèse, menée au Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur au sein du groupe Traitement du Langage Parlé et intitulée : "Questions-Réponses en domaine ouvert : sélection pertinente de documents en fonction du contexte de la question". La soutenance se déroulera le lundi 16 décembre 2013 à 14h30 au LIMSI. Cette soutenance sera suivie du traditionnel pot de thèse, vous y êtes chaleureusement conviés. Bien cordialement, Nicolas Foucault -------------------- Se rendre au LIMSI : -------------------- http://www.limsi.fr/Pratique/acces/index.fr.html http://www.limsi.fr/Pratique/acces/index.en.html Compter entre 1h00 et 1h15 depuis Châtelet - Les Halles (Paris) quand tout se déroule sans accroc sur le réseau de la RATP ! ======================= Composition du jury : ======================= [rapporteur] : Pr Pascale SÉBILLOT, PU, IRISA/INSA, Rennes [rapporteur] : Pr Patrice BELLOT, PU, LSIS, Université Aix-Marseille [examinateur] : Pr Thierry BACCINO, PU, LUTIN, Université Paris 8 [examinatrice] : Pr Brigitte GRAU, PU, LIMSI/CNRS, ENSIIE [directrice] : Mme Sophie ROSSET, DR2-CNRS, LIMSI/CNRS [co-directeur] : M. Gilles ADDA, IRHC-CNRS, LIMSI/CNRS ========== Résumé : ========== Les problématiques abordées dans cette thèse sont de définir une adaptation unifiée de la sélection des documents et des stratégies de recherche de la réponse à partir du type des documents et des questions, intégrer la solution au système de Questions-Réponses (QR) RITEL du LIMSI et évaluer son apport. Dans cette thèse, nous développons et étudions une méthode basée sur une approche de Recherche d'Information pour la sélection de documents en QR. Celle-ci s'appuie sur un modèle de langue et un modèle de classification binaire de texte en catégorie pertinent ou non pertinent d'un point de vue QR. Cette méthode permet filtrer les documents sélectionnés pour l'extraction de réponses par un système QR. Nous présentons la méthode et ses modèles, et la testons dans le cadre QR à l'aide de RITEL. L'évaluation est faite en français en contexte web sur un corpus de 500 000 pages web et de questions factuelles fournis par le programme Quaero. Celle-ci est menée soit sur des documents complets, soit sur des segments de documents. L'hypothèse suivie est que le contenu informationnel des segments est plus cohérent et facilite l'extraction de réponses. Dans le premier cas, les gains obtenus sont faibles comparés aux résultats de référence (sans filtrage). Dans le second cas, les gains sont plus élevés et confortent l'hypothèse, sans pour autant être significatifs. Une étude approfondie des liens existant entre les performances de RITEL et les paramètres de filtrage complète ces évaluations. Le système de segmentation créé pour travailler sur des segments est détaillé et évalué. L'évaluation mesure l'impact de la variabilité naturelle des pages web (en taille et en contenu) sur la tâche QR, en lien avec l'hypothèse précédente. En général, les résultats expérimentaux suggèrent que notre méthode aide un système QR dans sa tâche. Cependant, de nouvelles évaluations sont à mener pour rendre ces résultats significatifs, et notamment en utilisant plus de questions d'entraînement. ------------------------------------------------------------------------ "Open domain question-answering : relevant document selection geared to the question" =========== Abstract: =========== This thesis aims at defining a unified adaptation of the document selection and answer extraction strategies, based on the document and question types, in a Question-Answering (QA) context. The solution is integrated in RITEL (a LIMSI QA system) to assess the contribution. We develop and investigate a method based on an Information Retrieval approach for the selection of relevant documents in QA. The method is based on a language model and a binary model of textual classification in relevant or irrelevant category. It is used to filter unusable documents for answer extraction by matching lists of a priori relevant documents to the question type automatically. First, we present the method along with its underlying models and we evaluate it on the QA task with RITEL in French. The evaluation is done on a corpus of 500,000 unsegmented web pages with factoid questions provided by the Quaero program (i.e. evaluation at the document level or D-level). Then, we evaluate the method on segmented web pages (i.e. evaluation at the segment level or S-level). The idea is that information content is more consistent with segments, which facilitates answer extraction. D-filtering brings a small improvement over the baseline (no filtering). S-filtering outperforms both the baseline and D-filtering but not significantly. Finally, we study at the S-level the links between RITEL's performances and the key parameters of the method. In order to apply the method on segments, we created a system of web page segmentation. We present and evaluate it on the QA task with the same corpora used to evaluate the document selection method. This evaluation follows the former hypothesis and measures the impact of natural web page variability (in terms of size and content) on RITEL in its task. In general, our experimental results suggest that our IR-based method helps a QA system in its task, however further investigations should be conducted -- especially with larger corpora of questions -- to make them significant. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:51:25 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:51:25 +0100 Subject: Livre: Langue des signes, surdite et acces au langage Message-ID: Date: Fri, 29 Nov 2013 15:52:34 +0100 From: "Editions du Papyrus" Message-ID: <12145c242fc51c5b835414a628ad3f30 at editions-papyrus.com> LANGUE DES SIGNES, surdité et ACCES AU LANGAGE Les Editions du Papyrus vous présentent la 2e édition revue et augmentée de l'ouvrage "Langue des signes, surdité et accès au langage". Cet ouvrage fait le tour des questions qui se posent au quotidien aux professionnels de la surdité : - la place de la langue des signes dans l’enseignement spécialisé et tout particulièrement dans l’enseignement du français aux jeunes sourds et ipso facto la validité de l’opposition entre pensée visuelle et auditive, - la nature de la grammaire de la langue des signes, - l’interprétation vers ou à partir de la langue des signes dans les contextes pédagogique, culturel ou social et la formation des intervenants auprès des jeunes sourds. Ce livre part de situations concrètes, se nourrit d’exemples pratiques multiples. Il privilégie une approche pragmatique. La clarté de l’exposé permet au lecteur d’aborder la question linguistique -et c’est peut-être la première fois qu’un exposé aussi complet l’aborde ainsi- sans se laisser enfermer dans le débat idéologique qui, en matière de scolarité, oppose les tenants du recours à la langue des signes, au nom de la spécificité et de la culture et les partisans de la méthode orale au nom de la norme commune. L’auteur Interprète en langue des signes dès 1979, formateur d’enseignants auprès des jeunes sourds, Directeur du Master d’interprétation en Langue des signes française de l’Ecole Supérieure d’Interprètes et de Traducteurs, Sorbonne Nouvelle Paris 3, Philippe Séro-Guillaume poursuit une recherche sur des bases constructivistes et psycho-mécaniques de l’activité langagière et de l’interprétation, recherche consolidée par une collaboration depuis une douzaine d’année avec Philippe Geneste enseignant chercheur. © Editions du Papyrus, 2013 2 rue Vincent Van Gogh 93360 Neuilly-Plaisance Tél. 01 46 36 92 53 - Fax 01 43 00 95 29 E-mail : papyrus at editions-papyrus.com Site web : http://editions-papyrus.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA décline toute responsabilité concernant le contenu des messages diffusés sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Nov 3 17:08:11 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 3 Nov 2013 18:08:11 +0100 Subject: Appel: NooJ 2014 International Conference Message-ID: Date: Thu, 31 Oct 2013 23:08:27 +0100 From: "MONTI JOHANNA -Professore associato scienze umanistiche e sociali-d" Message-Id: <20131031215718.M21698 at uniss.it> X-url: http://nooj2014.uniss.it X-url: http://www.nooj4nlp.net/ International Nooj 2014 Conference June 3-5, University of Sassari - Italy Call for Papers http://nooj2014.uniss.it Submission deadline: 1 February 2014 at 24:00 CET (GMT+1) NooJ is a linguistic development environment that allows linguists to formalize several levels of linguistic phenomena: - typography and spelling; - lexicons of simple words, multiword units and discontinuous expressions; - inflectional, derivational and agglutinative morphology; - local and structural syntax; - transformational syntax and paraphrase generation; - semantic analysis and machine translation. For each of these levels NooJ provides linguists with one or more formal tools?specifically designed to facilitate the description of each phenomenon, aswell as parsing/development/debugging tools designed to be as computationallyefficient as possible, from Finite-State to Turing machines. The integrationof all the linguistic levels in one compatible platform distinguishes NooJfrom other computational linguistic frameworks which provide a uniqueformalism, incompatible with others. As a corpus processing tool, NooJ allows researchers in various socialsciences to extract information from corpora by applying sophisticated queriesbased on concepts and relations (rather than word forms) and automaticallybuild concordances, add semantic annotations, and perform statistical analyses. NooJ has been endorsed by the Meta-Share CESAR Project of theEuropean Community, is now available as a JAVA open source package and runsunder Windows LINUX and Mac OSX platforms. NooJ linguistic modules for over 20languages are freely available at www.nooj4nlp.net. The NooJ conference intends to: - give NooJ users and researchers in Linguistics and in ComputationalLinguistics the opportunity to meet and share their experience as developers, researchers and teachers; - present to NooJ users the latest linguistic resources and NLP applications developed for/with NooJ, its latest functionalities, as well as its futuredevelopments; - offer researchers and graduate students two tutorials (one basic and oneadvanced) to help them parse corpora and build NLP applications using NooJ; - provide the occasion to present and discover the recent developments of NooJitself (v3). Topics of interest Linguistic resources: Typography, Spelling, Morphology, Lexical Analysis,Local Syntax, Structural Syntax, Transformational Analysis, ParaphraseGeneration, Semantic annotations, Semantic analysis. Corpus processing: Corpus Linguistics, Information extraction, DiscourseAnalysis, Business Intelligence, NLP applications. Submission of abstracts Please send one abstract (up to 1 page, 400-600 words) in English to https://www.easychair.org/conferences/?conf=nooj2014. The deadline for the submission of the abstracts is February 1st, 2014. Notifications of acceptance will be sent by March 17th, 2014. Scientific Committee Abdelmajid Ben Hamadou (Institut Sup?rieur d'Informatique, Sfax, Tunisia) Xavier Blanco (Autonomous University of Barcelona, Spain) Krzysztof Bogacki (University of Warsaw, Poland) Pierrette Bouillon (University of Geneva, Switzerland) Thierry Declerck (DFKI GmbH, Germany) Svetla Koeva (University of Sofia, Bulgaria) Kimmo Koskenniemi (University of Helsinki, Finland) Peter Machonis (Florida International University, USA) Bernardo Magnini (FBK-Irst, Italy) Slim Mesfar (RIADI, ENSI, University of Manouba, Tunisia) Ruslan Mitkov (University of Wolverhampton, UK) Mario Monteleone (University of Salerno, Italy) Johanna Monti (University of Sassari, Italy) Adam Przepi?rkowski (ICS, Polish Academy of Sciences, Poland) Jan Radimsky (University of South Bohemia, Czech Republic) Max Silberztein (Universit? de Franche-Comt?, France) Marko Tadic (University of Zagreb, Croatia) Fran?ois Trouilleux (Universit? Blaise-Pascal, France) Tam?s V?radi (Hungarian Academy of Sciences, Hungary) Simonetta Vietri (University of Salerno, Italy) Organizing Committee Johanna Monti (University of Sassari, Italy) Max Silberztein (University de Franche-Comt?, France) Mario Monteleone (University of Salerno, Italy) Maria Pia di Buono (University of Salerno, Italy) Marco Javarone (University of Sassari, Italy) Contact For any enquiries regarding the workshop please send an email to Johanna Monti (nooj2014 at uniss.it). Important dates Abstract submission: February 1st. Notification of acceptance: March 17th. Registration starts April 15th. Conference web site: nooj2014.uniss.it ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d??cline toute responsabilit?? concernant le contenu des messages diffus??s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Nov 3 17:04:02 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 3 Nov 2013 18:04:02 +0100 Subject: Job: Ingenieur(e) R&D Traitement Automatique des Langues Polyvalent, XiKO Message-ID: Date: Wed, 30 Oct 2013 23:19:02 +0100 From: Ga?l Patin Message-ID: Ing?nieur(e) R&D Traitement Automatique des Langues Polyvalent XiKO Technologies se lance dans le d?veloppement de sa solution d?analyse de donn?es conversationnelles. Elle recherche pour cela un ing?nieur R&D sp?cialis?e dans le traitement automatique des langues. Nous recherchons de pr?f?rence un profil de type scientifique (Doctorant(e) ou Jeune Docteur(e)) ou ing?nieur R&D. Le/la candidat(e) doit avoir un esprit curieux et ouvert. Il/Elle doit ?tre en capacit? d??mettre et de recevoir des critiques constructives. Pragmatique, il/elle doit ?tre capable d?imaginer des solutions en prenant en compte les contraintes de temps, de complexit? et de ressources disponibles. L?ing?nieur(e) va ?tre techniquement et scientifiquement confront? ? des probl?matiques complexes : techniques de cat?gorisation agiles, syst?mes de gestion rationnelle des ressources linguistiques, remise en cause des paradigmes de normalisation linguistique pour traitement automatique des langues, algorithmique pour la gestion de plusieurs millions de documents, etc. Fonctions : * Aide ? la conception fonctionnelle et technique du syst?me. * Participation ? la conception de technologies innovantes pour l?analyse et la d?couverte d?information dans les textes. * D?veloppement de la solution logicielle. * Soutien au d?veloppement de l?infrastructure technique de l?entreprise. Int?r?ts attendus : * Int?r?t certain pour le Traitement Automatique des Langues en g?n?ral. * Bonne connaissance des techniques de recherche d?information. * Int?r?t pour le web s?mantique et la gestion des connaissances. Comp?tences requises : * D?veloppement Java confirm?, connaissance ?ventuelle de JEE. * Bonnes pratiques dans le d?veloppement des applications (cycles de vie, design pattern, agilit?). * Bonne connaissance syst?me Linux. Exp?riences appr?ci?es : * Syst?me d?indexation (i.e. Solr/Lucence). * Machine Learning (supervis? et non supervis?). * Montage de Webservice type Saas et mise ? l??chelle d?applications en ligne. * Maitrise d?une langue autre que le fran?ais ou l?anglais. Salaire : * A n?gocier selon le profil et l?exp?rience. * Convention CIFRE envisageable. Avantages sociaux : * Mutuelle : excellente couverture avec prise en charge ? 70%. * Ticket Restaurants. Envoyez votre CV ou profil Linkedin et lettre ou mail de motivation ? : contact at xiko.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d??cline toute responsabilit?? concernant le contenu des messages diffus??s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Nov 3 17:05:17 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 3 Nov 2013 18:05:17 +0100 Subject: Appel: Deadline Extension, Elsevier KBS special issue on Big Data for Social Analysis (BDSA) Message-ID: Date: Thu, 31 Oct 2013 11:58:32 +0800 From: Erik Cambria Message-ID: X-url: http://sentic.net/bigdata Apologies for cross-posting, The deadline for the Elsevier KBS special issue on Big Data for Social Analysis (http://sentic.net/bigdata) has been extended to November 22nd. RATIONALE The textual information available on the Web can be broadly grouped into two main categories: facts and opinions. Facts are objective expressions about entities or events. Opinions are usually subjective expressions that describe people's sentiments, appraisals, or feelings towards such entities and events. Much of the existing research on textual information processing has been focused on mining and retrieval of factual information, e.g., text classification, text recognition, text clustering, and many other text mining and natural language processing (NLP) tasks. Little work had been done on the processing of opinions until only recently. One of the main reasons for the lack of study on opinions is the fact that there was little opinionated text available before the recent passage from a read-only to a read-write Web. Before that, in fact, when people needed to make a decision, they typically asked for opinions from friends and family. Similarly, when organizations wanted to find the opinions or sentiments of the general public about their products and services, they had to specifically ask people by conducting opinion polls and surveys. However, with the advent of the Social Web, the way people express their views and opinions has dramatically changed. They can now post reviews of products at merchant sites and express their views on almost anything in Internet forums, discussion groups, and blogs. Such online word-of-mouth behavior represents new and measurable sources of information with many practical applications. Nonetheless, finding opinion sources and monitoring them can be a formidable task because there are a large number of diverse sources and each source may also have a huge volume of opinionated text. In many cases, in fact, opinions are hidden in long forum posts and blogs. It is extremely time-consuming for a human reader to find relevant sources, extract related sentences with opinions, read them, summarize them, and organize them into usable forms. Thus, automated opinion discovery and summarization systems are needed. Big social data analysis grows out of this need and it includes disciplines such as social network analysis, multimedia management, social media analytics, trend discovery, and opinion mining. The opportunity to capture the opinions of the general public about social events, political movements, company strategies, marketing campaigns, and product preferences, in particular, has raised growing interest both within the scientific community. All the opinion-mining tasks, however, are very challenging. Our understanding and knowledge of the problem and its solution are still limited. The main reason is that it is a NLP task, and NLP has no easy problems. Another reason may be due to our popular ways of doing research. So far, in fact, researchers have probably relied too much on traditional machine-learning algorithms. Some of the most effective machine-learning algorithms, in fact, produce no human understandable results such that, although they may achieve improved accuracy, little about how and why is known, apart from some superficial knowledge gained in the manual feature engineering process. All such approaches, moreover, rely on syntactical structure of text, which is far from the way human mind processes natural language. TOPICS Articles are thus invited in area of knowledge-based systems for big social data analysis. The broader context of the Special Issue comprehends artificial intelligence, knowledge representation and reasoning, natural language processing, and data mining. Topics include, but are not limited to: - Knowledge-based systems for big social data analysis - Biologically inspired opinion mining - Concept-level opinion and sentiment analysis - Knowledge-based systems for social media retrieval and analysis - Knowledge-based systems for social media marketing - Social network modeling, simulation, and visualization - Semantic multi-dimensional scaling for sentiment analysis - Knowledge-based systems for patient opinion mining - Sentic computing - Multilingual and multimodal sentiment analysis - Multimodal fusion for continuous interpretation of semantics - Knowledge-based systems for time-evolving sentiment tracking - Knowledge-based systems for cognitive agent-based computing - Human-agent, -computer, and -robot interaction - Domain adaptation for sentiment classification - Affective common-sense reasoning - Knowledge-based systems for user profiling and personalization The Special Issue also welcomes papers on specific application domains of knowledge-based systems for big social data analysis, e.g., influence networks, customer experience management, intelligent user interfaces, multimedia management, computer-mediated human-human communication, enterprise feedback management, surveillance, art. TIMEFRAME November 22nd, 2013: Paper submission deadline December 24th, 2013: Notification of acceptance January 24th, 2014: Final manuscript due April/May, 2014: Publication SUBMISSION AND PROCEEDINGS The Special Issue will consist of papers on novel methods and approaches that further develop and apply knowledge-based techniques in the context of natural language processing and big social data analysis. Some papers may survey various aspects of the topic. The balance between these will be adjusted to maximize the issue's impact. All articles are expected to successfully negotiate the standard review procedures for Elsevier Knowledge-Based Systems. Contributions are invited in the form of original high-quality research and review papers (preferably no more than 20 double line spaced manuscript pages, including tables and figures), following the formatting style for Elsevier. A submission that has already been published in conference proceedings has to be submitted as more than 45% update in comparison to the published version. The title page should not include name, affiliation, and e-mail address of the authors. All paper has to be submitted through thejournal electronic submission EES via the dedicated special issue. ORGANIZERS - Erik Cambria, National University of Singapore (Singapore) - Haixun Wang, Google Research (USA) - Bebo White, Stanford University (USA) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d??cline toute responsabilit?? concernant le contenu des messages diffus??s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sun Nov 3 17:06:57 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sun, 3 Nov 2013 18:06:57 +0100 Subject: Stage: Stage M2 recherche TAL, Lattice Message-ID: Date: Thu, 31 Oct 2013 16:07:59 +0100 From: Isabelle Tellier Message-Id: X-url: http://www.projet-orfeo.fr proposition de stage M2 recherche en informatique/TAL au Lattice (http://www.lattice.cnrs.fr) ? Montrouge (tout pr?s de Paris) Ce stage a pour objectifs de tester et adapter des algorithmes d'apprentissage automatique pour le rep?rage des expressions r?f?rentielles dans des textes ?crits ainsi que pour l'identification des cha?nes de cor?f?rence. Pour ce faire, le travail s'appuiera sur l'exploitation d'un corpus de petite taille, d?j? annot? en r?f?rence et en cor?f?rence (projet MC4, Mod?lisation Contrastive et Computationnelle des Cha?nes de Cor?f?rence). Un premier aspect du travail consistera ? faire passer sur le texte de d?part un ensemble d'outils libres et/ou d?velopp?s ? Lattice : analyse morphosyntaxique, segmentation en chunk, rep?rage d'entit?s nomm?es. Les r?sultats obtenus permettront d'enrichir les donn?es initiales, qui serviront ensuite pour la deuxi?me ?tape, au coeur du sujet, consistant ? tester diff?rentes m?thodes d'apprentissage automatique pour l'identification des expressions r?f?rentielles et des cha?nes de cor?f?rence (plusieurs passes pourront ?tre n?cessaires pour cela). Pour que ce stage de M2 puisse s'op?rer efficacement, le candidat devra avoir des connaissances solides en linguistique de corpus et traitement automatique des langues, des comp?tences pour l'?criture de scripts (PERL, PYTHON, voire JAVA : il faudra traiter des probl?mes de transformation de formats de fichiers) et des connaissances ainsi qu'un int?r?t pour les techniques d'apprentissage automatique. Le stage peut durer de 4 ? 6 mois au sein du Lattice, ? partir de 2014, il sera encadr? par Fr?d?ric Landragin (http://fred.landragin.free.fr) et Isabelle Tellier (http://www.lattice.cnrs.fr/sites/itellier/) et sera financ? (au tarif stage : ? Smic) par le projet ANR Orfeo (http://www.projet-orfeo.fr). envoyer CV + lettre de motivation ? frederic.landragin at ens.fr et isabelle.tellier at univ-paris3.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 20:31:53 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 21:31:53 +0100 Subject: Ecole: Stage NooJ, INALCO, 20-24 janvier 2014 Message-ID: Date: Mon, 4 Nov 2013 12:43:21 +0100 From: Max Silberztein Message-Id: *************************** Stage intensif NooJ ? l?INALCO 20-24 janvier 2014 65 rue des Grands Moulins, 75013 Paris *************************** NooJ est un environnement de d?veloppement utilis? pour formaliser huit niveaux de ph?nom?nes linguistiques : orthographe et typographie, morphologie flexionnelle et d?rivationnelle, syntaxe locale et structurelle, grammaire transformationnelle et analyse s?mantique. NooJ contient des outils informatiques adapt?s ? chaque type de ph?nom?ne (grammaires rationnelles, hors contexte, contextuelles et non restreintes) et permet de d?velopper des ressources ? large couverture dans une perspective de linguistique descriptive. NooJ est utilis? par des linguistes pour formaliser les langues et appliquer les descriptions linguistiques ? des corpus de textes, par des chercheurs en sciences sociales pour effectuer des analyses historiques, litt?raires, sociologiques ou psychologiques de corpus, et aussi par des entreprises pour extraire et annoter des informations scientifiques et techniques, notamment en intelligence ?conomique. NooJ est gratuit, est disponible en open source JAVA et fonctionne sous Windows, Mac OSX, LINUX et Unix cf. www.nooj4nlp.net. Le stage s?adresse particuli?rement aux ?tudiants de Master, doctorants et chercheurs int?ress?s par la linguistique descriptive et la linguistique de corpus ainsi que par l?analyse automatique de textes dans une perspective de sciences humaines et industrielle. Les ?tudiants en Master qui peuvent et d?sirent valider le stage aupr?s de leur universit? doivent me pr?venir d?s leur inscription. Le stage est gratuit et dure une semaine. **** ATTENTION **** : les places sont limit?es : il faut s?inscrire en envoyant son nom, son statut (?tudiant / doctorant / chercheur / industriel / autre) et le nom de son institution ? : max.silberztein at univ-fcomte.fr. Les matins sont d?di?s au cours et aux travaux dirig?s ; pendant les apr?s-midis, des chercheurs et doctorants pr?senteront diverses applications de NooJ en linguistique, en science sociale et dans le monde industriel. Voici le programme : Lundi 20 janvier 9H-12H30 : Fouille de texte : textes et corpus, requ?tes et concordances, analyses statistiques. 14H-16H : Deux conf?rences Mardi 21 janvier 9H-12H30 : Lexique & morphologie : Unit?s Linguistiques Atomiques, dictionnaires, flexion et d?rivation. 14H-16H : Deux conf?rences Mercredi 22 janvier 9H-12H30 : Syntaxe locale : requ?tes syntaxiques, grammaires locales, annotation automatique de textes, extraction d?entit?s nomm?es. 14H-16H : Deux conf?rences Jeudi 23 janvier 9H-12H30 : Syntaxe structurelle : Grammaires hors contexte, contraintes d?accord et arbres structurels. 14H-16H : Deux conf?rences Vendredi 24 janvier 9H-12H30 : S?mantique : Analyse transformationnelle et g?n?ration de paraphrase automatique, lev?e d?ambigu?t? s?mantique, traduction 14H-16H : Deux conf?rences ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 21:02:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 22:02:04 +0100 Subject: Seminaire: Centre d'Alembert, Programme 2013-2014 Message-ID: Date: Tue, 5 Nov 2013 11:20:58 +0100 From: Centre d'Alembert Message-Id: X-url: http://www.centre-dalembert.u-psud.fr Bonjour, Nous sommes heureux de vous annoncer le nouveau programme de s?minaires du Centre d'Alembert, pour l'ann?e 2013-2014 : "Les sciences comme biens communs" La notion de ? biens communs ? renvoie ? l'id?e d'une ressource relevant d'une appropriation, d'un usage et d'une exploitation collectifs. Il s'agit donc d'un ensemble de biens, pas n?cessairement mat?riels - il peut par exemple s'agir d'une culture, de m?thodes de pens?es, de fa?ons d'agir, de savoirs divers - qui appartiennent ? une communaut? ou dont une communaut? a un usage partag?. Ce partage d'une ressource collective implique l'id?e de r?gles d'acc?s qui permettent la pr?servation de la ressource et garantissent son usage commun. La notion de ? biens communs ? renvoie donc aussi ? la question de la gestion d?mocratique de ces biens. Qu'est-ce qui dans les sciences, dans leur pluralit? d'objets, de disciplines, peut faire ? biens communs ?? Le s?minaire de cette ann?e sera l'occasion de r?fl?chir ? ce qui, dans les pratiques disciplinaires, et/ou dans l'usage social qui est fait des productions scientifiques, rel?ve ou non de ces diff?rents aspects de la notion de ? biens communs ?. Nous nous demanderons, par exemple, si nous pouvons comprendre nos diff?rentes disciplines comme ? culture ? et si cette culture devient un ? bien commun ?. Et si les sciences et les savoirs qu'elles produisent sont des ? biens communs ?, quelles cons?quences cela a-t-il pour un ? usage social ? de la science comme ? biens communs ? ? Premi?re s?ance le mercredi 20 novembre. Programme d?taill? mis ? jour et contact : Web : http://www.centre-dalembert.u-psud.fr M?l. : centre.dalembert at u-psud.fr Les s?ances ont lieu ? la Facult? des Sciences d'Orsay, b?timent des colloques (338) de 13h45 ? 15h45 (entr?e libre) Acc?s : http://goo.gl/maps/cXezZ -------------------------------- S?ance du mercredi 20 novembre 2013 "LES MATH?MATIQUES : DES BIENS COMMUNS ?" Bernard BRU Ancien professeur de math?matiques ? l'Universit? Paris 5, sp?cialiste d'histoire du calcul des probabilit?s et de la statistique. Jeu de d?s et biens communs On pr?sentera rapidement le calcul des probabilit?s et ses applications, avec un point de vue d'historien. On se demandera ensuite dans quelle mesure et de quelles fa?ons la th?orie des probabilit?s peut ?tre profitable ? la nation en g?n?ral et ? chacun de ses citoyens en particulier. On ?voquera ? ce propos les th?ses classiques de Condorcet sur le r?le du calcul dans la recherche de la v?rit? et de la justice. Pierre PANSU Professeur ? l'Universit? Paris-Sud, Laboratoire de Math?matiques d'Orsay. Les Math?matiques pour la Plan?te Terre en partage. A l'aide de quelques pages du site mpt2013.fr, on d?crira la gen?se de progr?s math?matiques r?cents qui ont eu un impact direct sur la soci?t?. D'autres sciences y sont m?l?es indirectement, ce qui nous conduira ? un second constat : la construction du savoir math?matique n'est pas r?serv?e aux math?maticiens, elle est partag?e. Animateur de la s?ance : Yves LE JAN Laboratoire de Math?matiques d'Orsay, Universit? Paris-Sud -------------------------------- Dates 2013-2014 : - 20/11/2013 - 04/12/2013 - 18/12/2013 - 15/01/2014 - 29/01/2014 - 12/02/2014 - 13/03/2014 - 26/03/2014 - 09/04/2014 NB : Nous vous invitons ? consulter r?guli?rement notre site Internet, des modifications pouvant intervenir, en cas de force majeure, dans la planification. Nous vous remercions pour l'int?r?t que vous portez aux activit?s du Centre. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 20:57:29 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 21:57:29 +0100 Subject: Stage: stage M2 en TAL, Syllabs (Paris) Message-ID: Date: Tue, 5 Nov 2013 12:38:59 +0100 From: Helena Blancafort Message-ID: ------------------------------------------------------------------------ Offre de stage M2 en TAL ? Syllabs (Paris) ------------------------------------------------------------------------ ------------------------------------------------------------------------ Caract?risation des objets touristiques pour l'extraction de facettes dans le tourisme ------------------------------------------------------------------------ Syllabs travaille depuis un certain temps sur des outils de TAL appliqu?s au tourisme, que ce soit dans un contexte de web mining, de text mining ou de production de contenus.Dans le cadre de Tourinflux, projet de recherche multi-partenaire en cours, Syllabs doit produire des bases de connaissances se rapportant ? des objets touristiques (h?tels, etc.). Ce projet vise ? apporter aux acteurs du tourisme (d?abord les institutionnels mais aussi les acteurs priv?s) un ensemble d?outils leur permettant de g?rer ? la fois leurs donn?es internes et les informations disponibles sur le web afin de mieux comprendre comment un territoire est per?u et de mieux agir sur cette perception. C?est dans ce contexte que se situe le stage. Celui-ci comporte plusieurs ?tapes et objectifs. La dur?e du stage ne permettra peut-?tre pas de tout couvrir. ---------------------------- Descriptif du stage ---------------------------- 1) Mod?lisation d?une base de connaissances des objets touristiques - Cr?er une taxonomie (simple) des diff?rents objets touristiques et ?tudier les facettes communes ? plusieurs objets. - D?terminer les facettes utilisables pour la g?n?ration automatique des descriptifs - D?terminer les facettes n?cessaires pour l?analyse d?avis d?internautes 2) Extraction des facettes via LOL (outil d?di? ? base de r?gles linguistiques) - Extraction des facettes pr?sents dans les ?descriptifs marchands? - Extraction des facettes pr?sents dans les ?avis internautes? 3) Cr?ation de la base ? partir de la sortie d?extraction - Cr?er une base de donn?es ? partir de la sortie d?extraction, manipulation des objets extraits 4) G?n?ration de descriptifs d?objets touristiques - ?crire des r?gles de g?n?ration pour 2 objets touristiques diff?rents en fonction de la base obtenue ------------------------ Profil souhait? ------------------------ - Aptitude pour la repr?sentation formelle du langage. - Excellente capacit? de communication et aptitude pour le travail d??quipe. - Bon niveau en python serait un plus. - Excellentes qualit?s r?dactionnelles, go?t pour l??criture. Formation en cours : Linguistique Informatique, TAL ou similaire. Dur?e du stage : 6 mois (d?but entre janvier et avril, en fonction du cursus universitaire) Merci d?envoyer votre candidature ? l?adresse jobs at syllabs.com en indiquant dans l?objet du m?l ? Stage TAL ?. Lieu : Syllabs, 26 rue Notre Dame de Nazareth, 75003 Paris. Contrat : stage conventionn? r?mun?r? en fonction du niveau d??tude. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 20:59:09 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 21:59:09 +0100 Subject: Appel: ESWC 2014 Message-ID: Date: Tue, 5 Nov 2013 17:39:31 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131105163951.CF3D6F986B at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/call-workshops ** apologies for cross-posting ** ==== Second Call for Workshops ==== http://2014.eswc-conferences.org/important-dates/call-workshops The organizers of the 11th ESWC 2014 cordially invite you to submit a workshop proposal. ESWC is a major venue for discussing the latest scientific results and innovations in the field of semantic technologies on the Web and Linked Data, attracting a high number of high quality submissions and participants from academia and industry alike. Co-located workshops at ESWC conferences are distinguished meeting points for discussing ongoing work and latest ideas related to semantic technologies and the Semantic Web. Of particular interest are workshop proposals with an interdisciplinary standpoint, proposals focusing on a specific technology of general interest, or gathering a sub-community. We encourage the submission of workshop proposals on: * Fundamental problems of the Semantic Web / Linked Data such as ontology mining, heterogeneity, scalability and distribution, uncertainty, etc. * Applications of Semantic Web technologies in specific domains, * Important enabling technologies and their adaptation to the needs of the Semantic Web, and * Aspects of Semantic Web research that have been neglected so far, * Techniques from other research fields that are of relevance for Semantic Web research (e.g., machine learning, NLP, data mining) # General Information and Criteria Each proposal will be reviewed by the members of the workshop programme committee, and ranked based on the overall quality of the proposal and the workshop's fit to the conference as detailed below. Their recommendation will determine the final decision on the acceptance/rejection of each proposal, which is to be taken by the workshop and tutorial chairs as well as by the local and the general chair of ESWC 2014. The criteria for judging the quality of workshop proposals are as follows: * Co-located workshops cover topics falling in the general scope of the ESWC conference. * Workshops are intended to be genuine interactive events and not mini-conferences. * We welcome workshops with creative structures and organizations that attract various types of contributions and ensure rich interactions. * Workshops should have a clear focus on a specific technology, problem or application. * There is potentially a significant community interested in the workshop's topic. * Workshop duration can be half a day or a full day. * We strongly advise having more than one organizer and no more than four, preferably from different institutions, bringing different perspectives to the workshop topic. In case overlapping workshops are proposed, the workshop chair may contact the organisers to discuss the possibility of merging workshops. Please note that the duration of a workshop might need to be adjusted based on the overall number of submissions received. Further, workshops that receive less than 5 submissions or have less than 10 people registered at the early registration deadline might be canceled. The organizers of accepted workshops will be responsible for their own reviewing process, publicity (e.g., website, timelines and call for papers), and proceedings production. They will be required to closely cooperate with the Workshop Chair and the ESWC 2014 local organizers to finalize all organizational details. Workshop attendees must pay the ESWC 2014 workshop registration fee, as well as the conference registration fee. Organizers of workshops and tutorials will get a free registration for workshops and tutorials at the pre-conference days, i.e. they will only have to pay the main conference fee. # Important Dates Workshop proposals due: Nov 22, 2013 - 23:59 Hawaii Time Notification of acceptance: Dec 6, 2013 - 23:59 Hawaii Time Workshop Web site due: Dec 16, 2013 - 23:59 Hawaii Time Workshop camera-ready proceedings due: Apr 25, 2014 - 23:59 Hawaii Time Workshop days: May 25 and May 26, 2014 # Suggested Timeline for Workshops Submission deadline: March 6, 2014 Notifications: April 1, 2014 Camera ready version: April 15, 2014 # Submission Guidelines Workshop proposals have to be submitted via Easychair. Each proposal must consist of a single PDF document written in English, not longer than 3 pages, which contains the following information: 1. The title and brief technical description of the workshop, specifying its goals and motivation. 2. A brief discussion of why the topic is of particular interest at this time. 3. A brief description of why and to whom the workshop is of interest, the workshop audience, as well as the expected number of participants. 4. A brief description (draft outline) of the proposed workshop format, discussing the mix of events and activities such as paper presentations, invited talks, panels, hacking session, or general discussion, and and an approximate timeline. 5. A list of (potential) members of the program committee (at least 50% have to be known and confirmed at the time of the proposal). 6. An indication of whether the workshop should be considered for a half-day or full-day event. 7. Related Workshops and Conferences: Is this the continuation of a workshop series or a new workshop to address an emerging issue? Please provide information about past versions of this workshop and other related workshops (including URLs and submission/acceptance counts, if available). 8. Names and contact information of the workshop organizers/chair(s) (name, affiliation, email address, homepage and short (one paragraph) biography of each chair, explaining the chair's expertise for the workshop including past experience in organizing/facilitating workshops). Preferably a single contact person per submission. The best papers of each workshop will be included in the supplementary proceedings of ESWC 2014, which will appear in the Springer LNCS series. # Workshop Chair Harald Sack (Hasso-Plattner Institute for IT Systems Engineering, DE) email: harald.sack at hpi.uni-potsdam.de # Programme Committee Abraham Bernstein (University of Zuerich, CH) Chris Bizer (University of Mannheim, DE) Jerome Euzenat (INRIA Grenoble Rhone-Alpes, FR) Dieter Fensel (University of Innsbruck, AT) Aldo Gangemi (CNR Institute of Cognitive Sciences and Technology, IT) Asuncion Gomez-Perez (Universidad Politecnica de Madrid, ES) Frank van Harmelen (VU University Amsterdam, NL) Manfred Hauswirth (DERI, National University of Ireland, Galway, IE) Pascal Hitzler (Kno.e.sis Center, Wright State University, Dayton, US) Enrico Motta (The Open University, Milton Keynes, UK) Rudi Studer (Karlsruhe Institute of Technology, DE) From thierry.hamon at UNIV-PARIS13.FR Tue Nov 5 20:45:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 5 Nov 2013 21:45:03 +0100 Subject: Info: assemblee generale Consortium Corpus Ecrits, 22 novembre 2013, Paris Message-ID: Date: Mon, 04 Nov 2013 14:42:17 +0100 From: Secretariat General Message-ID: <5277A439.7070809 at ling.cnrs.fr> X-url: http://corpusecrits.corpus-ir.fr/ *Consortium ? Corpus ?crits ?* *Assembl?e g?n?rale du 22 novembre 2013* ILF - Paris, le 4novembre 2013 Ch?res Coll?gues, ChersColl?gues, Nous organisons notre r?union pl?ni?re annuelle le vendredi 22 novembre 2013, de 9h30 ? 18h,? l'INALCO, 62 rue des Grands Moulins ? Paris dans le 13^?me arrondissement. Cette r?union sera consacr?e ? la pr?sentation de notre bilan et aux perspectives. *_PROGRAMME_*__ - Pr?sentation - Bilans par th?mes des r?alisations - Pr?sentation des actions des groupes de travail - Formations r?alis?es et/ou n?cessaires - Pr?sentation de l'Initiative Corpus de r?f?rences du Fran?ais - Appel d'offres 2014 : Quels crit?res, quelles th?matiques, quel budget ? - Quelles attentes, quels projets en 2014 et 2015 pour le Consortium Corpus Ecrits La participation de toutes les personnes int?ress?es par cette journ?e est vive ment encourag?e par le comit? de pilotage, qu'elles soient ou non inscrites ? un groupe de travail. Si la participation ? ces journ?es est libre, l'inscription est obligatoire et tr?s rapide. Il vous convient de vous enregistrer en vous connectant ? : http://french.jotform.com/form/32943348795872 Le consortium peut contribuer au financement des missions des participants actifs des groupes de travail. Au plaisir de vous accueillir nombreux ce 22 novembre 2013, Pour le comit? de pilotage du Consortium ? Corpus ?crits ? Franck Neveu, Directeur de l'ILF http://corpusecrits.corpus-ir.fr/ Le comit? de pilotage du Consortium ? Corpus ?crits ? : Franck Neveu pour l'ILF, FR 2393 - Porteur du consortium Sylvie Archaimbault pour HTL - UMR 7597 - Universit? Denis Diderot - Paris 7 Thierry Chanier pour le LRL - EA 999 - Universit? Blaise Pascal - Clermont-Ferrand Serge Heiden pour ICAR - UMR 5191 - Universit? Lumi?re Lyon 2 V?ronique Magri pour BCL - UMR 6039 - Universit? Nice Sophia Antipolis Jean-Marie Pierrel pour l'ATILF - UMR 7118 - Nancy - Universit? Cl?ment Plancq pour le LLF - UMR 7110 - Universit? Denis Diderot - Paris 7 C?line Poudat pour le LDI - UMR 7187 - Universit? de Paris 13 Beno?t Sagot pour ALPAGE - INRIA- Universit? Denis Diderot - Paris 7 Rudolph Sock pour LILPA - EA 1339 - Universit? de Strasbourg Agn?s Tutin pour le LIDILEM - EA 609 - Universit? Grenoble 3 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:43:22 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:43:22 +0100 Subject: Appel: VitrineHN/DHShowcase 2014, Montreal Message-ID: Date: Wed, 6 Nov 2013 18:59:22 -0500 From: Louis Chartrand Message-ID: X-url: http://www.lanci.uqam.ca/DHShowcase/ ??????????????? *English follows* *Appel d'activit? ? VitrineHN 2014* Les technologies num?riques d?ferlent sur les sciences sociales et les lettres, apportant avec elles l'espoir des grands changements. Cependant, sous la surface des avanc?es prometteuses en termes de d?mocratisation du savoir et de facilitation du travail de recherche, le potentiel de l'informatique en nos disciplines est largement inexplor?. Aussi ces eaux sont-elles le domaine privil?gi? de la cr?ativit? et de l'audace. La VitrineHN est un espace informel o? les chercheur?ses des humanit?s num?riques peuvent partager leur ing?niosit?, et r?inventer ensemble la fa?on dont les lettres et les sciences sociales seront ?tudi?es, enseign?es et appr?ci?es. Format Cette ann?e, VitrineHN vous demande de faire une affiche, que vous devrez exposer dans une pr?sentation-?clair de 5 minutes, qui sera suivie d'une p?riode de questions. Apr?s un blitz de pr?sentations, les participant? es seront invit?es discuter des affiches en prenant bouch?es et raffraichissements. La prochaine ?dition de VitrineHN aura lieu ? l'UQAM (Montr?al) le vendredi 24 janvier 2014. Inscription Vous travaillez dans les humanit?s num?riques ? Que votre projet soit bien achev? ou en d?veloppement, qu'il s'agisse d'application ou de th?orie, on veut vous entendre ! Inscrivez-vous maintenant ! (http://www.lanci.uqam.ca/DHShowcase/inscription.html) *Date limite* : vendredi 20 d?cembre 2013 *Adresse *: http://www.lanci.uqam.ca/DHShowcase/ * * * *Call for papers ? DHShowcase 2014* As digital technologies are pouring out on the shores of social science and humanities, they are bringing about promises of change and improvements. However, despite impressive progress in democratizing content and facilitating research, the potential of computers remains largely underdeveloped. As such, these waters are full of opportunities for audacious and creative people. DHShowcase is an informal space where digital humanities students and researchers are invited to share their ingeniosity, and reinvent the way we study and enjoy social science and humanities. Format In this 2014 edition, DHShowcase invites you to make a poster and present your research in 5 minutes (followed with a short question period). After a blitz of presentations, participants will be invited to discuss posters with snacks and beverages. DHShowcase will be held in UQAM, Montr?al, on Friday, January 24, 2014. Submissions You or your team are working with the digital humanities? Whether your project is complete or in development, whether it is application or theory, we want to hear about it! Please submit a proposition ! (http://www.lanci.uqam.ca/DHShowcase/inscription.en.html) *Deadline* : December 20, 2013 *URL *: http://www.lanci.uqam.ca/DHShowcase/index.en.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:15:01 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:15:01 +0100 Subject: Job: CDD 18 mois Extraction d'entites specifiques (Apprentissage, Desambiguisation et Linking), CEA LIST Message-ID: Date: Thu, 07 Nov 2013 17:16:33 +0100 From: Message-ID: Le Laboratoire de Vision et d'Ing?nierie des Contenus du CEA LIST emploie une cinquantaine chercheurs et ing?nieurs travaillant sur l'analyse et l'interpr?tation de donn?es multim?dia (texte, image et analyse de vid?os). Le LVIC d?veloppe des algorithmes robustes pour l'extraction, l'analyse et le filtrage de grands volumes de donn?es multim?dia (texte, image, vid?o). La fusion de ces media permet une meilleure interpr?tation ou compr?hension des sc?nes ou des documents. Nos technologies ont contribu? ? l'?mergence de nouvelles activit?s ?conomiques. En effet, ces technologies ont permis la cr?ation de startups comme Senseetive ou Ant?Inno. Par ailleurs, le laboratoire participe ? de nombreux projets collaboratifs (ANR, Europe FP7, P?le de Comp?titivit?) avec des partenaires acad?miques, PMEs ou grands industriels. Dans le cadre de plusieurs projets de la th?matique "Traitement Automatique des Langues", le laboratoire LVIC recherche un ing?nieur pour assister les chercheurs du laboratoire dans la conception, l'impl?mentation et l??valuation de modules logiciels pour l?identification et le typage d?entit?s nomm?es. Les objectifs sont plus pr?cis?ment : - int?grer plusieurs mod?les d?identification et de typage d?entit?s nomm?es : mod?le ? base de r?gles (d?j? impl?ment? dans le laboratoire) et mod?le fond? sur un apprentissage statistique; - int?grer des bases de connaissances existantes de type encyclop?dique (DBPedia, Geonames, etc.) dans ces mod?les d?identification et de typage d?entit?s en g?rant le probl?me du passage ? l??chelle ; - d?velopper des m?thodes permettant d?identifier dans les textes des entit?s pr?sentes dans une base de connaissances de r?f?rence et de lever les ?ventuelles ambigu?t?s de rattachement lors de cette identification (entity linking) Le candidat devra candidat devra poss?der une bonne ma?trise du d?veloppement en C++ sous Linux (base de code install?e de plusieurs centaines de milliers de lignes) et conna?tre (ou ?tre capable de se familiariser rapidement avec) des biblioth?ques telles que STL, Xerces-C, Boost, gSoap, etc. Les comp?tences requises incluent ?galement la ma?trise de principes de conception de type Design Patterns et d'outils d?veloppement tels que tels que gdb, valgrind, etc. Enfin, une connaissance des techniques du TAL (Traitement Automatique des Langues) ou des techniques d'apprentissage et de classification (SVM, CRF, etc.) est consid?r?e comme fortement souhaitable. Le poste propos? est un CDD de 18 mois, r?mun?r? selon les grilles de salaire du CEA (d?pendant de la formation et de l'exp?rience). Il sera bas? sur le centre Nano'Innov, situ? pr?s du Campus de l??cole Polytechnique ? Palaiseau (91). Contact: Faiza GARA Email : faiza.gara at cea.fr Tel : 01 69 08 01 48 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:04:47 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:04:47 +0100 Subject: Appel: CORIA / CIFED 2014, Semaine du document numerique Message-ID: Date: Fri, 8 Nov 2013 10:55:30 +0100 From: Patrice Bellot Message-Id: <0134BFB9-49DF-4045-8D24-0460F40CC491 at univ-amu.fr> X-url: http://sdnri2014.loria.fr Semaine du Document Num?rique et de la Recherche d'Information http://sdnri2014.loria.fr Date : 19-21 mars 2014 Lieu : Nancy L'ARIA (Association francophone de Recherche d'Information et Applications) et le GRCE (Groupement de Recherche en Communication ?crite) ont d?cid? d'organiser simultan?ment les conf?rences CORIA et CIFED dans le cadre de la semaine du document num?rique et de la recherche d?information (SDNRI) en mars 2014 ? Nancy. CORIA et CIFED sont les points de rassemblement des communaut?s francophones respectivement en recherche d'information et en analyse de l'?crit et des documents num?ris?s. Tout en pr?servant les sp?cificit?s de chaque conf?rence, cette ?dition constituera une opportunit? pour les deux communaut?s de se retrouver autour de th?matiques pour lesquelles il existe des synergies de recherche (recherche de documents multim?dia, mod?le d'interaction avec l'utilisateur, passage ? l'?chelle de syst?me de recherche de d'information, outils d'?valuation de performance pour la recherche d'information). L'objectif est le rassemblement de plus de 120 participants autour de sessions th?matiques, sp?cifiques et communes. Pendant la conf?rence CIFED-CORIA 2014 seront ?galement organis?es les Rencontres Jeunes Chercheurs (RJC) en recherche d'information et en analyse de l'?crit et des documents num?ris?s. Elles ont pour objectif de permettre ? tous les doctorants de pr?senter leur probl?matique de recherche, d??tablir des contacts avec des ?quipes travaillant sur des domaines similaires ou connexes, et d?offrir ? l?ensemble de la communaut? un aper?u des axes de recherche actuels. Les travaux s?lectionn?s pour les RJC donneront lieu ? une pr?sentation orale et sous forme de poster. Les soumissions conjointes RJC et CIFED-CORIA sont autoris?es. ============================================= Th?matiques CIFED - Th?orie et mod?les pour la reconnaissance de formes en ?crit et document - M?thodes d?analyse d?images, de segmentation et de reconnaissance de l??crit - Num?risation, acquisition et compression - Analyse de dessins, plans, cartes, reconnaissance de graphiques, formules math?matiques - Traitement de documents en ligne, multim?dia et web - Architectures mat?rielles et logicielles pour l?analyse d?images et la reconnaissance des formes - Extraction et structuration d?informations graphiques, manuscrites, structur?es - Indexation de grandes base d?images de documents (biblioth?ques, archives, formulaires, ?) - Recherche/fouille d?information dans les images de documents et les ?crits - Interrogation par l?exemple (CBIR, word spotting, symbol spotting, ...) - Reconnaissance de symboles, de l??crit, des structures - O.C.R. et d?mat?rialisation - Format et codage des documents et plasticit? des documents - Encre ?lectronique, nouvelles modalit?s d?acquisition et d?interaction - Interaction multipoints en conception de documents structur?s - Camera-OCR, nouveaux dispositifs mobiles, ... - Reconnaissance de textes incrust?s dans les vid?os - Reconnaissance de textes dans les sc?nes naturelles - Identification, authentification des ?critures et des signatures manuscrites - ?valuation de performances ============================================= Th?matiques CORIA - Th?orie et mod?les formels pour la RI : mod?le logique, mod?les de langages - Multilinguisme : Recherche d?information multilingue, traduction automatique - Multim?dia (images, audio, vid?os, son, musique) : indexation, navigation, acc?s, interactions avec le texte, recherche d?information cross-m?dia, fusion des informations - Passage ? l??chelle : indexation, performances, architectures - Classification automatique, clustering, ranking, apprentissage automatique - Filtrage, routage, d?tection de nouveaut?s - Mod?lisation du contexte, personnalisation - Traitement Automatique de la Langue Naturelle pour la recherche d?information - Syst?mes de Questions R?ponses - Extraction d?informations : ontologies, ressources et recherche d?informations, d?tection d?entit?s nomm?es et des relations - Web : grands graphes, utilisation de la topologie du web, lois de puissances, citations, analyse de liens - RI et documents structur?s : RI et XML, RI pr?cise et recherche de passages - R?seaux sociaux : analyse de blogs et de sites communautaires, suivi de conversations, analyse de rumeurs, analyse de sentiments, d?tection d?opinion et des styles de vie - Recherche collaborative : filtrage, syst?mes de recommandation - Interaction utilisateur : interrogation flexible, interfaces, visualisation, mod?lisation de l?utilisateur, accessibilit?, indexation collaborative - Traitement et repr?sentation des connaissances : logique floue, m?tadonn?es, ontologies, web s?mantique, web de donn?es, ing?nierie des connaissances - Biblioth?ques num?riques : RI sur des livres num?ris?s, robustesse, OCR et indexabilit? - Syst?mes de recherche d?information d?di?s : recherche d?information g?nomique, g?ographique - RI distribu?e : recherche d?information mobile, situ?e, P2P - Outils pour la recherche d?information : ?valuation, bancs d?essais, m?triques, exp?rimentations qualitatives des syst?mes Soumission des articles Les soumissions peuvent ?tre faites en anglais ou en fran?ais. Les contributions peuvent concerner des travaux acad?miques ou des applications industrielles. Les textes de communications doivent comporter 16 pages maximum pour les soumissions ? CIFED et CORIA et 10 pages maximum pour les journ?es RJC. Les articles soumis ou r?cemment accept?s ? des conf?rences internationales sont recevables, sous r?serve qu?ils soient traduits et adapt?s pour CORIA ou CIFED. Une version ?tendue des meilleurs articles sera publi?e dans une revue ou dans un livre. ============================================= Dates importantes - Soumission des articles : 15 d?cembre 2013 - R?ponse aux auteurs : 15 janvier 2014 - D?p?t des articles d?finitifs : 15 f?vrier 2014 - Conf?rence : mercredi 19-21 mars 2014 Pr?sidents des comit?s de programme CORIA-CIFED - Marie-Francine Moens (Computer Science, KU Leuven, Belgique) - Christian Viard-Gaudin (IRCCyN - Universit? de Nantes) Pr?sidents du comit? de programme RJC - Ha?fa Zargayouna, LIPN, Universit? Paris 13 - Oriol Ramos-Terrades, Universitat Aut?noma de Barcelona Pr?sident du comit? d?organisation - Salvatore-Antoine Tabbone, LORIA-Universit? de Lorraine Vous trouverez sur le site http://sdnri2014.loria.fr toutes les informations sur les th?matiques sp?cifiques et communes des conf?rences. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:23:40 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:23:40 +0100 Subject: Appel: The 37th Annual ACM SIGIR 2014 conference, Gold Coast Australia, July 6-11 Message-ID: Date: Wed, 6 Nov 2013 10:00:52 +1000 From: Richi Nayak Message-ID: X-url: http://sigir.org/sigir2014/ CALL FOR PAPERS, Submission Due: JAN 27, 2014 ACM SIGIR 2014: THE 37th ANNUAL CONFERENCE 6-11 July, 2014, Gold Coast, Australia Conference website: http://sigir.org/sigir2014/ SIGIR is the major international forum for the presentation of new research results and for the demonstration of new systems and techniques in the broad field of information retrieval (IR). The Conference and Program Chairs invite all those working in areas related to IR to submit original papers for review. SIGIR 2014 welcomes contributions related to any aspect of IR theory and foundation, techniques, and applications. Relevant topics include, but are not limited to: TOPICS * Document Representation and Content Analysis (e.g., text representation, document structure, linguistic analysis, NLP for IR, cross- and multi-lingual IR, information extraction, sentiment analysis, clustering, classification, topic models, facets, text streams) * Queries and Query Analysis (e.g., query intent, query suggestion and prediction, query representation and reformulation, query log analysis, conversational search and dialogue, spoken queries, summarization, question answering) * Retrieval Models and Ranking (e.g., IR theory, language models, probabilistic retrieval models, learning to rank, combining searches, diversity and aggregated search) * Search Engine Architectures and Scalability (e.g., indexing, compression, distributed IR, P2P IR, mobile IR, cloud IR) * Users and Interactive IR (e.g., user studies, user and task models, interaction analysis, session analysis, exploratory search, personalized search, social and collaborative search, search interface, whole session support) * Filtering and Recommending (e.g., content-based filtering, collaborative filtering, recommender systems) * Evaluation (e.g., test collections, experimental design, effectiveness measures, session-based evaluation, simulation) * Web IR and Social Media Search (e.g., link analysis, click models/behavioral modeling, social tagging, social network analysis, blog and microblog search, forum search, community-based QA, adversarial IR and spam, vertical and local search) * IR and Structured Data (e.g., XML search, ranking in databases, desktop search, entity search) * Multimedia IR (e.g., image search, video search, speech/audio search, music search) * Other Applications (e.g., digital libraries, enterprise search, genomics IR, legal IR, patent search, text reuse, new retrieval problems) CONTRIBUTION TYPES * Full papers (10 pages), Short papers (4 pages), Demos (3 pages), Tutorials, Workshops INSTRUCTION Requirements for paper format and appropriate content are described in the content guidelines. The requirements will be strictly enforced. Papers which do not conform to the requirements may be rejected without review, so please be sure to read this page carefully. SIGIR 2014 solicits proposals for tutorials of either half-day (3 hours plus breaks) or full day (6 hours plus breaks) on all topics of information retrieval and its applications. Each tutorial should cover a single topic in detail. Submissions should include a cover sheet and an extended abstract. Proposals for workshops to be held at ACM SIGIR 2014 are also solicited. Workshops will usually last for one day and will be held on Friday 11th July 2014. IMPORTANT DATES * 20 January 2014: Abstracts for full research papers due * 27 January 2014: Full research papers due * 3 February 2014: Workshop proposals due * 17 February 2014: Short paper, demonstration, and tutorial submission deadline * 18 April 2014: Paper, short paper, tutorial, and demonstration acceptance notifications * 11 May 2014: Camera ready copy due (note the short timeline due to early conference date) * 16 May 2014: Early bird registration deadline ORGANIZERS * General Chairs: Shlomo Geva, Andrew Trotman * PC Chairs: Peter Bruza, Charles L. A. Clarke, Kalervo J?rvelin @Richi Nayak - Publicity Chair ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:33:23 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:33:23 +0100 Subject: Appel: Computer Speech and Language Special Issue on Hybrid Machine Translation Message-ID: Date: Wed, 6 Nov 2013 12:05:56 -0600 From: Marta Ruiz Message-ID: X-url: http://ees.elsevier.com/csl Hybrid Machine Translation focuses on combining the best properties of different Machine Translation (MT) paradigms. Nowadays, it is very popular to include linguistic features in Statistical Machine Translation (SMT) systems or to modify the standard Rule-based Machine Translation (RBMT) architecture to include statistical knowledge. Other ways of hybridization include the system combination techniques which may combine a rich variety of translation paradigms. This special issue in the prestigious Computer Speech and Language journal will cover different approaches from Hybrid Machine Translation and take advantage of the latest and leading research to discuss the progress in the field. This special issue invites contributions related to (but not limited): 1. theoretical and experimental design of hybrid MT architectures 2. experimental results with hybrid MT systems guided by corpus-based or rule-based systems 3. introduction of linguistics in corpus-based approaches 4. rule-based systems extended or built with statistical information 5. induction of lexical or grammatical transfer rules from corpora 6. description of open source tools and language resources for hybrid MT 7. description of computationally efficient algorithms for hybrid MT 8. applications of hybrid MT systems 9. hybrid methods applied to spoken language translation (SLT) 10. hybrid evaluation methods 11. system combination of different MT and SLT paradigms. *Submission procedure* Prospective authors should follow the regular guidelines of the Computer Speech and Language Journal for electronic submission (*http://ees.elsevier.com/csl*). During submission authors must select "SI: Hybrid Machine Translation" as Article Type. *Important dates: * 1st March 2014: Deadline for Submissions 1st June 2014: Notification of Resubmission 1st July 2014: Deadline for Resubmission 1st August 2014: Final Decision *Guest Editors:* Dr. Marta R. Costa-juss?, Institute for Infocomm Research, Singapore, *martaruizcostajussa at gmail.com* Prof. Jos? A. R. Fonollosa, Universitat Polit?cnica de Catalunya, Barcelona, *jose.fonollosa at upc.edu* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:29:05 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:29:05 +0100 Subject: Appel: SWIP-Swiss Workshop on Prosody, PhonoGenres and Speaking Styles, Geneve, 10-11 septembre 2014 Message-ID: Date: Wed, 6 Nov 2013 17:49:31 +0100 From: Jean-Philippe Goldman Message-ID: X-url: http://www.unige.ch/lettres/linguistique/actualites/swip2014.html Second appel ? communications 3?me SWIP - Swiss Workshop on Prosody Special Theme : PhonoGenres and Speaking Styles 10-11 Septembre 2014 - Universit? de Gen?ve http://www.unige.ch/lettres/linguistique/actualites/swip2014.html SWIP (Swiss Workshop on Prosody) est un ?v?nement annuel sur les avanc?es de recherches en prosodie, organis? en Suisse. Apr?s le 1er SWIP ? Zurich en 2012, et le 2?me ? Neuch?tel en 2013, le 3?me SWIP aura lieu ? Gen?ve les 10 et 11 septembre 2014. Pour cette ?dition, la th?matique principale porte sur les phonogenres et les styles de parole. Elle marquera la cl?ture des trois ans du projet FNS "Caract?risation prosodique et linguistique de phonogenres". La variation phonostylistique prosodique, qu?elle soit r?gionale, sociale, ou situationnelle, fait aujourd?hui l?objet de nombreuses ?tudes. Elles sont ponctuelles ou syst?matiques, empiriquement fond?es sur l??tude phon?tique-phonologique de corpus de grandes dimensions ou sur l?examen d??chantillons restreints. Les approches sont vari?es, entre les m?thodologies syst?matiques et des proc?dures ad hoc. Ainsi, l?un des objectifs principaux de la conf?rence est de r?pertorier les diff?rentes approches et de confronter leurs r?sultats. Les th?mes suivants peuvent ?tre abord?s: * phonogenres: dimensions phon?tico-prosodiques; variation situationnelle, communicative, micro- ou macro-sociale; analyses comparatives * styles de parole - clich?s, idiosyncrasies, particularit?s remarquables * variation diachronique des phonostyles * identification des genres et des styles de discours * m?thodologies et outils de traitement de corpus, avec un int?r?t particulier pour l??tude phonostylistique et la variation phonostylistique Les contributions en dehors de ces th?mes sont ?galement les bienvenues. Conf?renciers Invit?s: Julia Hirschberg Philippe Boula de Mare?il Format de soumission: La soumission de la contribution consiste en deux ?tapes. Dans un premier temps, nous attendons pour le 1er f?vrier 2014 les propositions de contribution (une page + r?f?rences) en fran?ais, ou en anglais. La soumission se fait au moyen de cette page EasyChair. https://www.easychair.org/conferences/?conf=swip3 Dans un deuxi?me temps, nous attendons pour le 1er juin 2014 la version d?finitive de l'article, en version courte (6 pages max., environ 2000 mots) ou longue (12 pages max., environ 4000 mots) en vue d'une publication dans les Nouveaux cahiers de linguistique fran?aise (papier et format ?lectronique), ? para?tre pour le colloque. Les articles peuvent ?tre r?dig?s en fran?ais ou en anglais avec un r?sum? dans l'autre langue. La mise en forme doit imp?rativement suivre ces consignes. http://clf.unige.ch/AppelPublication.php Veuillez noter que la langue de la conf?rence est l'anglais. Dates ? retenir: Soumission de la contribution : 1er f?vrier 2014 Notification d?acceptation: 1er mars 2014 Envoi de l'article complet pour les actes : 1er juin 2014 Dates de la conf?rence: 10-11 septembre 2014 Comit? scientifique: Antoine Auchlin Mathieu Avanzi Philippe Boula de Mare?il Nick Campbell Elisabeth Delais-Roussarie C?line De Looze Volker Dellwo Jean-Philippe Goldman Julia Hirschberg Daniel Hirst Ingrid Hove Adrian Leemann Joaquim Llisterri Philippe Martin Piet Mertens Anne Lacheret Nicolas Obin Tea Pr?ir Stephan Schmid Sandra Schwab Elizabeth Shriberg Anne Catherine Simon Comit? d'organisation: Antoine Auchlin Jean-Philippe Goldman Tea Pr?ir ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:51:33 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:51:33 +0100 Subject: Conf: Symposium franco-japonais, Analyse des donnees sonores et corpus de reference, Paris, 18 =?WINDOWS-1252?Q?=96_?=20 novembre 2013 Message-ID: Date: Thu, 7 Nov 2013 13:25:29 +0000 (GMT) From: Layal Kanaan Message-ID: <1383830729.57988.YahooMailNeo at web171403.mail.ir2.yahoo.com> X-url: http://www.lll.cnrs.fr/lll-ninjal-symposium X-url: http://www.lll.cnrs.fr/en/lll-ninjal-symposium Bonjour, Vous trouverez en document attach? l?annonce d'un symposium organis? conjointement par le Laboratoire Lig?rien de Linguistique (LLL / UMR 7270 ? Universit? d?Orl?ans ? Universit? de Tours ? BnF ? CNRS) et le NINJAL (National Institute of Japanese Language and Linguistics). Cette manifestation b?n?ficie du soutien de la Biblioth?que nationale de France, de la D?l?gation G?n?rale ? la Langue Fran?aise et aux Langues de France, de l?IRCOM (consortium Corpus Oraux et Multimodaux d?HUMA-NUM), de la Maison de la Culture du Japon ? Paris, de l?Association des Enseignants de Japonais en France et de la Soci?t? Japonaise de Didactique du Fran?ais. Pour des raisons d?acc?s dans les institutions qui nous accueillent, l?inscription est obligatoire et une pi?ce d?identit? sera demand?e ? l?entr?e. Afin de pouvoir assister ? une s?ance (les r?servations se prennent par demi-journ?e), il convient d?envoyer un message ? Layal Kanaan-Caillol (layal.kanaan at univ-orleans.fr) qui recensera les inscriptions, ? l?exception de celle concernant le mardi apr?s-midi pour laquelle les renseignements se prendront aupr?s de Jean Bazantay (jean.bazantay at univ-orleans.fr) et la demande d?inscription, ? l?adresse suivante : nihongo.mcjp at gmail.com. Les capacit?s d?accueil ?tant limit?es, il est recommand? de se manifester sans attendre et de nous informer si vous aviez un emp?chement ult?rieur. Un message de confirmation vous sera adress? en retour. Le programme et les informations pratiques d'acc?s sont disponibles sur le lien suivant : http://www.lll.cnrs.fr/lll-ninjal-symposium Program and access information are available on the following link: http://www.lll.cnrs.fr/en/lll-ninjal-symposium Pour le comit? d?organisation, L. Kanaan-Caillol et J. Bazantay ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:53:36 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:53:36 +0100 Subject: Appel: Third Workshop on Computational Linguistics for Literature, EACL 2014 Message-ID: Date: Thu, 07 Nov 2013 10:15:14 -0500 From: Stan Szpakowicz Message-ID: <527BAE82.50404 at eecs.uottawa.ca> Third Workshop on Computational Linguistics for Literature April 26 or 27, 2014, G?teborg, Sweden, co-located with EACL 2014 https://sites.google.com/site/clfl2014a/ First Call for Papers [Our apologies for multiple postings.] The purpose of the series of ACL workshops on Computational Linguistics for Literature is to bring together researchers fascinated with literature as a unique type of data which pose distinct challenges. We invite papers on original unpublished work in this broad area. In particular, we hope to see papers which explore how the state-of-the-art NLP methods can help solve existing research problems in the humanities, or perhaps suggest new problems. Literary texts revolve around the human condition, emotions, social life and inner life. Naturally, such data abound in common-sense knowledge but are very thin on technical jargon. Can tools and methods developed in the ACL community help process literary data? When do they work, when do they fail and why? What new instruments do we need in order to work with prose and poetry, on a large or small scale? Are there computational solutions of noteworthy problems in the Humanities, Information Science, Library Sciences and other similar disciplines? Here are some of the topics of interest to the workshop: - the needs of the readers and how these needs translate into meaningful NLP tasks; - searching for literature; - recommendation systems for literature; - computational modelling of narratives, computational narratology, computational folkloristics; - summarization of literature; - differences between literature and other types of writing as relevant to computational linguistics; - discourse structure in literature; - emotion analysis for literature; - profiling and authorship attribution; - identification and analysis of literary genres; - building and analyzing social networks of characters; - generation of literary narrative, dialogue or poetry; - modelling literary dialogue for generation. We will consider regular papers which describe experimental methods or theoretical work, and we will gladly welcome position papers. The NLP community does not study literature often enough, so it is important to discuss and formulate the problems before proposing solutions. The (tentative) submission deadline is January 23, 2014. Anna Feldman, Anna Kazantseva, Stan Szpakowicz ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:01:15 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:01:15 +0100 Subject: Conf: SocInfo2013, 25-27 November 2013, Kyoto, Japan Message-ID: Date: Fri, 08 Nov 2013 10:05:29 +0100 From: Antoine Doucet Message-ID: <527CA959.8050503 at unicaen.fr> X-url: http://www.socinfo2013.org ----Apologies for cross-posting--- The Fifth International Conference on Social Informatics (SocInfo2013) 25-27 November 2013, Kyoto, Japan http://www.socinfo2013.org -----Call for Participation--------- ---------------------------------------------------------------------- The Fifth International Conference on Social Informatics (SocInfo2013) is an interdisciplinary venue for researchers from informatics and the social & management sciences to come together to share ideas and opinions, and to present original research work. The goal is to create an opportunity for the dissemination of knowledge between the two communities, as well as to enable mutual critical discussion of current research. ---------------------------------------------------------------------- Keynote Speakers: -------------------------- Paul Resnick (University of Michigan) Yoshiyuki Hashimoto (University of Tokyo) Irwin King (Chinese University of Hong Kong) Co-located Events: -------------------------- TUTORIAL: Towards a Spatial and Temporal Representation of Social Processes by Christophe Claramunt (Naval Academy Research Institute, France) WORKSHOPS: 1st Workshop on Quality, Motivation and Coordination of open Collaboration (QMC 2013) (http://qmc2013.socinfo.eu/ ) 1st International Workshop on Histoinformatics (http://www.histoinformatics.org ) Accepted Papers: ---------------- FULL PAPERS: Modeling Analogies for Human-Centered Information Systems Christoph Lofi and Christian Nieke Resilience of Social Networks Under Different Attack Strategies Mohammad Ayub Latif, Muhammad Naveed and Faraz Zaidi Follow My Friends This Friday! An Analysis of Human-generated Friendship Recommendations Ruth Garcia Gavilanes, Neil O'fHare, Luca Maria Aiello and Alejandro Jaimes A Divide-and-Conquer Approach for Crowdsourced Data Enumeration Hideto Aoki and Atsuyuki Morishima Passive Participation in Communities of Practice: Scope and Motivations Azi Lev-On and Odelia Adler An Ontology-based Approach to Sentiment Classification of Mixed Opinions in Online Restaurant Reviews Hea-Jin Kim and Min Song Automating Credibility Assessment of Arabic News Mohamed Hammad and Elsayed Hemayed The Study of Social Mechanisms of Organization, Boundary Capabilities, and Information System Shiuann-Shuoh Chen, Pei-Yi Chen, Yu Min and Yu-Wei Chuang Predicting User'fs Political Party using Ideological Stances Swapna Gottipati, Minghui Qiu, Liu Yang, Feida Zhu and Jing Jiang A Fast Method for Detecting Communities from Tripartite Networks Kyohei Ikematsu and Tsuyoshi Murata Information vs Interaction: An Alternative User Ranking Model for Social Networks Wei Xie, Ai Phuong Hoang, Feida Zhu and Ee-Peng Lim Feature Extraction and Summarization of Recipes using Flow Graph Yoko Yamakata, Shinji Imahori, Yuichi Sugiyama, Shinsuke Mori and Katsumi Tanaka Unsupervised Opinion Targets Expansion and Modification Relation Identification for Microblog Sentiment Analysis Jenq-Haur Wang and Ting-Wei Yeh An Ontology-based Technique for Online Profile Resolution Keith Cortis, Simon Scerri, Ismael Rivera and Siegfried Handschuh The Three Dimensions of Social Prominence Diego Pennacchioli, Giulio Rossetti, Luca Pappalardo, Fosca Giannotti, Dino Pedreschi and Michele Coscia Automatic Thematic Content Analysis: Finding Frames in News Daan Odijk, Bjorn Burscher, Rens Vliegenthart and Maarten de Rijke Optimal scales in weighted networks Diego Garlaschelli, Sebastian E. Ahnert, Thomas M. A. Fink and Guido Caldarelli Diversity-Based HITS: Web Page Ranking by Referrer and Referral Diversity Yoshiyuki Shoji and Katsumi Tanaka The Babel of Software Development: Linguistic Diversity in Open Source Bogdan Vasilescu, Alexander Serebrenik and Mark G. J. van den Brand Using and Asking: APIs Used in the Android Market and Asked About in StackOverflow David Kavaler, Daryl Posnett, Clint Gibler, Hao Chen, Premkumar Devanbu and Vladimir Filkov Social-Urban Neighborhood Search based on Crowd Footprints Network Shoko Wakamiya, Ryong Lee and Kazutoshi Sumiya A Notification-centric Mobile Interaction Survey and Framework Jonas Elslander and Katsumi Tanaka Social Sensing for Urban Crisis Management: The Case of Singapore Haze Philips Kokoh Prasetyo, Ming Gao, Ee-Peng Lim and Christie Napa Scollon SHORT PAPERS: Changing with Time: Modelling and Detecting User Lifecycle Periods in Online Community Platforms Matthew Rowe A Novel Social Event Recommendation Method Based on Social and Collaborative Friendships Yu-Chun Sun and Chien Chin Chen Factors that Influence Social Networking Service Private Information Disclosure at Diverse Openness and Scopes Basilisa Mvungi and Mizuho Iwaihara An Approach to Building High-Quality Tag Hierarchies from Crowdsourced Taxonomic Tag Pairs Fahad Almoqhim, David E. Millard and Nigel Shadbolt Polarity Detection of Foursquare Tips Felipe Moraes, Marisa Vasconcelos, Patrick Prado, Daniel Dalip, Jussara Almeida and Marcos Goncalves Predicting Social Density in Mass Events to Prevent Crowd Disasters Bernhard Anzengruber, Danilo Pianini, Jussi Nieminen and Alois Ferscha Modeling Social Capital of Bureaucratic Hierarchy for Analyzing Promotion Decisions Jyi-Shane Liu, Zhuan-Yao Lin and Ke-Chih Ning The estimation of aNobii users'f reading diversity using book co-ownership data: a social analytical approach Muhchyun Tang, Yi-Ling Ke and Yi-Jin Sie Aspects of Rumor Spreading on a Microblog Network Sejeong Kwon, Meeyoung Cha, Kyomin Jung, Wei Chen and Yajun Wang Traffic Condition is More than Colored Lines on a Map: Characterization of Waze Alerts Thiago H. Silva, Pedro Olmo Vaz de Melo, Aline Carneiro Viana, Jussara M. Almeida, Juliana Salles and Antonio A. F. Loureiro Why Do I Retweet It? An Information Propagation Model for Microblogs Fabio Pezzoni, Jisun An, Andrea Passarella, Jon Crowcroft and Marco Conti Society as a Life Teacher ? Automatic Recognition of Instincts Underneath Human Actions by Using Blog Corpus Rafal Rzepka and Kenji Araki Temporal, cultural and thematic aspects of web credibility Radoslaw Nielek, Aleksander Wawer, Michal Jakowski-Lorek and Adam Wierzbicki How do Students Search during Class and Homework? A query log analysis for academic purposes Rafael Lopez-Garcia, Makoto P. Kato, Yoko Yamakata and Katsumi On Constrained Adding Friends in Social Networks Hoang Bao Thien and Abdessamad Imine DEMO PAPERS: Metro: Exploring Participation in Public Events Luca Chiarandini, Luca Maria Aiello, Neil O'fHare and Alejandro Jaimes Social Listening for Customer Acquisition Juan Du, Biying Tan, Feida Zhu and Ee-Peng Lim Pilot Study toward realizing Social Effect in O2O Commerce Services Tse-Ming Tsai, Ping-Che Yang and Wen-Nan Wang Organizing Committee: ---------------- General Co-Chairs: - Katsumi Tanaka (Kyoto University, Japan) - Andrew Flanagin (University of California, Santa Barbara, USA) Program Co-Chairs: - Ee Peng Lim (Singapore Management University, Singapore) - Adam Jatowt (Kyoto University, Japan) - Ying Ding (Indiana University, Bloomington, USA) - Asako Miura (Kwansei Gakuin University, Japan) - Keishi Tajima (Kyoto University, Japan) Workshop/Tutorial Co-Chairs: - Akiyo Nadamoto (Konan University, Japan) - Jochen Leidner (Thomson Reuters, Switzerland) Demo Co-Chairs: - Taro Tezuka (Tsukuba University, Japan) - Gael Dias (Normandie University, Caen, France) Publicity Co-Chairs: - Yoshinori Hijikata (Osaka University, Japan) - Antoine Doucet (Normandie University, Caen, France) - Ricardo Campos (Polytechnic Institute of Tomar, Portugal) - Goh Hoe Lian Dion (Nanyang Technological University, Singapore) - Atsuyuki Morishima (University of Tsukuba, Japan) - Leonard Bolc (Polish-Japanese Institute of Information Technology, Poland) Treasurers: - Chair: Kazutoshi Sumiya (University of Hyogo, Japan) - Hiroaki Ohshima (Kyoto University, Japan) - Daisuke Kitayama (Kogakuin University, Japan) Web Chair: - Makoto P. Kato (Kyoto University, Japan) Local Arrangement Co-Chairs: - Takehiro Yamamoto (Kyoto University, Japan) - Toshiyuki Shimizu (Kyoto University, Japan) From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:45:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:45:44 +0100 Subject: Stage: Stage de master recherche en TAL et Lexicographie, LIDILEM Message-ID: Date: Thu, 7 Nov 2013 08:34:30 +0100 From: Agn?s Tutin Message-ID: <000901cedb8b$cc2f1da0$648d58e0$@u-grenoble3.fr> X-url: http://www.atilf.fr/ressources/termith/ Stage de recherche M1 ou M2 Traitement automatique des langues, Lexicographie ou Linguistique appliqu?e Conception et d?veloppement d?un dictionnaire ?lectronique de collocations du langage scientifique Lieu : LIDILEM, Universit? Grenoble 3 ? Stendhal, Dur?e : de 3 ? 5 mois, P?riode : janvier ? juin 2014. Stage r?mun?r? : indemnit? (436 euros/mois) Personnes ? contacter : Agn?s Tutin (agnes.tutin at u-grenoble3.fr) Dans le cadre du projet Termith (Projet ANR-Content : http://www.atilf.fr/ressources/termith/) impliquant plusieurs laboratoires de recherche (ATILF, LINA, INRIA, LORIA, LIDILEM), nous souhaitons ?laborer un lexique d?expressions sp?cifiques du fran?ais scientifique, par exemple faire une hypoth?se, en premier lieu, contrairement ? nos attentes ? Cette phras?ologie transdisciplinaire des ?crits scientifiques traverse en large partie les disciplines et est surrepr?sent?e dans ce genre (Pecman 2007 ; Tutin 2007 ; Granger & Paquot 2010). Dans le cadre du projet Termith, ces expressions seront utilis?es dans un syst?me d?indexation automatique des ?crits scientifiques afin de mieux rep?rer les concepts sp?cifiques des textes. Dans cette phras?ologie, les collocations, ici d?finies comme des associations binaires privil?gi?es et compositionnelles sur le plan s?mantique, constituent les expressions les plus productives. Il s?agit d?expressions comme faire une hypoth?se, r?sultats encourageants, hypoth?se de travail, etc. Le sujet du stage consistera ? adapter un format d?encodage pour ces expressions ? partir des extractions effectu?es automatiquement d?un grand corpus d??crits scientifiques. L?extraction sera r?alis?e semi-automatiquement dans notre ?quipe ? partir d?un corpus analys? syntaxiquement en d?pendances en utilisant des mesures d?association (Kraif & Diwersy 2012 ; Cf aussi Seretan 2010). Le stagiaire sera charg? de r?fl?chir au codage linguistique des propri?t?s pertinentes ? associer ? ces collocations (alternances syntaxiques, d?termination, information d?usage) ? partir des observations en corpus, de s?lectionner les collocations adapt?es et de proposer une adaptation pour ces expressions du standard Lexical Markup Framework (Francopoulo et al. 2006). Francopoulo, G., George, M., Calzolari, N., Monachini, M., Bel, N., Pet, M., & Soria, C. (2006). Lexical markup framework (LMF). In International Conference on Language Resources and Evaluation-LREC 2006. Granger, S., Paquot, M., (2010. The Louvain EAP Dictionary (LEAD) ?, Proceedings of the XIV EURALEX International Congress , Leeuwarden (The Netherlands), 6-10 July 2010, 321-326. Kraif. O & Diwersy S. (2012). Le Lexicoscope : un outil pour l'?tude de profils combinatoires et l'extraction de constructions lexico-syntaxiques. Actes de la conf?rence conjointe JEP-TALN-RECITAL 2012, volume 2: TALN. Grenoble, France. 399?406. Pecman, M. (2007) : Approche onomasiologique de la langue scientifique g?n?rale. Revue fran?aise de linguistique appliqu?e. ? Lexique des ?crits scientifiques ?, vol. XII-2. 79-96. Seretan V. (2010). Syntax-based collocation extraction. Springer. Tutin, A. (2004). Pour une mod?lisation dynamique des collocations dans les textes. In Proceedings of the Eleventh EURALEX International Congress, Lorient, France. 207-219. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:12:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:12:55 +0100 Subject: Job: CDD 18 mois Classification et Filtrage + Integration Web Service, CEA LIST Message-ID: Date: Thu, 07 Nov 2013 17:15:51 +0100 From: Message-ID: Le Laboratoire de Vision et d'Ing?nierie des Contenus du CEA LIST emploie une cinquantaine chercheurs et ing?nieurs travaillant sur l'analyse et l'interpr?tation de donn?es multim?dia (texte, image et analyse de vid?os). Le LVIC d?veloppe des algorithmes robustes pour l'extraction, l'analyse et le filtrage de grands volumes de donn?es multim?dia (texte, image, vid?o). La fusion de ces media permet une meilleure interpr?tation ou compr?hension des sc?nes ou des documents. Nos technologies ont contribu?es ? l'?mergence de nouvelles activit?s ?conomiques. En effet, ces technologies ont permis la cr?ation de startups comme Senseetive ou Ant?Inno. Par ailleurs, le laboratoire participe ? de nombreux projets collaboratifs (ANR, Europe FP7, P?le de Comp?titivit?) avec des partenaires acad?miques, PMEs ou grands industriels. Dans le cadre de plusieurs projets en cours de la th?matique "Traitement Automatique des Langues", le laboratoire LVIC recherche un ing?nieur pour assister les chercheurs du laboratoire dans la conception, l'impl?mentation et l??valuation de modules logiciels de filtrage et de classification th?matique de documents h?t?rog?nes ainsi que leur int?gration dans une architecture orient?e service. Le candidat devra : - concevoir et impl?menter des algorithmes de classification en utilisant des classifieurs statistiques, en particulier de type SVM ; - ?valuer et am?liorer ces classifieurs. - int?grer les modules d?velopp?s ainsi que d?autres modules disponibles au sein du laboratoire dans une architecture orient?e service. Le candidat devra poss?der une bonne ma?trise du d?veloppement en C++ sous Linux (base de code install?e de plusieurs centaines de milliers de lignes) et conna?tre (ou ?tre capable de se familiariser rapidement avec) des biblioth?ques telles que STL, Xerces-C, Boost, gSoap, etc. Les comp?tences requises incluent ?galement la ma?trise de principes de conception de type Design Patterns et d'outils d?veloppement tels que, gdb, valgrind, etc. Le candidat devra en outre ?tre capable de se familiariser rapidement avec les architectures orient?es service. Enfin, une connaissance minimale des techniques d'apprentissage et de classification (SVM, etc.) est consid?r?e comme fortement souhaitable. Le poste propos? est un CDD de 18 mois, r?mun?r? selon les grilles de salaire du CEA (d?pendant de la formation et de l'exp?rience). Il sera bas? sur le centre Nano'Innov, situ? pr?s du Campus de l??cole Polytechnique ? Palaiseau (91). Contact: Faiza GARA Email : faiza.gara at cea.fr Tel : 01 69 08 01 48 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:55:47 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:55:47 +0100 Subject: Seminaire: Seminaire Alpage, Quentin Pradet et Laurence Danlos, 15 novembre 2013, Paris Message-ID: Date: Fri, 8 Nov 2013 09:40:33 +0100 From: Marie Candito Message-ID: ************** S?minaire de l'?quipe Alpage ********* Il s'agit du s?minaire de recherche en linguistique informatique organis? par l'?quipe Alpage, ?quipe mixte INRIA - Paris Diderot, sp?cialis?e en analyse syntaxique automatique et en traitement du discours. Vendredi 15 novembre de 11h ? 12h30, ATTENTION: b?timent inhabituel : le s?minaire aura lieu en salle 264E ? la *Halle aux Farines* 10 rue Fran?oise Dolto 75013 Paris (la salle est plut?t c?t? Seine du b?timent, et ? l'oppos? des Grands Moulins) Toute personne int?ress?e est la bienvenue. ********************************************************** Vers la cr?ation semi-automatique d?un VerbNet du fran?ais. Quentin Pradet (CEA LIST) et Laurence Danlos (Universit? Paris Diderot, ALPAGE) VerbNet est une ressource lexicale pour les verbes anglais organis?e autour de classes s?mantiques et de sous-classes syntaxiques. Cette ressource est tr?s utilis?e, notamment pour l'annotation en r?les s?mantiques (Swier et Stevenson, 2005 ; Palmer et al., 2013). Il para?t donc n?cessaire d?avoir une ressource ?quivalente pour le fran?ais. Les seuls efforts qui ont ?t? faits pour l?instant se limitent ? des constructions automatiques bruit?es dont l'?valuation se limite ? quelques verbes (Messiant et al., 2010 ; Falk et al., 2012). De plus ces efforts font abstraction des ressources lexicales qui existent pour le fran?ais, or celles?ci existent et sont de qualit?. Pour les verbes, nous pensons en particulier ? LVF+1 (http://pageperso.lif.univ-mrs.fr/~paul.sabatier/Contribution_FondamenTAL.html) et au Lexique-Grammaire (http://infolingu.univ-mlv.fr/DonneesLinguistiques/Lexiques-Grammaires/Telechargement.html). Nous avons donc l?objectif de r?aliser un VerbeNet du fran?ais semi-automatiquement en nous appuyant sur ces ressources, en particulier sur LVF+1 et LG, la premi?re plus centr?e sur les informations s?mantiques, la seconde sur les informations syntaxiques. Ce VerbeNet garde la hi?rarchie des classes s?mantiques du VerbNet anglais, ce qui permet de garder ? l'identique les informations s?mantiques, entre autres les r?les th?matiques. Ce travail est en cours. Nous pr?senterons les premiers r?sultats, les difficult?s rencontr?es et les futurs liens que nous envisageons vers d'autres ressources du fran?ais utilis?es en TAL. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 22:07:11 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 23:07:11 +0100 Subject: Revue: Numero Texto ! Textes & Cultures, Volume XVIII, 4 (2013) Message-ID: Date: Fri, 8 Nov 2013 18:29:54 +0100 From: Carine Duteil-Mougel Message-Id: X-url: http://www.revue-texto.net/index.php?id=3326 Bonjour, Au sommaire du nouveau num?ro de Texto ! Textes & Cultures : VOLUME XVIII - n?4 (2013), coordonn? par Fran?ois LAURENT http://www.revue-texto.net/index.php?id=3326 Dits et in?dits " Interpr?tation, traduction et rationalit? clinique dans l?anthropologie de Clifford Geertz " Philippe LACOUR URL : http://www.revue-texto.net/index.php?id=3352. Corpus et m?thodes " La ru?e linguistique vers le Web " Ludovic TANGUY URL : http://www.revue-texto.net/index.php?id=3335. Arts du langage Essai de s?mantique textuelle ? partir d?un extrait de La Recherche du temps perdu de Proust " Guillaume MARVIER URL : http://www.revue-texto.net/index.php?id=3324. Saussurismes et s?miotiques / Petite historiographie du saussurisme " La perspective fonctionnelle de la phrase " Tom?? HOSKOVEC URL : http://www.revue-texto.net/index.php?id=3389. Rep?res pour l'?tude " S?miologie des pictogrammes " Pascal VAILLANT URL : http://www.revue-texto.net/index.php?id=3336. " L'analyse des textes litt?raires : vingt m?thodes " Louis H?BERT (LIEN) Parutions et tr?sors " Faussaires ou bienfaiteurs ? Le probl?me public des ? faux ? m?dicaments dans les m?dias " Marine AL DAHDAH et Mathieu QUET URL : http://www.revue-texto.net/index.php?id=3310. " D?psychiatriser dit-elle " Arnaud ALESSANDRIN URL : http://www.revue-texto.net/index.php?id=3311. " L'alcoolisation adolescente : un probl?me de sant? publique dans la presse quotidienne nationale ? " Audrey ARNOULT URL : http://www.revue-texto.net/index.php?id=3312. " Un d?fi permanent pour les m?dias " Paul BENKIMOUN URL : http://www.revue-texto.net/index.php?id=3314. " La greffe de visage comme ? ?v?nement durable ? ? " Philippe CHAVOT et Anne MASSERAN URL : http://www.revue-texto.net/index.php?id=3316. " Sc?narisation m?diatique et enjeux d?signatifs autour de deux crises sanitaires : la Grippe A et la Bact?rie tueuse " Carine DUTEIL-MOUGEL et Pascale VERGELY URL : http://www.revue-texto.net/index.php?id=3317. " L'affaire du M?diator au prisme de la textom?trie " Philippe GAMBETTE et William MARTINEZ URL : http://www.revue-texto.net/index.php?id=3318. " Cancer et M?decines non conventionnelles : vers une ?volution du discours m?diatique " Sarah JEZIORSKI LAHBIB URL : http://www.revue-texto.net/index.php?id=3319. " Des accidents m?dicaux ? la ? crise syst?mique ?. Le traitement m?diatique des cas de surirradiations des h?pitaux d'?pinal et de Toulouse. " Florian PEDROT URL : http://www.revue-texto.net/index.php?id=3320. " M?dias/Sant?/Censure. Autour de la publicit? " Laura SANTONE " Sant?-m?dias-Sport : Responsabilit? sociale et l?imp?rieuse n?cessit? de l?interdisciplinarit? " Denis THEUNYNCK, Fabien WILLE, Gilles VANLERBERGHE et Fran?ois POTDEVIN URL : http://www.revue-texto.net/index.php?id=3322. " Incertitude, processus d?individualisation, et perception des risques : l?exemple de la controverse sur la vaccination contre la grippe A(H1N1) " Jeremy WARD URL : http://www.revue-texto.net/index.php?id=3323. " Du corpus au genre: l'exemple de linguistique " C?line POUDAT URL : http://www.revue-texto.net/index.php?id=3355. " Interpr?tation et fr?quence textuelle " Sylvain LOISEAU URL : http://www.revue-texto.net/index.php?id=3356. " Comment se constituent les genres ? l'?re du texte num?rique? " Val?rie BEAUDOUIN URL : http://www.revue-texto.net/index.php?id=3357. " L'analyse des textes litt?raires : une m?thodologie compl?te " Louis H?BERT (LIEN) Bien cordialement, Carine DM ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 8 21:40:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 8 Nov 2013 22:40:44 +0100 Subject: Appel: Special issue, ACM TACCESS on Speech and Language Interaction for Daily Assistive Technology (SLPAT) Message-ID: Date: Wed, 06 Nov 2013 21:22:25 +0100 From: Fran?ois Portet Message-ID: <527AA501.40709 at imag.fr> *Call for Papers - Special Issue of ACM Transactions on Accessible Computing (TACCESS) On Speech and Language Interaction for Daily Assistive Technology * /Guest Editors: Fran?ois Portet, Frank Rudzicz, Jan Alexandersson, Heidi Christensen/ Assistive technologies (AT) allow individuals with disabilities to do things that would otherwise be difficult or impossible. Many assistive technologies involve providing universal access, such as modifications to televisions or telephones to make them accessible to those with vision or hearing impairments. An important sub-discipline within this community is Augmentative and Alternative Communication (AAC), which has its focus on communication technologies for those with impairments that interfere with some aspect of human communication, including spoken or written modalities. Another important sub-discipline is Ambient Assisted Living (AAL) which facilitates independent living; these technologies break down the barriers faced by people with physical or cognitive impairments and support their relatives and caregivers. These technologies are expected to improve quality-of-life of users and promote independence, accessibility, learning, and social connectivity. Speech and natural language processing (NLP) can be used in AT/AAC in a variety of ways including, improving the intelligibility of unintelligible speech, and providing communicative assistance for frail individuals or those with severe motor impairments. The range of applications and technologies in AAL that can rely on speech and NLP technologies is very large, and the number of individuals actively working within these research communities is growing, as evidenced by the successful INTERSPEECH 2013 satellite workshop on Speech and Language Processing for Assistive Technologies (SLPAT). In particular, one of the greatest challenges in AAL is to design smart spaces (e.g., at home, work, hospital) and intelligent companions that anticipate user needs and enable them to interact with and in their daily environment and provide ways to communicate with others. This technology can benefit each of visually-, physically-, speech- or cognitively- impaired persons. Topics of interest for submission to this special issue include (but are not limited to): - Speech, natural language and multimodal interfaces designed for people with physical or cognitive impairments - Applications of speech and NLP technology (automatic speech recognition, synthesis, dialogue, natural language generation) for AT applications - Novel modeling and machine learning approaches for AT applications - Long-term adaptation of speech/NLP based AT system to user's change - User studies, overview of speech/NLP technology for AT: understanding the user's needs and future speech and language based technologies. - Understanding, modeling and recognition of aged or disordered speech - Speech analysis and diagnosis: automatic recognition and detection of speech pathologies and speech capability loss - Speech-based distress recognition - Automated processing of symbol languages, sign language and nonverbal communication including translation systems. - Text and audio processing for improved comprehension and intelligibility, e.g., sentence simplification or text-to-speech - Evaluation methodology of systems and components in the lab and in the wild. - Resources; corpora and annotation schemes - Other topics in AAC, AAL, and AT *Submission process* Contributions must not have been previously published or be under consideration for publication elsewhere, although substantial extensions of conference or workshop papers will be considered. as long as they adhere to ACM's minimum standards regarding prior publication (http://www.acm.org/pubs/sim_submissions.html). Studies involving experimentations with real target users will be appreciated. All submissions have to be prepared according to the Guide for Authors as published in the Journal website at http://www.rit.edu/gccis/taccess/. Submissions should follow the journal's suggested writing format (http://www.gccis.rit.edu/taccess/authors.html) and should be submitted through Manuscript Central http://mc.manuscriptcentral.com/taccess, indicating that the paper is intended for the Special Issue. All papers will be subject to the peer review process and final decisions regarding publication will be based on this review. *Important dates:* - Full paper submission: 31^st March 2014 - Response to authors: 30^th June 2014 - Revised submission deadline: 31^st August 2014 - Notification of acceptance: 31^st October 2014 - Final manuscripts due: 30^th November 2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:32:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:32:48 +0100 Subject: Appel: EACL 2014 Workshop on Multiword Expressions (MWE 2014) Message-ID: Date: Wed, 13 Nov 2013 12:32:47 +0100 From: Agata Savary Message-ID: <5283635F.9080400 at univ-tours.fr> X-url: http://multiword.sourceforge.net/mwe2014 Apologies for multiple postings ----------------------- First CALL FOR PAPERS The 10th Workshop on Multiword Expressions (MWE 2014) http://multiword.sourceforge.net/mwe2014 Workshop at EACL 2014 (Gothenburg, Sweden), April 26-27, 2014 Endorsed by the Special Interest Group on the Lexicon of the Association for Computational Linguistics (SIGLEX; http://www.siglex.org/); SIGLEX?s Multiword Expressions Section (SIGLEX-MWE; http://multiword.sourceforge.net/PHITE.php?sitesig=MWE); and PARSEME, European IC1207 COST Action (http://www.parseme.eu) Submission deadline: Long & short papers - January 23, 2014 at 23:59 PDT (GMT-7) ------------------------- Call For Papers Under the denomination "multiword expression", one assumes a wide range of linguistic constructions such as idioms (?storm in a teacup?, ?sweep under the rug?), fixed phrases (?in vitro?, ?by and large?, ?rock'n roll?), noun compounds (?olive oil?, ?laser printer?), compound verbs (?take a nap?, ?bring about?), etc. While easily mastered by native speakers, their interpretation poses a major challenge for computational systems, due to their flexible and heterogeneous nature. For a start, MWEs are not nearly as frequent in NLP resources as they are in real-world text, and this problem of coverage may impact the performance of many NLP tasks. Moreover, treating MWEs also involves problems like determining their semantics, which is not always compositional (?to kick the bucket? meaning ?to die?). In sum, MWEs are a key issue and a current weakness for natural language parsing and generation, as well as real-life applications depending on language technology, such as machine translation, just to name a prominent one among many. Thanks to the joint efforts of researchers from several fields working on MWEs, significant progress has been made in recent years, especially concerning the construction of large-scale language resources. For instance, there is a large number of recent papers which focus on acquisition of MWEs from corpora, and others that describe a variety of techniques to find paraphrases for MWEs. Current methods use a plethora of tools such as association measures, machine learning, syntactic patterns, web queries, etc. A considerable body of techniques, resources and tools to perform these tasks are now available, and are indicative of the growing importance of the field within the NLP community. Many of these advances are described as part of the annual workshop on MWEs, which attracts the attention of an ever-growing community working on a variety of languages and MWE types. The workshop has been held since 2001 in conjunction with major computational linguistics conferences (ACL, EACL, NAACL, COLING, LREC), providing an important venue for the community to interact, share resources and tools and collaborate on efforts for advancing the computational treatment of MWEs. Additionally, special issues on MWEs have been published by leading journals in computational linguistics. The latest such effort is the special issue on ?Multiword Expressions: from Theory to Practice and Use?, which has recently been published by the ACM Transactions on Speech and Language Processing (http://multiword.sourceforge.net/tslp2011si). MWE 2014 will be the 10th event in the series. We will be interested in major challenges in the overall process of MWE treatment, both from the theoretical and the computational viewpoint, focusing on original research related (but not limited) to the following topics: * Manually and automatically constructed resources * Representation of MWEs in dictionaries and ontologies * MWEs and user interaction * Multilingual acquisition * Multilingualism and MWE processing * Models of first and second language acquisition of MWEs * Crosslinguistic studies on MWEs * The role of MWEs in the domain adaptation of parsers * Integration of MWEs into NLP applications * Evaluation of MWE treatment techniques * Lexical, syntactic or semantic aspects of MWEs The workshop will feature a ?Special Track on Parsing and MWEs? dedicated to ?deep? parsing of MWEs, inviting submissions on the following and related challenges: * Lexicon-grammar interface: representing, at the lexical level, phenomena such as agreement, discontinuity and free word order; construction of MWE lexicons which would be easily convertible and maximally reusable in different parsing frameworks. * ?Deep? parsing techniques for MWEs: optimal representation of MWEs within linguistic frameworks, such CCG, HPSG, LFG, TAG, minimalism, etc; processing MWEs before, during or after parsing; representing the semantics of MWEs. * Hybrid parsing of MWEs: combining data-driven and knowledge-based approaches for efficient and linguistically precise parsers; using unannotated data for improving models based on annotated data. * Annotating MWEs in treebanks: MWE-aware methodologies of treebank construction, and their increased usability in parsing. This special track is endorsed by PARSEME, European IC1207 COST Action, dedicated to parsing and MWEs (www.parseme.eu). A separate time slot will be allocated to the special track within the workshop. Authors may submit papers either to the special track or to the regular workshop. They should follow common submission instructions. ------------------------- Submission modalities For MWE 2014, we will accept the following two types of submissions: Regular long papers (8 content pages + 1 page for references): Long papers should report on solid and finished research including new experimental results, resources and/or techniques. Regular short papers (4 content pages + 1 page for references): Short papers should report on small experiments, focused contributions, ongoing research, negative results and/or philosophical discussion. The reported research should be substantially original. The papers will be presented orally or as posters. The decision as to which papers will be presented orally and which as posters will be made by the program committee based on the nature rather than on the quality of the work. All submissions must be in PDF format and must follow the EACL 2014 formatting requirements (available at the EACL 2014 website). We strongly advise the use of the provided Word or LaTeX template files. Reviewing will be double-blind, and thus no author information should be included in the papers; self-reference should be avoided as well. Resources submitted with the papers should be anonymized for submission. Papers and/or resources that do not conform to these requirements will be rejected without review. Accepted papers will appear in the workshop proceedings, where no distinction will be made between papers presented orally or as posters. More details about the submission procedure (e.g. online submission system) will be available soon. ------------------------- Important dates 23 January 2014: Long & short paper submission deadline 23:59 PDT (GMT-7) 20 February 2014: Notification of Acceptance 03 March 2014: Camera-ready papers due 26-27 April 2014: Workshop Dates ------------------------- Program Committee I?aki Alegria, University of the Basque Country (Spain) Dimitra Anastasiou, University of Bremen (Germany) Doug Arnold, University of Essex (UK) Eleftherios Avramidis, DFKI GmbH (Germany) Tim Baldwin, University of Melbourne (Australia) N?ria Bel, Universitat Pompeu Fabra (Spain) Chris Biemann, Technische Universit?t Darmstadt (Germany) Francis Bond, Nanyang Technological University (Singapore) Lars Borin, University of Gothenburg (Sweden) Ant?nio Branco, University of Lisbon (Portugal) Miriam Butt, Universit?t Konstanz (Germany) Aoife Cahill, ETS (USA) Ken Church, IBM Research (USA) Matthieu Constant, Universit? Paris-Est Marne-la-Vall?e (France) Paul Cook, University of Melbourne (Australia) B?atrice Daille, Nantes University (France) Koenraad De Smedt, University of Bergen (Norway) Ga?l Dias, University of Caen Basse-Normandie (France) G?l?en Eryi?it, Istanbul Technical University (Turkey) Toma? Erjavec, Jo?ef Stefan Institute (Slovenia) Joaquim Ferreira da Silva, New University of Lisbon (Portugal) Roxana Girju, University of Illinois at Urbana-Champaign (USA) Jan Haji?, Charles University in Prague (Czech Republic) Chikara Hashimoto, National Institute of Information and Communications Technology (Japan) Ulrich Heid, University of Stuttgart (Germany) Kyo Kageura, University of Tokyo (Japan) Su Nam Kim, Monash University (VIC, Australia) Ioannis Korkontzelos, University of Manchester (UK) Brigitte Krenn, Austrian Research Institute for Artificial Intelligence (Austria) Cvetana Krstev, University of Belgrade (Serbia) Marie-Catherine de Marneffe, The Ohio State University (USA) Takuya Matsuzaki, National Institute of Informatics (Japan) Preslav Nakov, Qatar Computing Research Institute (Qatar) Malvina Nissim, University of Bologna (Italy) Joakim Nivre, Uppsala University (Sweden) Diarmuid ? S?aghdha, University of Cambridge (UK) Jan Odijk, University of Utrecht (The Netherlands) Yannick Parmentier, Universit? d'Orl?ans (France) Pavel Pecina, Charles University in Prague (Czech Republic) Scott Piao, Lancaster University (UK) Adam Przepi?rkowski, Polish Academy of Sciences (Poland) Victoria Ros?n, University of Bergen (Norway) Carlos Ramisch, Aix-Marseille University (France) Manfred Sailer, Goethe University Frankfurt am Main (Germany) Magali Sanches Duran, University of S?o Paulo (Brazil) Violeta Seretan, University of Geneva (Switzerland) Ekaterina Shutova, University of California, Berkeley (USA) Jan ?najder, University of Zagreb (Croatia) Pavel Stra??k, Charles University in Prague (Czech Republic) Sara Stymne, Uppsala University (Sweden) Stan Szpakowicz, University of Ottawa (Canada) Beata Trawinski, Institut f?r Deutsche Sprache (IDS), Mannheim (Germany) Yulia Tsvetkov, Carnegie Mellon University (USA) Yuancheng Tu, Microsoft (USA) Ruben Urizar, University of the Basque Country (Spain) Gertjan van Noord, University of Groningen (The Netherlands) Aline Villavicencio, Federal University of Rio Grande do Sul (Brazil) Veronika Vincze, Hungarian Academy of Sciences (Hungary) Martin Volk, University of Zurich (Switzerland) Tom Wasow, Stanford University (USA) Shuly Wintner, University of Haifa (Israel) Dekai Wu, The Hong Kong University of Science & Technology (Hong Kong) ------------------------- Workshop Organizers Valia Kordoni (Humboldt-Universit?t zu Berlin, Germany) Markus Egg (Humboldt-Universit?t zu Berlin, Germany) Agata Savary (Universit? Fran?ois Rabelais Tours, France; Special Track Organiser) Eric Wehrli (Universit? de Gen?ve, Switzerland; Special Track Organiser) Stefan Evert (Friedrich-Alexander-Universit?t Erlangen-N?rnberg, Germany) ------------------------- Contact For any inquiries regarding the workshop please send an email to mweworkshop.eacl2014 at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:12:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:12:31 +0100 Subject: Stage: Stage de master recherche en TAL, Paris Message-ID: Date: Sat, 9 Nov 2013 10:13:35 +0100 From: Frederic.Landragin at ens.fr Message-ID: <1383988415.527dfcbfec64a at mail.canoe.ens.fr> Proposition de stage de M2 Laboratoire Lattice & LTCI Telecom-ParisTech Titre : Mod?lisation d?actes communicatifs multimodaux pour un agent conversationnel anim? dans les dialogues humain-machine Descriptif : Les Agents Conversationnels Anim?s (ACA) sont des personnages virtuels permettant ? la machine de dialoguer avec les humains de mani?re naturelle. Ils peuvent prendre le r?le d?assistant comme les agents conversationnels pr?sents sur les sites de vente, de tuteur dans le cadre des Jeux S?rieux (Serious Games). Comment obtenir chez un ACA une expression naturelle des actes communicatifs? Avec quelles postures, quelles expressions faciales, quels gestes, quelle intonation, doit-on faire accompagner le discours d?un ACA dans un dialogue humain-machine ? Une attention particuli?re sera donn?e ? l?agencement des niveaux acoustique (intonation) et visuel (geste, regard, etc.) avec les aspects linguistiques de l??nonc? (syntaxe, s?mantique). On interrogera notamment les analyses classiques qui tendent ? simplifier, par exemple en consid?rant qu'? une question est associ? un contour prosodique montant, alors qu'un contour plat est souvent bien plus naturel. On interrogera ?galement les mat?rialisations d'un ordre en fonction du contexte socio-?motionnel : si en th?orie l'ordre fait partie des trois actes de langage classiques (par exemple au sens de la Th?orie de la Pertinence, Sperber & Wilson 1995), en pratique l'ordre direct est ressenti comme agressif et on lui pr?f?re un acte de langage indirect, comme une question ? valeur (cach?e) d'ordre. La notion d?acte de langage sera ?tendue ? celle d?acte communicatif afin d?int?grer les modalit?s non-verbales (Poggi et Pelachaud, 2000) et le sujet portera sur la mod?lisation des actes communicatifs multimodaux, et sur les cons?quences des choix qu?un syst?me de dialogue humain-machine peut effectuer. Les mod?les construits s?int?greront dans la plateforme Greta (Niewiadomski et al., 2011), qui permet de communiquer avec l?humain en g?n?rant chez l?agent une large palette de comportements expressifs verbaux et non verbaux (Bevacqua et al., 2012). Plusieurs cas d?application pourront ?tre envisag?s : dialogues d?entra?nement de jeunes en insertion sociale aux entretiens d?embauche (projet Tardis), dialogues entre un ACA et les visiteurs d?un mus?e (projet A1:1) Pour ce faire, le travail comportera les ?tapes suivantes : - Etude de dialogues Humain-Humain (TCOF, CID...), des dialogues Humain-Machine (SCNF, CIO) et de dialogues humain-ACA multimodaux (Corpus Semaine (Schr?der et al., 2011)), en comparant les actes communicatifs et actes de langage pr?sents dans ces corpus et leur r?alisation verbale et non verbale ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:30:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:30:31 +0100 Subject: Appel: EACL 2014 Workshop on Continuous Vector Space Models and their Compositionality Message-ID: Date: Wed, 13 Nov 2013 12:07:48 +0100 From: Alexandre Allauzen Message-ID: <52835D84.90709 at limsi.fr> ************************************************************************ Workshop on Continuous Vector Space Models and their Compositionality (2nd edition) Co-located with EACL 2014, Gothenburg, Sweden April 27, 2014 Submission deadline: January 23, 2014 https://sites.google.com/site/cvscworkshop2014 ************************************************************************ First Call for Papers (Apologies for multiple postings) In recent years, there has been a growing interest in algorithms that learn and use continuous representations for words, phrases, or documents in many natural language processing applications. Among many others, influential proposals that illustrate this trend include latent Dirichlet allocation, neural network based language models and spectral methods. These approaches are motivated by improving the generalization power of the discrete standard models, by dealing with the data sparsity issue and by efficiently handling a wide context. Despite the success of single word vector space models, they are limited since they do not capture compositionality. This prevents them from gaining a deeper understanding of the semantics of longer phrases or sentences. With the growing popularity of these neural and probabilistic methods of language processing, the scope of this second workshop is extended to theoretical and conceptual questions regarding: * their relation to unsupervised distributional representations, * the encompassing of the compositional aspects of formal models of semantics, * the role of linguistic theory in the design and development of these methods. Some such pertinent questions include: Should phrase representations and word representations be of the same sort? Could different linguistic levels require different modelling approaches? Is compositionality determined by syntax, and if so, how do we learn/define it? Should word representations be fixed and obtained distributionally, or should the encoding be variable? Should word representations be task-specific, or should they be general? In this workshop, we invite submissions of papers on continuous vector space models for natural language processing. Topics of interest include, but are not limited to: * learning algorithms for continuous vector space models, * their compositionality, * their use in NLP applications, * spectral learning for NLP, * neural networks for NLP, * phrase, sentence, and document-level distributional representations, * tensor models, * distributed semantic representations, * the role of syntax in compositional models, * formal and distributional semantic models. INVITED SPEAKERS The workshop will showcase presentations from two invited speakers : Geoffrey Zweig (Microsoft Research) and a second presenter to be announced soon. SUBMISSION INFORMATION Authors should submit a full paper of up to 8 pages in electronic, PDF format, with up to 2 additional pages for references. The reported research should be substantially original. The papers will be presented orally or as posters. All submissions must be in PDF format and must follow the EACL 2014 formatting requirements (http://www.eacl2014.org/files/eacl-2014-styles.zip ). Reviewing will be double-blind, and thus no author information should be included in the papers; self-reference should be avoided as well. Submissions must be made through the Softconf website set up for this workshop: https://www.softconf.com/eacl2014/CVSC/ Accepted papers will appear in the workshop proceedings, where no distinction will be made between papers presented orally or as posters. IMPORTANT DATES 23 January 2014 : Submission deadline 20 February 2014 : Notification of acceptance 3 March 2014 : Camera-ready deadline 27 April 2014 : Workshop ORGANIZERS Alexandre Allauzen (LIMSI-CNRS/Universit? Paris-Sud, France) Raffaella Bernardi (University of Trento, Italy) Edward Grefenstette (University of Oxford, UK) Hugo Larochelle (Universit? de de Sherbrooke, Canada) Christopher Manning (Stanford University, USA) Scott Wen-tau Yih (Microsoft Research, USA) PROGRAM COMMITTEE Nicholas Asher (IRIT-Toulouse) Marco Baroni (University of Trento) Yoshua Bengio (Universit? de Montr?al) Gemma Boleda (University of Texas) Antoine Bordes (Universit? Technologique de Compi?gne) Johan Bos (University of Groningen) L?on Bottou (Microsoft Research) Xavier Carreras (Universitat Polit?cnica de Catalunya) Lucas Champollion (New-York University) Stephen Clark (University of Cambridge) Shay Cohen (Columbia University) Ido Dagan (Bar Ilan University) Ronan Collobert (IDIAP Research Institute, Switzerland) Pino Di Fabbrizio (Amazon) Georgiana Dinu (University of Trento) Kevin Duh (Nara Institute of Science and Technology) Dean Foster (University of Pennsylvania) Alessandro Lenci (University of Pisa) Louise McNally (Universitat Pompeu Fabra) Fabio Massimo Zanzotto (Universit? degli Studi di Roma) Mirella Lapata (University of Edinburgh) Andriy Mnih (Gatsby Computational Neuroscience Unit) Larry Moss (Indiana University) Diarmuid ? Seaghdha (University of Cambridge) Sebastian Pado (Universit?t Stuttgart) Martha Palmer (University of Colorado) John Platt (Microsoft Research) Maarten de Rijke (University of Amsterdam) Mehrnoosh Sadrzadeh (University of London) Mark Steedman (University of Edinburgh) Chung-chieh Shan (Indiana University) Peter Turney (NRC) Jason Weston (Google) Guillaume Wisniewski (LIMSI-CNRS/Universit? Paris-Sud) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:27:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:27:10 +0100 Subject: Appel: IC 2014 Message-ID: Date: Tue, 12 Nov 2013 12:15:59 +0100 From: Nathalie Aussenac-Gilles Message-ID: <52820DEF.7090900 at irit.fr> X-url: http://www.irit.fr/IC2014 Appel ? communications pour les 25es Journ?es Francophones d'Ing?nierie des Connaissances : Connaissances pervasives: des utilisateurs plong?s dans des syst?mes ? base de connaissances et des syst?mes ? base de connaissances plong?s dans le monde http://www.irit.fr/IC2014 du 12 au 16 mai 2014 ? Clermont-Ferrand ------------------------------------------------------------------------ Dates importantes : Date limite de soumission des communications : jeudi 19 d?cembre 2013 Date de notification aux auteurs : jeudi 13 f?vrier 2014 Date limite de r?ception des textes d?finitifs : lundi 17 mars 2014 Dates de la conf?rence : du 12 au 16 mai 2014 ------------------------------------------------------------------------ La conf?rence d'Ing?nierie des Connaissances f?te cette ann?e ses 25 ans! Elle est le rendez-vous annuel de la communaut? fran?aise et francophone qui s'int?resse aux probl?matiques li?es ? l'ing?nierie des connaissances. Acad?miques et industriels s'y retrouvent pour ?changer et r?fl?chir sur des probl?mes de recherche qui se posent en acquisition, repr?sentation et gestion des connaissances. L'essor des sciences et technologies de l'information et de la communication, et notamment des technologies du web, dans l''ensemble de la soci?t? engendre des mutations dans les pratiques individuelles et collectives. L'ing?nierie des connaissances accompagne cette ?volution, en inventant les mod?les, m?thodes et outils permettant l''int?gration de connaissances et de raisonnements sur ces connaissances dans des environnements informatiques. De fait, on constate aujourd'hui une omnipr?sence des connaissances, en m?me temps qu'un d?cloisonnement des communaut?s de recherche en Intelligence Artificielle pour r?pondre aux probl?mes qui se posent. Ainsi, la construction des syst?mes ? base de connaissances fait appel ? l'ing?nierie des connaissances, au traitement automatique des langues, ? l'apprentissage automatique et ? la fouille de donn?es; le traitement des connaissances associe ing?nierie des connaissances avec recherche d'information, recherche op?rationnelle, analyse de donn?es; la mod?lisation des environnements informatiques, de ses acteurs humains ou logiciels, allie ing?nierie des connaissances et syst?mes multi-agents; enfin l'ing?nierie des connaissances touche ? des th?matiques classiques dans les communaut?s de l'interaction homme-machine et des environnements informatiques pour l'apprentissage humain. En pla?ant ainsi l'utilisateur au coeur des syst?mes informatiques, l'ing?nierie des connaissances est sollicit?e pour assister l'utilisateur dans le traitement de la masse de donn?es disponibles sur le web, pour les visualiser, contextualiser, expliquer, recommander, classer, pr?dire, approximer, s?curiser, fiabiliser, pour pallier ? leur impr?cision voire incoh?rence. Les th?mes d'IC 2014 sont les suivants (liste non exhaustive): Repr?sentation des connaissances et raisonnement - mod?les, formalismes, langages formels et informels de repr?sentation de connaissances - ?change, interop?rabilit? et r?utilisation des mod?les, standardisation - terminologies, thesauri, ontologies et lexiques - types d''ontologies et r?le des ontologies de r?f?rence - m?thodes et outils pour le cycle de vie des repr?sentations - gestion de la dynamique des ontologies (versionnement, ?volution, int?gration et alignement) - raisonnements logiques, inf?rences, raisonnements ? base de r?gles, - approximations, raisonnements statistiques, raisonnements par analogie, raisonnements ? partir de cas, raisonnements dans les logiques non classiques Conception et construction de mod?les de connaissances et d'ontologies - peuplement de mod?les de connaissances - acquisition de connaissances ? partir de textes - d?couverte interactive de connaissances dans les donn?es, dans les historiques, dans les interactions, sur le web, etc. - inf?rence et r?gles m?tier : acquisition, conception, r?utilisation, ?volution, ?valuation, exploitations - m?trique et ?valuation de la qualit? des ontologies Web de donn?es, web s?mantique - ouverture et interconnexion des donn?es - impact de l'ouverture des donn?es sur le web et de l'externalisation ouverte (crowdsourcing) sur l'ing?nierie des connaissances - r?seaux sociaux - gestion de flux de donn?es - passage ? l'?chelle : traitement de donn?es massives - traitement de donn?es h?t?rog?nes - provenance et confiance dans les donn?es - m?trique et ?valuation de la qualit? des donn?es Ing?nierie des connaissances centr?e utilisateurs - visualisation de connaissances, d'ontologies - visualisation d'interconnexions de donn?es, de raisonnements sur les donn?es - explication des raisonnements - profils utilisateurs, mod?les de contexte et adaptation, mod?les d'?motion - personnalisation de l'acc?s aux connaissances: confiance, recommandation, classement (ranking), r?sum? - assistance d'applications et de services: agents conversationnels - environnements informatiques pour l'apprentissage humain - conception et ?valuation d'interactions et d'interfaces avec des syst?mes ? base de connaissances Interdisciplinarit? de l'ing?nierie des connaissances - ?pist?mologie de l'ing?nierie des connaissances - th?orie des organisations et ing?nierie des connaissances - sciences humaines et sciences cognitives et ing?nierie des connaissances - ing?nierie des connaissances scientifiques Ing?nierie des connaissances pervasive : IC dans... - le traitement automatique des langues - l'apprentissage symbolique - la fouille de donn?es - la recherche d'information, l'indexation - la recherche op?rationnelle - l'analyse de donn?es - les syst?mes multi-agents - les environnements informatiques pour l'apprentissage humain - les interfaces homme-machine Applications - applications dans les domaines de la sant?, de l'?ducation et de l'apprentissage, de la culture, de la recherche documentaire, des transports intelligents, de l'informatique d?cisionnelle (BI), etc. - ?mergence de nouveaux domaines applicatifs - m?moires d'entreprises - syst?mes pour la collaboration et la coop?ration dans les organisations et les collectifs ------------------------------------------------------------------------ Soumissions : Articles longs(12 pages (nouveau format), pr?sentation orale de 20 mn, 10 mn discussion) : Sont concern?s des travaux aboutis, pr?sentant des r?sultats valid?s ou des synth?ses fouill?es. Articles courts(6 pages (nouveau format), pr?sentation orale de 10 mn, 5 mn discussion) : Sont concern?s des travaux en cours ou au stade de r?sultats partiels de recherche ou appliqu?s. Ce type de soumission correspond ? des travaux innovants de qualit?, mais dont la maturit? ne permet pas des ?laborations compl?tes et des conclusions d?finitives. Les articles devront respecter les styles de documents indiqu?s sur le site de la conf?rence: http://www.irit.fr/IC2014. Les auteurs sont invit?s ? soumettre leurs communications au format PDF sur EasyChair: https://www.easychair.org/conferences/?conf=ic2014. Les articles accept?s feront l'objet d''actes en version ?lectronique, publi?s sur HAL, et disponibles sur une cl? USB distribu?e aux participants de la conf?rence. Un prix AFIA du meilleur article sera d?cern? par un jury compos? de membres du comit? de pilotage de la conf?rence. ------------------------------------------------------------------------ La conf?rence d'Ing?nierie des Connaissances est plac?e sous l'?gide du coll?ge IC de l'AFIA ------------------------------------------------------------------------ Pr?sidente du comit? de programme : Catherine Faron Zucker (I3S, Universit? Nice Sophia Antipolis) Pr?sidente du comit? d'organisation : Catherine Roussey (Irstea) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:20:31 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:20:31 +0100 Subject: Appel: MediaEval 2014, Call for Task Proposals Message-ID: Date: Mon, 11 Nov 2013 09:37:58 +0000 From: POPESCU Adrian 211643 Message-ID: X-url: http://www.multimediaeval.org/mediaeval2014 MediaEval 2014 Call for Task Proposals MediaEval Multimedia Benchmark http://www.multimediaeval.org/mediaeval2014 ***Task proposal submission deadline: 21 December 2013*** __________________________________________________________ MediaEval is a benchmarking initiative dedicated to evaluating new algorithms for multimedia access and retrieval. It emphasizes the 'multi' in multimedia and focuses on human and social aspects of multimedia tasks. MediaEval is calling for proposals for tasks from researchers in academia and industry to run in the 2014 benchmarking season. The proposal should contain the following elements: - Name of the task, - Short description of the use scenario underlying the task (Who would ultimately use the technology developed to address this task?), - Short description of the task (What is the problem that task participants will be expected to solve?), - Description of the data to be used, including a statement on how it is to be licensed (Note that MediaEval encourages the use of Creative Commons data wherever possible.), - Description of how the ground truth will be obtained, - Statement of the evaluation metric and/or methodology, - Brief statement of how the task is different from existing tasks in other benchmarks and/or how it extends the previous year?s MediaEval task (if applicable), - Brief statement of why the task is a MediaEval task (Does the task involve a strong social or human component?), - Examples (2-3) of recommended reading (i.e., references of papers that you would expect participants to have read before attempting the task), - Name and contact information for the members of the proposing team (Please include a couple sentences about the composition/history of the team. New collaborations are explicitly encouraged.), - Summary (200-300 words) of the motivation, task, data and evaluation in a form suitable for the survey (i.e., a condensed version including the most important points from above), - The survey asks if people are interested in the task, and also asks questions that gather people's input on certain task design decisions. Please add 4-7 questions that you would like potential participants to ask about the task. For the last two points, it is helpful to refer to last years survey to see the format of the task description and the type of questions. http://www.multimediaeval.org/docs/MediaEval2013_SurveyForm_FInal.pdf There is no particular length specification for the proposal, some tasks will require more explanation than others. However, proposals are easier to manage if they are concise: in general, they should not exceed two pages. Please email your proposal (as a .pdf) to Martha Larson m.a.larson at tudelft.nl and Gareth Jones gareth.jones at computing.dcu.ie by December 21, 2013. __________________________________________________________ Task proposals are accepted on the basis of the existence of a community of task supporters (i.e., researchers who are interested and would plan to participate in the task). Support is determined using a survey, which is circulated widely to the multimedia research community at the beginning of the year (January 2014). Task decisions are made mid-February. Tasks must also be viable given the design of the task and the resources available to the task organization team. We encourage task proposers to join forces with colleagues from other institutions and other projects to create an organizing team large enough to bear the burden of data set generation, results evaluation, and working notes paper review. Please contact Martha Larson m.a.larson at tudelft.nl if you have questions about task organization or if you are interested in being connected up with other people with similar interests and who could join together to form a task organizer team. MediaEval has been experiencing steady growth since it was founded in 2008 as a track called "VideoCLEF" within the CLEF benchmark campaign. In 2010, it became an independent benchmark and in 2012 it ran for the first time as a fully "bottom-up benchmark", meaning that it is organized for the community, by the community, independently of a "parent" project. The MediaEval benchmarking season culminates with the MediaEval workshop. Participants come together at the workshop to present and discuss their results, build collaborations, and develop future task editions or entirely new tasks. Past working notes proceedings of the workshop include: MediaEval 2012: http://ceur-ws.org/Vol-807/ MediaEval 2013: http://ceur-ws.org/Vol-1043/ Example tasks that have run in past years are: - Placing Task: Predict the geo-coordinates of user-contributed photos. - Tagging Task: Automatically assign tags to user-generated videos. - Spoken Web Search: Search FOR audio content WITHIN audio content USING an audio content query. - Search and Hyperlinking: Multi-modal search and automated hyperlinking of user-generated and commercial video. - Social Event Detection: Find multimedia items related to a particular event within a social multimedia collection. - Violent Scenes Detection Task: Automatically detect violence in movies. We expect the MediaEval 2014 workshop to be held in October 2014 in Europe, possibly returning to the venue of the MediaEval 2013 workshop in Barcelona. For more information on the MediaEval Multimedia benchmark, please visit http://www.multimediaeval.org/ or contact Martha Larson m.a.larson at tudelft.nl. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:16:05 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:16:05 +0100 Subject: Appel: EACL 2014 Workshop on Cognitive Aspects of Computational Language Learning Message-ID: Date: Sat, 9 Nov 2013 21:52:56 +0100 From: Thierry Poibeau Message-Id: [Apologies for cross-postings] ================================================== First Call for Papers ================================================== EACL 2014 Workshop on Cognitive Aspects of Computational Language Learning April 26, 2014 Gothenburg, Sweden https://sites.google.com/site/cognitivews2014/ Deadline for Paper Submissions: January, 23rd, 2014 (11:59pm GMT -12) --------------------------------------------------------------- The human ability to acquire and process language has long attracted interest and generated much debate due to the apparent ease with which such a complex and dynamic system is learnt and used on the face of ambiguity, noise and uncertainty. This subject raises many questions ranging from the nature vs. nurture debate of how much needs to be innate and how much needs to be learned for acquisition to be successful, to the mechanisms involved in this process (general vs specific) and their representations in the human brain. There are also developmental issues related to the different stages consistently found during acquisition (e.g. one word vs. two words) and possible organizations of this knowledge. These have been discussed in the context of first and second language acquisition and bilingualism, with cross linguistic studies shedding light on the influence of the language and the environment. The past decades have seen a massive expansion in the application of statistical and machine learning methods to natural language processing (NLP). This work has yielded impressive results in numerous speech and language processing tasks, including e.g. speech recognition, morphological analysis, parsing, lexical acquisition, semantic interpretation, and dialogue management. The good results have generally been viewed as engineering achievements. Recently researchers have begun to investigate the relevance of computational learning methods for research on human language acquisition and change. The use of computational modeling is a relatively recent trend boosted by advances in machine learning techniques, and the availability of resources like corpora of child and child-directed sentences, and data from psycholinguistic tasks by normal and pathological groups. Many of the existing computational models attempt to study language tasks under cognitively plausible criteria (such as memory and processing limitations that humans face), and to explain the developmental stages observed in the acquisition and evolution of the language abilities. In doing so, computational modeling provides insight into the plausible mechanisms involved in human language processes, and inspires the development of better language models and techniques. These investigations are very important since if computational techniques can be used to improve our understanding of human language acquisition and change, these will not only benefit cognitive sciences in general but will reflect back to NLP and place us in a better position to develop useful language models. Success in this type of research requires close collaboration between the NLP, linguistics, psychology and cognitive science communities. The workshop is targeted at anyone interested in the relevance of computational techniques for understanding first, second and bilingual language acquisition and language change in normal and clinical conditions. Long and short papers are invited on, but not limited to, the following topics: * Computational learning theory and analysis of language learning and organization * Computational models of first, second and bilingual language acquisition * Computational models of language changes in clinical conditions * Computational models and analysis of factors that influence language acquisition and use in different age groups and cultures * Computational models of various aspects of language and their interaction effect in acquisition, processing and change * Computational models of the evolution of language * Data resources and tools for investigating computational models of human language processes * Empirical and theoretical comparisons of the learning environment and its impact on language processes * Cognitively oriented Bayesian models of language processes * Computational methods for acquiring various linguistic information (related to e.g. speech, morphology, lexicon, syntax, semantics, and discourse) and their relevance to research on human language acquisition * Investigations and comparisons of supervised, unsupervised and weakly-supervised methods for learning (e.g. machine learning, statistical, symbolic, biologically-inspired, active learning, various hybrid models) from a cognitive perspective --------------------------------------------------------------- SUBMISSIONS We invite three different submission modalities: * Regular long papers (8 content pages + 1 page for references): Long papers should report on original, solid and finished research including new experimental results, resources and/or techniques. * Regular short papers (4 content pages + 1 page for references): Short papers should report on small experiments, focused contributions, ongoing research, negative results and/or philosophical discussion. * System demonstration (2 pages): System demonstration papers should describe and document the demonstrated system or resources. We encourage the demonstration of both early research prototypes and mature systems, that will be presented in a separate demo session. All submissions must be in PDF format and must follow the EACL 2014 formatting requirements (available at http://www.eacl2014.org/files/eacl-2014-styles.zip). We strongly advise the use of the provided Word or LaTeX template files. For long and short papers, the reported research should be substantially original. The papers will be presented orally or as posters. The decision as to which paper will be presented orally and which as poster will be made by the program committee based on the nature rather than on the quality of the work. Reviewing will be double-blind, and thus no author information should be included in the papers; self-reference should be avoided as well. Papers that do not conform to these requirements will be rejected without review. Accepted papers will appear in the workshop proceedings, where no distinction will be made between papers presented orally or as posters. Submission and reviewing will be electronic, managed by the START system. Submissions must be uploaded onto the START system by the submission deadline: January 23rd, 2014 (11:59pm GMT -12 hours) Please choose the appropriate submission type from the START submission page, according to the category of your paper. --------------------------------------------------------------- IMPORTANT DATES Jan 23, 2014 Long and Short Paper submission deadline Feb 05, 2014 System Demonstrations submission deadline Feb 20, 2014 Notification of acceptance Mar 03, 2014 Camera-ready deadline Apr 26, 2014 Workshop --------------------------------------------------------------- PROGRAM COMMITTEE Afra Alishahi Tilburg University (Netherlands) Colin J Bannard University of Texas at Austin (USA) Marco Baroni University of Trento (Italy) Robert Berwick Massachusetts Institute of Technology (USA) Philippe Blache LPL, CNRS (France) Jim Blevins University of Cambridge (UK) Antal van den Bosch Radboud University Nijmegen (Netherlands) Chris Brew Nuance Communications (USA) Ted Briscoe University of Cambridge (UK) Alexander Clark Royal Holloway, University of London (UK) Robin Clark University of Pennsylvania (USA) Stephen Clark University of Cambridge (UK) Matthew W. Crocker Saarland University (Germany) Walter Daelemans University of Antwerp (Belgium) Dan Dediu Max Planck Institute for Psycholinguistics (The Netherlands) Barry Devereux University of Cambridge (UK) Benjamin Fagard Lattice-CNRS (France) Jeroen Geertzen University of Cambridge (UK) Ted Gibson Massachusetts Institute of Technology (USA) Henriette Hendriks University of Cambridge (UK) Marco Idiart Federal University of Rio Grande do Sul (Brazil) Mark Johnson Brown University (USA) Aravind Joshi University of Pennsylvania (USA) Gianluca Lebani University of Pisa (Italy) Igor Malioutov Massachusetts Institute of Technology (USA) Marie-Catherine de Marneffe The Ohio State University (USA) Maria Alice Parente Federal University of ABC (Brazil) Massimo Poesio University of Trento (Italy) Brechtje Post University of Cambridge (UK) Ari Rappoport The Hebrew University of Jerusalem (Israel) Anne Reboul L2C2-CNRS (France) Kenji Sagae University of Southern California (USA) Sabine Schulte im Walde University of Stuttgart (Germany) Ekaterina Shutova University of California, Berkeley (USA) Maity Siqueira Federal University of Rio Grande do Sul (Brazil) Mark Steedman University of Edinburgh (UK) Suzanne Stevenson University of Toronto (Canada) Remi van Trijp Sony Computer Science Laboratory Paris (France) Shuly Wintner University of Haifa (Israel) Charles Yang University of Pennsylvania (USA) Beracah Yankama Massachusetts Institute of Technology (USA) Menno van Zaanen Tilburg University (Netherlands) Alessandra Zarcone University of Stuttgart (Germany) --------------------------------------------------------------- WORKSHOP ORGANIZERS AND CONTACT Alessandro Lenci (University of Pisa, Italy) Muntsa Padr? (Federal University of Rio Grande do Sul, Brazil) Thierry Poibeau (LATTICE-CNRS, France) Aline Villavicencio (Federal University of Rio Grande do Sul, Brazil) For any inquiries regarding the workshop please send an email to cognitive2014 at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:28:50 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:28:50 +0100 Subject: Appel: RJCIA 2014 Message-ID: Date: Tue, 12 Nov 2013 17:59:56 +0100 From: Gr?gory Bonnet Message-ID: <52825E8C.3060902 at unicaen.fr> X-url: http://rjcia2014.greyc.fr X-url: http://rfia2014.univ-rouen.fr/ -- Merci de diffuser aussi largement que possible cet appel, en particulier au sein des associations de doctorants et des listes de diffusion de vos ?coles doctorales et laboratoires. Veuillez excuser les r?ceptions multiples. -- ********************************************************************** Appel ? communications RJCIA 2014 12?mes Rencontres des Jeunes Chercheurs en Intelligence Artificielle 30 juin - 1er juillet 2014, Rouen, France http://rjcia2014.greyc.fr ********************************************************************** Pr?sentation Les douzi?mes rencontres des jeunes chercheurs en Intelligence Artificielle (RJCIA 2014) se d?rouleront du 30 juin au 1er juillet 2014 ? Rouen. Ces rencontres sont h?berg?es par RFIA'14 (Reconnaissance des Formes et l'Intelligence Artificielle), organis?e par le laboratoire LITIS et ses ?tablissements de tutelle l'INSA de Rouen, l'Universit? de Rouen et l'Universit? du Havre, au nom de l'Association Fran?aise d'Intelligence Artificielle (AFIA) et de l'Association Fran?aise de Reconnaissance et d'Interpr?tation des Formes (AFRIF). Les RJCIA 2014 sont destin?es aux jeunes chercheurs en Intelligence Artificielle : doctorants ou titulaires d'un doctorat depuis moins d'un an. L'objectif de cette manifestation est double : 1) permettre aux jeunes chercheurs pr?parant une th?se en Intelligence Artificielle, ou l'ayant soutenue depuis peu, de se rencontrer et de pr?senter leurs travaux, et ainsi de former des contacts avec d'autres jeunes chercheurs et d'?largir leurs perspectives en ?changeant avec des sp?cialistes d'autres domaines de l'Intelligence Artificielle ; 2) former les jeunes chercheurs ? la pr?paration d'un article, ? sa r?vision pour tenir compte des observations du comit? de programme, et ? sa pr?sentation devant un auditoire de sp?cialistes, leur permettant ainsi d'obtenir des retours de chercheurs de leur domaine ou de domaines connexes. Pour tout renseignement compl?mentaire, s'adresser ? Gr?gory Bonnet (gregory.bonnet[at]unicaen.fr), pr?sident du comit? de programme. Appel ? communication Les RJCIA 2014 ont pour vocation de compl?ter le panorama de la recherche francophone en Intelligence Artificielle propos? par RFIA'14 en pr?sentant des travaux de jeunes chercheurs dans ce domaine. Ainsi, toute contribution relevant de l'Intelligence Artificielle est la bienvenue. La liste indicative des th?matiques ci-dessous n'est pas exhaustive. Apprentissage artificiel (supervis?, non supervis?, par renforcement) Fouille de masse de donn?es, fouille de grands graphes, fouille de texte Extraction et utilisation de connaissances par et pour la fouille (de masses) de donn?es Satisfaction de contraintes Repr?sentation des connaissances, mod?les de raisonnement, raisonnement, planification Agents autonomes et syst?mes multi-agents (d?cision individuelle, collective, interactions) Informatique ?motionnelle, agent virtuel socio-?motionnel, interaction humain-agent Robotique autonome, contr?le intelligent, aide ? la d?cision dans les syst?mes robotiques Gestion des connaissances : mod?lisation, organisation, optimisation et traitement Traitement automatique des langues Donn?es li?es, donn?es ouvertes, publication de donn?es Masse de donn?es, Web de donn?es, web s?mantique, ontologies. Extraction d'information, indexation s?mantique de contenu Visualisation de donn?es et de connaissances Validation, ?valuation des syst?mes d'Intelligence Artificielle Applications de l'Intelligence Artificielle (m?decine, transport, agronomie, droit) Conditions de soumission Les auteurs sont invit?s ? soumettre des propositions d'articles de 6 pages double colonne maximum selon le style propos? par RFIA'14. dans l'une des deux cat?gories suivantes : Communications de synth?se : Les RJCIA 2014 sont l'occasion pour les doctorants de premi?re ann?e de pr?senter leur sujet de th?se au travers d'une communication de synth?se. Cette derni?re permet de pr?senter un ?tat de l'art, d'identifier des probl?matiques et/ou de proposer de premi?re pistes de travail. Les auteurs sont encourag?s ? clairement d?crire le contexte de leur travaux et de mettre en lumi?re les probl?mes rencontr?s. Communications de recherche : Les RJCIA 2014 invitent aussi les jeunes chercheurs plus confirm?s ? pr?senter des travaux de recherche originaux th?oriques, exp?rimentaux ou ? vocation op?rationnelle. Une rigueur devra ?tre apport?e ? la r?daction des articles, tant sur le plan de la forme que sur celui du contenu scientifique. Les jeunes chercheurs qui le souhaitent sont ?galement invit?s ? soumettre leur communication ? la session IA de RFIA'14. Les auteurs sont invit?s ? indiquer lors de la soumission la cat?gorie dans laquelle s'inscrit leur proposition. Le premier auteur de la communication doit ?tre doctorant ou docteur depuis moins d'un an (th?se en cours, ou soutenue en 2013). Aucune exclusivit? n'est demand?e : nous souhaitons que les articles soumis dans les conf?rences ou ateliers internationaux puissent ?galement ?tre propos?s aux RJCIA 2014. La langue de la conf?rence est le fran?ais de pr?f?rence, ou l'anglais sinon. Chaque soumission sera relue par au moins trois membres du comit? de programme. Les crit?res de relecture incluent l'originalit? des id?es, la qualit? technique, l'importance des r?sultats et la qualit? de la pr?sentation. Dates importantes Ouverture du site de soumissions : 6 janvier 2014 Date limite de soumission : 17 f?vrier 2014 Notification aux auteurs : 25 avril 2014 R?ception des versions d?finitives : 16 mai 2014 RJCIA 2014 : lundi 30 juin et mardi 1er juillet 2014 Soumission d'articles Le format de soumission est disponible sur le site de la conf?rence : http://rjcia2014.greyc.fr Les soumissions se sont font via Easychair : https://www.easychair.org/conferences/?conf=rjcia2014 Comit? de programme (en cours de constitution) Nicolas B?chet, IRISA, Universit? de Bretage-Sud Lamia Belouaer, IRENav, Ecole Navale Gr?gory Bonnet, GREYC, Universit? de Caen Basse-Normandie Elise Bonzon, LIPADE, Universit? Paris Descartes Gauvain Bourgne, LIP6, Universit? Pierre et Marie Curie Sylvain Bouveret, LIG, INP Grenoble Am?lie Cordier, LIRIS, Universit? Lyon 1 Jean-Marie Lagniez, CRIL, Universit? d'Artois Marie Lefevre, LIRIS, Universit? Lyon 1 Benoit Mathern, LIRIS, Universit? Lyon 1 La?titia Matignon, LIRIS, Universit? Lyon 1 Alexandre Niveau, GREYC, Universit? de Caen Basse-Normandie Antoine Nongaillard, DISP, Universit? Lyon 2 Alexandre Pauchet, LITIS, INSA Rouen C?dric Pralet, Onera Mathieu Roche, TETIS, Cirad St?phanie Roussel, CRIL Karima Sedki, Lim&Bio, Universit? Paris 13 Informations pratiques Consultez le site de RFIA'14 (http://rfia2014.univ-rouen.fr/) afin d'obtenir les informations pratiques pour s'inscrire et se rendre au LITIS. Pour le comit? de programme des RJCIA 2014, Gr?gory Bonnet ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:25:07 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:25:07 +0100 Subject: Appel: ESWC 2014, Second Call for Tutorials Message-ID: Date: Mon, 11 Nov 2013 19:45:25 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131111184545.4003DDBA9E at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/call-tutorials ** apologies for cross-posting ** ==== Second Call for Tutorials ==== http://2014.eswc-conferences.org/important-dates/call-tutorials ESWC 2014 invites tutorials that address the interests of its varied audience: people new to the Semantic Web, Semantic Web researchers and practitioners that wish to learn new technologies, users of Semantic Web technologies, and representatives of government and funding agencies as well as potential private investors in Semantic Web technologies. We welcome submissions of tutorial proposals on all major topics related to semantic technologies. We especially solicit proposals for tutorials of the following types: - Tutorials with a coherent theme providing an introduction to new semantic technologies and trends. - Tutorials describing the application of semantic technologies in specific domains (e.g., life-sciences, e-government, e-commerce, cultural heritage, etc.). - Tutorials presenting techniques from other research fields that are of relevance for Semantic Web research especially in relationship to the tracks of the conference (e.g., techniques from social science, database techniques, NLP techniques etc.). Tutorials can be half a day or a full day. We advise having more than one presenter and no more than three, preferably from different institutions, bringing different perspectives to the tutorial topic. Tutorials may focus entirely on theoretical aspects; however, we encourage organisers to incorporate hands-on sessions where appropriate. The tutorials should reach a good balance between the topic coverage and its relevance to the community. Timeline for Tutorials ----------- Proposals due: Nov 22, 2013 - 23:59 Hawaii Time Notification of acceptance: Dec 6, 2013 - 23:59 Hawaii Time Tutorial Web site due: Dec 16, 2013 - 23:59 Hawaii Time Camera-ready material due: Apr 25, 2014 - 23:59 Hawaii Time Tutorial days: May 25 and May 26, 2014 Responsibilities ----------- Organizers of accepted tutorials are responsible for preparing and maintaining a Web site that describes the tutorial and includes all relevant information. Organizers are also responsible for submitting the material for attendees (slide sets, additional teaching material, software installation and usage guides for practical hands-on sessions, etc.) to the Tutorial Chair. The ESWC 2014 Organizing Committee is responsible for providing publicity for the tutorials as part of the conference publicity activities, and on-site logistical support to the organizers and attendees. Tutorial attendees must pay the ESWC 2014 workshop registration fee, as well as the conference registration fee. General Information ----------- Each tutorial will have one reduced registration fee (pre-conference days registration will be free i.e. one of the chairs will only have to pay the main conference fees). In the interest of the overall quality of the conference, the Tutorial Chair reserves the right to merge tutorials and/or adjust the scope thereof in case a mimimum number of registrations is not reached by the early registration deadline. Submission details ----------- Tutorial proposals should not exceed 5 pages, using an 11 pt font for the body of the text of the proposal and should contain the following information: - Abstract (200 words maximum, for inclusion on the ESWC 2014 website). - Tutorial description: More specifically, it should specify the objectives of the tutorial and relevance to ESWC 2014, include enough details on the scope of the material to be covered and the depth to which it will be covered and specify the intended audience and any prerequisite knowledge. Appropriate references to the material to be covered by the tutorial must be included. - Tutorial length. The tutorial can be full or half day (if the tutorial can be either length, please be sure to identify which material is included for each length). - Specify other venues to which the tutorial or part thereof has or will be presented, in addition to explaining how the current tutorial differs from the other editions. Links to the slides of those tutorial editions should be included in the proposal. - Brief professional biography of the presenter(s) indicating previous training and speaking experience (such as teaching and tutorial presentation). Each proposal will be reviewed by the members of the tutorial programme committee, and ranked based on the overall quality of the proposal and the tutorial's fit to the conference. Their recommendation will determine the final decision on the acceptance/rejection of each proposal. Submission ----------- Submission will be through the Easychair system (please note that it is the same site to submit workshops and tutorials) https://www.easychair.org/conferences/?conf=eswc2014workshops-tutorials Tutorials Chair Nathalie Aussenac-Gilles (IRIT-CNRS, Toulouse, Fr) email: aussenac at irit.fr From thierry.hamon at UNIV-PARIS13.FR Wed Nov 13 14:22:37 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Wed, 13 Nov 2013 15:22:37 +0100 Subject: Appel: PITR Workshop at EACL 2014 Message-ID: Date: Mon, 11 Nov 2013 18:05:10 +0000 From: Sandra.Williams Message-ID: <54822479-0E2A-4911-A14F-608429BCAAA8 at open.ac.uk> X-url: http://mcs.open.ac.uk/nlg/pitr2014/ First Call for Papers: The 3rd Workshop on Predicting and Improving Text Readability for Target Reader Populations (PITR2014) 27th April 2014 in conjunction with EACL 2014, Gothenburg, Sweden http://mcs.open.ac.uk/nlg/pitr2014/ Submission deadline: 23rd January 2014 Many NLP systems generate or reformulate human languages but how readable is the output? What makes language easy, difficult, or, indeed, a pleasure to read for different types of readers? How can existing text be manipulated to improve information access? How does the style of writing, formal vs informal, informational vs. entertaining, affect readability, user comprehension, and/or appreciation of text? The last few years have seen a resurgence of interest in these questions amongst computational linguists as attention turns to more sophisticated techniques for textual presentation and to address the widely differing needs of end users. PITR is a cross-disciplinary workshop bringing together researchers in fields concerned with the readability, accessibility, and quality of text. We are keen to widen the scope to include researchers who might not normally attend a computational linguistics conference, e.g., psycholinguists, sociolinguists, assistive technology and educational researchers. We would welcome papers on: * Reformulation of existing text (text-to-text systems) * Generation of readable language from data (data-to-text systems) * Generation of text in specific styles and registers for readability * Evaluation of language simplification strategies * Evaluation of the readability and quality of computer-generated text * Evaluation of the readability and quality of machine translation output * Prediction of aspects of text style related to readability * Prediction of the readability of documents * Readability issues in specialist texts such as questionnaires, exam questions, safety instructions, etc. * Novel evaluation strategies for assessing text readability * Novel readability metrics * Techniques for simplifying lexis * Techniques for simplifying syntax * Techniques for simplifying discourse properties (making text more transparent, etc.) * Techniques for manipulating textual layout to improve accessibility * Techniques for making descriptions of numerical quantities more accessible * Techniques for making technical terminology more accessible * Techniques for making descriptions of logical statements more accessible * Techniques for explaining complex ideas through accessible text * Systems aimed at adults with poor literacy * Systems aimed at children learning to read * Systems aimed at 2nd language learners * Systems aimed at people with language deficits (aphasia, deafness, neurodegeneration, etc.) * Systems aimed at non-experts accessing technical material * Models of text quality for competent language users * Models to predict reader interest and engagement * Models of text style with application to readability SUBMISSIONS Papers should prepared in EACL format (see under 'Submission Format' at http://eacl2014.org/call-for-papers). They should not exceed 8 pages in length plus up to 2 additional pages for references. These are maximum lengths; shorter papers are also acceptable. Papers should be anonymised for blind reviewing. Please submit your paper via the online START Conference Manager system: https://www.softconf.com/eacl2014/PITR/ Some authors will be invited to give oral presentations. All accepted authors will be expected to present a poster. Last year, the poster session was very lively, giving poster-only authors and oral-presentation authors ample opportunities to discuss their research. IMPORTANT DATES Submission deadline: 23rd January 2014 Notification: 20th February 2014 Camera-ready: 3rd March 2014 Workshop: 27th April 2014 PROGRAMME COMMITTEE Stefan Bott, Universitat Pompeu Fabra, Spain Kevyn Collins-Thompson, University of Michigan, USA Siobhan Devlin, University of Sunderland, UK Micha Elsner, Ohio State University, USA Richard Evans, University of Wolverhampton, UK Oliver Ferschke (instead of Iryna) Thomas Francois, University of Louvain, Belgium Caroline Gasperin, SwiftKey, UK Albert Gatt, University of Malta, Malta Raquel Hervas, Universidad Complutense de Madrid, Spain Veronique Hoste, University College Ghent, Belgium Matt Huenerfauth, The City University of New York (CUNY), USA David Kauchak, Middlebury College, USA Annie Louis, University of Edinburgh, UK Ruslan Mitkov, University of Wolverhampton, UK Hitoshi Nishikawa, NTT, Japan Ehud Reiter, University of Aberdeen, UK Matthew Shardlow, Uni of Manchester, UK Lucia Specia, University of Sheffield, UK Ivelina Stoyanova, BAS, Bulgaria Irina Temnikova, University of Wolverhampton, UK Sowmya Vajjala, Uni Tuebingen, Germany Ielka van der Sluis, University of Groningen, The Netherlands Jennifer Williams, MIT, USA Kristian Woodsend, University of Edinburgh, UK ORGANISERS Sandra Williams, The Open University, UK Advaith Siddharthan, University of Aberdeen, UK Ani Nenkova, University of Pennsylvania, USA From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:49:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:49:10 +0100 Subject: Appel: Journal of Language Modelling Message-ID: Date: Thu, 14 Nov 2013 11:10:56 +0100 From: Yannick Parmentier Message-ID: <20131114101056.GD3777 at nausicaa> X-url: http://jlm.ipipan.waw.pl/ **Apologies for cross-posting. Please post or distribute.** 2nd CALL FOR PAPERS Journal of Language Modelling SPECIAL ISSUE ON High-level Methodologies for Grammar Engineering http://jlm.ipipan.waw.pl/ Special Issue Description ------------------------- Many grammatical frameworks have been proposed over the last decades to describe the syntax (and semantics) of natural language. Among the most widely used, one may cite (in chronological order) Tree-Adjoining Grammar (TAG) [Joshi et al., 1975], Lexical-Functional Grammar (LFG) [Bresnan and Kaplan, 1982], Combinatory Categorial Grammar (CCG) [Steedman, 1987], or Head- driven Phrase Structure Grammar (HPSG) [Pollard and Sag, 1994]. These frameworks present theoretical and practical interests. From a theoretical point of view, they provide a formal device for the linguist to experiment with her/his theories. >From a practical point of view, they make it possible to automatically process natural language in applications such as dialog systems, machine translation, etc. They differ in their expressivity and complexity. Some prove more suitable for the description of a given language than others. Still, for many of these frameworks, large resources (e.g., grammars) have been designed, at first by hand, and later via dedicated tools (e.g., integrated grammar environments such as XLE for LFG [King et al., 2000]). In this Special Issue, we are concerned with this complex task of grammar engineering, keeping in mind the two above-mentioned theoretical and practical interests. Topics of Interest ------------------ This special issue welcomes contributions from the following topics (without being limited to these): 1. New or updated work on the traditional topics of GEAF workshops The traditional topics in the series of "Grammar Engineering Accross Frameworks" workshops, "Formal Grammar" conferences and / or the "High-level Methodologies for Grammar Engineering" ESSLLI 2013 workshop are appropriate. The submitted paper must clearly deal with language modelling. An extended version of a workshop/conference paper can be submitted, provided that the contribution has been substantially updated. The forums for any preliminary versions of the paper must be indicated. 2. Study of new fundamental and / or applied results in relation with grammar development, maintenance and enhancement - dedicated description languages for grammar engineering - semi-automatic acquisition of grammars - development of grammars for under-resourced languages - cross-framework grammar engineering - cross-language grammar engineering - seamless construction of grammars from dynamically changing linguistic descriptions - designs of weighted grammars - efficient and dynamic construction of structures from updated rules or logical formulas 3. Study of new methods for grammar engineering and their applications - debugging environments for grammar design - systems based on large-scale grammars 4. In addition, the topics of interest include reports on implementations - new kinds of implementations of grammar compilers, libraries and on-demand operations - benchmarks suitable for evaluation of grammars - methods that construct, minimize or decompose grammars Important Dates --------------- - Deadline for submissions: 2 February 2014 - First decision: 12 May 2014 - Submission of revised version: 17 July 2014 - Final decision: 22 September 2014 - Submission of camera-ready versions: 19 October 2014 Submission ---------- Articles submitted to this special issue must adhere to the JLM instructions for contributors and use the JLM's style files, see: http://jlm.ipipan.waw.pl/about/submissions#authorGuidelines Paper submissions should be made through JLM's electronic submission system: http://jlm.ipipan.waw.pl/about/submissions#onlineSubmissions All submitted articles should be anonymous and any obvious self-references should be avoided. The contribution of the paper must be substantial. All articles will be evaluated by at least 3 reviewers, including at least one member of JLM's Editorial Board, and at least one member of the issue's Guest Editorial Board. Editorial Board --------------- Guest Editors - Denys Duchier, Universit? d'Orl?ans, FRANCE - Yannick Parmentier, Universit? d'Orl?ans, FRANCE Guest Editorial Board - Emily Bender, University of Washington, USA - Philippe Blache, CNRS, Universit? d'Aix-en-Provence, FRANCE - Eric De La Clergerie, INRIA Paris, FRANCE - Beno?t Crabb?, Universit? Diderot Paris 7, FRANCE - Berthold Crysmann, CNRS Paris, FRANCE - Denys Duchier, Universit? d'Orl?ans, FRANCE - Claire Gardent, CNRS/LORIA, Nancy, FRANCE - Joseph Le Roux, Universit? Paris Nord, FRANCE - Timm Lichte, Universit?t D?sseldorf, GERMANY - Montserrat Marimon, Universitat de Barcelona, SPAIN - Yusuke Miyao, National Institute of Informatics, Tokyo, JAPAN - Stefan M?ller, Freie Universit?t Berlin, GERMANY - Yannick Parmentier, Universit? d'Orl?ans, FRANCE Contact ------- Yannick Parmentier Department of Computer Science, University Institute of Technology University of Orl?ans firstname (dot) lastname (at) univ-orleans (dot) fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:49:57 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:49:57 +0100 Subject: Appel: CICLing 2014 / NLP - Nepal - Springer LNCS Message-ID: Date: Thu, 14 Nov 2013 05:54:02 -0600 From: "Alexander Gelbukh \(CFP\)" Message-ID: <000b01cee130$3a010bf0$ae0323d0$@cicling.org> CICLing 2014 15th International Conference on Intelligent Text Processing and Computational Linguistics Kathmandu, Nepal - April 6-12, 2014 Springer LNCS, journals Deadline: Dec 31 / Jan 7 www.CICLing.org/2014 TOPICS: All topics related to computational linguistics, natural language processing, human language technologies, information retrieval, opinion mining, etc. PUBLICATION: LNCS - Springer Lecture Notes in Computer Science; poster session: special issues of journals KEYNOTE SPEAKERS: Four first-class experts, see webpage. CULTURAL PROGRAM: Three days of cultural activities: tours by Kathmandu, Buddhist monasteries, Chariot festival AWARDS: Best paper, best student paper, best presentation, best poster, best software SUBMISSION DEADLINES: December 31: registration of tentative abstract (why not register your tentative abstract now?), January 7: full text of the registered papers See complete CFP and contact on www.CICLing.org/2014 PLEASE CIRCULATE this CFP among your colleagues and students. I apologize if you receive multiple copies. Respond to this message to be removed from my list. From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:38:56 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:38:56 +0100 Subject: Stage: Stage de master recherche en TAL, Paris - CORRECTION Message-ID: Date: Thu, 14 Nov 2013 10:19:36 +0100 From: Frederic Landragin Message-ID: <528495A8.60406 at ens.fr> Proposition de stage de M2 Laboratoire Lattice & LTCI Telecom-ParisTech Titre : Mod?lisation d?actes communicatifs multimodaux pour un agent conversationnel anim? dans les dialogues humain-machine Descriptif : Les Agents Conversationnels Anim?s (ACA) sont des personnages virtuels permettant ? la machine de dialoguer avec les humains de mani?re naturelle. Ils peuvent prendre le r?le d?assistant comme les agents conversationnels pr?sents sur les sites de vente, de tuteur dans le cadre des Jeux S?rieux (Serious Games). Comment obtenir chez un ACA une expression naturelle des actes communicatifs? Avec quelles postures, quelles expressions faciales, quels gestes, quelle intonation, doit-on faire accompagner le discours d?un ACA dans un dialogue humain-machine ? Une attention particuli?re sera donn?e ? l?agencement des niveaux acoustique (intonation) et visuel (geste, regard, etc.) avec les aspects linguistiques de l??nonc? (syntaxe, s?mantique). On interrogera notamment les analyses classiques qui tendent ? simplifier, par exemple en consid?rant qu'? une question est associ? un contour prosodique montant, alors qu'un contour plat est souvent bien plus naturel. On interrogera ?galement les mat?rialisations d'un ordre en fonction du contexte socio-?motionnel : si en th?orie l'ordre fait partie des trois actes de langage classiques (par exemple au sens de la Th?orie de la Pertinence, Sperber & Wilson 1995), en pratique l'ordre direct est ressenti comme agressif et on lui pr?f?re un acte de langage indirect, comme une question ? valeur (cach?e) d'ordre. La notion d?acte de langage sera ?tendue ? celle d?acte communicatif afin d?int?grer les modalit?s non-verbales (Poggi et Pelachaud, 2000) et le sujet portera sur la mod?lisation des actes communicatifs multimodaux, et sur les cons?quences des choix qu?un syst?me de dialogue humain-machine peut effectuer. Les mod?les construits s?int?greront dans la plateforme Greta (Niewiadomski et al., 2011), qui permet de communiquer avec l?humain en g?n?rant chez l?agent une large palette de comportements expressifs verbaux et non verbaux (Bevacqua et al., 2012). Plusieurs cas d?application pourront ?tre envisag?s : dialogues d?entra?nement de jeunes en insertion sociale aux entretiens d?embauche (projet Tardis), dialogues entre un ACA et les visiteurs d?un mus?e (projet A1:1) Pour ce faire, le travail comportera les ?tapes suivantes : - Etude de dialogues Humain-Humain (TCOF, CID...), des dialogues Humain-Machine (SCNF, CIO) et de dialogues humain-ACA multimodaux (Corpus Semaine (Schr?der et al., 2011)), en comparant les actes communicatifs et actes de langage pr?sents dans ces corpus et leur r?alisation verbale et non verbale. - Construction d'un mod?le sp?cifiant des param?tres de synth?se multimodale retenus pour un ACA. - V?rification du mod?le en situations de communication (soit simul?es soit via un param?trage ad?quat des ACA de la plateforme GRETA (Niewiadomski et al., 2011)). Comp?tences requises : - Connaissances en interaction homme-machine, - Int?r?t pour les aspects linguistiques et pragmatiques de la communication, - Comp?tences en programmation (Java), - Bon niveau en anglais. Conditions du stage : - Niveau requis : M2 ou dipl?me d?ing?nieur en informatique. - R?mun?ration : ? du SMIC. - Dur?e : 6 mois en commen?ant d?but 2014. - Lieu : premi?re partie du stage au laboratoire Lattice (1 rue Maurice Arnoux, Montrouge - m?tro Porte d?Orl?ans ou trawmay Jean Moulin), et deuxi?me partie ? Telecom Paris-Tech (37 rue Dareau, Paris 14e - m?tro Saint-Jacques ou Denfert). Contacts : Fr?d?ric Landragin, chercheur CNRS, laboratoire Lattice. Tel: +33 (0)1 58 07 66 21 E-Mail: frederic.landragin [at] ens.fr Chlo? Clavel, ma?tre de conf?rences, GRETA team, T?l?com ParisTech. Tel:+33 (0)1 45 81 75 93 E-Mail: chloe.clavel [at] telecom-paristech.fr R?f?rences : E. Bevacqua, E. de Sevin, S.J. Hyniewska, C. Pelachaud (2012), A listener model : Introducing personality traits, Journal on Multimodal User Interfaces, special issue Interacting ECAs, Elisabeth Andr?, Marc Cavazza and Catherine Pelachaud (Guest Editors), 6:27?38, 2012 C. Kerbrat-Orecchioni (2001) Les actes de langage dans le discours. Th?orie et fonctionnement, Paris : Nathan Universit?. F. Landragin (2013) Dialogue homme-machine. Conception et enjeux, Paris : Herm?s-Lavoisier. G. McKeown, M. Valstar, R. Cowie, R., M. Pantic, M. Schroder (2012) The SEMAINE Database: Annotated Multimodal Records of Emotionally Colored Conversations between a Person and a Limited Agent, IEEE Transactions on Affective Computing, Volume : 3 , Issue : 1, Page(s) : 5- 17, Jan.-March 2012 R. Niewiadomski, S. Hyniewska, C. Pelachaud (2011), Constraint-Based Model for Synthesis of Multimodal Sequential Expressions of Emotions, IEEE Transactions of Affective Computing, vol. 2, no. 3, 134-146, Juillet 2011 Poggi , C . Pelachaud , Performative facial Expressions in Animated Faces , In J . Cassell , J . Sullivan , S . Prevost , E . Churchill ( Eds .), Embodied Conversational Agents , Cambridge ( Mass .): MIT Press , 2000 Riviere, J., Adam, C., Pesty, S., Pelachaud, C., Guiraud, N., Longin, D., & Lorini, E. (2011). Expressive Multimodal Conversational Acts for SAIBA Agents, 316?323. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:58:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:58:44 +0100 Subject: Job: Proposition de stage Master / Ingenieur, Enrichissement de lexique emotionnel pour l'informatique affective Message-ID: Date: Fri, 15 Nov 2013 02:41:01 +0100 From: Jean Yves ANTOINE Message-ID: <52857BAD.7000804 at univ-tours.fr> X-url: http://li.univ-tours.fr/equipes/equipe-bdtln-198022.kjsp X-url: http://www-seaside.irisa.fr/ Proposition de stage ------------------------------- Proposition de stage de fin d??tudes (Master, Ecole Ing?nieur) en informatique appliqu? au Traitement Automatique des Langues Naturelles, d?une dur?e minimale de 4 mois. Titre : Enrichissement de lexique ?motionnel pour l?informatique affective Contexte scientifique -------------------------------- En collaboration avec le Laboratoire d?Informatique de l?Universit? de Tours, le laboratoire IRISA, antenne de Lorient (56 ? Morbihan) propose un sujet de stage dans le cadre du projet de recherche DAPAI-EMO financ? par la soci?t? BAMSOO. Le projet DAPAI-EMO fait suite ? un projet (EmotiRob) concernant le d?veloppement d?un robot compagnon affectif pour des enfants en hospitalisation longue. Cette poursuite de travaux fait abstraction ici de sa dimension robotique pour se concentrer sur ses aspects li?s ? la compr?hension ?motionnelle de la langue. Au cours du projet EmotiRob, nous avons d?velopp? EmoLogus, un syst?me de d?tection des ?motions qui intervient ? la suite d?un syst?me logique de compr?hension de message appel? Logus. EmoLogus utilise la structure s?mantique de l??nonc? fourni par Logus pour mettre en ?uvre un calcul de la valence ?motionnelle port?e par l??nonc?, c'est-?-dire pour savoir si celui-ci porte une ?motion positive, n?gative ou neutre. Ce calcul logique se base principalement sur l?utilisation de normes lexicales ?motionnelles qui d?crivent le syst?me de valeurs du syst?me : ? chaque mot du vocabulaire est associ?e une valence (positif, neutre, n?gatif) et une intensit? (nul, faible, fort) ?motive. Le lexique ?motionnel sur lequel se base le syst?me a ?t? ?labor? en collaboration avec l??quipe de psycholinguistique d?Arielle Syssau, de l?Universit? Montpellier 2. Bas? sur des jugements ?valuatifs contr?l?s aupr?s d?une population de test ?chantillonn?e avec soin, il nous garantit la repr?sentativit? du syst?me de valeurs d?EmoLogus. Le syst?me a montr? une bonne robustesse de d?tection dans le cadre restrictif d?une communication enfantine. Il souffre toutefois du manque de couverture de son lexique ?motionnel. A l?heure actuelle, le syst?me EmoLogus int?gre en effet un lexique limit? ? un millier de mots, alors que la langue fran?aise g?n?rale compte entre 50 000 et 100 000 entr?es lexicales. Dans le cadre de ce projet, nous proposons d?utiliser des techniques d?extension automatique de lexique ?motionnel ? partir d?une ressource initiale telle que celle du syst?me EmoLogus. Parmi les m?thodes propos?es pour ?tendre automatiquement un lexique ?motionnel ?tendu, on distingue deux types d'approches : - celles bas?es sur des r?seaux s?mantiques comme WordNet, o? sont d?crits des relations de synonymies entre tous les mots d?une langue. On peut alors rechercher des synonymes des mots germes pr?sents dans le lexique originel et leur appliquer un algorithme de propagation de valence, - celles bas?es sur des techniques d?analyse de donn?es sur des corpus textuels. Dans ce second cas, on va ?tudier les cooccurrences de mots dans un corpus pour calculer des similarit?s s?mantiques (rempla?ant les liens de synonymie explicites de Wordnet) et les int?grer dans le calcul de la valence des mots du lexique. Dans le cadre de ce stage, on se propose ainsi d?utiliser la technique de l?analyse s?mantique latente (LSA : Latent Semantic Analysis) pour calculer ces proximit?s s?mantiques et s?en servir pour estimer la valence d?un mot. Les mots germes d?j? pr?sents dans la norme lexicale ?motionnelle actuelle serviront de base ? l?espace vectoriel sur lequel sera op?r?e l?analyse de donn?es permettant l?extension du lexique. Ce stage visera ? d?velopper au moins une de ces deux techniques pour ?tendre le lexique ?motionnel d?EmoLogus, et tester l?apport de cette extension sur un corpus de test. En cas d?avanc?e significative, ce travail pourra donner lieu ? communication dans une conf?rence scientifique ? laquelle sera invit? ? participer le stagiaire. Travail ? r?aliser ---------------------- La personne recrut?e sera en charge de la conception de nouvelles techniques d?extension de lexique ?motionnel, du d?veloppement d?un lexique ? large couverture pour le syst?me EmoLogus ainsi que de la r?alisation de tests d??valuation du syst?me ?tendu obtenu. Le stage se d?roulera en trois ?tapes successives : - Phase n?1 ? Pr?paration des donn?es (T0 ? T0+1) : Veille technologie sur le sujet, d?finition des formats d??change entre les diff?rentes techniques d?extension du lexique, caract?risation d?une ou plusieurs application test et d?finition des donn?es de test en relation et du protocole d??valuation final. - Phase n?2 ? Extension de lexique par relations s?mantiques (T0+1 ? T0+3) : Extension du lexique germe par analyse des relations de synonymie et d?antinomie entre ?l?ments (synsets) de Wordnet, ?valuation de l?approche sur donn?es de test (comparaison des performances d?EmoLogus avec ou sans le lexique ?tendu). - Phase n?3 ? Extension de lexique par analyse de donn?es (T0+4 ? T0+6) : Extension du lexique germe par analyse s?mantique latente. ?valuation sur tests unitaires de l?approche, ?valuation de l?approche sur donn?es de test (comparaison des performances d?EmoLogus avec ou sans le lexique ?tendu). Cette phase ne sera abord?e qu?en cas de stage de dur?e sup?rieure ? quatre mois. Profil recherch? --------------------- La personne recrut?e sera en cycle terminal d??tudes en informatique, de niveau Bac+5 (Master informatique professionnel, recherche ou indiff?renci?, ?cole d?ing?nieur). Des connaissances en Traitement Automatique des Langues et en analyse de donn?es seront appr?ci?es, sans ?tre un pr?-requis ? recrutement. Dans le cas d?un(e) ?tudiant(e) en Master Recherche, le sujet de stage pourra ?tre adapt? aux attentes de l??tudiant. R?mun?ration ------------------ R?mun?ration minimale pr?vue par la r?glementation ? savoir 436,05 ? par mois. Cette r?mun?ration sera assur?e dans le cadre d?un projet industriel financ? par la soci?t? BAMSOO. Dur?e du stage et lieu d?exercice ------------------------------------------ La personne recrut?e travaillera au sein du laboratoire IRISA, dans les locaux de l?ENSIBS, ? Lorient (Morbihan). Il s?int?grera dans une ?quipe projet compos?e de Jeanne Villaneau (IRISA, ?quipe SEASIDE) et Jean-Yves Antoine (Laboratoire d?Informatique de l?Universit? Fran?ois Rabelais de Tours, ?quipe BDTLN). La dur?e minimale de stage sera de 4 mois. Une prolongation de stage est envisageable ? la demande du stagiaire ou de son ?tablissement. Contact ? D?p?ts de candidature ------------------------------------------- Contact : Jeanne.Villaneau at univ-ubs.fr D?p?t des candidatures : aupr?s de Jeanne Villaneau. Merci de d?poser un CV d?taill? de vos activit?s pass?es, accompagn? d?une lettre de motivation et de vos relev?s de notes des deux derni?res ann?es d??tudes. Un d?veloppement Java sera demand? pour la s?lection du candidat. Liens utiles --------------- Laboratoire LI, ?quipe BDTLN : http://li.univ-tours.fr/equipes/equipe-bdtln-198022.kjsp Laboratoire IRISA, ?quipe SEASIDE : http://www-seaside.irisa.fr/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:55:24 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:55:24 +0100 Subject: Conf: (In)Coherence du discours, 12-13/12/13, Loria, Nancy Message-ID: Date: Thu, 14 Nov 2013 17:05:15 +0100 From: amblard Message-Id: <5F89EABF-651B-4E3D-BA59-9A5FB462748A at loria.fr> X-url: http://webloria.loria.fr/~amblard/SLAM/index.php?n=Main.In-coh%E9rence13 Le projet de recherche SLAM (Schizophr?nie et Langage : Analyse et Mod?lisation), organise un workshop ? Nancy. ************ (In)Coh?rence du discours 12 et 13 d?cembre 2013 -- Loria C005 programme ci-dessous ************ Le projet SLAM vise ? syst?matiser l??tude des conversations pathologiques dans le cadre d?une approche interdisciplinaire alliant psychologie, linguistique informatique et philosophie. Il se concentre notamment sur les conversations impliquant des personnes souffrant de troubles psychiatriques (comme la schizophr?nie). A cet effet, il est constitu? par trois axes : corpus, formalisation, ?pist?mologie. (In)Coh?rence du discours propose de discuter la question de la repr?sentation du discours tant du point de vue linguistique que formel. La repr?sentation s?mantique de la langue naturelle montre qu'elle ne peut ?tre compl?te sans consid?rer un contexte plus large. Une perspective pour y parvenir est de consid?rer non pas l'?nonc? mais le discours dont il est une partie. Plusieurs questions apparaissent alors, notamment aux niveaux pragmatique et formel (coh?sion, r?f?rence, pr?supposition, liens rh?toriques, ...) Les journ?es se tiendront en salle C005 du Loria ? Nancy. Les pr?sentations seront en anglais ou en fran?ais. Le workshop est financ? par un PEPS CNRS HuMaIn. Le projet Slam est par ailleurs soutenu par la MSH Lorraine (axe 6. Cognition). Pour des raisons d'organisation, si vous souhaitez participer ? cette rencontre, merci de prendre contact avec : maxime.amblard[at]loria.fr http://webloria.loria.fr/~amblard/SLAM/index.php?n=Main.In-coh%E9rence13 ************ Programme Jeudi 12 d?cembre : 10h -11h Michel Musiol / Maxime Amblard / Manuel Rebuschi L'experimentation du lien entre troubles cognitifs et (in)coherences du discours: les risques de la formalisation 11h -12h Christian Retor? CoLan : Complexit? et langage 14h - 15h Mathilde Dargnat et Jaques Jayez Le fonctionnement hyperd?ictique : l'exemple des particules discursives 15h - 16h Philippe de Groote tba 16h30 - 17H30 Bernard Combettes Dans quelle mesure peut-on parler d'une ?volution de la coh?rence textuelle ? Vendredi 13 d?cembre : 9h - 10h Yvan Leudar Pragmatics of verbal hallucinations 10h 30 - 11h30 Laure Vieu The rhetorical component of the semantics of discourse relations 11h 30 - 12h30 Jacques Jayez Les d?clencheurs pr?suppositionnels : premi?res approches exp?rimentales 14h - 15h Michel Charolles (In)coh?rence des discours : de la pertinence ? l'int?gration conceptuelle en passant par l'analyse des marques de coh?sion 15h - 16h Denis Apoth?loz Opacit? r?f?rentielle et coh?rence du discours ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 20:46:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 21:46:27 +0100 Subject: Conf: SocInfo2013, 25-27 November 2013, Kyoto, Japan Message-ID: Date: Sat, 9 Nov 2013 12:15:15 -0000 From: "Ricardo Campos" Message-ID: <00c801cedd45$688e9620$39abc260$@inescporto.pt> X-url: http://www.socinfo2013.org The Fifth International Conference on Social Informatics (SocInfo2013) 25-27 November 2013, Kyoto, Japan http://www.socinfo2013.org -----Call for Participation--------- ---------------------------------------------------------------------- The Fifth International Conference on Social Informatics (SocInfo2013) is an interdisciplinary venue for researchers from informatics and the social & management sciences to come together to share ideas and opinions, and to present original research work. The goal is to create an opportunity for the dissemination of knowledge between the two communities, as well as to enable mutual critical discussion of current research. ---------------------------------------------------------------------- Keynote Speakers: -------------------------- Paul Resnick (University of Michigan) Yoshiyuki Hashimoto (University of Tokyo) Irwin King (Chinese University of Hong Kong) Co-located Events: -------------------------- TUTORIAL: Towards a Spatial and Temporal Representation of Social Processes by Christophe Claramunt (Naval Academy Research Institute, France) WORKSHOPS: 1st Workshop on Quality, Motivation and Coordination of open Collaboration (QMC 2013) ( http://qmc2013.socinfo.eu/ ) 1st International Workshop on Histoinformatics ( http://www.histoinformatics.org ) Accepted Papers: ---------------- FULL PAPERS: Modeling Analogies for Human-Centered Information Systems Christoph Lofi and Christian Nieke Resilience of Social Networks Under Different Attack Strategies Mohammad Ayub Latif, Muhammad Naveed and Faraz Zaidi Follow My Friends This Friday! An Analysis of Human-generated Friendship Recommendations Ruth Garcia Gavilanes, Neil O_fHare, Luca Maria Aiello and Alejandro Jaimes A Divide-and-Conquer Approach for Crowdsourced Data Enumeration Hideto Aoki and Atsuyuki Morishima Passive Participation in Communities of Practice: Scope and Motivations Azi Lev-On and Odelia Adler An Ontology-based Approach to Sentiment Classification of Mixed Opinions in Online Restaurant Reviews Hea-Jin Kim and Min Song Automating Credibility Assessment of Arabic News Mohamed Hammad and Elsayed Hemayed The Study of Social Mechanisms of Organization, Boundary Capabilities, and Information System Shiuann-Shuoh Chen, Pei-Yi Chen, Yu Min and Yu-Wei Chuang Predicting User_fs Political Party using Ideological Stances Swapna Gottipati, Minghui Qiu, Liu Yang, Feida Zhu and Jing Jiang A Fast Method for Detecting Communities from Tripartite Networks Kyohei Ikematsu and Tsuyoshi Murata Information vs Interaction: An Alternative User Ranking Model for Social Networks Wei Xie, Ai Phuong Hoang, Feida Zhu and Ee-Peng Lim Feature Extraction and Summarization of Recipes using Flow Graph Yoko Yamakata, Shinji Imahori, Yuichi Sugiyama, Shinsuke Mori and Katsumi Tanaka Unsupervised Opinion Targets Expansion and Modification Relation Identification for Microblog Sentiment Analysis Jenq-Haur Wang and Ting-Wei Yeh An Ontology-based Technique for Online Profile Resolution Keith Cortis, Simon Scerri, Ismael Rivera and Siegfried Handschuh The Three Dimensions of Social Prominence Diego Pennacchioli, Giulio Rossetti, Luca Pappalardo, Fosca Giannotti, Dino Pedreschi and Michele Coscia Automatic Thematic Content Analysis: Finding Frames in News Daan Odijk, Bjorn Burscher, Rens Vliegenthart and Maarten de Rijke Optimal scales in weighted networks Diego Garlaschelli, Sebastian E. Ahnert, Thomas M. A. Fink and Guido Caldarelli Diversity-Based HITS: Web Page Ranking by Referrer and Referral Diversity Yoshiyuki Shoji and Katsumi Tanaka The Babel of Software Development: Linguistic Diversity in Open Source Bogdan Vasilescu, Alexander Serebrenik and Mark G. J. van den Brand Using and Asking: APIs Used in the Android Market and Asked About in StackOverflow David Kavaler, Daryl Posnett, Clint Gibler, Hao Chen, Premkumar Devanbu and Vladimir Filkov Social-Urban Neighborhood Search based on Crowd Footprints Network Shoko Wakamiya, Ryong Lee and Kazutoshi Sumiya A Notification-centric Mobile Interaction Survey and Framework Jonas Elslander and Katsumi Tanaka Social Sensing for Urban Crisis Management: The Case of Singapore Haze Philips Kokoh Prasetyo, Ming Gao, Ee-Peng Lim and Christie Napa Scollon SHORT PAPERS: Changing with Time: Modelling and Detecting User Lifecycle Periods in Online Community Platforms Matthew Rowe A Novel Social Event Recommendation Method Based on Social and Collaborative Friendships Yu-Chun Sun and Chien Chin Chen Factors that Influence Social Networking Service Private Information Disclosure at Diverse Openness and Scopes Basilisa Mvungi and Mizuho Iwaihara An Approach to Building High-Quality Tag Hierarchies from Crowdsourced Taxonomic Tag Pairs Fahad Almoqhim, David E. Millard and Nigel Shadbolt Polarity Detection of Foursquare Tips Felipe Moraes, Marisa Vasconcelos, Patrick Prado, Daniel Dalip, Jussara Almeida and Marcos Goncalves Predicting Social Density in Mass Events to Prevent Crowd Disasters Bernhard Anzengruber, Danilo Pianini, Jussi Nieminen and Alois Ferscha Modeling Social Capital of Bureaucratic Hierarchy for Analyzing Promotion Decisions Jyi-Shane Liu, Zhuan-Yao Lin and Ke-Chih Ning The estimation of aNobii users_f reading diversity using book co-ownership data: a social analytical approach Muhchyun Tang, Yi-Ling Ke and Yi-Jin Sie Aspects of Rumor Spreading on a Microblog Network Sejeong Kwon, Meeyoung Cha, Kyomin Jung, Wei Chen and Yajun Wang Traffic Condition is More than Colored Lines on a Map: Characterization of Waze Alerts Thiago H. Silva, Pedro Olmo Vaz de Melo, Aline Carneiro Viana, Jussara M. Almeida, Juliana Salles and Antonio A. F. Loureiro Why Do I Retweet It? An Information Propagation Model for Microblogs Fabio Pezzoni, Jisun An, Andrea Passarella, Jon Crowcroft and Marco Conti Society as a Life Teacher ? Automatic Recognition of Instincts Underneath Human Actions by Using Blog Corpus Rafal Rzepka and Kenji Araki Temporal, cultural and thematic aspects of web credibility Radoslaw Nielek, Aleksander Wawer, Michal Jakowski-Lorek and Adam Wierzbicki How do Students Search during Class and Homework? A query log analysis for academic purposes Rafael Lopez-Garcia, Makoto P. Kato, Yoko Yamakata and Katsumi On Constrained Adding Friends in Social Networks Hoang Bao Thien and Abdessamad Imine DEMO PAPERS: Metro: Exploring Participation in Public Events Luca Chiarandini, Luca Maria Aiello, Neil O_fHare and Alejandro Jaimes Social Listening for Customer Acquisition Juan Du, Biying Tan, Feida Zhu and Ee-Peng Lim Pilot Study toward realizing Social Effect in O2O Commerce Services Tse-Ming Tsai, Ping-Che Yang and Wen-Nan Wang Organizing Committee: ---------------- General Co-Chairs: - Katsumi Tanaka (Kyoto University, Japan) - Andrew Flanagin (University of California, Santa Barbara, USA) Program Co-Chairs: - Ee Peng Lim (Singapore Management University, Singapore) - Adam Jatowt (Kyoto University, Japan) - Ying Ding (Indiana University, Bloomington, USA) - Asako Miura (Kwansei Gakuin University, Japan) - Keishi Tajima (Kyoto University, Japan) Workshop/Tutorial Co-Chairs: - Akiyo Nadamoto (Konan University, Japan) - Jochen Leidner (Thomson Reuters, Switzerland) Demo Co-Chairs: - Taro Tezuka (Tsukuba University, Japan) - Gael Dias (Normandie University, Caen, France) Publicity Co-Chairs: - Yoshinori Hijikata (Osaka University, Japan) - Antoine Doucet (Normandie University, Caen, France) - Ricardo Campos (Polytechnic Institute of Tomar, Portugal) - Goh Hoe Lian Dion (Nanyang Technological University, Singapore) - Atsuyuki Morishima (University of Tsukuba, Japan) - Leonard Bolc (Polish-Japanese Institute of Information Technology, Poland) Treasurers: - Chair: Kazutoshi Sumiya (University of Hyogo, Japan) - Hiroaki Ohshima (Kyoto University, Japan) - Daisuke Kitayama (Kogakuin University, Japan) Web Chair: - Makoto P. Kato (Kyoto University, Japan) Local Arrangement Co-Chairs: - Takehiro Yamamoto (Kyoto University, Japan) - Toshiyuki Shimizu (Kyoto University, Japan) From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 21:05:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 22:05:48 +0100 Subject: Journee: Saussure et l'Essence double du langage, 22 novembre 2013, Paris Message-ID: Date: Fri, 15 Nov 2013 08:46:12 +0100 From: Fran?ois Rastier Message-ID: X-url: http://www.revue-texto.net Vendredi 22 novembre 10h-17h Maison des sciences de l'homme 190 avenue de France, 75013 Paris Salle 2 Saussure et l'Essence double du langage Journ?e d??tudes organis?e par le Centre culturel franco-norv?gien en sciences sociales et humaines, avec le soutien du D?partement de langues ?trang?res de l?Universit? de Bergen, de l?Institut Ferdinand de Saussure et de l?Ertim-INaLCO, ? l?occasion de la publication du num?ro de la revue Arena Romanistica, 12, intitul? ? De l?essence double du langage et le renouveau du saussurisme ? ? num?ro sp?cial ? l?occasion du centenaire de la mort de Ferdinand de Saussure (1857?1913). Organisateurs : Anje M?ller Gjesdal (Universit? de Bergen) et Fran?ois Rastier (ERTIM-INaLCO). Argument. ? La d?couverte du manuscrit publi? sous le titre De l?essence double du langage conduit ? une r?vision d?ensemble du corpus des ?uvres de Saussure et permet de modifier l?interpr?tation de sa pens?e, tout ? la fois obscurcie et simplifi?e par l?histoire de sa r?ception. Nous ?tudierons donc les probl?mes philologiques et herm?neutiques que posent alors l??tablissement et l?interpr?tation du corpus saussurien. En inspirant le courant de recherche r?cent du n?o-saussurisme, De l?essence double du langage peut conduire ? reconsid?rer le statut m?me de la linguistique contemporaine, tant dans ses rapports avec la tradition grammaticale qu?avec la philosophie du langage. - 10h-10h15 Anje M?ller Gjesdal, Universit? de Bergen Pr?sentation - 10h15-11h Fran?ois Rastier, Directeur de recherche, INaLCO-ERTIM, Paris De l?essence double du langage, un projet r?v?lateur Pause - 11h15-12h Simon Bouquet, Universit? Paris-Ouest Nanterre Triple articulation de la langue et articulation herm?neutique du langage - 12h-12h45 Arild Utaker, Universit? de Bergen Le retour de Saussure Pause repas - 14h15-15h Marie-Jos? B?guelin, Universit? de Neuch?tel De la diachronie ? la synchronie, et retour - 15h-15h45 R?gis Missire, Universit? Toulouse 2 Avoir un sens et faire sens : s?miosis textuelle et signifiance en linguistique textuelle n?o-saussurienne - 15h45-16h30 Pierre-Yves Testenoire, Universit? Paris 3 Les Anagrammes hom?riques de Saussure. Pause - 16h30-17h15 Table-ronde pr?sid?e par Enrique Ballon-Aguirre, Universit? d?Etat de l'Arizona : La reconception saussurienne du langage ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 15 21:15:02 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 15 Nov 2013 22:15:02 +0100 Subject: Stage: Stage Master / Ecole d'Ingenieur, Techniques de fouille de donnees pour la recherche d'information Message-ID: Date: Fri, 15 Nov 2013 21:34:03 +0100 From: Damien Nouvel Message-ID: X-url: http://damien.nouvels.net/fr/mxs Proposition de stage Master / Ecole d'Ing?nieur LI, Universit? Fran?ois Rabelais de Tours LIMSI-CNRS, Universit? Paris XI Techniques de fouille de donn?es pour la recherche d'information : ?valuation des ressources et traitements pour la reconnaissance d'entit?s nomm?es R?sum? : Proposition de stage de fin d'?tudes ou de Recherche de niveau Bac+5 (Master, Ecole d'Ing?nieur) en Informatique appliqu?e au Traitement Automatique des Langues d'une dur?e de 4 mois minimum. Contexte scientifique : Le Laboratoire LI et le LIMSI-CNRS proposent un sujet de stage commun dans le cadre du projet de recherche TMH (T?l?communications, Mobilit? et Handicap) financ? par la soci?t? BAMSOO. Le sujet porte sur le Traitement Automatique des Langues (TAL) appliqu? ? des t?ches d'extraction d'information textuelle ? l'aide de techniques de fouille de donn?es. Parmi les t?ches relevant de l'extraction d'information se trouve la reconnaissance automatique des entit?s nomm?es (REN) qui consiste ? rechercher des r?f?rences ? des noms de personnes, de lieux, d'organisation, d'unit?s mon?taire ou temporelles dans de grands flux de donn?es. Ces entit?s nomm?es peuvent pr?senter des formes linguistiques tr?s vari?es. Par exemple, les syst?mes de REN doivent reconna?tre que Fran?ois Hollande, le pr?sident de la R?publique, le pr?sident normal ou le locataire de l'Elys?e d?signent toutes la m?me personne, qui est une personnalit? politique. C'est sur cette t?che de reconnaissance d'entit?s nomm?es que portera sp?cifiquement ce stage. Le syst?me que nous avons d?velopp? (mXS) propose une approche de type fouille de donn?es dont une des caract?ristiques est de rechercher s?par?ment le d?but et la fin de chaque entit? nomm?e. Dans ses fondements, mXS repose sur l'?num?ration de motifs en s'appuyant sur des techniques bien ?tablies en TAL (cat?gorisation morpho-syntaxique, lemmatisation, utilisation de lexiques ? large couverture) comme en fouille de donn?es (motifs s?quentiels, hi?rarchies, r?gles d'association). Il a obtenu de bonnes performances dans le cadre de la campagne d'?valuation ETAPE, en particulier dans des contextes bruit?s (transcriptions automatiques). Au del? des performances globales du syst?me, il reste difficile de d?terminer quels sont les choix de mod?lisation effectu?s qui avantagent ou p?nalisent le syst?me. Outre une ?tape de r?-ing?nierie logicielle, ce stage a pour objectif de mener des travaux exp?rimentaux permettant de mieux cerner les apports de notre d?marche. Travail ? r?aliser : Le travail ? r?aliser vise ? consolider le code du syst?me existant puis ? mieux ?tudier son comportement et ?ventuellement dresser un ?tat des lieux des utilisations possibles de la fouille de donn?es pour diverses t?ches tourn?es vers le TAL. Il comportera deux phases successives principales : Phase 1 (2 mois) : r?-ing?nierie logicielle. Cette ?tape consistera ? factoriser et optimiser le code existant, afin de le rendre plus ?volutif, de le mettre ? disposition en ligne et de favoriser sa large diffusion dans la communaut? scientifique. En pratique, il s'agira ici de mieux modulariser les diff?rents traitements TAL qui le composent : - pr?traitements (morpho-syntaxe, lexiques) pour enrichir les textes selon la langue et les outils disponibles, - extraction de motifs s?quentiels hi?rarchiques, - mod?les (symboliques ou statistiques) qui exploitent les motifs pour l'annotation. Phase 2 (2 mois minimum) : ?tude du comportement du syst?me. Une ?tude approfondie sera men?e sur l'int?r?t de rechercher des marques de d?but et de fin d'entit?s nomm?es, plut?t que d'adopter une approche plus classique de classification mot-?-mot. Pour cela, une analyse sera conduite sur la comparaison des performances et des sorties de diff?rents types de syst?mes : ? base de r?gles et DAG (graphes dirig?s sans cycle) comme le syst?me CasEN d?velopp? ?galement au LI, mais aussi de CRF. A terme, ce travail permettra de d?finir les perspectives d'?volution les plus prometteuses pour les syst?mes traitant cette t?che. Phase compl?mentaire (si extension de stage). En cas d'avanc?e satisfaisante du travail, on cherchera ? ?tudier comment mieux manipuler les motifs ? des fins d'extraction de connaissances. Ce travail commencera par se doter des outils n?cessaires ? la caract?risation d'un corpus ? partir des motifs qui en ont ?t? extraits automatiquement. L'objectif ?tant d'?tre ? m?me de s?lectionner les motifs d'int?r?t par utilisation de m?thodes formelles, les motifs ?tant organis?s au sein de treillis. Profil recherch? : La personne recrut?e sera en cycle terminal d'?tudes en informatique, de niveau Bac+5 (Master informatique professionnel, recherche ou indiff?renci?, ?cole d'ing?nieur). Des comp?tences en Traitement Automatique des Langues et/ou en Fouille de Donn?es seront appr?ci?es. Dans le cas d'un(e) ?tudiant(e) en Master Recherche, le sujet de stage pourra ?tre adapt? aux attentes de l'?tudiant. Potentiellement, ce travail pourra donner lieu ? communication dans des conf?rences scientifiques. R?mun?ration : R?mun?ration maximale pr?vue par la r?glementation ? savoir 436,05? par mois, pour une dur?e de 4 mois de stage minimum (prolongation de la dur?e du stage jusqu'? 6 mois ? la demande de l'?tudiant ou de son ?tablissement). Cette r?mun?ration sera assur?e dans le cadre d'un projet industriel financ? par la soci?t? BAMSOO. Lieu d'exercice : Le stage se d?roulera dans les locaux du Laboratoire d'Informatique pour la M?canique et les Sciences de l'Ing?nieur (LIMSI-CNRS), Universit? Paris-Sud, Rue John von Neumann, 91403 Orsay, au sein de l'?quipe ILES (Information, Langue Ecrite et Sign?e). Le stage sera encadr? part Damien Nouvel, postdoc au LIMSI et Jean-Yves Antoine, professeur de l'Universit? Fran?ois Rabelais de Tours (?quipe BDLTN). D?p?ts de candidature : Contact : damien.nouvel at limsi.fr Merci de d?poser un CV d?taill? de vos activit?s pass?es, accompagn? d'une lettre de motivation et de vos relev?s de notes des deux derni?res ann?es d'?tudes. Liens utiles : - Syst?me mXS : http://damien.nouvels.net/fr/mxs - Laboratoire LIMSI (groupe ILES) : http://www.limsi.fr/Scientifique/iles/ - Laboratoire LI (?quipe BDTLN) : http://li.univ-tours.fr/equipes/equipe-bdtln-198022.kjsp - Campagne Etape : http://www.afcp-parole.org/etape.html ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:47:18 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:47:18 +0100 Subject: Appel: ACL 2014 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA 2014) Message-ID: Date: Mon, 18 Nov 2013 14:13:00 +0100 From: Alexandra Balahur Dobrescu Message-id: <528A125C.1070107 at jrc.ec.europa.eu> X-url: http://optima.jrc.it/wassa2014/ Apologies for cross-postings. ------------------------------------------------------------------------ ------------------------------------------------------------------------ 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA 2014) ************************************************************************ http://optima.jrc.it/wassa2014/ ************************************************************************ ******************************************************* BACKGROUND ******************************************************* Research in automatic Subjectivity and Sentiment Analysis (SSA), as subtasks of Affective Computing and Natural Language Processing (NLP), has flourished in the past years. The growth in interest in these tasks was motivated by the birth and rapid expansion of the Social Web that made it possible for people all over the world to share, comment or consult content on any given topic. In this context, opinions, sentiments and emotions expressed in Social Media texts have been shown to have a high influence on the social and economic behaviour worldwide. SSA systems are highly relevant to many real-world applications (e.g. marketing, eGovernance, business intelligent, social analysis) and also to many tasks in Natural Language Processing (NLP) -- information extraction, question answering, textual entailment, to name just a few. The importance of this field has been proven by the high number of approaches proposed in research in the past decade, as well as by the interest that it raised from other disciplines (Economics, Sociology, Psychology) and the applications that were created using its technology. In spite of the growing body of research in the area in the past years, dealing with affective phenomena in text has proven to be a complex, interdisciplinary problem that remains far from being solved. Its challenges include the need to address the issue from different perspectives and at different levels, depending on the characteristics of the textual genre, the language(s) treated and the final application for which the analysis is done. ******************************************************* ENVISAGED SCOPE OF WASSA 2014 ******************************************************* The aim of the 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA 2014) is to continue the line of the previous editions, bringing together researchers in Computational Linguistics working on Subjectivity and Sentiment Analysis and researchers working on interdisciplinary aspects of affect computation from text. Additionally, starting with WASSA 2013, we extended the focus to Social Media phenomena and the impact of affect-related phenomena in this context. In this new proposed edition, we would like to encourage the submission of long and short research and demo papers including, but not restricted to the following topics related to subjectivity and sentiment analysis: . Resources for subjectivity, sentiment and social media analysis; (semi-)automatic corpora generation and annotation . Opinion retrieval, extraction, categorization, aggregation and summarization . Trend detection in social media using subjectivity and sentiment analysis techniques . Data linking through social networks based on affect-related NLP methods . Impact of affective data from social media . Mass opinion estimation based on NLP and statistical models . Online reputation management . Topic and sentiment studies and applications of topic-sentiment analysis . Domain, topic and genre dependency of sentiment analysis . Ambiguity issues and word sense disambiguation of subjective language . Pragmatic analysis of the opinion mining task . Use of Semantic Web technologies for subjectivity and sentiment analysis . Improvement of NLP tasks using subjectivity and/or sentiment analysis . Intrinsic and extrinsic evaluations subjectivity and sentiment analysis . Subjectivity, sentiment and emotion detection in social networks . Classification of stance in dialogues . Applications of sentiment and social media analysis systems In addition, in the light of the fact that different sentiment analysis systems have been proposed and showcased in the past years, we feel there is a growing need to make users familiar with these systems and have them employed for building an end application. To this aim, we would like to organize a "Hackathon" (please see details below). ******************************************************* SENTIMENT ANALYSIS SYSTEMS HACKATHON ******************************************************* In the light of the fact that different sentiment analysis systems have been proposed and showcased in the past years, we feel there is a growing need to make other researchers and users familiar with these systems and have them employ them for building an end application. The Hackathon word stands for "Hacking Marathon", and its purpose is to introduce some. The activity will be open to all the people who will sign up for the workshop. We plan to organize a half a day session, in the first half presenting the participating systems and their use and creating teams for "application" development and leaving the second half of the day for working on the systems and presenting the results. We plan to give the participants the possibility to vote on the best application created and reward the winner with a gadget. ******************************************************* ORGANIZERS ******************************************************* Alexandra Balahur European Commission Joint Research Centre Via E. Fermi 2749, T.P. 267, 21027 Ispra (VA), Italy alexandra.balahur at jrc.ec.europa.eu Erik van der Goot European Commission Joint Research Centre Via E. Fermi 2749, T.P. 267, 21027 Ispra (VA), Italy Erik.van-der-Goot at jrc.ec.europa.eu Ralf Steinberger European Commission Joint Research Centre Via E. Fermi 2749, T.P. 267, 21027 Ispra (VA), Italy Ralf.Steinberger at jrc.ec.europa.eu Andr?s Montoyo University of Alicante, DLSI, Ap. De Correos 99, 03080 Alicante, Spain montoyo at dlsi.ua.es ******************************************************* PROGRAM COMMITTEE ******************************************************* . Khurshid Ahmad -- Trinity College Dublin, Ireland . Nicoletta Calzolari - CNR Pisa, Italy . Erik Cambria -- University of Stirling, U.K. . Jos? Carlos Cortizo - European University Madrid, Spain . Michael Gamon -- Microsoft, U.S.A. . Jes?s M. Hermida - University of Alicante, Spain . Veronique Hoste - University of Ghent, Belgium . Mijail Kabadjov -- University of Wolverhampton, U.K. . Zornitsa Kozareva - Information Sciences Institute California, U.S.A. . Rada Mihalcea - University of North Texas, U.S.A. . Saif Mohammad - National Research Council, Canada . Karo Moilanen -- Google . Rafael Mu?oz - University of Alicante, Spain . G?nter Neumann - DFKI, Germany . Alena Neviarouskaia -- University of Tokyo, Japan . Constantin Orasan - University of Wolverhampton, U.K. . Viktor Pekar - University of Wolverhampton, U.K. . Paolo Rosso - Polytechnic University of Valencia, Spain . Josef Steinberger -- EC- Joint Research Centre, Italy . Ralf Steinberger - EC- Joint Research Centre, Italy . Veselin Stoyanov -- John Hopkins University, U.S.A. . Maite Taboada - Simon Fraser University, Canada . Mike Thelwall - University of Wolverhampton, U.K. . Jos? Antonio Troyano - University of Seville, Spain . Dan Tufis - RACAI, Romania . Alfonso Ure?a -- University of Ja?n, Spain . Piek Vossen - Vrije Universiteit Amsterdam, The Netherlands . Marilyn Walker - University of California Santa Cruz, U.S.A. . Janyce Wiebe - University of Pittsburgh, U.S.A. . Michael Wiegand -- Saarland University, Germany . Theresa Wilson -- John Hopkins University, U.S.A. . Taras Zagibalov - Brantwatch, U.K. ******************************************************* IMPORTANT DATES ******************************************************* - Paper submission deadline: March 21, 2014 - Notification of acceptance: April 11, 2014 - Camera-ready deadline: April 29, 2014 - Workshop to take part at ACL 2014: June 27, 2014 ******************************************************* SUBMISSIONS ******************************************************* We encourage the submission of long, short and demo papers (especially describing systems participating in the hackathon) Long papers for WASSA 2014 must not exceed eight (8) pages without references. Short papers must not exceed five (5) pages without references. Papers for WASSA should be submitted using the ACL 2014 Style Files, available at: Reviewing for WASSA 2014 will be double blind: reviewers will not be presented with the identity of paper authors. Authors should avoid writing anything that makes their identity obvious in the text. Submissions should be original, and in particular should not previously have been formally published. Accepted papers will be published in the ACL WASSA proceedings. The best papers will be chosen for a special issue of an ISI- indexed journal. Previous special issues of WASSA were/are in the process of being published in the Decision Support Systems, Computer Speech and Language and Information Processing and Management journals (Elsevier). To submit a paper, please access: https://www.softconf.com/acl2014/WASSA/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:54:29 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:54:29 +0100 Subject: Appel: ESWC 2014 Message-ID: Date: Mon, 18 Nov 2013 15:24:35 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131118142455.91724DBB6D at vina.cines.fr> X-url: http://2014.eswc-conferences.org ** apologies for cross-posting ** ==== Second Call for Papers ==== http://2014.eswc-conferences.org/important-dates/call-papers CFP: 11th ESWC Conference 2014 Dates: May 25 - 29, 2014 Venue: Anissaras, Crete, Greece Hashtag: #eswc2014 Feed: @eswc_conf Site: http://2014.eswc-conferences.org General Chair: Valentina Presutti (STLab, ISTC-CNR, IT) Program Chairs: - Claudia d'Amato (Department of Computer Science, University of Bari, IT) - Fabien Gandon (Wimmics, Inria, I3S, CNRS, University of Nice Sophia Antipolis, FR) ESWC is a A rank conference according to CORE classificarion and a major venue for discussing the latest scientific results and technology innovations related to the Semantic Web. The 11th edition of ESWC will take place from May 25th, 2014 to May 29th, 2014 in Anissaras, Crete, Greece. Besides a main focus on advances in Semantic Web research and technologies, ESWC 2014 is seeking to broaden its attention to span other relevant research areas in which Web semantics plays an important role. The goal of the Semantic Web is to create a Web of knowledge and services in which the semantics of content is made explicit and content is linked to both other content and services. This arrangement of knowledge-based functionalities is weaving together a large network of human knowledge, and making this knowledge machine-processable to support intelligent behaviour by machines. Additionally, it supports novel applications allowing content from heterogeneous sources to be combined in unforeseen ways and support enhanced matching between users needs, software functionalities and online content. Creating such an interlinked Web of knowledge which bridges between heterogeneous content and services requires collaboration between several computer science domains. Also, within this hybrid space that the Web has become, where humans and software interact in a complex manner, fundamentally requires an inter-disciplinary approach to find novel solutions to the problems generated. ESWC 2014 will feature twelve thematic research tracks (see below) and an in-use and industrial track. Submissions of interdisciplinary research papers, covering more than one thematic track, are also encouraged. In addition, the in-use and industrial track will provide an opportunity for dialogue and discussion on industrial applications, tools, deployment experiences, case studies and usage analysis. Submitted papers should describe original work, present significant results, and provide rigorous, principled, and repeatable evaluation. We strongly encourage and appreciate the submission of papers incorporating links to data sets and other material used for evaluation as well as to live demos and software source code. We therefore encourage submissions addressing several conference research topics. However, each paper should be associated with at least one of the topics of the conference. The main research topics this year are: - Vocabularies, Schemas, Ontologies; - Reasoning; - Linked Open Data; - Social Web; - Web Science; - Data Management, Big data, Scalability; - Natural Language Processing; - Information Retrieval; - Machine Learning; - Mobile Web; - Sensors; - Streams; - Services, processes, and cloud computing. Additional special research topics this year are: - Cognition and Semantic Web; - Policies, Rights, Governance; - Semantic multimedia web. *Important Dates* Abstract submission: Wednesday 8th January 2014 (sharp) - 23:59 Hawaii Time Full-paper submission: Monday 13th January 2014 (sharp) - 23:59 Hawaii Time Authors' Rebuttals: Wednesday 19th-Friday 21 Feb 2014 Acceptance notifications: Wednesday 26 February 2014 Camera-ready papers: Monday 10th of March 2014 *Submission Information* ESWC2014 welcomes the submission of original research and application papers dealing with all aspects of representing and using semantics on the Web. We encourage theoretical, methodological, empirical, and applications papers. The proceedings of this conference will be published in Springer's Lecture Notes in Computer Science series. This year three of the best papers presented at the conference will have the opportunity to submit an extended version to a special issue of the journal "Semantic Web - Interoperability, Usability, Applicability" (IOS Press). Papers should not exceed fifteen (15) pages in length and must be formatted according to the information for LNCS authors. Papers must be submitted in PDF (Adobe's Portable Document Format) format. Papers that exceed 15 pages or do not follow the LNCS guidelines will be automatically rejected without a review. Authors of accepted papers will be required to provide semantic annotations for the abstract of their submission - details of this process will be given on the conference Web page at the time of acceptance. At least one author of each accepted paper must register for the conference. More information about the Springer's Lecture Notes in Computer Science (LNCS) are available on the Springer LNCS Web site (http://www.springer.com/computer/lncs/lncs+authors). Submissions and reviewing will be supported by the EasyChair system: https://www.easychair.org/account/signin.cgi?conf=eswc2014 From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:30:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:30:55 +0100 Subject: Journee: Journee thematique, Optimisation et traitement automatique du langage, Universite Paris 13, 16 decembre 2013 Message-ID: Date: Mon, 18 Nov 2013 12:45:55 +0100 From: Joseph Le Roux Message-ID: Bonjour, Les m?thodes d'optimisation sont de plus en plus utilis?es en traitement automatique des langues pour concevoir des m?thodes efficaces tant pour l'apprentissage de mod?les que pour le d?codage, notamment en offrant un cadre formel qui distingue clairement les contraintes globales des contraintes locales, tout en permettant de les combiner. L'?quipe RCLN du Laboratoire d'Informatique de Paris Nord s'int?resse de pr?s ? ces m?thodes pour la mod?lisation conjointe des diff?rents niveaux de description linguistique. Dans le cadre du p?le math/stic de Paris 13, avec le soutien du LABEX EFL, et en collaboration avec l'?quipe AOC du LIPN, l'?quipe RCLN organise une journ?e de s?minaires autour des th?mes de l'optimisation et du traitement automatique des langues. Cette journ?e aura lieu sur le campus de l'Universit? Paris 13 ? Villetaneuse, dans l'amphith??tre Euler : 09h30-10h00 :: Accueil (Amphi Euler) 10h00-11h00 :: Expos? d'Andr? Martins (Amphi Euler) 11h15-12h15 :: Expos? de Sebastian Riedel (Amphi Euler) Pause d?jeuner (LIPN) 13h45-14h45 :: Expos? de Xavier Carreras (Amphi Euler) 15h00-16h00 :: Expos? de Joseph Le Roux (Amphi Euler) 16h00 :: go?ter au LIPN ! La participation ? cette journ?e est libre. Si vous comptez y assister, nous vous demandons, pour des raisons pratiques (organisation du buffet notamment), de nous l'indiquer ? cette adresse [[http://doodle.com/87mnbcdbzdmytffc]] . R?sum? des quatre expos?s pr?vus : ------------------------------------------------------------------------ Andr? Martins, Priberam, Lisbon Title: AD3: A New Decoder for Structured Prediction Abstract: In this talk, I will present AD3 ("Alternating Directions Dual Decomposition"), a new consensus-based decoder for problems representable as factor graphs. AD3 is an approximate decoder that ignores global effects caused by the cycles of the graph, solving a linear relaxation of the original problem. It can handle many scenarios often encountered in NLP and IR applications, such as models with constraints in first-order logic; models involving budget or knapsack constraints; and combinations of structured models which are individually tractable, but hard to decode jointly. Like other dual decomposition algorithms, AD3 has a modular architecture, where local subproblems are solved independently, and their solutions are gathered to compute a global update. The key characteristic of AD3 is that each local subproblem has a quadratic regularizer, leading to faster convergence (both theoretically and in practice). After providing closed-form solutions for several of these subproblems, I will proceed to discuss a recent active set method that works for arbitrary factors, requiring only a local maximization oracle (the same oracle required in subgradient-based dual decomposition). In the second part of the talk, I will discuss two recent applications of AD3 in NLP problems: dependency parsing and compressive summarization. I will present "Turbo Parser," an open source dependency parser, which was recently improved with AD3 and the active set method to permit fast decoding of non-projective third-order models. Experiments in 14 languages yield state-of-art results, with parsing speeds ranging between 700 and 4,000 tokens per second. For compressive summarization, the use of AD3 leads to a system which is modular in the three qualities that define a good summary (conciseness, informativeness, and grammaticality), with state-of-the-art ROUGE scores, and runtimes close to extractive summarizers. This work was done in collaboration with Noah Smith, M?rio Figueiredo, Eric Xing, Pedro Aguiar, and Miguel Almeida. ------------------------------------------------------------------------ Sebastian Riedel, UCL, London. Title: Predict, Price and Cut: Column and Row Generation for Structured Prediction. Abstract: Many problems in NLP, and structured prediction in general, can be cast as finding high-scoring structures based on a large set of candidate parts. For example, In second order tagging, we have to select high-scoring transitions between tags in a globally consistent fashion. In second order graph-based dependency parsing we have to choose a quadratic number of first order and a cubic number of second order edges such that the graph is both high-scoring and a tree. What makes such problems challenging is the large number of possible parts to consider. This number not only affects the cost of search or optimization but also slows down the process of scoring parts before they enter the optimisation problem, and extracting features. In this talk I present an approach that can solve problems with large sets of candidate parts without considering all of these parts in either optimization or scoring. In contrast to most pruning heuristics, our algorithm can give certificates of optimality before having optimized over, or even scored, all parts. It does so without the need of auxiliary models or tuning of threshold parameters. This is achieved by a delayed column and row generation algorithm that iteratively solves an LP relaxation over a small subset of current candidate parts, and then finds new candidates with high scores that can be inserted into the current optimal solution without removing high scoring existing structure. The latter step subtracts from the cost of a part the price of resources the part requires, and is often referred as pricing. Sometimes parts may score highly after pricing, but are necessary in order to make the current solution feasible. We add such parts in a step that roughly amounts to violated cuts to the LP. We evaluate our approach on two applications: second order dependency parsing and first order tagging with large domains. In both cases we dramatically reduce the number of parts considered, and observe about an order of magnitude speed-up. This is possible without loss of optimality guarantees, and hence accuracy. ------------------------------------------------------------------------ Xavier Carreras, UPC, Barcelona Title: Learning Automata and Grammars: From Spectral Algorithms to Convex Optimizations There is an increasing interest in spectral methods to learn latent-variable language models in the form of weighted automata and context-free grammars. Spectral methods provide an algebraic formulation to the problem of inducing automata or grammars from data, and directly exploit the recurrence relations behind the model. I will review the spectral method from an algebraic perspective, making use of Hankel matrices as the key object behind the method: a Hankel matrix collects all necessary statistics of the distribution we want to learn; and finding a low-rank factorization of this matrix results in the automata or grammar. Under mild assumptions, it can be shown that this method nicely approximates the target model. From here, I will show how we can reformulate the spectral learning algorithm as a low-rank convex optimization. This will be useful to adapt the method to other settings, by adding linear constraints. I will focus in "unsupervised" induction of context-free grammars, that is, learning a grammar from plain strings. Our formulation involves optimizing for a low-rank Hankel matrix that is linearly constrained to satisfy inside-outside recursions. An analogous method method can be formulated to learn finite-state transducers from unaligned parallel strings. ------------------------------------------------------------------------ Joseph Le Roux, LIPN, Paris Title: Combining PCFG-LA Models with Dual Decomposition: A case Study with Function Labels and Binarization Abstract: It has recently been shown that different NLP models can be effectively combined using dual decomposition. In this talk, we present how PCFG-LAs (Probabilistic Context-Free Grammars with Latent Annotations, the state-of-the-art model for unlexicalized constituent parsing) are suitable for combination in this way. We first show how the intractable problem of exact PCFG-LA decoding is approximated with anchored PCFGs. Then we present a method for combining anchored PCFGs based on the partial superposition of tree structures. We experiment with the different models which result from alternative methods of extracting a grammar from a treebank (retaining or discarding function labels, left binarization versus right binarization) and achieve state-of-the-art parsing performance, with a labeled Parseval F-score of 92.4 on Wall Street Journal Section 23 ? this represents an error reduction rate of 7% over a strong PCFG-LA product-model baseline. This work was done in collaboration with Antoine Rozenknop and Jennifer Foster. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 21:05:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 22:05:10 +0100 Subject: Ressource: corpus ANCOR_Centre, annotation en coreference, 488 000 mots, fran=?ISO-8859-1?Q?=E7ais_?=parle, licence CC-BY-SA Message-ID: Date: Mon, 18 Nov 2013 17:08:41 +0100 From: Jean Yves ANTOINE Message-ID: <528A3B89.3030603 at univ-tours.fr> X-url: http://tln.li.univ-tours.fr/Tln_Corpus_Ancor.html ======================================================================= Nous avons le plaisir de vous annoncer la diffusion d'ANCOR_Centre, le plus grand corpus francophone annot? en relations anaphoriques et de cor?f?rence. Ce corpus a ?t? r?alis? par une ?quipe projet issue du Laboratoire d'Informatique de l'Universit? Fran?ois Rabelais de Tours (LI) et du Laboratoire Lig?rien de Linguistique (UMR 7270, Universit? d'Orl?ans & Universit? de Tours). Centr? sur l'annotation de mentions nominales ou pronominales, le corpus ANCOR_Centre concerne quatre corpus de dialogue ou interview oraux correspondant ? autant de situations discursives. Il constitue au total une ressource de 488 000 mots (30,5 h d'enregistrement) sur laquelle ont ?t? d?limit?es 116 071 mentions et 51337 relations de cor?f?rence ou anaphoriques auxquelles sont associ?s un riche ensemble de traits linguistiques. Ce corpus, qui peut servir aussi bien aux besoins du TAL que de la linguistique de corpus, est diffus? librement sous licence Creative Commons CC-BY-SA. La cr?ation de cette ressource a ?t? financ?e en majeure partie dans le cadre d'un appel ? projet d'initiative acad?mique de la r?gion Centre (projet ANCOR) Le corpus ANCOR_Centre est accessible depuis les sites suivants : - projet ANCOR : http://tln.li.univ-tours.fr/Tln_Corpus_Ancor.html - Parole_Publique (diffusion libre de corpus oraux) : www.info.univ-tours.fr/~antoine/parole_publique/ En esp?rant que cette ressource rencontrera votre int?r?t. L'?quipe projet ANCOR : LI : Ana?s Lefeuvre, Jean-Yves Antoine, Denis Maurel LLL : Judith Muzerelle, Emmanuel Schang, Aurore Pelletier, Iris Eshkol ============================================================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:56:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:56:27 +0100 Subject: Appel: ESWC 2014, Call for PhD Symposium Message-ID: Date: Mon, 18 Nov 2013 15:45:57 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131118144618.31DD6DBB6F at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/phd-symposium ** apologies for cross-posting ** ==== Call for PhD Symposium ==== http://2014.eswc-conferences.org/important-dates/phd-symposium The ESWC 2014 PhD Symposium is a chance for PhD students working in all areas of Semantic Web research to present their work, meet with peers and experienced researchers, obtain feedback and learn from each other's experiences. It aims at helping future researchers in building up the skills and confidence required to conduct and promote their research, as well as providing them with an opportunity to attend one of the most important research conferences on the Semantic Web. The ESWC PhD Symposium will give to students the opportunity to: 1. Learn from a mentor: Established researchers and PhD student advisors will provide direct feedback. Each selected student will be assigned a member of the programme committee with whom they will interact on the revision of the paper and the preparation of the presentation. 2. Learn about research in general: Doing good research goes beyond writing a good paper; it includes perspectives on research as an endeavour and a career. Besides the presentations, coffee breaks and the PhD Symposium lunch will be used to exchange ideas and ask questions about all aspects of conducting a PhD and a research career in general. 3. Learn by constructive criticism: Thinking and writing about strengths and weaknesses of other research contributions shapes your own research capabilities. As a participant to the PhD symposium, you will be expected to also review submissions from others, allowing you to juxtapose and learn from convergence and divergence of opinions. 4. Learn by presenting: Accepted contributions will be presented in the PhD symposium. All accepted contributions will also appear at the general poster session of ESWC. Students' posters will be presented alongside posters and demonstrations of the main conference. Submissions will be considered from two different categories depending on the advancement into the PhD: - Early Stage PhD: For students who may have identified the main research problem they want to address, the relevant literature, and are building their research methodology, but might not yet have obtained significant results, or only preliminary ones. - Late Stage PhD: For students who have already defined their approach (even if incompletely) and obtained significant results (e.g., that might already have been published). These categories do not affect the chances of being selected. They will however be taken into account by reviewers in their feedback, and in the length and format of the presentation. The organisers might decide to move a submission from one category to the other, if they think it is justified. *Submission Information* PhD students in all areas of Semantic Web research are invited to submit papers having 5 to 10 pages describing their PhD research, in the PDF format following the LNCS template. Submissions should be sent using the PhD Symposium submission system, through which participants will be also asked to decide on the category of their submission and to write a paragraph regarding their motivation for participating in the ESWC PhD Symposium. Submissions should follow the following template of sections: 1. Introduction/Motivation Give a general introduction to the domain/area/topic and indication of its importance/impact in Semantic Web research or other domains. 2. State of the Art Describe existing work in the area, work focusing on the same/similar problems or that might be useful to realising your PhD. 3. Problem Statement and Contributions Based on motivation and state of the art, formulate the problem you intend to solve, and how you intend to contribute to Semantic Web research. This section should include a clear formulation of one (or very few) research hypothesis (what you will validate through your methodology, approach and evaluation) and the research questions that need to be answered. Late Stage PhD submissions should focus on contributions to such a hypothesis. 4. Research Methodology and Approach Describe the research methodology you will apply in your research, including the different steps from the formulation of your research questions to answering them. Also describe the approach you are taking (or you intend to take for Early Stage PhD submissions) to instantiate the research methodology, hence contributing to solve the problem described in Section 3 and confirm or reject your hypothesis. Discuss how this approach is innovative and novel, and how it is (might be) implemented. 5. Preliminary or Intermediate Results In a full conference paper, the approach would be fully described (in section 4) and fully evaluated (in section 6). Being at an intermediate stage, you should report here about the results achieved up to now in applying your approach that might not yet be sufficient for a full evaluation. . 6. Evaluation Plan Describe your evaluation plan, which is the way you intend to validate your hypothesis, your results, and the value of your approach. For Early Stage PhD submissions, this might be only partially defined, and details might be ommited. For Late Stage PhD submissions, you might have partial evaluation results. 7. Conclusion Describe how your results will or might impact research or the world at large. *Important dates* Submission deadline: 13th January 2014 Notification: 10th February 2014 Revised version of submission to mentor: 24th February 2014 Final version: 10th March 2014 Draft presentation to mentor: 12th May 2014 *PhD Symposium Chairs* Steffen Staab (Institute for Web Science and Technologies - WeST, University of Koblenz-Landau, DE) Mathieu d'Aquin (Knowledge Media Institute, The Open University, UK) From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 21:16:36 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 22:16:36 +0100 Subject: Stage: Stage M2, Ressources semantiques pour l'analyse de la factualite Message-ID: Date: Tue, 19 Nov 2013 16:19:18 +0100 From: delphine battistelli Message-ID: X-url: http://chronolines.fr/ X-url: http://noopsis.fr/ X-url: http://www.mitpressjournals.org/toc/coli/38/2 *** *** Proposition de stage de M2 en TAL *** Le laboratoire MoDyCo (UMR CNRS-Universit? Paris Ouest Nanterre), en collaboration avec le laboratoire GREYC (UMR CNRS-Universit? de Caen), propose un sujet de stage en TAL de niveau Master 2 d?une dur?e minimale de 4 mois, ? partir de janvier 2014. Titre : Enrichissement de ressources s?mantiques pour l?analyse de la factualit? pour des syst?mes de recherche d?information. R?mun?ration : celle pr?vue par la r?glementation ? savoir 436,05 ? par mois. *- Contexte applicatif et enjeux th?oriques *: L?analyse automatique du degr? de factualit? des situations (ou ?v?nements) d?not?es dans les textes s?impose depuis quelques ann?es comme un enjeu important dans le domaine de la recherche d?information. Parmi les applications vis?es : les syst?mes de questions/r?ponses, les moteurs de recherche et, int?gr?s ou non ? ces derniers, les syst?mes visant ? proposer en sortie une visualisation des informations sur une ligne du temps (ou *timeline*). Ces applications visent alors ? distinguer les ?v?nements pr?sent?s comme d?j? r?alis?s et av?r?s des ?v?nements pr?sent?s comme incertains ou seulement possibles ou encore des ?v?nements pr?sent?s par l?auteur d?un texte comme certains selon un co-?nonciateur dont l?auteur ne fait que citer les propos en montrant qu?il n?y adh?re pas lui-m?me. Dans une autre terminologie, on parle de l?analyse et de la mod?lisation des caract?ristiques modales (voire ?nonciatives) des situations. Un num?ro entier de la revue *Computational Linguistics* (ModNeg, 2012) a derni?rement ?t? consacr? ? cette probl?matique. Il met l?accent sur sa complexit? th?orique, en termes notamment de cat?gorisation s?mantique des divers indices (lexicaux et grammaticaux) qui participent ? l?expression du degr? de factualit? d?un ?v?nement, celui-ci pouvant ?tre pass? ou ? venir. Un autre aspect fondamental, encore cependant peu d?crit dans la litt?rature tant linguistique que TAL, a trait aux modes de calcul de ce degr? ?tant donn? plusieurs indices co-pr?sents. Les exemples ci-apr?s donnent un aper?u des types d??nonc?s qu?il s?agit de pouvoir traiter en montrant la variation du statut v?ri-conditionnel d?un m?me contenu propositionnel () fonction des indices sous la port?e s?mantique desquels il tombe : *Paul est venu* *Paul est peut-?tre venu* *Je crois que Paul est venu * *On dit que Paul est venu * *Il semblerait que Paul est venu * *Selon Marie, Paul est venu * *Selon Marie, Paul est s?rement venu * *Marie pr?tend que Paul est venu* *Paul devrait venir* *Paul doit venir* *Paul pourrait venir* *- Sujet de stage :* On note que peu de ressources ont ?t? ?labor?es pour le fran?ais jusqu?? pr?sent. Le stage visera ? combler en partie ce d?ficit et s?int?ressera ? une analyse s?mantique fine d?indices lexicaux (verbes, noms, adjectifs, adverbes). Cette analyse s?appuiera sur une m?thodologie et des ressources d?j? constitu?es (Battistelli et Damiani, 2012, Damiani et Battistelli 2013, (Enjalbert et Mathet, 2013) ainsi que sur des conceptions linguistiques issues de (Authier-Revuz, 1995) ou (Gosselin, 1999). Ces ressources et cette m?thodologie seront test?es et ?valu?es sur deux types de corpus de textes dans une perspective comparationniste : des d?p?ches d?agence journalistique et des news technologiques publi?es sur le net. Le premier type de corpus est actuellement plus particuli?rement analys? dans le cadre d?un syst?me d?velopp? pour le projet ANR ChronoLines dont MoDyCo est le pilote (http://chronolines.fr/) ; le second type de corpus est lui plus particuli?rement analys? dans le cadre d?une application d?velopp?e au sein de l?entreprise Noopsis (http://noopsis.fr/), partenaire du laboratoire GREYC. Le travail visera en outre ? pr?ciser les zones de recouvrement th?orique comme applicatives avec le domaine de l?annotation des opinions (B?thard et al., 2004, Wilson et Wiebe, 2003). *- Profil du candidat:* Le candidat devra ?tre inscrit dans un Master en traitement automatique des langues ou en linguistique appliqu?e. - Comp?tences demand?es * comp?tences en traitement automatique des langues et/ou en linguistique. * comp?tences de base en informatique et plus sp?cifiquement maitrise des langages de type perl et python. - Comment candidater ? Envoyer un CV (avec le d?tail des cours et notes des deux ann?es de Master) et une lettre de motivation ? : Delphine Battistelli : del.battistelli at gmail.com Patrice Enjalbert : patrice.enjalbert at unicaen.fr *- R?f?rences * Authier-Revuz J. (1995). Ces mots qui ne vont pas de soi, Boucles r?flexives et non-co?ncidences du dire, Paris: Larousse, 1995 Battistelli D., Damiani M. (2013) - ? Analyzing modal and enunciative discursive heterogeneity: how to combine semantic resources and a syntactic parser analysis ?, in Actes WAMM (Workshop on Annotation of Modal Meaning in Natural Language), held in conjunction with IWCS'13, Potsdam, Allemagne. Bethard S., Yu H., Thornton A., Hatzivassiloglou V., Jurafsky D. (2004). ? Automatic extraction of opinion propositions and their holders?, in Working Notes of the AAAI Spring Symposium on Exploring Attitude and Affect in Text: Theories and Applications, March 22-24, 2004, Stanford Damiani M., Battistelli D. (2013) - ? Enunciative and modal variations in newswire texts in French: From guideline to automatic annotation ?, in Actes de The 7th Linguistic Annotation Workshop & Interoperability with Discourse, held in conjunction with ACL?2013, Sofia, Bulgarie. Enjalbert, P., Mathet, Y. (2013) ? ? Constructions ?Verbe + Verbe infinitif?: ?tude de corpus et lexique s?mantique ?, Document interne GREYC-Noopsis, Octobre 2013. Gosselin L. (2005). *Temporalit? et modalit?*, Bruxelles, De Boeck Sup?rieur ? Champs linguistiques ?, 2005. ModNeg, 2012. Modality and Negation, Computational Linguistics, Special Issue - Volume 38, Issue 2 - June 2012 (http://www.mitpressjournals.org/toc/coli/38/2). Sauri R., Pustejovsky J. (2007). ?Determining Modality and Factuality for Text Entailment?, in Actes ICSC 2007, Irvine, California, 2007. Wilson T., Wiebe J. (2003). ?Annotating opinions in the world Press?, in Actes 4th SIGdial Workshop on Discourse and Dialogue (SIGdial-03), ACL SIGdial, 2003. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 21:04:02 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 22:04:02 +0100 Subject: Appel: Assemblee Generale Consortium Corpus Ecrits, ILF, 22 novembre 2013 Message-ID: Date: Mon, 18 Nov 2013 16:20:55 +0100 From: Secretariat General Message-ID: <528A3057.70905 at ling.cnrs.fr> X-url: http://corpusecrits.corpus-ir.fr/ Veuillez nous excuser pour les doublons dans les envois ... MERCI http://www.huma-num.fr/sites/default/files/ressourcesdoc/couleur-cmjn-petit.jpg Consortium ? Corpus ?crits ? Assembl?e g?n?rale du 22 novembre 2013 ILF - Paris, le 18novembre 2013 Ch?res Coll?gues, ChersColl?gues, Nous organisons notre r?union pl?ni?re annuelle le vendredi 22 novembre 2013, de 9h30 ? 18h,? l'INALCO, 62 rue des Grands Moulins ? Paris dans le 13^?me arrondissement, Amphith??tre N?5 au 2?me ?tage. Cette r?union sera consacr?e ? la pr?sentation de notre bilan et aux perspectives. PROGRAMME - Pr?sentation - Bilans par th?mes des r?alisations - Pr?sentation des actions des groupes de travail - Formations r?alis?es et/ou n?cessaires - Pr?sentation de l'Initiative Corpus de r?f?rences du Fran?ais - Appel d'offres 2014 : Quels crit?res, quelles th?matiques, quel budget ? - Quelles attentes, quels projets en 2014 et 2015 pour le Consortium Corpus Ecrits La participation de toutes les personnes int?ress?es par cette journ?e est vivement encourag?e par le comit? de pilotage, qu'elles soient ou non inscrites ? un groupe de travail. Si la participation ? ces journ?es est libre, l'inscription est obligatoire et...tr?s rapide. Il vous convient de vous enregistrer en vous connectant ? : http://french.jotform.com/form/32943348795872 Le consortium peut contribuer au financement des missions des participants actifs des groupes de travail. Au plaisir devous accueillir nombreux ce 22 novembre 2013, Pour le comit? de pilotage du Consortium ? Corpus ?crits ? FranckNeveu, Directeurde l'ILF http://corpusecrits.corpus-ir.fr/ Le comit? depilotage duConsortium? Corpus ?crits ? : Franck Neveu pour l'ILF, FR 2393 - Porteur du consortium Sylvie Archaimbault pour HTL - UMR 7597 - Universit? Denis Diderot - Paris 7 Thierry Chanier pour le LRL - EA 999 - Universit? Blaise Pascal - Clermont-Ferrand Serge Heiden pour ICAR - UMR 5191 - Universit? Lumi?re Lyon 2 V?ronique Magri pour BCL - UMR 6039 - Universit? Nice Sophia Antipolis Jean-Marie Pierrel pour l'ATILF - UMR 7118 - Nancy - Universit? Cl?ment Plancq pour le LLF - UMR 7110 - Universit? Denis Diderot - Paris 7 C?line Poudat pour le LDI - UMR 7187 - Universit? de Paris 13 Beno?t Sagot pour ALPAGE - INRIA- Universit? Denis Diderot - Paris 7 Rudolph Sock pour LILPA - EA 1339 - Universit? de Strasbourg Agn?s Tutin pour le LIDILEM - EA 609 - Universit? Grenoble 3 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 19 20:49:20 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 19 Nov 2013 21:49:20 +0100 Subject: Seminaire: Traces digitales, Universite de Paris Est Marne la Vallee, 12 decembre 2013 Message-ID: Date: Mon, 18 Nov 2013 15:20:37 +0100 From: Nicolas Turenne Message-ID: <528A2235.1070209 at yahoo.fr> X-url: http://www.inra-ifris.org/axes-de-recherche-thematique/groupe-plateforme-cortext/seminaire-de-l-axe-traces-digitales-groupe-cortext.html/ [d?sol? pour les r?ception multiples] Chers coll?gues, Dans le cadre de la douzi?me s?ance du s?minaire 'traces digitales' du groupe CorText, nous avons le plaisir d'accueillir /Julien Bonneau/ (post-doc, Ceditec, UPEC) qui nous parlera de lexicom?trie . Cette matin?e aura lieu le *jeudi 12 d?cembre de 10h ? 13h*, dans la salle de r?union C219 du Latts (Universit? Paris-Est Marne la Vall?e - rue Galil?e, b?timent du Bois de l'Etang - 2?me ?tage - aile C). /Voir http://www.inra-ifris.org/axes-de-recherche-thematique/groupe-plateforme-cortext/seminaire-de-l-axe-traces-digitales-groupe-cortext.html/ Julien Bonneau /(post-doc, Ceditec, UPEC)/ *Vari?t? et variation : ?mergence d'une synergie (co-)textuelle interpr?table ?* Pour chaque mot d'un texte, la cooccurrence asym?trique (Luong et al. 2010) d?finit deux mesures de la vari?t? lexicale en cotexte : une moyenne locale (?nergie) et une mesure globale (disponibilit?). Apr?s avoir expos? et prolong? ces deux notions, nous g?n?raliserons leur utilisation ? l'ensemble du vocabulaire d'un texte (Bonneau 2012a). Nous d?crirons les propri?t?s du nuage lexical obtenu et nous interrogerons sur les mots pr?sentant des corr?lation (Rastier 2008) quantitatives saillantes car remarquables : deux parcours ?mergent - et s'opposent - dont diverses hypoth?ses d'interpr?tation seront discut?es : fonds vs. formes (Poudat et al. 2012) ; discours persuasif vs. informatif (Bonneau 2012b). " Une bibliographie succinte : Bonneau JADT, Li?ge 2012a Bonneau Th?se, Nice 2012b Luong et al. JADT, Rome 2010 Poudat et al. Colloque La cooccurrence. Du fait statistique au fait textuel, Besan?on 2012 Rastier JADT, Lyon 2008 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From SciencePG at HUYAMONT.COM Tue Nov 19 22:09:54 2013 From: SciencePG at HUYAMONT.COM (=?utf-8?B?U2NpZW5jZVBH?=) Date: Wed, 20 Nov 2013 06:09:54 +0800 Subject: SciencePG: Fast Publication Message-ID: An HTML attachment was scrubbed... URL: From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:18:19 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:18:19 +0100 Subject: Appel: Congres Mondial de Linguistique Francaise, Report date limite (CMLF, Berlin, 2014) Message-ID: Date: Thu, 21 Nov 2013 08:29:48 +0100 From: Alice Krieg-Planque Message-ID: <528DB66C.9050706 at club-internet.fr> X-url: http://www.ilf.cnrs.fr/spip.php?rubrique111 X-url: http://www.ilf.cnrs.fr/spip.php?article223 Report de date limite. - - - appel - - - appel - - - appel - - - appel - - - appel - - La date limite pour proposer une communication au prochain Congr?s Mondial de Linguistique Fran?aise a ?t? report?e au 15 d?cembre 2013. Les personnes souhaitant pr?senter une communication ? ce congr?s sont invit?es ? d?poser leur proposition jusqu'? cette date sur la plateforme de d?p?t, ? l'adresse : http://www.ilf.cnrs.fr/spip.php?rubrique111 Les r?ponses ? l'appel doivent se pr?senter sous forme de textes de 10 ? 15 pages comprenant une bibliographie. Le quatri?me Congr?s Mondial de Linguistique Fran?aise (CMLF) se tiendra ? Berlin (Allemagne, Freie Universit?t Berlin) du 19 au 23 juillet 2014. Il est organis? en diff?rentes sessions th?matiques : - Histoire du fran?ais : perspectives diachronique et synchronique - Linguistique et Didactique (fran?ais langue premi?re, fran?ais langue seconde) - Discours, Pragmatique et Interaction, - Francophonie, - Histoire, ?pist?mologie, R?flexivit?, - Lexique(s), - Linguistique de l'?crit, Linguistique du texte, S?miotique, Stylistique, - Morphologie, - Phon?tique, Phonologie et Interfaces, - Psycholinguistique et Acquisition, - S?mantique, - Sociolinguistique, Dialectologies et ?cologie des langues, - Syntaxe, - Ressources et Outils pour l'analyse linguistique A ces quatorze sessions th?matiques a ?t? ajout?e une quatorzi?me session "pluri-th?matique", laissant ouverte la possibilit? de travailler dans plusieurs domaines, voire en marge des territoires disciplinaires traditionnels. Informations suppl?mentaires : http://www.ilf.cnrs.fr/spip.php?article223 - - - appel - - - appel - - - appel - - - appel - - - appel - - ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 21:12:42 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 22:12:42 +0100 Subject: These: Romain Deveaud, Vers une representation du contexte thematique en Recherche d'Information Message-ID: Date: Wed, 20 Nov 2013 15:48:49 +0000 From: Romain Deveaud Message-ID: Bonjour, j'ai le plaisir de vous inviter ? la soutenance de ma th?se intitul?e "Vers une repr?sentation du contexte th?matique en Recherche d'Information". La soutenance aura lieu le vendre 29 novembre 2013 ? 14h30 dans l'amphith?atre de l'IUT de l'Universit? d'Avignon (337, chemin des Meinajari?s 84911 Avignon, iut.univ-avignon.fr). L'IUT est situ? juste ? c?t? du Centre d'Enseignement et de Recherche en Informatique. Vous ?tes ?galement convi?s au pot de th?se qui suivra la soutenance. Bien cordialement, Romain Deveaud ----------------------------------------------------------------------- Le jury de soutenance sera compos? de : Mme Josiane Mothe - Professeur, IRIT, Toulouse - Pr?sidente du jury M. Jian-Yun Nie - Professeur, RALI, Montr?al - Rapporteur M. Philippe Mulhem - Charg? de recherche CNRS, LIG, Grenoble - Rapporteur M. Jacques Savoy - Professeur, IIUN, Neuch?tel - Examinateur M. Jaap Kamps - Associate professor, ILLC, Amsterdam - Examinateur M. Benjamin Piwowarski - Charg? de recherche CNRS, LIP6, Paris - Examinateur M. Eric SanJuan - Ma?tre de conf?rences, LIA, Avignon - Co-Directeur de th?se M. Patrice Bellot - Professeur, LSIS, Marseille - Directeur de th?se R?sum? de la th?se : Quand des humains cherchent des informations au sein de bases de connaissances ou de collections de documents, ils utilisent un syst?me de recherche d'information (SRI) faisant office d'interface. Les utilisateurs doivent alors transmettre au SRI une repr?sentation de leur besoin d'information afin que celui-ci puisse chercher des documents contenant des informations pertinentes. De nos jours, la repr?sentation du besoin d'information est constitu?e d'un petit ensemble de mots-cl?s plus souvent connu sous la d?nomination de "requ?te". Or, quelques mots peuvent ne pas ?tre suffisants pour repr?senter pr?cis?ment et efficacement l'?tat cognitif complet d'un humain par rapport ? son besoin d'information initial. Sans une certaine forme de contexte th?matique compl?mentaire, le SRI peut ne pas renvoyer certains documents pertinents exprimant des concepts n'?tant pas explicitement ?voqu?s dans la requ?te. Dans cette th?se, nous explorons et proposons diff?rentes m?thodes statistiques, automatiques et non supervis?es pour la repr?sentation du contexte th?matique de la requ?te. Plus sp?cifiquement, nous cherchons ? identifier les diff?rents concepts implicites d'une requ?te formul?e par un utilisateur sans qu'aucune action de sa part ne soit n?cessaire. Nous exp?rimentons pour cela l'utilisation et la combinaison de diff?rentes sources d'information g?n?rales repr?sentant les grands types d'information auxquels nous sommes confront?s quotidiennement sur internet. Nous tirons ?galement parti d'algorithmes de mod?lisation th?matique probabiliste (tels que l'allocation de Dirichlet latente) dans le cadre d'un retour de pertinence simul?. Nous proposons par ailleurs une m?thode permettant d'estimer conjointement le nombre de concepts implicites d'une requ?te ainsi que l'ensemble de documents pseudo-pertinent le plus appropri? afin de mod?liser ces concepts. Nous ?valuons nos approches en utilisant quatre collections de test standards de TREC de grande taille. En annexes, nous proposons ?galement une approche de contextualisation de messages courts exploitant des m?thodes de recherche d'information et de r?sum? automatique. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 21:07:14 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 22:07:14 +0100 Subject: Journee: Alain Berthoz, simplexite et langage, la vicariance, Universite Paris Ouest Message-ID: Date: Wed, 20 Nov 2013 10:10:08 +0100 From: "Didier Bottineau" Message-ID: <007601cee5d0$512c0240$f38406c0$@bottineau at free.fr> CONFERENCE D?ALAIN BERTHOZ ET JOURNEE D?ETUDE SIMPLEXITE ET LANGAGE Alain Berthoz, Professeur au Coll?ge de France, Membre de l'Acad?mie des Sciences et de l'Acad?mie des Technologies, prononcera la Conf?rence inaugurale de l?Ecole Doctorale 139, Universit? Paris Ouest Nanterre la D?fense Le mercredi 27 novembre, ? 17h, B?timent A, Amphith??tre A2 : La vicariance, une propri?t? simplexe pour la perception, l'action, la m?moire et les d?cisions Cette conf?rence sera pr?c?d?e d?une journ?e d??tude SIMPLEXITE ET LANGAGE : rencontre avec Alain Berthoz Universit? Paris Ouest Nanterre, B?timent C, salle C 102a (1e ?tage), 9h-16h30 Vous ?tes cordialement invit?s ? participer aux deux ?v?nements. Acc?s : RER A Nanterre Universit? ou SNCF Nanterre Universit? (depuis la Gare Saint Lazare) Journ?e d??tude SIMPLEXITE ET LANGAGE La simplexit? dans sa conception actuelle est un processus ? os? ? et renouvel? par Alain Berthoz (La simplexit?, Odile Jacob, 2009). La simplexit? n?est pas l?art de rendre simple la complexit? ?crasante ni d?en simplifier la pr?sentation par un r?ductionnisme, mais la capacit? pour un ?tre vivant ou une entit? dynamique de produire a priori un monde ou environnement simple, ouvert ? la compr?hension pr?dictive et propice ? l?engagement et ? l?interaction, ? travers des actions et processus dynamiques naturels et culturels, individuels et collectifs, biologiques et techniques, spontan?s ou cultiv?s, pragmatiques et adaptatifs. La simplexit? serait de nature ? rendre compte de l?ab?me paradoxal qui s?pare la complexit? des mod?lisations et l?apparente aisance des agents confront?s ? l?exp?rience des environnements et syst?mes dynamiques. La question de la simplexit? a jusqu?ici ?t? appliqu?e ? divers domaines disciplines telles que la biologie du vivant, l?organisation des m?canismes neuronaux, la m?moire, l?action, la perception, la relation raison / ?motion. Elle fait l?objet d?applications dans des domaines aussi divers que le management (la d?cision), le design, l?interaction homme-machine (l?ergonomie), et elle commence ? susciter l?int?r?t de recherches appliqu?es en didactique. Que peut apporter la simplexit? aux sciences du langage ? Peut-on mod?liser une langue humaine ou un comportement de communication animale comme un syst?me complexe dont des individus produisent par leur action une aperception simple qui en expliquerait l?ergonomie apparente ? A travers quels processus d?acquisition, d?apprentissage, de production et de compr?hension de parole, d?interaction, de reformulation ? Les descriptions de faits lexicaux, morphologiques, syntaxiques, prosodiques, s?mantiques, pragmatiques peuvent-elles mettre en ?vidence certains des processus simplexes en question ? La didactique de la langue premi?re ou seconde peut-elle prendre en compte des ? propositions simplexes ?, et dans quelle mesure et en quoi le fait-elle d?j? ? Quels types de ? d?tours simplexes ? les th?ories linguistiques peuvent-elles d?velopper ou empruntent-elles d?j? ? L?objet de la pr?sente journ?e d??tude est de promouvoir ce type de questionnement en sciences du langage en vue d?esquisser un premier tour d?horizon de travaux envisag?s ou en cours dans cet esprit et d?ouvrir la voie ? des actions de recherche collaboratives ult?rieures de plus grande envergure. Pour ce faire, elle est constitu?e d?une s?rie de br?ves interventions sur th?mes cibl?s suivis de moments de discussion. Elle comprendra une pr?sentation de la simplexit? par Alain Berthoz et se terminera par une discussion g?n?rale. Elle sera suivie de la conf?rence inaugurale de l?ED 139 par Alain Berthoz sur La vicariance (Odile Jacob, 2013). Veuillez trouver infra le programme de la journ?e. UMR CNRS 7114 MoDyCo, Universit? Paris Ouest Nanterre Journ?e d??tudes SIMPLEXITE ET LANGAGE Rencontre avec le Professeur Alain Berthoz Coll?ge de France, Chaire de physiologie de la perception et de l?action Membre de l'Acad?mie des Sciences et de l'Acad?mie des Technologies Mercredi 27 novembre 2013, B?timent C, salle C102a MATIN 09:00-09:20 Didier Bottineau (MoDyCo, Universit? Paris Ouest Nanterre) Ouverture Simplexit? et diversit? linguistique en morphologie et en syntaxe 09:20-09:40 Christophe Parisse (MoDyCo, Universit? Paris Ouest Nanterre) Peut-on retrouver la simplexite? dans l'interaction pre?-langagie?re chez l'enfant ? 09:40-10:00 Claire Martinot (EA 4509 Sens Textes Informatique Histoire (STIH), Universit? Paris Sorbonne) Comment la reformulation peut simplexifier la langue ? Exemples de l'oral des enfants. 10:00-10:20 Anne Lacheret (MoDyCo, Universit? Paris Ouest Nanterre) Du complexe au simplexe dans l??tude de la prosodie des langues : une alternative ? creuser Pause (10:20-10:40) 10:40-11:00 Sylvain Kahane (MoDyCo, Universit? Paris Ouest Nanterre) La simplexit? des distorsions dans l'interface s?mantique-syntaxe 11h-12h : Alain Berthoz (Coll?ge de France) La simplexit? pr?sent?e ? des linguistes APRES-MIDI 14:00-14:20 Serge Sakhno (MoDyCo, Universit? Paris Ouest Nanterre) Simplexit? et explication des faits de langue comme construction d?un discours didactique efficient : une exp?rience de strat?gie didactique impliquant diff?rentes langues (russe, fran?ais, langues romanes, latin) 14:20-14:40 J?rg Eschenauer (Ecole des Ponts ParisTech, UPLEGESS) Enseignement des langues dans les Grandes Ecoles et simplexit? : Terrain fertile pour des projets innovants de recherche ? action ? 14:40-15:00 Michel Kreutzer (Laboratoire d'Ethologie et Cognition compar?es (EA 3456), Universit? Paris Ouest Nanterre) Le r?le des performances vocales et de la vie sociale des oiseaux chanteurs sur leurs comp?tences pour identifier des chants 15:00-15:20 Ren?-Joseph Lavie (MoDyCo, Universit? Paris Ouest Nanterre) La linguistique n'a pas manqu? de simplexionnistes! Mais ont-ils fait le bon 'd?tour'? Pause (15:20-15:40) 15:40-16:30 Discussion g?n?rale et projets La journ?e d??tude sera suivie de la conf?rence de la session inaugurale de l?E.D. 139 Amphith??tre A2, 17h Alain Berthoz (Coll?ge de France) La vicariance, une propri?t? simplexe pour la perception, l'action, la m?moire et les d?cisions ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 21:01:55 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 22:01:55 +0100 Subject: Stage: Grammaires d'extraction de marqueurs temporels Message-ID: Date: Wed, 20 Nov 2013 09:27:01 +0100 From: Alain Couillault Message-ID: <528C7255.4090309 at aproged.org> *Sujet de stage :* *D?veloppement de grammaires d'extractions de descriptions temporelles.* ** *R?sum? du travail propos? :* L'objectif de ce stage est de d?velopper une grammaire d'extraction de marqueurs temporels dans le domaine du tourisme. La plupart des informations contenues dans une base de donn?es touristiques (?v?nements, manifestations, h?tels, restaurants, mus?es...) contiennent des marqueurs temporels (date, dur?e, horaires d'ouvertures, conditions d'ouvertures ou de tarifs...) qu'il s'agira d'identifier au moyen d'une grammaire adapt?e. A partir de donn?es r?elles, vous aurez ? d?velopper une grammaire locale de reconnaissance de ces marqueurs, en utilisant les outils Unitex (http://www-igm.univ-mlv.fr/~unitex/) et GramLab (http://www.gramlab.org/fr/). *Mots cl?s :* Traitement automatique des langues, grammaires locales, Unitex, GramLab, expressions temporelles *Informations compl?mentaires :* *Encadrant(s) *: Alain Couillault, Micka?l Coustaty, Jean-Marc Ogier *Axe th?matique*://IDDC/(Image, Documents, Donn?es Complexes)/ *Axe strat?gique *: Pertinence Contenu-Interaction *Cadre de coop?ration* : Projet TourInflux (Investissement d'Avenir) *Date de d?but du stage *: Janvier 2014 *Dur?e du stage *: 5 ? 6 mois *Contexte de l'?tude:* Les travaux men?s par le candidat se d?rouleront au sein du L3i et s'inscriront dans le projet Tourinflux. . Le projet Tourinflux, s?lectionn? dans le cadre de l'appel ? projets Big Data du Fonds National pour la Soci?t? Num?rique et financ? dans le programme d'investissements d'avenir, rassemble deux entreprises, une association d'entreprises et le laboratoire L3i, et sera r?alis? en partenariat avec plusieurs acteurs du tourisme de France. Ce projet vise ? apporter aux acteurs du tourisme (d'abord les institutionnels mais aussi les acteurs priv?s) un ensemble d'outils leur permettant de g?rer ? la fois leurs donn?es internes et les informations disponibles sur le web afin de mieux comprendre comment un territoire est per?u et de mieux agir sur cette perception. Les outils actuellement ? disposition des institutionnels du tourisme sont insuffisants pour r?pondre ? ce besoin du fait des probl?mes de collecte, d'analyse, de manipulation et d'?change d'informations r?alis?s de mani?re beaucoup trop artisanale. L'objectif de Tourinflux est de proposer un tableau de bord complet permettant aux institutionnels du tourisme, quelle que soit leur taille, de visualiser et interpr?ter l'information disponible par rapport ? leur territoire (aux niveaux micro et macro) afin de prendre les d?cisions les plus efficaces. *Le laboratoire:* Le laboratoire L3i, EA 2118 cr?? en 1993, repr?sente la seule et unique composante de recherche du domaine STIC sur l'Universit? de la Rochelle associant tr?s efficacement les chercheurs de l'IUT de la Rochelle, et du P?le Sciences en informatique. Dans le cadre de la politique quadriennale (d?sormais quinquennale) de l'universit? de la Rochelle, le L3i vient d'?tre ?valu? A par l'AERES. Le laboratoire Informatique, Image et Interaction a choisi d'axer son projet de laboratoire autour de deux th?mes (Axes Th?matiques) que sont ? Image, Document et Donn?es Complexes ? et ? Syst?mes Interactifs et Images ?, v?ritables coeurs de m?tier du laboratoire. Par ailleurs, le laboratoire propose de mettre en avant ASPIC (Axe Strat?gique Pertinence Intraction/Contenus), vecteur de visibilit? de son action scientifique au sein de projets structurants et en articulation avec le monde socio-?conomique. Ainsi, plus d'une dizaine de projets sont actuellement men?s autour de l'analyse de documents et de donn?es complexes d'une part (en lien avec le centre europ?en de valorisation des contenus num?riques -- Valconum), et autour de l'interaction appliqu?e aux jeux vid?os et l'e-Education d'autre part. Par ses activit?s de ces six derni?res ann?es, le L3i a d?velopp? des outils et des comp?tences dans l'analyse de donn?es r?currentes dans le temps et l'espace, mais ?galement l'analyse de contenus et de donn?es complexes et h?t?rog?nes. *Description du sujet :* Le candidat retenu devra, ? partir de corpus dans le domaine du tourisme, d?veloppement une grammaire d'analyse d'?v?nements touristiques, r?currents ou non, dans le temps et/ou dans l'espace (? tous les lundi ?, ? tous les ans ?, ? dans toutes les boutiques du r?seau ?, ?tous les mardis sur la place du march? sauf veille de jours f?ri?s ?, ? H?tel ouvert toute l'ann?e, restauration sur place seulement en ?t? ?...). *Qualifications :* Le candidat devra justifier de comp?tences de recherche dans au moins deux des quatre domaines suivants : - Traitement Automatique des Langues, Fouille de texte - Raisonnement temporel et/ou spatial - Annotation et ?valuation - Ecriture de grammaires d'extraction *Contacts -- liens : * *Email *: mickael.coustaty at univ-lr.fr ; alain.couillault at univ-lr.fr ; jean-marc.ogier at univ-lr.fr ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 21:08:42 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 22:08:42 +0100 Subject: Stage: Stage M2 / EDF, Etude des outils de Text Mining Message-ID: Date: Wed, 20 Nov 2013 17:23:57 +0100 From: Delphine LAGARDE Message-ID: ------------------------------------------------------------ STAGE ING?NIERIE LINGUISTIQUE SUJET 2014: ?VALUATION D'OUTILS TEXT MINING DUR?E : 6 MOIS ENVIRON 1. CONTEXTE Le volume des donn?es num?riques textuelles, disponibles sur l?Internet (forums, twitters etc.) ou relatives ? des contacts client (enqu?tes, centre d?appel etc.), augmente chaque ann?e. L?analyse de ces informations, structur?es ou non, est, aujourd?hui, un imp?ratif strat?gique pour une entreprise telle qu?EDF. Dans ce cadre, et dans l?objectif de toujours mieux conna?tre les besoins des clients, l?exploitation de ces documents implique l?utilisation de m?thodes et d?outils adapt?s. Au c?ur de ces probl?matiques les outils de Text Mining sont de plus en plus nombreux et performants, ainsi nous souhaitons ?tudier les principaux outils ?voluant sur le march? aujourd?hui. 2. SUJET DU STAGE Depuis 2003, les donn?es textuelles sont essentiellement trait?es ? la R&D via des solutions d?velopp?es par l??diteur TEMIS (Text-Mining Solution). Ce choix fait suite ? diff?rentes campagnes de veille sur les outils de Text Mining. Un protocole de test d?outils de Text Mining avait ?t? d?fini et appliqu? ? l??tude approfondie de diff?rents logiciels. Dans le cadre du suivi des ?volutions des outils de Text Mining, nous souhaitons effectuer une nouvelle ?valuation des outils d?analyse de donn?es contenant du texte. Ce stage se d?composera en 3 parties : - Veille d?outils de Text Mining : Il s?agira de mener une ?tude de march? des outils existants aujourd?hui. - Evaluation : A partir des solutions ?mergentes du march?, il s?agira d??valuer une s?lection d?outils (entre 3 et 4) jug?s ? priori int?ressants par rapport aux besoins d?EDF. - Perspectives : Dans un second temps, il s?agira d?identifier les perspectives envisageables quant ? l?alliance du Text Mining et du Web s?mantique au regard des besoins EDF. INFORMATIONS PRATIQUES Interlocuteurs: Delphine Lagarde 01.47.65.39.75 delphine.lagarde at edf.fr Anne Peradotto 01.47.65.44.89 anne.peradotto at edf.fr Lieu du stage: EDF R&D ? D?partement ICAME 1, avenue du G?n?ral de Gaulle 92141 Clamart Cedex Date & Dur?e : D?but 2014 - 6 mois environ R?mun?ration: A d?finir (environ 1.000?/mois) ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 20:59:48 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 21:59:48 +0100 Subject: Appel: ESWC 2014, Final Call for Workshops Message-ID: Date: Thu, 21 Nov 2013 19:01:22 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131121180143.054B8DDA94 at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/call-workshops ** apologies for cross-posting ** ==== Final Call for Workshops ==== http://2014.eswc-conferences.org/important-dates/call-workshops The organizers of the 11th ESWC 2014 cordially invite you to submit a workshop proposal. ESWC is a major venue for discussing the latest scientific results and innovations in the field of semantic technologies on the Web and Linked Data, attracting a high number of high quality submissions and participants from academia and industry alike. Co-located workshops at ESWC conferences are distinguished meeting points for discussing ongoing work and latest ideas related to semantic technologies and the Semantic Web. Of particular interest are workshop proposals with an interdisciplinary standpoint, proposals focusing on a specific technology of general interest, or gathering a sub-community. We encourage the submission of workshop proposals on: * Fundamental problems of the Semantic Web / Linked Data such as ontology mining, heterogeneity, scalability and distribution, uncertainty, etc. * Applications of Semantic Web technologies in specific domains, * Important enabling technologies and their adaptation to the needs of the Semantic Web, and * Aspects of Semantic Web research that have been neglected so far, * Techniques from other research fields that are of relevance for Semantic Web research (e.g., machine learning, NLP, data mining) # General Information and Criteria Each proposal will be reviewed by the members of the workshop programme committee, and ranked based on the overall quality of the proposal and the workshop's fit to the conference as detailed below. Their recommendation will determine the final decision on the acceptance/rejection of each proposal, which is to be taken by the workshop and tutorial chairs as well as by the local and the general chair of ESWC 2014. The criteria for judging the quality of workshop proposals are as follows: * Co-located workshops cover topics falling in the general scope of the ESWC conference. * Workshops are intended to be genuine interactive events and not mini-conferences. * We welcome workshops with creative structures and organizations that attract various types of contributions and ensure rich interactions. * Workshops should have a clear focus on a specific technology, problem or application. * There is potentially a significant community interested in the workshop's topic. * Workshop duration can be half a day or a full day. * We strongly advise having more than one organizer and no more than four, preferably from different institutions, bringing different perspectives to the workshop topic. In case overlapping workshops are proposed, the workshop chair may contact the organisers to discuss the possibility of merging workshops. Please note that the duration of a workshop might need to be adjusted based on the overall number of submissions received. Further, workshops that receive less than 5 submissions or have less than 10 people registered at the early registration deadline might be canceled. The organizers of accepted workshops will be responsible for their own reviewing process, publicity (e.g., website, timelines and call for papers), and proceedings production. They will be required to closely cooperate with the Workshop Chair and the ESWC 2014 local organizers to finalize all organizational details. Workshop attendees must pay the ESWC 2014 workshop registration fee, as well as the conference registration fee. Organizers of workshops and tutorials will get a free registration for workshops and tutorials at the pre-conference days, i.e. they will only have to pay the main conference fee. # Important Dates Workshop proposals due: Nov 22, 2013 - 23:59 Hawaii Time Notification of acceptance: Dec 6, 2013 - 23:59 Hawaii Time Workshop Web site due: Dec 16, 2013 - 23:59 Hawaii Time Workshop camera-ready proceedings due: Apr 25, 2014 - 23:59 Hawaii Time Workshop days: May 25 and May 26, 2014 # Suggested Timeline for Workshops Submission deadline: March 6, 2014 Notifications: April 1, 2014 Camera ready version: April 15, 2014 # Submission Guidelines Workshop proposals have to be submitted via Easychair at https://www.easychair.org/conferences/?conf=eswc2014workshops-tutorials. Each proposal must consist of a single PDF document written in English, not longer than 3 pages, which contains the following information: 1. The title and brief technical description of the workshop, specifying its goals and motivation. 2. A brief discussion of why the topic is of particular interest at this time. 3. A brief description of why and to whom the workshop is of interest, the workshop audience, as well as the expected number of participants. 4. A brief description (draft outline) of the proposed workshop format, discussing the mix of events and activities such as paper presentations, invited talks, panels, hacking session, or general discussion, and and an approximate timeline. 5. A list of (potential) members of the program committee (at least 50% have to be known and confirmed at the time of the proposal). 6. An indication of whether the workshop should be considered for a half-day or full-day event. 7. Related Workshops and Conferences: Is this the continuation of a workshop series or a new workshop to address an emerging issue? Please provide information about past versions of this workshop and other related workshops (including URLs and submission/acceptance counts, if available). 8. Names and contact information of the workshop organizers/chair(s) (name, affiliation, email address, homepage and short (one paragraph) biography of each chair, explaining the chair's expertise for the workshop including past experience in organizing/facilitating workshops). Preferably a single contact person per submission. The best papers of each workshop will be included in the supplementary proceedings of ESWC 2014, which will appear in the Springer LNCS series. # Workshop Chair Harald Sack (Hasso-Plattner Institute for IT Systems Engineering, DE) email: harald.sack at hpi.uni-potsdam.de # Programme Committee Abraham Bernstein (University of Zuerich, CH) Chris Bizer (University of Mannheim, DE) Jerome Euzenat (INRIA Grenoble Rhone-Alpes, FR) Dieter Fensel (University of Innsbruck, AT) Aldo Gangemi (CNR Institute of Cognitive Sciences and Technology, IT) Asuncion Gomez-Perez (Universidad Politecnica de Madrid, ES) Frank van Harmelen (VU University Amsterdam, NL) Manfred Hauswirth (DERI, National University of Ireland, Galway, IE) Pascal Hitzler (Kno.e.sis Center, Wright State University, Dayton, US) Enrico Motta (The Open University, Milton Keynes, UK) Rudi Studer (Karlsruhe Institute of Technology, DE) From thierry.hamon at UNIV-PARIS13.FR Fri Nov 22 20:56:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Fri, 22 Nov 2013 21:56:10 +0100 Subject: Appel: ESWC 2014, Final Call for Tutorials Message-ID: Date: Thu, 21 Nov 2013 18:50:42 +0100 (CET) From: speroni at cs.unibo.it Message-Id: <20131121175102.D9D3411976F at vina.cines.fr> X-url: http://2014.eswc-conferences.org/important-dates/call-tutorials ** apologies for cross-posting ** ==== Final Call for Tutorials ==== http://2014.eswc-conferences.org/important-dates/call-tutorials ESWC 2014 invites tutorials that address the interests of its varied audience: people new to the Semantic Web, Semantic Web researchers and practitioners that wish to learn new technologies, users of Semantic Web technologies, and representatives of government and funding agencies as well as potential private investors in Semantic Web technologies. We welcome submissions of tutorial proposals on all major topics related to semantic technologies. We especially solicit proposals for tutorials of the following types: - Tutorials with a coherent theme providing an introduction to new semantic technologies and trends. - Tutorials describing the application of semantic technologies in specific domains (e.g., life-sciences, e-government, e-commerce, cultural heritage, etc.). - Tutorials presenting techniques from other research fields that are of relevance for Semantic Web research especially in relationship to the tracks of the conference (e.g., techniques from social science, database techniques, NLP techniques etc.). Tutorials can be half a day or a full day. We advise having more than one presenter and no more than three, preferably from different institutions, bringing different perspectives to the tutorial topic. Tutorials may focus entirely on theoretical aspects; however, we encourage organisers to incorporate hands-on sessions where appropriate. The tutorials should reach a good balance between the topic coverage and its relevance to the community. Timeline for Tutorials ----------- Proposals due: Nov 22, 2013 - 23:59 Hawaii Time Notification of acceptance: Dec 6, 2013 - 23:59 Hawaii Time Tutorial Web site due: Dec 16, 2013 - 23:59 Hawaii Time Camera-ready material due: Apr 25, 2014 - 23:59 Hawaii Time Tutorial days: May 25 and May 26, 2014 Responsibilities ----------- Organizers of accepted tutorials are responsible for preparing and maintaining a Web site that describes the tutorial and includes all relevant information. Organizers are also responsible for submitting the material for attendees (slide sets, additional teaching material, software installation and usage guides for practical hands-on sessions, etc.) to the Tutorial Chair. The ESWC 2014 Organizing Committee is responsible for providing publicity for the tutorials as part of the conference publicity activities, and on-site logistical support to the organizers and attendees. Tutorial attendees must pay the ESWC 2014 workshop registration fee, as well as the conference registration fee. General Information ----------- Each tutorial will have one reduced registration fee (pre-conference days registration will be free i.e. one of the chairs will only have to pay the main conference fees). In the interest of the overall quality of the conference, the Tutorial Chair reserves the right to merge tutorials and/or adjust the scope thereof in case a mimimum number of registrations is not reached by the early registration deadline. Submission details ----------- Tutorial proposals should not exceed 5 pages, using an 11 pt font for the body of the text of the proposal and should contain the following information: - Abstract (200 words maximum, for inclusion on the ESWC 2014 website). - Tutorial description: More specifically, it should specify the objectives of the tutorial and relevance to ESWC 2014, include enough details on the scope of the material to be covered and the depth to which it will be covered and specify the intended audience and any prerequisite knowledge. Appropriate references to the material to be covered by the tutorial must be included. - Tutorial length. The tutorial can be full or half day (if the tutorial can be either length, please be sure to identify which material is included for each length). - Specify other venues to which the tutorial or part thereof has or will be presented, in addition to explaining how the current tutorial differs from the other editions. Links to the slides of those tutorial editions should be included in the proposal. - Brief professional biography of the presenter(s) indicating previous training and speaking experience (such as teaching and tutorial presentation). Each proposal will be reviewed by the members of the tutorial programme committee, and ranked based on the overall quality of the proposal and the tutorial's fit to the conference. Their recommendation will determine the final decision on the acceptance/rejection of each proposal. Submission ----------- Submission will be through the Easychair system (please note that it is the same site to submit workshops and tutorials) https://www.easychair.org/conferences/?conf=eswc2014workshops-tutorials Tutorials Chair Nathalie Aussenac-Gilles (IRIT-CNRS, Toulouse, Fr) email: aussenac at irit.fr From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:33:27 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:33:27 +0100 Subject: These: Anais Cadilhac, Extraction et Raisonnement sur les preferences dans des dialogues de negociation Message-ID: Date: Fri, 22 Nov 2013 13:41:00 +0100 From: Ana?s CADILHAC Message-ID: <528F50DC.6070303 at irit.fr> X-url: http://www.irit.fr/documentation/plan_irit/planirit.html Bonjour, J'ai le plaisir de vous inviter ? ma soutenance de th?se intitul?e : "Extraction et Raisonnement sur les pr?f?rences dans des dialogues de n?gociation". Elle aura lieu le vendredi 29 novembre 2013 ? 10h30 ? l'auditorium J. Herbrand de l'IRIT, ? Toulouse. (plan : http://www.irit.fr/documentation/plan_irit/planirit.html) Bien cordialement, Ana?s Cadilhac ---------- Composition du Jury : --------------------- . Rapporteur : M. Jonathan Ginzburg, Professeur, Universit? Paris Diderot . Rapporteur : M. Bruno Zanuttini, Ma?tre de Conf?rence, UCBN Caen . Directeur de th?se : M. Nicholas Asher, Directeur de Recherche CNRS, IRIT Toulouse . CoDirecteur de th?se : Mme Farah Benamara, Ma?tre de Conf?rence, UPS Toulouse . Examinateur : Mme Claudette Cayrol, Professeur, UPS Toulouse . Examinateur : Mme B?atrice Daille, Professeur, Universit? de Nantes . Examinateur : M. J?r?me Lang, Directeur de Recherche CNRS, LAMSADE Paris R?sum? : -------- Mod?liser les pr?f?rences des utilisateurs est incontournable dans de nombreux probl?mes de la vie courante, que ce soit pour la prise de d?cision individuelle ou collective ou le raisonnement strat?gique par exemple. Cependant, il n'est pas facile de travailler avec les pr?f?rences. Comme les agents ne connaissent pas compl?tement leurs pr?f?rences ? l'avance, nous avons seulement deux moyens de les d?terminer pour pouvoir raisonner ensuite : nous pouvons les inf?rer soit de ce que les agents disent, soit de leurs actions non-linguistiques. Plusieurs m?thodes ont ?t? propos?es en Intelligence Artificielle pour apprendre les pr?f?rences ? partir d'actions non-linguistiques mais ? notre connaissance tr?s peu de travaux ont ?tudi? comment ?liciter efficacement les pr?f?rences verbalis?es par les utilisateurs gr?ce ? des m?thodes de Traitement Automatique des Langues (TAL). Dans ce travail, nous proposons une nouvelle approche pour extraire et raisonner sur les pr?f?rences exprim?es dans des dialogues de n?gociation. Apr?s avoir extrait les pr?f?rences de chaque tour de dialogue, nous utilisons la structure discursive pour suivre leur ?volution au fur et ? mesure de la conversation. Nous utilisons les CP-nets, un mod?le de repr?sentation des pr?f?rences, pour formaliser et raisonner sur ces pr?f?rences extraites. Cette m?thode est d'abord ?valu?e sur diff?rents corpus de n?gociation pour lesquels les r?sultats montrent que la m?thode est prometteuse. Nous l'appliquons ensuite dans sa globalit? avec des raisonnements issus de la Th?orie des Jeux pour pr?dire les ?changes effectu?s, ou non, dans le jeu de marchandage Les Colons de Catane. Les r?sultats obtenus montrent des pr?dictions significativement meilleures que celles de quatre baselines qui ne g?rent pas correctement le raisonnement strat?gique. Cette th?se pr?sente donc une nouvelle approche ? la crois?e de plusieurs domaines : le Traitement Automatique des Langues (pour l'extraction automatique des pr?f?rences et le raisonnement sur leur verbalisation), l'Intelligence Artificielle (pour la mod?lisation et le raisonnement sur les pr?f?rences extraites) et la Th?orie des Jeux (pour la pr?diction des actions strat?giques dans un jeu de marchandage). Mots-cl?s : ----------- Pr?f?rences, Dialogues, CP-nets, Structure discursive, Traitement Automatique des Langues (TAL). Abstract : ---------- Preference Extraction and Reasoning in Negotiation Dialogues Modelling user preferences is crucial in many real-life problems, ranging from individual and collective decision-making to strategic interactions between agents for example. But handling preferences is not easy. Since agents don't come with their preferences transparently given in advance, we have only two means to determine what they are if we wish to exploit them in reasoning: we can infer them from what an agent says or from his nonlinguistic actions. Preference acquisition from nonlinguistic actions has been wildly studied within the Artificial Intelligence community. However, to our knowledge, there has been little work that has so far investigated how preferences can be efficiently elicited from users using Natural Language Processing (NLP) techniques. In this work, we propose a new approach to extract and reason on preferences expressed in negotiation dialogues. After having extracted the preferences expressed in each dialogue turn, we use the discursive structure to follow their evolution as the dialogue progresses. We use CP-nets, a model used for the representation of preferences, to formalize and reason about these extracted preferences. The method is first evaluated on different negotiation corpora for which we obtain promising results. We then apply the end-to-end method with principles from Game Theory to predict trades in the win-lose game The Settlers of Catan. Our method shows good results, beating baselines that don't adequately track or reason about preferences. This work thus presents a new approach at the intersection of several research domains: Natural Language Processing (for the automatic preference extraction and the reasoning on their verbalisation), Artificial Intelligence (for the modelling and reasoning on the extracted preferences) and Game Theory (for strategic action prediction in a bargaining game). Keywords: --------- Preferences, Dialogues, CP-nets, Discursive structure, Natural Language Processing (NLP). ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:23:42 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:23:42 +0100 Subject: Stage: Stage M2, Detection de communautes, Nimes Message-ID: Date: Thu, 21 Nov 2013 16:53:22 +0100 From: Planti? Michel Message-ID: <528E2C72.8000000 at mines-ales.fr> X-url: http://www.lgi2p.ema.fr:8090/plantie/site/index.php/sujet-master-recherche Le laboratoire LGI2P ? N?mes de l??cole des Mines d'Ales, propose le stage Master 2 suivant : *Lieu : *N?mes, site EERIE, EMA, parc Georges Besse, 30000 N?mes *Sujet : *S?MANTIQUE, ?QUILIBRES ET STABILIT?S DE CONSTRUCTION DE COMMUNAUT?S RECOUVRANTES DANS LES R?SEAUX SOCIAUX *Descriptif succinct* /(pour une description plus d?taill?e, voir adresse ci-dessous)/ Les r?seaux sociaux occupent une part de plus en plus importante dans l??change de donn?es sur le web. La recommandation de produits et de services, les mod?les utilisateurs enrichis par des donn?es sociales peuvent rev?tir une grande importance. Le sujet propos? a pour objectif de d?terminer des communaut?s extraites ? partir de donn?es sociales et de rechercher les optimums de stabilit? et d??quilibre tout en tenant compte de leur s?mantique. La signification et la stabilit? de ces communaut?s ainsi constitu?es n?est que peu abord?e dans les travaux actuels. Les auteurs appliquent un algorithme unique d?optimisation et observent ensuite les performances. Le travail de stage aura les objectifs suivants ? partir des travaux d?j? effectu?s au laboratoire : - Approfondir les travaux de recherche de stabilit? dans la construction de communaut?s recouvrantes. - ?tablir les fondements de la s?mantique attach?s ? la construction de communaut?s - D?finir des proc?dures de validation de communaut?s - etc. Pour plus de d?tails voir la description ? l'adresse suivante : http://www.lgi2p.ema.fr:8090/plantie/site/index.php/sujet-master-recherche *Direction de stage* (? contacter pour plus d?informations) ? Michel Planti?, LGI2P (michel.plantie at mines-ales.fr) ? Michel Crampes, LGI2P (michel.crampes at mines-ales.fr) *Remarque importante :* Un support financier est possible pour une poursuite en th?se de doctorat. Si les comp?tences et le niveau acad?mique du (de la) candidat(e) le justifient, sa candidature sera notamment soutenue pour l?obtention d?un tel financement, afin qu?il (elle) puisse accomplir une th?se ? la suite de ce stage. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:42:41 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:42:41 +0100 Subject: Job: Five Early-Stage Researcher (pre-doctoral) and two Experienced Researcher (post-doctoral) positions Message-ID: Date: Fri, 22 Nov 2013 11:27:38 +0100 (CET) From: Fausto Giunchiglia Message-ID: <52422.127.0.0.1.1385116058.squirrel at mail.disi.unitn.it> X-url: http://www.essence-network.eu/hiring The ESSENCE (Evolution of Shared SEmaNtics in Computational Environments, www.essence-network.eu) Marie Curie Initial Training Network is offering five Early-Stage Researcher (pre-doctoral) and two Experienced Researcher (post-doctoral) positions, to start in February 2014. The application deadline for these posts is 15th December 2013. This is a rare opportunity to be involved in a highly prestigious European training network for outstanding applicants in an emergent and important research area, led by internationally leading groups in their fields! ESSENCE conducts research and provides research training in various aspects of translating human capabilities for negotiating meaning to open computational environments such as the web, multi-robot systems, and sensor networks. The network will support 15 pre- and post-doctoral fellows who will work toward a set of different research projects within this overall theme, ranging from symbol grounding and ontological reasoning to game-theoretic models of communication and crowdsourcing. ESSENCE involves a top-quality consortium of internationally leading research institutions which will act as hosts for the following projects in the current recruitment round: Early-Stage Researchers (36 months): - Communication Planning (CISA, Informatics, The University of Edinburgh, UK) - Concept Convergence: Argumentation and Agreement over Meaning (IIIA-CSIC, Barcelona, Spain) - The Social Construction of Conceptual Space (ILLC, Universiteit van Amsterdam, The Netherlands) - Sociolinguistics and Network Games (ILLC, Universiteit van Amsterdam, The Netherlands) - Open-ended Robot Interaction (AI Lab, Vrije Universiteit Brussel, Belgium) Early-Stage Researchers must, at the time of recruitment by the host organisation be in the first 4 years (full-time equivalent research experience) of their research careers, and not yet have a doctoral degree. Experienced Researchers (24 months): - The ESSENCE Platform: Architecture (CISA, Informatics, The University of Edinburgh, UK) - The ESSENCE Challenge (Information Engineering and Computer Science, Universit? degli Studi di Trento, Italy) Experienced Researchers must (at the time of recruitment by the host organisation) be in possession of a doctoral degree, or have at least four years of full-time equivalent research experience, and have less than five years of full-time equivalent research experience (including time spent on doctoral research). For both categories, research experience is measured from the date when they obtained the degree which formally entitled them to embark on a doctorate. All positions are very competitively remunerated (significantly above the respective average national salaries/studentships for pre- and post-doctoral positions) and aimed at outstanding candidates. Please consult the individual descriptions of projects at http://www.essence-network.eu/hiring for detailled salary information. Researchers can be of any nationality, though at the time of recruitment by the host organisation, researchers must not have resided or carried out their main activity (work, studies, etc) in the country of their host organisation for more than 12 months in the 3 years immediately prior to the reference date. (Short stays such as holidays and/or compulsory national service are not taken into account.) All applicants are asked to pre-apply at http://www.essence-network.eu/hiring. Please contact Dr Michael Rovatsos (mrovatso at inf.ed.ac.uk) for informal enquiries. Fausto Giunchiglia ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 10:26:45 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 11:26:45 +0100 Subject: Appel: WIMS'14 Message-ID: Date: Thu, 21 Nov 2013 17:33:00 +0100 From: Planti? Michel Message-ID: <528E35BC.4090501 at mines-ales.fr> X-url: http://wims14.csd.auth.gr/ WIMS' 14 [multiple calls]: 4th International Conference on Web Intelligence, Mining and Semantics CALL FOR RESEARCH / APPLICATION & CASE STUDY PAPERS / POSTERS CALL FOR WORKSHOPS / TUTORIALS / DEMONSTRATIONS WIMS' 14: 4th International Conference on Web Intelligence, Mining and Semantics Thessaloniki, Greece, 2-4 June 2014 http://wims14.csd.auth.gr/ About WIMS?14 Conference ------------------------- WIMS is a series of peer-reviewed International Computer Science conferences. It is a forum for researchers and practitioners to present their state-of-the-art results in building Intelligent Web, to examine performance characteristics of various approaches in Web-based intelligent information technology, and to cross-fertilize their ideas on the development of Web-based intelligent information management solutions across different domains. Objectives ----------- The purpose of the WIMS series is: - To provide a forum for established researchers and practitioners to present their contributions to the state of the art research and development in Web technology and applications. - To give doctoral students an opportunity to present their research to a friendly and knowledgeable audience and receive valuable feedback. - To provide an informal social event where Web technology researchers and practitioners can meet. Call for Research Papers/Posters -------------------------------- WIMS'14 is intended to foster the dissemination of state-of-the-art research in the area of Web intelligence, Web mining, Web semantics and the fundamental interaction between them. Authors are invited to submit regular (12 pages) or short (6 pages) research papers or posters (4 pages) on all related areas. Papers exploring new directions or areas will receive a thorough and encouraging review. More details on the nature of the different submission types can be found at: http://wims14.csd.auth.gr/?page_id=23 The papers in all the categories should describe original results that have not been accepted or submitted for publication elsewhere. All submissions will be evaluated by at least three members of the international program committee. Submissions should be made electronically in PDF or DOC/DOCX (MS/Open Word) format via the electronic submission system of the WIMS?14 Conference Management system at https://www.easychair.org/conferences/?conf=wims14 The submissions should be typeset using the templates of the ACM International Conference Proceedings Series (ICPS). The templates could be retrieved fromhttp://www.acm.org/sigs/publications/proceedings-templates Call for Application and Case Study Track Papers ------------------------------------------------- The goal of this track is to provide opportunities for researchers, innovators, industry leaders, and practitioners to present and exchange ideas, results, and experiences in the applications of Web Intelligence, Mining, and Semantics (WIMS). The Application & Case Studies Track invites submissions describing implementations of Web Intelligence, Mining, and Semantics in industrial or government or other ?real world? settings. Papers must include descriptions of how the applications have been conceived, developed, and (probably) deployed. Details about the submission types and the submission procedure of this track can be found at: http://wims14.csd.auth.gr/?page_id=154 Call for Tutorials/Demonstration Proposals ------------------------------------------- WIMS'14 also welcomes Tutorial and/or Demonstration proposals. WIMS?14 will include tutorials and/or demonstrations (on new applications) providing in-depth background on subjects that are of broad interest to the Web Mining and Web Semantics community. The tutorials will be part of the main conference technical program. Proposal papers must be no less than 5 pages and no more than 12 pages, and must provide a sense of both the scope of the tutorial and depth within the scope. Details about the submissions of the tutorial/demonstration proposals can be found at: http://wims14.csd.auth.gr/?page_id=148 Call for Workshop Proposals ---------------------------- WIMS'14 invites proposals for workshops to be held in conjunction with the conference. Organizers may structure workshops as they see fit, possibly including invited talks, panel discussions, presentations of work in progress, peer-reviewed papers, or some combination. A workshop could be scheduled for a half a day or a full day, depending on potential interest and organizers preference. The organizers of successful workshops will be responsible for their own reviewing process, website, and to co-ordinate the collection and delivery of camera ready material and ACM copyright transfer. Accepted papers in workshops will be published in the WIMS?14 proceedings and disseminated through the ACM Digital Library. Selected extended papers will be invited to appear in a special issue of a reputed journal in the field. Details about the submissions of the workshop proposals can be found at: http://wims14.csd.auth.gr/?page_id=150 Conference Scope ----------------- WIMS solicits regular and work-in-progress research, discussion papers and industry experience report papers in related fields. Papers exploring new directions or areas are also welcome. In particular but not exclusively the submissions within the following major areas are relevant: - Scalable Web and Data Architectures and Infrastructures - Web Intelligence - Web Mining, Information and Knowledge Extraction - Web Semantics and Reasoning - WIMS Applications - Evaluation and Validation of WIMS Technologies and Applications More details about the conference scope and topics can be found at: http://wims14.csd.auth.gr/?page_id=146 Publications ------------- Accepted papers/tutorials/posters will be published by ACM and disseminated through the ACM Digital Library through the International Conference Proceedings Series (ICPS). A selection of the best WIMS'14 papers will be invited to be revised and extended for the post-conference publication in the Special Issue of the International Journal on Artificial Intelligence Tools (IJAIT). The proceedings of the previous WIMS conferences could be checked at: - WIMS?11:https://dl.acm.org/citation.cfm?id=1988688 - WIMS?12:https://dl.acm.org/citation.cfm?id=2254129 - WIMS?13:https://dl.acm.org/citation.cfm?id=2479787 Keynotes --------- WIMS'14 organizing committee is happy to announce the following significant keynote speakers for this year's conference: - Large-Scale Reasoning with (Semantic) Data: Grigoris Antoniou, Professor, University of Huddersfield. - Semantic Technology for online, broadcast and print media: Jem Rayfield, Head Architect, Financial Times. - Big Data ? from Hype to Reality: Richard Benjamins, Dr., Director of Business Intelligence, Telefonica. Important Dates ---------------- 25.11.2013 - submission of abstracts for Application and Case Study Track Papers 09.12.2013 - submission of Research Track papers & Application and Case Study Track papers & posters 13.12.2013 - submission of tutorial and workshop proposals 20.12.2013 - notification of acceptance for tutorials & workshops 24.01.2014 - notification of acceptance for (all tracks) papers/posters 24.02.2014 - camera ready versions of the accepted (all tracks) papers, posters, tutorial papers 07.04.2014 - author registration deadline 02-04.06.2014 - Conference Organization ------------- WIMS'14 is organized under the auspices of the Dept. of Informatics at the Aristotle University of Thessaloniki, Greece. (http://www.csd.auth.gr/en/) WIMS Conferences Chair ---------------------- Rajendra Akerkar, Western Norway Research Institute, Norway General Chairs --------------- Ioannis Vlahavas, Aristotle University of Thessaloniki, Greece Takahira Yamaguchi, Keio University, Japan Program Committee Chairs ------------------------- Nick Bassiliades, Aristotle University of Thessaloniki, Greece Vadim Ermolayev, Zaporizhzhya National University, Ukraine Advisory Committee ------------------- Grigoris Antoniou, University of Huddersfield, UK Harold Boley, Faculty of Computer Science, University of New Brunswick, Fredericton, Canada James Hendler, Rensselaer Polytechnic Institute, Troy, NY, USA Guus Schreiber, VU University, Amsterdam, the Netherlands Amit Sheth, Ohio Center of Excellence on Knowledge-enabled Computing, Ohio, USA Workshops and Tutorials Chairs ------------------------------- Costin Badica, University of Craiova, Romania Dimitris Vrakas, Aristotle University of Thessaloniki, Greece Industrial Track Chair ---------------------- John Davies, BT Research & Innovation, UK Publicity Chair ---------------- Athena Vakali, Aristotle University of Thessaloniki, Greece Local Organization Chair ------------------------ Yannis Manolopoulos, Aristotle University of Thessaloniki, Greece Web Chairs ----------- Efstratios Kontopoulos, International Hellenic University, Greece Fotis Kokkoras, T.E.I. of Thessaly, Greece ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Sat Nov 23 11:13:34 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Sat, 23 Nov 2013 12:13:34 +0100 Subject: Appel: EACL 2014 Student Research Workshop, Deadline extension Message-ID: Date: Fri, 22 Nov 2013 22:47:05 +0100 From: peter ljungl?f Message-Id: <566E9480-9DE8-4B33-97FD-AF4C42143D19 at heatherleaf.se> X-url: http://eacl2014.org/ EACL 2014 STUDENT RESEARCH WORKSHOP The 14th Conference of the European Chapter of the Association for Computational Linguistics Gothenburg, Sweden 26-30 April 2014 http://eacl2014.org/ CALL FOR PAPERS ** Deadline extension! ** The Submission deadline has been extended to Friday, 13 December 2013; 11:59pm CET I. General Invitation for Submissions ------------------------------------- EACL 2014 continues the tradition of providing a forum for student researchers who are investigating various areas related to Computational Linguistics and Natural Language Processing. The workshop provides an excellent opportunity for student participants to present their work and receive valuable feedback from the international research community as well as from selected panelists - experienced researchers who will prepare in-depth comments and questions in advance of the presentation. The workshop's goal is to aid students at multiple stages of their education: from those in the final stages of undergraduate training to those active with graduate thesis research. We invite papers in two separate categories: 1. Thesis/Research Proposals: This category is appropriate for students who wish to get feedback on the progress of their thesis work and broader ideas from the field in order to identify the most promising directions for the remaining thesis work. 2. Research Papers: Most appropriate for students who are new to academic conferences. Papers in this category can describe completed original work or work in progress with preliminary results. Topics relevant to the workshop aim to cover all aspects of Computational Linguistics and Natural Language Processing, including, but not limited to (in alphabetical order): - Cognitive modeling of language processing and psycholinguistics - Dialogue and interactive systems - Discourse, coreference and pragmatics - Evaluation methods - Information retrieval - Language resources - Lexical semantics and ontologies - Machine translation: methods, applications and evaluation - Multilinguality in NLP - NLP applications - NLP and creativity - NLP for low-resource languages - NLP for the Web and social media - Question answering - Semantics - Sentiment analysis, opinion mining and text classification - Spoken language processing - Statistical and Machine Learning methods in NLP - Summarization and generation - Syntax and parsing - Tagging and chunking - Text mining and information extraction - Word segmentation Subject to the availability of established researcher volunteers, each accepted paper will be assigned a mentor, an experienced researcher who will provide feedback on the work to the student at the conference. Details on this service will be provided in the acceptance notification. II. Submission guidelines ------------------------- A) Submission requirements 1. Thesis/Research Proposals may contain previously published work and must include specific research directions. They may also be in the style of a position paper that surveys and critiques existing literature, but must suggest future research directions. Proposals may only have one author, who must be a student. 2. Research Papers must describe original completed work or work in progress. Since the main purpose of presenting at the workshop is to exchange ideas with other researchers and to receive helpful feedback for further development of the work, papers should clearly indicate directions for future research wherever appropriate. The first author of multi-author papers must be a student, but additional co-authors need not be students. Research Papers are eligible for this workshop only if they have not been presented at any other meeting with publicly available published proceedings. Students who have already presented at a past ACL/EACL/NAACL Student Research Workshop may not submit to this track as a first author (though they may still be a co-author, or the first author of a Thesis/Research Proposal). These students are instead encouraged to submit their work to the main conference or to the Thesis Proposal track. During submission, students must clearly indicate whether a paper has been submitted to another conference or workshop. Double submissions to the EACL main conference and the Student Research Workshop are not allowed. One student can only submit one paper to the Research Papers track as the first author. B) Submission procedure Both paper and proposal submissions to the EACL 2014 Student Research Workshop should follow the standard two-column format of the EACL 2014 proceedings and they must be submitted as a PDF file. Authors are strongly recommended to use the style files from the conference web site. The style files are available here: - http://www.eacl2014.org/files/eacl-2014-styles.zip All submissions may consist of up to nine (9) pages of content only. Any number of additional pages containing references is allowed. The reviewing process will be double-blind; therefore, please ensure that the paper does not include the authors' names and affiliations. Furthermore, self-references that reveal the author's identity, e.g., "We previously showed (Smith, 1991) ...", should be avoided. Instead, use citations such as "Smith previously showed (Smith, 1991) ...". Further guidelines are provided in the template style files. References to your own work in thesis proposals should also be anonymized. You may for example write it as "in X (2000) we showed", etc. and do not add your papers in the reference list. Authors should not use other anonymous citations in both research papers and thesis proposals, and should not include any acknowledgments. Papers that do not conform to these requirements will be rejected without review. The deadline for submission has been extended to 11:59pm CET on Friday, 13 December 2013. Submission will be electronic using the paper submission web page: - https://www.softconf.com/eacl2014/srw/ Papers will be presented orally or as posters during the main EACL conference as determined by the program committee. Decisions on presentation format will be based on the nature rather than the quality of the work. There will be no distinction in the proceedings between long papers presented orally and as posters. C) Multiple-submission policy Papers that have been or will be submitted to other meetings or publications must indicate this at submission time. Authors of papers accepted for presentation at EACL SRW 2014 must notify the program chairs whether the paper will be presented. All accepted papers must be presented at the workshop in order for them to appear in the proceedings. We will not accept for publication or presentation papers that overlap significantly in content or results with papers that will be (or have been) published elsewhere. Double submissions to the EACL main conference and the Student Research Workshop are not allowed, and the authors must ensure that these submissions do not overlap significantly (> 50%) with each other in content or results. D) Reviewing procedure The reviewing of the papers will be double-blind. Reviewing will be managed by the Student Workshop Co-Chairs and a team of reviewers. Each submission will be matched with a mixed panel of student and senior researchers for review. The final acceptance decision will be based on the results of the review. III. Important dates -------------------- - Submission deadline has been extended to: 13 December 2013 - Notification of acceptance: 20 January 2014 - Camera-ready submission deadline: 17 February 2014 - Conference dates: 26-30 April 2014 (The workshop will be held during the main conference, in a mode similar to the conference's regular sessions. The exact format will be decided by the workshop co-chairs and conference chairs.) IV. Student Research Workshop Committee --------------------------------------- Student chairs: - Desmond Elliott (University of Edinburgh, UK) - Konstantina Garoufi (University of Potsdam, Germany) - Douwe Kiela (University of Cambridge, UK) - Ivan Vuli? (KU Leuven, Belgium) Faculty advisor: - Sebastian Pad? (University of Stuttgart, Germany) Contact information: - students at eacl.org ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:35:44 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:35:44 +0100 Subject: Stage: Stage M2, Amelioration du module de desambiguisation du Moteur de Recherche Semantique d'inbenta Message-ID: Date: Mon, 25 Nov 2013 10:01:52 +0100 From: Manon Quintana Message-ID: *Pr?sentation soci?t?* ------------------------------ inbenta est une soci?t? pionni?re dans le *Traitement Automatique du Langage Naturel et la recherche s?mantique*. Bas?e sur ces concepts novateurs, inbenta d?veloppe depuis 2005 des solutions logicielles pour les sites internet de Grands Comptes. *Description de l?offre* ------------------------------ Inbenta a d?velopp? un moteur de recherche intelligent appel? *Inbenta Semantic Search Engine* (ISSE). Les deux t?ches principales de ce moteur sont d?analyser les questions des utilisateurs et de trouver la r?ponse appropri?e ? la requ?te en effectuant une recherche dans une base de connaissances. Un *module de d?sambigu?sation syntaxique et s?mantique* est int?gr? dans notre moteur de recherche. Ce module est tr?s important car il fait partie int?grante du bon fonctionnement de la solution. L?objet du stage propos? par inbenta sera d?am?liorer le module de d?sambigu?sation. Les missions de stage seront : - Gestion linguistique et ?ditoriale d?un projet de FAQ dynamique afin que le stagiaire s?approprie l?existant - Enrichissement du module de d?sambigu?sation par l?ajout de r?gles, de descriptions lexicales et de grammaires locales + ?valuation du travail - R?flexion d?am?lioration du module de d?sambigu?sation ? un niveau algorithmique *Profil recherch?* ------------------------------ Nous recherchons une personne enthousiaste, organis?e et s?rieuse et ayant l?envie d?int?grer une ?quipe internationale. Le stagiaire devra ?galement avoir les comp?tences suivantes : - ?tudes en Traitement Automatique du Langage Naturel - Excellente ma?trise de la langue fran?aise et bonne communication ?crite et orale en espagnol, anglais ou catalan Bonus : - Ma?trise d?au moins un langage de programmation (PHP de pr?f?rence) - Maitrise des expressions r?guli?res et du SQL *Modalit?s du poste* ------------------------------ - Stage de 5 ? 6 mois (avec possibilit? d?embauche en CDI) - R?mun?ration pr?vue: 30% du SMIC (+ prime en fonction des r?sultats) - D?but : ? partir de F?vrier / Mars 2013 - Lieu : Toulouse Merci d?adresser CV et lettre de motivation ? Quintana Manon ? l?adresse mail suivante : *mquintana at inbenta.com* ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:27:01 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:27:01 +0100 Subject: Revue: Nommer la segregation en sociolinguistique urbaine, Cahiers internationaux de sociolinguistique n3 Message-ID: Date: Sat, 23 Nov 2013 13:39:25 +0100 From: "gudrun.ledegen" Message-ID: <0a1e01cee849$0b136480$213a2d80$@wanadoo.fr> Les Cahiers internationaux de sociolinguistique n? 3 viennent de sortir sous le titre Nommer la s?gr?gation en sociolinguistique urbaine. Les dimensions socio-spatiales du processus (ISBN : 978-2-343-01031-1). Vous trouverez ci-dessous la pr?sentation de la 4? de couverture et la table des mati?res. Tr?s cordialement, Gudrun Ledegen PREFics 4246-Universit? Rennes II Le pr?sent recueil centr? sur la mise en mots de la s?gr?gation en situation urbanis?e tente de rendre compte de la complexit? des situations sociolinguistiques que le chercheur est amen? ? rencontrer et ? partir desquelles il souhaite mettre en place une intervention. Un premier volet concerne la dynamique s?gr?gative en cours dans la soci?t? mauricienne, qui voit arriver une nouvelle ?conomie de ? migration externe de luxe ?, ou dans la soci?t? allemande et fran?aise, pour les jeunes qui vivent dans la marge. Un second volet porte sur la nomination d?un groupe ? autre ?, qu?il soit habitant de grands ensembles vou?s ? la destruction, mahorais ou comorien ? La R?union, ou tsigane dans la presse fran?aise du d?but du si?cle. TABLE DES MATI?RES INTRODUCTION. LA S?GR?GATION MISE EN MOTS : QUELQUES R?FLEXIONS SUR LA DIMENSION SOCIOLINGUISTIQUE DU PROCESSUS (GUDRUN LEDEGEN / THIERRY BULOT) 1. Les dimensions socio-spatiales du processus s?gr?gatif 2. Corpus et/ou observables en sociolinguistique urbaine 3. Espace et s?gr?gation 4. Nommer 5. Bibliographie PRATIQUES S?GR?GATIVES DANS LA STRUCTURATION DE L?ESPACE MAURICIEN (YANNICK BOSQUET-BALLAH) 1. Introduction 2. Consid?rations conceptuelles et m?thodologiques 3. Organisation socio-spatiale de l??le Maurice 4. Les villages de Tamarin et de Grande Rivi?re Noire 5. Le marquage de l?espace 6. Conclusion 7. Bibliographie 8. Annexes CES JEUNES QUI VIVENT EN MARGE : DOCUMENTARISATION ET INTERVENTION SOCIOLINGUISTIQUE (SABINE BASTIAN) 1. Introduction 2. La situation des jeunes dans les quartiers marginalis?s : l?exemple de l?Allemagne (compar? ? la France) 3. Nouvelles approches pour la recherche 4. En guise de conclusion 5. Bibliographie LA FIGURE DE L?HABITANT (DISCOURS ET R?NOVATION URBAINE) (FR?D?RIC PUGNI?RE-SAAVEDRA) 1. Introduction 2. Le corpus 3. Cadre th?orique : double approche 4. Conclusion 5. Bibliographie 6. Annexes LES DISCOURS ETHNICIS?S, M?DIATIQUEMENT DICIBLE ET IMPLICITE : CAS DU MOD?LE R?UNIONNAIS DANS LA PRESSE ?CRITE (FRANCK MARC) 1. Introduction 2. La dialectique de l?ethnicit? : ? ton identit? s?arr?te l? o? commence la ? mienne ? 3. Continuum de formulabilit? des discours 4. Conclusion 5. Bibliographie INTRODUCTEURS NORMATIFS ET DISCRIMINATION. UN REGARD SUR LES TSIGANES DANS LES JOURNAUX DU D?BUT DU XXE SI?CLE (B?ATRICE TURPIN) 1. Introduction 2. Les inducteurs normatifs de la langue 3. Le discours de presse et la norme 4. Les inducteurs juridiques 5. Les inducteurs ?valuatifs 6. Les inducteurs d?ontiques 7. Les inducteurs rh?toriques 8. Bibliographie ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:22:39 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:22:39 +0100 Subject: Appel: EACL 2014 Type Theory and Natural Language Semantics Workshop Message-ID: Date: Sun, 24 Nov 2013 20:21:34 +0100 From: retore Message-Id: X-url: http://clt.gu.se/event/2014-04-27/type-theory-workshop-eacl-2014 Call for Papers - Submission Deadline 23 January 2014 TTNLS: EACL 2014 Type Theory and Natural Language Semantics Workshop Co-located with EACL 2014, Gothenburg, Sweden 27th of April, 2014 http://clt.gu.se/event/2014-04-27/type-theory-workshop-eacl-2014 http://eacl2014.org/ WORKSHOP DESCRIPTION Type theory has been a central area of research in logic, the semantics of programming languages, and natural language semantics over the past fifty years. Recent developments in type theory have been used to reconstruct the formal foundations of computational semantics (Ranta (1994), Fox and Lappin (2005), Ginzburg (2012), Retor? (2012), Cooper (2012), Cooper et al. (2013)). These theories are generally intensional and polymorphic in character, and they allow for structured, fine-grained encoding of information across a diverse set of linguistic domains. The work in this area has opened up new approaches to modeling the relations between, inter alia, syntax, semantic interpretation, dialogue, inference, and cognition, from a largely proof theoretic perspective. The workshop provides a forum for the presentation of leading edge research in this fast developing subfield of computational linguistics. To the best of our knowledge it will be the first major conference on this topic hosted by the ACL. TOPICS We invite papers on topics including, but not limited to, the following: * subtyping * lexical semantics * record types * intensionality * probabilistic type theory * type theory and the interface among syntax, semantics, phonology * type theory and functional programming * type theory, logic, and inference Programme Committee: * Krasimir Angelov (Chalmers, Gothenburg) * Patrick Blackburn (Roskilde) * Stergios Chatzikyriakidis (Royal Holloway, London) * Steve Clark (Cambridge) * Jan van Eijck (Amsterdam) * Raquel Fern?ndez (Amsterdam) * Tim Fernando (Trinity College, Dublin) * Chris Fox (Essex) * Jonathan Ginzburg (Paris 7) * Zhaohui Luo (Royal Holloway, London) * Bruno Mery (LaBRI, Bordeaux) * Glyn Morrill (Polit?cnica de Catalunya, Barcelona) * Larry Moss (Indiana) * Reinhard Muskens (Tilburg) * Bengt Nordstr?m (Chalmers, Gothenburg) * Valeria de Paiva (Nuance, Sunnyvale California) * Carl Pollard (Ohio State University) * Ian Pratt-Hartmann (Manchester) * Steve Pulman (Oxford) * Matt Purver (Queen Mary, London) * Aarne Ranta (Chalmers, Gothenburg) * Christian Retor? (LaBRI, Bordeaux) * Ray Turner (Essex) SUBMISSION All papers should be submitted in English as PDF documents. Note that submissions must be anonymous. We welcome full papers of up to 8 pages and 1 additional page for references formatted in accordance with the EACL'14 style files (seehttp://www.eacl2014.org/files/eacl-2014-styles.zip ). Submissions can be made via the TTNLS START Conference Management's system website: https://www.softconf.com/eacl2014/TT/ CONTACT For any queries please contact us at: simon.dobnik <- at -> gu <-.-> se IMPORTANT DATES Submission Deadline 23 January 2014 Notification 20 February 2014 Camera Ready Deadline 3 March 2014 Workshop Day 27 April 2014 WORKSHOP ORGANISERS Robin Cooper (University of Gothenburg), Simon Dobnik (University of Gothenburg), Shalom Lappin (King's College, London), and Staffan Larsson ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:50:46 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:50:46 +0100 Subject: Stage: Detection automatique multilingue de sous-parties de mots (morphemes), Vision Objects Message-ID: Date: Tue, 26 Nov 2013 11:57:19 +0100 From: prajol shrestha Message-ID: X-url: http://www.prajol.net.np *Stage en Traitement Automatique des Langues H/F :* *SUJET : D?tection automatique multilingue de sous-parties de mots (morph?mes)* Avec plus de 90% de son CA ? l?international, et plus de 100 millions d?utilisateurs dans le monde, Vision Objects est un ?diteur de logiciels leader mondial sur le march? des interfaces homme-machine bas?es sur la reconnaissance d??criture manuscrite. Disponible dans plus de 85 langues, ses produits concernent les march?s de la mobilit? (saisie de texte, prise de notes, ?), de l??ducation (apprentissage de l??criture, des math?matiques, de la g?om?trie, ?) de l?entreprise (prise de notes et traitement de formulaires), et de l?automobile (saisie de texte ? partir d?une surface tactile, interaction avec GPS). Vision Objects est une entreprise d?innovation et de hautes technologies. Le c?ur de sa technologie MyScript est diffus? sous forme de kit de d?veloppement logiciel, de ? Cloud service ?, de composants ? int?grer ou sous forme d?applications pr?tes ? l?emploi. Le moteur de reconnaissance de Vision Objects se classe r?guli?rement aux premi?res places des comp?titions scientifiques internationales (cf., par exemple, ICDAR). Dans le cadre de sa forte croissance, Vision Objects (Nantes, France) est ? la recherche d'un: *Stagiaire Ing?nieur Informaticien en Traitement Automatique des Langues (TAL)* Dans l'?quipe *Ressources Linguistiques*, vous serez amen? ? travailler sur la mission suivante : *SUJET : D?tection automatique multilingue de sous-parties de mots (morph?mes)* *Les langues fortement agglutinantes posent des probl?mes sp?cifiques en mod?lisation statistique des langues, notamment le tr?s grand nombre d'unit?s lexicales possibles. Une approche est de d?couper ce qui est couramment appel? mot en unit?s plus petites.* *Le stage consiste ? ?tudier et impl?menter des algorithmes non supervis?s (sans exemples de d?coupage dans la langue cible) de d?coupage de mots en morph?mes. Il s'agit ensuite d'appliquer ces algorithmes dans un contexte fortement multilingue car notre solution est disponible en 64 langues.* *Une suite possible de ce travail sera l'?tude de techniques ?galement non supervis?es et multilingues d'analyse grammaticale (PoS tagging).* Stage bas? ? Nantes, d?marrage d?s que possible en 2013 ou 2014. Rigoureux, dynamique et d?un relationnel facile, vous saurez rapidement vous int?grer au sein des ?quipes. Au sein de VisionObjects, vous travaillerez sur des technologies ? la pointe de la recherche et pourrez identifier les applications directes et concr?tes de votre travail. Un ancien stagiaire, promotion ECN 2010-2013, a ainsi contribu? ? l??laboration de l?application Android MyScript Calculator: une calculatrice manuscrite utilisant la reconnaissance d??quations de VisionObjects. Les applications r?alis?es et publi?es par VisionObjects ? partir du travail de ce stage ont depuis totalis? plus de 10 millions de t?l?chargements. Vous pouvez trouver gratuitement MyScript Calculator sur les stores Android et iOS. Contact : job at visionobjects.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:48:14 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:48:14 +0100 Subject: Stage: Influence des types de corpus sur la reconnaissance d'ecriture, Vision Objects Message-ID: Date: Tue, 26 Nov 2013 11:53:24 +0100 From: prajol shrestha Message-ID: X-url: http://www.prajol.net.np *Stage en Traitement Automatique des Langues H/F :* *SUJET : Influence des types de corpus sur la reconnaissance d'?criture* Avec plus de 90% de son CA ? l?international, et plus de 100 millions d?utilisateurs dans le monde, Vision Objects est un ?diteur de logiciels leader mondial sur le march? des interfaces homme-machine bas?es sur la reconnaissance d??criture manuscrite. Disponible dans plus de 85 langues, ses produits concernent les march?s de la mobilit? (saisie de texte, prise de notes, ?), de l??ducation (apprentissage de l??criture, des math?matiques, de la g?om?trie, ?) de l?entreprise (prise de notes et traitement de formulaires), et de l?automobile (saisie de texte ? partir d?une surface tactile, interaction avec GPS). Vision Objects est une entreprise d?innovation et de hautes technologies. Le c?ur de sa technologie MyScript est diffus? sous forme de kit de d?veloppement logiciel, de ? Cloud service ?, de composants ? int?grer ou sous forme d?applications pr?tes ? l?emploi. Le moteur de reconnaissance de Vision Objects se classe r?guli?rement aux premi?res places des comp?titions scientifiques internationales (cf., par exemple, ICDAR). Dans le cadre de sa forte croissance, Vision Objects (Nantes, France) est ? la recherche d'un: *Stagiaire Ing?nieur Informaticien en Traitement Automatique des Langues (TAL)* Dans l'?quipe *Ressources Linguistiques*, vous serez amen? ? travailler sur la mission suivante : *SUJET : Influence des types de corpus sur la reconnaissance d'?criture* *Les nouveaux usages du Web ont fait ?merger de nouveaux registres de langue. On n'?crit pas de la m?me fa?on un e-mail, un sms, un tweet ou un article plus formel.* *Le stage consiste ? enrichir en diversit? les corpus utilis?s pour la construction des mod?les de langue et ? ?valuer la fa?on de combiner ces corpus. On s'int?resse en particulier aux contenus extractibles des r?seaux sociaux ainsi qu'aux corpus disponibles dans de nombreuses langues car notre solution est disponible dans 64 langues, dont certaines peu dot?es en termes de ressources.* Stage bas? ? Nantes, d?marrage d?s que possible en 2013 ou 2014. Au sein de VisionObjects, vous travaillerez sur des technologies ? la pointe de la recherche et pourrez identifier les applications directes et concr?tes de votre travail. Un ancien stagiaire, promotion ECN 2010-2013, a ainsi contribu? ? l??laboration de l?application Android MyScript Calculator: une calculatrice manuscrite utilisant la reconnaissance d??quations de VisionObjects. Les applications r?alis?es et publi?es par VisionObjects ? partir du travail de ce stage ont depuis totalis? plus de 10 millions de t?l?chargements. Vous pouvez trouver gratuitement MyScript Calculator sur les stores Android et iOS. Contact : job at visionobjects.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:41:38 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:41:38 +0100 Subject: Conf: Colloque Le langage en sciences humaines et sociales, 5 decembre 2013, Paris Message-ID: Date: Tue, 26 Nov 2013 09:26:48 +0100 From: Alice Krieg-Planque Message-ID: <52945B48.6030100 at club-internet.fr> X-url: http://www.shs.parisdescartes.fr/ACTUALITES/Colloque-international-LE-LANGAGE-EN-SCIENCES-HUMAINES-ET-SOCIALES Pour rappel, ci-dessous le programme du colloque "Le langage en sciences humaines et sociales" qui aura lieu jeudi de la semaine prochaine, ? Paris. Entr?e libre dans la limite des places disponibles. - colloque - - - colloque - - - colloque - - - colloque - - - Colloque "Le langage en sciences humaines et sociales" jeudi 5 d?cembre 2013 Universit? Paris Descartes - Sorbonne Paris Cit? Amphith??tre Durkheim - Sorbonne - Galerie Claude Bernard - esc. I 1 rue Victor Cousin - 75005 Paris Le langage constitue la mati?re premi?re de l'ensemble des disciplines en sciences humaines et sociales : que les individus soient sollicit?s pour des entretiens, des r?cits de vie, des questionnaires ou observ?s par l'interm?diaire de productions verbales ind?pendantes du travail de recherche, que leurs productions soient orales ou ?crites, c'est bien toujours par le discours que s'op?re la relation entre les chercheurs et les sujets, qui sont souvent leurs interlocuteurs. C'est aussi essentiellement par leurs dires (m?me en leur absence, lors d'?tudes de textes ou de discours ?crits) que se construisent la plupart des analyses scientifiques, en interaction avec d'autres composantes (comportements, attitudes, etc.). L'analyse de discours, la sociolinguistique et l'anthropologie du langage d?velopp?es ? la facult? de sciences humaines et sociales de Paris Descartes se situent ? l'interface de multiples approches, int?grant les dimensions sociologiques, anthropologiques, historiques, ?ducatives, voire philosophiques. Elles proposent une approche des praxis langagi?res qui fait n?cessairement appel ? des disciplines autres que les sciences du langage, l'articulation avec ces derni?res pouvant se faire de diff?rentes mani?res. Inversement, les autres sciences humaines et sociales font constamment appel au langage ? toutes les ?tapes de la recherche, que ce soit lors du recueil des donn?es, lors de leur exploitation ou lors de la construction de cadres d'interpr?tation. Le colloque " Le langage en sciences humaines et sociales " r?unira toutes les disciplines de la facult? ainsi que des coll?gues rattach?s ? d'autres institutions, en France et ? l'?tranger, et donnera lieu ? un dialogue sur les fa?ons dont l'interdisciplinarit? " autour du langage " pourrait ?tre pratiqu?e d'une fa?on g?n?rale et en particulier dans ce lieu de rencontres entre sciences humaines et sociales que constitue notre facult?. Programme : 9 h 00 : Accueil 9 h 15 Ouverture : Fr?d?ric Dardel, Pr?sident de l'universit? Paris Descartes, Sorbonne Paris Cit? Jo?l Lebeaume, Doyen de la facult? de sciences humaines et sociales Sorbonne 9 h 30 - 10 h 30 Conf?rence : Bernard Lahire (ENS Lyon, Centre Max Weber) : " De la n?cessit? d'articuler le langagier et le social " 10 h 30-10 h 45 : Pause caf? 10 h 45 - 12 h 45 Communications : C?cile Canut (Universit? Paris Descartes, CEPED) : " Mat?rialit?s langagi?res et praxis sociales : le langage au coeur des sciences humaines et sociales " Erwann Dianteill (Universit? Paris Descartes, IUF, CANTHEL) : " Comment les dieux parlent aux hommes : anthropologie du discours divinatoire dans le vaudou (Porto-Novo, B?nin) " Johannes Angerm?ller (Universit? de Warwick, Grande-Bretagne, CEMS/EHESS) : " Le discours comme pratique langagi?re. Construire sa place dans le social " Sabine Caillaud (Universit? Paris Descartes, Laboratoire de psychologie des menaces sociales et environnementales) : " La triangulation des m?thodes d'analyse du discours en psychologie sociale : deux exemples d'?tudes sur les repr?sentations sociales de l'?cologie " 12 h 45-14 h 45 Pause d?jeuner 14 h 45-16 h 45 Communications : Marie Veniard et Bernard Pechberty (Universit? Paris Descartes, EDA) : " Approche clinique et linguistique d'entretiens non directifs avec des professionnels de l'?ducation sp?cialis?e " Alice Krieg-Planque (Universit? Paris-Est Cr?teil, CEDITEC) : " La communication des organisations et des institutions au prisme de l'analyse du discours " Elsa Ramos (Universit? Paris Descartes, CERLIS) : " Du discours de l'enqu?t? ? l'analyse du sociologue " Patricia von M?nchow (Universit? Paris Descartes, EDA) : " Discours et cultures ?ducatives " 16 h 45-17 h 00 Pause caf? 17 h 00-18 h 00 Conf?rence : Dominique Maingueneau (Universit? Paris Sorbonne, STIH) : " Discours et analyse du discours " 18 h 00-18 h 30 Discussion 18 h 45 Cocktail Contacts : Patricia von M?nchow : patricia.vonmunchow at parisdescartes.fr, C?cile Canut : cecile.canut at parisdescartes.fr URL : http://www.shs.parisdescartes.fr/ACTUALITES/Colloque-international-LE-LANGAGE-EN-SCIENCES-HUMAINES-ET-SOCIALES - colloque - - - colloque - - - colloque - - - colloque - - - ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:47:03 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:47:03 +0100 Subject: Job: Contract positions at Google, Junior Linguist [French] (multiple positions) Message-ID: Date: Tue, 26 Nov 2013 10:55:06 +0100 From: Advanced Linguistics Message-ID: Job title: Junior Linguist [French] (multiple positions) Linguistic Field(s): Morphology, Semantics, Syntax, Lexicography, NLP This is a full-time contract position. Work will be done from home, but Junior Linguists should be able to come to Google Paris Office for training and meetings. Job description: As a Junior Linguist, you will be reviewing and annotating linguistic data and carrying out a number of tasks to improve Google?s natural language processing. This includes: - reviewing and annotating linguistic data - labeling text for semantic, syntactic and morphological characteristics - providing transcriptions for lexicon entries according to guidelines - deriving NLP data for new and on-going projects Job requirements: - native-level speaker of French and fluent in English - degree in Linguistics or Computational Linguistics with knowledge of semantics, syntax, morphology or lexicography - ability to quickly grasp technical concepts; should have an interest in natural language processing - excellent oral and written communication skills - keen interest in technology and computer-literate (should feel comfortable using in-house tools and should have an interest in linguistics and linguistic resources) - attention to detail and good organizational skills Project duration: 9 months (with potential for extension) For immediate consideration, please email your CV and cover letter in English (PDF format preferred) with ?Junior Linguists? [French] in the subject line. Application Deadline: (Open until filled) Email Address for Applications: AdvancedLinguistics at gmail.com Contact information: Linne Ha: AdvancedLinguistics at gmail.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:52:15 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:52:15 +0100 Subject: Appel: NLDB'2014 Message-ID: Date: Tue, 26 Nov 2013 12:45:59 +0100 From: Mathieu Roche Message-ID: X-url: http://www.nldb.org/ ============== CALL FOR PAPERS - NLDB'2014 19th International Conference on Application of Natural Language to Information Systems 18-20 June 2014 - Montpellier, France http://www.nldb.org/ Submission deadline: February 3, 2014 ============== Since 1995, the NLDB conference aims at bringing together researcher, industrials and potential users interested in various application of Natural Language in the Database and Information Systems field. The integration of databases and natural language has been an utopia for many years. However, progress has been made and this is now an established field thanks to developments in Natural Language and technologies that made the storage and manipulation of large electronic dictionaries possible. As Information Systems are now evolving into the communication area, the term databases should be considered in the broader sense of information and communication systems. The use of Natural Language in Software Engineering has contributed to both improving the development process from the viewpoints of developers (improve the process of conceptual modeling, validation, etc) and the usability of applications by users (natural language query interfaces, semantic webs, etc). NLDB'2014 will take place in Montpellier (France). The conference invites researchers from academia and industry to submit papers for oral or poster presentations on recent, unpublished research that addresses theoretical aspects, algorithms, applications, architectures for applied and integrated NLP, resources for applied NLP, and other aspects of NLP, as well as review and discussion papers. Topics of interest include but are not limited to: - Applications of NLP in Information Systems: Multilingual Information Systems, NLP in Requirement Engineering, NLP in Knowledge Management, Semantic Data Integration and Data Cleaning - Social Media and Web Data: Corpus analysis, Language identification, Text normalization, Robust NLP for social media, Text classification, Information Extraction and Sentiment Analysis for social media - Big Data and Natural Language - Semantic Web Open Linked Data: Ontology Learning and Alignment, Populating ontologies, Querying Ontologies and linked data, Semantic tagging and classification, Ontology-driven NLP - Question Answering (QA): NL interfaces to databases, QA using web data, multi-lingual QA, Non-factoid QA (how/why/opinion questions, lists), geographical QA, QA corpora and training sets - Natural language and Ubiquitous Computing: Pervasive Computing, Embedded, Robotic and Mobile Applications. - Natural Language in Conceptual Modeling: Analysis of Natural Language Descriptions, Terminological Ontologies, Consistency Checking, Metadata Creation and Harvesting, Ontology-driven Systems Integration, Ontology Management - NLP Applications: Business Intelligence, Subjectivity and Sentiment Analysis, QA systems, Event Detection, Named Entity and Event Detection, Information Extraction, Summarization, NLP for Data Mining, NLP for Data Warehouses, Plagiarism detection, Identity detection ============== Submission guidelines: Authors should follow the LNCS format and submit their manuscripts in pdf. Submissions can be full papers (12 pages maximum including references), short papers (6 pages) or papers for a poster presentation (4 pages). The programme committee may decide to accept some full papers as short papers or poster contributions. The Proceedings of NLDB 2014 will be published by Springer LNCS Series. We plan to publish extended versions of a selection of the best papers after the conference in the 'Data and Knowledge Engineering Journal' as a special issue. ============== Conference Chair: - Elisabeth M?tais, Conservatoire National des Arts et M?tiers, Paris, France Programme Committee Chairs: - Mathieu Roche, Cirad, TETIS, France - Maguelonne Teisseire, Irstea, TETIS, France ============== Important dates: - Paper submission: February 3, 2014 - Notification of acceptance: March 24, 2014 - Camera-ready papers: April 7, 2014 - Conference: 18-20 June 2014 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:49:10 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:49:10 +0100 Subject: Stage: Developpement d'un outil d'analyse de resultats, Vision Objects Message-ID: Date: Tue, 26 Nov 2013 11:56:22 +0100 From: prajol shrestha Message-ID: X-url: http://www.prajol.net.np *STAGE EQUIPE TAL ? VISION OBJECTS* Avec plus de 90% de son CA ? l?international, et plus de 100 millions d?utilisateurs dans le monde, Vision Objects est un ?diteur de logiciels leader mondial sur le march? des interfaces homme-machine bas?es sur la reconnaissance d??criture manuscrite. Disponible dans plus de 85 langues, ses produits concernent les march?s de la mobilit? (saisie de texte, prise de notes, ?), de l??ducation (apprentissage de l??criture, des math?matiques, de la g?om?trie, ?) de l?entreprise (prise de notes et traitement de formulaires), et de l?automobile (saisie de texte ? partir d?une surface tactile, interaction avec GPS). Vision Objects est une entreprise d?innovation et de hautes technologies. Le c?ur de sa technologie MyScript est diffus? sous forme de kit de d?veloppement logiciel, de ? Cloud service ?, de composants ? int?grer ou sous forme d?applications pr?tes ? l?emploi. Le moteur de reconnaissance de Vision Objects se classe r?guli?rement aux premi?res places des comp?titions scientifiques internationales (cf., par exemple, ICDAR). *Stagiaire ? D?veloppement d?un outil d?analyse de r?sultats* *Une probl?matique de la recherche en reconnaissance d'?criture est d'?valuer globalement les avantages et inconv?nients de diff?rents algorithmes, tout en ?tudiant les comportements de ces algorithmes sur quelques cas sp?cifiques. Ce passage de la v?rit? g?n?rale au cas particuliers, et inversement, peut ?tre grandement facilit? par un outillage ad?quat.* *Dans ce stage, on s'int?ressera au d?veloppement d'un nouvel outil de d?tection de cas int?ressants ? partir de bases de test globales. Au sein du d?partement R&D, le stagiaire aura l'occasion de comprendre le fonctionnement du moteur de reconnaissance d'?criture, tout en acqu?rant des comp?tences de programmation utilisables dans bien d'autres contextes. Le travail comprend des aspects algorithmiques et d'analyse de donn?es pour factoriser l'information, ainsi que des aspects interface graphique et int?gration dans les outils existants pour la pr?senter de fa?on optimale ? l'utilisateur.* Stage bas? ? Nantes, d?marrage d?s que possible en 2013 ou 2014. Rigoureux, dynamique et d?un relationnel facile, vous saurez rapidement vous int?grer au sein d??quipes de haut niveau et dans un environnement stimulant. Au sein de VisionObjects, vous travaillerez sur des technologies ? la pointe de la recherche et pourrez identifier les applications directes et concr?tes de votre travail. Un ancien stagiaire, promotion ECN 2010-2013, a ainsi contribu? ? l??laboration de l?application Android MyScript Calculator: une calculatrice manuscrite utilisant la reconnaissance d??quations de VisionObjects. Les applications r?alis?es et publi?es par VisionObjects ? partir du travail de ce stage ont depuis totalis? plus de 10 millions de t?l?chargements. Vous pouvez trouver gratuitement MyScript Calculator sur les stores Android et iOS. Contact : job at visionobjects.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From thierry.hamon at UNIV-PARIS13.FR Tue Nov 26 20:37:04 2013 From: thierry.hamon at UNIV-PARIS13.FR (Thierry Hamon) Date: Tue, 26 Nov 2013 21:37:04 +0100 Subject: Appel: Atelier JADT 2014, Actualite des corpus multilingues en analyse statistiques des donn=?ISO-8859-1?Q?=E9es_?=textuelles Message-ID: Date: Tue, 26 Nov 2013 00:08:57 +0100 From: Mathieu Valette Message-Id: X-url: http://jadt.org Actualit? des corpus multilingues en analyse statistiques des donn?es textuelles : enjeux th?oriques, m?thodologies, applications Qu?ils soient parall?les ou comparables, les corpus multilingues sont aujourd?hui couramment utilis?s dans le domaine du traitement automatique des langues, notamment comme corpus d?entra?nement dans les applications en traduction automatique et en recherche d?information translingue. La terminologie et la lexicographie ont elles aussi recours aux corpus multilingues pour l?extraction de ressources langagi?res. D'autres disciplines appliqu?es, telles que la traductique ou la didactique des langues, b?n?ficient notamment de telles ressources. Encore peu exploit?e dans un contexte acad?mique, l'analyse statistique des corpus comparables offre, quant ? elle, de prometteuses perspectives en termes de description des langues, des textes et des cultures, et pour l'insertion de la linguistique de corpus dans le champ des humanit?s num?riques. Dans le cadre des Journ?es internationales d?Analyse statistique des Donn?es Textuelles (JADT 2014), un atelier est organis? en amont de la conf?rence, le mardi 3 juin 2014, dont l'objectif est de faire un ?tat des lieux prospectif sur l?utilisation des statistiques textuelles pour l?analyse de corpus multilingues. Les th?mes attendus sont les suivants : Enjeux th?oriques des corpus multilingues pour l?analyse statistique des donn?es textuelles - humanit?s num?riques et multilinguisme - corpus multilingues et linguistique compar?e - actualit? du concept de comparabilit? et comparatisme - corpus multilingues et sciences de la culture M?thodologie, outils et heuristiques pour le traitement statistique des corpus multilingues - constitution et alignement de corpus parall?les - conception, identification et constitution de corpus comparables - typologie des corpus comparables - m?thodes contrastives et analyses diff?rentielles de corpus multilingues - textom?trie multilingue Applications de l?analyse statistique des donn?es textuelles multilingues - lexicographie, terminologie, didactique, traductique, fouille de textes, etc. Les propositions de communications seront soumises suivant les normes ?ditoriales de la conf?rence elle-m?me. Site de la conf?rence http://jadt.org Date limite de soumission : 1er f?vrier 2014 Notification aux auteurs : 1er mars 2014 Date limite d'inscription : 15 mars 2014 Tenue de l'atelier : 3 juin 2014 ==================================== ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:15:15 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:15:15 +0100 Subject: Stage: Adaptation de la ressource lexico-syntaxique VerbNet au francais (2eme diffusion) Message-ID: Date: Wed, 27 Nov 2013 16:59:14 +0100 From: Ga?l de Chalendar Message-ID: <3122853.0tXvOHeGyz at brezhoneg.intra.cea.fr> INTRODUCTION Dans le cadre de la th?se de Quentin Pradet, sous la direction du Pr. Laurence Danlos et du Dr. Ga?l de Chalendar, le CEA LIST et l'INRIA ALPAGE ont entam? l'adaptation au fran?ais de la ressource lexico-syntaxique VerbNet. Le pr?sent stage vise ? contribuer ? cette traduction. CONTEXTE VerbNet est une ressource lexicale pour les verbes anglais organis?e autour de classes s?mantiques et de sous-classes syntaxiques. Cette ressource est tr?s utilis?e, notamment pour l'annotation en r?les s?mantiques. Il para?t donc n?cessaire d'avoir une ressource ?quivalente pour le fran?ais. Les seuls efforts qui ont ?t? faits pour l'instant se limitent ? des constructions automatiques bruit?es dont l'?valuation se limite ? quelques verbes. De plus ces efforts font abstraction des ressources lexicales qui existent pour le fran?ais, or celles-ci existent et sont de qualit?. Pour les verbes, nous pensons en particulier ? LVF+1, au Lexique-Grammaire et ? Dicovalence. Nous avons donc l'objectif de r?aliser un VerbeNet du fran?ais semi-automatiquement en nous appuyant sur ces ressources, en particulier sur LVF+1 et LG, la premi?re plus centr?e sur les informations s?mantiques, la seconde sur les informations syntaxiques. Ce VerbeNet garde la hi?rarchie des classes s?mantiques du VerbNet anglais, ce qui permet de garder ? l'identique les informations s?mantiques, entre autres les r?les th?matiques. OBJECTIFS La partie automatique exploitant les liens disponibles entre ressources et un r?seau lexico-syntaxique est termin?e. Le but de ce stage est de participer en collaboration ?troite avec Laurence Danlos et Quentin Pradet ? la correction manuelle de la ressource ? l'aide d'une interface Web d?velopp?e en interne. Pour chaque classe ou sous-classe VerbNet, on dispose des constructions syntaxiques possibles en anglais, des liens obtenus automatiquement avec les classes LVF+1 et LG correspondantes et d'une liste de verbes pouvant appartenir ? cette classe. Le travail consiste en l'?dition des frames lexico- syntactico-s?mantiques en r?organisant si n?cessaire la hi?rarchie de classes, en acceptant ou refusant les verbes propos?s, en modifiant les constructions syntaxiques et en traduisant les exemples. CANDIDAT ET DEROULEMENT Nous recherchons pour ce stage un ?tudiant en linguistique avec si possible des notions de lexicographie. Le stage se d?roulera au laboratoire LVIC du CEA LIST, dans les locaux de Nano Innov ? Palaiseau, en ?troite collaboration avec Laurence Danlos ? Paris. La r?mun?ration est autour de 700? pour un ?tudiant de M2, plus une ?ventuelle prime de fin de stage. CONTACT Ga?l de Chalendar gael.de-chalendar at cea.fr 01 69 08 01 50 ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:24:55 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:24:55 +0100 Subject: Carnet: Deces de Pierre Cadiot Message-ID: Date: Thu, 28 Nov 2013 08:46:16 +0100 From: "Didier Bottineau" Message-ID: <00cf01ceec0d$ec638c40$c52aa4c0$@bottineau at free.fr> Message de la part de Florence Lautel-Ribstein (florence.lautel at gmail.com) -------------------------------------------------------------- Chers coll?gues, chers amis, C'est avec une profonde tristesse que je vous informe du d?c?s de Pierre Cadiot le mardi 26 novembre. Pierre Cadiot ?tait l'un des plus grands s?manticiens fran?ais de ces derni?res ann?es. Pour tous ceux qui l'ont connu, c'?tait aussi un homme inoubliable. Les obs?ques auront lieu le vendredi 29 novembre ? l'?glise Saint Sulpice de Paris ? 11h. Une journ?e rassemblant ses amis et coll?gues sera bient?t organis?e. Me contacter. Tristement, Florence Lautel-Ribstein ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:23:38 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:23:38 +0100 Subject: Appel: 15th International Workshop on Non-Monotonic Reasoning (NMR 2014) Message-ID: Date: Wed, 27 Nov 2013 19:21:13 +0100 From: S?bastien Konieczny Message-Id: <00C7780F-381A-4D13-B85E-C7DF91E23C9A at cril.fr> X-url: http://www.kr.tuwien.ac.at/nmr14/ ______________________________________________________________________ CALL FOR PAPERS 15th International Workshop on Non-Monotonic Reasoning (NMR 2014) http://www.kr.tuwien.ac.at/nmr14/ Vienna, Austria, July 17?19, 2014 Co-located with KR 2014 [http://kr.org/KR2014/], DL 2014 [http://www.dbai.tuwien.ac.at/dl2014/], FLoC 2014, and Logic Colloquium 2014. KR 2014 is part of the Vienna Summer of Logic [http://vsl2014.at/] ______________________________________________________________________ * Aims and Scope * The NMR workshop series is the premier specialized forum for researchers in non-monotonic reasoning and related areas. This will be the 15th workshop in this series. Its aim is to bring together active researchers in the broad area of non-monotonic reasoning, including belief revision, reasoning about actions, argumentation, declarative programming, preferences, non-monotonic reasoning for ontologies, uncertainty, and other related topics. NMR will share a joint session with the 27th International Workshop on Description Logics (DL 2014). * Topics * NMR 2014 welcomes the submission of papers broadly centered on issues and research in non-monotonic reasoning. We welcome papers of either theoretical or practical nature. Topics of interest include (but are not limited to): - abductive reasoning and diagnosis, - algorithms and complexity analysis, - argumentation and dialog, - answer-set programming, - belief revision, belief update, and belief merging, - benchmarks for non-monotonic reasoning, - declarative programming for non-monotonic reasoning, - default reasoning, - empirical studies of reasoning strategies, - foundations of non-monotonic reasoning, - hybrid approaches (non-monotonic reasoning combined with other computing paradigms), - inconsistency handling, - implementations and systems, - non-monotonic logics in multi-agent interaction, including negotiation and dispute resolution, - non-monotonic reasoning for ontologies, - reasoning and decision making under uncertainty, - reasoning with preferences, - representing actions and planning, - causal reasoning, and - similarity based-reasoning. * Tracks * To focus the different topics of submissions, the workshop comprises the following thematic tracks: 1. Actions, Causality, and Belief Change; 2. Declarative Programming; 3. Argumentation and Dialog; 4. Preferences, Norms, and Trust; 5. NMR and Uncertainty; 6. Commonsense and NMR for Ontologies; as well as the following special tracks: 7. Systems and Applications; 8. Benchmarks for NMR. * Systems and Applications Track * Recent years witnessed the development of mature solver technology for some NMR based formalisms and, accordingly, successful real-world applications. This track welcomes papers on describing implemented NMR systems as well as papers presenting applications of NMR formalisms and systems. Topics of interest include pure system descriptions (providing information on the basic functionality and usability of the respective systems), the comparison and evaluation of NMR systems, NMR applications in industry and academia, software engineering and modeling methodology aspects, and reports from the field. * Benchmarks for NMR special track * The aim of the Benchmarks for NMR special track is to discuss the construction of benchmarks for NMR. Benchmarks proved useful in a variety of domains in order to develop efficient algorithms and methods. They are for the moment insufficiently developed for main NMR areas. We want to discuss this issue in NMR 2014. Typical questions of interested could be: - How to obtain benchmarks from real application cases? - How to build sensible random benchmarks? - How to export existing benchmarks in some formalism into other domains formalisms? - Etc. Papers related to these issues, description of existing systems of benchmarks, etc., are welcome. * Submissions * Papers should be between 4 and 10 pages in AAAI style (http://www.aaai.org/Publications/Author/author.php) including references, figures, and appendixes if any. System descriptions can typically be on the lower bound of the page range. Papers submission will be handled electronically by means of the easychair system. Papers must be submitted in PDF only. The submission page is available at http://www.easychair.org/conferences/?conf=nmr2014 Papers already published at other conferences and that can be of interest for an NMR audience are welcomed to NMR 2014, provided that the initial publication is mentioned in a footnote on the first page. Submissions will have to indicate to which of the above listed tracks it is intended to belong to, as well as whether it constitutes new research or recently published research. * Proceedings * There are no formal proceedings for NMR. The accepted papers will be published as a technical report and will be made available in the CoRR Computing Research Repository, see http://arxiv.org/corr/home. The copyright of the papers lies with the authors, and as far as NMR is concerned, they are free to submit to other conferences and workshops as well. Similarly, papers already published can be submitted (but this has to be indicated in the submission). * Important Dates * Submission deadline: February 14, 2014 Notification: April 2, 2014 Camera-ready articles due: April 25, 2014 NMR 2014: July 17-19, 2014 * Location * NMR 2014 will be held at the Vienna University of Technology and is part of the Vienna Summer of Logic, http://vsl2014.at/, which will probably be the largest scientific logic event in known history. * Workshop Chairs * S?bastien Konieczny (CNRS, Universit? d'Artois, France) Hans Tompits (Vienna University of Technology, Austria) Email: nmr14 [at] kr [dot] tuwien [dot] ac [dot] at * Homepage * http://www.kr.tuwien.ac.at/nmr14/ ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:14:24 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:14:24 +0100 Subject: Stage: Creating and maintaining test validation corpus, Trooclick France Message-ID: Date: Wed, 27 Nov 2013 09:15:56 +0100 From: Dhouha Bouamor Message-ID: Trooclick France is a company that specializes in the development of web applications for the automatic processing of information. Our goal is to create services that rebuild the user?s trust in digital content. Up to now, Web players were able to enhance the relevance of this content; we go a step further and contribute to improve its reliability. Trooclick was created in November 2012. Just a few months later, in April 2013, it received financial support from the BPI (French public investment bank) and in June 2013 the French government granted it the Status of "Young Innovative Company" (JEI), recognizing its innovative nature. It now counts twelve committed and passionate members in its tight-knit team. The company carries out R&D projects in search of technical solutions in the Artificial Intelligence field. Due to its growth, Trooclick is now looking for candidates for a 6 month internship for its office in Paris (17?me). Missions: As a member of the technical team, you will benefit from ongoing training and you will help us design and build our information extraction framework based on advanced NLP technologies. You will turn ideas into well-documented and reliable linguistic resources (both dictionaries and extraction rules) to ensure efficiency, quality, performance and scalability. A great team player, you will interact with other departments to understand and fine tune specifications. You will carry out unitary testing, create and maintain our test validation corpus and participate in editing technical documents. All developments will be done in English. Qualifications: - BSc/MSc - Experience with NLP tools such as Gate, Treetagger, NooJ, Stanford for linguistic annotation, named entity recognition, relationship and fact extraction, sentiment analysis, etc. - Experience in scripting languages such as Perl or Python as well as XML format to be autonomous in completing some technical tasks. - Experience with basic database management operations (SQL language) Knowledge of Semantic Web technologies (RDF, OWL, SKOS, etc.) will be a plus. - Excellent communication skills in English and French - We are open to new ideas that will significantly contribute to our success. Our friendly team will provide the opportunity for valuable collaboration. - We offer you career perspectives in a young and dynamic company with an interesting and diversified scope of duties at the cutting edge of research. We welcome applications from highly motivated individuals able to learn new techniques and share knowledge and experience with the team. Interested? Then send your application to jobs at trooclick.com! ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:27:52 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:27:52 +0100 Subject: Appel: Call for poster proposals, PARSEME COST action meeting, 10-11 March 2014, Athens Message-ID: Date: Fri, 29 Nov 2013 17:27:38 +0100 From: Agata Savary Message-ID: <5298C07A.1050001 at univ-tours.fr> X-url: http://typo.uni-konstanz.de/parseme/index.php/event/meetings/59-2nd-general-meeting-10-11-march-2014-athens X-url: http://www.cost.eu/domains_actions/ict/Actions/IC1207?parties CALL FOR POSTER PROPOSALS COST Action IC1207 PARSEME meeting, 10?11 March 2014, Athens http://typo.uni-konstanz.de/parseme/index.php/event/meetings/59-2nd-general-meeting-10-11-march-2014-athens The second general meeting of the PARSEME COST Action IC1207 (www.parseme.eu) will take place on 10?11 March 2014 in Athens. It will be organized by the Institute for Language and Speech Processing of the Athena Research Center. The meeting will start on Monday 10.03.2014 morning with a plenary session, and will continue on Monday p.m. and Tuesday 11.03.2014 with poster sessions and partly parallel Working Group (WG) sessions. Poster proposals should be related to the scientific program of any of the four Working Groups: WG1: Lexicon/Grammar Interface WG2: Parsing Techniques for MWEs WG3: Statistical, Hybrid and Multilingual Processing of MWEs WG4: Annotating MWEs in Treebanks The presentation of the posters based on selected proposals will be twofold: - a brief presentation (of about 3 minutes) of each poster will be done in a dedicated plenary session, - posters will be displayed in the meeting rooms and a classical poster session will allow for parallel discussions. Submission format: PDF, up to 2 pages (12pt font, 1in margins). Please include your name and affiliation, the title of the poster, and the Working Group concerned. You may refer to results published previously in another venue or journal. Submissions are not anonymous and are open to all researchers and language technology experts from the Action's member countries (http://www.cost.eu/domains_actions/ict/Actions/IC1207?parties). Please send your submissions via e-mail to parseme-steer at chopin.ipipan.waw.pl The final acceptance decisions will be made by the PARSEME Steering Committee. The authors of the selected proposals will be reimbursed for their travel and stay. Important dates: - 10 January 2014: poster submission deadline - 22 January 2014: notifications sent out - 10-11 March 2013: poster sessions and WG sessions Note that there will be no long paper presentations at this meeting. The Working Group sessions will be dedicated mostly to brain-storming and discussion. We are looking forward to your submissions and to an exciting and fruitful meeting! ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:32:20 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:32:20 +0100 Subject: These: Nicolas Foucault, Questions-Reponses en domaine ouvert Message-ID: Date: Fri, 29 Nov 2013 19:04:48 +0100 From: foucault Message-ID: <2857b5a678fb66dda08f361daa06a0df at limsi.fr> Bonjour ? toutes et ? tous, J'ai le plaisir de vous inviter ? ma soutenance de th?se, men?e au Laboratoire d'Informatique pour la M?canique et les Sciences de l'Ing?nieur au sein du groupe Traitement du Langage Parl? et intitul?e : "Questions-R?ponses en domaine ouvert : s?lection pertinente de documents en fonction du contexte de la question". La soutenance se d?roulera le lundi 16 d?cembre 2013 ? 14h30 au LIMSI. Cette soutenance sera suivie du traditionnel pot de th?se, vous y ?tes chaleureusement convi?s. Bien cordialement, Nicolas Foucault -------------------- Se rendre au LIMSI : -------------------- http://www.limsi.fr/Pratique/acces/index.fr.html http://www.limsi.fr/Pratique/acces/index.en.html Compter entre 1h00 et 1h15 depuis Ch?telet - Les Halles (Paris) quand tout se d?roule sans accroc sur le r?seau de la RATP ! ======================= Composition du jury : ======================= [rapporteur] : Pr Pascale S?BILLOT, PU, IRISA/INSA, Rennes [rapporteur] : Pr Patrice BELLOT, PU, LSIS, Universit? Aix-Marseille [examinateur] : Pr Thierry BACCINO, PU, LUTIN, Universit? Paris 8 [examinatrice] : Pr Brigitte GRAU, PU, LIMSI/CNRS, ENSIIE [directrice] : Mme Sophie ROSSET, DR2-CNRS, LIMSI/CNRS [co-directeur] : M. Gilles ADDA, IRHC-CNRS, LIMSI/CNRS ========== R?sum? : ========== Les probl?matiques abord?es dans cette th?se sont de d?finir une adaptation unifi?e de la s?lection des documents et des strat?gies de recherche de la r?ponse ? partir du type des documents et des questions, int?grer la solution au syst?me de Questions-R?ponses (QR) RITEL du LIMSI et ?valuer son apport. Dans cette th?se, nous d?veloppons et ?tudions une m?thode bas?e sur une approche de Recherche d'Information pour la s?lection de documents en QR. Celle-ci s'appuie sur un mod?le de langue et un mod?le de classification binaire de texte en cat?gorie pertinent ou non pertinent d'un point de vue QR. Cette m?thode permet filtrer les documents s?lectionn?s pour l'extraction de r?ponses par un syst?me QR. Nous pr?sentons la m?thode et ses mod?les, et la testons dans le cadre QR ? l'aide de RITEL. L'?valuation est faite en fran?ais en contexte web sur un corpus de 500 000 pages web et de questions factuelles fournis par le programme Quaero. Celle-ci est men?e soit sur des documents complets, soit sur des segments de documents. L'hypoth?se suivie est que le contenu informationnel des segments est plus coh?rent et facilite l'extraction de r?ponses. Dans le premier cas, les gains obtenus sont faibles compar?s aux r?sultats de r?f?rence (sans filtrage). Dans le second cas, les gains sont plus ?lev?s et confortent l'hypoth?se, sans pour autant ?tre significatifs. Une ?tude approfondie des liens existant entre les performances de RITEL et les param?tres de filtrage compl?te ces ?valuations. Le syst?me de segmentation cr?? pour travailler sur des segments est d?taill? et ?valu?. L'?valuation mesure l'impact de la variabilit? naturelle des pages web (en taille et en contenu) sur la t?che QR, en lien avec l'hypoth?se pr?c?dente. En g?n?ral, les r?sultats exp?rimentaux sugg?rent que notre m?thode aide un syst?me QR dans sa t?che. Cependant, de nouvelles ?valuations sont ? mener pour rendre ces r?sultats significatifs, et notamment en utilisant plus de questions d'entra?nement. ------------------------------------------------------------------------ "Open domain question-answering : relevant document selection geared to the question" =========== Abstract: =========== This thesis aims at defining a unified adaptation of the document selection and answer extraction strategies, based on the document and question types, in a Question-Answering (QA) context. The solution is integrated in RITEL (a LIMSI QA system) to assess the contribution. We develop and investigate a method based on an Information Retrieval approach for the selection of relevant documents in QA. The method is based on a language model and a binary model of textual classification in relevant or irrelevant category. It is used to filter unusable documents for answer extraction by matching lists of a priori relevant documents to the question type automatically. First, we present the method along with its underlying models and we evaluate it on the QA task with RITEL in French. The evaluation is done on a corpus of 500,000 unsegmented web pages with factoid questions provided by the Quaero program (i.e. evaluation at the document level or D-level). Then, we evaluate the method on segmented web pages (i.e. evaluation at the segment level or S-level). The idea is that information content is more consistent with segments, which facilitates answer extraction. D-filtering brings a small improvement over the baseline (no filtering). S-filtering outperforms both the baseline and D-filtering but not significantly. Finally, we study at the S-level the links between RITEL's performances and the key parameters of the method. In order to apply the method on segments, we created a system of web page segmentation. We present and evaluate it on the QA task with the same corpora used to evaluate the document selection method. This evaluation follows the former hypothesis and measures the impact of natural web page variability (in terms of size and content) on RITEL in its task. In general, our experimental results suggest that our IR-based method helps a QA system in its task, however further investigations should be conducted -- especially with larger corpora of questions -- to make them significant. ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN ------------------------------------------------------------------------- From hamon at LIMSI.FR Fri Nov 29 20:51:25 2013 From: hamon at LIMSI.FR (Thierry Hamon) Date: Fri, 29 Nov 2013 21:51:25 +0100 Subject: Livre: Langue des signes, surdite et acces au langage Message-ID: Date: Fri, 29 Nov 2013 15:52:34 +0100 From: "Editions du Papyrus" Message-ID: <12145c242fc51c5b835414a628ad3f30 at editions-papyrus.com> LANGUE DES SIGNES, surdit? et ACCES AU LANGAGE Les Editions du Papyrus vous pr?sentent la 2e ?dition revue et augment?e de l'ouvrage "Langue des signes, surdit? et acc?s au langage". Cet ouvrage fait le tour des questions qui se posent au quotidien aux professionnels de la surdit? : - la place de la langue des signes dans l?enseignement sp?cialis? et tout particuli?rement dans l?enseignement du fran?ais aux jeunes sourds et ipso facto la validit? de l?opposition entre pens?e visuelle et auditive, - la nature de la grammaire de la langue des signes, - l?interpr?tation vers ou ? partir de la langue des signes dans les contextes p?dagogique, culturel ou social et la formation des intervenants aupr?s des jeunes sourds. Ce livre part de situations concr?tes, se nourrit d?exemples pratiques multiples. Il privil?gie une approche pragmatique. La clart? de l?expos? permet au lecteur d?aborder la question linguistique -et c?est peut-?tre la premi?re fois qu?un expos? aussi complet l?aborde ainsi- sans se laisser enfermer dans le d?bat id?ologique qui, en mati?re de scolarit?, oppose les tenants du recours ? la langue des signes, au nom de la sp?cificit? et de la culture et les partisans de la m?thode orale au nom de la norme commune. L?auteur Interpr?te en langue des signes d?s 1979, formateur d?enseignants aupr?s des jeunes sourds, Directeur du Master d?interpr?tation en Langue des signes fran?aise de l?Ecole Sup?rieure d?Interpr?tes et de Traducteurs, Sorbonne Nouvelle Paris 3, Philippe S?ro-Guillaume poursuit une recherche sur des bases constructivistes et psycho-m?caniques de l?activit? langagi?re et de l?interpr?tation, recherche consolid?e par une collaboration depuis une douzaine d?ann?e avec Philippe Geneste enseignant chercheur. ? Editions du Papyrus, 2013 2 rue Vincent Van Gogh 93360 Neuilly-Plaisance T?l. 01 46 36 92 53 - Fax 01 43 00 95 29 E-mail : papyrus at editions-papyrus.com Site web : http://editions-papyrus.com ------------------------------------------------------------------------- Message diffuse par la liste Langage Naturel Informations, abonnement : http://www.atala.org/article.php3?id_article=48 English version : Archives : http://listserv.linguistlist.org/archives/ln.html http://liste.cines.fr/info/ln La liste LN est parrainee par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhesion : http://www.atala.org/ ATALA d?cline toute responsabilit? concernant le contenu des messages diffus?s sur la liste LN -------------------------------------------------------------------------