17.2892, Calls: Typology, Text/Corpus Ling/France; Semantics/USA

LINGUIST Network linguist at LINGUISTLIST.ORG
Thu Oct 5 14:37:40 UTC 2006


LINGUIST List: Vol-17-2892. Thu Oct 05 2006. ISSN: 1068 - 4875.

Subject: 17.2892, Calls: Typology, Text/Corpus Ling/France; Semantics/USA

Moderators: Anthony Aristar, Eastern Michigan U <aristar at linguistlist.org>
            Helen Aristar-Dry, Eastern Michigan U <hdry at linguistlist.org>
 
Reviews: Laura Welcher, Rosetta Project / Long Now Foundation  
         <reviews at linguistlist.org> 

Homepage: http://linguistlist.org/

The LINGUIST List is funded by Eastern Michigan University, Wayne
State University, and donations from subscribers and publishers.

Editor for this issue: Dan Parker <dan at linguistlist.org>
================================================================  

As a matter of policy, LINGUIST discourages the use of abbreviations
or acronyms in conference announcements unless they are explained in
the text.

To post to LINGUIST, use our convenient web form at 
http://linguistlist.org/LL/posttolinguist.html. 



===========================Directory==============================  

1)
Date: 05-Oct-2006
From: Maria Zimina-Poirot < maria.zimina at lipn.univ-paris13.fr >
Subject: Typologies de Textes Pour le Traitement Automatique 

2)
Date: 05-Oct-2006
From: Yael Sharvit < salt17 at uconn.edu >
Subject: Semantics And Linguistic Theory 17 

	
-------------------------Message 1 ---------------------------------- 
Date: Thu, 05 Oct 2006 10:35:19
From: Maria Zimina-Poirot < maria.zimina at lipn.univ-paris13.fr >
Subject: Typologies de Textes Pour le Traitement Automatique 
 


Full Title: Typologies de Textes Pour le Traitement Automatique 
Short Title: Journée ATALA 

Date: 09-Dec-2006 - 09-Dec-2006
Location: Paris, France 
Contact Person: Maria Zimina-Poirot
Meeting Email: maria.zimina at lipn.univ-paris13.fr
Web Site: http://www.atala.org/rubrique.php3?id_rubrique=2 

Linguistic Field(s): Computational Linguistics; Text/Corpus Linguistics; Typology 

Subject Language(s): French (fra)

Call Deadline: 10-Nov-2006 

Meeting Description:

Appel A Communications

Journée d'études ATALA 'Typologies de Textes Pour le Traitement Automatique'
9 décembre 2006, Paris. 

Cette journée ATALA souhaite concentrer les exposés sur la notion de typologie textuelle c'est à dire le rattachement d'un document à tel ou tel type de textes (ou genre ou registre, vu la terminologie fluctuante) : manuel technique, texte de loi, constat d'accident, rapport de stage, recommandation médicale, documentation technique, éditorial, article scientifique,... Si cette approche typologique fait l'hypothèse de types de textes définis a priori, l'appel concerne aussi, mais dans une moindre mesure, une typologie a posteriori où les catégories émergent en fonction de l'examen et du regroupement de traits linguistiques ou autres. 

Dans cet éventail de recherches allant du plus théorique ou plus pratique, cette journée se veut  un lieu d'échange et de discussions entre des chercheurs qui abordent le texte avec des points de vue très divers mais qui envisagent une automatisation des traitements. 

Cette journée abordera en particulier les points suivants : 

- quelles mesures de distances pour calculer des proximités/oppositions entre textes ? Quels facteurs, quels traits (lexical, syntaxique, sémantique, pragmatique) utiliser ? 

- les systèmes de TAL existants utilisent les mêmes outils, les mêmes ressources, réalisent les mêmes traitements quel que soit le type du texte. Est-ce pertinent ? Si non, est-il possible de  traiter la circularité apparente : l'efficacité des outils dépend du type de textes mais la détection du type de textes nécessite l'utilisation d'outils ? 

- Les deux façons de définir une typologie  a priori (avec des catégories pré-établies de genres, de domaines, de contextes de production) ou a posteriori (où les catégories émergent en fonction de l'examen et du regroupement de traits linguistiques), concordent-elles ? 

- Un texte est-il entièrement d'un certain type ou peut-il comporter des parties relevant chacune de types différents ? Quels moyens de repérage ? 

- En quoi les documents structurés renouvellent la problématique de typologie des textes ? 

- ou toute autre proposition de communication en relation avec les thèmes de la journée. 

Les propositions de communication (de 1 à 5 pages) au format WORD ou PDF devront parvenir aux organisateurs pour le 10 novembre 2006

pour une journée le 9 décembre. 

Contacts : 
francoise.gayral at lipn.univ-paris13.fr 
maria.zimina at lipn.univ-paris13.fr 

Depuis quelques années, avec le développement de l'accès aux documents numériques, de nouveaux besoins émergent concernant l'exploitation des documents :

- besoin de catégoriser les documents par thème, par genre,... pour faciliter la recherche documentaire et regrouper les documents par catégorie,

- besoin d'isoler des zones de documents plutôt que des documents, pour montrer, par exemple, des parties pertinentes par rapport à une question posée,

- besoin de naviguer à l'intérieur des documents, pour guider l'utilisateur dans sa recherche,

-...

Ces besoins nécessitent d'avoir à la fois une vision globale du document afin de prendre en considération son organisation discursive, sa structuration thématique ou rhétorique,... et aussi une vision - locale - puisque ce sont souvent des marques linguistiques qui permettent de mettre à jour ces différents plans organisationnels.

Du point de vue du traitement automatique de la langue et de la linguistique textuelle, une dynamique de recherche s'est instaurée autour de ces besoins et de ces visions complémentaires avec la journée ATALA - Modéliser et décrire l'organisation discursive à l'heure du document numérique - de juin 2004, le colloque - discours et document -  de Caen en juin dernier et l'appel de la revue TAL - Discours et document : traitements automatiques -. La part de - traitement automatique - est très variable suivant les approches.

Une autre communauté scientifique, - apprentissage à partir de textes - est aussi concernée par ces problématiques quand elle s'assigne des tâches de catégorisation automatique, de classification automatique, segmentation automatique de textes... La représentation du texte est souvent extrêmement simplifiée mais les solutions proposées sont implémentées et leur efficacité peut être testée et comparée.

La journée ATALA proposée s'inscrit dans ce cadre général mais souhaite concentrer les exposés sur la notion de typologie textuelle c'est à dire le rattachement d'un document à tel ou tel type de textes (ou genre ou registre, vu la terminologie fluctuante) : manuel technique, texte de loi, constat d'accident, rapport de stage, recommandation médicale, documentation technique, éditorial, article scientifique,... Si cette approche typologique fait l'hypothèse de types de textes définis a priori, l'appel concerne aussi, mais dans une moindre mesure, une typologie a posteriori où les catégories émergent en fonction de l'examen et du regroupement de traits linguistiques ou autres.

Dans cet éventail de recherches allant du plus théorique ou plus pratique, cette journée se veut  un lieu d'échange et de discussions entre des chercheurs qui abordent le texte avec des points de vue très divers mais qui envisagent une automatisation des traitements.

Cette journée abordera en particulier les points suivants :

- quelles mesures de distances pour calculer des proximités/oppositions entre textes ? Quels facteurs, quels traits (lexical, syntaxique, sémantique, pragmatique) utiliser ?

- les systèmes de TAL existants utilisent les mêmes outils, les mêmes ressources, réalisent les mêmes traitements quel que soit le type du texte. Est-ce pertinent ? Si non, est-il possible de  traiter la circularité apparente : l'efficacité des outils dépend du type de textes mais la détection du type de textes nécessite l'utilisation d'outils ?

- Les deux façons de définir une typologie  a priori (avec des catégories pré-établies de genres, de domaines, de contextes de production) ou a posteriori (où les catégories émergent en fonction de l'examen et du regroupement de traits linguistiques), concordent-elles ?

- Un texte est-il entièrement d'un certain type ou peut-il comporter des parties relevant chacune de types différents ? Quels moyens de repérage ?

- En quoi les documents structurés renouvellent la problématique de typologie des textes ?

- ou toute autre proposition de communication en relation avec les thèmes de la journée.

Comité d'organisation :

Maria Zimina-Poirot (LIPN)
Marie-Paul Jacques (LIPN)
Patrick Saint-Dizier (IRIT)
Thierry Poibeau (LIPN-CNRS)
Françoise Gayral (LIPN)

Comité de lecture (en cours de définition)

Les propositions de communication (de 1 à 5 pages) au format WORD ou PDF devront parvenir aux organisateurs pour le 10 novembre 2006.

Pour une journée le 9 décembre.

Contacts :
francoise.gayral at lipn.univ-paris13.fr
maria.zimina at lipn.univ-paris13.fr

LIPN-RCLN
Université Paris 13
99, avenue Jean-Baptiste Clément
93430 Villetaneuse


	
-------------------------Message 2 ---------------------------------- 
Date: Thu, 05 Oct 2006 10:35:25
From: Yael Sharvit < salt17 at uconn.edu >
Subject: Semantics And Linguistic Theory 17 

	

Full Title: Semantics And Linguistic Theory 17 
Short Title: salt17 

Date: 11-May-2007 - 13-May-2007
Location: Storrs, CT (UConn), USA 
Contact Person: Yael Sharvit
Meeting Email: salt17 at uconn.edu
Web Site: http://salt17.uconn.edu 

Linguistic Field(s): Semantics 

Call Deadline: 02-Jan-2007 

Meeting Description:

Natural language semantics and its relevance to linguistis theory. 

We are pleased to announce that Semantics and Linguistic Theory 17 will be held May 11-13, 2007 at the University of Connecticut in Storrs, CT. The invited speakers are

Gennaro Chierchia, Harvard University
Veneeta Dayal, Rutgers University
Danny Fox, MIT
Thomas Ede Zimmerman, Johann Wolfgang Goethe-Universität

We invite submissions of abstracts for 30-minute presentations (plus 10-minute discussions) on any topic pertaining to natural language semantics with relevance to linguistic theory. Abstracts must be anonymous and should be at most 2 pages (A4 or US Letter) in length (including examples and references) using a 12 pt font with 1-inch (2.5 cm) margins on all four sides. In the interest of fairness, these limitations will be strictly enforced.

Authors may be involved in at most two submissions and may be the sole author of at most one abstract. No single author will be allowed to give more than one presentation at the conference.

As a matter of general policy, SALT does not accept papers that at the time of the conference have been published or have been accepted for publication. In addition, preference will be given to presentations that are not duplicated at other major conferences. We therefore request that authors indicate prior or planned presentations of their papers along with their contact information when they submit their abstracts.

The deadline is January 2, 2007. We regret that we will not be able to consider abstracts arriving after this date. Speakers will be notified of the results of their abstract review by February 2007.

For instructions on abstract submission, please go to: http://salt17.uconn.edu

We look forward to seeing you here in Connecticut during SALT 17!!
 



-----------------------------------------------------------
LINGUIST List: Vol-17-2892	

	



More information about the LINGUIST mailing list