[Corpora-List] JADT 2004 proceedings

Mon Mar 22 17:12:55 UTC 2004

JADT 2004 (7th International Conference on the Textual Data Statistical 
Analysis) was held from March 10 to March 12, 2004 in Louvain-la-Neuve 
(Belgium). 

The proceedings were published by the "Presses Universitaires de 
Louvain" (PUL, 1220 pages, 2 vols).

You can order the JADT 2004 proceedings on-line:
	On paper: 64 euros (-20% off until April 15, 2004: 52 euros)
	In PDF format: 32 euros
	(each volume can be ordered separately)

	Order & info : http://www.i6doc.com/doc/poidsmotsen

	JADT web site : http://www.jadt.org

Table of content :	

VOLUME 1

** Keynote speakers **

Douglas BIBER : 
Conversation text types: A multi-dimensional analysis 15 

Claudia LEACOCK : 
Statistical Analysis of Text in Educational Measurement 35 

** Communications / Papers / Posters ** 

- Ramón ÁLVAREZ, Mónica BÉCUE, Olga VALENCIA : 
Étude de la stabilité des valeurs propres de l'AFC d'un tableau lexical au 
moyen de procédures de rééchantillonage 42 
- Silvano AMATO, Emilio DI MEGLIO, Maria GUERRA : 
Text Retrieval with External Information 52 
- Roxana ANGHELUTA, Patrick JEUNIAUX, Rudradeb MITRA, Marie-Francine MOENS : 
Clustering Algorithms for Noun Phrase Coreference Resolution 60 
Mappillairaju BAGAVANDAS, G. MANIMANNAM : 
Quantification Of Stylistic Traits: A Statistical Approach 71 
- Simona BALBI, Emilio DI MEGLIO : 
A Text Mining Strategy based on Local Contexts of Words 79 
- Ana-Maria BARBU : 
Simple linguistic methods for improving a word alignment algorithm 88 
- Silvia BARTOLETTI, Alessandra GARBERO, Silvia MONTECOLLE, Ferdinando NISCO, 
Emanuela RECCHINI, Irene SALERNO : 
Gli sbarchi dei clandestini nei quotidiani: un'analisi testuale esplorativa 99 
- Valérie BEAUDOUIN, François YVON : 
Contribution de la métrique à la stylométrie 107 
- Mónica BECUE, Jérôme PAGES, Campo-Elias PARDO : 
Analysis of multilingual free responses 119 
- Luc BELANGER, Guy LAPALME : 
Identification de questions pour traiter les courriels par une méthode 
question-réponse 128 
- Jean-Guy BERGERON, Dominique LABBE : 
Analyser les entretiens sociologiques 136 
- Charles BERNET : 
Hasards de la rime 148 
- Anne BERRY, Bangaly KABA, Mohamed NADIF, Eric SANJUAN, Alain SIGAYRET : 
Classification et désarticulation de graphes de termes 160 
- Yves BESTGEN : 
Analyse sémantique latente et segmentation automatique de textes 171 
- Yves BESTGEN, Cédrick FAIRON, Laurent KERVES : 
Un baromètre affectif effectif. Corpus de référence et méthode pour déterminer 
la valence affective de phrases 182 
- Ismaïl BISKRI, Jean-Guy MEUNIER, Sylvain JOYAL : 
L'extraction des termes complexes : une approche modulaire semi-automatique 
192 
- Sergio BOLASCO, Francesca DELLA RATTA ' RINALDI : 
Experiments on semantic categorisation of texts: analysis of positive and 
negative dimension 202 
- Mathieu BRUGIDOU, Nadine MANDRAN, Michel MOINE, Annie-Claude SALOMON : 
Les apports de l'analyse textuelle pour l'analyse électorale : les questions 
ouvertes du panel électoral de 2002 211 
- Sylviane BURNER : 
Le rapport à l'autre dans la psychose bipolaire 221 
- Carmela CAPPELLI, Angela D'ELIA : 
La percezione della sinonimia: un'analisi statistica mediante moelli per 
ranghi 229 
- Simona CARBONE, Maria LONGOBARDI : 
Gli aggettivi delle rappresentazioni di genere in adolescenza 241 
- Renzo CARLI, Francesca DOLCETTI, Nadia BATTISTI : 
L'analisi emozionale del testo (AET): un caso di verifica nella formazione 
professionale 250 
- Antonio CHIRUMBOLO, Alessandra ARENI : 
Linguaggio, ideologia e categorizzazione sociale: un'analisi psicologico 
sociale del documento di rivendicazione dell'attentato a Marco Biagi 262 
- Marie-Catherine de MARNEFFE, Pierre DUPONT : 
Comparative study of statistical word sense discrimination techniques 270 
- Anne DE ROECK, Avik SARKAR, Paul H. GARTHWAITE : 
Defeating the Homogeneity Assumption 282 
- Jean-Claude DEROUBAIX : 
Que faire des corpus multilingues parallèles ' Une expérience 295 
- Guy DEVILLE, Laurence DUMORTIER, Hans PAULUSSEN : 
Génération de corpus multilingues dans la mise en ½uvre d'un outil en ligne 
d'aide à la lecture de textes en langue étrangère 304 
- Anne DISTER : 
La féminisation des noms de métier, fonction, grade ou titre en Belgique 
francophone. État des lieux dans un corpus de presse 313 
- Hai DOAN-NGUYEN, Leila KOSSEIM : 
Amélioration de la précision dans un système de question-réponse de domaine 
fermé 325 
- Antoine DOUCET : 
Utilisation de séquences fréquentes maximales en recherche d'information 334 
- Patrick DROUIN : 
Spécificités lexicales et acquisition de la terminologie 345 
- Jules DUCHASTEL, François DAOUST, Dimitri DELLA FAILLE : 
SATO-XML : une plateforme Internet ouverte pour l'analyse de texte assistée 
par ordinateur 353 
- Jules DUCHASTEL, Francis J. LACOSTE, François PIZARRO NOËL : 
Une stratégie intégrée de recherche en sciences humaines dans le Portail 
ATO-MCD 364 
- Anne DUFRESNE : 
Le discours de la BCE concernant les aspects sociaux 373 
- Vincent J. DURIAU, Rhonda K. REGER : 
Choice of Text Analysis Software in Organization Research: Insight from a 
Multi-dimensional Scaling (MDS) Analysis 382 
- Louisette EMIRKANIAN, Christophe FOUQUERE, Fabrice ISSAC : 
Corpus issus du Web : analyse des pertinences thématique et informationnelle 
390 
- Frédéric ERLOS : 
Référentiels terminologiques adaptables au contexte. L'exemple d'un système de 
recherche d'informations dans une grande entreprise 399 
- Stefan EVERT : 
A simple LNRE Model for Random Character Sequences 411 
- Cédrick FAIRON, Ngoc-Diep HO : 
Quantité d'information échangée : une nouvelle mesure de la similarité des 
mots 423 
- Dominic FOREST, Jean-Guy MEUNIER : 
Classification et catégorisation automatiques : application à l'analyse 
thématique des données textuelles 434 
- François FOUSS, Jean-Michel RENDERS, Marco SAERENS : 
Some relationships between Kleinberg's hubs and authorities, correspondence 
analysis, and the Salsa algorithm 445 
- Itsuko FUJIMURA, Mitsumi UCHIDA, Hiroshi NAKAO : 
De vs des devant les noms précédés d'épithète en français : 
le problème de petit 456 
- Jean-Gabriel GANASCIA, Irène FENOGLIO, Jean-Louis LEBRAVE : 
EDITE MEDITE : un logiciel de comparaison de versions 468 
- Claire GELINAS-CHEBAT, François DAOUST, Monique DUFRESNE, Karine GALLOPEL, 
Marie Élaine LEBEL : 
Analyse exploratoire d'entrevues de groupe : les jeunes Français et le tabac 
479 
- Raphaël GERARD, Bastien KINDT : 
D'un dictionnaire de lemmatisation (D.A.G.) à un dictionnaire dérivationnel du 
grec ancien (D.D.G.) 488 
- Gaëtanelle GILQUIN, Eric LECOUTRE : 
(How) can causative constructions be predicted' 496 
- Luca GIULIANO : 
Il lessico della guerra nei newsgroup della categoria it.politica durante la 
guerra in Iraq 504 
- Cyril GOUTTE, Eric GAUSSIER, Nicola CANCEDDA, Hervé DEJEAN : 
Generative vs Discriminative Approaches to Entity Recognition from 
Label-Deficient Data 515 
- Maria Gabriella GRASSIA, Michelangelo MISURACA, Germana SCEPI : 
Relazioni non Simmetriche tra Corpora 524 
- Edel P. GREEVY, Alan F. SMEATON : 
Text Categorisation of Racist Texts Using a Support Vector Machine 533 
- Gaston GROSS : 
Réflexions sur le traitement automatique des langues 545 
- Patricia GUILPIN, Christian GUILPIN : 
Nouvelle méthode d'analyse statistique de la fréquence d'apparition d'un mot 
particulier (études synchroniques et diachroniques) 557 
- Benoît HABERT, Gabriel ILLOUZ, Helka FOLCH : 
Dégrouper les sens : pourquoi, comment ' 565 
- Serge HEIDEN : 
Interface hypertextuelle à un espace de cooccurrences : implémentation dans 
Weblex 577 
- Fidelia IBEKWE-SANJUAN, Eric SANJUAN : 
Mapping the structure of research topics through term variant clustering : the 
TermWatch system 589 
- Angel IGELMO, Gabriel M. JORDA, Carlota VICENS : 
El análisis estadístico para el estudio de los campos estilísticos en una obra 
literaria 601 

VOLUME 2 

- Michel JACOBSON : 
Corpus oraux glosés : outils logiciels d'aide à l'analyse 625 
- Bernard JACQUEMIN : 
Analyse et expansion des textes en question-réponse 633 
- Jean-Marie JACQUES, Nathanaël LAURENT, Anne WALLEMACQ : 
Paradoxes, dilemmes et contradictions : une mise en lumière au moyen du 
logiciel EVOQ© 644 
- Radwan JALAM, Jérémy CLECH, Ricco RAKOTOMALALA : 
Cadre pour la catégorisation de textes multilingues 650 
- Michèle JARDINO : 
Recherche de structures latentes dans des partitions de « textes » de 2 à k 
classes 661 
- Margareta KASTBERG SJÖBLOM : 
Analyse grammatico-métrique d'une monographie "multi-générique" ; le 
substantif 672 
- Nicolas KUMPS, Pascal FRANCQ, Alain DELCHAMBRE : 
Création d'un espace conceptuel par analyse de données contextuelles 682 
- Mathieu LAFOURCADE, Violaine PRINCE : 
Modélisation de l'Hyperonymie via la combinaison de réseaux sémantiqueset de 
vecteurs conceptuels 692 
- Anne-Catherine LANTIN, Philippe V. BARET, Caroline MACÉ : 
Phylogenetic analysis of Gregory of Nazianzus' Homily 27 700 
Ludovic LEBART : 
Validité des visualisations de données textuelles 708 
- Jean-marc LEBLANC, Pierre FIALA : 
Autour du Je présidentiel 716 
- Christophe LEJEUNE : 
Représentation des réseaux de mots associés 726 
- Alain LELU : 
Analyse en composantes locales et graphes de similarité entre textes 737 
- Dominique LONGREE, Xuan LONG, Sylvie MELLET : 
Temps verbaux, axe syntagmatique, topologie textuelle : analyses d'un corpus 
lemmatisé 743 
- Jean-Luc MANGUIN : 
L'évolution en français de l'adjectif épithète vers la postposition : réalité 
syntaxique ou trompe-l'½il lexical ' 753 
- Chantal-Édith MASSON, Hélène CAJOLET-LAGANIERE, Pierre MARTEL : 
La BDTS-concordances : un outil technologique d'enrichissement de la pratique 
lexicographique 764 
- Denis MAUREL : 
Les mots inconnus sont-ils des noms propres ? 776 
- Damon MAYAFFRE : 
Analyse logométrique de la cohabitation Chirac/Jospin (1997-2002). Explication 
de la défaite de Lionel Jospin à l'élection présidentielle de 2002 785 
- Nicolas MAZZIOTTA : 
Le texte dans tous ses états. Philosophie d'encodage du projet Khartês 793 
- Maura MISITI, Simona CARBONE : 
Secondo gli esperti: Popolazione e società nelle opinioni dei testimoni 
privilegiati di una ricerca sugli adolescenti italiani 804 
- A. MOKRANE, R. AREZKI, G. DRAY, P. PONCELET : 
Cartographie automatique du contenu d'un corpus de documents textuels 816 
- Rogério MUGNAINI, Esteban FERNANDEZ TUESTA, Adalberto OTRANTO TARDELLI : 
Citations Titles Standardization Using Information Retrieval Techniques 824 
- Jean-Pierre MÜLLER : 
ttda ' une librairie R pour l'analyses de données textuelles 831 
- Takuya NAKAMURA : 
Analyse automatique d'un discours spécialisé au moyen de grammaires locales 
837 
- Berthille PALLAUD, Sandrine HENRY : 
Amorces de mots et répétitions : des hésitations plus que des erreurs en 
français parlé 848 
- Sophie PIÉRARD, Liesbeth DEGAND, Yves BESTGEN : 
Vers une recherche automatique des marqueurs de la segmentation du discours 
859 
- Bénédicte PINCEMIN : 
Lexicométrie sur corpus étiquetés 865 
- Carmen PINEIRA-TRESMONTANT : 
Un pas en avant, un pas en arrière (Vingt-cinq ans d'allocutions 
radiodiffusées du roi Juan-Carlos d'Espagne) 874 
- Sophie PIRON : 
Contraintes syntaxiques et préférences sélectionnelles du verbe entendre 885 
- Thierry POIBEAU : 
Pré-analyse de corpus 897 
- Jean-Luc POMMIER : 
Des variables tensives inscrites dans le texte : une interprétation dynamique 
de l'A.F.C. dans l'analyse d'Alceste 904 
- Yasmina QUATRAIN, Sylvaine NUGIER, Anne PERADOTTO, Damien GARROUSTE : 
Évaluation d'outils de Text Mining : démarches et résultats 916 
- Paul RAYSON, Damon BERRIDGE, Brian FRANCIS : 
Extending the Cochran rule for the comparison of word frequencies between 
corpora 926 
- Alex RIBA, Josep GINEBRA : 
Diversity of Vocabulary and Homogeneity of Style in Tirant lo Blanc 937 
- Mathieu ROCHE, Thomas HEITZ, Oriane MATTE-TAILLIEZ, Yves KODRATOFF : 
EXIT: un système itératif pour l'extraction de la terminologie du domaine à 
partir de corpus spécialisés 946 
- Maria Clelia ROMANO, Tania CAPPADOZZI : 
Il processo di codifica dei dati testuali dell'indagine Multiscopo 'Uso del 
tempo' 958 
- Cristelle ROUX, Alain LEFEVRE : 
Identification des besoins en information géographique 970 
- Thibault ROY, Pierre BEUST : 
ProxiDocs : un outil de cartographie et de catégorisation thématique de corpus 
978 
- André SALEM : 
Introduction à la résonance textuelle 987 
- Luiggi SANSONETTI : 
Apports de la statistique textuelle pour le repérage des reprises et 
reformulations dans les corpus d'interaction verbale entre un adulte et un 
enfant 994 
- Jacques SAVOY, Yves RASOLOFO : 
Hyperliens et recherche d'information sur le web 1001 
- Didier SCHWAB, Mathieu LAFOURCADE, Violaine PRINCE : 
Hypothèses pour la construction et l'exploitation conjointe d'une base 
lexicale sémantique basée sur les vecteurs conceptuels 1009 
- Gilda SENSALES, Antonio CHIRUMBOLO : 
Le rappresentazioni delle differenze di 'Genere' nel mondo del lavoro 
attraverso la comunicazione scientifica in psicologia sociale: analisi del 
lessico degli 'Psychological Abstracts' (1976-2002) 1020 
- Benedikt SZMRECSÁNYI : 
On Operationalizing Syntactic Complexity 1032 
- Cristina Alice TOMA : 
Cohésion informative dans le discours scientifique 1040 
- Carlo TOMASETTO, Patrizia SELLERI : 
Lessico dell'intervista, lessico degli intervistati : l'articolazione tra 
domande e risposte nell'analisi di Alceste 1052 
- Stéphane TREBUCQ : 
Finance organisationnelle : un essai de représentation 1062 
- Laurence TUERLINCKX : 
La lemmatisation de l'arabe non classique 1070 
- Jose TUMMERS, Dirk SPEELMA, Dirk GEERAERTS : 
Quantifying semantic effects. The impact of lexical collocations on the 
inflectional variation of Dutch attributive adjectives 1080 
- Gian Piero TURCHI, Sara MARTINAZIOLI, Luisa ORRU, Barbara LALISCIA : 
La 'malattia mentale' tra senso scientifico e senso comune: analisi di testi 
di settore e divulgativi 1090 
- Arjuna TUZZI, Marisa CEMIN, Marco CASTAGNA : 
'Moved deeply I am'. Autistic language in texts produced with FC 1098 
- Mathieu VALETTE, Natalia GRABAR : 
Caractérisation de textes à contenus idéologiques : statistique textuelle ou 
extraction de syntagme ' l'exemple du projet PRINCIP 1107 
- Valery VANDAELE, Pascal FRANCQ, Alain DELCHAMBRE : 
Analyse d'hyperliens en vue d'une meilleure description des profils 1118 
- Lieve VANGEHUCHTEN : 
El uso de la estadística en la didáctica de las lenguas extranjeras con fines 
específicos: descripción del proceso de selección del léxico típico del 
discurso económico empresarial en español 1129 
- Sofie VAN GIJSEL, Dirk GEERAERTS, Dirk SPEELMAN : 
A functional analysis of the linguistic variation in Flemish spoken 
commercials 1037 
- Fabienne VENANT : 
Polysémie et calcul du sens 1146 
- Jacques VERGNE : 
Découverte locale des mots vides dans des corpus bruts de langues inconnues, 
sans aucune ressource 1158 
- Jean-Marie VIPREY : 
Analyse séquencée de la micro-distribution lexicale 1166 
- Hung VO TRUNG : 
SANDOH, un outil pour analyser des textes hétérogènes 1178 
- David WARTEL, Pascal FRANCQ, Alain DELCHAMBRE : 
Organisation d'une masse documentaire électronique présentée à des lecteurs 
potentiels 1186 
- Maria ZIMINA : 
Alignement textométrique des unités lexicales à correspondances multiples dans 
les corpus parallèles 1196 

** Tables rondes / Workshops ** 

Lexicométrie et corpus multilingues 1204 
Corneille et Molière 1208 
Index 
Index des auteurs /Authors Index 1209 
Index des mots-clés / Keywords Index 1213