From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:31 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:31 +0200 Subject: Appel: COLING 2004 Message-ID: PRELIMINARY ANNOUNCEMENT: COLING 2004 The 20th International Conference on Computational Linguistics University of Geneva, Switzerland -- August 23-27, 2004 We are pleased to announce that COLING 2004 will take place at the University of Geneva, Switzerland, on August 23-27, 2004 (main conference dates), together with satellite events before and after the main conference. Information about submission, registration and venue will be posted in due time at the URL below. The head of the program committee for COLING 2004 is Prof. Sergei Nirenburg (University of Maryland Baltimore County), and the head of the organizing committee is Prof. Margaret King (University of Geneva). Important dates * deadline for submission of papers: March 26, 2004 * notification of acceptance: May 14, 2004 * deadline for workshop and tutorial proposals: December 15, 2003 * workshop and tutorial notification: January 16, 2004 URL for local organization * http://www.issco.unige.ch/coling2004/ ------------------------------------------------------------------- ------------------------------------------------------------------------- Message diffus� par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain�e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh�sion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:27 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:27 +0200 Subject: Appel: JEP 2004 - TALN 2004 Message-ID: ********************************************************************** J E P 2 0 0 4 - T A L N 2 0 0 4 Journées d'Etude sur la Parole 2004 & Traitement Automatique du Langage Naturel 2004 --- Palais de Congrès Fès (Maroc) du 19 au 22 avril 2004 http://www.lpl.univ-aix.fr/jep-taln04/ ********************************************************************** (English version below) Les conférences JEP 2004 (Journées d'Etude sur la Parole) et TALN 2004 (Traitement Automatique du Langage Naturel) auront lieu en conjonction à Fès, au Maroc, du 19 au 22 avril 2004. Elles sont placées sous l'égide de l'Association Francophone de la Communication Parlée (AFCP) et de l'Association pour le traitement automatique des langues (ATALA). Toutes les informations relatives aux deux conférences, les appels à communication, et les renseignements pratiques, seront bientôt accessibles sur le site : http://www.lpl.univ-aix.fr/jep-taln04/ JEP-TALN'04 est organisée par : . le Laboratoire Parole et Langage, Aix-en Provence (France) . l'Université de Fès (Maroc) . l'Ecole Normale Supérieure de Fès (Maroc) --------------------------------------------------------------------- The JEP 2004 (Journées d'Etude sur la Parole) and TALN 2004 (Traitement Automatique du Langage Naturel) conferences will be held in conjunction in Fez, Morocco, from 19 to 22 April 2004, under the aegis of the Association Francophone de la Communication Parlée (AFCP) and of the Association pour le Traitement Automatique des Langues (ATALA). A complete presentation of the two conferences, along with calls for communication and practical information, will soon be available at the following URL: http://www.lpl.univ-aix.fr/jep-taln04/ JEP-TALN'04 is organized by : . the Laboratoire Parole et Langage, Aix-en Provence (France) . the University of Fès (Morocco) . the Ecole Normale Supérieure of Fez (Morocco) ------------------------------------------------------------------------- Message diffusé par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrainée par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhésion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:39 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:39 +0200 Subject: Appel: PROSPECTS AND ADVANCES IN THE SYNTAX/SEMANTICS INTERFACE Message-ID: ====================================================================== PROSPECTS AND ADVANCES IN THE SYNTAX/SEMANTICS INTERFACE Lorraine-Saarland Workshop Series Nancy, October 20-21 2003 Deadline for abstracts, demos: August 31 2003 ====================================================================== In the context of the Lorraine-Saarland Workshop Series, we are organizing a workshop entitled "Prospects and advances in the syntax/semantics interface". The workshop series is a joint initiative of LORIA (Nancy) and MPI (Saarbrücken). The workshop itself will take place in Nancy, October 20-21 2003. http://www.loria.fr/~duchier/Lorraine-Saarland/index.html Both in Lorraine and in the Saarland, considerable interest and active research efforts have started to gravitate around the syntax/semantics interface. Our objective with this workshop is to bring together the many researchers who are involved in these efforts, to report on e.g. formal, computational, and empirical issues, to increase mutual awareness and improve lines of communication, and to foster collaboration on the integration of computational semantics into grammar frameworks. (while there is a certain regional bias in this workshop, we welcome submissions from anywhere). The idea is to construct the workshop program around presentations (on the basis of reviewed papers), a panel discussion, and a session of informal demos. Authors are invited to submit 4-page extended abstracts (for presentation), 1-page position papers for the panel, and 3-page abstracts for demos. IMPORTANT: Please inform us of your _intent_ to participate as early as possible (by emailing to lorraine-saarland at ps.uni-sb.de) PAPERS We welcome submissions on all aspects of the syntax/semantics interface, including formal, computational and empirical issues, as well as on applications. We are particularly keen on recent developments, work in progress, and prospective projects, in other words, all contributions which may serve to increase the mutual awareness of on-going research and to encourage the formation of joint research efforts. Merely as a suggestion, we provide here a non-exhaustive list of possible topics: formalisms: - grammatical and metagrammatical formalisms - constraint formalisms computational issues (processing, algorithms, constraints): - processing tree descriptions computational semantics - application of the syntax/semantics interface in the service of computational semantics corpus-based and empirical research: - semantics annotations - learning - preferences - statistical methods, robustness PANEL DISCUSSION Our theme is: "description, processing and integration of multiple sources of information in the modeling and computational analysis of natural language". We are especially interested in the integrative aspect of this enterprise which not only touches on all aspects of computational linguistics, but also reaches across the border into other areas such as ontologies and the semantic web. IMPORTANT DATES - Deadline for submissions: August 31, 2003 - Notification of acceptance: September 19, 2003 - Workshop: October 20-21, 2003 LOCAL ARRANGEMENTS There will be no registration fee, and we will provide proceedings, lunch, and coffee breaks. However, due to the strong local character of the workshop, everyone should make their own arrangements for accommodations (although, if you need help, please email to lorraine-saarland at ps.uni-sb.de). We will also organize a dinner at a restaurant on the evening of Day 1 for those interested. PROGRAM Day 1 10:00 Start/Paper session (5 papers) 12:30 Lunch 14:30 Panel discussion 16:00 Tea/coffee break 16:30 Paper session (2 papers) 17:30 End/Dinner Day 2 09:30 Start/Paper session (3 papers) 11:00 Tea/Coffee break 11:30 Paper session (2 papers) 12:30 Lunch 14:30 Demos 16:30 Final wrap-up of workshop 17:00 End PROGRAM COMMITTEE Carlos Areces (LORIA, Nancy) Patrick Blackburn (LORIA, Nancy) Paul Buitelaar (DFKI, Saarbrücken) Denys Duchier (LORIA, Nancy; Chair) Philippe de Groote (LORIA, Nancy) Valia Kordoni (COLI, Saarbrücken) Geert-Jan Kruijff (COLI, Saarbrücken; Chair) Guy Perrier (LORIA, Nancy) Manfred Pinkal (COLI, Saarbrücken) Hans Uszkoreit (COLI/DFKI, Saarbrücken) -- Denys Duchier - Équipe Calligramme - LORIA, Nancy, France ------------------------------------------------------------------------- Message diffusé par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrainée par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhésion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:49 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:49 +0200 Subject: Conf: XVIII Tarragona Seminar on Formal Syntax and Semantics Message-ID: ALGEBRAIC GRAMMAR AND ROUGH SET THEORY (XVIII Tarragona Seminar on Formal Syntax and Semantics, FS&S) Joachim Lambek (McGill University) Zdzislaw Pawlak (Polish Academy of Sciences) July 28 - August 1, 2003 Organized by the Research Group on Mathematical Linguistics Rovira i Virgili University PROGRAMME Monday 28 9-11 Lambek, Historical Introduction to Categorial and Pregroup Grammars 11-13 Pawlak, Sets, Fuzzy Sets and Rough Sets Tuesday 29 9-11 Lambek, Simple English Sentences and Chomskyan Traces 11-13 Pawlak, Logic (Deductive, Inductive and Common Sense) and Rough Sets Wednesday 30 9-11 Lambek, Verbs with Two Complements and Discontinuous Dependencies 11-13 Pawlak, Rough Sets: Theoretical Foundations Thursday 31 9-11 Lambek, Noun Phrases, Relative Clauses and Indirect Sentences 11-13 Pawlak, Rough Sets and Intelligent Data Analysis Friday 1 11-13 Lambek, Constraints on Transformations and Miller's Magical Number Seven 15-17 Pawlak, Rough Sets and Conflict Analysis Place: Classroom 1201 School of Arts and Chemistry Rovira i Virgili University Pl. Imperial Tarraco, 1 43005 Tarragona, Spain Sponsors: Direccion General de Investigacion, Ministerio de Ciencia y Tecnologia Departament d'Universitats, Recerca i Societat de la Informacio, Generalitat de Catalunya Universitat Rovira i Virgili Diputacio de Tarragona ------------------------------------------------------------------------- Message diffus� par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain�e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh�sion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:53 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:53 +0200 Subject: Conf: 3emes Journees de la Linguistique de Corpus Message-ID: APPEL A PARTICIPATION 3èmes Journées de la Linguistique de Corpus Les 3èmes Journées de linguistique de corpus auront lieu à Lorient les 11, 12 et 13 septembre 2003. Elles sont organisées par le Centre de Recherche en Littérature, Linguistique Civilisations (CRELLIC - UBS Lorient) avec la collaboration du laboratoire Valoria (UBS Vannes). Elles sont également soutenues par les Départements LEA et LLCE de l'Université de Bretagne Sud. Informations Pratiques : Inscriptions, etc. - http://www.univ-ubs.fr/crellic/corpusinfo.htm Objectifs : Ces 3èmes Journées de Linguistique de Corpus visent à promouvoir le développement de la linguistique de corpus en France. Elles réunissent des chercheurs venus d'horizons divers qui s'intéressent à l'utilisation de l'informatique pour l'analyse des faits de langues. Les contributions attendues pourront concerner, sans exclusive : a.. la lexicologie et la lexicographie, mono~ et bilingues, b.. la lexicométrie, c.. la terminologie d.. la traductologie, e.. la linguistique appliquée, f.. la description linguistique, g.. . Programme : Le programme sera en bientôt en ligne et incluera des interventions de Lou Burnard (Université d'Oxford) sur X/Sara : un moteur de recherche pour les corpus balisés en XML, John Humbley (Université de Paris III) sur la terminologie et l'enseignement des langues de spécialités et Etienne Brunet (Université de Nice) sur ce que l'étude des textes peut nous apprendre sur l'affaire Corneille/Molière. Organisation : Les journées prendront la forme de communications orales d'une vingtaine de minutes sur des travaux en cours. L'ensemble des communications donnera lieu à publication sous forme d'actes. Comité d'organisation : Président : Geoffrey Williams, CRELLIC etUniversité de Bretagne Sud, Lorient Jean-Yves Antoine, Université de Bretagne Sud, Vannes Nathalie Gasiglia, Silex, UMR 8528 du CNRS et Université Lille III Christopher Gledhill, Université de Strasbourg Thomas Lebarbé, Université de Caen Isabelle Léglise, Université de Tours Jean Peeters, Université de Bretagne Sud, Lorient Christophe Ropers, Université de Bretagne Sud, Lorient Claude Sionis, Université de La Rochelle Comité scientifique : Pierre Arnaud, Professeur. CRTT, Université Lyon II. Claire Blanche-Benveniste, Professeur Emérite. GARS, Université d'Aix en Provence. Thierry Fontenelle, Dr. Microsoft Corporation, US et Président d'EURALEX. Mats Forsgren, Professeur. Université de Stockholm, Suède. Sylviane Granger, Professeur. Université Catholique de Louvain, Belgique. François Rastier, Directeur de recherche. (UMR 7114 CNRS-Paris X) UMR 7114 du CNRS et Université Paris X. John Sinclair, Professeur Emérite, Université de Birmingham, Royaume Uni, Directeur Tuscan Word Centre, Italie. Wolfgang Teubert, Professeur. Université de Birmingham, Royaume Uni. Elena Tognini-Bonelli. Dr. Université de Siena, Italie. Marc Van Campenhoudt Professor Professeur. Institut supérieur de traducteurs et interprètes (ISTI) Bruxelles, Belgique Renseignements : Pour plus de renseignements, s'adresser à: Geoffrey.Williams at univ-ubs.fr ou le site WWW de la conférence : http://www.univ-ubs.fr/crellic/corpusinfo.htm ENGLISH SUMMARY This conference is the third in a series started in 2003 and aims to bring together researchers working with electronic corpora and lexical resources in France or in the French Language. It is aimed principally at those working in teaching, translating, lexicography and applied linguistics. The language of the workshop will be French, all submissions must be in this language, whatever the language under study. ------------------------------------------------------------------------- Message diffusé par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrainée par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhésion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Fri Jul 18 15:00:38 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Fri, 18 Jul 2003 17:00:38 +0200 Subject: Appel: Regards croises sur l'unite texte Message-ID: Appel à communication / Call for papers - Colloque international / International Conference Regards croisés sur l'unité texte Organisé à l'Université de Chypre 18, 19 et 20 mars 2004 Date limite (propositions de contribution) : 30 septembre 2003 Contacts D. Klingler : dominique.klingler at tiscali.fr (ILPGA, Paris III, France), S. Porhiel : sylvieporhiel at ucy.ac.cy (Université de Chypre, Chypre) Appel à contribution Au quotidien, on ne peut éviter les textes. Nous les côtoyons régulièrement et ils jouent un rôle prépondérant à différents niveaux : tout à chacun produit des textes, les comprends/déchiffre et les perçoit par mode d'affichage ou par voie orale. Le texte peut être considéré comme une unité globale de production verbale (écrite ou orale) dont l'émergence est tributaire d'activités mentales, et qui véhicule une information organisée en vue d'un destinataire. En tant qu'occurrence communicative, le texte présente un ensemble de phrases unies par un réseau de relations que nous sommes susceptibles d'interpréter, de comprendre, de produire : ceci est lié à la capacité de tout à chacun à distinguer ce qui est cohérent de ce qui ne l'est pas. En effet, si des relations existent entre les phrases successives (cohérence locale), d'autres interviennent entre différentes parties du texte (cohérence globale). Et c'est l'interaction entre ces deux types de relation qui permet d'accéder au sens du texte, de même que c'est la capacité à mettre en 'uvre des procédures engendrant de telles relations qui est à l'origine de la production textuelle et de son efficacité communicative. On admet, quelle que soit la théorie syntaxique à laquelle on adhère, que des contraintes rectionnelles et positionnelles pèsent sur la phrase, en nombre fini. Or, sorti des limites de ce système on entre dans le texte dont le dispositif obéit à des principes organisationnels qui n'ont rien à voir avec la syntaxe. Il est alors légitime de se demander comment on passe d'empans courts (dont la phrase est l'exemple le plus représentatif) à des empans plus larges, et quels processus cognitifs sont mis en 'uvre lors de ces différents passages, quelles marques linguistiques codent les relations de cohérence. C'est l'objectif de ce colloque qui voudrait croiser des regards interdisciplinaires sur le texte pour l'éclairer tant en interprétation/compréhension qu'en production. L'orientation prise par ce colloque est donc de croiser les points de vue et de confronter comment la linguistique, la psycholinguistique mais aussi le Traitement Automatique des Langues Naturelles qui utilise les résultats d'analyses linguistiques, se situent par rapport au texte et l'expliquent. Nous invitons les auteurs à - soumettre des propositions de communication qui s'articuleront aux thématiques du colloque ; - soumettre des travaux ayant pour objet le texte et qui n'auront pas été publiés ; - envisager le texte sous divers points de vue qui pourront être éventuellement croisés ; - présenter des outils méthodologiques solides, des hypothèses, des perspectives d'ouverture et des résultats en l'état. Langues du colloque : français et anglais Comité scientifique Bruce Fraser (School of Education, Boston University, USA) Daniel Gaonac'h (Laboratoire Langage et Cognition, Université de Poitiers - CNRS, France) László Hunyadi (University of Debrecen, Hongrie) Jean-Marie Pierrel (ATILF(Analyse et Traitement Informatique de la Langue Française), CNRS-Université de Nancy, France) Tamás Varadi (Linguistic Institute, Hungarian Academy of Sciences, Hongrie) (En cours de constitution) Les propositions de contribution devront nous parvenir à la date limite du 30 septembre 2003 comporteront, sur une page séparée, les éléments suivants : - Nom, prénom - Affiliation - Adresse - Téléphone - Fax - Adresse électronique Le titre de la proposition de contribution - seront de deux pages maximum (notes et bibliographie comprises) - seront anonymes - seront de préférence en français mais les propositions en anglais seront également acceptées - et seront à envoyer, en attachement, par courrier électronique, au format WORD .rtf, aux deux organisatrices, sylvieporhiel at ucy.ac.cy et dominique.klingler at tiscali.fr, en précisant dans l'objet : " Regards croisés sur l'unité texte ". Si vous ne pouviez soumettre votre proposition de contribution par courrier électronique, merci de contacter les organisatrices. Conférenciers invités : Michel Charolles (Université de Paris III, équipe LaTTiCe (Langues, Textes, Traitements Informatiques et Cognition), France) Liesbeth Degand (Université catholique de Louvain, Belgique) Jean-Luc Minel (CNRS, LaLLIC (Langage, Logique, Informatique, Cognition et Communication), France) Calendrier date limite d'envoi des propositions de contribution : 30 septembre 2003 notification aux auteurs : 30 novembre 2003 dates de la conférence : 18, 19 et 20 mars 2004 Information complémentaire : Les organisatrices diffuseront ultérieurement une seconde note d'information qui précisera les conditions matérielles du colloque. §§§§§§§§§§§§§§§§§§§§§§§§§ Conjoint perspectives on the text Organized at the University of Cyprus 18th, 19th and 20th March 2004 Deadline (abstracts): 30th September 2003 Contacts D. Klingler : dominique.klingler at tiscali.fr (ILPGA, Paris III, France), S. Porhiel : sylvieporhiel at ucy.ac.cy (University of Cyprus, Cyprus) Call for papers On an everyday basis it is impossible to escape texts. We deal with them regularly and they play an important role at different levels: everybody produce texts, understand/decode and appreciate them either posted or verbally. One can consider that the text is a global unit of verbal production (written or spoken), the emergence of which is based on mental activities. Such a production also conveys organized information aimed at an addressee. As a communicative occurrence, the text is a set of sentences linked by a network of relations we are liable to interpret, to understand and to produce: this is linked to everybody's capacity to distinguish between what is coherent and what is not. Indeed, if there exist relations between adjacent sentences (local coherence), they also intervene between other parts of the text (global coherence). It is this particular interaction between two types of relation that makes it possible to access the meaning of the text. Likewise it is our ability to set on procedures creating such relations that prompts textual production and assures its communicative efficiency. Whatever the syntactic theory considered, a finished set of relational and positional constraints weigh on the sentence. And yet, beyond the phrasal system we enter the textual system, the organisational principles of which have nothing to do with syntax. One can then legitimately wonder how one goes from short spans (the sentence being the most representative example) to wider spans, and what cognitive processes come into play during such transitions, what linguistic markers code the coherence relations. Such is the aim of this conference with a view to conjoining interdisciplinary perspectives about the text regarding its interpretation/comprehension and production. The direction of this conference is then to conjunct points of view and to compare how linguistics, psycholinguistics but also Natural Language Automatic Treatment that uses the outcomes of linguistic analyses, consider the text and deal with it. We invite authors to: submit abstracts taking into consideration the topics of the conference; submit research that will have the text as object and will not have been published; envisage the text from perspectives that can be diverse and possibly conjoint; present robust methodological tools, hypotheses, opening perspectives and present results. Languages of the conference: French and English Scientific committee: Bruce Fraser (School of Education, Boston University, USA) Daniel Gaonac'h (Laboratoire Langage et Cognition, Université de Poitiers - CNRS, France) László Hunyadi (University of Debrecen, Hungary) Jean-Marie Pierrel (ATILF(Analyse et Traitement Informatique de la Langue Française), CNRS-Université de Nancy, France) Tamás Varadi (Linguistic Institute, Hungarian Academy of Sciences, Hungary) (Being constituted) Abstract will have to be sent by 30th September 2003 will state on a separate page: Your name and surname Affiliation Adress Phone number Fax E-mail address Title of abstract should be limited to two pages in Times New Roman, font 12 (notes references included) will be anonymous will be preferably in French, however English abstracts are also accepted will be sent, as an attachment via e-mail in rtf WORD format, to the two organisers, sylvieporhiel at ucy.ac.cy and dominique.klingler at tiscali.fr, specifying 'Conjoint/conjunct perspectives on the text' in the subject line. If, for any reason, you are unable to submit the abstract by e-mail, please contact the organizers. Invited speakers Michel Charolles (University of Paris III, team LaTTiCe (Langues, Textes, Traitements Informatiques et Cognition), France) Liesbeth Degand (Université catholique de Louvain, Belgium) Jean-Luc Minel (CNRS, LaLLIC (Langage, Logique, Informatique, Cognition et Communication), France) Important deadlines deadline for submitting abstracts: 30th September 2003 Notification of acceptance to authors: 30th November 2003 Dates of the conference: 18th, 19th and 20th March 2004 *********************************************************** Sylvie Porhiel Université de Chypre 12 Aglantjas avenue Building Athina, 2nd Floor 1078 NICOSIA CYPRUS Tél. (+357) 22 33 50 77, poste 18 sylvieporhiel at ucy.ac.cy sylvieporhiel at hotmail.com ------------------------------------------------------------------------- Message diffusé par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrainée par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhésion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Fri Jul 18 15:00:42 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Fri, 18 Jul 2003 17:00:42 +0200 Subject: ATALA: journee d'etude 22/11 : Le role de la typographie et de la ponctuation dans le TAL Message-ID: (Veuillez nous excuser pour les réceptions multiples) ---------------------------------------------------------------------------- (English version below) -------------------------------------------- JOURNEES d'étude de l'ATALA APPEL A COMMUNICATION ************************************** 22 novembre 2003 ENST, 46, rue Barrault (49, rue Vergnault), 75013 Paris Titre : Le rôle de la typographie et de la ponctuation dans le traitement automatique des langues (segmentation de textes, prosodie, analyse syntaxique, filtrage d'informations, codage dans des systèmes multilingues, etc.) Organisée par Ghassan Mourad & Jean-Pierre Desclés Laboratoire : LaLICC (UMR 8139 Paris-Sorbonne / CNRS) Objectif : Même si elles ne constituent toujours pas un savoir enseigné à part entière, peut-on encore nier le rôle de la ponctuation et de la typographie, tant sut le plan de la lecture que sur le plan de l'écriture ' Ceci est d'autant plus vrai concernant le traitement automatique de langues, domaine où la ponctuation tient une place majeure. Les signes typographiques et de ponctuation sont des « baliseurs naturels » de l'information, mais aussi, des indicateurs sur lesquels devrait désormais s'appuyer la plupart des traitements automatiques (syntaxiques, sémantiques, prosodique, extracteurs d'information, etc.). Concernant ces derniers, il est important de cadrer et d'étudier tout les problèmes qui surgissent dans la phase de traitement automatique multilingue, multiécriture et multicodage. L'objectif de cette journée de l'ATALA est de faire le point sur l'état actuel des recherches concernant les problématiques de la ponctuation, de la typographie, du codage et du transcodage en linguistique et dans le traitement automatique ; et de présenter les travaux déjà réalises dans ce domaine, ou les travaux y contribuant directement. Problématique : L'ingénierie linguistique et le TAL sont confrontés à de nouveaux problèmes. En effet, il est maintenant nécessaire de travailler non plus seulement sur des phrases ou des énoncés isolés mais sur des textes entiers, formatés ou non formatés, par exemple sur des textes rapatriés du Web ou encore sur des textes extraits de grandes bases de documents stockés dans des entreprises ou des administrations, sur des encyclopédies ou même sur des articles de dictionnaire. De plus, les textes disponibles ne sont pas tous numérisés et encore moins balisés. Or , effectuer un traitement automatique de documents textuels impose des opérations préalables aux analyses syntaxiques, sémantiques et pragmatiques. En particulier, chaque texte possède deux structures : une structure formelle et une structure discursive. La première structuration conditionne la seconde. La structure formelle est déjà porteuse d'une certaine intentionnalité signifiante ; elle est le résultat d'un codage dans un système typographique et celui d'une mise en texte. Le traitement préalable d'un texte doit exploiter cette structuration formelle (repérage des titres et sous titres ; découpage d'un texte en paragraphes, énoncés, phrases, propositions, mots ; repérage des citations ; identification des énumérations ; prise en compte des ordres dispositionnels dans les textes ; repérage des images, diagrammes, légendes, encadrés ') avant de procéder aux opérations ultérieures et à l'exploitation de la structuration discursive (identification des cadres temporels, spatiaux, thématiques ; des relations causales, définitoires, temporelles ' ; des relations entre concepts, termes, événements ; des liens anaphoriques ; des prises en charge énonciatives '). Sans la maîtrise complète de l'exploitation de la structure formelle, aucun traitement automatique des textes ne sera vraiment opérationnel. Evidemment, ce problème ne se posait pas encore lorsque l'on travaillait uniquement sur des phrases isolées. Mais, pour l'analyse sémantique des textes, il faut être capable de le segmenter en des unités linguistiques qui sont supérieures et inférieures à la phrase normative, en prenant en compte des marques sémiotiques clairement et formellement identifiables par une machine. Ainsi, la ponctuation et tous les indices typographiques restent les éléments les plus pertinents car ils sont susceptibles de fournir des indications précises pour segmenter et structurer formellement les textes, ces indications étant aux fondements mêmes d'une véritable linguistique textuelle automatisable. En schématisant, on peut distinguer trois types d'approche de la segmentation : (a) approches numériques (réseaux neuronaux, N-grammes, chaînes de Markov ') ; (b) approches par automates finis et expressions régulières (exemple : INTEX) ; (c) approches par exploration contextuelle autour des marqueurs de ponctuation (exemple : SegATex). Les traités classiques sur la ponctuation sont en général normatifs et ils ne permettent donc pas une formulation de règles précises permettant de réaliser une segmentation automatique. De plus, ces traités n'ont pas assez dégagé des analyses sémantiques de marqueurs hautement polysémiques comme la virgule, le point-virgule, le deux-point, les tirets, les parenthèses, les guillemets, le point' Pourtant, ces marqueurs jouent un rôle très important dans la structuration sémantique ; leur analyse permet d'améliorer les processus de segmentation et la structuration discursive des textes. Les outils de traitement des textes offrent d'énormes possibilités pour des variations typographiques afin de souligner la mise en relief d'un terme pour citer, pour exemplifier, ou encore pour désambiguïser une expression' ; comme l'a dit Ch. Gouriou : « A tout problème que pose la transcription de la pensée, la typographie se doit d'apporter au moins une solution ; elle en offre plusieurs dès que l'on la sollicite de faire valoir des nuances ou des subtilités ». Cependant, l'intégration qu'il convient d'attribuer à ces variations n'est pas uniforme et dépend d'autres éléments contextuels (ponctuationnels et typographiques) ; par exemple, une expression mise en italique n'a pas la même valeur selon qu'elle est entre guillemets ou en majuscules . C'est en fait un conglomérat d'indices typographiques, variables de textes à textes, qui fixe la valeur d'une occurrence de changement typographique. Le traitement automatique, lorsqu'il prend pour objet des textes réels, se doit de résoudre ces problèmes, à la fois linguistiques et informatiques. Thèmes : Les problèmes (liste non-exhaustive) qui pourraient être abordés lors de cette journée seront, entre autres : - segmentation formelle du texte ; - segmentation discursive du texte à partir des marques de ponctuation et de typographie (par exemple la sémantique de la disposition spatiale) ; - architecture textuelle ; - rôle de la ponctuation - en particulier, la virgule - dans une analyse syntaxique ; - contribution de la ponctuation dans le codage de la prosodie et contribution de la typographie au codage de l'intonation' ; - contribution de la ponctuation pour l'identification des noms propres, des mots composés, des sigles et des abréviations, des références bibliographiques, des citations, des renvois aux notes' ; - comparaison des différents systèmes de ponctuation et de typographie dans différents systèmes linguistiques (arabe, chinois, japonais ') ; - problème de codage, du transcodage et du multicodage de différents systèmes linguistiques dans une approche multilingue des textes. - '. Modalités : Nous demandons aux auteurs de préciser si leur soumission : 1) concerne des travaux en cours, ou des prises de position; 2) des travaux aboutis du point de vue théorique ou appliqué. Soumission (modalités) Un résumé de 2 à 4 pages doit être envoyé avant le 30 septembre 2003 par courrier électronique en format text, .rtf, .doc ou .pdf à : Ghassan.Mourad at paris4.sorbonne.fr Et Jean-Pierre.Descles at paris4.sorbonne.fr Les notifications d'acceptation seront données pour le 20 octobre 2003. **************************************************************************************** English version ----------------------- ATALA Workshop Conference call ************************************** 22 novembre 2003 ENST, 46, rue Barrault (49, rue Vergnault), 75013 Paris **************************************************** Title : Role of typography and punctuation in natural language processing (texts segmentation, prosody, syntactical analysis, information retrieval, coding in multilingual systems,') Organisation : Ghassan Mourad & Jean-Pierre Desclés Laboratory : LaLICC (UMR 8139 Paris-Sorbonne / CNRS) Objective: Even though punctuation and typography are not seen as teaching knowledge, we can hardly deny their role in reading and writing. This is also true for natural language processing, where punctuation plays an important role. Typographical and punctuation signs are 'natural tags' of information, and indicators on which most of the processing should rely. It is essential to tally and study all issues in the multilingual, multiwriting, and multicoding processing phases. The ATALA workshop is particularly concerned with current research on punctuation, typography, coding and transcribing issues in linguistics and language processing; and with work that already exists in this restricted domain or directly related to. Issues: Linguistic engineering and language processing is confronted with new issues. Indeed, it is now necessary to work not only on isolated sentences or utterances, but on entire structured or unstructured texts too; for example, texts from the Internet or from document-bases stored by companies or administrations, encyclopaedias or even dictionary articles. Moreover, texts are rarely tagged or digitised. However, text processing requires pre-processing in order to conduct syntactical, semantic and pragmatic analysis. In particular, each text has two structures: formal and discursive. The later depends on the earlier. The formal structure expresses a certain meaning intentionality; it results from the coding in a typographical system and from 'text-setting' or text layout. The pre-processing of a text must exploit the formal structure (titles and sub-titles localisation; text fragmentation in sentences, paragraphs, utterances, propositions, words; quotation identification; item list identification; spatial disposition consideration; images, diagrams, captions, boxes localisation....), before executing other tasks, or exploiting the discursive structure (temporal, spatial, topic, event frames identification; relations between concepts, terms, events; anaphoric links; enunciative phenomena'). Without complete control of the exploitation of formal structure, text processing will not really be operational. Obviously, this issue did not appear when we worked only on isolated sentences. However, for semantic analysis, text must segmented into linguistic units that are superior or inferior to the normative sentences, by taking into account semiotic marks clearly and formally known by the computer. Punctuation and all typographic signs (index) are still the most relevant elements, since they can provide sharp indications for formal text segmentation and structuring; these indications being the foundation of automatic textual linguistics. We can distinguish between three types of approaches for segmentation: (a) Digital approaches (neuronal nets, N-grams, Markov model'); (b) Finite automata and regular expressions approaches (for instance INTEX); (c) Contextual exploration approaches based on punctuation marks (for instance SegATex). Traditional theories (treaties, handbooks) of punctuation generally are normative and do not allow the expression of precise rules that could lead to automatic segmentation. Furthermore, these treaties did not consider semantic analysis of highly polysemous marks like comma, semicolon, colon, dash, parenthesises, ... However, marks play a very important role in semantic structuring; their analysis allow to improve segmentation process and text discursive structuring. Text processing tools offer enormous potentialities for typographic variations; for example highlighting a term being quoted, exemplify, or disambiguate an expression'; Quoting Ch. Gouriou : « A tout problème que pose la transcription de la pensée, la typographie se doit d'apporter au moins une solution ; elle en offre plusieurs dès que l'on la sollicite de faire valoir des nuances ou des subtilité ». However, the integration to be granted to these variations is not regular and depends on other contextual (typographic and punctuation) elements; for example, an italicized expression does not have the same value (meaning) according to the fact that it is capitalized or between quoting marks. It is indeed a conglomerate of typographic marks, variable from text to text, which gives the value of an occurrence of typographic change. Text processing must resolve these linguistic and computational issues. Theme: Submission can also Discuss/tackle cross-domain topics in relation to: - Formal segmentation of text, - Text discursive segmentation based on punctuation and typography marks, - 'Textual architecture', - The role of the punctuation -particularly, the comma- in a syntactic analysis, - Contribution of the punctuation for the coding of the prosody and contribution of typography for the coding of intonation, - Contribution of the punctuation for the identification of proper names, compound words, abbreviations, initials, ' - Comparison between punctuation in various linguistic systems (Arab, Chinese'), - Coding and transcribing issues in various linguistics systems, - ? Modalities : Submission : a 2-4 page summary. We ask authors to indicate if their submission: - present in-progress work or is a position paper; - present theoretical or applied completed work. A 2-4-page summary must be sent before 30 September 2003 by e-mail in text, .rtf, .doc or .pdf to: Ghassan.Mourad at paris4.sorbonne.fr and Jean-Pierre.Descles at paris4.sorbonne.fr Acceptance notifications will be sent for 20 October 2003. ******************************************************************************** Ghassan Mourad ISHA, Paris - Sorbonne Laboratoire LaLICC (Langage, Logique, Informatique, Cognition et Communication) (UMR 8139 Paris-Sorbonne / CNRS) 96, Bd Raspail http://www.lalic.paris4.sorbonne.fr/ 75006 Paris France tél : 01 44 39 35 90 fax : 01 44 39 35 91 ------------------------------------------------------------------------- Message diffusé par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrainée par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhésion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Fri Jul 18 15:01:26 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Fri, 18 Jul 2003 17:01:26 +0200 Subject: interruption de la liste LN Message-ID: Bonjour, La diffusion sur la liste LN est suspendue à partir d'aujourd'hui, elle reprendra début septembre. Bonnes vacances pour ceux qui en prennent et bon travail pour les autres. Alexis Nasr ------------------------------------------------------------------------- Message diffusé par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrainée par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adhésion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:31 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:31 +0200 Subject: Appel: COLING 2004 Message-ID: PRELIMINARY ANNOUNCEMENT: COLING 2004 The 20th International Conference on Computational Linguistics University of Geneva, Switzerland -- August 23-27, 2004 We are pleased to announce that COLING 2004 will take place at the University of Geneva, Switzerland, on August 23-27, 2004 (main conference dates), together with satellite events before and after the main conference. Information about submission, registration and venue will be posted in due time at the URL below. The head of the program committee for COLING 2004 is Prof. Sergei Nirenburg (University of Maryland Baltimore County), and the head of the organizing committee is Prof. Margaret King (University of Geneva). Important dates * deadline for submission of papers: March 26, 2004 * notification of acceptance: May 14, 2004 * deadline for workshop and tutorial proposals: December 15, 2003 * workshop and tutorial notification: January 16, 2004 URL for local organization * http://www.issco.unige.ch/coling2004/ ------------------------------------------------------------------- ------------------------------------------------------------------------- Message diffus? par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain?e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh?sion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:27 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:27 +0200 Subject: Appel: JEP 2004 - TALN 2004 Message-ID: ********************************************************************** J E P 2 0 0 4 - T A L N 2 0 0 4 Journ?es d'Etude sur la Parole 2004 & Traitement Automatique du Langage Naturel 2004 --- Palais de Congr?s F?s (Maroc) du 19 au 22 avril 2004 http://www.lpl.univ-aix.fr/jep-taln04/ ********************************************************************** (English version below) Les conf?rences JEP 2004 (Journ?es d'Etude sur la Parole) et TALN 2004 (Traitement Automatique du Langage Naturel) auront lieu en conjonction ? F?s, au Maroc, du 19 au 22 avril 2004. Elles sont plac?es sous l'?gide de l'Association Francophone de la Communication Parl?e (AFCP) et de l'Association pour le traitement automatique des langues (ATALA). Toutes les informations relatives aux deux conf?rences, les appels ? communication, et les renseignements pratiques, seront bient?t accessibles sur le site : http://www.lpl.univ-aix.fr/jep-taln04/ JEP-TALN'04 est organis?e par : . le Laboratoire Parole et Langage, Aix-en Provence (France) . l'Universit? de F?s (Maroc) . l'Ecole Normale Sup?rieure de F?s (Maroc) --------------------------------------------------------------------- The JEP 2004 (Journ?es d'Etude sur la Parole) and TALN 2004 (Traitement Automatique du Langage Naturel) conferences will be held in conjunction in Fez, Morocco, from 19 to 22 April 2004, under the aegis of the Association Francophone de la Communication Parl?e (AFCP) and of the Association pour le Traitement Automatique des Langues (ATALA). A complete presentation of the two conferences, along with calls for communication and practical information, will soon be available at the following URL: http://www.lpl.univ-aix.fr/jep-taln04/ JEP-TALN'04 is organized by : . the Laboratoire Parole et Langage, Aix-en Provence (France) . the University of F?s (Morocco) . the Ecole Normale Sup?rieure of Fez (Morocco) ------------------------------------------------------------------------- Message diffus? par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain?e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh?sion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:39 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:39 +0200 Subject: Appel: PROSPECTS AND ADVANCES IN THE SYNTAX/SEMANTICS INTERFACE Message-ID: ====================================================================== PROSPECTS AND ADVANCES IN THE SYNTAX/SEMANTICS INTERFACE Lorraine-Saarland Workshop Series Nancy, October 20-21 2003 Deadline for abstracts, demos: August 31 2003 ====================================================================== In the context of the Lorraine-Saarland Workshop Series, we are organizing a workshop entitled "Prospects and advances in the syntax/semantics interface". The workshop series is a joint initiative of LORIA (Nancy) and MPI (Saarbr?cken). The workshop itself will take place in Nancy, October 20-21 2003. http://www.loria.fr/~duchier/Lorraine-Saarland/index.html Both in Lorraine and in the Saarland, considerable interest and active research efforts have started to gravitate around the syntax/semantics interface. Our objective with this workshop is to bring together the many researchers who are involved in these efforts, to report on e.g. formal, computational, and empirical issues, to increase mutual awareness and improve lines of communication, and to foster collaboration on the integration of computational semantics into grammar frameworks. (while there is a certain regional bias in this workshop, we welcome submissions from anywhere). The idea is to construct the workshop program around presentations (on the basis of reviewed papers), a panel discussion, and a session of informal demos. Authors are invited to submit 4-page extended abstracts (for presentation), 1-page position papers for the panel, and 3-page abstracts for demos. IMPORTANT: Please inform us of your _intent_ to participate as early as possible (by emailing to lorraine-saarland at ps.uni-sb.de) PAPERS We welcome submissions on all aspects of the syntax/semantics interface, including formal, computational and empirical issues, as well as on applications. We are particularly keen on recent developments, work in progress, and prospective projects, in other words, all contributions which may serve to increase the mutual awareness of on-going research and to encourage the formation of joint research efforts. Merely as a suggestion, we provide here a non-exhaustive list of possible topics: formalisms: - grammatical and metagrammatical formalisms - constraint formalisms computational issues (processing, algorithms, constraints): - processing tree descriptions computational semantics - application of the syntax/semantics interface in the service of computational semantics corpus-based and empirical research: - semantics annotations - learning - preferences - statistical methods, robustness PANEL DISCUSSION Our theme is: "description, processing and integration of multiple sources of information in the modeling and computational analysis of natural language". We are especially interested in the integrative aspect of this enterprise which not only touches on all aspects of computational linguistics, but also reaches across the border into other areas such as ontologies and the semantic web. IMPORTANT DATES - Deadline for submissions: August 31, 2003 - Notification of acceptance: September 19, 2003 - Workshop: October 20-21, 2003 LOCAL ARRANGEMENTS There will be no registration fee, and we will provide proceedings, lunch, and coffee breaks. However, due to the strong local character of the workshop, everyone should make their own arrangements for accommodations (although, if you need help, please email to lorraine-saarland at ps.uni-sb.de). We will also organize a dinner at a restaurant on the evening of Day 1 for those interested. PROGRAM Day 1 10:00 Start/Paper session (5 papers) 12:30 Lunch 14:30 Panel discussion 16:00 Tea/coffee break 16:30 Paper session (2 papers) 17:30 End/Dinner Day 2 09:30 Start/Paper session (3 papers) 11:00 Tea/Coffee break 11:30 Paper session (2 papers) 12:30 Lunch 14:30 Demos 16:30 Final wrap-up of workshop 17:00 End PROGRAM COMMITTEE Carlos Areces (LORIA, Nancy) Patrick Blackburn (LORIA, Nancy) Paul Buitelaar (DFKI, Saarbr?cken) Denys Duchier (LORIA, Nancy; Chair) Philippe de Groote (LORIA, Nancy) Valia Kordoni (COLI, Saarbr?cken) Geert-Jan Kruijff (COLI, Saarbr?cken; Chair) Guy Perrier (LORIA, Nancy) Manfred Pinkal (COLI, Saarbr?cken) Hans Uszkoreit (COLI/DFKI, Saarbr?cken) -- Denys Duchier - ?quipe Calligramme - LORIA, Nancy, France ------------------------------------------------------------------------- Message diffus? par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain?e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh?sion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:49 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:49 +0200 Subject: Conf: XVIII Tarragona Seminar on Formal Syntax and Semantics Message-ID: ALGEBRAIC GRAMMAR AND ROUGH SET THEORY (XVIII Tarragona Seminar on Formal Syntax and Semantics, FS&S) Joachim Lambek (McGill University) Zdzislaw Pawlak (Polish Academy of Sciences) July 28 - August 1, 2003 Organized by the Research Group on Mathematical Linguistics Rovira i Virgili University PROGRAMME Monday 28 9-11 Lambek, Historical Introduction to Categorial and Pregroup Grammars 11-13 Pawlak, Sets, Fuzzy Sets and Rough Sets Tuesday 29 9-11 Lambek, Simple English Sentences and Chomskyan Traces 11-13 Pawlak, Logic (Deductive, Inductive and Common Sense) and Rough Sets Wednesday 30 9-11 Lambek, Verbs with Two Complements and Discontinuous Dependencies 11-13 Pawlak, Rough Sets: Theoretical Foundations Thursday 31 9-11 Lambek, Noun Phrases, Relative Clauses and Indirect Sentences 11-13 Pawlak, Rough Sets and Intelligent Data Analysis Friday 1 11-13 Lambek, Constraints on Transformations and Miller's Magical Number Seven 15-17 Pawlak, Rough Sets and Conflict Analysis Place: Classroom 1201 School of Arts and Chemistry Rovira i Virgili University Pl. Imperial Tarraco, 1 43005 Tarragona, Spain Sponsors: Direccion General de Investigacion, Ministerio de Ciencia y Tecnologia Departament d'Universitats, Recerca i Societat de la Informacio, Generalitat de Catalunya Universitat Rovira i Virgili Diputacio de Tarragona ------------------------------------------------------------------------- Message diffus? par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain?e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh?sion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Tue Jul 15 07:34:53 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Tue, 15 Jul 2003 09:34:53 +0200 Subject: Conf: 3emes Journees de la Linguistique de Corpus Message-ID: APPEL A PARTICIPATION 3?mes Journ?es de la Linguistique de Corpus Les 3?mes Journ?es de linguistique de corpus auront lieu ? Lorient les 11, 12 et 13 septembre 2003. Elles sont organis?es par le Centre de Recherche en Litt?rature, Linguistique Civilisations (CRELLIC - UBS Lorient) avec la collaboration du laboratoire Valoria (UBS Vannes). Elles sont ?galement soutenues par les D?partements LEA et LLCE de l'Universit? de Bretagne Sud. Informations Pratiques : Inscriptions, etc. - http://www.univ-ubs.fr/crellic/corpusinfo.htm Objectifs : Ces 3?mes Journ?es de Linguistique de Corpus visent ? promouvoir le d?veloppement de la linguistique de corpus en France. Elles r?unissent des chercheurs venus d'horizons divers qui s'int?ressent ? l'utilisation de l'informatique pour l'analyse des faits de langues. Les contributions attendues pourront concerner, sans exclusive : a.. la lexicologie et la lexicographie, mono~ et bilingues, b.. la lexicom?trie, c.. la terminologie d.. la traductologie, e.. la linguistique appliqu?e, f.. la description linguistique, g.. . Programme : Le programme sera en bient?t en ligne et incluera des interventions de Lou Burnard (Universit? d'Oxford) sur X/Sara : un moteur de recherche pour les corpus balis?s en XML, John Humbley (Universit? de Paris III) sur la terminologie et l'enseignement des langues de sp?cialit?s et Etienne Brunet (Universit? de Nice) sur ce que l'?tude des textes peut nous apprendre sur l'affaire Corneille/Moli?re. Organisation : Les journ?es prendront la forme de communications orales d'une vingtaine de minutes sur des travaux en cours. L'ensemble des communications donnera lieu ? publication sous forme d'actes. Comit? d'organisation : Pr?sident : Geoffrey Williams, CRELLIC etUniversit? de Bretagne Sud, Lorient Jean-Yves Antoine, Universit? de Bretagne Sud, Vannes Nathalie Gasiglia, Silex, UMR 8528 du CNRS et Universit? Lille III Christopher Gledhill, Universit? de Strasbourg Thomas Lebarb?, Universit? de Caen Isabelle L?glise, Universit? de Tours Jean Peeters, Universit? de Bretagne Sud, Lorient Christophe Ropers, Universit? de Bretagne Sud, Lorient Claude Sionis, Universit? de La Rochelle Comit? scientifique : Pierre Arnaud, Professeur. CRTT, Universit? Lyon II. Claire Blanche-Benveniste, Professeur Em?rite. GARS, Universit? d'Aix en Provence. Thierry Fontenelle, Dr. Microsoft Corporation, US et Pr?sident d'EURALEX. Mats Forsgren, Professeur. Universit? de Stockholm, Su?de. Sylviane Granger, Professeur. Universit? Catholique de Louvain, Belgique. Fran?ois Rastier, Directeur de recherche. (UMR 7114 CNRS-Paris X) UMR 7114 du CNRS et Universit? Paris X. John Sinclair, Professeur Em?rite, Universit? de Birmingham, Royaume Uni, Directeur Tuscan Word Centre, Italie. Wolfgang Teubert, Professeur. Universit? de Birmingham, Royaume Uni. Elena Tognini-Bonelli. Dr. Universit? de Siena, Italie. Marc Van Campenhoudt Professor Professeur. Institut sup?rieur de traducteurs et interpr?tes (ISTI) Bruxelles, Belgique Renseignements : Pour plus de renseignements, s'adresser ?: Geoffrey.Williams at univ-ubs.fr ou le site WWW de la conf?rence : http://www.univ-ubs.fr/crellic/corpusinfo.htm ENGLISH SUMMARY This conference is the third in a series started in 2003 and aims to bring together researchers working with electronic corpora and lexical resources in France or in the French Language. It is aimed principally at those working in teaching, translating, lexicography and applied linguistics. The language of the workshop will be French, all submissions must be in this language, whatever the language under study. ------------------------------------------------------------------------- Message diffus? par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain?e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh?sion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Fri Jul 18 15:00:38 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Fri, 18 Jul 2003 17:00:38 +0200 Subject: Appel: Regards croises sur l'unite texte Message-ID: Appel ? communication / Call for papers - Colloque international / International Conference Regards crois?s sur l'unit? texte Organis? ? l'Universit? de Chypre 18, 19 et 20 mars 2004 Date limite (propositions de contribution) : 30 septembre 2003 Contacts D. Klingler : dominique.klingler at tiscali.fr (ILPGA, Paris III, France), S. Porhiel : sylvieporhiel at ucy.ac.cy (Universit? de Chypre, Chypre) Appel ? contribution Au quotidien, on ne peut ?viter les textes. Nous les c?toyons r?guli?rement et ils jouent un r?le pr?pond?rant ? diff?rents niveaux : tout ? chacun produit des textes, les comprends/d?chiffre et les per?oit par mode d'affichage ou par voie orale. Le texte peut ?tre consid?r? comme une unit? globale de production verbale (?crite ou orale) dont l'?mergence est tributaire d'activit?s mentales, et qui v?hicule une information organis?e en vue d'un destinataire. En tant qu'occurrence communicative, le texte pr?sente un ensemble de phrases unies par un r?seau de relations que nous sommes susceptibles d'interpr?ter, de comprendre, de produire : ceci est li? ? la capacit? de tout ? chacun ? distinguer ce qui est coh?rent de ce qui ne l'est pas. En effet, si des relations existent entre les phrases successives (coh?rence locale), d'autres interviennent entre diff?rentes parties du texte (coh?rence globale). Et c'est l'interaction entre ces deux types de relation qui permet d'acc?der au sens du texte, de m?me que c'est la capacit? ? mettre en 'uvre des proc?dures engendrant de telles relations qui est ? l'origine de la production textuelle et de son efficacit? communicative. On admet, quelle que soit la th?orie syntaxique ? laquelle on adh?re, que des contraintes rectionnelles et positionnelles p?sent sur la phrase, en nombre fini. Or, sorti des limites de ce syst?me on entre dans le texte dont le dispositif ob?it ? des principes organisationnels qui n'ont rien ? voir avec la syntaxe. Il est alors l?gitime de se demander comment on passe d'empans courts (dont la phrase est l'exemple le plus repr?sentatif) ? des empans plus larges, et quels processus cognitifs sont mis en 'uvre lors de ces diff?rents passages, quelles marques linguistiques codent les relations de coh?rence. C'est l'objectif de ce colloque qui voudrait croiser des regards interdisciplinaires sur le texte pour l'?clairer tant en interpr?tation/compr?hension qu'en production. L'orientation prise par ce colloque est donc de croiser les points de vue et de confronter comment la linguistique, la psycholinguistique mais aussi le Traitement Automatique des Langues Naturelles qui utilise les r?sultats d'analyses linguistiques, se situent par rapport au texte et l'expliquent. Nous invitons les auteurs ? - soumettre des propositions de communication qui s'articuleront aux th?matiques du colloque ; - soumettre des travaux ayant pour objet le texte et qui n'auront pas ?t? publi?s ; - envisager le texte sous divers points de vue qui pourront ?tre ?ventuellement crois?s ; - pr?senter des outils m?thodologiques solides, des hypoth?ses, des perspectives d'ouverture et des r?sultats en l'?tat. Langues du colloque : fran?ais et anglais Comit? scientifique Bruce Fraser (School of Education, Boston University, USA) Daniel Gaonac'h (Laboratoire Langage et Cognition, Universit? de Poitiers - CNRS, France) L?szl? Hunyadi (University of Debrecen, Hongrie) Jean-Marie Pierrel (ATILF(Analyse et Traitement Informatique de la Langue Fran?aise), CNRS-Universit? de Nancy, France) Tam?s Varadi (Linguistic Institute, Hungarian Academy of Sciences, Hongrie) (En cours de constitution) Les propositions de contribution devront nous parvenir ? la date limite du 30 septembre 2003 comporteront, sur une page s?par?e, les ?l?ments suivants : - Nom, pr?nom - Affiliation - Adresse - T?l?phone - Fax - Adresse ?lectronique Le titre de la proposition de contribution - seront de deux pages maximum (notes et bibliographie comprises) - seront anonymes - seront de pr?f?rence en fran?ais mais les propositions en anglais seront ?galement accept?es - et seront ? envoyer, en attachement, par courrier ?lectronique, au format WORD .rtf, aux deux organisatrices, sylvieporhiel at ucy.ac.cy et dominique.klingler at tiscali.fr, en pr?cisant dans l'objet : " Regards crois?s sur l'unit? texte ". Si vous ne pouviez soumettre votre proposition de contribution par courrier ?lectronique, merci de contacter les organisatrices. Conf?renciers invit?s : Michel Charolles (Universit? de Paris III, ?quipe LaTTiCe (Langues, Textes, Traitements Informatiques et Cognition), France) Liesbeth Degand (Universit? catholique de Louvain, Belgique) Jean-Luc Minel (CNRS, LaLLIC (Langage, Logique, Informatique, Cognition et Communication), France) Calendrier date limite d'envoi des propositions de contribution : 30 septembre 2003 notification aux auteurs : 30 novembre 2003 dates de la conf?rence : 18, 19 et 20 mars 2004 Information compl?mentaire : Les organisatrices diffuseront ult?rieurement une seconde note d'information qui pr?cisera les conditions mat?rielles du colloque. ????????????????????????? Conjoint perspectives on the text Organized at the University of Cyprus 18th, 19th and 20th March 2004 Deadline (abstracts): 30th September 2003 Contacts D. Klingler : dominique.klingler at tiscali.fr (ILPGA, Paris III, France), S. Porhiel : sylvieporhiel at ucy.ac.cy (University of Cyprus, Cyprus) Call for papers On an everyday basis it is impossible to escape texts. We deal with them regularly and they play an important role at different levels: everybody produce texts, understand/decode and appreciate them either posted or verbally. One can consider that the text is a global unit of verbal production (written or spoken), the emergence of which is based on mental activities. Such a production also conveys organized information aimed at an addressee. As a communicative occurrence, the text is a set of sentences linked by a network of relations we are liable to interpret, to understand and to produce: this is linked to everybody's capacity to distinguish between what is coherent and what is not. Indeed, if there exist relations between adjacent sentences (local coherence), they also intervene between other parts of the text (global coherence). It is this particular interaction between two types of relation that makes it possible to access the meaning of the text. Likewise it is our ability to set on procedures creating such relations that prompts textual production and assures its communicative efficiency. Whatever the syntactic theory considered, a finished set of relational and positional constraints weigh on the sentence. And yet, beyond the phrasal system we enter the textual system, the organisational principles of which have nothing to do with syntax. One can then legitimately wonder how one goes from short spans (the sentence being the most representative example) to wider spans, and what cognitive processes come into play during such transitions, what linguistic markers code the coherence relations. Such is the aim of this conference with a view to conjoining interdisciplinary perspectives about the text regarding its interpretation/comprehension and production. The direction of this conference is then to conjunct points of view and to compare how linguistics, psycholinguistics but also Natural Language Automatic Treatment that uses the outcomes of linguistic analyses, consider the text and deal with it. We invite authors to: submit abstracts taking into consideration the topics of the conference; submit research that will have the text as object and will not have been published; envisage the text from perspectives that can be diverse and possibly conjoint; present robust methodological tools, hypotheses, opening perspectives and present results. Languages of the conference: French and English Scientific committee: Bruce Fraser (School of Education, Boston University, USA) Daniel Gaonac'h (Laboratoire Langage et Cognition, Universit? de Poitiers - CNRS, France) L?szl? Hunyadi (University of Debrecen, Hungary) Jean-Marie Pierrel (ATILF(Analyse et Traitement Informatique de la Langue Fran?aise), CNRS-Universit? de Nancy, France) Tam?s Varadi (Linguistic Institute, Hungarian Academy of Sciences, Hungary) (Being constituted) Abstract will have to be sent by 30th September 2003 will state on a separate page: Your name and surname Affiliation Adress Phone number Fax E-mail address Title of abstract should be limited to two pages in Times New Roman, font 12 (notes references included) will be anonymous will be preferably in French, however English abstracts are also accepted will be sent, as an attachment via e-mail in rtf WORD format, to the two organisers, sylvieporhiel at ucy.ac.cy and dominique.klingler at tiscali.fr, specifying 'Conjoint/conjunct perspectives on the text' in the subject line. If, for any reason, you are unable to submit the abstract by e-mail, please contact the organizers. Invited speakers Michel Charolles (University of Paris III, team LaTTiCe (Langues, Textes, Traitements Informatiques et Cognition), France) Liesbeth Degand (Universit? catholique de Louvain, Belgium) Jean-Luc Minel (CNRS, LaLLIC (Langage, Logique, Informatique, Cognition et Communication), France) Important deadlines deadline for submitting abstracts: 30th September 2003 Notification of acceptance to authors: 30th November 2003 Dates of the conference: 18th, 19th and 20th March 2004 *********************************************************** Sylvie Porhiel Universit? de Chypre 12 Aglantjas avenue Building Athina, 2nd Floor 1078 NICOSIA CYPRUS T?l. (+357) 22 33 50 77, poste 18 sylvieporhiel at ucy.ac.cy sylvieporhiel at hotmail.com ------------------------------------------------------------------------- Message diffus? par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain?e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh?sion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Fri Jul 18 15:00:42 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Fri, 18 Jul 2003 17:00:42 +0200 Subject: ATALA: journee d'etude 22/11 : Le role de la typographie et de la ponctuation dans le TAL Message-ID: (Veuillez nous excuser pour les r?ceptions multiples) ---------------------------------------------------------------------------- (English version below) -------------------------------------------- JOURNEES d'?tude de l'ATALA APPEL A COMMUNICATION ************************************** 22 novembre 2003 ENST, 46, rue Barrault (49, rue Vergnault), 75013 Paris Titre : Le r?le de la typographie et de la ponctuation dans le traitement automatique des langues (segmentation de textes, prosodie, analyse syntaxique, filtrage d'informations, codage dans des syst?mes multilingues, etc.) Organis?e par Ghassan Mourad & Jean-Pierre Descl?s Laboratoire : LaLICC (UMR 8139 Paris-Sorbonne / CNRS) Objectif : M?me si elles ne constituent toujours pas un savoir enseign? ? part enti?re, peut-on encore nier le r?le de la ponctuation et de la typographie, tant sut le plan de la lecture que sur le plan de l'?criture ' Ceci est d'autant plus vrai concernant le traitement automatique de langues, domaine o? la ponctuation tient une place majeure. Les signes typographiques et de ponctuation sont des ? baliseurs naturels ? de l'information, mais aussi, des indicateurs sur lesquels devrait d?sormais s'appuyer la plupart des traitements automatiques (syntaxiques, s?mantiques, prosodique, extracteurs d'information, etc.). Concernant ces derniers, il est important de cadrer et d'?tudier tout les probl?mes qui surgissent dans la phase de traitement automatique multilingue, multi?criture et multicodage. L'objectif de cette journ?e de l'ATALA est de faire le point sur l'?tat actuel des recherches concernant les probl?matiques de la ponctuation, de la typographie, du codage et du transcodage en linguistique et dans le traitement automatique ; et de pr?senter les travaux d?j? r?alises dans ce domaine, ou les travaux y contribuant directement. Probl?matique : L'ing?nierie linguistique et le TAL sont confront?s ? de nouveaux probl?mes. En effet, il est maintenant n?cessaire de travailler non plus seulement sur des phrases ou des ?nonc?s isol?s mais sur des textes entiers, format?s ou non format?s, par exemple sur des textes rapatri?s du Web ou encore sur des textes extraits de grandes bases de documents stock?s dans des entreprises ou des administrations, sur des encyclop?dies ou m?me sur des articles de dictionnaire. De plus, les textes disponibles ne sont pas tous num?ris?s et encore moins balis?s. Or , effectuer un traitement automatique de documents textuels impose des op?rations pr?alables aux analyses syntaxiques, s?mantiques et pragmatiques. En particulier, chaque texte poss?de deux structures : une structure formelle et une structure discursive. La premi?re structuration conditionne la seconde. La structure formelle est d?j? porteuse d'une certaine intentionnalit? signifiante ; elle est le r?sultat d'un codage dans un syst?me typographique et celui d'une mise en texte. Le traitement pr?alable d'un texte doit exploiter cette structuration formelle (rep?rage des titres et sous titres ; d?coupage d'un texte en paragraphes, ?nonc?s, phrases, propositions, mots ; rep?rage des citations ; identification des ?num?rations ; prise en compte des ordres dispositionnels dans les textes ; rep?rage des images, diagrammes, l?gendes, encadr?s ') avant de proc?der aux op?rations ult?rieures et ? l'exploitation de la structuration discursive (identification des cadres temporels, spatiaux, th?matiques ; des relations causales, d?finitoires, temporelles ' ; des relations entre concepts, termes, ?v?nements ; des liens anaphoriques ; des prises en charge ?nonciatives '). Sans la ma?trise compl?te de l'exploitation de la structure formelle, aucun traitement automatique des textes ne sera vraiment op?rationnel. Evidemment, ce probl?me ne se posait pas encore lorsque l'on travaillait uniquement sur des phrases isol?es. Mais, pour l'analyse s?mantique des textes, il faut ?tre capable de le segmenter en des unit?s linguistiques qui sont sup?rieures et inf?rieures ? la phrase normative, en prenant en compte des marques s?miotiques clairement et formellement identifiables par une machine. Ainsi, la ponctuation et tous les indices typographiques restent les ?l?ments les plus pertinents car ils sont susceptibles de fournir des indications pr?cises pour segmenter et structurer formellement les textes, ces indications ?tant aux fondements m?mes d'une v?ritable linguistique textuelle automatisable. En sch?matisant, on peut distinguer trois types d'approche de la segmentation : (a) approches num?riques (r?seaux neuronaux, N-grammes, cha?nes de Markov ') ; (b) approches par automates finis et expressions r?guli?res (exemple : INTEX) ; (c) approches par exploration contextuelle autour des marqueurs de ponctuation (exemple : SegATex). Les trait?s classiques sur la ponctuation sont en g?n?ral normatifs et ils ne permettent donc pas une formulation de r?gles pr?cises permettant de r?aliser une segmentation automatique. De plus, ces trait?s n'ont pas assez d?gag? des analyses s?mantiques de marqueurs hautement polys?miques comme la virgule, le point-virgule, le deux-point, les tirets, les parenth?ses, les guillemets, le point' Pourtant, ces marqueurs jouent un r?le tr?s important dans la structuration s?mantique ; leur analyse permet d'am?liorer les processus de segmentation et la structuration discursive des textes. Les outils de traitement des textes offrent d'?normes possibilit?s pour des variations typographiques afin de souligner la mise en relief d'un terme pour citer, pour exemplifier, ou encore pour d?sambigu?ser une expression' ; comme l'a dit Ch. Gouriou : ? A tout probl?me que pose la transcription de la pens?e, la typographie se doit d'apporter au moins une solution ; elle en offre plusieurs d?s que l'on la sollicite de faire valoir des nuances ou des subtilit?s ?. Cependant, l'int?gration qu'il convient d'attribuer ? ces variations n'est pas uniforme et d?pend d'autres ?l?ments contextuels (ponctuationnels et typographiques) ; par exemple, une expression mise en italique n'a pas la m?me valeur selon qu'elle est entre guillemets ou en majuscules . C'est en fait un conglom?rat d'indices typographiques, variables de textes ? textes, qui fixe la valeur d'une occurrence de changement typographique. Le traitement automatique, lorsqu'il prend pour objet des textes r?els, se doit de r?soudre ces probl?mes, ? la fois linguistiques et informatiques. Th?mes : Les probl?mes (liste non-exhaustive) qui pourraient ?tre abord?s lors de cette journ?e seront, entre autres : - segmentation formelle du texte ; - segmentation discursive du texte ? partir des marques de ponctuation et de typographie (par exemple la s?mantique de la disposition spatiale) ; - architecture textuelle ; - r?le de la ponctuation - en particulier, la virgule - dans une analyse syntaxique ; - contribution de la ponctuation dans le codage de la prosodie et contribution de la typographie au codage de l'intonation' ; - contribution de la ponctuation pour l'identification des noms propres, des mots compos?s, des sigles et des abr?viations, des r?f?rences bibliographiques, des citations, des renvois aux notes' ; - comparaison des diff?rents syst?mes de ponctuation et de typographie dans diff?rents syst?mes linguistiques (arabe, chinois, japonais ') ; - probl?me de codage, du transcodage et du multicodage de diff?rents syst?mes linguistiques dans une approche multilingue des textes. - '. Modalit?s : Nous demandons aux auteurs de pr?ciser si leur soumission : 1) concerne des travaux en cours, ou des prises de position; 2) des travaux aboutis du point de vue th?orique ou appliqu?. Soumission (modalit?s) Un r?sum? de 2 ? 4 pages doit ?tre envoy? avant le 30 septembre 2003 par courrier ?lectronique en format text, .rtf, .doc ou .pdf ? : Ghassan.Mourad at paris4.sorbonne.fr Et Jean-Pierre.Descles at paris4.sorbonne.fr Les notifications d'acceptation seront donn?es pour le 20 octobre 2003. **************************************************************************************** English version ----------------------- ATALA Workshop Conference call ************************************** 22 novembre 2003 ENST, 46, rue Barrault (49, rue Vergnault), 75013 Paris **************************************************** Title : Role of typography and punctuation in natural language processing (texts segmentation, prosody, syntactical analysis, information retrieval, coding in multilingual systems,') Organisation : Ghassan Mourad & Jean-Pierre Descl?s Laboratory : LaLICC (UMR 8139 Paris-Sorbonne / CNRS) Objective: Even though punctuation and typography are not seen as teaching knowledge, we can hardly deny their role in reading and writing. This is also true for natural language processing, where punctuation plays an important role. Typographical and punctuation signs are 'natural tags' of information, and indicators on which most of the processing should rely. It is essential to tally and study all issues in the multilingual, multiwriting, and multicoding processing phases. The ATALA workshop is particularly concerned with current research on punctuation, typography, coding and transcribing issues in linguistics and language processing; and with work that already exists in this restricted domain or directly related to. Issues: Linguistic engineering and language processing is confronted with new issues. Indeed, it is now necessary to work not only on isolated sentences or utterances, but on entire structured or unstructured texts too; for example, texts from the Internet or from document-bases stored by companies or administrations, encyclopaedias or even dictionary articles. Moreover, texts are rarely tagged or digitised. However, text processing requires pre-processing in order to conduct syntactical, semantic and pragmatic analysis. In particular, each text has two structures: formal and discursive. The later depends on the earlier. The formal structure expresses a certain meaning intentionality; it results from the coding in a typographical system and from 'text-setting' or text layout. The pre-processing of a text must exploit the formal structure (titles and sub-titles localisation; text fragmentation in sentences, paragraphs, utterances, propositions, words; quotation identification; item list identification; spatial disposition consideration; images, diagrams, captions, boxes localisation....), before executing other tasks, or exploiting the discursive structure (temporal, spatial, topic, event frames identification; relations between concepts, terms, events; anaphoric links; enunciative phenomena'). Without complete control of the exploitation of formal structure, text processing will not really be operational. Obviously, this issue did not appear when we worked only on isolated sentences. However, for semantic analysis, text must segmented into linguistic units that are superior or inferior to the normative sentences, by taking into account semiotic marks clearly and formally known by the computer. Punctuation and all typographic signs (index) are still the most relevant elements, since they can provide sharp indications for formal text segmentation and structuring; these indications being the foundation of automatic textual linguistics. We can distinguish between three types of approaches for segmentation: (a) Digital approaches (neuronal nets, N-grams, Markov model'); (b) Finite automata and regular expressions approaches (for instance INTEX); (c) Contextual exploration approaches based on punctuation marks (for instance SegATex). Traditional theories (treaties, handbooks) of punctuation generally are normative and do not allow the expression of precise rules that could lead to automatic segmentation. Furthermore, these treaties did not consider semantic analysis of highly polysemous marks like comma, semicolon, colon, dash, parenthesises, ... However, marks play a very important role in semantic structuring; their analysis allow to improve segmentation process and text discursive structuring. Text processing tools offer enormous potentialities for typographic variations; for example highlighting a term being quoted, exemplify, or disambiguate an expression'; Quoting Ch. Gouriou : ? A tout probl?me que pose la transcription de la pens?e, la typographie se doit d'apporter au moins une solution ; elle en offre plusieurs d?s que l'on la sollicite de faire valoir des nuances ou des subtilit? ?. However, the integration to be granted to these variations is not regular and depends on other contextual (typographic and punctuation) elements; for example, an italicized expression does not have the same value (meaning) according to the fact that it is capitalized or between quoting marks. It is indeed a conglomerate of typographic marks, variable from text to text, which gives the value of an occurrence of typographic change. Text processing must resolve these linguistic and computational issues. Theme: Submission can also Discuss/tackle cross-domain topics in relation to: - Formal segmentation of text, - Text discursive segmentation based on punctuation and typography marks, - 'Textual architecture', - The role of the punctuation -particularly, the comma- in a syntactic analysis, - Contribution of the punctuation for the coding of the prosody and contribution of typography for the coding of intonation, - Contribution of the punctuation for the identification of proper names, compound words, abbreviations, initials, ' - Comparison between punctuation in various linguistic systems (Arab, Chinese'), - Coding and transcribing issues in various linguistics systems, - ? Modalities : Submission : a 2-4 page summary. We ask authors to indicate if their submission: - present in-progress work or is a position paper; - present theoretical or applied completed work. A 2-4-page summary must be sent before 30 September 2003 by e-mail in text, .rtf, .doc or .pdf to: Ghassan.Mourad at paris4.sorbonne.fr and Jean-Pierre.Descles at paris4.sorbonne.fr Acceptance notifications will be sent for 20 October 2003. ******************************************************************************** Ghassan Mourad ISHA, Paris - Sorbonne Laboratoire LaLICC (Langage, Logique, Informatique, Cognition et Communication) (UMR 8139 Paris-Sorbonne / CNRS) 96, Bd Raspail http://www.lalic.paris4.sorbonne.fr/ 75006 Paris France t?l : 01 44 39 35 90 fax : 01 44 39 35 91 ------------------------------------------------------------------------- Message diffus? par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain?e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh?sion : http://www.atala.org/ ------------------------------------------------------------------------- From alexis.nasr at LINGUIST.JUSSIEU.FR Fri Jul 18 15:01:26 2003 From: alexis.nasr at LINGUIST.JUSSIEU.FR (alexis.nasr at LINGUIST.JUSSIEU.FR) Date: Fri, 18 Jul 2003 17:01:26 +0200 Subject: interruption de la liste LN Message-ID: Bonjour, La diffusion sur la liste LN est suspendue ? partir d'aujourd'hui, elle reprendra d?but septembre. Bonnes vacances pour ceux qui en prennent et bon travail pour les autres. Alexis Nasr ------------------------------------------------------------------------- Message diffus? par la liste Langage Naturel Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/ English version : http://www.biomath.jussieu.fr/LN/LN/ Archives : http://listserv.linguistlist.org/archives/ln.html La liste LN est parrain?e par l'ATALA (Association pour le Traitement Automatique des Langues) Information et adh?sion : http://www.atala.org/ -------------------------------------------------------------------------