séminaire Modyco

Clara Romero ulysse21fr at YAHOO.FR
Fri Oct 13 18:56:37 UTC 2006



________________________________________________

Séminaire Modyco - ED

UMR 7114 Modèles, Dynamiques, Corpus

ED 139 Connaissance, langage, modélisation

 

                date : mercredi à 14h

                lieu : Université Paris 10, RER Nanterre Université, salle variable

 

25 octobre 2006, Bâtiment N, salle 1bis

14h-15h30           John Goldsmith (U. de Chicago)

                                               L'apprentissage automatique de la morphologie dans le cadre MDL 

15h45-17h15       Jean-Luc Minel (Modyco, U. Paris 10)

                                               Navigation textuelle 

 

8 novembre 2006, Bâtiment B, salle des colloques

14h-15   h             Seong-Heon Lee (Université National de Séoul)

                                               Le dictionnaire électronique Sejong. Sa structure et ses caractéristiques.

15h15-16h15       Jean-Pierre Jaffré (Modyco, CNRS)

                                               Les orthographes aujourd'hui. Revue de question.

16h30-17h30       Danièle Cogis (Modyco, IUFM de Paris)

                                               Une enquête sur la variation orthographique des élèves entre 10 et 16 ans : aperçus sur quelques résultats

 

Prochaines séances

29 novembre 2006, Bâtiment K, salle des conférences

10 janvier 2007

24 janvier 2007

14 février 2007

7 mars 2007

21 mars 2007

4 avril 2007

13 juin 2007

 

Responsables :

Christian Hudelot <hudelot at vjf.cnrs.fr>

Sylvain Kahane <sk at ccr.jussieu.fr>

 

Résumés

 

25 octobre 2006

John Goldsmith (U. de Chicago)

L'apprentissage automatique de la morphologie dans le cadre MDL 

 

Notre connaissance (en tant que locuteur natif, et non pas en tant que linguiste) d'une langue consiste en deux parties : ce que l'on n'a pas appris (parce qu'il découle de notre grammaire universelle, encodée dans nos gènes) et ce que l'on a appris. La théorie linguistique actuelle tend à valoriser la découverte, par les linguistes, de ce que l'on n'a pas appris. Qu'en est-il pourtant de ce que l'on a bel et bien appris, comme des morphèmes et des mots de nos langues? Quel genre d'algorithme serait capable de découper la chaîne sonore en mots et en morphèmes, et d'induire l'identité de ces morphèmes ? Afin de répondre à cette question, nous essayons depuis plusieurs années de monter un logiciel qui accepte comme input un corpus d'une langue inconnue et qui produit comme output une morphologie de la langue en question. Nous montrerons comment le système marche, et discuterons ses implications générales pour la linguistique.

 

25 octobre 2006

Jean-Luc Minel (Modyco, U. Paris 10)

Navigation textuelle 

 

Le terme de navigation textuelle reçoit de multiples interprétations. La plus commune renvoie inévitablement au processus mis en oeuvre par les outils de navigation hypertextuelle,  qui donne la possibilité d'activer un lien pour déplacer le point de lecture ; ce déplacement pouvant être intra ou intertextuel.

Notre conception de navigation textuelle se démarque de ce type de navigation car nous considérons que circuler ou naviguer dans un texte est l'expression d'un processus cognitif qui convoque des connaissances qui sont propres à la finalité de la navigation. Nous formulons l'hypothèse que la démarche du lecteur peut être assistée par l'exploitation de ces connaissances qui peuvent être, en partie, modélisées. En conséquence, nous avons développé, en collaboration avec J. Couto (INCO) le langage Sextant pour exprimer ces connaissances et implanté celui-ci dans la plate-forme NaviTexte.

Nous illustrerons l'intérêt de cette plate-forme en présentant différentes applications, fruits d'une collaboration avec des équipes de recherche françaises et étrangères.

 

8 novembre 2006

Seong-Heon Lee (Université National de Séoul)

Le dictionnaire électronique Sejong. Sa structure et ses caractéristiques.

 

Depuis 9 ans, nous nous consacrons à la construction d'un dictionnaire électronique du coréen de grande dimension et à usages multiples. Il s'agit d'une entreprise à l'échelle nationale, étalée sur 10 ans (1998-2007), et subventionnée par l'Etat. Ces travaux s'effectuent en effet dans le cadre du « Projet Sejong pour le 21ème siècle », projet qui vise à informatiser tous les types de données sur le coréen et à bâtir une infrastructure favorisant le développement tant des industries de la langue que des disciplines qui utilisent les industries de la langue.

Nous nous attacherons, dans notre intervention, à présenter ces travaux sous deux angles : la méthode de construction du dictionnaire électronique Sejong, et ses caractéristiques. En ce qui concerne le premier point, nous parlerons des objectifs, de la composition de l'équipe, de l'organisation des travaux ainsi que de l'actuel état des lieux. Pour ce qui est du second point, nous présenterons la macrostructure et la microstructure du dictionnaire Sejong, et nous soulignerons son intérêt pour les différents domaines du traitement automatique des langues naturelles et des recherches linguistiques en général.

 

8 novembre 2006-10-07

Jean-Pierre Jaffré (Modyco, CNRS)

Les orthographes aujourd'hui. Revue de question.

 

Au cours de ces dernières années, de nombreux travaux ont été publiés sur les orthographes et sur leurs modalités d'acquisition. Cette communication a pour but de faire le point sur ces publications, en linguistique et en psycholinguistique. Je proposerai ainsi un tour d'horizon sur les enseignements que l'on peu tirer d'une telle revue de question, en confrontant la tradition alphabétique telle que nous la connaissons en Europe et d'autres, plus ou moins éloignées. Pour illustrer notre démarche comparative, je me servirai notamment d'études sur des orthographes alphasyllabiques (devanagari, hangul) et morphosyllabiques (japonais, chinois).

 

8 novembre 2006

Danièle Cogis (Modyco, IUFM de Paris)

Une enquête sur la variation orthographique des élèves entre 10 et 16 ans : aperçus sur quelques résultats

À l'heure où le discours institutionnel relayé par les médias ne cesse de stigmatiser les résultats de l'école et de prôner le retour aux méthodes traditionnelles, il importe de disposer d'outils de mesure les plus fiables possible.

Cette communication se propose de présenter les résultats d'une enquête concernant plus de 2500 élèves du CM2 à la troisième et permettant de comparer le niveau des élèves dans une épreuve de dictée à près de vingt ans de distance. Cette recherche met en évidence des évolutions certaines, qu'il conviendra ensuite d'analyser, notamment dans le domaine de la morphographie du français.

Cette recherche, conduite au sein du Léaple (2004-2006), est en cours de publication (janvier 2007). Ses premiers résultats globaux ont fait l'objet d'une brève présentation à l'occasion de la journée d'étude de l'ONL (Office national de la lecture) en mars 2006 par Danièle Manesse, directrice du projet de recherche.

 
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20061013/08decb14/attachment.htm>


More information about the Parislinguists mailing list