seminaire Modyco - ED

Sylvain Kahane sk at CCR.JUSSIEU.FR
Tue Oct 10 08:20:41 UTC 2006


Séminaire Modyco - ED
UMR 7114 Modèles, Dynamiques, Corpus
ED 139 Connaissance, langage, modélisation

	date : mercredi à 14h
	lieu : Université Paris 10, RER Nanterre Université, salle variable

25 octobre 2006, Bâtiment N, salle 1bis
14h-15h30 	John Goldsmith (U. de Chicago)
			L’apprentissage automatique de la morphologie dans le cadre MDL
15h45-17h15	Jean-Luc Minel (Modyco, U. Paris 10)
			Navigation textuelle

8 novembre 2006, Bâtiment B, salle des colloques
14h-15h		Seong-Heon Lee (Université National de Séoul)
			Le dictionnaire électronique Sejong. Sa structure et ses  
caractéristiques.
15h15-16h15	Jean-Pierre Jaffré (Modyco, CNRS)
			Les orthographes aujourd'hui. Revue de question.
16h30-17h30	Danièle Cogis (Modyco, IUFM de Paris)
			Une enquête sur la variation orthographique des élèves entre 10 et  
16 ans : aperçus sur quelques résultats

Prochaines séances
29 novembre 2006, Bâtiment K, salle des conférences
10 janvier 2007
24 janvier 2007
14 février 2007
7 mars 2007
21 mars 2007
4 avril 2007
13 juin 2007

Responsables :
Christian Hudelot <hudelot at vjf.cnrs.fr>
Sylvain Kahane <sk at ccr.jussieu.fr>

Résumés

25 octobre 2006
John Goldsmith (U. de Chicago)
L’apprentissage automatique de la morphologie dans le cadre MDL

Notre connaissance (en tant que locuteur natif, et non pas en tant  
que linguiste) d’une langue consiste en deux parties : ce que l’on  
n’a pas appris (parce qu’il découle de notre grammaire universelle,  
encodée dans nos gènes) et ce que l’on a appris. La théorie  
linguistique actuelle tend à valoriser la découverte, par les  
linguistes, de ce que l’on n’a pas appris. Qu’en est-il pourtant de  
ce que l’on a bel et bien appris, comme des morphèmes et des mots de  
nos langues? Quel genre d’algorithme serait capable de découper la  
chaîne sonore en mots et en morphèmes, et d’induire l’identité de ces  
morphèmes ? Afin de répondre à cette question, nous essayons depuis  
plusieurs années de monter un logiciel qui accepte comme input un  
corpus d’une langue inconnue et qui produit comme output une  
morphologie de la langue en question. Nous montrerons comment le  
système marche, et discuterons ses implications générales pour la  
linguistique.

25 octobre 2006
Jean-Luc Minel (Modyco, U. Paris 10)
Navigation textuelle

Le terme de navigation textuelle reçoit de multiples interprétations.  
La plus commune renvoie inévitablement au processus mis en oeuvre par  
les outils de navigation hypertextuelle,  qui donne la possibilité  
d'activer un lien pour déplacer le point de lecture ; ce déplacement  
pouvant être intra ou intertextuel.
Notre conception de navigation textuelle se démarque de ce type de  
navigation car nous considérons que circuler ou naviguer dans un  
texte est l'expression d'un processus cognitif qui convoque des  
connaissances qui sont propres à la finalité de la navigation. Nous  
formulons l'hypothèse que la démarche du lecteur peut être assistée  
par l'exploitation de ces connaissances qui peuvent être, en partie,  
modélisées. En conséquence, nous avons développé, en collaboration  
avec J. Couto (INCO) le langage Sextant pour exprimer ces  
connaissances et implanté celui-ci dans la plate-forme NaviTexte.
Nous illustrerons l’intérêt de cette plate-forme en présentant  
différentes applications, fruits d’une collaboration avec des équipes  
de recherche françaises et étrangères.

8 novembre 2006
Seong-Heon Lee (Université National de Séoul)
Le dictionnaire électronique Sejong. Sa structure et ses  
caractéristiques.

Depuis 9 ans, nous nous consacrons à la construction d’un  
dictionnaire électronique du coréen de grande dimension et à usages  
multiples. Il s’agit d’une entreprise à l’échelle nationale, étalée  
sur 10 ans (1998-2007), et subventionnée par l’Etat. Ces travaux  
s’effectuent en effet dans le cadre du « Projet Sejong pour le 21ème  
siècle », projet qui vise à informatiser tous les types de données  
sur le coréen et à bâtir une infrastructure favorisant le  
développement tant des industries de la langue que des disciplines  
qui utilisent les industries de la langue.
Nous nous attacherons, dans notre intervention, à présenter ces  
travaux sous deux angles : la méthode de construction du dictionnaire  
électronique Sejong, et ses caractéristiques. En ce qui concerne le  
premier point, nous parlerons des objectifs, de la composition de  
l’équipe, de l’organisation des travaux ainsi que de l’actuel état  
des lieux. Pour ce qui est du second point, nous présenterons la  
macrostructure et la microstructure du dictionnaire Sejong, et nous  
soulignerons son intérêt pour les différents domaines du traitement  
automatique des langues naturelles et des recherches linguistiques en  
général.

8 novembre 2006-10-07
Jean-Pierre Jaffré (Modyco, CNRS)
Les orthographes aujourd'hui. Revue de question.

Au cours de ces dernières années, de nombreux travaux ont été publiés  
sur les orthographes et sur leurs modalités d'acquisition. Cette  
communication a pour but de faire le point sur ces publications, en  
linguistique et en psycholinguistique. Je proposerai ainsi un tour  
d'horizon sur les enseignements que l'on peu tirer d'une telle revue  
de question, en confrontant la tradition alphabétique telle que nous  
la connaissons en Europe et d'autres, plus ou moins éloignées. Pour  
illustrer notre démarche comparative, je me servirai notamment  
d'études sur des orthographes alphasyllabiques (devanagari, hangul)  
et morphosyllabiques (japonais, chinois).

8 novembre 2006
Danièle Cogis (Modyco, IUFM de Paris)
Une enquête sur la variation orthographique des élèves entre 10 et 16  
ans : aperçus sur quelques résultats
À l’heure où le discours institutionnel relayé par les médias ne  
cesse de stigmatiser les résultats de l’école et de prôner le retour  
aux méthodes traditionnelles, il importe de disposer d’outils de  
mesure les plus fiables possible.
Cette communication se propose de présenter les résultats d’une  
enquête concernant plus de 2500 élèves du CM2 à la troisième et  
permettant de comparer le niveau des élèves dans une épreuve de  
dictée à près de vingt ans de distance. Cette recherche met en  
évidence des évolutions certaines, qu’il conviendra ensuite  
d’analyser, notamment dans le domaine de la morphographie du français.
Cette recherche, conduite au sein du Léaple (2004-2006), est en cours  
de publication (janvier 2007). Ses premiers résultats globaux ont  
fait l’objet d’une brève présentation à l’occasion de la journée  
d’étude de l’ONL (Office national de la lecture) en mars 2006 par  
Danièle Manesse, directrice du projet de recherche.

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20061010/2a0b5ac0/attachment.htm>


More information about the Parislinguists mailing list