seminaire Modyco - ED
Sylvain Kahane
sk at CCR.JUSSIEU.FR
Tue Oct 10 08:20:41 UTC 2006
Séminaire Modyco - ED
UMR 7114 Modèles, Dynamiques, Corpus
ED 139 Connaissance, langage, modélisation
date : mercredi à 14h
lieu : Université Paris 10, RER Nanterre Université, salle variable
25 octobre 2006, Bâtiment N, salle 1bis
14h-15h30 John Goldsmith (U. de Chicago)
L’apprentissage automatique de la morphologie dans le cadre MDL
15h45-17h15 Jean-Luc Minel (Modyco, U. Paris 10)
Navigation textuelle
8 novembre 2006, Bâtiment B, salle des colloques
14h-15h Seong-Heon Lee (Université National de Séoul)
Le dictionnaire électronique Sejong. Sa structure et ses
caractéristiques.
15h15-16h15 Jean-Pierre Jaffré (Modyco, CNRS)
Les orthographes aujourd'hui. Revue de question.
16h30-17h30 Danièle Cogis (Modyco, IUFM de Paris)
Une enquête sur la variation orthographique des élèves entre 10 et
16 ans : aperçus sur quelques résultats
Prochaines séances
29 novembre 2006, Bâtiment K, salle des conférences
10 janvier 2007
24 janvier 2007
14 février 2007
7 mars 2007
21 mars 2007
4 avril 2007
13 juin 2007
Responsables :
Christian Hudelot <hudelot at vjf.cnrs.fr>
Sylvain Kahane <sk at ccr.jussieu.fr>
Résumés
25 octobre 2006
John Goldsmith (U. de Chicago)
L’apprentissage automatique de la morphologie dans le cadre MDL
Notre connaissance (en tant que locuteur natif, et non pas en tant
que linguiste) d’une langue consiste en deux parties : ce que l’on
n’a pas appris (parce qu’il découle de notre grammaire universelle,
encodée dans nos gènes) et ce que l’on a appris. La théorie
linguistique actuelle tend à valoriser la découverte, par les
linguistes, de ce que l’on n’a pas appris. Qu’en est-il pourtant de
ce que l’on a bel et bien appris, comme des morphèmes et des mots de
nos langues? Quel genre d’algorithme serait capable de découper la
chaîne sonore en mots et en morphèmes, et d’induire l’identité de ces
morphèmes ? Afin de répondre à cette question, nous essayons depuis
plusieurs années de monter un logiciel qui accepte comme input un
corpus d’une langue inconnue et qui produit comme output une
morphologie de la langue en question. Nous montrerons comment le
système marche, et discuterons ses implications générales pour la
linguistique.
25 octobre 2006
Jean-Luc Minel (Modyco, U. Paris 10)
Navigation textuelle
Le terme de navigation textuelle reçoit de multiples interprétations.
La plus commune renvoie inévitablement au processus mis en oeuvre par
les outils de navigation hypertextuelle, qui donne la possibilité
d'activer un lien pour déplacer le point de lecture ; ce déplacement
pouvant être intra ou intertextuel.
Notre conception de navigation textuelle se démarque de ce type de
navigation car nous considérons que circuler ou naviguer dans un
texte est l'expression d'un processus cognitif qui convoque des
connaissances qui sont propres à la finalité de la navigation. Nous
formulons l'hypothèse que la démarche du lecteur peut être assistée
par l'exploitation de ces connaissances qui peuvent être, en partie,
modélisées. En conséquence, nous avons développé, en collaboration
avec J. Couto (INCO) le langage Sextant pour exprimer ces
connaissances et implanté celui-ci dans la plate-forme NaviTexte.
Nous illustrerons l’intérêt de cette plate-forme en présentant
différentes applications, fruits d’une collaboration avec des équipes
de recherche françaises et étrangères.
8 novembre 2006
Seong-Heon Lee (Université National de Séoul)
Le dictionnaire électronique Sejong. Sa structure et ses
caractéristiques.
Depuis 9 ans, nous nous consacrons à la construction d’un
dictionnaire électronique du coréen de grande dimension et à usages
multiples. Il s’agit d’une entreprise à l’échelle nationale, étalée
sur 10 ans (1998-2007), et subventionnée par l’Etat. Ces travaux
s’effectuent en effet dans le cadre du « Projet Sejong pour le 21ème
siècle », projet qui vise à informatiser tous les types de données
sur le coréen et à bâtir une infrastructure favorisant le
développement tant des industries de la langue que des disciplines
qui utilisent les industries de la langue.
Nous nous attacherons, dans notre intervention, à présenter ces
travaux sous deux angles : la méthode de construction du dictionnaire
électronique Sejong, et ses caractéristiques. En ce qui concerne le
premier point, nous parlerons des objectifs, de la composition de
l’équipe, de l’organisation des travaux ainsi que de l’actuel état
des lieux. Pour ce qui est du second point, nous présenterons la
macrostructure et la microstructure du dictionnaire Sejong, et nous
soulignerons son intérêt pour les différents domaines du traitement
automatique des langues naturelles et des recherches linguistiques en
général.
8 novembre 2006-10-07
Jean-Pierre Jaffré (Modyco, CNRS)
Les orthographes aujourd'hui. Revue de question.
Au cours de ces dernières années, de nombreux travaux ont été publiés
sur les orthographes et sur leurs modalités d'acquisition. Cette
communication a pour but de faire le point sur ces publications, en
linguistique et en psycholinguistique. Je proposerai ainsi un tour
d'horizon sur les enseignements que l'on peu tirer d'une telle revue
de question, en confrontant la tradition alphabétique telle que nous
la connaissons en Europe et d'autres, plus ou moins éloignées. Pour
illustrer notre démarche comparative, je me servirai notamment
d'études sur des orthographes alphasyllabiques (devanagari, hangul)
et morphosyllabiques (japonais, chinois).
8 novembre 2006
Danièle Cogis (Modyco, IUFM de Paris)
Une enquête sur la variation orthographique des élèves entre 10 et 16
ans : aperçus sur quelques résultats
À l’heure où le discours institutionnel relayé par les médias ne
cesse de stigmatiser les résultats de l’école et de prôner le retour
aux méthodes traditionnelles, il importe de disposer d’outils de
mesure les plus fiables possible.
Cette communication se propose de présenter les résultats d’une
enquête concernant plus de 2500 élèves du CM2 à la troisième et
permettant de comparer le niveau des élèves dans une épreuve de
dictée à près de vingt ans de distance. Cette recherche met en
évidence des évolutions certaines, qu’il conviendra ensuite
d’analyser, notamment dans le domaine de la morphographie du français.
Cette recherche, conduite au sein du Léaple (2004-2006), est en cours
de publication (janvier 2007). Ses premiers résultats globaux ont
fait l’objet d’une brève présentation à l’occasion de la journée
d’étude de l’ONL (Office national de la lecture) en mars 2006 par
Danièle Manesse, directrice du projet de recherche.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20061010/2a0b5ac0/attachment.htm>
More information about the Parislinguists
mailing list