s=?iso-8859-1?Q?=E9minaire_Ling&Math_=E0_?=Nanterre
christopheparisse
christopheparisse at GMAIL.COM
Tue Oct 9 20:38:57 UTC 2012
Depuis quelques années, le développement de la linguistique de corpus, et en particulier de l'outillage mathématique de l'analyse des corpus, a profondément modifié le paysage conceptuel et théorique de la linguistique. Ce développement s'inscrit plus largement dans le mouvement provoqué par l'irruption des données de très grandes dimensions dans toutes les sciences. Cette véritable lame de fond pose des questions très épineuses auxquelles les mathématiciens se sont attaqués de leur côté, aiguillant notamment le développement de théories statistiques pour la modélisation, l'analyse et l'exploitation de tels jeux de données. C'est dans ce cadre que se met en place une première étape de collaboration entre les mathématiciens et les linguistes de Paris Ouest.
Les laboratoires Modyco et Modal'X organisent un séminaire commun.
Ce séminaire intitulé « Mathématiques pour la linguistique de corpus » est co-organisé par Bernard Laks et Christophe Parisse (Modyco), Antoine Chambaz et Nathanaël Enriquez (Modal'X).
Il se tiendra le jeudi matin au rythme d'une séance toutes les six semaines environ. La première séance aura lieu le :
jeudi 25 octobre 2012 à 10h
salle 407, bâtiment A
Université Paris Ouest Nanterre.
Ce séminaire, ouvert à un large public, sera un lieu de débats et d'échanges. Il a pour but de favoriser la collaboration entre linguistes et mathématiciens afin de stimuler et d'encadrer le développement de projets de recherche à la jonction de la linguistique et des mathématiques. Son déroulement, aussi peu formel que possible, s'articulera autour de une à deux présentations à chaque séance, de mathématiques et/ou de linguistique. On y insistera sur les états de l'art, les échanges d'informations et de bibliographies, les présentations de travaux.
La séance du 25 octobre aura pour thème les "Formes et natures des données linguistiques de corpus". On y présentera :
- les données linguistiques de corpus utilisées dans le laboratoire Modyco
- les traitements (automatiques ou statistiques) qui leur sont présentement appliqués ainsi que ceux qui pourraient l'être
- un panorama des tendances actuelles de la recherche en statistiques pour les données de grandes dimensions.
Une page web et une liste de diffusion vont être mises en place pour vous informer sur les prochaines séances de ce séminaire.
Merci également de diffuser très largement cette annonce autour de vous.
Cordialement,
Bernard Laks et Christophe Parisse (Modyco)
Antoine Chambaz et Nathanael Enriquez (Modal'x)
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20121009/495f9449/attachment.htm>
More information about the Parislinguists
mailing list