Seminaire: Alpage, Jennifer Foster, lundi 4 mai

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue May 5 12:52:16 UTC 2009


Date: Wed, 29 Apr 2009 17:11:41 +0200
From: bcrabbe at linguist.jussieu.fr
Message-ID: <1241017901.49f86e2dd98bb at kmail.linguist.univ-paris-diderot.fr>


******************* Séminaire Alpage *******************

              Séminaire de l'école doctorale de Paris 7

Il s'agit du séminaire de recherche en linguistique informatique
organisé par l'équipe Alpage, Alpage est une nouvelle équipe mixte
Inria -- Paris 7 issue de la fusion des équipes Atoll et Talana.
L'équipe centre ses intérêts scientifiques autour de l'analyse
syntaxique automatique et du traitement du discours pour la langue
française.

Le séminaire se tient le lundi de 14.00 à 16.00 tous les 15 jours.  Il
a lieu en salle 131 au 30 rue du Château des Rentiers 75013 Paris
(premier étage)

Toute personne intéressée est la bienvenue.

***********************************************************

Lundi 4 mai 2009, Jennifer Foster (Dublin) nous parlera de :

Detecting and Parsing Ungrammatical Text

Given the human propensity to err, a parser must be able to produce
accurate analyses for sentences which are deviant according to human
standards, yet which we routinely interpret correctly. State-of-the-
art statistical parsers are generally robust to errors, and they will
return analyses for most ungrammatical sentences. However, these
robust analyses are not necessarily correct because they do not always
reflect the meanings of the ill-formed sentences. I present a two-
stage "error-aware" statistical parsing architecture which uses two
versions of a statistical parser, one trained on a normal treebank and
the other trained on an automatically created ungrammatical version of
the original treebank. A binary classifier is used to decide which
version to employ. I present the results of experiments carried out
using this parsing architecture and the Penn Treebank. I also present
the results of experiments carried out with various
grammatical/ungrammatical classifiers, and I present a tool called
GenERRate which can be used to automatically create ungrammatical
training data.

Séminaires à venir :

18/5 : J.P. Prost (Orléans)

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list