These: Remi Bove, Analyse syntaxique automatique de l'oral : etude des disfluences

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Wed Nov 12 11:42:19 UTC 2008


Date: Mon, 10 Nov 2008 13:55:33 +0100 (CET)
From: Remi BOVE <Remi.Bove at univ-provence.fr>
Message-ID: <20282761.29777.1226321735256.JavaMail.root at frontal2>


Bonjour à tous,

J'ai le plaisir de vous annoncer que ma soutenance de thèse intitulée
"Analyse syntaxique automatique de l'oral : étude des disfluences"
aura lieu le 25 novembre à 14h à Aix-en-Provence dans la salle C212
(2e étage) de l'Université de Provence (Aix-Marseille I).

Rémi BOVE


Jury :

Martine ADDA-DECKER (LIMSI, Université Paris-Sud, Rapporteur)
Jean-Yves ANTOINE (LI, Université François Rabelais de Tours, Rapporteur)
Jacques VERGNE (GREYC, Université de Caen, Examinateur)
José DEULOFEU (TALEP, Université de Provence, Examinateur)
Jean VERONIS (TALEP, Université de Provence, Directeur)


Résumé : 

Le but de cette thèse est d'étudier de façon détaillée l'impact des
disfluences en français parlé (répétitions, auto-corrections, amorces,
etc.) sur l'analyse syntaxique automatique de l'oral, et de proposer
un modèle théorique permettant de les intégrer dans cette analyse.

Notre axe de recherche se fonde sur l'hypothèse selon laquelle une
analyse détaillée des énoncés oraux (principalement en termes
morphosyntaxiques) peut permettre un traitement efficace pour ce type
de données, et s'avère incontournable dans une optique de
développement d'applications génériques dans le domaine des
technologies de la parole.

Dans ce travail, nous proposons à la fois une étude linguistique
détaillée et une stratégie d'analyse syntaxique automatique partielle
des disfluences (en syntagmes minimaux non récursifs ou "chunk"). Le
corpus final obtenu est ainsi segmenté en chunks non-disfluents d'une
part, à côté des chunks disfluents d'autre part, après prise en compte
des régularités observées dans notre corpus. Les résultats de
l'analyse automatique sont finalement évalués de façon quantitative
sur le corpus permettant ainsi de valider le modèle théorique de façon
empirique.


Mots-Clefs :
TAL, Analyse Syntaxique Automatique, Disfluences, Oral, Français
Parlé, Étiquetage Automatique, Grammaire de Chunking, Linguistique de
Corpus

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list