These: Nicolas Obin, Analyse et Modelisation de la Prosodie et du Style de Parole

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Apr 29 20:43:23 UTC 2011


Date: Fri, 29 Apr 2011 21:02:07 +0200
From: Nicolas OBIN <Nicolas.Obin at ircam.fr>
Message-Id: <1FA61D62-FE1E-4C0F-A5A1-AB1A18BDBFA4 at ircam.fr>
X-url: http://recherche.ircam.fr/equipes/analyse-synthese/obin/

J'ai le plaisir de vous annoncer la soutenance de ma thèse le jeudi 23
juin 2011 à 14h30 en salle Stravinsky à l'IRCAM, Paris.

En espérant avoir l'honneur de vous y rencontrer,

Cordialement,

Nicolas OBIN

------------------

Merci de diffuser largement cette annonce.
La thèse sera soutenue en anglais.

Une présentation détaillée est disponible à l'adresse suivante.

English version bellow.

Please forward this announcement to whom it may concern.
The thesis will be defended in english.

More information is available at the following link.

Nicolas Obin.

FRENCH VERSION
---------------------------

Soutenance de thèse 
Département Recherche & Développement

JEUDI 23 JUIN  2011   à 14h30,   en salle Stravinsky, Ircam, 

Nicolas OBIN soutiendra sa thèse de doctorat dirigée par Xavier Rodet
et Anne Lacheret, réalisée à l'Ircam au sein de l'équipe Interactions
Analyse et Synthèse des sons, intitulée :

"MeLos: Analyse et Modélisation de la Prosodie et du Style de Parole"

La soutenance de thèse se fera devant un jury composé de :

- Nick Campbell Professeur, CLCS - Université de Dublin rapporteur
- Simon King Professeur, CSTR - Université d'Edimbourg rapporteur
- Jean-François Bonastre Professeur, LIA - Université d'Avignon
  examinateur
- Eric de la Clergerie Chercheur INRIA - ALPAGE examinateur
- David Wessel Professeur, CNMAT - Université de Californie Berkeley
  examinateur
- Jean-Luc Zarader Professeur, ISIR - Université de Paris VI
  examinateur
- Anne Lacheret Professeur, MoDyCo - Université Paris Ouest - La
  Défense co-directrice de thèse
- Xavier Rodet Chercheur émérite, IRCAM - Université de Paris VI
  directeur de thèse

Résumé :

Cette thèse a pour objet la modélisation de la prosodie dans le cadre
de la synthèse de la parole. Nous présenterons MeLos : un système
complet d’analyse et de modélisation de la prosodie, “la musique de la
parole”.

L’objectif de cette thèse est de modéliser la stratégie, les
alternatives, et le style de parole d’un locuteur pour permettre une
synthèse de parole naturelle, expressive, et variée. Nous présenterons
un système unifié fondé sur des modèles de Markov cachés (HMMs) à
observation discrète/continue pour modéliser les caractéristiques
symbolique et acoustique de la prosodie :

1) Une chaîne de traitement linguistique de surface et profonde sera
   introduite pour enrichir la description des caractéristiques du
   texte.

2) Un modèle segmental associé à la fusion de Dempster-Shafer sera
   utilisé pour combiner les contraintes linguistique et métrique dans
   la production des pauses.

3) Un modèle de trajectoire basé sur la stylisation des contours
   prosodiques sera présenté pour permettre de modéliser simultanément
   les variations à court et long terme de la F0.

Le système proposé est utilisé pour modéliser les stratégies et le
style d’un locuteur, et est étendu à la modélisation du style de
parole par des méthodes de modélisation en contexte partagé et de
normalisation du locuteur.

Mots-clefs: prosodie, style de parole, synthèse de la parole, modèle
de Markov caché (HMM) à observation discrète/continue, stylisation,
modèle de trajectoire, analyse linguistique.

ENGLISH VERSION
---------------------------

PhD Defense - 
Research and Development Department

Thursday, june 23, 2011 at 2:30pm in Stravinsky Conference Room,
Ircam, Paris - France

Nicolas Obin will defend his PhD. thesis supervised by Xavier Rodet
and Anne Lacheret, carried out as a member of the Analysis and
Synthesis team at IRCAM:

"MeLos: Analysis and Modelling of Speech Prosody and Speaking Style",

in front of the following committee:

- Nick Campbell Professor, CLCS - University of Dublin reviewer
- Simon King Professor, CSTR - University of Edinburgh reviewer
- Jean-François Bonastre Professor, LIA - University of Avignon
  examiner
- Eric de la Clergerie Researcher, INRIA - ALPAGE examiner
- David Wessel Professor, CNMAT - University of California Berkeley
  examiner
- Jean-Luc Zarader Professor, ISIR - University of Paris VI examiner
- Anne Lacheret Professor, MoDyCo - University of Paris Ouest - La
  Défense supervisor
- Xavier Rodet Emeritus Researcher, IRCAM - University of Paris VI
  supervisor

Abstract : 
This thesis addresses the issue of modelling speech prosody for speech
synthesis and presents MeLos: a complete system for the analysis and
modelling of speech prosody, “the music of speech”.

The objective of this thesis is to model the strategy, alternatives,
and speaking style of a speaker for natural, expressive, and varied
speech synthesis. The present study presents original contributions
with special attention paid to the combination of theoretical
linguistic and statistical modelling to provide a complete speech
prosody system.

A unified discrete/continuous context-dependent HMM is presented to
model the symbolic and the acoustic characteristics of speech prosody:

1) A rich description of the text characteristics based on a
   linguistic processing chain that includes surface and deep
   syntactic parsing is proposed to refine the modelling of the speech
   prosody in context.

2) Segmental HMMs and Dempster-Shafer fusion are used to balance
   linguistic and metric constrains in the production of a pause.

3) A trajectory model is proposed based on the stylization and the
   simultaneous modelling of short and long-term F0 variations over
   various temporal domains.

The proposed system is used to model the strategies, alternatives and
speaking style of a speaker, and is extended to model the speaking
style of any arbitrary number of speakers using
shared-context-dependent modelling and speaker normalization
techniques.

Keywords: speech prosody, speaking style, speech synthesis,
discrete/continuous HMMs, stylization, trajectory modelling,
linguistic analysis.


Nicolas OBIN: PhD Student at IRCAM Analysis/Synthesis Team - 
contact | nobin at ircam.fr -
Tel : 33 (0) 1 44 78 48 90, Fax : 33 (0)1 44 78 15 40
http://recherche.ircam.fr/equipes/analyse-synthese/obin/

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list