Job: Stage Bac+5, Analyse textuelle de scripts de films pour ameliorer le reperage d'actions dans les videos de ces films

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Feb 1 11:23:21 UTC 2012


Date: Tue, 31 Jan 2012 10:36:32 +0100
From: Marie Candito <marie.candito at gmail.com>
Message-ID: <4F27B620.9040201 at gmail.com>


(English version below)

========================================= 
Stage Bac+5 : Analyse textuelle de scripts de films pour améliorer le
repérage d'actions dans les vidéos de ces films
=========================================

=========================================
Equipes, projet et lieu du stage :
=========================================
Equipes : ALPAGE (UMR-I Univ Paris Diderot/INRIA
          et WILLOW (UMR CNRS/ENS/INRIA)

Le stage sera déroulera en cotutelle par ALPAGE et WILLOW, dans le cadre
du projet ERC VideoWorld :
"Modeling, interpreting and manipulating digital video"

Lieu : Le stagiaire sera basé à Alpage :
       175 rue du chevaleret 75013 Paris

=========================================
Sujet :
=========================================
Un nombre énorme de vidéos est aujourd'hui disponible, en particulier
sur Internet, qu'il s'agisse de vidéos informatives, éducatives, de
divertissement ou autres. Ce nombre va croissant, et de ce fait l'accès
intelligent à leur contenu devient un enjeu majeur.

Un scénario de recherche au sein de vidéos peut par exemple se modéliser
comme la recherche de certaines situations ou actions précises (faire du
cheval, sortir d'un véhicule, prendre un repas ...). Pour automatiser
cette tâche par des techniques d'apprentissage supervisé, un problème
important est le fait qu'il est très fastidieux de construire des
exemples d'apprentissage où les séquences de vidéos sont couplées à des
actions précises. Une solution à ce problème est de construire
automatiquement des exemples d'apprentissage en utilisant, lorsqu'ils
existent, les textes associés aux vidéos. Ces textes sont en particulier
disponibles pour un grand nombre de films, sous la forme de scripts de
scenario.

L'objet du stage est de construire un système intégré d'analyse de
scripts (anglais) de films, en vue de permettre la classification
automatique de descriptions de scènes de films en actions, parmi un
ensemble prédéfini d'actions. Il s'agira de de coupler l'utilisation et
l'adaptation de modules de traitement existants (reconnaissance
d'entités nommées, résolution d'anaphores, tagging, parsing) à des
modules spécifiques. Deux points (de recherche) attireront notre
attention : d'une part l'utilisation du cadre FrameNet pour le repérage
des actions, d'autre part les informations de factivité (cadre FactBank)
pour savoir si une action s'est effectivement produite.

Par exemple pour la description de scène suivante issue d'un script :

" The servants move Chang's chair back. Before he goes, however, he
turns to Conway and smiles at him. "

Il s'agit de repérer les personnages "the servants", Chang, Conway;
résoudre les références de "he" et "him"; repérer les actions "move
chair", "turn", "smile" et leurs actants; et idéalement repérer que la
mention de l'action de partir (to go) n'est pas réalisée ou pas encore
réalisée.

=========================================
Profil recherché :
=========================================
Etudiant de niveau BAC +5, avec des connaissances en Traitement
Automatique des Langues et en apprentissage automatique.
Une autonomie en programmation est indispensable, ainsi qu'une bonne
maîtrise de l'anglais (langue des textes à traiter).
Des connaissances en linguistique seraient un plus apprécié.

=========================================
Durée : 6 mois
=========================================
Rémunération : selon profil
=========================================

Envoyez CV et lettre de motivation à :
contact : marie.candito at gmail.com



=============English version=============


Internship Master's degree : Textual analysis of movie scripts to
improve action classification in movie videos

=========================================
Teams and location of the internship :
=========================================
Teams : ALPAGE (UMR-I Univ Paris Diderot/INRIA
          et WILLOW (UMR CNRS/ENS/INRIA)
The internship will be supervised both at ALPAGE and WILLOW teams
within the ERC VideoWorld project :
"Modeling, interpreting and manipulating digital video"

Location : The intern will work mainly at ALPAGE
           175 rue du chevaleret 75013 Paris 

=========================================
Scientific context :
=========================================
A growing amount of videos is available online, whether educational,
entertaining, news videos or other.
Intelligent access to the content of these videos is becoming crucial.

One search strategy within viedos can be modeled as the search for
certain prototypical actions or situations (such as ride horse, get out
of a vehicle, have a meal etc...).
This can be achieved by training supervised classifiers to assign
actions to video sequences.
One classic problem is the extreme difficulty to build annotated
examples (sequences annotated with actions). A potential solution is
automatically build examples using texts associated videos.

Such texts are often available in the case of movie videos, in the form
of movie scripts. Such scripts are publicly available for hundreds of
movies, and describe the movie in terms of characters, scenes, dialogues
and brief descriptions of actions performed in the video.

The objective of the internship is to build an integrated system for
movie script textual analysis (in English), in order to build examples
of textual descriptions labeled with actions, taken from a predefined
set of actions.
The task will require to use and possibly adapt existing tools (for
named entity recognition, anaphora resolution, tagging, parsing).  The
scientific focus will be on the possibility to use the FrameNet
framework to spot actions, and factivity information (FactBank
frameWork) to decide whether an action was indeed performed or not.

=========================================
Profile :
=========================================
Master 2, with knowledge in NLP and Machine learning.
Required programming skills, and a good knowledge of English.
Some knowledge in linguistics would be a plus.

=========================================
Conditions :
6 months, starting as soon as possible.
Salary depending on experience and profile
=========================================
How to apply :
Send CV and cover letter to marie.candito at gmail.com

Marie Candito
Maître de Conférences 
UFR de Linguistique - Université Paris 7
Equipe Alpage (INRIA / Université Paris 7)
Tel: +33 1 57 27 57 74
Fax: +33 1 57 27 57 81

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list