Soft: un analyseur syntaxico-semantique multi-formalisme sous license GPL

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue Feb 26 09:50:30 UTC 2008

Date: Thu, 21 Feb 2008 10:15:26 +0100
From: Yannick Parmentier <yannick.parmentier at>
Message-Id: <20080221101526.0ff099a0.yannick.parmentier at>

(English below)


Une nouvelle version de l'analyseur syntaxique multi-formalisme TuLiPA
développé à l'Université de Tübingen est disponible sous licence

Pour rappel: TuLiPA est un environnement pour l'analyse syntaxique de
grammaires légèrement sensibles au contexte (grammaires d'arbres
adjoints [TAG] et grammaires d'arbres adjoints multi-composantes avec
tuples d'arbres [TT-MCTAG]).
TuLiPA utilise les grammaires à concaténation d'intervalles (RCG)
comme formalisme pivot. Ainsi les grammaires d'arbres sont converties
en RCG équivalentes, ces dernières étant utilisées pour
l'analyse. Le résultat de l'analyse correspond à une forêt
partagée sur laquelle divers traitements sont effectués, par exemple
pour extraire les arbres de dérivation et dérivé.

Cette nouvelle version (1.0.4) intègre un support pour le calcul
sémantique pour grammaires d'arbres, via l'interface
syntaxe/sémantique de (Gardent et Kallmeyer, 2003, Kallmeyer et
Romero, 2008).

En outre, TuLiPA est développé en Java et se caractérise par:

* une procédure d'installation relativement simple (seule la
  bibliothèque GecodeJ est pré-requise, celle-ci est disponible
  librement pour de nombreuses plateformes, cf,

* le choix entre une interface d'utilisation intuitive via un
  environnement graphique ou une interface en mode texte,

* une interface graphique pour la visualisation du résultat de
  l'analyse (structure de dépendances, arbre dérivé, arbre de
  dérivation, arbres élémentaires utilisés, et représentation
  sémantique plate),

* un export du résultat d'analyse en XML pour intégration dans une
  chaîne de TAL,

* la possibilité d'utiliser un étiquetteur externe (en l'occurrence
  le TreeTagger développé à l'Université de Stuttgart),

* la possibilité de faire de l'analyse pour grammaires d'arbres, ou
  pour grammaires RCG directement.

TuLiPA est utilisé dans le cadre du développement d'une grammaire
TT-MCTAG de l'allemand. Pour plus d'informations (et des exemples de
grammaires TT-MCTAG, TAG et RCG au format TuLiPA), merci de consulter
le site internet de TuLiPA:

Tout commentaire, toute question, demande d'extension ou encore
rapport d'erreur est le bienvenu.

pour le projet Emmy-Noether,

  Yannick Parmentier


Dear all,

A new version of the TuLiPA multi-formalism parser, developed at the
University of Tuebingen, has been released under a GPL licence.

TuLiPA is an environment for syntactic parsing of mildly
context-sensitive grammatical formalisms (namely Tree-Adjoining
Grammars [TAG], Multi-Component Tree-Adjoining Grammars with Tree
Tuples [TT-MCTAG]).

TuLiPA uses Range Concatenation Grammar [RCG] as a pivot
formalism. Thus, tree-based grammars are converted into equivalent
RCGs, the latter being used for parsing. The result of parsing
corresponds to a shared forest, which is post-processed to extract
dependency, derivation and derived trees.

This new version (1.0.4) includes a support for semantic calculus
following the ideas of (Gardent and Kallmeyer, 2003, Kallmeyer and
Romero, 2008).

TuLiPA is developed in Java, its main features are:

* a relatively easy installation procedure (the only requirement is
  the GecodeJ library, which is freely available for all major
  platforms, cf,

* 2 interfaces, an intuitive graphical one, and a text-based one,

* an output graphical interface displaying the result of parsing
  (namely derivation tree, derived tree and flat semantic

* an XML export of the parsing result, allowing for the integration of
  TuLiPA within an NLP processing chain,

* the possibility to use an external Part-Of-Speech tagger (namely the
  TreeTagger developed at the University of Stuttgart),

* the possibility to parse either tree-based grammars, or RCGs

TuLiPA is being used in the context of the design of a TT-MCTAG for
German. For more information (and for examples of TT-MCTAG, TAG,
semantic TAG and RCG in the TuLiPA format -- including DTDs), please
consult the TuLiPA web page:

All comments, questions, feature requests, or bug reports are welcome.

With best regards,
on behalf of the Emmy-Noether project at University of Tuebingen,

  Yannick Parmentier

Message diffuse par la liste Langage Naturel <LN at>
Informations, abonnement :
English version       : 
Archives                 :

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  :

More information about the Ln mailing list