[Corpora-List] Product Announcement: Canoo's Morphology Software now available for Italian

Sandra Wendland sandra.wendland at canoo.com
Wed May 21 16:00:16 UTC 2003


*Deutsche Version siehe unten

Canoo’s Morphology Software now available for Italian

Canoo has released the first WMTrans products for Italian. The language technology company recently extended its product range to
cover further languages. Canoo now offers morphology software for German, English and Italian.

An Italian version of the
	WMTrans Lemmatizer
	WMTrans Inflection Analyzer
	WMTrans Inflection Analyzer / Generator
is now available at the product site:
http://www.canoo.com/wmtrans

Like their German and English counterparts, the Word Manager Transducers (WMTrans) for Italian provide functionality to analyze and
generate inflected Italian word forms.

WMTrans is based on the Canoo morphological dictionaries, containing:
-	more than 250'000 lexemes, generating 3 million fully categorized word forms for German,
-	50'000 lexemes, generating 115'000 word forms for English,
-	and 50’000 lexemes, generating 456'000 word forms for Italian.

The dictionaries include information on word formation dependencies, all types of morphological irregularities and spelling
variants.

An added benefit for Italian: WMTrans products process verb and pronoun contractions such as "dimmi", "pensandoci", "vattene", and
"credermelo". This is a powerful advantage and increases the number of recognized Italian word forms to 2'425'000.

The smart text processing software is used in retrieval and language processing applications. Typical use cases include word
stemming, intelligent search, text indexing, text mining, language learning, hyperlink generation, spell checking, grammar checking,
and machine translation.

The WMTrans Lemmatizer determines the base form of a word and its category. Consider the word form "vattene": The Lemmatizer
analyses the word, retrieves its base form, andare, and determines the word category, V (verb), plus details about any contractions.

		query   -> vattene
		result  -> andare (Cat V)(Contraction ti/Pron+ne/Pron+V)

The WMTrans Inflection Analyzer processes any word form, and delivers as a result a rich set of useful information on inflection.

For example, for the word "spiegatemela", the Inflection Analyzer returns the base form "spiegare" and the word category V (verb),
plus further morphosyntactic details such as number or verb tense:

		query   -> spiegatemela
		result  -> spiegare
				(Cat V)(Aux avere)(Mod Imp)(Pers 2nd)
				(Num PL)(Contraction mi/Pron+la/Pron+V)

WMTrans Inflection Analyzer / Generator offers two function calls. The Analyzer returns morphosyntactic information for an input
word such as its base form, word category, gender, case, tense, auxiliary verbs. The Generator delivers a list of all word forms
related to a base form. The word forms are followed by a list of morphosyntactic features related to each single form. See the
Inflection Analyzer / Generator output for the base form "andare", showing only verb forms in the first person, indicative as set by
the filter:

		query   -> andare   Filter: (Mod Ind)(Pers 1st)
		result  ->
		andai
		(Cat V)(Aux essere)(Mod Ind)
		(Temp Pass-Rem)(Pers 1st)(Num SG)(ID 0-1)
		andammo
		(Cat V)(Aux essere)(Mod Ind)
		(Temp Pass-Rem)(Pers 1st)(Num PL)(ID 0-1)
		andavo
		(Cat V)(Aux essere)(Mod Ind)(Temp Impf)
		(Pers 1st)(Num SG)(ID 0-1)
		andavamo
		(Cat V)(Aux essere)(Mod Ind)(Temp Impf)
		(Pers 1st)(Num PL)(ID 0-1)
		vado
		(Cat V)(Aux essere)(Mod Ind)(Temp Pres)
		(Pers 1st)(Num SG)(ID 0-1)
		andiamo
		(Cat V)(Aux essere)(Mod Ind)(Temp Pres)
		(Pers 1st)(Num PL)(ID 0-1)
		andrò
		(Cat V)(Aux essere)(Mod Ind)(Temp Fut)
		(Pers 1st)(Num SG)(ID 0-1)
		andremo
		(Cat V)(Aux essere)(Mod Ind)(Temp Fut)
		(Pers 1st)(Num PL)(ID 0-1)

The WMTrans products for Italian are available in Java and run on any platform with Java Runtime Environment (JRE) 1.3 or higher.

WMTrans product range allows developers to integrate functions such as word stemming, spell checking, and paradigm generation in
their applications.

For more information, see
http://www.canoo.com/wmtrans/
or contact:
Elisabeth Maier
Canoo Engineering AG
Kirschgartenstr. 7
CH-4051 Basel
Tel.: +41 61 228 94 44
mailto:wmtrans-info at canoo.com

=====================================================

Deutsche Version

=====================================================

Produktankündigung

Canoo’s Morphologiesoftware jetzt auch für Italienisch erhältlich

Canoo hat die WMTrans Produktreihe erweitert und bietet jetzt Morphologiesoftware für Italienisch an. Zusätzlich zu den
Softwarekomponenten für Deutsch und Englisch ist neu auch Italienisch verfügbar.

Eine italienische Version des
	WMTrans Lemmatizer
	WMTrans Inflection Analyzer
	WMTrans Inflection Analyzer / Generator
ist ab sofort erhältlich auf der WMTrans Produkt-Site unter:
http://www.canoo.com/wmtrans

Wie die entsprechenden deutschen und englischen Versionen bieten diese Word Manager Transducer (WMTrans) verschiedene Funktionen,
die flektierte italienische Wortformen analysieren bzw. generieren.

Basis bilden die Morphologie-Wörterbücher:
-	mit 250'000 Einträgen für Deutsch und der Möglichkeit drei Millionen deutsche Wortformen zu generieren,
-	50'000 Einträgen für Englisch und der Möglichkeit 115'000 englische Wortformen zu generieren,
-	und 50'000 Einträgen für Italienisch und der Möglichkeit 456'000 italienische Wortformen zu generieren.

Die Wörterbücher enthalten Details zur Wortbildung, Flexion und Rechtschreibung. Zusätzlich werden  Zusammenziehungen von Verb und
Pronomen wie "dimmi", "pensandoci", "vattene" und "credermelo" erfolgreich analysiert.  Dies ist ein wesentlicher Vorteil für
Italienisch: Die Zahl der möglichen erkannten italienischen Wortformen erhöht sich so auf 2'425'000.

WMTrans besteht aus einer Reihe von Softwareprodukten zur Aufbereitung und Recherche von Texten bespielsweise in Suchmaschinen und
Sprachanwendungen.
Typische Anwendungsbereiche sind Informationsextraktion, intelligente Suche, automatische Indexierung, Text Mining, Spracherwerb,
Hyperlink-Generierung, Rechtschreibprüfer, Grammatikprogramme und maschinelle Übersetzung.

Der WMTrans Lemmatizer ermittelt die Grundform eines italienischen Wortes und dessen Wortkategorie. Zum Beispiel: Für die Wortform
"vattene" findet der Lemmatizer die Grundform "andare" und die Kategorie V (Verb) sowie Details zur Zusammenziehung .

		query   -> vattene
		result  -> andare
				(Cat V)(Contraction ti/Pron+ne/Pron+V)

Der Inflection Analyzer ermittelt neben der Grundform und der Wortklasse eines Wortes zusätzliche grammatikalische und
orthografische Information.

Zum Beispiel für das Wort "spiegatemela" liefert der Inflection Analyzer die Grundform "spiegare", die Wortkategorie V (Verb) sowie
weitere morphosyntaktische Details wie zum Beispiel Numerus und Person:
		query   -> spiegatemela
		result  -> spiegare
				(Cat V)(Aux avere)(Mod Imp)(Pers 2nd)
				(Num PL)(Contraction mi/Pron+la/Pron+V)

Der WMTrans Inflection Analyzer / Generator bietet zwei Funktionsaufrufe. Der Analyzer ermittelt die Grundform und Kategorie eines
Wortes  sowie zusätzliche morphosyntaktische Information. Der Generator liefert alle flektierten Wortformen und
Rechtschreibvarianten für die gegebene Grundform mit einer Liste der jeweiligen morphosyntaktischen Eigenschaften. Das Beispiel
zeigt für die Grundform "andare" alle Verbformen die mit den Filterangaben 1. Person Indikativ übereinstimmen:

		query   -> andare   Filter: (Mod Ind)(Pers 1st)
		result  ->
		andai
		(Cat V)(Aux essere)(Mod Ind)
		(Temp Pass-Rem)(Pers 1st)(Num SG)(ID 0-1)
		andammo
		(Cat V)(Aux essere)(Mod Ind)
		(Temp Pass-Rem)(Pers 1st)(Num PL)(ID 0-1)
		andavo
		(Cat V)(Aux essere)(Mod Ind)(Temp Impf)
		(Pers 1st)(Num SG)(ID 0-1)
		andavamo
		(Cat V)(Aux essere)(Mod Ind)(Temp Impf)
		(Pers 1st)(Num PL)(ID 0-1)
		vado
		(Cat V)(Aux essere)(Mod Ind)(Temp Pres)
		(Pers 1st)(Num SG)(ID 0-1)
		andiamo
		(Cat V)(Aux essere)(Mod Ind)(Temp Pres)
		(Pers 1st)(Num PL)(ID 0-1)
		andrò
		(Cat V)(Aux essere)(Mod Ind)(Temp Fut)
		(Pers 1st)(Num SG)(ID 0-1)
		andremo
		(Cat V)(Aux essere)(Mod Ind)(Temp Fut)
		(Pers 1st)(Num PL)(ID 0-1)

Die WMTrans Produkte für Italienisch sind in Java erhältlich und laufen auf jeder Plattform mit dem Plug-In Java Runtime Environment
(JRE) 1.3 oder höher.

WMTrans bietet Entwicklern die Möglichkeit, Funktionen wie Stemming und Rechtschreibprüfung in ihre Anwendungen zu integrieren.

Weitere Information unter
http://www.canoo.com/wmtrans/

Kontakt:
Elisabeth Maier
Canoo Engineering AG
Kirschgartenstr. 7
CH-4051 Basel
Tel.: +41 61 228 94 44
mailto:wmtrans-info at canoo.com



--
Sandra Wendland
Canoo Engineering AG
Kirschgartenstrasse 7
CH-4051 Basel
Tel. +41 61 228 94 66
Fax +41 61 228 94 49
mailto:sandra.wendland at canoo.com
Web: http://www.canoo.com



More information about the Corpora mailing list