[Corpora-List] DGfS-06 http://www.spectrum.uni-bielefeld.de/DGfS/ Workshop on Corpus-based Approaches to Non-compositional Phenomena

Tue Jun 21 16:44:42 UTC 2005

***********************************************************************************************************

DGfS-06 Workshop on Corpus-based Approaches to Non-compositional
Phenomena (http://www.spectrum.uni-bielefeld.de/DGfS/)

February 22 -24, 2006
Bielefeld, Germany

************************************************************************************************************

Workshop Description
=================

Metaphors, metonymies, idioms and support verb constructions are
omnipresent in every day language. These non-compositional phenomena
contradict - to different degress - the somewhat idealising, but still
common assumption, that meanings of complex expressions can be
systematically derived from their parts.

Recently, corpus-based methods have become an important methodology in
lexical semantics. In this new research paradigm, non-compositional
phenomena have to be dealt with in one some way or other. To date,
theoretically well-founded principles for the annotation of such
non-compositional phenomena have not yet been fully worked out. In
particular, language resources for the automatic identification and
representation are still rare.

In the last couple of years, several projects have chosen
non-compositional phenomena as a central research topic. Large data
bases for the phenomena under consideration have been built in projects
such as "Collocations in the German Language"
(http://www.bbaw.de/bbaw/Forschung/Forschungsprojekte/kollokationen) or
the "Hamburg Metaphor Database" (http://www.rrz.uni-hamburg.de/metaphern).

An important question in this area of research is how to bridge the gap
between traditional theory (e.g. Cognitive Linguistics/Lakoff's theory
of metaphors) and recent corpus-based approaches. Moreover, we can
expect that corpus-based approaches will lead to a new perspective on
the phenomena under consideration and to an empirical evaluation of
(established) theories.

The goal of the workshop is to give researchers in this field the
opportunity to report on and to exchange experiences with different
aspects of corpus-based research on non-compositional phenomena.
Contributions addressing the following topics are particularly welcome:

-    Typology or classification schemes
-    Semantic annotation and annotation schemes
-    Empirical evaluation of corpora
-    Representation within the lexicon
-    Building of lexical data bases
-    Integration into computational linguistics
oriented/machine-readable resources (such as Frame Net, Word Net,
Propbank ...)
-    Automatic identification/analysis
-    Automatic annotation
-    Cross-lingual studies/parallel corpora

Organizers:
=========

Manfred Pinkal, Universität des Saarlandes, Germany
Andrea Kowalski  (kowalski at coli.uni-sb.de) Universität des Saarlandes,
Germany

Important Dates:
============

Abstract submission deadline: August 15, 2005
Notification of acceptance: September 5, 2005
Camera ready copy: October 15, 2005
Workshop date: February 22 - 24, 2006

Submission Information:
==================

Extended abstracts of one page should be submitted to the following
email address:

kowalski at coli.uni-sb.de

In order to be fully considered, submissions must arrive by August 20,
2005. The language of the abstracts/talks should be English or German,
discussion language of the workshop will be German.

Please note that according to the DGfS guidelines no speaker is allowed
to give a talk in more than one workshop of the DGfs conference.

Registration and Accomodation:
========================

Information about registration, participation fee, accomodation, and
location will be available on  http:///www.spctrum.uni-bielefeld.de/DGfS.

Contact Information:
================

Andrea Kowalski
Fachrichtung 4.7 Allgemeine Linguistik
Universität des Saarlandes
Im Stadtwald - Gebäude 45
Postfach 151150
66041 Saarbrücken
kowalski at coli.uni-sb.de
tel + 49 (0)681/302 70032

***************************************************************************************************************************

Korpusbasierte Behandlung nichtkompositioneller Phänomene

Nichtkompositionelle Phänomene sind in der Alltagssprache weit
verbreitet. Hierunter fallen u.a. Phänomene wie Metaphern, Metonymien,
Idiome oder Funktionsverbgefüge. Sprachliche Phänomene dieser Art
widersprechen (in unterschiedlichen Graden) der immer noch gängigen
Idealisierung, dass sich die Bedeutung komplexer Ausdrücke systematisch
auf die Bedeutungen ihrer Teilausdrücke zurückführen lässt. Seit wenigen
Jahren werden korpusbasierte Methoden vermehrt auch auf
lexikalisch-semantische Fragestellungen angewandt. Dabei hat sich
deutlich gezeigt, dass nichtkompositioneller Sprachgebrauch schon
aufgrund der bloßen Vorkommenshäufigkeit keinen randständigen oder
vernachlässigbaren Forschungsgegenstand darstellen kann. In der
korpuslinguistischen Forschung fehlen jedoch noch immer theoretisch
fundierte Prinzipien für die Annotation dieser Phänomene. Insbesondere
ist noch immer ein Mangel an Daten und Methoden für die automatische
Identifikation und Repräsentation zu verzeichnen. Erst in den letzten
Jahren sind Projekte entstanden, die nichtkompositionelle Phänomene zum
Kern korpusbasierter Forschung machen und z.T. große Datenbanken für die
jeweiligen Phänomene aufbauen (z.B. "Kollokationen im Wörterbuch" unter
der Leitung von C. Fellbaum oder die "Hamburger Metapherndatenbank",
Leitung  W. Settekorn). In diesem Forschungskontext stellt sich auch die
Frage, wie die Lücke zwischen traditionellen Theorien (z.B. kognitive
Linguistik/Lakoffs Metapherntheorie) und neuen Korpusmethoden
geschlossen werden kann. Zu erwarten stehen einerseits die empirische
Überprüfung von Theorien; andererseits können neue Ressourcen zu neuen
Sichtweisen auf die Phänomene führen.)
Ziel der AG ist es, Forscher zusammenzubringen, die sich aus einer
korpuslinguistischen Perspektive mit verschiedenen Aspekten der
Behandlung nichtkompositioneller Phänomene befassen. Hierunter fallen
vor allem die folgenden (computer-)linguistischen Themenbereiche:
-   Typologie/Klassifikationsschemata
-    Semantische Annotation und Annotationsschemata
-    Empirische Auswertung von Korpora
-    Behandlung/Repräsentation im Lexikon
-    Aufbau lexikalischer Datenbanken
-    Möglichkeiten für die Integration in computerlinguistisch
orientierte bzw. computerlesbare Ressourcen (wie WordNet, FrameNet,
PropBank)
-    Automatisierung von Identifikations- und Analyseverfahren
-    Automatisierung von Annotationsverfahren
-    sprachübergreifende Studien/parallele Korpora
Hierbei sollen natürlich Arbeiten präsentiert werden, die in größeren
Projektzusammenhängen durchgeführt werden, aber auch korpusbasierte
Einzelanalysen sind von Interesse.