[Corpora-List] Reminder: last CfP DGfS-06 Workshop on Corpus-based Approaches to Non-compositional Phenomena

Andrea Kowalski kowalski at CoLi.Uni-SB.DE
Mon Aug 8 14:42:56 UTC 2005


*********************************************************************************************************** 


DGfS-06 Workshop on Corpus-based Approaches to Non-compositional 
Phenomena (http://www.spectrum.uni-bielefeld.de/DGfS/)

February 22 -24, 2006
Bielefeld, Germany

************************************************************************************************************ 



Workshop Description
=================

Metaphors, metonymies, idioms and support verb constructions are 
omnipresent in every day language. These non-compositional phenomena 
contradict - to different degress - the somewhat idealising, but still 
common assumption, that meanings of complex expressions can be 
systematically derived from their parts.

Recently, corpus-based methods have become an important methodology in 
lexical semantics. In this new research paradigm, non-compositional 
phenomena have to be dealt with in one some way or other. To date, 
theoretically well-founded principles for the annotation of such 
non-compositional phenomena have not yet been fully worked out. In 
particular, language resources for the automatic identification and 
representation are still rare.

In the last couple of years, several projects have chosen 
non-compositional phenomena as a central research topic. Large data 
bases for the phenomena under consideration have been built in projects 
such as "Collocations in the German Language" 
(http://www.bbaw.de/bbaw/Forschung/Forschungsprojekte/kollokationen) or 
the "Hamburg Metaphor Database" (http://www.rrz.uni-hamburg.de/metaphern).

An important question in this area of research is how to bridge the gap 
between traditional theory (e.g. Cognitive Linguistics/Lakoff's theory 
of metaphors) and recent corpus-based approaches. Moreover, we can 
expect that corpus-based approaches will lead to a new perspective on 
the phenomena under consideration and to an empirical evaluation of 
(established) theories.

The goal of the workshop is to give researchers in this field the 
opportunity to report on and to exchange experiences with different 
aspects of corpus-based research on non-compositional phenomena. 
Contributions addressing the following topics are particularly welcome:

-    Typology or classification schemes
-    Semantic annotation and annotation schemes
-    Empirical evaluation of corpora
-    Representation within the lexicon
-    Building of lexical data bases
-    Integration into computational linguistics 
oriented/machine-readable resources (such as Frame Net, Word Net, 
Propbank ...)
-    Automatic identification/analysis
-    Automatic annotation
-    Cross-lingual studies/parallel corpora


Organizers:
=========

Manfred Pinkal, Universität des Saarlandes, Germany
Andrea Kowalski  (kowalski at coli.uni-sb.de) Universität des Saarlandes, 
Germany


Important Dates:
============

Abstract submission deadline: August 15, 2005
Notification of acceptance: September 5, 2005
Camera ready copy: October 15, 2005
Workshop date: February 22 - 24, 2006


Submission Information:
==================

Extended abstracts of one page should be submitted to the following 
email address:

kowalski at coli.uni-sb.de 
In order to be fully considered, submissions must arrive by August 20, 
2005. The language of the abstracts/talks should be English or German, 
discussion language of the workshop will be German.

Please note that according to the DGfS guidelines no speaker is allowed 
to give a talk in more than one workshop of the DGfs conference.


Registration and Accomodation:
========================

Information about registration, participation fee, accomodation, and 
location will be available on  http:///www.spctrum.uni-bielefeld.de/DGfS.


Contact Information:
================

Andrea Kowalski
Fachrichtung 4.7 Allgemeine Linguistik
Universität des Saarlandes
Im Stadtwald - Gebäude 45
Postfach 151150
66041 Saarbrücken
kowalski at coli.uni-sb.de
tel + 49 (0)681/302 70032

*************************************************************************************************************************** 


Korpusbasierte Behandlung nichtkompositioneller Phänomene


Nichtkompositionelle Phänomene sind in der Alltagssprache weit 
verbreitet. Hierunter fallen u.a. Phänomene wie Metaphern, Metonymien, 
Idiome oder Funktionsverbgefüge. Sprachliche Phänomene dieser Art 
widersprechen (in unterschiedlichen Graden) der immer noch gängigen 
Idealisierung, dass sich die Bedeutung komplexer Ausdrücke systematisch 
auf die Bedeutungen ihrer Teilausdrücke zurückführen lässt. Seit wenigen 
Jahren werden korpusbasierte Methoden vermehrt auch auf 
lexikalisch-semantische Fragestellungen angewandt. Dabei hat sich 
deutlich gezeigt, dass nichtkompositioneller Sprachgebrauch schon 
aufgrund der bloßen Vorkommenshäufigkeit keinen randständigen oder 
vernachlässigbaren Forschungsgegenstand darstellen kann. In der 
korpuslinguistischen Forschung fehlen jedoch noch immer theoretisch 
fundierte Prinzipien für die Annotation dieser Phänomene. Insbesondere 
ist noch immer ein Mangel an Daten und Methoden für die automatische 
Identifikation und Repräsentation zu verzeichnen. Erst in den letzten 
Jahren sind Projekte entstanden, die nichtkompositionelle Phänomene zum 
Kern korpusbasierter Forschung machen und z.T. große Datenbanken für die 
jeweiligen Phänomene aufbauen (z.B. "Kollokationen im Wörterbuch" unter 
der Leitung von C. Fellbaum oder die "Hamburger Metapherndatenbank", 
Leitung  W. Settekorn). In diesem Forschungskontext stellt sich auch die 
Frage, wie die Lücke zwischen traditionellen Theorien (z.B. kognitive 
Linguistik/Lakoffs Metapherntheorie) und neuen Korpusmethoden 
geschlossen werden kann. Zu erwarten stehen einerseits die empirische 
Überprüfung von Theorien; andererseits können neue Ressourcen zu neuen 
Sichtweisen auf die Phänomene führen.)
Ziel der AG ist es, Forscher zusammenzubringen, die sich aus einer 
korpuslinguistischen Perspektive mit verschiedenen Aspekten der 
Behandlung nichtkompositioneller Phänomene befassen. Hierunter fallen 
vor allem die folgenden (computer-)linguistischen Themenbereiche:
-   Typologie/Klassifikationsschemata
-    Semantische Annotation und Annotationsschemata
-    Empirische Auswertung von Korpora
-    Behandlung/Repräsentation im Lexikon
-    Aufbau lexikalischer Datenbanken
-    Möglichkeiten für die Integration in computerlinguistisch 
orientierte bzw. computerlesbare Ressourcen (wie WordNet, FrameNet, 
PropBank)
-    Automatisierung von Identifikations- und Analyseverfahren
-    Automatisierung von Annotationsverfahren
-    sprachübergreifende Studien/parallele Korpora
Hierbei sollen natürlich Arbeiten präsentiert werden, die in größeren 
Projektzusammenhängen durchgeführt werden, aber auch korpusbasierte 
Einzelanalysen sind von Interesse.



More information about the Corpora mailing list