17.3092, Diss: Computational Ling/Semantics: Wegner: 'Neighborhoods in Seman...'

LINGUIST Network linguist at LINGUISTLIST.ORG
Fri Oct 20 20:44:15 UTC 2006


LINGUIST List: Vol-17-3092. Fri Oct 20 2006. ISSN: 1068 - 4875.

Subject: 17.3092, Diss: Computational Ling/Semantics: Wegner: 'Neighborhoods in Seman...'

Moderators: Anthony Aristar, Eastern Michigan U <aristar at linguistlist.org>
            Helen Aristar-Dry, Eastern Michigan U <hdry at linguistlist.org>
 
Reviews: Laura Welcher, Rosetta Project / Long Now Foundation  
         <reviews at linguistlist.org> 

Homepage: http://linguistlist.org/

The LINGUIST List is funded by Eastern Michigan University, Wayne
State University, and donations from subscribers and publishers.

Editor for this issue: Hannah Morales <hannah at linguistlist.org>
================================================================  

To post to LINGUIST, use our convenient web form at
http://linguistlist.org/LL/posttolinguist.html.


===========================Directory==============================  

1)
Date: 19-Oct-2006
From: Armin Wegner < arminwegner at googlemail.com >
Subject: Neighborhoods in Semantic Space (Nachbarschaften im semantischen Raum) 

	
-------------------------Message 1 ---------------------------------- 
Date: Fri, 20 Oct 2006 16:42:26
From: Armin Wegner < arminwegner at googlemail.com >
Subject: Neighborhoods in Semantic Space (Nachbarschaften im semantischen Raum) 
 


Institution: Universität Trier 
Program: Computational Linguistics 
Dissertation Status: Completed 
Degree Date: 2006 

Author: Armin Wegner

Dissertation Title: Neighborhoods in Semantic Space (Nachbarschaften im
semantischen Raum) 

Dissertation URL:  http://ubt.opus.hbz-nrw.de/volltexte/2006/373/

Linguistic Field(s): Computational Linguistics
                     Semantics


Dissertation Director(s):
Reinhard Köhler
Burghard Rieger

Dissertation Abstract:

Mathematical methods and algorithms in cluster analysis are studied with
respect to meaning representation. The prerequisites and conditions of the
cluster analytical approach within descriptive and exploratory data
analysis as well as the possibilities of its application are discussed. The
methods described can be utilised for adequate determination and
description of groups of meaning points in semantic space, whose spatial
locations and topological neighborhoods correspond to similarities of word
meanings in texts. Known weaknesses of cluster analysis are on one hand the
number of free parameters and on the other hand the influence on the
quality of the expected results exerted by the choice of traditional
cluster criteria since each of them implies particular constraining
assumptions about the structure of the data. This general problem causes
some difficulty in predicting the success and the adequacy of unsupervised
classifications, with implications reaching far beyond the domain of
quantitative linguistics proper. To overcome these difficulties a new
cluster procedure is invented that is mainly driven by the data and its
structure and does not that strongly impose a certain implied model on the
data.


Es werden die mathematischen Methoden und algorithmischen Verfahren der
Clusteranalyse im Hinblick auf Bedeutungsrepräsentationen untersucht. Im
Rahmen der deskriptiven und explorativen Datenanalyse werden die
Voraussetzungen und Bedingungen des clusteranalytischen Ansatzes und die
Möglichkeiten seiner Anwendung diskutiert, die zur adäquaten Ermittlung und
Beschreibung von Gruppierungen von Bedeutungspunkten im semantischen Raum
verwendet werden, welche nach räumlicher Lage und topologischen
Nachbarschaften den Ähnlichkeiten von Bedeutungen sprachlicher Zeichen in
Texten entsprechen. Dabei ist die große Anzahl frei wählbarer Parameter und
der Einfluß, den jede Wahl eines der bekannten clusteranalytischen
Verfahren in Bezug auf die vorauszusetzenden Vorkenntnisse von der Struktur
der zu untersuchenden Daten auf die Güte der erwartbaren Ergebnisse hat,
eine bekannte Schwäche der Clusteranalyse. Diese generelle Problematik
belastet die Abschätzbarkeit von Erfolg und Adäquatheit unüberwachter
Klassifikationsverfahren weit über die quantitativ-linguistischen
Untersuchungen in der Gebrauchssemantik hinaus. Deshalb wird ein neues
Verfahren entwickelt, welches den analysierten Daten in geringerem Maße als
bisher Strukturen aufprägt und in höherem Maße als bisher von den
analysierten Daten und ihren Strukturen gesteuert wird. 




-----------------------------------------------------------
LINGUIST List: Vol-17-3092	

	



More information about the LINGUIST mailing list