<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META content="text/html; charset=iso-8859-1" http-equiv=Content-Type>
<META content="MSHTML 5.00.3103.1000" name=GENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=#ffffff>
<DIV><FONT face=Arial size=2>Hi,</FONT></DIV>
<DIV> </DIV>
<DIV><FONT face=Arial size=2>yesterday I had asked for suggestions</FONT><FONT 
face=Arial size=2> about newspaper corpora.</FONT></DIV>
<DIV><FONT face=Arial size=2>Many thanks to the people you</FONT><FONT 
face=Arial size=2> have answered so far.</FONT></DIV>
<DIV><FONT face=Arial size=2>They already provided me with a lot</FONT><FONT 
face=Arial size=2> of suggestions (summary below).</FONT></DIV>
<DIV><FONT face=Arial size=2> </FONT></DIV>
<DIV><FONT face=Arial size=2>Unfortunately,</FONT><FONT face=Arial size=2> all 
the suggested corpora were either</FONT></DIV>
<DIV><FONT face=Arial size=2>in English or in German.</FONT><FONT face=Arial 
size=2> Its exactly these two languages that</FONT></DIV>
<DIV><FONT face=Arial size=2>I have already evaluated (on the</FONT><FONT 
face=Arial size=2> Wall Street Journal corpus and</FONT></DIV>
<DIV><FONT face=Arial size=2>Neue Zürcher Zeitung).</FONT></DIV>
<DIV> </DIV>
<DIV><FONT face=Arial size=2>Do you perhaps know of any newspaper corpora in 
other languages like Danish</FONT><FONT face=Arial size=2>,</FONT></DIV>
<DIV><FONT face=Arial size=2>Turkish or Hungarian?</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT> </DIV>
<DIV><FONT face=Arial size=2>Thanks!</FONT></DIV>
<DIV><BR><FONT face=Arial size=2>Jan</FONT></DIV>
<DIV><FONT face=Arial size=2><A 
href="mailto:strunk@linguistics.ruhr-uni-bochum.de">strunk@linguistics.ruhr-uni-bochum.de</A></FONT></DIV>
<DIV><FONT face=Arial size=2>Sprachwissenschaftliches Institut</FONT></DIV>
<DIV><FONT face=Arial size=2>Ruhr-Universität Bochum</FONT></DIV>
<DIV><FONT face=Arial size=2>Germany</FONT></DIV>
<DIV> </DIV>
<DIV> <FONT face=Arial size=2>Summary of the responses I got so 
far:</FONT></DIV>
<DIV> </DIV>
<DIV><FONT face=Arial size=2>Mahtab Nikkhou suggested looking at the ELDA 
ressources collection:</FONT></DIV>
<DIV><FONT face=Arial size=2>>You may have a look at ELDA's on-line language 
resources catalogue from: <BR>><A 
href="http://www.elda.fr/cata/tabtext.html">http://www.elda.fr/cata/tabtext.html</A><BR>>If 
you wish to order a database, please contact Ms Valerie Mapelli at <BR>><A 
href="mailto:mapelli@elda.fr">mapelli@elda.fr</A><BR></FONT></DIV>
<DIV><FONT face=Arial size=2>Jana Diesner suggested the following for 
German:</FONT></DIV>
<DIV><FONT face=Arial size=2>
<DIV><FONT face=Arial size=2>> der klassiker: <A 
href="http://corpora.ids-mannheim.de/~cosmas/">http://corpora.ids-mannheim.de/~cosmas/</A>, 
</FONT><FONT face=Arial size=2>auch unter: </FONT><FONT face=Arial size=2><A 
href="http://www.ids-mannheim.de/kt/corpora.shtml">http://www.ids-mannheim.de/kt/corpora.shtml</A></FONT></DIV>
<DIV><FONT face=Arial size=2>> alternativ: <A 
href="http://www.coli.uni-sb.de/sfb378/negra-corpus/">http://www.coli.uni-sb.de/sfb378/negra-corpus/</A></FONT></DIV>
<DIV> </DIV>
<DIV>
<DIV><SPAN class=973470615-14042003><FONT face=Arial size=2>Tony 
Rose:</FONT></SPAN></DIV>
<DIV><SPAN class=973470615-14042003><FONT color=#0000ff face=Arial size=2>> 
You could also try the Reuters Corpus:</FONT></SPAN></DIV>
<DIV><SPAN class=973470615-14042003><FONT color=#0000ff face=Arial size=2><FONT 
color=#000000>> </FONT><A 
href="http://about.reuters.com/researchandstandards/corpus/">http://about.reuters.com/researchandstandards/corpus/</A></FONT></SPAN></DIV>
<DIV>><SPAN class=973470615-14042003><FONT color=#0000ff face=Arial size=2> 
It's an archive of some 800,000 English language news stories, is freely 
available, and marked up in XML (NewsML in fact).</FONT></SPAN><BR><BR>Jerome 
Richalot:</DIV>
<DIV>
<DIV><FONT color=#0000ff face=Arial size=2><SPAN 
class=853503614-14042003>>How about the METER COrpus at</SPAN></FONT></DIV>
<DIV><FONT color=#0000ff face=Arial size=2><SPAN class=853503614-14042003><FONT 
color=#000000>></FONT><A 
href="http://www.dcs.shef.ac.uk/nlp/meter/Metercorpus/metercorpus.htm">http://www.dcs.shef.ac.uk/nlp/meter/Metercorpus/metercorpus.htm</A></SPAN></FONT></DIV>
<DIV><FONT color=#0000ff face=Arial size=2><SPAN 
class=853503614-14042003></SPAN></FONT> </DIV></DIV>
<DIV>And last but not least Thorsten Brants proposed the NEGRA corpus:</DIV>
<DIV>>the NEGRA Corpus (<A 
href="http://www.coli.uni-sb.de/sfb378/negra-corpus/)">http://www.coli.uni-sb.de/sfb378/negra-corpus/)</A><BR>>contains 
articles from the German newspaper Frankfurter Rundschau.<BR>>As part of the 
syntactic annotation, the texts are separated into sentences,<BR>>which 
disambiguates the periods.<BR></DIV>
<DIV>Thanks again!</DIV>
<DIV> </DIV></DIV></DIV></FONT>
<BLOCKQUOTE 
style="BORDER-LEFT: #000000 2px solid; MARGIN-LEFT: 5px; MARGIN-RIGHT: 0px; PADDING-LEFT: 5px; PADDING-RIGHT: 0px">
  <DIV> </DIV></BLOCKQUOTE></BODY></HTML>