<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META content="text/html; charset=iso-8859-1" http-equiv=Content-Type>
<META content="MSHTML 5.00.3103.1000" name=GENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=#ffffff>
<DIV><FONT face=Arial size=2>Hello,</FONT></DIV>
<DIV> </DIV>
<DIV><FONT face=Arial size=2>as there have been quite a few 
responses</FONT></DIV>
<DIV><FONT face=Arial size=2>on my second query, I'll post another 
summary.</FONT></DIV>
<DIV><BR><FONT face=Arial size=2>In my second query, I asked for available 
newspaper</FONT></DIV>
<DIV><FONT face=Arial size=2>corpora in languages except (English, French, 
German</FONT></DIV>
<DIV><FONT face=Arial size=2>and Spanish, for which a lot of ressources seem to 
exist).</FONT></DIV>
<DIV> </DIV>
<DIV><FONT face=Arial size=2>Many thanks for your information!</FONT></DIV>
<DIV> </DIV>
<DIV><FONT face=Arial size=2>Best regards!</FONT></DIV>
<DIV><FONT face=Arial size=2>Jan Strunk</FONT></DIV>
<DIV><FONT face=Arial size=2><A 
href="mailto:strunk@linguistics.ruhr-uni-bochum.de">strunk@linguistics.ruhr-uni-bochum.de</A></FONT></DIV>
<DIV> </DIV>
<DIV><FONT face=Arial size=2>Rik De Busser suggest a meta-site:</FONT><FONT 
face=Arial size=2><BR>>This might help:<BR>><A 
href="http://www.ims.uni-stuttgart.de/info/Newspapers.html">http://www.ims.uni-stuttgart.de/info/Newspapers.html</A><BR>>(Not 
all of them are for free)<BR></FONT></DIV>
<DIV><FONT face=Arial size=2>Yvonne suggested the following 
sources:</FONT></DIV>
<DIV><FONT face=Arial size=2>
<P class=MsoNormal><FONT color=navy face=Arial size=2><SPAN lang=EN-GB 
style="COLOR: navy; FONT-FAMILY: Arial; FONT-SIZE: 10pt">>Danish  <A 
href="http://korpus.dsl.dk/korpus2000/indgang.php">http://korpus.dsl.dk/korpus2000/indgang.php</A></SPAN></FONT></P>
<P class=MsoNormal><FONT color=navy face=Arial size=2><SPAN 
style="COLOR: navy; FONT-FAMILY: Arial; FONT-SIZE: 10pt">>Bosnian 
</SPAN></FONT><FONT color=navy face=Arial size=2><SPAN lang=EN-GB 
style="COLOR: navy; FONT-FAMILY: Arial; FONT-SIZE: 10pt"><A 
href="http://www.tekstlab.uio.no/Bosnian/Corpus.html"><SPAN 
lang=DE>http://www.tekstlab.uio.no/Bosnian/Corpus.html</SPAN></A></SPAN></FONT></P>
<P class=MsoNormal><FONT color=navy face=Arial size=2><SPAN lang=EN-GB 
style="COLOR: navy; FONT-FAMILY: Arial; FONT-SIZE: 10pt">>Swedish  <A 
href="http://spraakdata.gu.se/lb/konk/">http://spraakdata.gu.se/lb/konk/</A></SPAN></FONT></P></DIV>
<DIV class=MsoNormal>Antti Arppe suggested the Finnish language bank:</DIV>
<DIV class=MsoNormal>>Well there is a substantial amount of Finnish newspaper 
corpora (tens<BR>>of millions of words) and a lesser amount of Swedish 
newspaper<BR>>material (published in Finland) available in the Finnish text 
bank:<BR>><BR>><A 
href="http://www.csc.fi/kielipankki/">http://www.csc.fi/kielipankki/</A><BR>><BR>>All 
the info appears to be in Finnish or Swedish, but you can try to<BR>>contact 
e.g. Manne Miettinen, tel. +358 9 457 2517 e-mail:<BR>><<A 
href="mailto:manne.miettinen@csc.fi">manne.miettinen@csc.fi</A>>.<BR></DIV>
<DIV class=MsoNormal>Elisabeth Burr:</DIV>
<DIV class=MsoNormal>>I can only help out with Italian, French and Spanish 
newspaper corpora.<BR>>See:<BR>><BR>><A 
href="http://www.uni-duisburg.de/Fak2/FremdPhil/Romanistik/Personal/Burr/humcomp/" 
eudora="autourl">http://www.uni-duisburg.de/Fak2/FremdPhil/Romanistik/Personal/Burr/humcomp/</A><BR>><BR><FONT 
face="Times New Roman, Times">>Oxford Text Archive Corpus of Italian 
Newspapers<BR></FONT><FONT face=Arial>><BR></FONT><FONT 
face="Times New Roman, Times" size=3>>“Italian Newspaper Corpus (ita03)”, in: 
Association for Computational Linguistics:<BR><I>>European Corpus Initiative 
Multilingual Corpus 1</I> (ECI/MCI) CD-ROM:<BR>>\data\ eci1\ <BR><FONT 
face=Arial size=2></FONT></FONT></DIV>
<DIV class=MsoNormal><FONT face="Times New Roman, Times" size=3><FONT face=Arial 
size=2>Bilge Say:<BR></FONT></FONT>>About your recent posting to 
corpora-list, we have a corpus of 2 M words of post<BR>>1990 written Turkish, 
which includes about 40% newspaper material (not all<BR>>of them news items 
though, including editorials, columns etc). It is available for<BR>>free for 
academic purposes; contact our project assistant Umut Ozge at<BR>><A 
href="mailto:umut@ii.metu.edu.tr">umut@ii.metu.edu.tr</A><BR>>for filling out 
the required form and receiving the corpus over 
the<BR>>Internet.<BR>><BR>>Kemal Oflazer at Sabanci University has also 
a newspaper corpus of Turkish<BR>>(I think about 10 M words). He can be 
contacted at  <A 
href="mailto:oflazer@sabanciuniv.edu">oflazer@sabanciuniv.edu</A><BR></DIV>
<DIV class=MsoNormal>Seza Dogruoz suggested that I contact Bilge Say.</DIV>
<DIV class=MsoNormal> </DIV>
<DIV class=MsoNormal>Shlomo Yona also suggested a Turkish corpus and offered 
help with Hebrew:</DIV>
<DIV class=MsoNormal>>I have corpora of newspaper articles in 
Hebrew.<BR>>Tagged Turkish news text can be found at:<BR>><A 
href="http://www.nlp.cs.bilkent.edu.tr/Center/Corpus/">http://www.nlp.cs.bilkent.edu.tr/Center/Corpus/</A><BR></DIV>
<DIV class=MsoNormal>and last but not least, Paul McNamee suggested the CLEF 
project.</DIV>
<DIV class=MsoNormal>>Not for those three, but the CLEF activity has created 
a newspaper<BR>>corpus in 8 languages with O(100k) articles per language from 
the years<BR>>1994 and 1995. In addition to German and English they 
have:<BR>>Dutch, Finnish, French, Italian, Spanish, and Swedish.  Check 
out<BR>>the CLEF site at <A 
href="http://www.clef-campaign.org/">http://www.clef-campaign.org/</A>  You 
might also want<BR>>to investigate the holdings of ELRA and the 
LDC.<BR><BR>Many thanks again!</DIV>
<DIV class=MsoNormal> </DIV></FONT></BODY></HTML>