<div class="gmail_quote"><div>Dear Alisa,</div><div><br></div><div>For English-Spanish you can also check the United Nation corpora.</div><div><br></div><div>Best,</div><div><br></div><div>Wilker</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">


<br>
Message: 14<br>
Date: Mon, 8 Aug 2011 22:56:39 -0500<br>
From: Alisa Zhi <<a href="mailto:proloxx@mail.ru">proloxx@mail.ru</a>><br>
Subject: [Corpora-List]  English-Spanish parallel corpus?<br>
To: <a href="mailto:corpora@uib.no">corpora@uib.no</a> <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
<br>
Dear Corpora-Members,<br>
<br>
Can anybody advise me an  English-Spanish or<br>
any  other  European  Language/Slavic  -  Spanish  corpus?  Preferably freely<br>
available but I will appreciate any options.<br>
<br>
Thanks in advance!<br>
<br>
Alisa Zhila,<br>
<br>
NLP PhD Student at CIC IPN, Mexico<br>
<br>
<br>
<br>
--<br>
? ?????????,<br>
 Alisa                          mailto:<a href="mailto:proloxx@mail.ru">proloxx@mail.ru</a><br>
<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 15<br>
Date: Tue, 9 Aug 2011 05:48:16 +0100 (BST)<br>
From: Bill Louw <<a href="mailto:louwfirth@yahoo.com">louwfirth@yahoo.com</a>><br>
Subject: Re: [Corpora-List] PS:minimal changes in a paragraph (based<br>
        on a    corpus it appeared) ... (2nd attempt (after first one was<br>
        deleted))<br>
To: <a href="mailto:corpora@uib.no">corpora@uib.no</a>, Albretch Mueller <<a href="mailto:lbrtchx@gmail.com">lbrtchx@gmail.com</a>><br>
<br>
Albretch,<br>
 <br>
It may be of interest to you and to members of the list that the method I proposed works in other languages. Structural issues of argument are likely to be universal, as the article listed below demonstrates.<br>
 <br>
Milojkovic M. (2011). Semantic Prosody and Subtext as Universal, Collocation-Based Instrumentation for Meaning and Literary Worlds. In Zaharov V.P. (et al.), ????? ????????????? ??????????? «????????? ??????????? ? 2011». St Petersburg: St Petersburg State University, Faculty of Philology. 47-52<br>


<br>
<br>
--- On Tue, 9/8/11, Albretch Mueller <<a href="mailto:lbrtchx@gmail.com">lbrtchx@gmail.com</a>> wrote:<br>
<br>
<br>
From: Albretch Mueller <<a href="mailto:lbrtchx@gmail.com">lbrtchx@gmail.com</a>><br>
Subject: [Corpora-List] minimal changes in a paragraph (based on a corpus it appeared) ... (2nd attempt (after first one was deleted))<br>
To: <a href="mailto:corpora@uib.no">corpora@uib.no</a><br>
Date: Tuesday, 9 August, 2011, 2:24<br>
<br>
<br>
~<br>
Say, you have a certain paragraph belonging to a text and relating to<br>
the other paragraphs of that same text and to other ones of other<br>
texts and you want to generate similar paragraphs.<br>
~<br>
How could you do that?<br>
~<br>
Thanks<br>
lbrtchx<br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 3213 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20110809/c54bd7a8/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20110809/c54bd7a8/attachment.txt</a>><br>
<br>
------------------------------<br>
<br>
Message: 16<br>
Date: Tue, 9 Aug 2011 09:48:32 +0200<br>
From: Simon Carter <<a href="mailto:s.c.carter@uva.nl">s.c.carter@uva.nl</a>><br>
Subject: Re: [Corpora-List] English-Spanish parallel corpus?<br>
To: Alisa Zhi <<a href="mailto:proloxx@mail.ru">proloxx@mail.ru</a>><br>
Cc: "<a href="mailto:corpora@uib.no">corpora@uib.no</a>" <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
<br>
Check out the Europarl Corpus <a href="http://www.statmt.org/europarl/" target="_blank">http://www.statmt.org/europarl/</a>.<br>
<br>
>From this you should be create a parallel corpus between any two european Languages.<br>
I think version 6 (i.e what you see on the first page) comes pretty well pre-packaged and cleaned, so you may want to check out version 5 for greater flexibility, depending on your needs (<a href="http://www.statmt.org/europarl/archives.html#v5" target="_blank">http://www.statmt.org/europarl/archives.html#v5</a>).<br>


<br>
<br>
Simon Carter<br>
ISLA, Informatics Institute,<br>
University of Amsterdam,<br>
Science Park 107<br>
1098 XG Amsterdam<br>
Phone: +31 (0)20 525 6731<br>
Email: <a href="mailto:s.c.carter@uva.nl">s.c.carter@uva.nl</a><br>
Web: <a href="http://www.scarter.org" target="_blank">www.scarter.org</a><br>
<br>
On Aug 9, 2011, at 5:56 AM, Alisa Zhi wrote:<br>
<br>
> Dear Corpora-Members,<br>
><br>
> Can anybody advise me an  English-Spanish or<br>
> any  other  European  Language/Slavic  -  Spanish  corpus?  Preferably freely<br>
> available but I will appreciate any options.<br>
><br>
> Thanks in advance!<br>
><br>
> Alisa Zhila,<br>
><br>
> NLP PhD Student at CIC IPN, Mexico<br>
><br>
><br>
><br>
> --<br>
> ? ?????????,<br>
> Alisa                          mailto:<a href="mailto:proloxx@mail.ru">proloxx@mail.ru</a><br>
><br>
><br>
> _______________________________________________<br>
> UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
> Corpora mailing list<br>
> <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
> <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 17<br>
Date: Tue, 9 Aug 2011 10:09:43 +0200<br>
From: Joerg Tiedemann <<a href="mailto:jorg.tiedemann@lingfil.uu.se">jorg.tiedemann@lingfil.uu.se</a>><br>
Subject: Re: [Corpora-List] English-Spanish parallel corpus?<br>
To: Alisa Zhi <<a href="mailto:proloxx@mail.ru">proloxx@mail.ru</a>><br>
Cc: "<a href="mailto:corpora@uib.no">corpora@uib.no</a>" <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
<br>
Other common free data sets including Spanish are available here:<br>
<br>
<a href="http://langtech.jrc.it/JRC-Acquis.html" target="_blank">http://langtech.jrc.it/JRC-Acquis.html</a><br>
<a href="http://www.euromatrixplus.eu/multi-un/" target="_blank">http://www.euromatrixplus.eu/multi-un/</a><br>
<a href="http://www.statmt.org/wmt11/translation-task.html" target="_blank">http://www.statmt.org/wmt11/translation-task.html</a><br>
<a href="http://apertium.eu/data" target="_blank">http://apertium.eu/data</a><br>
<br>
<br>
Parallel data for many language pairs (including Spanish to Slavic<br>
languages) are available from OPUS:<br>
<br>
<a href="http://opus.lingfil.uu.se/" target="_blank">http://opus.lingfil.uu.se/</a><br>
<br>
<br>
Jörg<br>
<br>
<br>
2011/8/9 Alisa Zhi <<a href="mailto:proloxx@mail.ru">proloxx@mail.ru</a>>:<br>
> Dear Corpora-Members,<br>
><br>
> Can anybody advise me an  English-Spanish or<br>
> any  other  European  Language/Slavic  -  Spanish  corpus?  Preferably freely<br>
> available but I will appreciate any options.<br>
><br>
> Thanks in advance!<br>
><br>
> Alisa Zhila,<br>
><br>
> NLP PhD Student at CIC IPN, Mexico<br>
><br>
><br>
><br>
> --<br>
> ? ?????????,<br>
>  Alisa                          mailto:<a href="mailto:proloxx@mail.ru">proloxx@mail.ru</a><br>
><br>
><br>
> _______________________________________________<br>
> UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
> Corpora mailing list<br>
> <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
> <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
><br>
<br><br></blockquote></div>