<div dir="ltr"><div>Hello. <br><br>I'm new to this list but excited to find it. I'm a doctoral candidate in Rhetoric/Technical Communications and I'm writing my dissertation on the rhetoric(s) of Agent Orange. Specifically, I'm studying the different ways that arguments for/against AO were framed by the US and VM media, US/VM governments across time. I've created a custom framing dictionary specific to the corpus, but was wondering if there were standardized dictionaries that could help me identify logical arguments, general rhetorical strategies, and/or features?<br>
<br></div>Any help is appreciated.<br><br>Kindly,<br><br>Sarah Beth <br></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Wed, Feb 5, 2014 at 6:00 AM,  <span dir="ltr"><<a href="mailto:corpora-request@uib.no" target="_blank">corpora-request@uib.no</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Today's Topics:<br>
<br>
   1.  2nd CFP: LRE-Rel2 Workshop at LREC 2014 (Claire Brierley)<br>
   2.  Taiwan Mandarin Chinese corpus + parallel corpora (Myriam Boulin)<br>
   3. Re:  English-German Word Alignments (Yannick Versley)<br>
   4.  TSD 2014 - First Call for Papers (TSD 2014)<br>
   5.  2nd call RECITAL (NLP Students conference) (Nuria Gala)<br>
   6. Re:  English-German Word Alignments (Hieu Hoang)<br>
   7. Re:  Taiwan Mandarin Chinese corpus + parallel corpora<br>
      (Valerie Mapelli)<br>
   8.  [CFP] Journal of Language Modelling - Special issue on<br>
      Grammar Engineering (deadline extension) (Yannick Parmentier)<br>
   9. Re:  English-German Word Alignments (Jörg Tiedemann)<br>
  10. Re:  English-German Word Alignments (Khalid CHOUKRI)<br>
<br>
<br>
----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Sun, 2 Feb 2014 09:56:27 +0000<br>
From: Claire Brierley <<a href="mailto:C.Brierley@leeds.ac.uk">C.Brierley@leeds.ac.uk</a>><br>
Subject: [Corpora-List] 2nd CFP: LRE-Rel2 Workshop at LREC 2014<br>
To: "<a href="mailto:corpora@uib.no">corpora@uib.no</a>" <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
<br>
2nd Workshop on Language Resources and Evaluation for Religious Texts (LRE-Rel2)<br>
31st May 2014 (afternoon session): Harpa Conference Center, Reykjavik, Iceland<br>
Workshop website: <a href="http://www.comp.leeds.ac.uk/arabic/lre-rel2.html" target="_blank">http://www.comp.leeds.ac.uk/arabic/lre-rel2.html</a><br>
<br>
Second Call for Papers:<br>
After a successful launch at LREC 2012, we are organising a second workshop on Language Resources and Evaluation for Religious Texts hosted by LREC 2014 in Reykjavik, Iceland. This is an inclusive workshop title, aimed at researchers with a generic interest in religious texts to raise awareness of different perspectives and practices, and to identify some common themes. Our first workshop attracted a range of scholarship, particularly on Arabic and Islamic Studies, and this year we are keen to extend this range to canonical texts from other languages and religions - Christian, Jewish, Sikh, Buddhist, and other - and, given the Icelandic venue, to iconic texts from historical religions such as The Prose Edda of Norse mythology. We are also keen to foster inter-faith corpus studies, tracing similarities as well as differences in religious texts, where this genre includes: the faith-defining religious canon; authoritative interpretations and commentary; sermons, liturgy, prayers, poetry, and lyrics.<br>

<br>
Workshop Attendance:<br>
Prospective authors should note that attendance at the workshop is necessary for their paper to be published in the workshop proceedings, though for papers with multiple authors, only one author will be required to attend. Therefore, prospective authors are strongly encouraged to check the LREC website and other sources for information on visa restrictions, and likely travel and hotel costs.<br>

<br>
Workshop Topics:<br>
Submissions are invited for (but not limited to) the following topics:<br>
?       measuring semantic relatedness between multiple religious texts and corpora from different religions;<br>
?       analysis of ceremonial, liturgical, and ritual speech; recitation styles; speech decorum; discourse analysis for religious texts;<br>
?       formulaic language and multi-word expressions in religious texts;<br>
?       suitability of modal and other logic types for knowledge representation and inference in religious texts;<br>
?       issues in, and evaluation of, machine translation in religious texts;<br>
?       text-mining, stylometry, and authorship attribution for religious texts;<br>
?       corpus query languages and tools for exploring religious corpora;<br>
?       dictionaries, thesaurai, Wordnet, and ontologies for religious texts;<br>
?        (new) corpora and rich and novel annotation schemes for religious texts;<br>
?       annotation and analysis of religious metaphor;<br>
?       genre analysis for religious texts;<br>
?       application in other disciplines (e.g. theology, classics, philosophy, literature) of computer-mediated methods for analysing religious texts.<br>
<br>
Important Dates:<br>
19.02.2014                  Deadline for paper submissions<br>
05.03.2014                  Notification of acceptance<br>
21.03.2014              Camera-ready copies due from authors<br>
06.04.2014                  LREC deadline for camera-ready copy of Workshop Proceedings<br>
31.05.2014              LRE-Rel2 Workshop (afternoon session)<br>
<br>
Submission of Papers:<br>
Please submit your papers via the LRE-Rel2 submission page in LREC's START Manager. The URL for this is: <a href="https://www.softconf.com/lrec2014/LRE-Rel2/" target="_blank">https://www.softconf.com/lrec2014/LRE-Rel2/</a> Authors should submit a full paper, not an abstract. They should also follow LREC guidelines for length of papers, and are advised to use the LREC template for paper submissions. This template will be published by LREC in due course. In the meantime, authors can use the LREC 2012 template: <a href="http://www.lrec-conf.org/lrec2012/?Authors-Kit" target="_blank">http://www.lrec-conf.org/lrec2012/?Authors-Kit</a><br>

<br>
Request from LREC Organisers:<br>
"...When submitting a paper from the START page, authors will be asked to provide essential information about resources (in a broad sense, i.e. also technologies, standards, evaluation kits, etc.) that have been used for the work described in the paper or are a new result of your research. Moreover, ELRA encourages all LREC authors to share the described LRs (data, tools, services, etc.), to enable their reuse, replicability of experiments, including evaluation ones, etc..."<br>

<br>
LRE-Rel2 Organising Committee:<br>
Eric Atwell and Claire Brierley: Computing, University of Leeds, LEEDS, LS2 9JT, UK<br>
<a href="mailto:E.S.Atwell@leeds.ac.uk">E.S.Atwell@leeds.ac.uk</a>; <a href="mailto:C.Brierley@leeds.ac.uk">C.Brierley@leeds.ac.uk</a><br>
Majdi Sawalha and Bassam Hammo: Computer Information Systems, University of Jordan, AMMAN 11942, Jordan<br>
<a href="mailto:sawalha.majdi@leeds.ac.uk">sawalha.majdi@leeds.ac.uk</a>;<br>
<br>
LRE-Rel2 Programme Committee (provisional):<br>
Eric Atwell, School of Computing, University of Leeds, UK<br>
Claire Brierley, School of Computing, University of Leeds, UK<br>
Majdi Sawalha, Computer Information Systems, University of Jordan, Jordan<br>
Bassam Hammo, Computer Information Systems, University of Jordan, Jordan<br>
Sane Yagi, Department of Linguistics, University of Jordan, Jordan<br>
Dag Haug, Department of Philosophy, History of Art and Ideas, University of Oslo, Norway<br>
Moshe Koppel, Department of Computer Science, Bar-Ilan University, Israel<br>
Nils Reiter: Department of Computational Linguistics, Heidelberg University, Germany<br>
Andrew Wilson, Department of Linguistics and English Language, University of Lancaster, UK<br>
Claudia Resch, Institute for Corpus Linguistics and Text Technology, Austrian Academy of Sciences, Austria<br>
Nadeem Obaid, Computer Information Systems, University of Jordan, Jordan<br>
Muhammad A.M. Abushariah, Computer Information Systems, University of Jordan, Jordan<br>
Mortaza Rezaee, Islamic College, London, UK<br>
Janet Watson, Arabic and Middle Eastern Studies, and Linguistics and Phonetics, University of Leeds, UK<br>
John Lee, Halliday Centre for Intelligent Applications of Language Studies, City University of Hong Kong, (HK)<br>
Mohamed Menacer, Taibah University, Saudi Arabia<br>
Deryle Lonsdale, Department of Linguistics and English Language, Brigham Young University, US<br>
Bob MacDonald, Research and Development, Anthony Macauley Associates, Canada<br>
Kais Dukes, School of Computing, University of Leeds, UK<br>
Aida Mustapha, Department of Computer Science and Information Technology, Putra University, Malaysia<br>
Liviu Dinu, Centre for Computational Linguistics, University of Bucharest, Romania<br>
Behrooz Minaei, School of Computer Engineering, Iran University of Science and Technology, Iran<br>
Gurpreet Singh, Centre for Language and Communication Studies, Trinity College Dublin, Ireland<br>
Azzeddine Mazroui, Mathematics and Computer Science, Mohammed 1st University, Morocco<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 2<br>
Date: Fri, 31 Jan 2014 12:22:26 +0100<br>
From: Myriam Boulin <<a href="mailto:myriam.boulin@gmail.com">myriam.boulin@gmail.com</a>><br>
Subject: [Corpora-List] Taiwan Mandarin Chinese corpus + parallel<br>
        corpora<br>
To: <a href="mailto:corpora@uib.no">corpora@uib.no</a><br>
<br>
Dear all,<br>
<br>
I am looking for the following corpora:<br>
<br>
- corpus of spoken Taiwan Mandarin Chinese<br>
- parallel corpus of English and Taiwanese novels (in Mandarin Chinese)<br>
- parallel corpus of English and Taiwanese film dialogues<br>
<br>
I would be very grateful for any information related to these kinds of<br>
corpora...<br>
<br>
Best regards,<br>
Myriam Boulin, Paris 7 University<br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 505 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20140131/bbc80d08/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20140131/bbc80d08/attachment.txt</a>><br>
<br>
------------------------------<br>
<br>
Message: 3<br>
Date: Wed, 5 Feb 2014 09:27:33 +0100<br>
From: Yannick Versley <<a href="mailto:versley@cl.uni-heidelberg.de">versley@cl.uni-heidelberg.de</a>><br>
Subject: Re: [Corpora-List] English-German Word Alignments<br>
To: Yuliya <<a href="mailto:4arly@bk.ru">4arly@bk.ru</a>><br>
Cc: corpora <<a href="mailto:corpora@uib.no">corpora@uib.no</a>>,   Sebastian Sulger<br>
        <<a href="mailto:sebastian.sulger@uni-konstanz.de">sebastian.sulger@uni-konstanz.de</a>><br>
<br>
Hi,<br>
<br>
There is a set of word alignments for a German-English section of EuroParl<br>
by Thomas Schönemann:<br>
<br>
<a href="http://user.phil-fak.uni-duesseldorf.de/~tosch/downloads.html" target="_blank">http://user.phil-fak.uni-duesseldorf.de/~tosch/downloads.html</a><br>
<br>
Best wishes,<br>
Yannick<br>
<br>
<br>
On Wed, Feb 5, 2014 at 8:32 AM, Yuliya <<a href="mailto:4arly@bk.ru">4arly@bk.ru</a>> wrote:<br>
<br>
> Hello,<br>
><br>
> There is an excellent DE-EN-FR parallel corpus PatTR by Katharina Wäschle<br>
> : <a href="http://www.cl.uni-heidelberg.de/statnlpgroup/pattr" target="_blank">http://www.cl.uni-heidelberg.de/statnlpgroup/pattr</a><br>
><br>
> But it seems to me that it is not word-aligned.<br>
><br>
> Best regards,<br>
> Yuliya Korenchuk<br>
> Université de Strasbourg<br>
><br>
><br>
> _______________________________________________<br>
> UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
> Corpora mailing list<br>
> <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
> <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
><br>
><br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 1463 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20140205/14aa4b47/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20140205/14aa4b47/attachment.txt</a>><br>
<br>
------------------------------<br>
<br>
Message: 4<br>
Date: Tue, 04 Feb 2014 21:50:30 +0100<br>
From: TSD 2014 <<a href="mailto:xrambous@aurora.fi.muni.cz">xrambous@aurora.fi.muni.cz</a>><br>
Subject: [Corpora-List] TSD 2014 - First Call for Papers<br>
To: <a href="mailto:tsd2014@tsdconference.org">tsd2014@tsdconference.org</a><br>
<br>
         *********************************************************<br>
                     TSD 2014 - FIRST CALL FOR PAPERS<br>
         *********************************************************<br>
<br>
Seventeenth International Conference on TEXT, SPEECH and DIALOGUE (TSD 2014)<br>
              Brno, Czech Republic, 8-12 September 2014<br>
                    <a href="http://www.tsdconference.org/" target="_blank">http://www.tsdconference.org/</a><br>
<br>
The conference is organized by the Faculty of Informatics, Masaryk<br>
University, Brno, and the Faculty of Applied Sciences, University of<br>
West Bohemia, Pilsen.  The conference is supported by International<br>
Speech Communication Association.<br>
<br>
Venue: Brno, Czech Republic<br>
<br>
<br>
THE SUBMISSION DEADLINES:<br>
<br>
    March 15 2014 ............ Submission of abstracts<br>
    March 22 2014 ............ Submission of full papers<br>
<br>
Submission of abstract serves for better organization of the review<br>
process only - for the actual review a full paper submission is<br>
necessary.<br>
<br>
TSD SERIES<br>
<br>
TSD series evolved as a prime forum for interaction between researchers in<br>
both spoken and written language processing from all over the world.<br>
Proceedings of TSD form a book published by Springer-Verlag in their<br>
Lecture Notes in Artificial Intelligence (LNAI) series.  TSD Proceedings<br>
are regularly indexed by Thomson Reuters Conference Proceedings Citation<br>
Index.  Moreover, LNAI series are listed in all major citation databases<br>
such as DBLP, SCOPUS, EI, INSPEC or COMPENDEX.<br>
<br>
<br>
TOPICS<br>
<br>
Topics of the conference will include (but are not limited to):<br>
<br>
    Corpora and Language Resources (monolingual, multilingual,<br>
    text and spoken corpora, large web corpora, disambiguation,<br>
    specialized lexicons, dictionaries)<br>
<br>
    Speech Recognition (multilingual, continuous, emotional<br>
    speech, handicapped speaker, out-of-vocabulary words,<br>
    alternative way of feature extraction, new models for<br>
    acoustic and language modelling)<br>
<br>
    Tagging, Classification and Parsing of Text and Speech<br>
    (morphological and syntactic analysis, synthesis and<br>
    disambiguation, multilingual processing, sentiment analysis,<br>
    credibility analysis, automatic text labeling, summarization,<br>
    authorship attribution)<br>
<br>
    Speech and Spoken Language Generation (multilingual, high<br>
    fidelity speech synthesis, computer singing)<br>
<br>
    Semantic Processing of Text and Speech (information<br>
    extraction, information retrieval, data mining, semantic web,<br>
    knowledge representation, inference, ontologies, sense<br>
    disambiguation, plagiarism detection)<br>
<br>
    Integrating Applications of Text and Speech Processing<br>
    (machine translation, natural language understanding,<br>
    question-answering strategies, assistive technologies)<br>
<br>
    Automatic Dialogue Systems (self-learning, multilingual,<br>
    question-answering systems, dialogue strategies, prosody in<br>
    dialogues)<br>
<br>
    Multimodal Techniques and Modelling (video processing, facial<br>
    animation, visual speech synthesis, user modelling, emotions<br>
    and personality modelling)<br>
<br>
Papers on processing of languages other than English are strongly<br>
encouraged.<br>
<br>
<br>
PROGRAM COMMITTEE<br>
<br>
    Hynek Hermansky, USA (general chair)<br>
    Eneko Agirre, Spain<br>
    Genevieve Baudoin, France<br>
    Paul Cook, Australia<br>
    Jan Cernocky, Czech Republic<br>
    Simon Dobrisek, Slovenia<br>
    Karina Evgrafova, Russia<br>
    Darja Fiser, Slovenia<br>
    Radovan Garabik, Slovakia<br>
    Alexander Gelbukh, Mexico<br>
    Louise Guthrie, GB<br>
    Jan Hajic, Czech Republic<br>
    Eva Hajicova, Czech Republic<br>
    Yannis Haralambous, France<br>
    Ludwig Hitzenberger, Germany<br>
    Jaroslava Hlavacova, Czech Republic<br>
    Ales Horak, Czech Republic<br>
    Eduard Hovy, USA<br>
    Maria Khokhlova, Russia<br>
    Daniil Kocharov, Russia<br>
    Ivan Kopecek, Czech Republic<br>
    Valia Kordoni, Germany<br>
    Steven Krauwer, The Netherlands<br>
    Siegfried Kunzmann, Germany<br>
    Natalija Loukachevitch, Russia<br>
    Vaclav Matousek, Czech Republic<br>
    Diana McCarthy, United Kingdom<br>
    France Mihelic, Slovenia<br>
    Hermann Ney, Germany<br>
    Elmar Noeth, Germany<br>
    Karel Oliva, Czech Republic<br>
    Karel Pala, Czech Republic<br>
    Nikola Pavesic, Slovenia<br>
    Fabio Pianesi, Italy<br>
    Maciej Piasecki, Poland<br>
    Adam Przepiorkowski, Poland<br>
    Josef Psutka, Czech Republic<br>
    James Pustejovsky, USA<br>
    German Rigau, Spain<br>
    Leon Rothkrantz, The Netherlands<br>
    Anna Rumshisky, USA<br>
    Milan Rusko, Slovakia<br>
    Mykola Sazhok, Ukraine<br>
    Pavel Skrelin, Russia<br>
    Pavel Smrz, Czech Republic<br>
    Petr Sojka, Czech Republic<br>
    Stefan Steidl, Germany<br>
    Georg Stemmer, Germany<br>
    Marko Tadic, Croatia<br>
    Tamas Varadi, Hungary<br>
    Zygmunt Vetulani, Poland<br>
    Pascal Wiggers, The Netherlands<br>
    Yorick Wilks, GB<br>
    Marcin Wolinski, Poland<br>
    Victor Zakharov, Russia<br>
<br>
<br>
KEYNOTE SPEAKERS<br>
<br>
    Ralph Grishman, New York University, USA<br>
    Bernardo Magnini, FBK - Fondazione Bruno Kessler, Italy<br>
    Salim Roukos, IBM, USA<br>
<br>
<br>
FORMAT OF THE CONFERENCE<br>
<br>
The conference program will include presentation of invited papers,<br>
oral presentations, and poster/demonstration sessions. Papers will<br>
be presented in plenary or topic oriented sessions.<br>
<br>
Social events including a trip in the vicinity of Brno will allow<br>
for additional informal interactions.<br>
<br>
<br>
SUBMISSION OF PAPERS<br>
<br>
Authors are invited to submit a full paper not exceeding 8 pages<br>
formatted in the LNCS style (see below). Those accepted will be<br>
presented either orally or as posters. The decision about the<br>
presentation format will be based on the recommendation of the<br>
reviewers. The authors are asked to submit their papers using the<br>
on-line form accessible from the conference website.<br>
<br>
Papers submitted to TSD 2014 must not be under review by any other<br>
conference or publication during the TSD review cycle, and must not be<br>
previously published or accepted for publication elsewhere.<br>
<br>
As reviewing will be blind, the paper should not include the authors'<br>
names and affiliations. Furthermore, self-references that reveal the<br>
author's identity, e.g., "We previously showed (Smith, 1991) ...",<br>
should be avoided. Instead, use citations such as "Smith previously<br>
showed (Smith, 1991) ...".  Papers that do not conform to the<br>
requirements above are subject to be rejected without review.<br>
<br>
The authors are strongly encouraged to write their papers in TeX or<br>
LaTeX formats. These formats are necessary for the final versions of<br>
the papers that will be published in the Springer Lecture Notes.<br>
Authors using a WORD compatible software for the final version must<br>
use the LNCS template for WORD and within the submit process ask the<br>
Proceedings Editors to convert the paper to LaTeX format.  For this<br>
service a service-and-license fee of CZK 1500 will be levied<br>
automatically.<br>
<br>
The paper format for review has to be either PDF or PostScript file<br>
with all required fonts included. Upon notification of acceptance,<br>
presenters will receive further information on submitting their<br>
camera-ready and electronic sources (for detailed instructions on the<br>
final paper format see<br>
<a href="http://www.springer.de/comp/lncs/authors.html#Proceedings" target="_blank">http://www.springer.de/comp/lncs/authors.html#Proceedings</a>, Sample File<br>
typeinst.zip).<br>
<br>
Authors are also invited to present actual projects, developed<br>
software or interesting material relevant to the topics of the<br>
conference.  The presenters of demonstrations should provide an<br>
abstract not exceeding one page. The demonstration abstracts will not<br>
appear in the conference proceedings.<br>
<br>
<br>
IMPORTANT DATES<br>
<br>
March 15 2014 ............ Submission of abstracts<br>
March 22 2014 ............ Submission of full papers<br>
May 15 2014 .............. Notification of acceptance<br>
May 31 2014 .............. Final papers (camera ready) and registration<br>
August 3 2014 ............ Submission of demonstration abstracts<br>
August 10 2014 ........... Notification of acceptance for<br>
                           demonstrations sent to the authors<br>
September 8-12 2014 ...... Conference date<br>
<br>
Submission of abstracts serves for better organization of the review<br>
process only - for the actual review a full paper submission is<br>
necessary.<br>
<br>
The accepted conference contributions will be published in proceedings<br>
that will be made available to participants at the time of the<br>
conference.<br>
<br>
<br>
OFFICIAL LANGUAGE<br>
<br>
The official language of the conference is English.<br>
<br>
<br>
ACCOMMODATION<br>
<br>
The organizing committee will arrange discounts on accommodation in<br>
the 4-star hotel at the conference venue. The current prices of the<br>
accommodation will be available at the conference website.<br>
<br>
<br>
ADDRESS<br>
<br>
All correspondence regarding the conference should be<br>
addressed to<br>
<br>
    Ales Horak, TSD 2014<br>
    Faculty of Informatics, Masaryk University<br>
    Botanicka 68a, 602 00 Brno, Czech Republic<br>
    phone: +420-5-49 49 18 63<br>
    fax: +420-5-49 49 18 20<br>
    email: <a href="mailto:tsd2014@tsdconference.org">tsd2014@tsdconference.org</a><br>
<br>
The official TSD 2014 homepage is: <a href="http://www.tsdconference.org/" target="_blank">http://www.tsdconference.org/</a><br>
<br>
<br>
LOCATION<br>
<br>
Brno is the second largest city in the Czech Republic with a<br>
population of almost 400.000 and is the country's judiciary and<br>
trade-fair center. Brno is the capital of South Moravia, which is<br>
located in the south-east part of the Czech Republic and is known<br>
for a wide range of cultural, natural, and technical sights.<br>
South Moravia is a traditional wine region. Brno had been a Royal<br>
City since 1347 and with its six universities it forms a cultural<br>
center of the region.<br>
<br>
Brno can be reached easily by direct flights from London, Moscow,<br>
and Eindhoven, and by trains or buses from Prague (200 km) or Vienna<br>
(130 km).<br>
<br>
For the participants with some extra time, nearby places may<br>
also be of interest.  Local ones include: Brno Castle now called<br>
Spilberk, Veveri Castle, the Old and New City Halls, the<br>
Augustine Monastery with St. Thomas Church and crypt of Moravian<br>
Margraves, Church of St.  James, Cathedral of St. Peter & Paul,<br>
Cartesian Monastery in Kralovo Pole, the famous Villa Tugendhat<br>
designed by Mies van der Rohe along with other important<br>
buildings of between-war Czech architecture.<br>
<br>
For those willing to venture out of Brno, Moravian Karst with<br>
Macocha Chasm and Punkva caves, battlefield of the Battle of<br>
three emperors (Napoleon, Russian Alexander and Austrian Franz<br>
- Battle by Austerlitz), Chateau of Slavkov (Austerlitz),<br>
Pernstejn Castle, Buchlov Castle, Lednice Chateau, Buchlovice<br>
Chateau, Letovice Chateau, Mikulov with one of the largest Jewish<br>
cemeteries in Central Europe, Telc - a town on the UNESCO<br>
heritage list, and many others are all within easy reach.<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 5<br>
Date: Mon, 03 Feb 2014 12:07:50 +0100<br>
From: Nuria Gala <<a href="mailto:Nuria.Gala@lif.univ-mrs.fr">Nuria.Gala@lif.univ-mrs.fr</a>><br>
Subject: [Corpora-List] 2nd call RECITAL (NLP Students conference)<br>
To: <a href="mailto:corpora@uib.no">corpora@uib.no</a>, <a href="mailto:elsnet-list@elsnet.org">elsnet-list@elsnet.org</a><br>
Cc: Klim Peshkov <<a href="mailto:klim.peshkov@gmail.com">klim.peshkov@gmail.com</a>>,      Nuria Gala<br>
        <<a href="mailto:nuria.gala@lif.univ-mrs.fr">nuria.gala@lif.univ-mrs.fr</a>><br>
<br>
RECITAL 2014 : First Call for Papers<br>
------------------------------------<br>
<br>
16th Rencontre des Étudiants Chercheurs en Informatique pour le Traitement<br>
Automatique des Langues (RECITAL)<br>
<br>
(Natural Language Processing Students Conference)<br>
<br>
Faculté Saint Charles, Aix Marseille Université (Marseilles, France),<br>
July 1st to 4th 2014.<br>
<br>
<br>
Important dates<br>
-----------------<br>
<br>
- Submission deadline : Saturday, April 5th 2014<br>
- Acceptance notification : Saturday, May 3rd 2014<br>
- Camera ready : Saturday, May 17th 2014<br>
<br>
Presentation<br>
------------<br>
<br>
RECITAL 2014, the annual meeting for young researchers associated to the<br>
TALN<br>
conference, will take place in Marseilles (France) on July 1st to 4th.<br>
RECITAL provides a venue for young researchers investigating topics in<br>
Computational Linguistics and Natural Language Processing to present their<br>
research, meet potential advisors, and receive feedback from the research<br>
community. Authors must be students (Master or PhD) or young researchers<br>
who<br>
recently completed their phd. RECITAL 2014 will include oral and poster<br>
presentations. The official language is French but English presentations<br>
and<br>
papers are accepted for non-French-speaking authors.<br>
<br>
Building on the success of the previous year, we are encouraging the<br>
submission<br>
of research proposals and papers describing preliminary works<br>
(state-of-the-art,<br>
first experiments, etc.). RECITAL's main goal is to support the work of<br>
young<br>
researchers and facilitate their integration into our community. To this<br>
aim we enhance :<br>
<br>
  - pedagogic reviews : authors should be able to understand their<br>
mistakes and<br>
    correct them in order to improve the quality of their work;<br>
<br>
  - positive reviews : it is never necessary to discourage a young<br>
researcher,<br>
    watchwords will be encouraging/guiding;<br>
<br>
  - direct exchange : all the reviews will be signed. Authors and<br>
reviewers are<br>
    encouraged to discuss together during the conference.<br>
<br>
A prize will be awarded to the author(s) of the best paper during the<br>
closing ceremony.<br>
<br>
Topics<br>
------<br>
<br>
Relevant topics include, but are not limited to, the following areas<br>
(in alphabetical order):<br>
<br>
- Analysis and generation in the following domains:<br>
  + Phonetics<br>
  + Phonology<br>
  + Morphology<br>
  + Syntax<br>
  + Semantics<br>
  + Discourse<br>
- Development of language resources for NLP:<br>
  + Databases containing morphological, syntactic, semantic, and/or<br>
    phonological information<br>
  + Grammars<br>
  + Lexicons<br>
  + Ontologies<br>
  + Corpus linguistics<br>
- NLP applications:<br>
  + Opinion and Sentiment Analysis<br>
  + Automatic Classification or Categorization<br>
  + Word Sense Disambiguation<br>
  + Human machine dialogue<br>
  + Automatic Indexing<br>
  + Information Retrieval and Extraction<br>
  + Summarization<br>
  + Anaphora resolution<br>
  + Question-Answering<br>
  + Machine Translation<br>
  + Semantic Web<br>
- Approaches:<br>
  + Formal Linguistics to support automatic processing<br>
  + Automatic processing for experimental linguistics<br>
  + Computational psycholinguistics<br>
  + Symbolic<br>
  + Logical<br>
  + Statistical<br>
  + Based on Machine Learning<br>
<br>
Selection Criteria<br>
------------------<br>
<br>
Research Papers must describe original completed work or work in<br>
progress and<br>
should clearly indicate directions for future research wherever<br>
appropriate.<br>
Authors MUST be students (Master or PhD) or young researchers who recently<br>
completed their phd. Publications with confirmed researchers (which<br>
include PhD<br>
supervisors) must be submitted to TALN.<br>
<br>
Submissions will be reviewed by at least two experts in the field.<br>
In particular, will be considered:<br>
<br>
  - Correction of scientific and technical content<br>
  - Comparison with previous works<br>
  - The organization and clarity of presentation<br>
  - The adequacy of the conference topics<br>
<br>
The selected communications will be published in the conference<br>
proceedings.<br>
<br>
Submission Procedure<br>
--------------------<br>
<br>
Papers will be written in French for French-speaking authors or English for<br>
non-French-speaking authors. A LaTeX style file and a Word template will be<br>
available on the conference website (<a href="http://www.taln2014.org" target="_blank">www.taln2014.org</a>).<br>
<br>
Contact : nuria.gala @ <a href="http://lif.univ-mrs.fr" target="_blank">lif.univ-mrs.fr</a> & klim.peshkov @ <a href="http://lpl-aix.fr" target="_blank">lpl-aix.fr</a><br>
<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 6<br>
Date: Wed, 5 Feb 2014 09:34:30 +0000<br>
From: Hieu Hoang <<a href="mailto:Hieu.Hoang@ed.ac.uk">Hieu.Hoang@ed.ac.uk</a>><br>
Subject: Re: [Corpora-List] English-German Word Alignments<br>
To: Sebastian Sulger <<a href="mailto:sebastian.sulger@uni-konstanz.de">sebastian.sulger@uni-konstanz.de</a>><br>
Cc: "<a href="mailto:corpora@uib.no">corpora@uib.no</a>" <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
<br>
You can get the Europarl de-en with the alignment as part of the pre-built<br>
models we release with Moses:<br>
   <a href="http://www.statmt.org/moses/RELEASE-2.1/models/de-en/" target="_blank">http://www.statmt.org/moses/RELEASE-2.1/models/de-en/</a><br>
<br>
You would probably want the cleaned, tokenized files<br>
   corpus/europarl.clean.1.*<br>
and the alignment file<br>
   model/aligned.1.grow-diag-final-and<br>
<br>
<br>
fyi, the word alignment was done with mgiza<br>
<br>
<br>
On 5 February 2014 07:06, Sebastian Sulger <<a href="mailto:sebastian.sulger@uni-konstanz.de">sebastian.sulger@uni-konstanz.de</a><br>
> wrote:<br>
<br>
> Dear All,<br>
><br>
> I would like to do some experiments using a parallel English-German<br>
> corpus, ideally word or phrase aligned. I know about the Europarl corpora,<br>
> and I was wondering whether there are word or phrase alignments for those<br>
> available somewhere.<br>
><br>
> I am not familiar with word alignment tools (GIZA++ and the like), so<br>
> before I get into that, readily usable alignments would be preferred.<br>
><br>
> I'm thankful for any pointers!<br>
><br>
> Best,<br>
> Sebastian<br>
><br>
> --<br>
> Sebastian Sulger<br>
> FB Sprachwissenschaft<br>
> Universität Konstanz<br>
> <a href="http://ling.uni-konstanz.de/pages/home/sulger" target="_blank">http://ling.uni-konstanz.de/pages/home/sulger</a><br>
><br>
><br>
> _______________________________________________<br>
> UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
> Corpora mailing list<br>
> <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
> <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
><br>
><br>
<br>
<br>
--<br>
Hieu Hoang<br>
Research Associate<br>
University of Edinburgh<br>
<a href="http://www.hoang.co.uk/hieu" target="_blank">http://www.hoang.co.uk/hieu</a><br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 2285 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20140205/72a7ba5d/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20140205/72a7ba5d/attachment.txt</a>><br>
<br>
------------------------------<br>
<br>
Message: 7<br>
Date: Wed, 05 Feb 2014 10:47:53 +0100<br>
From: Valerie Mapelli <<a href="mailto:mapelli@elda.org">mapelli@elda.org</a>><br>
Subject: Re: [Corpora-List] Taiwan Mandarin Chinese corpus + parallel<br>
        corpora<br>
To: <a href="mailto:corpora@uib.no">corpora@uib.no</a><br>
<br>
Dear Myriam,<br>
<br>
Please note that ELRA distributes the Taiwan Mandarin Speecon database.<br>
For more information, please check here:<br>
<a href="http://catalog.elra.info/product_info.php?products_id=861" target="_blank">http://catalog.elra.info/product_info.php?products_id=861</a><br>
<br>
I will be happy to provide you with more information.<br>
<br>
Best regards,<br>
<br>
Valérie Mapelli<br>
<br>
<br>
<br>
Le 31/01/2014 12:22, Myriam Boulin a écrit :<br>
> Dear all,<br>
> I am looking for the following corpora:<br>
> - corpus of spoken Taiwan Mandarin Chinese<br>
> - parallel corpus of English and Taiwanese novels (in Mandarin Chinese)<br>
> - parallel corpus of English and Taiwanese film dialogues<br>
> I would be very grateful for any information related to these kinds of<br>
> corpora...<br>
> Best regards,<br>
> Myriam Boulin, Paris 7 University<br>
><br>
><br>
> _______________________________________________<br>
> UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
> Corpora mailing list<br>
> <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
> <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br>
--<br>
<br>
Valérie Mapelli<br>
Project Manager & Sales Coordinator<br>
<br>
tel <a href="tel:%2B33%201%2043%2013%2033%2033" value="+33143133333">+33 1 43 13 33 33</a> (secr.) / 33 32 (direct) / skype ID: mapelli_elda<br>
fax <a href="tel:%2B33%201%2043%2013%2033%2030" value="+33143133330">+33 1 43 13 33 30</a><br>
WWW <a href="http://www.elda.org" target="_blank">http://www.elda.org</a> or <a href="http://www.elra.info" target="_blank">http://www.elra.info</a><br>
<br>
Visit the ELRA Catalogue of Language Resources<br>
<a href="http://catalog.elra.info" target="_blank">http://catalog.elra.info</a><br>
<br>
Visit the Universal Catalogue of Language Resources<br>
<a href="http://universal.elra.info" target="_blank">http://universal.elra.info</a><br>
<br>
Visit the LREC Conference Web site<br>
<a href="http://www.lrec-conf.org" target="_blank">http://www.lrec-conf.org</a><br>
<br>
<br>
<br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 2926 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20140205/71f1b11a/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20140205/71f1b11a/attachment.txt</a>><br>
<br>
------------------------------<br>
<br>
Message: 8<br>
Date: Wed, 5 Feb 2014 10:53:22 +0100<br>
From: Yannick Parmentier <<a href="mailto:yannick.parmentier@univ-orleans.fr">yannick.parmentier@univ-orleans.fr</a>><br>
Subject: [Corpora-List] [CFP] Journal of Language Modelling - Special<br>
        issue on Grammar Engineering (deadline extension)<br>
To: <a href="mailto:yannick.parmentier@univ-orleans.fr">yannick.parmentier@univ-orleans.fr</a><br>
Cc: <a href="mailto:denys.duchier@univ-orleans.fr">denys.duchier@univ-orleans.fr</a><br>
<br>
**Apologies for cross-posting. Please post or distribute.**<br>
<br>
<br>
             *DEADLINE EXTENSION: February, 23rd*<br>
<br>
<br>
                      CALL FOR PAPERS<br>
<br>
                 Journal of Language Modelling<br>
<br>
                     SPECIAL ISSUE ON<br>
<br>
       High-level Methodologies for Grammar Engineering<br>
<br>
                 <a href="http://jlm.ipipan.waw.pl/" target="_blank">http://jlm.ipipan.waw.pl/</a><br>
<br>
<br>
Special Issue Description<br>
-------------------------<br>
<br>
Many grammatical frameworks have been proposed over the last decades<br>
to describe the syntax (and semantics) of natural language. Among the<br>
most widely used, one may cite (in chronological order) Tree-Adjoining<br>
Grammar (TAG) [Joshi et al., 1975], Lexical-Functional Grammar (LFG)<br>
[Bresnan and Kaplan, 1982], Combinatory Categorial Grammar (CCG)<br>
[Steedman, 1987], or Head- driven Phrase Structure Grammar (HPSG)<br>
[Pollard and Sag, 1994]. These frameworks present theoretical and<br>
practical interests. From a theoretical point of view, they provide a<br>
formal device for the linguist to experiment with her/his theories.<br>
>From a practical point of view, they make it possible to automatically<br>
process natural language in applications such as dialog systems,<br>
machine translation, etc. They differ in their expressivity and<br>
complexity. Some prove more suitable for the description of a given<br>
language than others. Still, for many of these frameworks, large<br>
resources (e.g., grammars) have been designed, at first by hand, and<br>
later via dedicated tools (e.g., integrated grammar environments such<br>
as XLE for LFG [King et al., 2000]). In this Special Issue, we are<br>
concerned with this complex task of grammar engineering, keeping in<br>
mind the two above-mentioned theoretical and practical interests.<br>
<br>
<br>
Topics of Interest<br>
------------------<br>
<br>
This special issue welcomes contributions from the following topics<br>
(without being limited to these):<br>
<br>
<br>
1. New or updated work on the traditional topics of GEAF workshops<br>
<br>
  The traditional topics in the series of "Grammar Engineering Accross<br>
  Frameworks" workshops, "Formal Grammar" conferences and / or the<br>
  "High-level Methodologies for Grammar Engineering" ESSLLI 2013<br>
  workshop are appropriate. The submitted paper must clearly deal with<br>
  language modelling.<br>
<br>
  An extended version of a workshop/conference paper can be submitted,<br>
  provided that the contribution has been substantially updated. The<br>
  forums for any preliminary versions of the paper must be indicated.<br>
<br>
<br>
2. Study of new fundamental and / or applied results in relation with<br>
grammar development, maintenance and enhancement<br>
<br>
 - dedicated description languages for grammar engineering<br>
 - semi-automatic acquisition of grammars<br>
 - development of grammars for under-resourced languages<br>
 - cross-framework grammar engineering<br>
 - cross-language grammar engineering<br>
 - seamless construction of grammars from dynamically changing<br>
   linguistic descriptions<br>
 - designs of weighted grammars<br>
 - efficient and dynamic construction of structures from updated rules<br>
   or logical formulas<br>
<br>
<br>
3. Study of new methods for grammar engineering and their applications<br>
<br>
 - debugging environments for grammar design<br>
 - systems based on large-scale grammars<br>
<br>
<br>
4. In addition, the topics of interest include reports on<br>
implementations<br>
<br>
 - new kinds of implementations of grammar compilers, libraries and<br>
   on-demand operations<br>
 - benchmarks suitable for evaluation of grammars<br>
 - methods that construct, minimize or decompose grammars<br>
<br>
<br>
Important Dates<br>
---------------<br>
<br>
- Deadline for submissions: 23 February 2014<br>
- First decision: 12 May 2014<br>
- Submission of revised version: 17 July 2014<br>
- Final decision: 22 September 2014<br>
- Submission of camera-ready versions: 19 October 2014<br>
<br>
<br>
Submission<br>
----------<br>
<br>
Articles submitted to this special issue must adhere to the JLM<br>
instructions for contributors and use the JLM's style files, see:<br>
<br>
<a href="http://jlm.ipipan.waw.pl/about/submissions#authorGuidelines" target="_blank">http://jlm.ipipan.waw.pl/about/submissions#authorGuidelines</a><br>
<br>
Paper submissions should be made through JLM's electronic submission<br>
system:<br>
<br>
<a href="http://jlm.ipipan.waw.pl/about/submissions#onlineSubmissions" target="_blank">http://jlm.ipipan.waw.pl/about/submissions#onlineSubmissions</a><br>
<br>
All submitted articles should be anonymous and any obvious<br>
self-references should be avoided. The contribution of the paper must<br>
be substantial. All articles will be evaluated by at least 3<br>
reviewers, including at least one member of JLM's Editorial Board, and<br>
at least one member of the issue's Guest Editorial Board.<br>
<br>
<br>
Editorial Board<br>
---------------<br>
<br>
Guest Editors<br>
<br>
- Denys Duchier, Université d'Orléans, FRANCE<br>
- Yannick Parmentier, Université d'Orléans, FRANCE<br>
<br>
Guest Editorial Board<br>
<br>
- Emily Bender, University of Washington, USA<br>
- Philippe Blache, CNRS, Université d'Aix-en-Provence, FRANCE<br>
- Eric De La Clergerie, INRIA Paris, FRANCE<br>
- Benoît Crabbé, Université Diderot Paris 7, FRANCE<br>
- Berthold Crysmann, CNRS Paris, FRANCE<br>
- Denys Duchier, Université d'Orléans, FRANCE<br>
- Claire Gardent, CNRS/LORIA, Nancy, FRANCE<br>
- Joseph Le Roux, Université Paris Nord, FRANCE<br>
- Timm Lichte, Universität Düsseldorf, GERMANY<br>
- Montserrat Marimon, Universitat de Barcelona, SPAIN<br>
- Yusuke Miyao, National Institute of Informatics, Tokyo, JAPAN<br>
- Stefan Müller, Freie Universität Berlin, GERMANY<br>
- Yannick Parmentier, Université d'Orléans, FRANCE<br>
<br>
<br>
Contact<br>
-------<br>
<br>
Yannick Parmentier<br>
Department of Computer Science, University Institute of Technology<br>
University of Orléans<br>
firstname (dot) lastname (at) univ-orleans (dot) fr<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 9<br>
Date: Wed, 5 Feb 2014 10:00:25 +0000<br>
From: Jörg Tiedemann <<a href="mailto:Jorg.Tiedemann@lingfil.uu.se">Jorg.Tiedemann@lingfil.uu.se</a>><br>
Subject: Re: [Corpora-List] English-German Word Alignments<br>
To: Sebastian Sulger <<a href="mailto:sebastian.sulger@uni-konstanz.de">sebastian.sulger@uni-konstanz.de</a>><br>
Cc: "<<a href="mailto:corpora@uib.no">corpora@uib.no</a>>" <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
<br>
<br>
Look at OPUS:<br>
<a href="http://opus.lingfil.uu.se" target="_blank">http://opus.lingfil.uu.se</a><br>
<br>
If you select German and English in the form at the top of that page then you will get all resources available for that language pair. Click on the links in the TM column to get the word alignments if they exits for that resource. One piece of warning: The EUbookshop data is very noisy and a new version i on the way. The alignments are for the old version and you should probably forget about them right now. All alignments are done automatically using GIZA++ and symmetrization heuristics implemented in Moses.<br>

<br>
Jörg<br>
<br>
<br>
**********************************************************************************<br>
 Jörg Tiedemann                                          <a href="mailto:jorg.tiedemann@lingfil.uu.se">jorg.tiedemann@lingfil.uu.se</a><mailto:<a href="mailto:jorg.tiedemann@lingfil.uu.se">jorg.tiedemann@lingfil.uu.se</a>><br>

 Dep. of Linguistics and Philology            <a href="http://stp.lingfil.uu.se/~joerg/" target="_blank">http://stp.lingfil.uu.se/~joerg/</a><br>
 Uppsala University                                     tel:  +46 (0)18 - 471 1412<br>
 Box 635, SE-751 26 Uppsala/Sweden   fax: +46 (0)18 - 471 1094<br>
<br>
On Feb 5, 2014, at 8:06 AM, Sebastian Sulger wrote:<br>
<br>
Dear All,<br>
<br>
I would like to do some experiments using a parallel English-German corpus, ideally word or phrase aligned. I know about the Europarl corpora, and I was wondering whether there are word or phrase alignments for those available somewhere.<br>

<br>
I am not familiar with word alignment tools (GIZA++ and the like), so before I get into that, readily usable alignments would be preferred.<br>
<br>
I'm thankful for any pointers!<br>
<br>
Best,<br>
Sebastian<br>
<br>
--<br>
Sebastian Sulger<br>
FB Sprachwissenschaft<br>
Universität Konstanz<br>
<a href="http://ling.uni-konstanz.de/pages/home/sulger" target="_blank">http://ling.uni-konstanz.de/pages/home/sulger</a><br>
<br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 2853 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20140205/a57f6c73/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20140205/a57f6c73/attachment.txt</a>><br>
<br>
------------------------------<br>
<br>
Message: 10<br>
Date: Wed, 05 Feb 2014 11:17:40 +0100<br>
From: Khalid CHOUKRI <<a href="mailto:choukri@elda.org">choukri@elda.org</a>><br>
Subject: Re: [Corpora-List] English-German Word Alignments<br>
To: Sebastian Sulger <<a href="mailto:sebastian.sulger@uni-konstanz.de">sebastian.sulger@uni-konstanz.de</a>>,        Corpora list<br>
        <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
<br>
Dear Sebastian<br>
<br>
You may want to have a look at:    ELRA-W0023,  MLCC Multilingual and<br>
Parallel Corpora<br>
(<a href="http://catalog.elra.info/product_info.php?products_id=764" target="_blank">http://catalog.elra.info/product_info.php?products_id=764</a>), this is<br>
free for research<br>
<br>
Best regards<br>
Khalid<br>
<br>
<br>
<br>
Sebastian Sulger wrote, On 05/02/2014 08:06:<br>
> Dear All,<br>
><br>
> I would like to do some experiments using a parallel English-German<br>
> corpus, ideally word or phrase aligned. I know about the Europarl<br>
> corpora, and I was wondering whether there are word or phrase<br>
> alignments for those available somewhere.<br>
><br>
> I am not familiar with word alignment tools (GIZA++ and the like), so<br>
> before I get into that, readily usable alignments would be preferred.<br>
><br>
> I'm thankful for any pointers!<br>
><br>
> Best,<br>
> Sebastian<br>
><br>
<br>
--<br>
<br>
*Khalid Choukri *<br>
ELRA General secretary & ELDA CEO<br>
email: <a href="mailto:choukri@elda.org">choukri@elda.org</a>;<br>
Web: <a href="http://www.elra.info" target="_blank">www.elra.info</a> <a href="http://www.elda.org" target="_blank">www.elda.org</a><br>
Tel. +33 1 43 13 33 33 - Fax. +33 1 43 13 33 30<br>
<br>
****************************************************<br>
** Info on LREC: <a href="http://www.lrec-conf.org" target="_blank">www.lrec-conf.org</a><br>
****************************************************<br>
<br>
<br>
<br>
<br>
*<br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 2274 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20140205/30e082a9/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20140205/30e082a9/attachment.txt</a>><br>
<br>
----------------------------------------------------------------------<br>
Send Corpora mailing list submissions to<br>
        <a href="mailto:corpora@uib.no">corpora@uib.no</a><br>
<br>
To subscribe or unsubscribe via the World Wide Web, visit<br>
        <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
or, via email, send a message with subject or body 'help' to<br>
        <a href="mailto:corpora-request@uib.no">corpora-request@uib.no</a><br>
<br>
You can reach the person managing the list at<br>
        <a href="mailto:corpora-owner@uib.no">corpora-owner@uib.no</a><br>
<br>
When replying, please edit your Subject line so it is more specific<br>
than "Re: Contents of Corpora digest..."<br>
<br>
<br>
_______________________________________________<br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br>
<br>
End of Corpora Digest, Vol 80, Issue 6<br>
**************************************<br>
</blockquote></div><br><br clear="all"><br>-- <br><div dir="ltr"><div>Sarah Beth Hopton, ABD<br>(863) 381-2106<br></div><div><a href="mailto:sb@sarahbethhopton.com" target="_blank">sb@sarahbethhopton.com</a><br></div><div>
 </div></div>
</div>