<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"MS Mincho";
        panose-1:2 2 6 9 4 2 5 8 3 4;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:"\@MS Mincho";
        panose-1:2 2 6 9 4 2 5 8 3 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
p.MsoFootnoteText, li.MsoFootnoteText, div.MsoFootnoteText
        {mso-style-priority:99;
        mso-style-link:"Footnote Text Char";
        margin:0in;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Times New Roman","serif";}
span.MsoFootnoteReference
        {mso-style-priority:99;
        font-family:"Times New Roman","serif";
        vertical-align:super;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
cite
        {mso-style-priority:99;
        font-family:"Times New Roman","serif";}
p.MsoListParagraph, li.MsoListParagraph, div.MsoListParagraph
        {mso-style-priority:34;
        margin-top:0in;
        margin-right:0in;
        margin-bottom:0in;
        margin-left:.5in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
p.MsoListParagraphCxSpFirst, li.MsoListParagraphCxSpFirst, div.MsoListParagraphCxSpFirst
        {mso-style-priority:34;
        mso-style-type:export-only;
        margin-top:0in;
        margin-right:0in;
        margin-bottom:0in;
        margin-left:.5in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
p.MsoListParagraphCxSpMiddle, li.MsoListParagraphCxSpMiddle, div.MsoListParagraphCxSpMiddle
        {mso-style-priority:34;
        mso-style-type:export-only;
        margin-top:0in;
        margin-right:0in;
        margin-bottom:0in;
        margin-left:.5in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
p.MsoListParagraphCxSpLast, li.MsoListParagraphCxSpLast, div.MsoListParagraphCxSpLast
        {mso-style-priority:34;
        mso-style-type:export-only;
        margin-top:0in;
        margin-right:0in;
        margin-bottom:0in;
        margin-left:.5in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
span.FootnoteTextChar
        {mso-style-name:"Footnote Text Char";
        mso-style-priority:99;
        mso-style-link:"Footnote Text";
        font-family:"Times New Roman","serif";}
.MsoChpDefault
        {mso-style-type:export-only;}
 /* Page Definitions */
 @page
        {mso-endnote-separator:url("cid:header.htm\@01CB0BCF.11D86040") es;
        mso-endnote-continuation-separator:url("cid:header.htm\@01CB0BCF.11D86040") ecs;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
 /* List Definitions */
 @list l0
        {mso-list-id:1553954668;
        mso-list-type:hybrid;
        mso-list-template-ids:1481127328 67698689 67698691 67698693 67698689 67698691 67698693 67698689 67698691 67698693;}
@list l0:level1
        {mso-level-number-format:bullet;
        mso-level-text:\F0B7;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-.25in;
        font-family:Symbol;}
@list l0:level2
        {mso-level-tab-stop:1.0in;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level3
        {mso-level-tab-stop:1.5in;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level4
        {mso-level-tab-stop:2.0in;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level5
        {mso-level-tab-stop:2.5in;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level6
        {mso-level-tab-stop:3.0in;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level7
        {mso-level-tab-stop:3.5in;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level8
        {mso-level-tab-stop:4.0in;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level9
        {mso-level-tab-stop:4.5in;
        mso-level-number-position:left;
        text-indent:-.25in;}
ol
        {margin-bottom:0in;}
ul
        {margin-bottom:0in;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EN-US link=blue vlink=purple>

<div class=WordSection1>

<p class=MsoNormal align=center style='text-align:center'><b><span
style='font-size:13.0pt'>Call for Papers:<o:p></o:p></span></b></p>

<p class=MsoNormal align=center style='text-align:center'><b><span
style='font-size:13.0pt'>Workshop:  Uses and Users for Parallel Corpora in
the Translation Process<o:p></o:p></span></b></p>

<p class=MsoNormal align=center style='text-align:center'><b><span
style='font-size:13.0pt'>Association for Machine Translation in the Americas
(AMTA)<o:p></o:p></span></b></p>

<p class=MsoNormal align=center style='text-align:center'><b><span
style='font-size:13.0pt'>November 4-5, 2010 Denver, Colorado<o:p></o:p></span></b></p>

<p class=MsoNormal align=center style='text-align:center'><b><span
style='font-size:13.0pt'>(in conjunction with the American Translators
Association Conference)<o:p></o:p></span></b></p>

<p class=MsoNormal><span style='font-size:12.0pt'><o:p> </o:p></span></p>

<p class=MsoNormal>The purpose of this workshop is to explore the uses that the
translation community is currently applying, and will apply, to parallel
corpora.  A parallel corpus generally refers to a large collection of
translated text.  These texts are often aligned at the sentence or phrase
level and annotated with a specific task in mind, motivating a markup
schema.  Bilingual parallel texts are referred to as bitext, whereas
parallel corpora can be multilingual (e.g. the many translations of the Bible.)<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>Submissions will address and explore the many reasons why
people create corpora, what corpora they would like to see created, how
translators are making use of corpora, how translations systems are utilizing
corpora according to type and structure, and what the privacy and copyright
issues are which accompany the many uses, both by machine and by people.<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>Collections of parallel corpora abound, whereas definitions
and structuring of corpora seem to vary across sites<a style='mso-footnote-id:
ftn1' href="#_ftn1" name="_ftnref1" title=""><span class=MsoFootnoteReference><span
class=MsoFootnoteReference><span style='font-size:11.0pt'>[1]</span></span></span></a>. 
Examples of the kinds of differences involve source text markup,
transliteration, target text markup, methods of associating source and target,
and alignment.<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>Processing needed for different applications varies widely
according to context and function; for example, how granular do associations
between source and target need to be, how much tagging needs to occur
(morphological, syntactic, semantic), what types of alignment are needed for
which purposes, and how much of the markup is manual or automatic. 
Furthermore, given the wide range of preprocessing needs, what is the quality
check process as part of the overall workflow?  <o:p></o:p></p>

<p class=MsoNormal><br>
When using corpora to aid in human translation, especially in conjunction with
Translation Memory software, which  representation standards are being, or
should be applied ( for example tmx, tbx, srx, xml:tm, etc) and what are some
of the compatibility issues encountered. <o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>Finally, what are the standard existing uses for various
kinds of parallel corpora, and what are some of the nascent needs that could
only be explored once massive amounts of data are collected.  Some of
these uses and users may simply need smaller amounts of data, but still require
backup corpora for validation and extension of data.  What can translators
expect from parallel corpora?  Of what use are these resources for others
in the translation industry, be it government or industry or academia.<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>Two of the issues addressed only gingerly in the translation
community are those of privacy and permissions for copyrighted text,
particularly when dealing with limited extraction of say technical terms and
their translations that could in no way be used to reconstruct the sources. A
liberal interpretation might claim that it does not constitute an invasion of
privacy (in corpora that consist of logs, chats, emails, etc), nor is it an
infringement of copyright. On the other hand, a more conservative
interpretation of privacy or infringement might claim that this use does
constitute misuse. Most people either overlook these issues or are blocked from
progress with the more cautious approach.<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>The types of questions that this workshop will address
include:<o:p></o:p></p>

<p class=MsoListParagraphCxSpFirst style='text-indent:-.25in;mso-list:l0 level1 lfo1'><![if !supportLists]><span
style='font-family:Symbol'><span style='mso-list:Ignore'>·<span
style='font:7.0pt "Times New Roman"'>        
</span></span></span><![endif]><span dir=LTR></span>How you create parallel
corpora as part of your workflow?<o:p></o:p></p>

<p class=MsoListParagraphCxSpMiddle style='text-indent:-.25in;mso-list:l0 level1 lfo1'><![if !supportLists]><span
style='font-family:Symbol'><span style='mso-list:Ignore'>·<span
style='font:7.0pt "Times New Roman"'>        
</span></span></span><![endif]><span dir=LTR></span>In what ways do you use
parallel corpora?<o:p></o:p></p>

<p class=MsoListParagraphCxSpMiddle style='text-indent:-.25in;mso-list:l0 level1 lfo1'><![if !supportLists]><span
style='font-family:Symbol'><span style='mso-list:Ignore'>·<span
style='font:7.0pt "Times New Roman"'>        
</span></span></span><![endif]><span dir=LTR></span>What techniques do you use
to evaluate usefulness (for people or systems)?<o:p></o:p></p>

<p class=MsoListParagraphCxSpMiddle style='text-indent:-.25in;mso-list:l0 level1 lfo1'><![if !supportLists]><span
style='font-family:Symbol'><span style='mso-list:Ignore'>·<span
style='font:7.0pt "Times New Roman"'>        
</span></span></span><![endif]><span dir=LTR></span>How are your corpora
processed (Aligned?  Markup? Standards?)<o:p></o:p></p>

<p class=MsoListParagraphCxSpMiddle style='text-indent:-.25in;mso-list:l0 level1 lfo1'><![if !supportLists]><span
style='font-family:Symbol'><span style='mso-list:Ignore'>·<span
style='font:7.0pt "Times New Roman"'>        
</span></span></span><![endif]><span dir=LTR></span>What kinds of quality
ratings do you use?<o:p></o:p></p>

<p class=MsoListParagraphCxSpMiddle style='text-indent:-.25in;mso-list:l0 level1 lfo1'><![if !supportLists]><span
style='font-family:Symbol'><span style='mso-list:Ignore'>·<span
style='font:7.0pt "Times New Roman"'>        
</span></span></span><![endif]><span dir=LTR></span>What are your lessons
learned?<o:p></o:p></p>

<p class=MsoListParagraphCxSpLast><o:p> </o:p></p>

<p class=MsoNormal>Proposers are encouraged to participate by sharing their
experiences, projects, needs and findings as a single contributor or as a
member of a panel. Of interest is the workflow process of creating or finding,
processing, standardizing and using parallel or comparable corpora for
improving language training of humans and machines.  Furthermore, if
participants have developed a financial return on investment scenario for using
parallel corpora, those insights and justifications are also welcome as
presentation topics.<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal><b>Organizers</b>:<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>Judith L. Klavans – U.S. Government and University of
Maryland<o:p></o:p></p>

<p class=MsoNormal>Elizabeth McGrath – MITRE Corporation<o:p></o:p></p>

<p class=MsoNormal>Trent Rockwood – MITRE Corporation <o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal><b>Important Dates and Schedule:<o:p></o:p></b></p>

<p class=MsoNormal><b><o:p> </o:p></b></p>

<p class=MsoNormal>June 14, 2010 – send out call for papers <o:p></o:p></p>

<p class=MsoNormal>July 20, 2010 – papers due <o:p></o:p></p>

<p class=MsoNormal>August 20, 2010 – send reviews back to submitters<o:p></o:p></p>

<p class=MsoNormal>September 10, 2010 – revisions due back to AMTA for
printing<o:p></o:p></p>

<p class=MsoNormal>November 4-5, 2010 – workshop dates<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal><b>Format<o:p></o:p></b></p>

<p class=MsoNormal>6 page max, 11pt minimum, 2 column, ACM format:  <o:p></o:p></p>

<p class=MsoNormal><a
href="http://www.acm.org/sigs/publications/proceedings-templates">http://www.acm.org/sigs/publications/proceedings-templates</a><o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal><b>Submissions and questions to</b>: Trent Rockwood, <a
href="mailto:trockwood@mitre.org">trockwood@mitre.org</a><o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

</div>

<div style='mso-element:footnote-list'><br clear=all>

<hr align=left size=1 width="33%">

<div style='mso-element:footnote' id=ftn1>

<p class=MsoFootnoteText><a style='mso-footnote-id:ftn1' href="#_ftnref1"
name="_ftn1" title=""><span class=MsoFootnoteReference><span
class=MsoFootnoteReference><span style='font-size:10.0pt'>[1]</span></span></span></a>
A few examples of major collections include the Linguistic Data Consortium (<a
href="http://www.ldc.upenn.edu">www.ldc.upenn.edu</a>),  the British
National Corpus (bnc.org), the JRC-Acquis corpora <a
href="http://wt.jrc.it/lt/Acquis/">http://wt.jrc.it/lt/Acquis/</a>,  the
ELRA MLCC Multilingual and Parallel Corpora <a href="http://catalog.elra.info">http://catalog.elra.info</a>,
Japanese-Chinese corpora <a href="http://www.nict.go.jp/"><i>www.<b>nict</b>.go.jp/</i></a><cite><span
style='font-style:normal'>, and many others.</span></cite><o:p></o:p></p>

</div>

</div>

</body>

</html>