<div style="margin-left:40px">** apologies for multiple postings
        **<br><b></b>-------------------------------------------------------------------------<br>Call for participation <br>Early registration deadline:  Thursday, **September 20**. <br>-------------------------------------------------------------------------<br>
</div><b></b><br><div style="margin-left:40px">AMTA
        2012 Workshop on Monolingual Machine Translation (MONOMT
        2012)<br>Date: Nov 1, 2012<br>Location: San Diego, United
        States<br><b></b>* Colocated with AMTA 2012 (The Tenth Biennial
        Conference of the Association for <br>Machine Translation in
        the America)<br><br><a href="http://computing.dcu.ie/%7Etokita/MONOMT/monomt.htm">http://computing.dcu.ie/~tokita/MONOMT/monomt.htm</a><b><b><b><style type="text/css"><!--
                @page { margin: 0.79in }
                P { margin-bottom: 0.08in }
                A:link { so-language: zxx }
        --></style></b></b></b><br><br><b><b><b><font color="#3366FF"><b>Invited Speakers</b></font></b></b></b><br></div><b><b><b><font color="#3366FF"><b><br></b></font></b></b></b><div style="margin-left:40px">Marcello Federico (FBK, Italy)<br>
George Foster (National Research Council Canada, Canada)<br>Philipp Koehn (university of Edinburgh, UK)<br>Qun Liu (Dublin City University, Ireland & Chinese Academy of Science, China)<br>Evgeny Matusov (SAIC)<br>Taro Watanabe (NICT, Japan)<br>
(More ...)<br><br></div><b><b><b><div style="margin-left:40px"><font color="#3366FF"><b>ACCEPTED PAPERS</b></font></div></b></b></b><div style="margin-left:40px">
<br><font color="#073763">
Long Presentations
<span style></span></font></div><b><b><b><div><font color="#073763"><ul><div><font color="#0099CC">
<div><font color="#3366FF">
<div><font color="#000000" face="times">
</font><div style="margin-left:40px"><font style="font-weight:normal" color="#000000" face="times"><li>Improving English to Spanish Out-of-Domain Translations by Morphology
Generalization and Generation</li></font><font color="#0099CC"><font color="#3366FF"><font color="#000000" face="times">
</font></font></font></div><div style="margin-left:40px"><span style="font-weight:normal;color:rgb(0,0,0)">Lluis Formiga, Adolfo Hernandez, Jose B. Marino, and Enric Monte</span><br><font style="font-weight:normal" color="#000000" face="times"><li>
Monolingual Data Optimisation for Bootstrapping SMT Engines</li></font></div><div style="margin-left:40px;font-weight:normal;color:rgb(0,0,0)">Jie Jiang, Andy Way, Nelson Ng, Rejwanul Haque, Mike Dillinger, and Jun Lu</div>
<div style="margin-left:40px;font-weight:normal"><font color="#000000" face="times"><li>
Shallow and Deep Paraphrasing for Improved Machine Translation Parameter Optimization</li></font></div><div style="margin-left:40px"><span style="font-weight:normal;color:rgb(0,0,0)">Dennis Nolan Mehay and Michael White</span>
<font color="#000000" face="times">
</font></div></div></font></div></font></div></ul></font><div style="margin-left:40px"><font color="#073763"><font color="#0099CC"><font color="#3366FF"><font color="#000000" face="times"><div><font color="#073763">
Short Presentations</font></div></font></font></font></font></div><font color="#073763"><font color="#0099CC"><font color="#3366FF"><font color="#000000" face="times"><div><font color="#073763">
</font></div></font></font></font></font><font color="#073763"><font color="#0099CC"><font color="#3366FF"><font color="#000000" face="times"><font color="#073763">
<ul><font color="#000000" face="times">
<li style="margin-left:40px"><span style="font-weight:normal">Two stage Machine Translation System using Pattern-based MT and Phrase-based SMT</span><br>
<span style="font-weight:normal;color:rgb(0,0,0)">Jin'ichi Murakami, Takuya Nishimura and Masato Tokuhisa</span>
</li><li style="margin-left:40px"><span style="font-weight:normal">Improving Word Alignment by Exploiting Adapted Word Similarity</span><br>
<span style="font-weight:normal">Septina Dian Larasati</span>
</li><li style="margin-left:40px"><span style="font-weight:normal">Addressing some Issues of Data Sparsity towards Improving English-Manipuri SMT using Morphological Information</span><br>
<span style="font-weight:normal">Thoudam Doren Singh</span>
</li><li style="margin-left:40px"><span style="font-weight:normal">Statistical Machine Translation for Depassivizing German Part-of-speech Sequences</span><br>
<span style="font-weight:normal">Benjamin Gottesman</span></li></font><br>


        
        
        
        <style type="text/css">
        <!--
                @page { margin: 0.79in }
                P { margin-bottom: 0.08in }
        -->
        </style>

<br><span style="color:rgb(0,0,0);font-weight:normal">DESCRIPTION</span><br style="color:rgb(0,0,0);font-weight:normal"><p style="margin-bottom:0in;color:rgb(0,0,0);font-weight:normal"><br>Due to the
increasing demands for high quality translation,<br>monolingual
Machine Translation (MT) subtasks are frequently<br>encountered in
various occasions, where one MT task is decomposed into<br>several
subtasks some of which can be called `monolingual'. Such<br>monolingual
MT subtasks include: (1) MT for morphologically rich<br>languages,
[Bojar, 08] aimed at dealing with morphologic richness of<br>the
target, as is the case with the English-Czech (EN-CZ) language<br>pair.
An MT task is thus split into two subtasks: first, English
is<br>(`bilingually') translated into simplified Czech and then,
the<br>obtained morphologically normalized Czech is
(`monolingually')<br>translated into morphologically rich Czech; (2)
system combination<br>[Matusov et al., 05], where a source sentence
is first translated into<br>the target language by several MT
systems, and then, the obtained<br>translations are combined to
create / generate the output in the same<br>language; (3) statistical
post-editing [Dugast et al., 07; Simard et<br>al., 07], where a
source sentence is first translated into the target<br>language by a
rule-based MT system and then, the obtained output is<br>`monolingually'
translated by an SMT system; (4) domain adaptation<br>using transfer
learning [Daume III, 07]: the source side written in a<br>`source'
domain (e.g., newswires) is converted into the target side<br>written
in a `target' domain (e.g., patents); (5) transliteration<br>between
phonemes / alphabets [Knight and Graehl, 98]; (6)
considering<br>reordering issues (SVO and SOV) [Katz-Brown et al.,
11]; (7) MERT<br>process [Arun et al., 10]; (8) translation memory
(TM) and MT<br>integration [Ma et al., 11]; (9) paraphrasing for
creating additional<br>training data or for evaluation purposes.<br><br>A
distinction could be established between bilingual MT tools<br>(B-tools)
and monolingual MT tools (M-tools) that may be exploited
for<br>monolingual MT. Consider, e.g., monolingual subtasks such as
MT for<br>morphologically rich languages, statistical post-editing,
or<br>transliteration and a task of system combination or domain
adaptation<br>as respective representatives. The latter group is
often approached<br>with monolingual M-tools like monolingual word
alignment [Matusov et<br>al., 05; He et al., 08] and the minimization
of Bayes risk [Kumar and<br>Byrne, 02] (on the outputs of combined
systems). However, the former<br>usually employs bilingual MT tools,
like GIZA++ [Och and Ney, 04] to<br>extract bilingual phrases and MAP
decoding on them. The way M-tools<br>and B-tools are used for
monolingual MT is an issue of particular<br>interest for this
workshop.<br><br>This workshop is intended to provide the opportunity
to discuss ideas<br>and share opinions on the question of the
applicability of M-tools or<br>B-tools for monolingual MT subtasks,
and on their respective strengths<br>and weaknesses in specific
settings. Furthermore we wish to provide<br>opportunity to
demonstrate successful usecases of M-tools.<br><br>Possible
questions, that are encouraged to be addressed during the<br>workshop,
include:<br>    ways of applying M-tools to
monolingual MT subtasks such as MT for<br>morphologically rich
languages and statistical post-editing.<br>   
investigation of the suitability of B-tools or M-tools
for<br>monolingual MT subtasks.<br>    performance
improvements of monolingual word alignment tools,<br>since these are
necessary for specific monolingual subtasks, such as<br>MT for
morphologically rich languages and statistical
post-editing.<br><br>IMPORTANT DATES<br><br>Submission deadline:
<strike>August 14, 2012</strike><br>Notification to authors: <strike>August
31, 2012</strike><br>Camera ready: <strike>September 7,
2012</strike><br>Workshop: November 1, 2012<br><br>TOPICS OF
INTEREST<br><br>Original papers are invited on different aspects of
monolingual MT, such as:<br>    MT for morphologically
rich languages<br>    system combination<br>   
statistical post-editing<br>    domain adaptation<br>   
MERT process<br>    MT for reordering mismatched
language pairs (SVO and SOV)<br>    MT-Translation
Memory integration<br>    transliteration<br>   
MT using textual entailment<br>    MT using confidence
estimation<br>    paraphrasing<br>   
hybrid MT<br><br>Papers describing the mechanism of MT tools that may
be considered<br>`monolingual' are also encouraged. Some possible
topics are listed<br>below:<br>    MBR decoding,
consensus decoding<br>    monolingual word alignment
(based on TER, METEOR,...)<br>    language models
constructed by learning the representation of data<br>   
data structure related matters<br>    ranking
algorithms<br>    multitask learning (in the context
of domain adaptation)<br><br>WORKSHOP CHAIRS<br><br>Tsuyoshi Okita
(DCU, Ireland)<br>Artem Sokolov (LIMSI, France)<br>Taro Watanabe
(NICT, Japan)<br><br>PROGRAM COMMITTEE (Tentative)<br><br>Bogdan
Babych (University of Leeds, UK)<br>Loic Barrault (LIUM, Universite
du Maine, France)<br>Nicola Bertoldi (FBK, Italy)<br>Ergun Bicici
(CNGL, Dublin City University, Ireland)<br>Ondrej Bojar (Charles
University, Czech)<br>Boxing Chen (NRC Institute for Information
Technology, Canada)<br>Trevor Cohn (University of Sheffield,
UK)<br>Marta Ruiz Costa-jussa (Barcelona Media, Spain)<br>Josep M.
Crego (SYSTRAN, France)<br>John DeNero (Google, USA)<br>Jinhua Du
(Xi'an University of Technology, China)<br>Kevin Duh (Nara Institute
of Science and Technology, Japan)<br>Chris Dyer (CMU, USA)<br>Christian
Federmann (DFKI, Germany)<br>Yvette Graham (Dublin City University,
Ireland)<br>Barry Haddow (University of Edinburgh, UK)<br>Xiadong He
(Microsoft, USA)<br>Jagadeesh Jagarlamudi (University of Maryland,
USA)<br>Jie Jiang (Applied Language Solutions, UK)<br>Philipp Koehn
(University of Edinburgh, UK)<br>Shankar Kumar (Google, USA)<br>Alon
Lavie (CMU, USA)<br>Yanjun Ma (Baidu, China)<br>Aurelien Max (LIMSI,
University Paris Sud, France)<br>Maite Melero (Barcelona Media,
Spain)<br>Philip Resnik (University of Maryland, USA)<br>Stefan
Riezler (University of Heidelberg, Germany)<br>Lucia Specia
(University of Sheffield, UK)<br>Marco Turchi (JRC, Italy)<br>Antal
van den Bosch (Radboud University Nijmegen, Netherlands)<br>Xianchao
Wu (Baidu, Japan)<br>Dekai Wu (HKUST, Hong Kong)<br>Francois Yvon
(LIMSI, University Paris Sud, France)</p>
</ul></font></font></font></font></font></div></b></b></b>