<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
  <head>

    <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
  </head>
  <body bgcolor="#ffffff" text="#000000">
    <style type="text/css">p { margin-bottom: 0.21cm; }a:link { color: rgb(0, 0, 255); }</style>
    <p style="margin-bottom: 0cm;" lang="en-GB"></p>
    <tt>==============================================================<br>
      <br>
                  FIRST CALL FOR PAPERS<br>
      <br>
      OpenMT-2 Workshop on Using Linguistic Information for Hybrid
      Machine Translation<br>
      <br>
      Friday, November 18, 2011. Barcelona, Spain.<br>
      <a class="moz-txt-link-freetext" href="http://ixa2.si.ehu.es/lihmt2011">http://ixa2.si.ehu.es/lihmt2011</a> <br>
      ==============================================================<br>
      <br>
      Background<br>
      =========<br>
      Akin to the OpenMT Workshop on Mixing Approaches to Machine
      Translation in 2008 (<a class="moz-txt-link-freetext" href="http://ixa2.si.ehu.es/matmt-2008">http://ixa2.si.ehu.es/matmt-2008</a>), the aim of
      the OpenMT-2 Workshop on Using Linguistic Information for Hybrid
      Machine Translation (HMT) is to promote corpus-based methods and
      technologies that combine resources and algorithms from the three
      general approaches to MT: rule-based (RBMT), example-based (EBMT)
      and statistical (SMT).<br>
      <br>
      The boundaries between these three approaches are becoming
      narrower: <br>
      (i) String based SMT models are being augmented with
      morphological, syntactic or semantic information.<br>
      (ii) RBMT systems are using parallel corpora to improve their
      results by enriching their lexicons and grammars and creating new
      methods for disambiguation, <br>
      (iii) Previous projects have shown that benefits can be accrued by
      simple combination of MT systems created using different MT
      approaches.<br>
      <br>
      At the same time, data-driven Machine Translation (EBMT and SMT)
      is nowadays prevalent within the MT research community and
      translation results obtained with these approaches have now
      reached a reasonably useful level of quality, especially when the
      target language is English. But such data-driven MT systems base
      their knowledge on bilingual aligned corpora, and the accuracy of
      their output depends strongly on the quality and the size of that
      corpora. Large and reliable bilingual corpora are unavailable for
      many language pairs. In addition, translating into a
      morphologically rich target language makes the training of
      data-driven systems a lot more difficult.<br>
      <br>
      Workshop Programme<br>
      ================<br>
      The one-day workshop is being organised as part of the
      dissemination effort of the OpenMT-2 project, a Spanish government
      funded, three-year, multisite research effort addressing, on the
      one hand, approaches to integrating structural information
      (morphological, syntactic and semantic) into open-source SMT and,
      on the other, to developing novel automatic MT evaluation using
      linguistically motivated metrics. Thus, the central issues to be
      addressed during the workshop include:<br>
      methods and techniques for integrating structural information
      (syntactic and semantic) into HMT,<br>
      methods and techniques for handling morphologically rich languages
      (e.g. Basque) within HMT,<br>
      alternative approaches to automatic MT evaluation relying on
      linguistic criteria.<br>
      <br>
      The programme will include three invited plenary talks, each
      addressing one of the central issues above, and the presentation
      of a number of refereed contributions on related topics. The
      invited speakers include:<br>
      Lucia Specia (University of Wolverhampton, UK),<br>
      Ondřej Bojar (Charles University, Czech Republic),<br>
      TBA (TBA).<br>
      <br>
      The workshop will conclude with a brief panel discussion
      summarising the results of the presentations as they impact the
      central issues.<br>
      <br>
      Topics of Interest<br>
      =============<br>
      We are particularly interested in papers describing research and
      development in the following areas:<br>
      methods to compare and combine translation-outputs obtained from
      different MT systems,<br>
      methods for dealing with languages with rich morphology within
      data-driven approaches,<br>
      approaches to developing morphologically, syntactically or
      semantically augmented SMT models,<br>
      new automatic (or manual) MT evaluation methods based on
      linguistically motivated metrics,<br>
      descriptions of open-source or free language resources that are
      available for developing hybrid MT systems.<br>
      <br>
      All contributions will be published in the workshop proceedings.<br>
      <br>
      Important Dates<br>
      ============<br>
      Paper submission deadline: Sept. 9, 2011,<br>
      Notification of acceptance: Oct. 7, 2011,<br>
      Final version of paper: Oct 21, 2011,<br>
      Workshop: Nov 18, 2011.<br>
      <br>
      Submissions<br>
      =========<br>
      Papers should be in English and up to a maximum of 8 pages long.
      Please follow the ACL HLT 2011 formatting requirements for long
      papers found at: <br>
          <a class="moz-txt-link-freetext" href="http://www.acl2011.org/call.shtml">http://www.acl2011.org/call.shtml</a><br>
      <br>
      To submit contributions, please follow the instructions at the
      EasyChair conference management system submission website at: <br>
          <a class="moz-txt-link-freetext" href="http://www.easychair.org/conferences/?conf=lihmt2011">http://www.easychair.org/conferences/?conf=lihmt2011</a>.<br>
                  <br>
      The deadline for submission is September 9, 2011.<br>
      The contributions will undergo a double-blind review by members of
      the programme committee.<br>
      <br>
      Please address queries to <a class="moz-txt-link-abbreviated" href="mailto:lihmt@easychair.org">lihmt@easychair.org</a><br>
      <br>
      <br>
      Programme committee (Tentative)<br>
      ================<br>
      <br>
      Co-Chair: David Farwell (Technical University of Catalonia, TALP,
      Barcelona)<br>
      Co-Chair: Gorka Labaka (University of the Basque Country,
      Donostia)<br>
      <br>
      Iñaki Alegria (University of the Basque Country, Donostia)<br>
      Ondřej Bojar (Charles University, Czech Republic)<br>
      Arantza Díaz de Ilarraza (University of the Basque Country,
      Donostia)<br>
      Chris Dyer (Carnegie Mellon University, US)<br>
      Cristina España (Technical University of Catalonia, TALP,
      Barcelona)<br>
      Marcello Federico (Fondazione Bruno Kessler, Italy)<br>
      Mikel Forcada (University of Alacant, Alicante)<br>
      Adrià de Gispert (University of Cambridge, UK)<br>
      Kevin Knight (Information Sciences Institute, US)<br>
      Phillip Koehn (University of Edinburgh, UK)<br>
      José Mariño (Technical University of Catalonia, TALP, Barcelona)<br>
      Lluís Màrquez (Technical University of Catalonia, TALP, Barcelona)<br>
      Hermann Ney (RWTH-Aachen, Germany)<br>
      Daniele Pighin (Technical University of Catalonia, TALP,
      Barcelona)<br>
      Aarne Ranta (Chalmers University of Technology, Gothenburg,
      Sweden)<br>
      Marta R. Costa-jussà (Barcelona Media, Spain)<br>
      Felipe Sánchez-Martínez (University of Alacant, Alicante)<br>
      Kepa Sarasola (University of the Basque Country, Donostia)<br>
      Lucia Specia (University of Wolverhampton, UK)<br>
      Dekai Wu (Hong Kong University of Science and Technology, China)<br>
      <br>
      Local organization<br>
      ==============<br>
      Centre for Speech and Language Applications and Technologies
      (TALP), Technical University of Catalonia (UPC).<br>
      Committee members: David Farwell (Chair), Amarin Deemagarn,
      Cristina España, Meritxell González, Lluís Màrquez, Daniele
      Pighin.<br>
      <br>
      <br>
      About the OpenMT-2 project<br>
      =====================<br>
      The main goal of the OpenMT-2 project is the development of Open
      Source Machine Translation Architectures based on hybrid models
      and advanced semantic processors. These architectures will be
      open-source systems combining the three main Machine Translation
      frameworks – Rule-Based MT (RBMT), Statistical MT (SMT) and
      Example-Based MT (EBMT) – into hybrid systems. Defined
      architectures and results of the project will be Open Source, so
      it will allow rapid development and adaptation of new advanced
      Machine Translations systems for other languages. We will test the
      functionality of this system with different languages: English,
      Spanish, Catalan and Basque; so we will evaluate such
      architectures in different contexts. While there are many corpus
      resources for English and Spanish, there are not so many for
      Catalan and Basque languages. While the structure of some of those
      languages is very similar (Catalan and Spanish), others are very
      different (English and Basque). Basque is an agglutinative and
      highly inflecting language, unlike English, Catalan and Spanish.<br>
      <br>
      In parallel there has been extensive work on developing an
      automatic Evaluation platform that for the introduction of
      linguistically motivated morphological, syntactic and semantic
      metrics into the design of MT Evaluation methodologies as well as
      the development and testing of concrete, linguistically-based
      evaluation techniques.<br>
      <br>
      The main innovative points of the OpenMT-2 project are:<br>
      The design of hybrid systems combining traditional linguistic
      rules, example-based methods and statistical methods.<br>
      The development of MT evaluation methods based on linguistically
      motivated metrics.<br>
      Open Source Systems.<br>
      The use of advanced syntactic and semantic processing in MT.<br>
      <br>
      For further details, see the OpenMT-2 website:
      <a class="moz-txt-link-freetext" href="http://ixa.si.ehu.es/openmt2">http://ixa.si.ehu.es/openmt2</a><br>
      <br>
      <br>
      <br>
      <br>
    </tt>
  </body>
</html>