<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
  <title></title>
</head>
<body bgcolor="#ffffff" text="#000000">
<pre wrap=""><a class="moz-txt-link-abbreviated"
 href="mailto:elsnet-list@elsnet.org">

</a></pre>
<h2 style="margin: 0cm 0cm 14pt; text-indent: 0cm;"><span
 style="font-size: 12pt;">Vacancies for two computer linguists<o:p></o:p></span></h2>
<p class="MsoNormal"><span style="font-size: 11pt;" lang="EN-GB">The
Institute for
Dutch Lexicology has two vacancies for experienced computer linguists
for the
development of Named Entity Processing tools for IMPACT.<o:p></o:p></span></p>
<p class="MsoNormal"><i style=""><span style="font-size: 11pt;"
 lang="EN-GB">IMPACT</span></i><span style="font-size: 11pt;"
 lang="EN-GB"> is a new European research project in the field of
informatics for the
humanities. The project will start on 1 january <st1:metricconverter
 productid="2008. In" w:st="on">2008. In</st1:metricconverter> IMPACT
15
National libraries and research institutes from Europe, <st1:country-region
 w:st="on">Israel</st1:country-region> and <st1:country-region
 w:st="on"><st1:place w:st="on">Russia</st1:place></st1:country-region>
will work together.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size: 11pt;" lang="EN-GB">The
main purpose
of IMPACT is to obtain a significant improvement of the accessibility
of historical
documents. <o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size: 11pt;" lang="EN-GB">To
achieve this,
the following will be tackled:<o:p></o:p></span></p>
<ol style="margin-top: 0cm;" start="1" type="1">
  <li class="MsoNormal" style=""><span style="font-size: 11pt;"
 lang="EN-GB">Current OCR-software is not suitable for mass
digitisation of historical documents. Within the project, OCR software
will be developed that will significantly improve the accuracy of
state­-of-the-art systems, so as to enable for the first time, reliable
full text mass digitisation of historical documents.<o:p></o:p></span></li>
  <li class="MsoNormal" style=""><span style="font-size: 11pt;"
 lang="EN-GB">Information in historical documents is not easily
accessed by modern users because of the historical language barrier.
Within the project,<span style="">  </span>historical lexica and
linguistic processing tools will be developed that will enable enriched
indexing to provide access historical material with contemporary query.<o:p></o:p></span></li>
</ol>
<p class="MsoNormal" style=""><span lang="EN-GB">To be effective the
lexica will also have to contain Named Entity data
and tools for NE recognition and NE classification for historical
language
material will have to be developed.</span></p>
<p class="MsoNormal" style=""><span lang="EN-GB"><o:p> </o:p></span></p>
<p class="MsoNormal" style=""><b style=""><span lang="EN-GB">Tasks<o:p></o:p></span></b></p>
<p class="MsoNormal"><span style="font-size: 11pt;" lang="EN-GB">The NE
specialists
will be responsible for the development of a toolbox for NE lexicon
building
and NE lexicon deployment to tackle historical language material to be
used for
the improvement of OCR of historical texts and for better retrieval on
historical text material. The work will imply the implementation as
well as the
design of relevant algorithms.</span><span style="font-size: 11pt;"> <o:p></o:p></span></p>
<h3 style="margin-left: 0cm; text-indent: 0cm;"><span
 style="font-size: 11pt;">Profile<o:p></o:p></span></h3>
<p class="MsoNormal" style="margin-left: 18pt; text-indent: -18pt;"><!--[if !supportLists]--><span
 style="font-size: 11pt; font-family: "Palatino Linotype";" lang="EN-GB"><span
 style="">-<span
 style="font-family: "Times New Roman"; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">         
</span></span></span><!--[endif]--><span style="font-size: 11pt;"
 lang="EN-GB">relevant
background in computational linguistics, computer science or applied
mathematics (master level, preferably PHD level)<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left: 18pt; text-indent: -18pt;"><!--[if !supportLists]--><span
 style="font-size: 11pt; font-family: "Palatino Linotype";" lang="EN-GB"><span
 style="">-<span
 style="font-family: "Times New Roman"; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">         
</span></span></span><!--[endif]--><span style="font-size: 11pt;"
 lang="EN-GB">sufficient
knowledge and experience with the development and implementation of NLP
algorithms, preferably in the field of NE processing<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left: 18pt; text-indent: -18pt;"><!--[if !supportLists]--><span
 style="font-size: 11pt; font-family: "Palatino Linotype";" lang="EN-GB"><span
 style="">-<span
 style="font-family: "Times New Roman"; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">         
</span></span></span><!--[endif]--><span style="font-size: 11pt;"
 lang="EN-GB">sufficient
experience in developing complex software systems; preferably
proficiency in C,
C++ and/or<span style="">  </span>Java <o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left: 18pt; text-indent: -18pt;"><!--[if !supportLists]--><span
 style="font-size: 11pt; font-family: "Palatino Linotype";" lang="EN-GB"><span
 style="">-<span
 style="font-family: "Times New Roman"; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">         
</span></span></span><!--[endif]--><span style="font-size: 11pt;"
 lang="EN-GB">knowledge
of Dutch language is required, preferably knowledge of historical Dutch
language<o:p></o:p></span></p>
<h3 style="margin-left: 0cm; text-indent: 0cm;"><span
 style="font-size: 11pt;">Offer<o:p></o:p></span></h3>
<p class="MsoNormal"><span style="font-size: 11pt;">An INL
contract for two years. </span><span style="" lang="EN-US">According
to the cao–Onderzoekinstellingen the salary scale indicated for this
job is 11
max., with a maximum of € 4.138, - gross per month on the basis of a 40
hour
week. In addition you will be entitled to 42 days holiday per year plus
holiday
pay.</span><span style="font-size: 11pt;" lang="EN-GB"><o:p></o:p></span></p>
<h3 style="margin-left: 0cm; text-indent: 0cm;"><span
 style="font-size: 11pt;">Interested<o:p></o:p></span></h3>
<p class="MsoNormal"><span style="font-size: 11pt;">Contact Katrien
Depuydt (Taalbank) INL, Postbus 9515, 2300 RA, Leiden <o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size: 11pt;">tel.
(+31 (0)71 527 2479), email: </span><span style=""><a
 href="mailto:depuyd@inl.nl">depuydt@inl.nl.</a><o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-GB">Send your application to Dr.
Jeannine
Beeken, INL, Postbus 9515, 2300RA <st1:place w:st="on"><st1:City
 w:st="on">Leiden</st1:City></st1:place>,
email: <a href="mailto:secretariaat@inl.nl">secretariaat@inl.nl</a></span></p>
<p class="MsoNormal"><span style="font-size: 11pt;" lang="EN-GB"><o:p> </o:p></span></p>
<p class="MsoNormal"><strong><span style="font-size: 11pt;">Closing
date:</span></strong><span style="font-size: 11pt;"> 02-01-2008<o:p></o:p></span></p>
<pre class="moz-signature" cols="72">-- 
Katrien Depuydt
Instituut voor Nederlandse Lexicologie
(Institute for Dutch Lexicology)
 Taalbank
(Language Database Dept.)
Postbus 9515
NL-2300 RA Leiden

tel.: +31 71 5272479
mail: <a class="moz-txt-link-abbreviated" href="mailto:depuydt@inl.nl">depuydt@inl.nl</a></pre>
</body>
</html>