<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div><br></div><div>Termine <a href="http://www.nactem.ac.uk/software/termine/">http://www.nactem.ac.uk/software/termine/</a> would give you candidate terms but these also would have to be evaluated.</div><div>C-value upon which Termine is based, has been implemented for several languages, e.g. Spanish, Japanese, Chinese, etc.</div><div><br></div><div>Sophia </div><div><br></div><div><br></div><div><br><div><div>On 19 Feb 2014, at 16:00, Kevin B. Cohen wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"><div dir="ltr"><div>Hi, Adam,<br><br>I would recommend talking with Sophia Ananiadou, the creator of TerMine.<br><br></div><div>Kev<br><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Wed, Feb 19, 2014 at 4:34 AM, Adam Kilgarriff <span dir="ltr"><<a href="mailto:adam@lexmasterclass.com" target="_blank">adam@lexmasterclass.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_quote"><div dir="ltr"><div>Dear all,</div><div><br></div><div>The Sketch Engine now supports term extraction for many languages - and we want to evaluate it.</div>

<div><br></div><div>For that, we need domain corpora in which somebody has gone through identifying all the 'true' terms.  Then we can compute our system's precision and recall.</div>


<div><br></div><div>We are aware of GENIA, for English, and are using that already (key citation here:<font color="#000000"> <a href="http://scholar.google.co.uk/citations?view_op=view_citation&hl=en&user=VsRwsN8AAAAJ&citation_for_view=VsRwsN8AAAAJ:u5HHmVD_uO8C" style="text-decoration:none;font-family:Arial,sans-serif;background-color:rgb(232,244,247)" target="_blank">A comparative evaluation of term recognition algorithms</a> 2008: </font><span style="line-height:16.1200008392334px;background-color:rgb(232,244,247);font-family:Arial,sans-serif">Z Zhang, J Iria, CA Brewster, F Ciravegna) </span></div>




<div><br></div><div>Any corpus with "the terms it contains", conscientiously produced, will help us.</div><div><br></div><div>Pointers please!</div><span class="HOEnZb"><font color="#888888"><span><font color="#888888"><div>

<br></div><div>

Adam<br clear="all"><div><br></div>-- <br>========================================<br>
<a href="http://www.kilgarriff.co.uk/" target="_blank">Adam Kilgarriff</a>                  <a href="mailto:adam@lexmasterclass.com" target="_blank">adam@lexmasterclass.com</a>                                             <br>




Director                                    <a href="http://www.sketchengine.co.uk/" target="_blank">Lexical Computing Ltd</a>                <br>Visiting Research Fellow                 <a href="http://leeds.ac.uk/" target="_blank">University of Leeds</a>     <div>




<i><font color="#006600">Corpora for all</font></i> with <a href="http://www.sketchengine.co.uk/" target="_blank">the Sketch Engine</a>                 </div><div>                        <i><a href="http://www.webdante.com/" target="_blank">DANTE: <font color="#009900">a lexical database for English</font></a><font color="#009900"> </font>                 </i><div>




========================================</div></div>
</div></font></span></font></span></div>
</div><br><br>
</div>
<br>_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br><div dir="ltr">Kevin Bretonnel Cohen, PhD<br>Biomedical Text Mining Group Lead, Computational Bioscience Program, <br>U. Colorado School of Medicine<br>303-916-2417<br>

<a href="http://compbio.ucdenver.edu/Hunter_lab/Cohen" target="_blank">http://compbio.ucdenver.edu/Hunter_lab/Cohen</a><br><br><br><br></div>
</div>
</blockquote></div><br><div>
<span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; color: rgb(35, 35, 35); font-size: 13px; ">----------</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; color: rgb(35, 35, 35); font-size: 13px; ">Professor Sophia Ananiadou, School of Computer Science,</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; color: rgb(35, 35, 35); font-size: 13px; ">Director, National Centre for Text Mining</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; color: rgb(35, 35, 35); font-size: 13px; ">Manchester Institute of Biotechnology</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; color: rgb(35, 35, 35); font-size: 13px; ">University of Manchester</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; color: rgb(35, 35, 35); font-size: 13px; ">131 Princess Street, M1 7DN</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; color: rgb(34, 60, 251); font-size: 13px; "><span style="text-decoration: underline; "><a href="http://www.nactem.ac.uk/">www.nactem.ac.uk</a></span></div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; font-size: 13px; "><font class="Apple-style-span" color="#232323"><a href="mailto:Sophia.Ananiadou@manchester.ac.uk">sophia.ananiadou@manchester.ac.uk</a></font></div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; font-size: 13px; "><a href="http://www.nactem.ac.uk/staff/sophia.ananiadou/">http://www.nactem.ac.uk/staff/sophia.ananiadou/</a></div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 12px/normal Helvetica; font-size: 13px; "><font class="Apple-style-span" color="#232323">tel: +44 (0)161 306 3092</font></div></div></span>
</div>
<br></div></body></html>