Maggie,<br><br>By ATR, do you mean automatic term recognition?  If so, then yes, both of these could be good data sets for your research.  They differ considerably in terms of the number of semantic types and the complexity of the ontology (which is explicit in GENIA and implicit in GENETAG) that underlies each.  You might also be interested in the MEDSTRACT corpus, which is also annotated with respect to a larger set of semantic types than "just" genes.
<br><br>Kevin<br><br><div><span class="gmail_quote">On 10/12/07, <b class="gmail_sendername">zxing2</b> <<a href="mailto:zxing2@student.cityu.edu.hk">zxing2@student.cityu.edu.hk</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Dear Members,<br><br>Do you know if GENIA or GENETAG is suitable for linguistics students to do ATR research because gene identification seems belonging to bioinformatics. Am I right? I intend to do ATR research and want to find a suitable corpus to do experiment. Could you give me some suggestions?
<br><br>Thanks<br><br>Maggie Cheng<br><br>_______________________________________________<br>Corpora mailing list<br><a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br><a href="http://mailman.uib.no/listinfo/corpora">http://mailman.uib.no/listinfo/corpora
</a><br></blockquote></div><br><br clear="all"><br>-- <br>K. B. Cohen<br>Biomedical Text Mining Group Lead<br>Center for Computational Pharmacology<br>303-724-7563 (office) 303-916-2417 (cell) 303-377-9194 (home)<br><a href="http://compbio.uchsc.edu/Hunter_lab/Cohen">
http://compbio.uchsc.edu/Hunter_lab/Cohen</a>