<table cellpadding=3 cellspacing=0 border=0 width=100% bgcolor=white><tr valign=top><td width=100%><font size=2 color=black>Dear Chelo,<br> <br>I think you might find the following reference useful:<br> <br>

<DT>Sarmento, Luís, Belinda Maia & Diana Santos. "The Corpógrafo - a Web-based environment for corpora research", in Maria Teresa Lino, Maria Francisca Xavier, Fátima Ferreira, Rute Costa & Raquel Silva (eds.), <I>Proceedings of LREC'2004, Fourth International Conference on Language resources and Evaluation</I> (Lisboa, 26-28 May 2004), pp. 449-52.</DT><br><P>You can download the pdf file from Linguateca's web site at: <A href="http://www.linguateca.pt/Diana/download/SarmentoMaiaSantosLREC2004.pdf">http://www.linguateca.pt/Diana/download/SarmentoMaiaSantosLREC2004.pdf</A></P>

<P>In this paper we describe the Corpógrafo, a web based environment that we have been developing for almost two years. The Corpógrafo allows users to create their own personal (and private) corpora by uploading various types of files (pdf, post-script, html, word, rtf...) to our web server. Once a specific corpus has been collected (containing any combination of the uploaded files), users can perform a variety of standard corpus search operations (regular expression concordancing, KWIC, N-Gram analysis) and also extract terminology from the corpus by using a combination of statistical algorithms and lexical filters, built for portuguese, english, spanish and italian (also french and german but results are not as good). </P>

<P>All the terminology extracted may be automatically stored in specific terminology databases (created by the user) for further knowledge extraction. These databases allow the user to set and manage meta-information about the term, as defined by the ISO standard. The Corpografo will also help the user in finding definitions for terms and possible semantic relations among them (at the moment only meronimy and hiponimy) by searching the corpus again for specific patterns and clues and presenting possible candidates to the user for validation. Users may also manually identify bilingual equivalents in order to create multilingual terminological databases.</P>

<P>We will be releasing Version 2 of Corpógrafo in late October with more and revised functionalities and a more user-friendly interface. For now, please have a look at <A href="http://www.linguateca.pt/corpografo/">www.linguateca.pt/corpografo/</A> and have a try (you need to subscribe the Corpógrafo before using it). The web interface is in portuguese but user documentation is available in both portuguese and english. At the moment, Corpógrafo is being regurlarly used by 40 users (aprox.) that have been doing terminological research on a variety of knowledge domains based on their own personal specific domain corpora...</P>

<P>I hope this helps.</P>

<P>Regards,</P>

<P>Luís Sarmento</P>

<P><A href="mailto:las@letras.up.pt">las@letras.up.pt</A></P>

<P>Linguateca</P>

<P> </P>

 --- On Wed 09/22, Chelo Vargas < Chelo.Vargas@ua.es > wrote: From: Chelo Vargas [mailto: Chelo.Vargas@ua.es] To: CORPORA@HD.UIB.NO Date: Wed, 22 Sep 2004 07:00:43 +0200 Subject: [Corpora-List] special purpose corpora

<META content="MSHTML 6.00.2800.1458" name=GENERATOR><br>

<FONT face=Arial size=2><SPAN class=734103704-22092004>Dear all,</SPAN></FONT><br><FONT size=+0><SPAN class=734103704-22092004>

<P><FONT face=Arial><FONT size=2><SPAN class=734103704-22092004>I am </SPAN>looking for <SPAN class=734103704-22092004>literature dealing with the design and compilation of special purpose corpora, more specifically, corpora with a terminographical purpose</SPAN>. <SPAN class=734103704-22092004>The references I already have are: </SPAN></FONT></FONT></P>

<P><FONT face=Arial><FONT size=2><SPAN class=734103704-22092004><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">Pearson, J. </SPAN><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">(19</SPAN><SPAN lang=EN-US style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">98): <I>Terms in Context; </I></SPAN></SPAN></FONT></FONT><FONT face=Arial><FONT size=2><SPAN class=734103704-22092004><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">Meyer, </SPAN><?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" /><st1:place><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">I.</SPAN></st1:place><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes"> </SPAN><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">y<SPAN style="FONT-VARIANT: small-caps"> Mackintosh, K. </SPAN>(1996a): "The Corpus from a Terminographer's Viewpoint", </SPAN></SPAN></FONT></FONT><FONT face=Arial><FONT size=2><SPAN class=734103704-22092004><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">Ahmad, K. </SPAN><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">y </SPAN><st1:City><st1:place><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">Rogers</SPAN></st1:place></st1:City><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">, M. (2001): "</SPAN><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">Corpus Linguistics and Terminology Extraction<SPAN style="FONT-VARIANT: small-caps">", </SPAN></SPAN></SPAN></FONT></FONT>
 <FONT face=Arial><FONT size=2><SPAN class=734103704-22092004><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes; mso-bidi-font-size: 11.0pt">Bowker, </SPAN><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">L. (1996): "Towards a Corpus-Based Approach to Terminography"; </SPAN></SPAN></FONT></FONT><FONT face=Arial><FONT size=2><SPAN class=734103704-22092004><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes; mso-bidi-font-size: 11.0pt">Bowker, </SPAN><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">L. y </SPAN><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; FONT-VARIANT: small-caps; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes; mso-bidi-font-size: 11.0pt">Pearson, J. </SPAN><SPAN lang=EN-GB style="FONT-SIZE: 12pt; LINE-HEIGHT: 160%; FONT-FAMILY: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-GB; mso-fareast-language: ES; mso-bidi-language: AR-SA; mso-bidi-font-weight: bold; mso-no-proof: yes">(2002): <I>Working with Specialized Language. A practical guide to using corpora</I>, Londres y Nueva York: Routledge</SPAN></SPAN></FONT></FONT></P>

<P><FONT face=Arial size=2><SPAN class=734103704-22092004>Thank you very much in advance</SPAN></FONT></SPAN></FONT></P><br><DIV align=left>

<DIV align=left><FONT face=Arial color=#003366 size=2>

<DIV align=left><FONT face=Arial color=#003366 size=2>***********************************************************</FONT><br><FONT face="Franklin Gothic Book" color=#800040><STRONG><EM>Chelo Vargas</EM></STRONG></FONT><br><FONT face="Bookman Old Style" color=#aaaaaa size=2><STRONG>Universidad de Alicante</STRONG></FONT><br><FONT face="Bookman Old Style" color=#aaaaaa size=2><STRONG>Dpto. Filología Inglesa</STRONG></FONT><br><FONT face="Bookman Old Style" color=#aaaaaa size=2><STRONG>Apdo. 99</STRONG></FONT><br><FONT face="Bookman Old Style" color=#aaaaaa size=2><STRONG>03080 Alicante</STRONG></FONT><br><FONT face=Arial color=#cc3300 size=2>Tlf. 96590 9579</FONT><br><FONT face=Arial color=#cc3300 size=2>Fax 96590 3800</FONT><br><FONT face=Arial size=2><A href="mailto:Chelo.Vargas@ua.es">Chelo.Vargas@ua.es</A></FONT><br></FONT><br> <br><P></P><br></font></td></tr></table><p><hr><font size=2 face=geneva><b>Join Excite! - <a href=http://www.excite.com target=_blank>http://www.excite.com</a></b><br>The most personalized portal on the Web!</font>