<div>Taras,</div>
<div> </div>
<div>the prior question is: "how close is one domain or genre is to another".  (Presumably, porting costs vary with distance between domains/genres, so an account of porting costs without an account of text type similarity tells us nothing.)   </div>

<div> </div>
<div>But it's not a question that has had much scientific exploration.  Only viable approach I know of is based on comparing corpus frequencies of words or other constructs - see eg contrastive accounts of web corpora in recent work by Sharoff, Ferraresi and others</div>

<div> </div>
<div>Adam</div>
<div> </div>
<div>Sharoff, S (2006) <a href="http://corpus.leeds.ac.uk/serge/publications/wacky-paper.pdf">Creating general-purpose corpora using automated search engine queries.</a> In M. Baroni, S. Bernardini (eds.) <i>WaCky! Working papers on the Web as Corpus</i>, Bologna, 2006. </div>

<div>A. Ferraresi, E. Zanchetta, M. Baroni and S. Bernardini. 2008. <a href="http://clic.cimec.unitn.it/marco/publications/lrec2008/lrec08-ukwac.pdf">Introducing and evaluating ukWaC, a very large Web-derived corpus of English</a>. In Proceedings of the WAC4 Workshop at LREC 2008.<br>
<br></div>
<div class="gmail_quote">2008/7/3 Taras Zagibalov <<a href="mailto:T.Zagibalov@sussex.ac.uk">T.Zagibalov@sussex.ac.uk</a>>:<br>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">Dear colleagues,<br>I've been trying to study the problem of NLP systems' portability, but<br>failed to find any paper covering the subject. Could you please advise<br>
of any source of information that describes the problem of porting an<br>NLP system to different domains/genres/languages and provides some<br>metrics that measures how much it takes (of time, labour, resources...)<br>to port a system.<br>
Thank you in advance.<br><br>Taras Zagibalov<br>University of Sussex<br><br>_______________________________________________<br>Corpora mailing list<br><a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br><a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>================================================<br>Adam Kilgarriff <a href="http://www.kilgarriff.co.uk">http://www.kilgarriff.co.uk</a> <br>Lexical Computing Ltd <a href="http://www.sketchengine.co.uk">http://www.sketchengine.co.uk</a><br>
Lexicography MasterClass Ltd <a href="http://www.lexmasterclass.com">http://www.lexmasterclass.com</a><br>Universities of Leeds and Sussex <a href="mailto:adam@lexmasterclass.com">adam@lexmasterclass.com</a><br>================================================