<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
</head>
<body bgcolor="#ffffff" text="#000000">
    On Pages 10-14 of <i>Tableau</i>, there is a profile of the ARTFL
project at the University of Chicago, which began as a collaboration
with the French CNRS to clean up the FRANTEXT corpus, and has since
been extended to other corpora.<br>
<br>
<a class="moz-txt-link-freetext" href="http://humanities.uchicago.edu/tableau/issues/fall_2009.pdf">http://humanities.uchicago.edu/tableau/issues/fall_2009.pdf</a><br>
<br>
    The FRANTEXT corpus of canonical French works was compiled for the <i>Trésor
de la langue française</i> dictionary, from first editions in the 1960s
on punch cards and paper tape.  The ARTFL website offers several tools
for searching the corpus.<br>
<br>
<a class="moz-txt-link-freetext" href="http://artfl-project.uchicago.edu/">http://artfl-project.uchicago.edu/</a><br>
<br>
    Most of the cleaned-up text files are available for download from
Gallica, as are scanned images of many of the documents.<br>
<br>
<a class="moz-txt-link-freetext" href="http://gallica.bnf.fr/">http://gallica.bnf.fr/</a><br>
<br>
    I worked as a student employee at ARTFL in 1993 and 1994; for some
reason I particularly remember cleaning up Nerval's translation of <i>Faust</i>,
and Sainte-Beuve's history of Port-Royal.  Since then I have used the
FRANTEXT corpus for several projects, including my dissertation.  I
highly recommend it to anyone interested in written French up to 1950,
with the caveat that it is strongly biased towards the canon.<br>
<pre class="moz-signature" cols="72">-- 
                                -Angus B. Grieve-Smith
                                <a class="moz-txt-link-abbreviated" href="mailto:grvsmth@panix.com">grvsmth@panix.com</a>
</pre>
</body>
</html>