Eric,<br><br>You might contact John Aberdeen at the MITRE Corporation.  I think that his deidentification tool is available.<br><br>Best wishes,<br><br>Kevin Cohen<br><br><div class="gmail_quote">On Fri, May 27, 2011 at 4:12 PM, Eric Atwell <span dir="ltr"><<a href="mailto:csc6ea@leeds.ac.uk">csc6ea@leeds.ac.uk</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">We are investigating research methods for patient records.<br>
To be available for Corpus Linguistics analysis, patient records<br>
have to be anonymised, so individual patients cannot be identified. Can anyone point us at tools to (semi-)automate anonymization or<br>
deidentification of health text data (or any other text data)?<br>
<br>
I managed to find "deid" in Physionet<br>
<a href="http://www.physionet.org/physiotools/deid/" target="_blank">http://www.physionet.org/physiotools/deid/</a><br>
Neamatullah I, Douglass M, Lehman LH, Reisner A, Villarroel M, Long WJ,<br>
Szolovits P, Moody GB, Mark RG, Clifford GD. Automated De-Identification<br>
of Free-Text Medical Records. British Medical Council: Medical Informatics and Decision Making, 2008, 8:32.<br>
<br>
and a survey:<br>
Ozlem Uzuner, Yuan Luo, Peter Szolovits. Evaluating the State-of-the-Art in Automatic De-identification. JAMIA Journal of the American Medical<br>
Informatics Association, 2007,14:550-563<br>
<br>
thanks forany other recommendations<br>
<br>
Eric Atwell, Senior Lecturer, Language research group,<br>
 I-AIBS Institute for Artificial Intelligence and Biological Systems<br>
 School of Computing, Faculty of Engineering, UNIVERSITY OF LEEDS<br>
 Leeds LS2 9JT, England.        TEL: 0113-3435430  FAX: 0113-3435468<br>
 WWW: <a href="http://www.comp.leeds.ac.uk/arabic" target="_blank">http://www.comp.leeds.ac.uk/arabic</a><br>
      <a href="http://www.comp.leeds.ac.uk/nlp" target="_blank">http://www.comp.leeds.ac.uk/nlp</a><br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>Kevin Bretonnel Cohen, PhD<br>Biomedical Text Mining Group Lead, Computational Bioscience Program, <br>U. Colorado School of Medicine<br>303-916-2417 (cell) 303-377-9194 (home)<br>
<a href="http://compbio.ucdenver.edu/Hunter_lab/Cohen" target="_blank">http://compbio.ucdenver.edu/Hunter_lab/Cohen</a><br><br><br><br>