This one is for all who are not into sed, perl etc.<br><br>Jedit's (Java based text editor, <a href="http://www.jedit.org">www.jedit.org</a>) XML plugin has a "Remove all tags" command.<br><br>It might win the prize for the fastest way to do it, too.
<br><br>Notis<br><br><div><span class="gmail_quote">On 11/28/06, <b class="gmail_sendername">Martin Wynne</b> <<a href="mailto:martin.wynne@oucs.ox.ac.uk">martin.wynne@oucs.ox.ac.uk</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
I'd use sed too, although I don't think Oliver's command will catch<br>cases where there is a line break between the < and the >, so typically<br>won't catch long comments in the markup, for example. If you run the<br>
following first:<br><br>cat yourxmltext | grep "<" | grep -v ">"  | less<br><br>it should show any lines with just an opening "<", and alert you to the<br>presence of any potential problems.
<br><br>Martin<br><br>Oliver Mason wrote:<br>> With sed it's even easier...<br>><br>> cat yourxmltext | sed 's/<[^>]*>//g' > yourplaintext<br>><br>> This removes everything in '<..>'; not as complete as Lou's earlier
<br>> suggestion regarding XSLT, but I guess it wins the prize for the<br>> shortest solution...<br>><br>> Oliver<br>><br>> On 27/11/06, Daniel Zeman <<a href="mailto:zeman@ufal.mff.cuni.cz">zeman@ufal.mff.cuni.cz
</a>> wrote:<br>>> If you have Perl on your machine (default on Linux), the attached Perl<br>>> script could help you.<br>><br>><br><br><br>--<br>Martin Wynne<br>Head of the Oxford Text Archive and<br>
AHDS Literature, Languages and Linguistics<br><br>Oxford University Computing Services<br>13 Banbury Road<br>Oxford<br>UK - OX2 6NN<br>Tel: +44 1865 283299<br>Fax: +44 1865 273275<br><a href="mailto:martin.wynne@oucs.ox.ac.uk">
martin.wynne@oucs.ox.ac.uk</a><br><br><br></blockquote></div><br><br clear="all"><br>-- <br><a href="http://www.early-modern-greek.org">http://www.early-modern-greek.org</a><br><a href="http://www.mml.cam.ac.uk/greek/grammarofmedievalgreek/">
http://www.mml.cam.ac.uk/greek/grammarofmedievalgreek/</a>