<font face="verdana,sans-serif">boilerpipe [1] served my purposes temporarily. When I tried to do more serious stuff such as reading the news, it fails. For example, consider:<br> <a href="http://www.innovations-report.com/html/reports/studies/report-92130.html">http://www.innovations-report.com/html/reports/studies/report-92130.html</a><br>

it pulls only what is not relevant<br><br>or <a href="http://www.highbeam.com/doc/1P1-160189301.html">http://www.highbeam.com/doc/1P1-160189301.html</a><br>it pulls stuff from related articles, which I'm not interested in. <br>

<br></font>[1] Christian Kohlschütter, Peter Fankhauser and Wolfgang Nejdl,<br><a href="http://www.l3s.de/%7Ekohlschuetter/publications/wsdm187-kohlschuetter.pdf">Boilerplate
Detection using Shallow Text Features</a>,<br>
WSDM 2010 -- The Third ACM International Conference on Web Search and
Data Mining New York City, NY USA.
<br><font face="verdana,sans-serif"><br>Any suggestions on tools or addons?<br><br clear="all"></font><span style="font-family:verdana,sans-serif">Sincerely,</span><br style="font-family:verdana,sans-serif"><span style="font-family:verdana,sans-serif">Siddhartha Jonnalagadda, </span>Ph.D.<br style="font-family:verdana,sans-serif">

<span style="font-family:verdana,sans-serif"></span><span style="font-family:verdana,sans-serif"></span><a style="font-family:verdana,sans-serif" href="http://sjonnalagadda.wordpress.com" target="_blank">sjonnalagadda.wordpress.com</a><br style="font-family:verdana,sans-serif">

<br style="font-family:verdana,sans-serif"><br>