I didn't invent this world. I only observe it. The system to sentiment analysis mustn't be perfect but comprehensible. The main idea of my contribution was an announcement of a real-life system to sentiment analysis that can be applied to real scenarios. The system relies on scientific findings in my phd thesis; it works and the results are not that bad. They could be better and I also describe in the thesis how they can be improved. It's up to you, you can ignore them and loose time.<div>




<br></div><div>To my knowledge, the statistical engine summarizes many findings of statistical processing that I read about during preparation of my thesis and adds much more. The same applies to semantic engine. With some imagination the issues of vague interpretation can be explained or neglected. I also described a hybrid approach and a fusion approach that combine both engines and can be considered in future. AO<br>




<br><div class="gmail_quote">2011/12/17 Jordi Carrera Ventura <span dir="ltr"><<a href="mailto:excellens@gmail.com" target="_blank">excellens@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">




<div style="word-wrap:break-word"><div>I share most commenters' observations, although not necessarily some of the criticism. Even if the demo does not live up to its own marketing claims, I wouldn't take that to be a reason to further bash it but rather a reason not to take it too seriously in the first place. In my opinion, no user who tries the system (which is right there for anybody to judge for themselves), should be misled by any amount of marketing.</div>




<div><br></div><div>I agree with Justin and Amanda's linguistic analysis, but I'd contend what Amanda gives as an example of realistic data. Probably for clarity, she seems to have translated into a linguistically correct pair of juxtaposed sentences an original tweet which, as such, must have looked like</div>




<div><br></div><div>"sh*t!!!!! i left my iphone on t bus - im f***** wihtout iiiiiit!!!!! :("</div><div><br></div><div>(I am hypothesizing so I may have got the transliterations wrong).</div><div><br></div><div>




Of course, good luck building anything resembling a syntactic tree from what could only be called a string of characters.</div><div><br></div><div>The more general point behind my joke is that rarely does commercial sentiment analysis concern itself with achieving full, deep semantic understanding (fascinating as this may be from a theoretical standpoint). In many situations, reasonable business cases can be built on the basis of detecting *potentially* negative utterances, which is a far less daunting challenge and an application for which there seems to be a market. Many corporations find it satisfactory to spot crises before they happen rather than being told a posteriori with utmost confidence and detail what particular level of hatred they have inspired on their customers. Even if that implies some number of false positives, PR staff are mainly concerned with true positives, which they'll get by maximizing recall. In principle, precision only has to be high enough to filter clearly irrelevant expressions (normally the majority), which is generally true assuming lexical resources have been built in a balanced, domain-aware way.</div>




<div><br></div><div>On the other hand, systems able to correctly deal with Amanda's tweet are becoming increasingly common, at least based on anecdotal evidence and my own personal experience (I could be wrong, of course). So, in her example, if monitoring e.g. "iphone", that noun does not seem an argument of any head (or a head of any modifier) likely to have been assigned a particular sentiment value, which should rule it out as an instance of sentiment regarding the iPhone.</div>




<div><br></div><div>Overall, however, I completely agree it's an open area of research with great challenges.</div><span><font color="#888888"><div><br></div><div><br></div><div>Jordi</div></font></span><div>
<div><div><br></div><div><div>On Dec 16, 2011, at 9:21 PM, Amanda Schiffrin wrote:</div><br><blockquote type="cite">I think Justin has hit the nail on the head here.  I worked on an attempt to develop a sentiment detection module for a text analytics software system in my previous job, and I soon realised that once you start working with real data, both statistical and grammatical ('semantic') approaches will fail.  You need a more complex model of information in order to be able to understand that a tweet such as "Bummer, I left my iPhone on the bus - I'm lost without it :-(", despite containing only indicators of negative sentiment at the lexical level, still expresses high positive sentiment toward the *product*.  Being able to distinguish this kind of sentiment is one of the main drivers of commercial sentiment detection, and I'd say we're still a very long way away from anything like that level of sophistication.<div>





<br></div><div>Mandy Schiffrin</div><div><div><br><br><div class="gmail_quote">On 16 December 2011 20:24, Justin Washtell <span dir="ltr"><<a href="mailto:lec3jrw@leeds.ac.uk" target="_blank">lec3jrw@leeds.ac.uk</a>></span> wrote:<br>





<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">"I would be very sad if this movie did not win a prize."                                        high_neg<br>





"I'm very happy that the other reviewers have seen this movie for what it is: rubbish."         high_pos<br>
<br>
Rather than (unfairly) singling out this system, I think these examples serve to highlight that this is a very difficult (if not impossibly ill-defined) problem. One cannot just assess the polarity of a statement - one needs to know something about what the object of interest is. In the above cases we are probably interested in [the writer's opinion of] the movie... but that fact is of course *pragmatic* information.<br>






<br>
I'm out of my depth now, so I'll say no more :-) No doubt much has been written on these issues.<br>
<div><br>
Justin Washtell<br>
University of Leeds<br>
<br>
________________________________________<br>
</div>From: <a href="mailto:corpora-bounces@uib.no" target="_blank">corpora-bounces@uib.no</a> [<a href="mailto:corpora-bounces@uib.no" target="_blank">corpora-bounces@uib.no</a>] On Behalf Of Angus Grieve-Smith [<a href="mailto:grvsmth@panix.com" target="_blank">grvsmth@panix.com</a>]<br>






Sent: 16 December 2011 17:25<br>
To: <a href="mailto:corpora@uib.no" target="_blank">corpora@uib.no</a><br>
Subject: Re: [Corpora-List] EmoText - Software for opinion mining and lexical affect sensing<br>
<div><div><br>
On 12/16/2011 9:01 AM, Alexander Osherenko wrote:<br>
> You didn't test the approach for complex sentences. I always used the<br>
> example "I am very sad if ..."<br>
<br>
     I don't want to nitpick, but that's not a very nativelike example<br>
for a test sentence.  I've only heard English speakers use "I am very<br>
sad if ..." in habitual or generic contexts, and even then "I get very<br>
sad when ..." is much more common.  "I would be very sad if ..." is also<br>
used.  Maybe check your test sentences against the CoCA or something?<br>
<br>
--<br>
                                -Angus B. Grieve-Smith<br>
                                <a href="mailto:grvsmth@panix.com" target="_blank">grvsmth@panix.com</a><br>
<br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</div></div></blockquote></div><br></div></div>
_______________________________________________<br>UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>Corpora mailing list<br><a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>




<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br></blockquote></div><br></div></div></div><br>_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br></div>