<div dir="ltr">Dear all,<div><br></div><div style>I'm trying to find the semantic differences between two synonymous, but syntactically different constructions. Among the things I've thought of doing is a latent semantic analysis comparing the sentences for construction A with the sentences for construction B. When I do it including all words, and get the angle of the two vectors, I arrive at a cos(x) = 0.95. If, however, I remove all words with counts higher than 100, I get something like 0.46. Now, the 0.95 value makes not much sense because there are no repeated sentences, but I'm not sure that I can just remove all words with more than 100 occurrences. Is this a valid procedure or should I take the 0.95 result?</div>
<div style><br></div><div style>The second question is more about lsa in itself. Since I only have two text, I'm omitting singular value decomposition, I'm not sure I can do this. If I actually carry out the SVD, I get a 2 by 2 matrix with columns perpendicular to each other. Should I take this result? It also makes no sense to me.</div>
<div style><br></div><div style>Thanks a lot,</div><div style><br></div><div style>Matías</div></div>