<div dir="ltr">Hi folks,<div><br></div><div>A bit struggling of calculating the statistical significant between the output of two systems. Suppose Ive got the following two results from two independent systems (performing sequence labelling task):</div><div><br></div><div>System 01: </div><div>precision:  81.57%; recall:  57.12%; FB1:  67.19%<br></div><div><br></div><div><div>System 02: </div><div>precision:  84.07%; recall:  62.47%; FB1:  71.68%</div></div><div><br></div><div><br></div><div>Could someone pinpoint me to the way of calculating the statistical significant between them?</div><div><br></div><div>p.s. I've no folds applied (just one go "training and test")</div><div><br></div><div>J.</div></div>