<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=iso-8859-1">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoPlainText, li.MsoPlainText, div.MsoPlainText
        {mso-style-priority:99;
        mso-style-link:"Plain Text Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:10.5pt;
        font-family:Consolas;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
span.PlainTextChar
        {mso-style-name:"Plain Text Char";
        mso-style-priority:99;
        mso-style-link:"Plain Text";
        font-family:Consolas;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:72.0pt 90.0pt 72.0pt 90.0pt;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EL link=blue vlink=purple>

<div class=Section1>

<p class=MsoPlainText><span lang=EN-US>--------------------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>CFP PAN'09: 3rd Int. PAN Workshop - 1st
Competition on Plagiarism Detection<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>--------------------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>                 
Satellite workshop of 25th SEPLN Conference<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>                 
Donostia-San Sebastián, September 10<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>                    
</span><a href="http://www.webis.de/pan-09"><span lang=EN-US>http://www.webis.de/pan-09</span></a><span
lang=EN-US><o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>About the PAN Workshop:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>The workshop shall bring together
experts and researchers around the exciting and future-oriented topics of
plagiarism detection, authorship identification, and the detection of social
software misuse. The development of new solutions for these problems can
benefit from the combination of existing technologies, and in this sense the
workshop provides a platform that spans different views and approaches. The
following list gives examples from the outlined fields for which contributions
are welcome, but not restricted to:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Plagiarism detection:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * plagiarism detection in
general, in Web communities and social networks, and cross-language plagiarism<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * identifying near-duplicate and
versioned documents of all kinds:  <o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>text, software, image, music, video<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * technology for high-similarity
retrieval such as fingerprinting and similarity hashing<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Authorship identification:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * models for authorship
identification, authorship attribution, and writing style<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * NLP- and knowledge-based
retrieval models to capture personal traits and sentiment<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * Web forensics, community fraud,
and new Web infringements<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Social Software Misuse Detection:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * uncovering serial sharing and
lobbying<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * monitoring vandalism, trolling,
or stalking<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * trust, psychological and
personality-based user studies, social aspects of Web misuse<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Background:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Plagiarism analysis is a collective term
for computer-based methods to identify a plagiarism offense. In connection with
text documents we distinguish between corpus-based and intrinsic analysis: the
former compares suspicious documents against a set of potential original
documents, the latter identifies potentially plagiarized passages by analyzing
the suspicious document with respect to changes in writing style.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Authorship identification divides into
so-called attribution and verification problems. In the authorship attribution
problem, one is given examples of the writing of a number of authors and is
asked to determine which of them authored given anonymous texts. In the
authorship verification problem, one is given examples of the writing of a
single author and is asked to determine if given texts were or were not written
by this author. As a categorization problem, verification is significantly more
difficult than attribution. Authorship verification and intrinsic plagiarism
analysis represent two sides of the same coin.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>"Social Software Misuse" can
nowadays be noticed on many social software based platforms. These platforms
like Blogs, sharing sites for photos and videos, wikis and online forums are
contributing up to one third of new Web content.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>"Social Software Misuse" is a collective
term for anti-social behavior in online communities; an example is the
distribution of spam via the e-mail infrastructure. Interestingly, spam is one
of the few misuses for which detection technology is developed at all, though
various forms of misuse exist that threaten the different online
communities.  <o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Our workshop shall close this gap and
invites contributions concerned with all kinds of social software misuse.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>About the Competition on Plagiarism
Detection:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>The detection of plagiarism by hand is a
laborious retrieval task, a task which can be aided or automatized. The PAN
competition on plagiarism detection shall foster the development of new
solutions in this respect.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>The competition divides into two tracks:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * External Plagiarism Analysis.
Given a set of suspicious documents and a set of potential source documents the
task is to find all passages within the suspiscious documents which have been
plagairized from one or more of the source documents.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>  * Intrinsic Plagiarism Analysis.
Given a set of suspicious documents the task is to detect paragraphs in the
documents which have not been written by its main author. No source documents
are given in this task.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>A large corpus of artificial plagiarism
containing cases which have been obfuscated and/or translated will be released
for the competition.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>A development corpus, to be used in
developing a detection software, will be released two months before the
competition starts, a competition corpus will be used to evaluate and compare
detection softwares. The former will contain fully annotated plagiarism cases,
the latter will not.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>The succes of a plagiarism detection
software will be measured in terms of its precision, recall, and granularity.<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Important Dates:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>open 
     
        Notification of interest for
participation<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>21.03.2009
        Release of the development
corpus<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>21.05.2009
        Release of the competition
corpus<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>07.06.2009
        Submission deadline for the
competition<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>15.06.2009         Notification
of competition results<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>01.07.2009
        Submission deadline for the
papers<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>15.07.2009
        Notification of reviews<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>01.08.2009
        Submission deadline for final
version of the papers<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>10.09.2009 (afternoon)  PAN
Workshop<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Workshop Organization:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Benno Stein
            Bauhaus
University Weimar, Germany<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Paolo Rosso
            Universidad
Politécnica de Valencia, Spain<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Efstathios Stamatatos   University
of the Aegean, Greece<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Moshe Koppel
           Bar-Ilan
University, Israel<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Competition Organization:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Bauhaus University Weimar:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Benno Stein, Martin Potthast, and
Andreas Eiselt<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=ES>Universidad Politécnica de Valencia:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=ES>Paolo Rosso and Alberto Barrón Cedeño<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=ES><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=ES>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=ES>Contact:<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>---------------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><a href="mailto:pan09@webis.de"><span lang=EN-US>pan09@webis.de</span></a><span
lang=EN-US><o:p></o:p></span></p>

<p class=MsoPlainText><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoPlainText><span lang=EN-US>Information about workshop and
competition can be found at </span><a href="http://www.webis.de/pa"><span
lang=EN-US>http://www.webis.de/pa</span></a><span lang=EN-US><o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p> </o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p> </o:p></span></p>

</div>

</body>

</html>