NLPIR4DL: Workshop on text and citation analysis for scholarly digital libraries <br>Call for Papers <br><br><a href="http://wing.comp.nus.edu.sg/nlpir4dl/" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://wing.comp.nus.edu.sg/nlpir4dl/</a><br>
<br>In recent years, interest in scholarly publications in electronic forms has boomed, <br> and several large-scale electronic digital libraries and citation indices are now used <br>everyday by researchers. Current digital libraries collect and allow access to digital<br>
papers and their metadata (including citations), but largely do not attempt to analyze<br> the items they collect. <br><br>The goal of this workshop is to investigate how developments in natural language <br>processing and information retrieval techniques can advance the state-of-the-art <br>
in scholarly document understanding, analysis and retrival. Full document text analysis <br> can help design automatic summarization and sentiment detection methods, automated <br>recommendation and reviewing systems, and may provide data for visualizing scientific<br>
trends and bibliometrics. Citation analysis takes this a step further, adding scientific <br> social network analysis as another strand of evidence to enhance solutions to the above <br>challenges. Web based digital libraries add download counts and Web 2.0 information<br>
such as tagging. <br><br>Aside from researchers, this workshop hopes to interest other stakeholders, namely<br> implementers, publishers and policymakers. Even within computer science, many<br>different scholarly sites exist -- ACM Portal, IEEE Xplore, Google Scholar, PSU's <br>
CiteSeerX, MSRA's Libra, Tsinghua's ArnetMiner, Trier's DBLP, UMass' Rexa, <br> Hiroshima's PRESRI -- and with this workshop we hope to bring a number of these <br>contributers together. Today's publishers continue to seek new ways to be relevant to their<br>
consumers, in disseminating the right published works to their audience. <br> The fact that formal citation metrics have become an increasingly large factor in <br>decision-making by universities and funding bodies worldwide makes the need for research <br>
in such topics and for better methods for measuring the impact of work more pressing. <br><br>We invite stimulating and unpublished submissions on topics including (but not limited to) <br>full-text analysis, multimedia and multilingual analysis and alignment as well as citation-based <br>
NLP or IR. Specific examples of fields of interests include: <br><br>* new information access methods for scientific papers <br>* automatic creation of reviews <br>* automatic qualitative assessment of submissions <br>* summarisation of scientific articles <br>
* navigation, searching and browsing in scholarly DLs <br> * techniques for suggesting and recommending scholarly papers, reviewers, citations<br>   and publication venues <br>* information retrieval for scholarly text, e.g. citation-based IR <br>
* topical modeling analysis <br>* network analysis and citation analysis in scholarly DLs <br> * citation function/motivation analysis <br>* novel bibliographic metrics <br>* niche search in scholarly DLs, e.g., survey paper finding and provenance tracing of <br>
  algorithms) <br>* knowledge discovery and analysis of the ancestry of ideas <br> * analyses of writing style in scholarly publications <br>* multilingual and multimedia analysis and alignment of scholarly works <br>* managing digital archives of linguistic corpora; federated access <br>
* metadata and controlled vocabularies for resource description and discovery <br> * automatic metadata discovery, e.g., language identification <br>* data cleaning and data quality <br>* disambiguation issues in scholarly DLs using NLP or IR techniques. <br>
<br>Submission details: <br><br>Style files for submissions should following standard ACL-IJCNLP paper submission <br> style: <a href="http://www.acl-ijcnlp-2009.org/main/authors/stylefiles/" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.acl-ijcnlp-2009.org/main/authors/stylefiles/</a> <br>
<br>Important Dates: <br><br>May 1, 2009 Deadline for paper submissions <br>Jun 1, 2009 Notification of acceptances <br> Jun 7, 2009 Camera-ready copies due <br>Aug 7, 2009 ACL-IJCNLP 2009 Workshop <br><br>Program Committee: <br>
<br>* Colin Batchelor (Royal Society of Chemistry) <br>* Steven Bird (Univ. of Melbourne & Linguistic Data Consortium) <br> * Shannon Bradshaw (Drew University) <br>* Jason S Chang (National Tsing-hua Univ.) <br>* Robert Dale (Macquarie Univ.) <br>
* Bonnie Dorr (Univ. of Maryland) <br>* Curtis Dyreson (Utah State Univ.) <br>* C Lee Giles (Pennsylvania State Univ.) <br> * Dan Jurafsky (Stanford Univ.) <br>* Noriko Kando (National Institute of Informatics, Japan) <br>
* Dongwon Lee (Pennsylvania State Univ.) <br>* Elizabeth Liddy (Syracuse Univ.) <br>* Andrew McCallum (Univ. of Massachusetts) <br> * Qiaozhu Mei (UIUC) <br>* Hidetsugu Nanba (Hiroshima Univ.) <br>* Manabu Okumura (Tokyo Institute of Technology) <br>
* Dragomir Radev (Univ. of Michigan) <br>* Anna Ritchie (Cambridge University) <br>* Mark Sanderson (Sheffield Univ.) <br> * John Swales (Univ. of Michigan) <br>* Jie Tang (Tsinghua Univ.) <br>* Michael Thelwall (Univ. of Wolverhampton) <br>
* Howard White (Drexel Univ.) <br>* Bonnie Webber (Edinburgh Univ.) <br><br>Organizers: <br><br>Simone Teufel <br> University of Cambridge Computer Laboratory <br>William Gates Building, JJ Thompson Ave, <br>Cambridge CB3 0FD, United Kingdom. <br>
<br>Simone Teufel is a senior lecturer in the Computer Laboratory at Cambridge University,<br> where she has worked since 2001. Her main research interests are in corpus-linguistic <br>approaches to discourse theory, and in the application of such information to <br>
summarisation, information retrieval and citation analysis. She has a background in <br> computer science (1994 Diploma from University of Stuttgart) and in cognitive science <br>(2000 PhD from Edinburgh University), and has also experience in medical information<br>
processing and search, from a postdoctoral stay at Columbia University, and in <br> collocation extraction, from a research post at Xerox Europe. Her latest research interests<br>include lexical acquisition, and the visualisation and language generation of the analysis<br>
results of scientific articles. <br><br>Min-Yen Kan <br>AS6 05-12 Computing 1, Law Link <br>National University of Singapore <br><br>Min-Yen Kan is an assistant professor at the National University of Singapore. His research<br>
interests include digital libraries and applied natural language processing. Specific projects <br> include work in the areas of citation analysis, document structure acquisition, verb analysis,<br>and applied text summarization. Prior to joining NUS, he was a graduate research assistant<br>
at Columbia University, and has interned at various industry laboratories, including AT&T,<br> IBM and Eurospider Technologies in Switzerland.<br><br>