[Corpora-List] internship offers in (computational) linguistics and/or computer science -- EURAC Bolzano
Institute for Specialised Communication and Multilingualism
communication.multilingualism at eurac.edu
Thu Nov 23 09:00:11 UTC 2006
[apologies for cross posting]
Dear list members,
we would like to draw your attention to the following internship offers, which we kindly ask you to forward to interested students of (computational) linguistics and/or computer science.
Thank you,
the team of the
Institute for Specialised Communication and Multilingalism / European Academy Bolzano
Internship in the area of Computational Linguistics / Computer Science
At the Institute for Specialised Communication and Multilingualism of the European Academy Bolzano, a payed internship in the areas of computational linguistics and computer science is offered. The internship involves preparing text corpora in multiple languages for the projects "Lexalp" and "Korpus Südtirol" (Interreg-III-A: Free University of Bolzano (coordinator), EURAC, University of Innsbruck). It will also involve text annotation such as part-of-speech tagging and lemmatisation. The position may also involve creating scripts to process and display data retrieved from queries over bibliographic databases. We are also involved in recovering data from old magnetic media formats; an intern with any experience in this area would be very welcome to participate in this area of work.
- strong familiarity with XML/HTML
- any major scripting language
- Linux/Unix
- some practical knowledge of databases and SQL
Additional desired skills:
- knowledge of computational linguistics
- familiarity with recovery of data from archaic electronic media
Starting date: end of November 2006
Duration: 6 months
For further questions please refer to vlyding at eurac.edu.
Please send your application (including a letter of motivation and your CV) to the following address:
European Academy Bolzano
Institute for Specialised Communication and Multilingualism
Viale Druso 1, I - 39100 Bolzano
Tel. 0471 055100 (8:30-12:30) -- Fax 0471 055199
e-mail: communication.multilingualism at eurac.edu
Please add the following phrase to you CV otherwise your application can not be considered: 'I consent to the use of my personal data in accordance with the provisions of decree 196/2003.'
Am Institut für Fachkommunikation und Mehrsprachigkeit der Europäischen Akademie Bozen wird ein bezahltes
Praktikum im Bereich der (Computer-)Linguistik
angeboten, in dem es sich hauptsächlich um die Unterstützung des Projektteams bei der Metadatenerhebung für das Projekt "Korpus Südtirol" (Interreg-III-A: Freie Universität Bozen (Projektleitung), EURAC, Universität Innsbruck) handelt. Dabei wird die Aufgabe darin bestehen, relevante Metadaten zu ausgesuchten Südtiroler Texten zu ermitteln (in Verlagsarchiven, in Bibliotheken, im Internet etc.) und diese mit einem Editor in ein für die computerlinguistische Weiterverarbeitung geeignetes Format zu überführen.
Das Praktikum vermittelt:
- Einblick in das Verlags- und Bibliothekswesen
- Einblick in die Publikationssituation in einem mehrsprachigen Gebiet
- Erfahrung im Erstellen eines Textkorpus
Ziele und Aufgaben:
- Ermitteln bzw. Vervollständigen von Metadaten per Recherche in Verlagsarchiven, Bibliotheken etc.
- Überführen der Daten in ein geeignetes Format
- sehr gute Deutschkenntnisse
- Studium der Linguistik / Literaturwissenschaften
- eigenverantwortliches Arbeiten
Zusätzliche wünschenswerte Fähigkeiten:
- systematische Arbeitsweise
- Erfahrung mit Bibliothekssystemen
Beginn: Dezember 2006 /Januar 2007
Dauer: 3-6 Monate
Für weitere Informationen wenden Sie sich gerne an stefanie.anstein at eurac.edu.
Ihre Bewerbung (Lebenslauf und Begleitschreiben) schicken Sie bitte an die folgende Adresse: Europäische Akademie Bozen
Institut für Fachkommunikation und Mehrsprachigkeit
Drususallee, 1 -- I-39100 Bozen
Tel. 0471 055100 (8:30-12:30) -- Fax 0471 055199
e-mail: communication.multilingualism at eurac.edu
Bitte fügen Sie ihrem Lebenslauf folgende Einwilligung zur Verwendung Ihrer persönlichen Daten im Sinne des Datenschutzdekrets 196/2003 bei: "Ich ermächtige die EURAC zur Verwendung meiner persönlichen Daten im Sinne des Dekrets 196/2003."
Ohne diesen Zusatz dürfen wir Ihre Unterlagen nicht berücksichtigen.
More information about the Corpora
mailing list