[parislinguists] Conf =?ISO-8859-1?B?6XJlbmNlIHN1ciBsZSBzeXTobWUgVFJBRkwgZGUgbek=?=moire de traduction par Roussi NIKOLOV
Jean-Yves Dommergues
jean-yves.dommergues at WANADOO.FR
Sun Apr 10 15:37:30 UTC 2005
L'équipe LAPS
(Linguistique Anglaise Psycholinguistique)
du Département d'Etudes des Pays Anglophones
de l'Université Paris 8 à Saint-Denis
a le plaisir d'annoncer la conférence que donnera
Roussi NIKOLOV de l'Université de Plovdiv (Bulgarie) sur le thème suivant:
"PRÉSENTATION DU SYSTÈME TRAFL DE MÉMOIRE DE TRADUCTION :
AVANTAGES ET RESTRICTIONS PAR RAPPORT À UN SYSTÈME
DE TRADUCTION AUTOMATIQUE"
le vendredi 22 avril 2005 de 14h à 16h
à l'Université Paris 8,
bâtiment B, salle B313.
Roussi NIKOLOV, HDR, est Directeur du Département de Français de
l'Université Païssii Hilendarski de Plovdiv. Il est spécialiste de
phonétique du français (liaison, syllabation) et concepteur de deux
logiciels de traduction français-anglais: BiTrad (mémoire de traduction avec
règles de syntaxe) et TRAFL (mémoire de traduction sans règles de syntaxe).
C'est ce second type de logiciel qu'il présentera. Un résumé de sa
présentation est donné ci-dessous.
Jean-Yves Dommergues, Université Paris 8, DEPA, LAPS.
=====================================================
PRÉSENTATION DU SYSTÈME TRAFL
DE MÉMOIRE DE TRADUCTION : AVANTAGES ET RESTRICTIONS PAR RAPPORT À UN
SYSTÈME DE TRADUCTION AUTOMATIQUE
Roussi NIKOLOV, Université de Plovdiv « Païssii Hilendarski »
24, rue Tsar Assen, Plovdiv 4000, Bulgarie. rousni at pu.acad.bg
La traduction pratiquée à l¹université est une activité de base non
seulement dans la formation de traducteurs, mais aussi dans l¹enseignement
des langues étrangères en général. Mais cette activité n¹a en général qu¹une
raison d¹être pédagogique ou didactique ; on pourrait aisément concevoir de
valoriser en les utilisant les travaux de traduction des apprenants pour
nourrir des systèmes de mémoire de traduction ou d¹autres outils d¹aide à la
traduction. Un système comme TRAFL pourrait servir ce but dans la mesure où
il présente quelques caractéristiques intéressantes concernant la
productivité, la robustesse, l¹ergonomie et l¹esthétique.
1. Le système TraFl de gestion de bases de données textuelles est
indépendant des paramètres régionaux du système d¹exploitation Windows,
grâce au recours à l¹encodage Unicode, ce qui est important pour un système
multilingue.
2. Le processus de traduction est organisé en deux boucles emboîtées l¹une
dans l¹autre : une boucle principale de déplacement « de gauche à droite »,
par rapport au texte d¹entrée, et une boucle secondaire de retour, qu¹on
peut appeler aussi « descendante », par rapport à la longueur des unités de
traduction (réelles ou potentielles). Le mouvement général « de gauche à
droite » permet à l¹utilisateur de « consommer » immédiatement le texte
traduit, celui-ci s¹affichant en temps réel, c¹est-à-dire au fur et à mesure
de la progression du processus de traduction. Le mouvement secondaire «
descendant » permet, lui, d¹établir une hiérarchie naturelle (elle l¹est
aussi du point de vue psycholinguistique) entre les unités de traduction
(respectivement de perception et/ou de compréhension) en fonction de leur
étendue. Ainsi, grâce à cette hiérarchie, la suite de mots pomme de terre
sera traduite correctement, suivant la définition de traduction pomme de
terre=x, puisque la définition de traduction pomme=y de niveau inférieur ne
sera en l¹occurrence pas activée.
3. Dans ce système de mémoire de traduction, l¹unité minimale est le mot, et
la traduction progresse par mots ou suites de mots de taille variable, les
unites plus longues ayant priorite sur les breves. Le choix judicieux de
l¹étendue des unités de traduction et de leurs équivalents est essentiel
pour l¹optimisation de la base de données. L¹établissement d¹un système
rigoureux de règles en la matière pour un couple de langues données
constitue donc non seulement une sorte de défi linguistique dans une
perspective comparativiste, mais aussi une nécessité pratique en vue de
l¹utilité de recettes empiriques lorsqu¹il s¹agit de segmenter une phrase en
unités de traduction.
4. La performance du moteur de traduction (exprimée en nombre d¹unités de
traduction traitées par unité de temps) est comparable à celle des moteurs
de recherche sur Internet, et est presque indépendante de la taille de la
base de données. Celle-ci peut contenir des dizaines de milliards de
définitions de traduction, et sa taille n¹est limitée que par la capacité du
disque dur. On peut se faire une idée précise du temps nécessaire à la
récupération d¹un équivalent de traduction en pensant, par exemple, à la
vitesse d¹exécution de Google. L¹originalité du système TraFl réside dans
l¹algorithme d¹analyse du texte d¹entrée et d¹activation séquentielle
sélective d¹une part infime de la base de données, celle-ci étant très
fortement parcellisée. En outre, les définitions de traduction se
distribuent d¹une manière parfaitement uniforme entre les sections de la
base de données, grâce à l¹utilisation de l¹algorithme de Fletcher auquel
ce système doit son nom.
Ces caractéristiques du système TraFl assurent la viabilité durable de tout
projet de constitution de sa base de données, c¹est-à-dire d¹une mémoire de
traduction considérable et par sa taille et par sa qualité. Qui plus est,
cette viabilité n¹est pas tributaire du développement rapide des nouvelles
technologies. En effet, s¹agissant d¹une base de données textuelles, il est
facile de convertir au besoin son format, et c¹est là l¹un des avantages des
mémoires de traduction par rapport aux bases de données linguistiques (avec
règles morphosyntaxiques par exemple) pour la traduction automatique. On
examinera aussi quelques restrictions fondamentales de ce genre de système
de traduction.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20050410/96ef298d/attachment.htm>
More information about the Parislinguists
mailing list