Type | Information |
---|---|
Titre du projet : | Post-édition de traductions automatiques en domaine de spécialité |
Chercheur titulaire responsable scientifique du projet : | François Yvon (francois.yvon[at]sorbonnne-universite.fr) |
Téléphone : | 33 (0)1 44 27 51 41 |
Fonction : | Direction de recherche |
Affiliation : | Direction de recherche Institut des systèmes Intelligents et de Robonique, UMR 7722 Sorbonne Université et CNRS |
Adresse postale : | Institut des Systèmes Intelligents et de Robotique, 5 place Jussieu 75005 Paris |
Collaborateurs chercheurs : | Rachel Bawden, chargée de recherches, Inria Paris Eric de la Clergerie, chargé de recherches, Inria Paris Laurent Romary, directeur de recherches, Inria Paris |
Lieu de recherche : | Questionnaire(s) en ligne |
Objectif du projet de recherche : | L’objectif de cette étude est d’évaluer l'acceptabilité par la communauté scientifique à réaliser des tâches de post-édition de traductions automatiques de résumés d'articles, dans un scénario où les personnes sollicitées pourront réviser des traductions de leurs propres résumés d'articles, et pourront retirer un bénéfice direct de leur post-édition. Un objectif second est de mesurer l'effort de post-édition nécessaire, en fonction de la qualité des systèmes de traductions automatiques et de collecter des données annotées. |
Ce que l’on attend de vous : | Si vous acceptez de participer à cette étude, vous serez conduit-e à réviser une traduction automatique d'un ou plusieurs articles dans le domaine du traitement automatique des langues (TAL). Vous aurez la possibilité de choisir en priorité des articles auxquels vous avez directement contribué. Vous pourrez réaliser cette étude à distance depuis un ordinateur connecté à Internet. L'expérience se déroulera sur une durée d'environ un mois. En début d’étude, vous devrez vous inscrire sur la plateforme expérimentale et compléter en ligne un questionnaire destiné à recueillir des informations concernant vos compétences linguistiques, votre expérience dans le domaine du TAL et votre familiarité avec les outils de traduction automatique. Une fois inscrit-e, vous aurez accès à une liste d'articles dans le domaine du traitement des langues pour lesquelles un résumé en anglais écrit par les auteurs a été extrait soit de la plateforme HAL (https://hal.science) soit d'une archive publique comme l'ACL anthology (https://anthology.acl.org). Vous pourrez sélectionner dans cette liste un résumé d'article dans la langue d'origine aligné avec sa traduction automatique et que vous aurez à post-éditer. Cette opération de post-édition pourra être répétée autant de fois que vous le souhaitez, et concerner vos propres résumés d'articles comme ceux rédigés par d'autres auteurs. \`A tout moment, vous pourrez télécharger les résumés traduits automatiquement et post-édités par vos soins. |
Vos droits de poser des questions à tout moment : | Vous pouvez poser des questions au sujet de la recherche en tout temps en communiquant avec le responsable scientifique du projet identifié au début de ce document. Par exemple, vous pourrez demander l’accès aux résultats globaux de cette étude. |
Vos droits de rétractation : | Vous pourrez à tout moment demander que les données que vous aurez produites dans le cadre de cette étude soient supprimées par simple demande par courrier électronique auprès du responsable scientifique du projet identifié au début de ce document. |
Bénéfices de l’étude : | Aucune indemnisation ne vous sera donnée pour votre participation à cette étude. Les avantages attendus de cette recherche seront d'aider au design d'une étude à plus grande échelle qui sera conduite à l'échelle de la plateforme HAL toute entière dans le déroulement ultérieur du projet MaTOS. Après chaque session de post-édition, vous pourrez demander à télécharger les textes que vous aurez produits et les utiliser pour votre propre compte, par exemple pour mettre à jour les méta-données associées à vos articles sur la plateforme HAL. |
Risques possibles de l’étude : | À notre connaissance, cette recherche n’implique aucun risque autre que ceux de la vie quotidienne. Chaque session de post-édition est indépendante des autres et vous pourrez faire autant de pauses que nécessaires pendant cette expérience. |
Diffusion des résultats : | Les résultats globaux concernant les mesures réalisés pendant cette étude (moyennés sur l’ensemble des participants) sont susceptibles d’être diffusés lors de colloques et d’être publiés dans des revues académiques. Les corpus de textes post-édités seront rassemblés et diffusés sous licence CC-BY-SA-4.0 pour servir à d'autres travaux dans le domaine du traitement automatique des langues. |
Ce protocole a reçu un avis Favorable du Comité d'Ethique de la Recherche de Sorbonne Université |