Blog

Formats de fichiers traduction

15 Fév 2018 | Nos services

Si j’ai choisi de faire un article sur les formats de fichiers que nous pouvons traiter grâce à notre outil memoQ, c’est parce que de nombreux clients nous posent la question.

En résumé, on pourrait d’ailleurs dire que memoQ sait tout traiter !

Voici donc une liste non exhaustive des formats de fichiers que vous pouvez nous envoyer (il en existe probablement d’autres, mais qui n’ont été répertoriés nulle part à ce jour) :

Fichiers pris en charge par memoQ

  • Traduction indesignAdobe Framemaker™ (.MIF),
  • Adobe PDF files (.PDF),
  • Adobe InCopy™,
  • Adobe InDesign™ Markup Language (.IDML),
  • Adobe InDesign™ (via un compte gratuit sur Language Terminal),
  • Adobe InDesign™ (.INX),
  • Adobe PhotoShop™ (.PSD),
  • DITA (.DITA, .XML),
  • AuthorIT (.XML),
  • FreeMind mind maps (.MM),
  • HTML (.HTML, .HMT, .SHT), including HTML5,
  • Microsoft Word™ 2003 (.DOC, .RTF, .BAK, .DOT),
  • Microsoft Word™ 2007-2013 (.DOCX),
  • Microsoft Excel™ 2003 (.XLS, .XML, .XLT),
  • Microsoft Excel™ 2007-2013 (.XLSX, .XLSM),
  • Microsoft PowerPoint™ 2007-2013 (.PPTX, .PPSX, .POTX, .SLDX),
  • Microsoft PowerPoint™ 2003 (.PPT, .PPS, .POT),
  • Microsoft Visio™ (.VDX),
  • MS Help™ Workshop (.HHC, .HHK),
  • Des documents et textes travaillés sous OpenDocument (.ODT, .ODF),
  • Plain text (.TXT, .INF, .INI, .REG),
  • Rich Text Format™ (.RTF, two-column .RTF),
  • Scalable Vector Graphics (.SVG),
  • TMX filter,
  • XML (.XML) and SGML (.SGML) files,
  • Typo3 pages (.XML),
  • YAML (.YAML).

D’un point de vue technique, tout document texte peut être importé dans memoQ pour traduction, avec un filtre « regex text filter » plus ou moins complexe selon le cas de figure.

Si vous nous transmettez un document Excel contenant du texte au format HTML (avec balises), nous pourrons le traiter sur memoQ grâce au « cascading filter ».

Ceci permet à la fois de ne comptabiliser que le nombre de mots à traduire et d’exclure les balises de ce décompte. C’est grâce à ce filtre que nous pouvons réaliser des devis précis et que nos traducteurs ont l’assurance de ne traduire que ce qui le nécessite. Tous nos traducteurs ne sont en effet pas forcément des experts en HTML.

Logiciels que memoQ permet de localiser

memoQ permet également de localiser un grand nombre de logiciels à partir des formats de fichiers suivants :

  • .NET resource files (.RESX),
  • HTML (.HTML, .HMT, .SHT), dont HTML5,
  • Java properties,
  • JSON,
  • formats XML multilingues (via xPath),
  • fichiers texte PO (.PO),
  • XML,
  • YAML,
  • formats multilingues sur Excel/CSV (CSV, TSV, XLS, XLSX).

À noter : les fichiers Excel multilingues sont des documents où chaque langue apparaît dans une colonne différente. Il n’est pas rare que toutes les colonnes ne soient pas à traduire dans ce type de fichier car certaines d’entre elles servent uniquement de contexte au projet.

De la même façon, on peut utiliser les filtres « regex text filter » et « cascading filter » pour traiter du contenu HTML inclus dans un fichier TSV.

À noter : memoQ permet de traduire des images. Cela dit, memoQ ne fonctionne pas comme un OCR* (Optical Character Recognition) puisque c’est le traducteur lui-même qui doit lui indiquer quels sont les mots sources et cibles pour chaque image.

*Un OCR est un outil qui permet, notamment dans un document scanné, de détecter les mots qui composent ce document afin de créer un fichier texte éditable. Concrètement, un bon OCR permet de transformer un scan en un fichier Word parfaitement utilisable !

Par ailleurs memoQ permet d’importer un grand nombre de formats de documents bilingues.

Mais cette information concerne surtout les traducteurs et les chefs de projets puisqu’il arrive qu’ils aient besoin d’un format d’échange entre différents outils de TAO (traduction assistée par ordinateur) utilisés par les acteurs d’un même projet.

Source : https://www.memoq.com/en/languages-and-file-formats