Bonjour à tous ,

Nous sommes régulièrement sollicités par nos clients pour de la traduction de fichiers PDF, c’est pourquoi je souhaite aujourd’hui faire un point sur ce format de fichiers.

Bien entendu, nous pouvons accepter ce format de fichiers, mais il y a tout de même quelques spécificités à connaitre.

Tout d’abord, qu’est-ce qu’un document PDF ? Ce sigle veut dire Portable Document Format, et il permet de garantir l’affiche à l’identique d’une présentation, quel que soit le programme utilisé pour ouvrir ce fichier. C’est un avantage indéniable pour l’auteur du document mais en revanche ce n’est pas pratique pour votre agence de traduction !

Il existe 2 grandes catégories de fichiers PDF : les fichiers PDF numérisés et les fichiers PDF modifiables. Les PDF issus d’un scan ne sont non éditables de prime abord.

  • Les PDF issus de scan nécessitent l’intervention d’un logiciel d’OCR pour pouvoir en extraire le contenu. Grâce à une reconnaissance optique de caractère, ce type de logiciel peut reconnaitre les mots d’un document scanné. Cette technologie ne permet pas de traiter toutes les langues de manière uniforme (elle fonctionne grâce à un dictionnaire), mais ce peut être une aide précieuse dans certains cas.

Les documents mal scannés, flous, tachés, écrits à la main, ne sont pas convertibles.

  • Les PDF modifiables eux, sont souvent des documents qui ont été créés sous un logiciel de la suite Office ou du pack Adobe. On reconnait les PDF modifiables assez facilement car il est facile de sélectionner le texte dans ce type de fichier.

En revanche, il est possible de trouver des images non éditables, y compris dans un PDF modifiable !

Je vous ai perdu là ?

Prenons un cas pratique : imaginez un document PPT que vous auriez convertis en PDF pour l’envoyer à votre client. Votre client souhaite le faire traduire car il maitrise mal le français (ce n’est pas sa langue maternelle). Il va donc envoyer ce PPT à TradOnline.

J’ouvre ce fichier PDF, je vois qu’il y a pas mal de tableaux et de photos, ce qui me met la puce à l’oreille. Après analyse approfondie, je vois que les tableaux proviennent de copier/coller depuis Excel et que les images correspondent à des impressions d’écran. Typiquement dans ce cas-là, s’il y a du texte dans ces images, je ne vais pas pouvoir l’extraire, et si mon client souhaite le faire traduire, ce sera sans remise en page.

Pour remettre en page à l’identique des tableaux ou photos, il est nécessaire que nous ayons en mains les fichiers sources originaux.

Dernière chose, pourquoi TradOnline me propose souvent un tarif de remise en page quand je fais traduire des fichiers PDF ? Nos logiciels d’aide à la traduction permettent de traiter ce type de formats, mais en revanche selon le taux de foisonnement d’une langue à l’autre, la mise en page en pourra en être affectée. A chaque nouveau projet nous faisons un test, et si le test n’est pas concluant, nous vous proposons un coût de remise en page à l’identique.

En résumé : OUI nous acceptons des fichiers PDF mais si vous avez en mains un autre format pour vos documents, pensez à bien nous le transmettre également !

J’espère que cette explication n’est pas trop confuse, si vous avez des questions, n’hésitez pas à revenir vers moi.

A bientôt pour une prochaine vidéo.