翻訳で取りあつかう様々なファイル形式

このリストは2001年以降にアテナオが翻訳したファイル形式一覧です対応の頻度は、1度のみ対応したもの、連日のように対応していたもの等、種類によって様々です。

本日は、私たちが今までに翻訳を手がけたフォーマットの数々と、翻訳作業にあたり必要となる対応方法をご紹介します。例えばXLSX、DOCX、またはPPTXなどは、簡単に翻訳作業を行える形式ですが、特殊な形式の場合は、対応の難易度も高くなり、さまざまな専門知識が必要になります。

いくつかのファイル形式は、コンピュータ支援翻訳支援ツール(CATツール)を使用して翻訳することができます。該当する場合は、説明の中でその旨を明記しています。ファイル形式が特定の翻訳支援ツールにしか対応していない場合は、その旨も記載しています。

なお、人工知能(AI)ツールやニューラル機械翻訳エンジンは、現時点ではプロフェッショナル翻訳のプロセス管理をする機能はないため、このリストにはあえて含めていません。例えばGoogle翻訳は、一般的なファイル形式や静止画像も翻訳することができますが、その結果は、プロフェッショナルユーズとして使えるレベルとは言えません。

このリストは、以下のファイル形式の翻訳が必要な場合に、お役立てください。翻訳のお見積もりをご希望の場合は、可能な限り、元の形式のファイルをご提供ください。


画像

BMP, JPEG ou JPG, PNG, RAW, CRW, GIF, TIFF ou TIF, EPS :

これらの画像フォーマットは固定されており、編集を加えることはできません。画像内のテキストも、編集はできません。このタイプのファイルを翻訳した上で再度利用するには、次のステップが必要になります:

  • 画像内のテキストを、テキストファイル (DOCX、ODT、または同等のもの) に再入力するか、文字認識ツール(CATツールまたはReadirisタイプのアプリケーションを使用)を使う。
  • 再入力あるいは文字認識ツールで認識したテキストを翻訳する (CATツールの使用、不使用を問わない)。
  • Adobe Photoshopまたは写真編集ソフトウェアを使用して、翻訳したテキストを画像に再統合する。

Adobe Photoshop PSD, PDD, PSDT :

最も有能なCATツールは、Adobe PhotoshopのPSD、PDT、PSDTフォーマットをサポートしています。翻訳会社としては、Photoshop画像を翻訳するのに最適なツールはPhotoshopそのものですが、これには多少の知識が必要です。というのも、固定された画像を処理する方法(テキストの再入力、翻訳、再統合)が、Photoshopファイルでも必要となるためです。

基本的には、Photoshopの画像に文字が多く含まれているケースは少ないため、翻訳にCATツールを使用することはありません。むしろ、CATツールを使うとエラーが発生する可能性があるため、手入力で、テキストを翻訳できる状態にします。

この種の画像にはテキストがあまり含まれておらず、ネイティブ形式で保存する必要があるためです。CATツールは問題を引き起こす可能性があるため、翻訳されたテキストは手作業で統合することをお勧めします。

Adobe PDF :

PDFファイルは、編集可能です。PDFファイルを翻訳するには、いくつかの方法があります:

  • 「テキスト編集」機能をを使ってPDFファイル上で直接翻訳する方法。このテクニックは時間がかかり、不快な上に、エラーも発生しやすく、元のPDFで使用されているフォントを使えることが前提です。この方法は、翻訳するテキストの量が非常に少ない場合にのみ使用します。
  • OCR(文字認識)を使用する。OCRを使ってPDFをテキストファイルに変換する方法ですが、元のレイアウトを崩すリスクがあります。Tradosのような一部のCATツールでは、搭載されているOCRの使用後に、PDFファイルを翻訳することができます。
  • Adobe Indesignまたは同等のツールを使用して、テキストを再入力し、翻訳し、ファイルのレイアウトを変更する方法。

原則として、PDFファイルからの翻訳は、PDFの元のファイル(DOCXなど)が入手できない場合にのみ行います。

Adobe Illustrator AI :

IllustratorファイルをIllustratorファイルの翻訳を行うには、Illustratorソフトウェアが必要です。方法としては、編集ファイルに直接翻訳を組み込みます
IllustratorでPDFを作成した場合、テキストは通常ベクトル化されます。テキストを修正することはできず、テキストは固定された画像として扱わなければなりません。

SVG :

SVG(Scalable Vector Graphics)ファイル形式は、ウェブに最適化された図面を作成するために設計されています。SVGファイルを翻訳するには、memoQのようなCATソフトウェアを使用するか、SVGをIllustratorファイルとして扱う必要があります。SVGは、InkscapeOpenOfficeLibreOffice Draw(無料)、またはIllustratorで編集および修正できます。

テキスト

RTF, TXT, ODT, DOC, DOCX, ODT, OTT, ODM, ODP, OTP, WPS, DOTX, DOCM, DOTM, WP :

テキストファイルは最も加工しやすい形式です。ほとんどのワープロソフトと互換性があるため、レイアウトは一般的に非常にシンプルで、テキストをネイティブファイルに直接翻訳するだけで済みます。さらに、ほとんどの場合、翻訳会社で最も一般的に使用されているCATツールとの互換性もあります。

DTP&グラフィック処理

INDD, IDML, INX :

InDesignは現在、多言語デスクトップパブリッシングのために最も広く使用されているプロフェッショナルフォーマットです。

このソフトウェアを使用することにより、テキストを直接翻訳できるようになります。翻訳者は各テキストブロックを選択し、原文を翻訳文に置き換えます。この方法は時間がかかりますが、文脈を明確に把握できるため、何が翻訳され、何が翻訳されていないかを簡単に確認できます。主な欠点:ネイティブファイルに手作業で編集を加えることに関連するエラー。つまり、レイアウトの完全性が保証されないこと。

InDesignファイルは、ほとんどのCATツールと完全な互換性があります。CATツールは完全なページレイアウト形式(INDD)をサポートしていませんが、InDesignの異なるエディション間で互換性のあるファイルのタイプを指定するIDML形式で動作します。このファイルはXML構造に基づいているため、CATツールではそのように見なされます。CATツールを使用してInDesignファイルを翻訳する場合、翻訳者がソースコードを変更できないため、レイアウトとスタイルシートの整合性が尊重されることにより、作業は高速になります。文脈の喪失を補うため、CATツールを使用してInDesignコンポジションを翻訳する場合は、PDFコンポジションを並行して参照することをお勧めします。

PPT, PPTX, POT, PPTX, PPSX, POTX, PPTM, POTM, PPSM :

Microsoft PowerPointは翻訳しやすいファイル形式です。PowerPointは、Microsoft Suitで広く使用されており、すべての言語サービスプロバイダーがこのソフトウェアを導入しています。PowerPointファイル内の翻訳も複雑ではありませんが、他のフォーマットと同様、CATを使用しないと、単語の反復を考慮することはできません。

PPTやPPTXファイルを翻訳する場合、他に2つの注意点があります:

  • コメント。開くと、見えなくなることが多いです。
  • 翻訳後のグラフィック。場合によっては、ある言語から別の言語への拡張率によって、テキストブロックのサイズが翻訳されたテキストに適さなくなることがあります。そのため、テキストブロックが翻訳されたバージョンに適合しているかどうかをチェックするためのパスが必要です。

KEY :

Keynoteは、翻訳作業が難しいアップルのプログラムのひとつです。NumbersやPagesのように、Keynote文書の翻訳をプロの翻訳者や言語サービス会社に任せたい場合、最も扱いが複雑なファイルと言えるでしょう。

KEYファイルはDTPツールと互換性がないため、ネイティブファイルに翻訳するか、テキストをまずエクスポートし(DOCXやPPTX形式など)、テキストを翻訳して再統合する必要があります。

KeynoteはPowerPointとしてエクスポートすることができますので、エクスポートしたファイルを他のPowerPointと同様に翻訳し、KEYとして保存することができますが、この手順は多くの場合エラーを生じさせるため、完全な修正が不可欠です。

PAGES :

我々の知る限り、2023現時点、アップル社のプログラムPAGESを開けるCATツールは存在しないようです。PAGESファイルを翻訳するには、PAGESのソフトウェアを使用するか、変換段階を経る必要があります。幸いなことに、PAGESファイルをDOCやDOCXのような翻訳可能なフォーマットに変換できるオンラインコンバータがありますが、変換過程でエラーが発生する可能性があり、ページレイアウトの原型がキープされる保証はありません。

どうしても翻訳されたPAGES文書を取り出したい場合は、翻訳ファイルからテキストを抽出し、PAGESで文書を再構成する必要があります。

PUB :

PUBファイルを直接翻訳できるのは、MS Publisherを持っている場合のみです。 このDTPフォーマットは、どのCATツールでも使用できルわけではありません。MS Publisherをお持ちでない場合は、PUBからPDFへの変換を行い、取得したファイルの翻訳を、PDFファイルと同じ様に行う必要があります。

MIF :

MIFファイルはAdobe FrameMakerから提供されており、地図作成と地理分析専用のソフトウェアアプリケーションであるMapInfoによって作成されています。MapInfo は、地図表示データの保存に MIF フォーマットを使用します。MIF ファイルを翻訳するには、次の操作を行います:

  • 画像、索引、目次、相互参照、見出し、脚注、小見出しを FrameMaker で直接翻訳する。ただしほとんどの場合、FrameMaker文書の翻訳を専門とする翻訳者だけがこのソフトウェアを保有し、使用方法を理解しています。
  • FrameMakerのレイアウトをRTFタイプのテキスト形式でエクスポートします。ただし、テキストエディタで翻訳すると、文書の構造が崩れるリスクがあります。したがって、この方法はお勧めしません。
  • ページレイアウト全体を保持する CAT ツールを使用する。

QXP :

QuarkXpressは、プロフェッショナルDTPのリーダー的な地位をInDesignに奪われたと言えるでしょう。現在でも使用されているものの、Adobeスイートと違って、このソフトウェアを所有する多言語サービス機関やプロの翻訳者はもはや、ほとんど存在しません。そのため、Xpressファイルの翻訳は、INDDファイルの翻訳よりも少し複雑です。

QXDまたはQXPファイルを翻訳するには、:

  • ソフトウェアを使用し、テキストブロック内で直接翻訳する。
    利点:翻訳者が文脈に沿ってテキストを翻訳するため、翻訳がより快適になります。
    デメリット:反復する単語が考慮されないため、予算が増える。
  • Xpressファイルを「インターチェンジ」形式(XTG、TAG、InDesignのIDMLに相当)でエクスポートしたのち、XTGおよびTAG形式をサポートする数少ないツールであるSDL TradosまたはSmartcatを使用し、CATツールで翻訳する。

CANVA :

CANVAファイルを人間が翻訳するには、該当ページをPDF形式でエクスポートし、従来のPDFファイルとして扱います。

 

ソースコード

HTM, HTML, XHTML, XML, YML, JSON, PLIST, YAML :

エンコードされたファイルが少なくて短い場合は、BBedit、Smultron、Sublime textなどのコードエディタで直接翻訳できますが、ソースコードの完全性を保証するには、CATツールを使って翻訳することを強くお勧めします。CATツールはコードタグをロックし、翻訳するテキストだけを「編集可能」にします。

翻訳するデータの量やタグの多様性によっては、CATツールが独自のタグを生成し、エラーを発生させることがあります。たとえば、CATツールは、POファイルの複数形を正しく処理できない傾向があります。JSONファイルでは、段落の区切りを抑制するツールもあります。したがって、ソース・コード・ファイルを翻訳する際には、翻訳後のソース・コードのチェックが不可欠です。

PO, POT :

GetText Portable Object (PO)ファイルは、多言語PHPウェブサイトに適しているため、業界でも広く使用されています。

翻訳のために、PHP コード解析ツールは、翻訳する原文のみで構成されるPOT ファイルを生成します。そして、このファイルが最初に翻訳されます。POTファイルの翻訳が完了すると、翻訳結果はPO(Portable Object)として保存されます。これは、原文と訳文を含むバイリンガルファイルです。このファイルは通常、定期更新等の管理のために使用されます。

MO(Machine Object):MOファイルの内容はPOファイルと同じですが、形式だけが異なります。MOファイルはサーバー専用です。

これらのファイルを翻訳するために、テキストエディタを使用することは理論的には可能ですが、この方法は正直、おすすめできません。最善の選択肢は、CATツールを使用することです。アテナオでは、Poeditを好んで使用しています。LocalizeもPO形式をスムーズに処理しますし、一般的なCATツールも同様です。

XLIFF, XLF :

XLIFFファイルを翻訳するには、CATを使わない方法と、CATを使って翻訳する方法があります。CATを使わずに翻訳するのは簡単ではありません。まず、コード・エディターを使ってXLIFFファイルを開き、ソース・テキストを選んで抽出し、テキストを翻訳してから、それぞれの翻訳を元のファイルに再インポートする必要があります。XLIFFファイルはバイリンガルなので、”target “という名前のテキストを翻訳することで、ファイル内で直接作業することも可能ですが、翻訳者がコード内で作業するため、コードが変更される危険性があり、非常にデリケートな方法です。

CATツール(互換性のあるものがほとんど)を使えば、翻訳対象のテキストだけが表示されるため、方法ははるかに簡単です。XLIFFファイルをCATツールにダウンロードするだけで、原文が「原文言語-訳文言語」の複式テーブルに表示され、翻訳者は「訳文」の列に訳文を入力するだけで良いのです。

LaTeX :

LaTeXは、科学コミュニティで広く使われているオープンソースのワードプロセッサです。LaTeXは、プログラミング言語とほぼ同じ方法で使用されています。テキストとLaTeXコマンドは、まずテキストファイルに書き込まれ、次にコンパイルされて表示されます。出来上がったファイルは翻訳できますが、この手順は若干複雑です。

コピー&ペーストで原文を抽出し、翻訳してネイティブ・ファイルに再統合することは可能ですが、LaTeXコマンドや数式を他のテキストから分離する必要があり、アクセント記号への対応も不可欠となります。DOCXに変換されたPDFエクスポートや、IllustratorでソースのPDFエクスポートから作業することも可能ですが、この場合、LaTeX形式のファイルは得られません。

翻訳会社としては、最善の選択肢は次のとおりです:

  • OverleafタイプのLaTeXエディターを使う。
  • TEXフォーマットをサポートするフリーソフトOmegaT CATツールを使う。
  • LaTeXパッケージをインストールし、ネイティブファイルで作業する。

表計算データベース

CSV, XLSX, XLS, XLT, XLSM, ODS, OTS :

これらのデータベース・フォーマットはすべて、そのままのフォーマットで翻訳することができます、データベースのサイズや単語の繰り返しの数によっては、CATツールで作業することが望ましいでしょう。

ODB :

ODB ファイル(Apache OpenOffice Base)は、Zip 形式で圧縮されたファイルとフォルダのコレクションを含むリレーショナルデータベースです。小規模な ODB データベースは OpenOffice に直接変換することができますが、大半のデータベースでは、ODB ファイルを CAT で読み取り可能な形式(XLS、XLSX、CSV、ODS など)に変換する必要があります。

NUMBERS :

NUMBERSはアップル社のプログラムで、CATツールでは開くことができません。NUMBERSファイルを翻訳するには、このソフトウェアを持っているか、変換ステップが必要になります。幸いなことに、NUMBERSファイルをXLSやXLSXのような翻訳可能な形式に変換できるオンライン・コンバータがあります。

翻訳されたNUMBERS文書をどうしても取り出さなければならない場合は、NUMBERSで文書を再構成する必要があります。

字幕(サブタイトル)

ASS, SBV, SCC, SUB, LRC :

な構造になっています。原則として、これらのファイルは、拡張子を変更したり、ほとんどのCATツールで使用できる形式(SRT形式)で保存し直すことができます。

字幕制作についてより詳しく知りたい方は、字幕制作ツールのリストをご覧ください。アテナオのこのページでは、40のソフトウェアパッケージがリストアップされています。

SRT :

SRTは、最も普及している字幕フォーマットで、ソフトウェア、プラットフォーム、ソーシャルネットワークとの互換性が最も高いフォーマットです。翻訳は比較的簡単で、シーケンス番号やタイムコードを変更することなく、原文の代わりに翻訳を挿入するだけです。ほとんどのCATツールと完全な互換性があります。

VTT :

VTT字幕ファイル形式はウェブ専用で、特定の時間注釈、メタデータを含み、競合他社よりも豊富なテキストフォーマットが可能です。VTTファイルを翻訳するには、コードエディタで開くか、あるいはより簡単に、このフォーマットに対応した数少ない翻訳プログラムの1つであるSmartcat CATツールを使用します。

オーディオ

FLAC, MP3, WAV, OGG, MID, WMA :

これらのオーディオファイル形式はすべて、音楽や人間の声などの音声を保存するコンピューティングで使われています。オーディオファイルを翻訳するには、トランスクリプション(テープ起こし)の段階が不可欠です。トランスクリプションは、人間が行うことも、自動トランスクリプションソフトウェアを使って自動的に行うこともできます。 タイムコード(タイムマーカー付き)も、シンプルなものもあります。トランスクリプションは、字幕ファイルやテキスト形式のファイルで行うことができ、テープ起こしされたファイルは、CATツールを使用して翻訳することもできます。

絵画

DXF, DWG :

Autocadファイルの翻訳作業は複雑です。第一に、どのCATツールとも直接の互換性が無いこと、第二に、技術翻訳を専門としないプロの翻訳者や翻訳会社が、Autocadを直接扱うことは、まずほとんどないからです。

DWG形式はAutocadのネイティブ形式であり、DXF形式はAutocadファイルを作成に使用したバージョンよりも古いバージョンで表示できるようにする「交換」用の形式です。

TranslateCADアプリケーションは、DXF形式の交換ファイルを翻訳できますが、DWG形式のファイルは翻訳できません。DWGファイルしかない場合は、まずDXFに変換する必要があります。

PowerCADもDXFファイルを扱えるDWGファイル翻訳アプリケーションです。

DWGまたはDMXファイルをIllustratorにエクスポートし、AIファイルとして扱う方法もあります。

VSDX, VSX, VTX, VDX, VSSX, VSTX, VSDM, VSSM, VSTM :

これらのMicrosoft Visio固有のファイル形式は、Visioで直接翻訳するか、CATツールを使用して翻訳することができます。