GitLab CIを活用した英日翻訳改善 #gitlab #gitlabjp #docker #devops #kaizen
この記事は1年以上前に投稿されました。情報が古い可能性がありますので、ご注意ください。
GitLab CIを活用してLaTeX英日翻訳を改善しました。
とあるLaTeX英語文書の和訳に、最初はGitLabのWeb IDEを利用していました。
しかしWeb IDEは翻訳ツールではないため、同じ文や似た文を参考として表示する機能がなく、用語や文体の統一に手間がかかったり、原文が更新された際の追従が非常に大変でした。
弊社ではコンピュータ翻訳支援(Computer Assisted Translation; CAT)ツールとしてOmegaTを採用していますが、今回の原文であるLaTeX文書にはさまざまな拡張が施されていたため、対象訳文の抽出や訳文ファイル生成に問題があり、そのまま使うことができませんでした。
そこでpo4aというツールをLaTeX文書とOmegaTの間に挟み、OmegaTではPO (Portable Object)ファイルを翻訳するという手順を取ることにしました。po4aの対象訳文の抽出はカスタマイズが可能なので、LaTeX文書の拡張部分に対応することができました。
しかし、
- po4aで原文LaTeX文書を原文POファイルに変換
- OmegaTで原文POファイルを翻訳
- OmegaTで訳文POファイルを生成
- po4aで訳文POファイルと原文LaTeX文書から、訳文LaTeX文書を生成
- LaTeXコンパイラで訳文LaTeX文書から、訳文PDFを生成
これらすべてを手動で行うのは大変骨が折れるため、OmegaTで翻訳を行う箇所(2.)以外はGitLab CIとDockerを活用して自動化しました。
これにより、Web IDEで翻訳を行っていたころの期間に比べて、88日から24日に短縮できました。
作業期間を3分の1に短縮できたこともさることながら、各種中間ファイルの生成を自動化したことで、翻訳担当者の目からすれば「翻訳したらPDFが出てくる」ほどの効率アップを実現できました。
クリエーションライン株式会社では DevOpsエンジニアを募集 しています。