AI翻訳・LLM

2016年に日本翻訳連盟(Japan Translation Federation、JTF)に入会してから、京都で開催された第28回(2018年)を除き、JTF翻訳祭に毎年参加しています。今年、ハイブリッド形式(リアル会場&オンライン)で開催された第32回JTF翻訳祭2023にもアーカイブ動画を視聴する形で参加しました。

去年のJTF翻訳祭2022では「AI翻訳との共存」と題したセッションもありましたが、今年の方が各セッションのタイトルにChatGPTやAI翻訳のキーワードが多く使われていたことが印象に残っています。今回の翻訳祭は「どうする!?翻訳通訳業界」がテーマだったので、やはり生成AIブームの火付け役となったChatGPTのような大規模言語モデル(Large Language Model、LLM)に対する翻訳業界の警戒感(あるいは期待感)が表れていたと思います。

一般にもAI翻訳という言葉がだいぶ普及してきた感じがしますが、ChatGPTなどのLLMは文脈の理解や文章生成の自然言語処理に重点を置いており、本来はDeepLやGoogle翻訳などのニューラル機械翻訳(Neural Machine Translation、NMT)の方が翻訳に特化しています。しかし、LLMは幅広いコンテンツを学習しているため、分野を問わず従来のNMTモデルより自然な文章を出力できるのが強みです。

なお、ChatGPT(OpenAI)やCopilot(MS)、Bard(Google)などのメジャーなチャットAIの学習に使用されるデータセットの主要言語は英語なので、英語を含まない言語ペアー(例えば日本語とポルトガル語)の翻訳精度はそれほど高くない場合があります。これはNMTにもいえることですが、英語の翻訳精度を前提として他の言語の組み合わせでも同じ精度が得られると期待するのは過信になります。NTTの「tsuzumi」のような日本語の処理能力が高いLLMも開発されていますが、機密保持やハルシネーション(もっともらしい嘘)の問題をクリアしているのかも気になるところです。

さた、今年も残りわずかとなりました。本年も多くの翻訳会社・LSPに格別のご厚情を賜り、心より感謝申し上げます。来年も何卒よろしくお願い申し上げます。

Feliz 2024! Happy 2024!どうぞ良いお年をお迎えください!