AI時代の翻訳者の新しい武器
最近、翻訳の勉強として「Codex」を蓄積しています。
現在、約300個ほどの翻訳パターンを登録しました。
結論から言うと、
Codexは翻訳者にとってかなり強力な武器になります。
この記事では、Codexを300個作って感じたことを、現役翻訳者の視点でリアルに書いてみます。
Codexとは何か
まず簡単に説明します。
Codexとは
翻訳パターンのデータベース
です。
つまり
「どう訳すか」
を保存する場所です。
例えば特許翻訳ではこういう表現がよく出ます。
in certain embodiments
→ ある実施形態では
configured to
→ ~するよう構成されている
according to an embodiment
→ 一実施形態によれば
こういう
翻訳の型(構文)
を保存していくのがCodexです。
なぜCodexを作り始めたのか
特許翻訳をしていると、だんだん気づきます。
同じ構文が何度も出てくる。
特許翻訳は
- 定型表現
- 構文パターン
- 技術用語
の組み合わせです。
つまり翻訳は
ゼロから作る作業ではなく
パターンの組み合わせ
なんです。
そこで
「このパターンを全部データベース化したらどうなるんだろう?」
と思ってCodexを作り始めました。
Codex300個作った感想
実際に300個くらい作ってみて感じたことがあります。
それは
翻訳がかなり速くなる
ということです。
理由はシンプルです。
翻訳のとき
原文
↓
構文認識
↓
Codex検索
↓
既存パターン
↓
微調整
という流れになるからです。
つまり
翻訳 → 編集
に近くなります。
特許翻訳は構文の世界
特許翻訳をしている人なら分かると思いますが、
特許はかなりパターン化されています。
例えば
A continuing need exists for X
これは
Xに対する継続的なニーズが存在する
と訳せます。
こういう構文が
何百個も存在する
わけです。
Codexはそれを
体系化する作業
です。
Codexを作ってわかったこと
300個作って分かったことがあります。
それは
翻訳はデータの仕事
ということです。
翻訳者の資産と言えば
昔は
- 翻訳メモリ
- 用語集
でした。
でもAI時代は
翻訳パターン
がかなり重要になります。
つまり
翻訳メモリ
↓
翻訳パターンDB
という変化が起きている気がします。
AI翻訳との相性がいい
Codexは
AI翻訳ともかなり相性がいいです。
例えば
- ChatGPT
- DeepL
のようなAI翻訳ツールがあります。
AIは
パターン認識
が得意です。
つまり
Codexのような構文DBがあると
AI翻訳の精度も上がります。
Codexは翻訳者の新しい資産
これからの翻訳者の資産は
おそらく
- 翻訳メモリ
- 用語集
- 構文データベース
になります。
特に特許翻訳では
構文DBはかなり強い武器
になると思います。
これからの目標
現在
Codex 約300
です。
目標は
- 1000
- 3000
- 5000
くらいです。
もし5000くらいまで行けば
かなり強い翻訳パターンDBになると思います。
まとめ
Codexを300個作って感じたこと。
・翻訳はパターンの世界
・構文DBはかなり強い
・AI翻訳とも相性がいい
・翻訳速度が上がる
翻訳者の資産は
翻訳メモリ → 翻訳パターンDB
へと変わっていくのかもしれません。
AI時代の翻訳者にとって、
Codexはかなり面白いツールだと思います。

コメント