MENU

Codexを300個作った翻訳者のリアル

AI時代の翻訳者の新しい武器

最近、翻訳の勉強として「Codex」を蓄積しています。
現在、約300個ほどの翻訳パターンを登録しました。

結論から言うと、

Codexは翻訳者にとってかなり強力な武器になります。

この記事では、Codexを300個作って感じたことを、現役翻訳者の視点でリアルに書いてみます。


Codexとは何か

まず簡単に説明します。

Codexとは

翻訳パターンのデータベース

です。

つまり

「どう訳すか」

を保存する場所です。

例えば特許翻訳ではこういう表現がよく出ます。

in certain embodiments
→ ある実施形態では
configured to
→ ~するよう構成されている
according to an embodiment
→ 一実施形態によれば

こういう

翻訳の型(構文)

を保存していくのがCodexです。


なぜCodexを作り始めたのか

特許翻訳をしていると、だんだん気づきます。

同じ構文が何度も出てくる。

特許翻訳は

  • 定型表現
  • 構文パターン
  • 技術用語

の組み合わせです。

つまり翻訳は

ゼロから作る作業ではなく
パターンの組み合わせ

なんです。

そこで

「このパターンを全部データベース化したらどうなるんだろう?」

と思ってCodexを作り始めました。


Codex300個作った感想

実際に300個くらい作ってみて感じたことがあります。

それは

翻訳がかなり速くなる

ということです。

理由はシンプルです。

翻訳のとき

原文

構文認識

Codex検索

既存パターン

微調整

という流れになるからです。

つまり

翻訳 → 編集

に近くなります。


特許翻訳は構文の世界

特許翻訳をしている人なら分かると思いますが、
特許はかなりパターン化されています。

例えば

A continuing need exists for X

これは

Xに対する継続的なニーズが存在する

と訳せます。

こういう構文が

何百個も存在する

わけです。

Codexはそれを

体系化する作業

です。


Codexを作ってわかったこと

300個作って分かったことがあります。

それは

翻訳はデータの仕事

ということです。

翻訳者の資産と言えば

昔は

  • 翻訳メモリ
  • 用語集

でした。

でもAI時代は

翻訳パターン

がかなり重要になります。

つまり

翻訳メモリ

翻訳パターンDB

という変化が起きている気がします。


AI翻訳との相性がいい

Codexは

AI翻訳ともかなり相性がいいです。

例えば

  • ChatGPT
  • DeepL

のようなAI翻訳ツールがあります。

AIは

パターン認識

が得意です。

つまり

Codexのような構文DBがあると

AI翻訳の精度も上がります。


Codexは翻訳者の新しい資産

これからの翻訳者の資産は

おそらく

  • 翻訳メモリ
  • 用語集
  • 構文データベース

になります。

特に特許翻訳では

構文DBはかなり強い武器

になると思います。


これからの目標

現在

Codex 約300

です。

目標は

  • 1000
  • 3000
  • 5000

くらいです。

もし5000くらいまで行けば

かなり強い翻訳パターンDBになると思います。


まとめ

Codexを300個作って感じたこと。

・翻訳はパターンの世界
・構文DBはかなり強い
・AI翻訳とも相性がいい
・翻訳速度が上がる

翻訳者の資産は

翻訳メモリ → 翻訳パターンDB

へと変わっていくのかもしれません。

AI時代の翻訳者にとって、
Codexはかなり面白いツールだと思います。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメントする

目次