DeepL の新モデルの翻訳性能をざっとチェック

2024年7月21日 · 約5分

はじめに

最近、DeepL の新モデルが登場し、ChatGPT-4 よりも上だと DeepL 社は主張している。

全く期待せずに翻訳性能をざっとチェックした結果が下。確かに以下の例だと ChatGPT-4o よりも優れている。

原文

He ended up with cancer of the spine. He did not want to die at home. And as he was laying on the gurney waiting to be loaded into the ambulance, he told me, he said, baby, he said, the story is true.

He said, don't let anybody try to tell you any different. He said, the incident happened, there was a spacecraft, and I kissed him, and that's the last I got to talk to my dad. (00:01:23)

DeepL old model

彼は結局、背骨のガンを患った。彼は家で死にたくなかった。担架に寝かされて救急車に乗せられるのを待っているとき、彼は私に言ったんだ。

誰にも違うことを言わせないでくれ、と。そして私は父にキスをし、それが父と話をした最後となった。 (00:01:23)

DeepL new model

彼は最終的に脊髄がんで亡くなった。彼は自宅で死にたくなかった。そして、救急車に乗せられるのを担架の上で待っていたとき、彼は私に言った。「ベイビー、あの話は本当なんだ。

他の人が違うことを言おうとしても、信じちゃいけないよ。あの出来事は実際に起こったんだ。宇宙船があったんだ。そして、私は彼にキスをした。それが、父と最後に話した言葉だ。（00:01:23）

（比較用）ChatGPT-4o

彼は最終的に脊椎の癌になった。彼は自宅で死にたくなかった。そして、担架に横たわりながら救急車に乗せられるのを待っていた時に、彼は私にこう言った。「ベイビー、話は本当だ」と。

「誰にも違うと言わせるな。事件は本当に起こったんだ、宇宙船もあったんだ」と言って、私は彼にキスをした。それが私が父と話した最後だった。（00:01:23）

原文の参照元

❏ 心理学教授の「1965年に Roswell の金属シートを実際に手にした」という証言の謎を解く（完結） (2024-05-22)

ChatGPT-4o による DeepL の和訳性能の評価

ついでに ChatGPT-4o に DeepL の和訳を評価させたが、大きく進化したと判定している。

ChatGPT-4o

DeepL の新モデルの翻訳結果は非常に自然で読みやすいですね。特に以下の点で優れていると感じます：

感情の表現: 「信じちゃいけないよ」という部分は、話し手の感情をうまく捉えています。これにより、会話のリアリティと感情がよく伝わります。
文脈の理解: 「そして、救急車に乗せられるのを担架の上で待っていたとき、彼は私に言った。」という部分は、元の英文の意味を正確に捉えています。従来のモデルでは係り受け構文が難しかった点が改善されています。
自然な日本語: 全体的に翻訳された日本語が非常に自然で、違和感が少ないです。文の流れもスムーズで読みやすいです。

全体として、DeepL の新モデルは非常に高い翻訳性能を持っていると評価できます。特に、感情やニュアンスをうまく捉えた翻訳ができる点で、従来モデルから大きく進化していると感じます。

(2024-07-21)

はじめに​

原文​

DeepL old model​

DeepL new model​

（比較用）ChatGPT-4o​

原文の参照元​

ChatGPT-4o による DeepL の和訳性能の評価​