メインコンテンツまでスキップ

英語話者動画の AI 整理:改善点と問題点

· 約5分

前置き

ここしばらく、NotebookLM で主要情報源(英語話者の動画)を整理して記事化を試みてきた。

かなりのデータが集まったので従来の記事作成方法との比較を行った。

新旧の方式の比較

従来方式

この Blog の情報源は現状、大半が英語話者の動画。その情報源を従来は

従来方式
  • 人間が聴き取り → 主要な話題を記事化
  • AI による文字起こし → AI による和訳 → 記事に添付

という方法で記事にしてきた。つまり人間が英語話者の動画を聴き取り、主要な話題を人間が拾って日本語文章にしてきた。この方法では

  • 記事作成に手間がかかりすぎる
  • そのため、情報源に含まれている他の小話題を記事化する余裕がなくなる
  • 聴き飛ばしによる重要な話題を取りこぼす

という問題があった。

最近の新方式

こういった問題があるので、英語話者の動画を、先ごろから NotebookLM という AI で整理する方法を試みてきた。つまり、

最近
  • 概要、詳細、時系列、主要関係者の自動生成 → そのまま記事化
  • mind map 生成 → 小話題を人間が拾って独立した章を作成

という方法に変更した。これにより、

  • 記事作成の手間が大幅に減少
  • 拙い英語の聴き取り能力による記事の取りこぼしや誤訳が激減

という長所がもたらされた一方で、

  • (a) 記事の長大化
  • (b) 小話題が複数の章で詳細化の程度が異なった形で重複する

という欠点も生まれた。

b を説明すると、この NotebookLM の mind map 出力の都合上、主要なトピック毎に章を綺麗に分離するのは簡単ではない。それ故、詳しさの程度が異なる形で同じトピックが複数の章で重複するのは避けがたい。

この a は大きな問題とはならない筈。記事の長大化の対策として自動生成した見出しを冒頭に添付しているので必要な箇所だけ拾い読みできるゆえ。

b については、

  • 今後、特定の章を格上げして別記事でリンクを張ってタイトルに格上げする場合が多くなるが、その場合は重複は障害とはならない。

  • 現状でもこの Blog 記事の読み手はごく少数。いずれこの手の AI 整理の長大な記事は 検索/参照 用となり、人間がじかに読むことはなくなる筈。つまり、AI が生成した記事を「AI だけが読む」ようになる。

と判断できるので、障害とはならない筈。

それにいずれ、AI によって b も改善できる筈。