日本語の縦書き文章を OCR するコツ
· 3 min read
前置き
Windows11 に標準で搭載されている snipping Tool には OCR 機能がある。この OCR 機能は極めて優秀で、市販の OCR ソフトよりも勝っているのだが、一つ、大きな欠点がある。
それは、日本語の縦書き文章を OCR 処理させると、行が入り乱れてしまうという問題。しかも不規則に乱れる場合もあるので、後から機械処理で訂正することもできず、人手で直す必要がある。これはダルい。
で、その対策を見つけたので記録しておく。
Microsoft は何事もユーザーに押し付けるという、傲慢かつ独りよがりな社風なので(Apple は Apple で鼻につく社風なのでイヤ)、縦書き文章の OCR の改善も期待できない。当面は以下の方法で凌ぐしかない。
縦書き文章を OCR するコツ
縦書きの日本語文章の画像を、左に 90度回転させてから OCR させる。
思いついたときには、自分でも「まさか。そんな雑な方法でいけるかよ…」とは思ったが、試してみたら これで いけた。