« 紙の国語辞典から言葉が消えても | トップページ | 今年の漢字は「金」だそうだが、個人的には「巣」 »

2021年12月13日

「AI 手書きくずし字検索」が既に実現してた!

昨日の記事で、辞書の話の行きがかりみたいな形で『くずし字解読辞典』というものに触れた。どんなものか知ってもらうために、その中のページを画像で紹介すると、こんな感じである。

2112132

クリックして拡大表示すると、ややわかりやすいかもしれないが、要するに、ヒョロヒョロッと筆で書かれた古文書の草書体(いわゆる「くずし字」)を解読するための辞典である。使い慣れないと、どうやって調べるのかという入り口で戸惑うような代物だ。

ただこれ、私みたいに古典芸能研究なんてことを大学と大学院で専攻しちゃったりすると、昔のわけのわからない古文書を読むための必需品だったりするのである。だって、こんなようなの ↓ を読まなきゃいけないのだからね。

2112133

ちなみにこの画像の右の題字みたいなのは、「新板 歌舞妓狂言穴さがし」と読む。「新板」は、今なら「新版」だろうし、「歌舞伎」の「伎」の字も、昔はこんな風に「妓」の字を当てたりしていた。

さらに「穴さがし」の「が」という字は、下手すると「う」とか「ろ」とか読んじゃいそうだが、「加」の字を崩した現代かなではなく、「可」の字をくずしたものなので、こんな形になってしまう。

そういえば 10年前の "「そむ」って何だ?" という記事も「そば」の「ば」の字は本来「者」という字を崩したものなのに、それを知らずに平気で「そむ」としか読めない看板を上げるそば屋が多いのを嘆いたものだ。2年前の "「せん遍以」を「方言漢字」とはこれ如何に?" も「せんべい」のことである。

というわけで、『くずし字解読辞典』は私の必需品なのだが、行きがかり上みたいにググって見たら、ネット上で「AI 手書きくずし字検索」というサービスがあるのを発見した。画面上の四角の枠内に、マウスを使ってくずし字を書くと、それが何の字なのかという候補を挙げてくれるのである。

10月 9日付の "文語体と草書体(くずし字)における「文化革命」" で "源氏物語が好きすぎて AI くずし字認識に挑戦でグーグル入社  タイ出身女性が語る「前人未到の人生」" という記事に触れたのを覚えておいでだろうか。それが既に実際に提供されているのを見て、私はグッとくるほど驚いてしまった。

試しにこのシステムを使い、「空」「変」「舞」「語」「話」「貍」という字を手書きして解読させてみた結果が、下の画像である。ミミズの這ったような字がお恥ずかしい限りだが。

211213

「空」「語」「貍」は見事に第一候補がヒットし、「変」は第二候補、「舞」「話」は第三候補でヒットしているから、立派なものだ。ちなみに最後の「貍」(「狸」の異体字?)は、我ながらかなり意地悪な挑戦のつもりだったが、あっさり認識されたのには驚いた。

ただ、自分自身の名誉のためというわけじゃないが、いくら私が悪筆でも、実際に筆で書いたらもう少しはマシな字になるという釈明ぐらいはさせてもらってもいいだろう。試してみればわかるが、マウスやタッチパッドででくずし字を書くのは超絶やりにくい。どうしても「金釘流」以下になってしまう。

それでもこのぐらいのレベルで解読してくれるのだから、このシステム、なかなかのものだ。10月 9日の記事で前もって讃嘆しておいた甲斐があるというものである。

ただ、この「くずし字解読」、正直言って、まだまだ紙の辞典の方がずっと使い物になる。だって、どう読むのかわからない字を、自分でマウスを使って画面上に書き込むなんていうのは、難行苦行みたいなものだから、今後もっといいシステムとして改良される余地がたっぷりだ。

ところで、10月 9日の記事で、私は以下のように書いた。

というわけで、彼女の試みに精一杯の拍手を送り、応援したい。いつの日か、Google のサイトで古文書の画像をアップすると、瞬時に現代の文字に置き換わるなんていうサービスが始まることを期待して。

それが、なんとスマホ・アプリで実現されていると知って、ますます驚いた。世の中、一体どうなってるんだ?

|

« 紙の国語辞典から言葉が消えても | トップページ | 今年の漢字は「金」だそうだが、個人的には「巣」 »

言葉」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




« 紙の国語辞典から言葉が消えても | トップページ | 今年の漢字は「金」だそうだが、個人的には「巣」 »