東京大学総合図書館のデジタル源氏物語にて、「デジタル源氏物語(AI画像検索版)」が公開【国立国会図書館デジタルコレクションで公開されている 『校異源氏物語』の本文を基に、複数の写本・版本の全冊画像から該当箇所と思われる画像を横断的に検索する機能】

このエントリーをはてなブックマークに追加 Share on Tumblr

【AI画像検索(Finding Digital Facsimiles Including Parallel Texts with AI)について

『源氏物語』の写本・版本のデジタル画像は多くの機関で公開されていますが、ある一つの場面を確認したいとき、桐壺巻から夢浮橋巻までの約2000枚にも及ぶ画像から目当ての場面を探し出すのは、変体仮名(くずし字)の読解能力にかかわらず、画像のコマ送りの手間を要します。複数の写本・版本を同時に調べる場合は尚更であり、「デジタル源氏物語」では『校異源氏物語』や『新編日本古典文学全集』の頁番号を付すことで諸本の横断検索を実現しています。その一方で、頁番号付与の作業は人による確認が欠かせず、少人数の作業体制では一度に多くの伝本を組み入れることは困難です。この問題を解消すべく、従来の頁番号の方法もこれまで通り進めつつ、さらなる自動化を目指して別の新しい検索方法についても議論してきました。

この「AI画像検索」は、国立国会図書館デジタルコレクションで公開されている 『校異源氏物語』(インターネット公開(保護期間満了))の本文を基に、複数の写本・版本の全冊画像から該当箇所と思われる画像を横断的に検索する機能です。検索結果に表示される「類似度」は、『校異源氏物語』の本文と人文学オープンデータ共同利用センター(CODH)開発のくずし字OCRによる諸本翻刻との照合に基づくものであり、システム構築に際してくずし字OCRの利用を御快諾下さったCODHの各位に御礼申し上げます。】

つづきは以下より。
https://genji-ai.web.app/