人文学オープンデータ共同利用センターが、「KuroNetくずし字認識サービス」【IIIFに準拠した画像であれば、世界中で公開されるくずし字画像を翻字】を公開、「日本古典籍くずし字データセット」に字形データを大幅に追加、ついに100万文字越え
TweetKuroNet開発者、カラーヌワット・タリン氏の思い。
資料が読めないから、読まれていないし、勝手に多く捨てられている。資料の面白さが一般の人々が分かってもらえたら、みんなが大事にしてくれるんじゃないかと思ったので、くずし字AIを作りました。日本人だけではなくて、くずし字資料の素晴らしさと面白さを海外にも知ってもらいたいから頑張りました
— tkasasagi (@tkasasagi) November 12, 2019
古典ブームを起こそうとしています。
— tkasasagi (@tkasasagi) November 12, 2019
■古典・古文書の難読「くずし字」、AIが瞬時に解読...精度90%も 読売新聞
https://headlines.yahoo.co.jp/hl?a=20191111-00010000-yom-sctch
■「KuroNetくずし字認識サービス」
https://mp.ex.nii.ac.jp/kuronet/
○使い方
「KuroNetくずし字認識サービス」の使い方(@yhkondo 氏のレクチャー)【IIIF (International Image Interoperability Framework)に準拠した画像であれば、世界中で公開されるくずし字画像を翻字できる!】
https://togetter.com/li/1429574
KuroNetデモ動画です。以下のリンクからサービス試しができます。実行する前にLoginする必要があります。
— tkasasagi (@tkasasagi) November 14, 2019
KuroNet Demo Video. You can try it by yourself from this link. https://t.co/dt2xPFLK2E pic.twitter.com/gFHNFMpLXg
KuroNetくずし字認識サービスhttps://t.co/GT8RAMW0PA 「利用方法」にも書いてありますが、ポイントは3つ
— 蔵書印/出版広告 (@NIJL_collectors) November 12, 2019
①「KuroNetくずし認識ビューア」と「ダッシュボード」の両方に、同じアカウントでログインすること
②「KuroNetくずし認識ビューア」の■から操作
③OCR予約クリックhttps://t.co/wjXkJoFd3r pic.twitter.com/di0x4CFYDK
④認識結果は、「横方向移動量」などのスライダーを使って、本文からずらすと読みやすいです。 pic.twitter.com/kp7nP4rm0x
— 蔵書印/出版広告 (@NIJL_collectors) November 12, 2019
■人文学オープンデータ共同利用センター・ニュース(こちらで追加情報を確認してください)
http://codh.rois.ac.jp/news/
twitter
https://twitter.com/rois_codh
■「日本古典籍くずし字データセット」に字形データを大幅に追加
http://codh.rois.ac.jp/char-shape/