国立国会図書館:2022年度「NDLデジタルライブラリーカフェ」(2023年1月18日(水)15時〜16時45分、Zoom Webinar)※要申し込み

このエントリーをはてなブックマークに追加 Share on Tumblr

研究会情報です。

●公式サイトはこちら
https://lab.ndl.go.jp/event/digicafe2022/

--------------------
※申し込み等は上記サイトをご確認ください。


●イベント概要
国立国会図書館は、「ビジョン2021-2025 -国立国会図書館のデジタルシフト-」を掲げて、2021年から2025年までの5年間に100万冊以上の所蔵資料のデジタル化を進めるとともに、OCR(光学的文字認識)による全文テキスト化も行い、検索や機械学習に活かせる基盤データとすることを目指しています。

デジタル化資料の全文テキストデータの作成のために、令和3年度OCR処理プログラム研究開発において、当館は機械学習技術を用いたOCR処理プログラム「NDLOCR」(GitHubへの外部リンク)を開発しました。NDLOCRはオープンソースソフトウェアとしてCC BY 4.0で公開されており、自由な利用が可能になっています。

本イベントでは、実際の研究の場においてNDLOCRが活用されている事例について話題提供を受け、更なる活用の可能性について参加者とディスカッションを行います。

●テーマ
NDLOCRを使ってみた―全文テキスト活用のススメ―

●プログラム概要・発表者(敬称略)

第1部 話題提供(提供順)

NDLOCRとデータセットの紹介(仮)

青池亨(電子情報企画課次世代システム開発研究室開発研究係員)
東京大学史料編纂所出版物を用いたNDLOCRの応用事例紹介(仮)

中村覚(東京大学史料編纂所助教、当館非常勤調査員)
全文テキスト化が研究に与えるインパクトと今後の期待について(仮)

箱石大(東京大学史料編纂所教授)
第2部 カフェタイム

国内の多様なデジタル化資料のテキスト化の推進に向けて、NDLOCR活用の可能性や、テキストデータ活用の意義など、NDLOCRとテキストデータの活用をテーマに、第1部の登壇者と参加者とで気軽にディスカッションできる時間とします。


日時
2023年1月18日(水)15時から16時45分まで(14時45分受付開始)

開催形態
オンライン開催(Web会議システム(Zoom Webinar)を使用)

定員
なし。ただし、ディスカッション参加者は20名(先着順)。

参加費
無料