DH国際シンポジウム「デジタル画像とテキストの新展開: 自動文字読み取りの最新動向とその利活用」(2025年6月3日(火曜) 13:30-18:00 、慶應義塾大学三田キャンパス北館ホール、同時通訳付き/ハイブリッド開催・無料、要事前申込み)

研究会情報です。
●公式サイトはこちら
https://sites.google.com/view/dhsympo2025b/
--------------------
※詳細は上記サイトをご確認ください。
2025年6月3日(火曜) 13:30-18:00
慶應義塾大学三田キャンパス北館ホール
同時通訳付き/ハイブリッド開催
参加申込みフォーム(無料、要事前申込み)
https://forms.gle/G3UQG6tSWj9kMkaNA
膨大な文書や古典籍をデジタル撮影したものの、その後、これをどのように活用すべきか、ということは人文学のみならず様々な分野において広く大きな課題でした。近年は、AI技術の高度化により、解決の糸口が見えつつあります。これについて、フランス発のオープンソースの手書き文字認識プラットフォームプロジェクトescriptoriumの共同代表、Peter Stokes教授と、国立国会図書館で古典籍OCRの開発を推進する青池亨氏をお迎えし、現在の最新状況について情報共有し、関連する国内外の研究を踏まえた議論を行なう場として、本シンポジウムを企画いたしました。手書き文字や木版の文字の自動読み取りとその活用や将来像にご関心がおありの方は、ぜひご参加ください。
基調講演:多様な文字体系に対する自動文字認識:課題と可能性
Challenges and Potentials in Multi-Script Automatic Character Recognition
歴史的な手書き文書の自動文字認識(ACR)は、かつては遠い夢だと考えられていましたが、現在では現実のものとなっています。この技術は、自動テキスト認識(ATR)、手書きテキスト認識(HTR)、光学文字認識(OCR)などとも呼ばれ、現在ではラテン文字、ヘブライ文字、シリア文字、ギリシャ文字、キリル文字、アルメニア文字、グルジア文字、ベトナム文字、漢字、そしてもちろん日本のカナなど、幅広い歴史的書記体系や言語の文書転写に成功しています。しかしながら、ACRには依然として多くの課題と将来的な可能性が残されています。その一例として、単一文書に複数の異なる書記体系が混在するような場合をどのように処理するか、また、自動転写したテキストを完全な学術版(エディション)へと発展させる方法などが挙げられます。さらに、ACRは古文書学(palaeography)、写本学(codicology)、本文伝承(textual transmission)、さらには美術史といった分野において、特にフランスのBiblissima+プロジェクトのようなリンクト・オープン・データ(Linked Open Data)と連携することで、これまで十分に活用されていなかった新たな可能性を切り開きつつあります。本講演では、フランス高等研究実習院 (EPHE, Ecole Pratique des Hautes Etudes)およびPSL研究大学で取り組まれている事例を紹介し、現在可能となっていること、そして今後取り組むべき課題について述べます。
プログラム
総合司会 岡田一祐(慶應義塾大学文学部)
13:30-14:00
:開会挨拶
OCRの高度化とそれを利用した古典籍画像活用の可能性
(Leveraging Advanced OCR for Efficient Usage of Classical Text Images )
永崎研宣(慶應義塾大学文学部/一般財団法人人文情報学研究所)
14:00-15:00
:基調講演
Challenges and Potentials in Multi-Script Automatic Character Recognition
(多書記体系における自動文字認識:課題と可能性)
Peter Stokes (École Pratique des Hautes Études, PSL University)
15:15-15:45
:PSL研究大学における画像とテキスト研究の最新動向
AI and Computer Vision Approaches to the Study of Animals in Medieval Illuminated Manuscripts
(中世装飾写本に描かれた動物の研究へのAIおよびコンピュータビジョンの応用)
Daniel STOCKHOLM (École Pratique des Hautes Études (PSL))
Manuscript restoration using Generative networks
(生成ネットワークを用いた写本の修復)
Chahan VIDAL-GORENE (École nationale des chartes (PSL))
Augmented Diplomacy: Transcription, Semantic Edition, and AI-Assisted Exploration of the Archives of Multilateralism
(AIを活用した外交史料研究:多国間主義アーカイブの転写、意味的校訂、AI支援による探索)
Florian CAFIERO (PSL & École nationale des chartes)
15:45-16:15
:講演
国立国会図書館におけるOCR研究開発の現状と将来(仮題)(Current Status and Future Prospects of OCR Research and Development at the National Diet Library)
青池亨(国立国会図書館)
16:15-16:45
:講演
7. 西洋初期刊本の活字画像の認識と活字研究への応用
(Recognizing Type Image in the Early Printed Books and Their Application to Type Analysis)
安形麻理(慶應義塾大学文学部)
17:00-17:50
:総合討論
司会:徳永聡子(慶應義塾大学文学部)
17:50-18:00
閉会