デジタル・ヒューマニティーズ 国際ワークショップ「デジタルテキスト研究の新展開」【下田正弘・竹内綾乃・永崎研宣・Dr. Federico Pianzola】(2025年4月11日(金)14時~17時 、東京大学本郷キャンパス山上会館大会議室)

ワークショップ情報です。
●公式サイトはこちら
https://sites.google.com/view/dhws20250411/
--------------------
※詳細は上記サイトをご確認ください。
デジタル・ヒューマニティーズ 国際ワークショップ
デジタルテキスト研究の新展開
4月11日(金)14時~17時
東京大学本郷キャンパス山上会館大会議室(同時通訳付き)
参加費無料・要申し込み【参加申込みフォーム】
https://forms.gle/DBq36YTYjwKrqJw4A
【プログラム】
14:00 開会挨拶: 下田正弘「デジタル研究基盤としての「令和大蔵経の編纂」のこれから」
14:30 講演: 竹内綾乃「発することばで造られる登場人物 --源氏物語の女性たち--」
15:00 講演: 永崎研宣「新たな仏典テキストデータ構築のための枠組み」
15:30 基調講演:Dr. Federico Pianzola「GOLEM: Graphs and Ontologies for Literary Evolution Models」
16:30 総合討論
17:00 終了
発表概要:
下田正弘「デジタル研究基盤としての「令和大蔵経の編纂」のこれから」
今年度から4年にわたって【特別推進研究】「デジタル研究基盤としての令和大蔵経の編纂―次世代人文学の研究基盤構築モデルの提示」を推進する。この研究は、研究媒体のデジタル化(DX)と人工知能(AI)がきわめて効果的に機能しはじめた研究環境の構築に向け、人文学が対応すべき諸要件を明らかにし、それらを実現するデジタル学術空間の構築を通して、人文学の伝統的営為を発展的に再編するための道筋をしめすことを目的とする。すでに実績をもつSAT DB(大蔵経全テキストデータベース)にもとづき、人文学DXの次世代モデルとAI-OCRを採用した最新の実装システムを用い、大蔵経全体の再編纂――令和大蔵経の編纂――を可能とする大規模なDXを行い、あらたな研究方法と学術的評価方法の知見を提示する。これによってDX-AI時代に成立する日本の人文学が進むべき方途が見えてくるだろう。
竹内綾乃「発することばで造られる登場人物 --源氏物語の女性たち--」
本講演では、日本古典文学作品『源氏物語』における登場人物が発することばを対象に、そのことばが登場人物の特徴づけにどのように寄与しているのかを分析する。小説や物語における登場人物は、外見などの視覚的な要素だけではなく、使用することばによっても特徴づけられることがある。例えば、「あら」や「まあ」のようなことばと、「おい」のようなことばは、多くの場合、異なる性別、年齢、性格の登場人物によって使用されており、そのことばからどのような人物として書かれているのかを想像することができる。このような役割をもった言語要素は、江戸時代までその起源を遡ることができると言われている。では、江戸時代以前に書かれた文学作品ではどうだったのだろうか。登場人物を特徴づけるための言語要素は存在したのだろうか。そこで、源氏物語における女性の登場人物が発することばに焦点を当て、コーパスを活用したテキスト分析を通して、登場人物のことばが登場人物自身の特徴づけにおいてどのような役割を果たしているのかついて考えてみた。
永崎研宣「新たな仏典テキストデータ構築のための枠組み」
AIを活用した高効率なOCRの登場と、利用者の意識の変化により、人文学のためのテキストデータ構築は新たな局面を迎えつつある。人文学において重要な基盤の一つであるテキスト資料のデジタル媒体への移行にあたり、それをよりよい形で共有し研究に活用できる基盤としていくためにはどういう技術と手続きが必要になるのか。データ形式の規格としては近年日本でも広まりつつあるTEIガイドラインが存在するものの、それを踏まえた上で誰が何にどう取り組み、それらをどう整理すべきなのか。ここまでの研究実践および技術と規格の発展を踏まえた効果的な枠組みを提示する。
Dr. Federico Pianzola「GOLEM: Graphs and Ontologies for Literary Evolution Models」
This talk presents the first release of a graph database of online fiction corpora in various languages. The goal is to describe texts using "derived data" referring to various textual features, so that comparisons between documents could be done without accessing the full text of the documents. The idea is similar to that of the HathiTrust Extracted Features dataset, but the features encoded in the GOLEM project ("Graphs and Ontologies for Literary Evolution Models") are much richer and also refer to narrative and stylistic elements and to reader response data (e.g. characters, relationships, topics, readability, sentiment of comments received by the story, etc.) collected from likes and comments left on the stories. Since GOLEM focuses primarily on derived data, only statements about the texts and their reception are stored in the database, modelled according to a new ontology for narrative and fiction, but also looking at existing ontologies as closely as possible in order to maximize the interoperability with other relevant projects, like Wikidata and MiMoText.
Pannach, F., Cheng, L. and Pianzola, F. (2024). The GOLEM-Knowledge Graph and Search Interface: Perspectives into Narrative and Fiction. Proceedings of the Computational Humanities Research Conference 2024, Aarhus, Denmark, December 4-6, 2024. https://ceur-ws.org/Vol-3834/paper80.pdf
主催 一般財団人文情報学研究所
後援
東京大学大学院人文社会系研究科次世代人文学開発センター人文情報学部門
科学研究費補助金特別推進研究(代表:下田正弘)(JP25H00001)デジタル研究基盤としての令和大蔵経の編纂―次世代人文学の研究基盤構築モデルの提示