コーパス開発センターにて、『日本語歴史コーパス 和歌集編』(短単位データver.0.8)、『日本語歴史コーパス 江戸時代編Ⅱ人情本』(短単位データVer.0.8)、『日本語歴史コーパス 明治・大正編Ⅲ明治初期口語資料』(短単位データver.0.8)が公開

このエントリーをはてなブックマークに追加 Share on Tumblr

2019/03/26『日本語歴史コーパス』(ver.2019.3)を公開しました。

【『日本語歴史コーパス 和歌集編』(短単位データver.0.8)を公開しました。
平安時代から鎌倉時代にかけて編纂された勅撰和歌集のうち、八代集と称される和歌集のデータ(約26万短単位)が加わりました。

『日本語歴史コーパス 江戸時代編Ⅰ洒落本』を更新しました(短単位データVer.1.0 長単位データVer.1.0)。
短単位データの品詞・語種、および本文種別・話者情報に修正を加え、さらに、一部データに対して、同一箇所に複数の形態論情報を付与する「形態論情報の多重化」を行いました。

『日本語歴史コーパス 江戸時代編Ⅱ人情本』(短単位データVer.0.8)を公開しました。
ひまわり版で試行版が公開されていた1作品に加え、江戸時代後期の言葉を知ることのできる人情本の8作品(約40万短単位)がコーパスに加わりました。

『日本語歴史コーパス 明治・大正編Ⅰ雑誌』を更新しました(短単位データver.1.2)。
『明六雑誌』(1874年、1875年)と『国民之友』(1887年、1888年)の間を繋ぐ雑誌として、『東洋学芸雑誌』(1880年、1881年)のデータ(約20万短単位)を追加しました。

『日本語歴史コーパス 明治・大正編Ⅲ明治初期口語資料』(短単位データver.0.8)を公開しました。
明治初期に口語体で書かれた啓蒙書、文学作品のデータ(10作品、約20万短単位)が加わりました。】
https://pj.ninjal.ac.jp/corpus_center/renew/