国立国会図書館・NDLラボにて、NDL Ngram Viewerが公開【OCRによって作成されたテキストデータから、出版年代ごとの出現頻度を可視化・列挙することができるサービス】【2022年5月現在の対象は、著作権保護期間満了図書資料約28万点(次世代デジタルライブラリーの全文検索と同様の資料群)のOCRテキストデータから集計した、約8.3億種類の単語及びフレーズ】

このエントリーをはてなブックマークに追加 Share on Tumblr

【概要
OCRによって作成されたテキストデータから、出版年代ごとの出現頻度を可視化・列挙することができるサービスです。

可視化グラフの縦軸は、年代ごとに何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。

2022年5月現在の対象は、著作権保護期間満了図書資料約28万点(次世代デジタルライブラリーの全文検索と同様の資料群)のOCRテキストデータから集計した、約8.3億種類の単語及びフレーズ(以下「キーワード」といいます。)です。】

詳細は以下より。
https://lab.ndl.go.jp/service/ngramviewer/