国立国会図書館・NDLラボにて、NDL Ngram Viewerが公開【OCRによって作成されたテキストデータから、出版年代ごとの出現頻度を可視化・列挙することができるサービス】【2022年5月現在の対象は、著作権保護期間満了図書資料約28万点（次世代デジタルライブラリーの全文検索と同様の資料群）のOCRテキストデータから集計した、約8.3億種類の単語及びフレーズ】 - 文学通信｜多様な情報をつなげ、多くの「問い」を世に生み出す出版社

国立国会図書館・NDLラボにて、NDL Ngram Viewerが公開【OCRによって作成されたテキストデータから、出版年代ごとの出現頻度を可視化・列挙することができるサービス】【2022年5月現在の対象は、著作権保護期間満了図書資料約28万点（次世代デジタルライブラリーの全文検索と同様の資料群）のOCRテキストデータから集計した、約8.3億種類の単語及びフレーズ】

Share on Tumblr

【概要
OCRによって作成されたテキストデータから、出版年代ごとの出現頻度を可視化・列挙することができるサービスです。

可視化グラフの縦軸は、年代ごとに何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。

2022年5月現在の対象は、著作権保護期間満了図書資料約28万点（次世代デジタルライブラリーの全文検索と同様の資料群）のOCRテキストデータから集計した、約8.3億種類の単語及びフレーズ（以下「キーワード」といいます。）です。】

詳細は以下より。
https://lab.ndl.go.jp/service/ngramviewer/