近代雑誌の写真データをOCRしてテキスト化できるプログラム「Kindai-OCR」(OCR system for recognizing modern Japanese magazines)【LE DUC ANH氏】が公開に
Tweet私も兼務している人文学オープンデータ共同利用センターで、研究員のアィンさんが、近代雑誌の写真データをOCRしてテキスト化できるプログラムをGitHubで公開されました。https://t.co/yHQ90uREMz
— Daichi Mochihashi (@daiti_m) August 4, 2020
旧字体や文字の掠れ等があってもテキスト化してくれます。今後、さらに高精度化を進めていく予定です。