TOKYO DIGITAL HISTORYが、DHの学習動画シリーズ【UTDH Lab】の配信開始。まずは「OCRされたテキストデータをキレイにしよう〜正規表現〜 1〜4」が公開。
Tweet【UTDH Lab】OCRされたテキストデータをキレイにしよう〜正規表現〜、YouTubeプレイリスト
https://www.youtube.com/playlist?list=PLWr6KR1hONCfKup9vwwoSLXsTfgPChmpn
(承前)【UTDH Lab】第1弾は、Tokyo Digital History代表を務める小風尚樹による「OCRされたテキストデータをキレイにしよう~正規表現~」全4回です!Internet Archiveから取得した20世紀イギリスのNavy Listのテキストを、正規表現を使って整形し、Excelに落とし込みます。https://t.co/1SZCRDfkci
— Tokyo Digital History (@DHistory_Tokyo) March 11, 2020