ニュース
» 2013年09月02日 11時25分 UPDATE

米国議会図書館プログラマー、OpenCVでスキャン書籍から図版だけ抽出する方法を解説

OpenCVでスキャン画像から図版要素のみを抽出するハック。

[hon.jp]
hon.jp

 米国議会図書館で書籍スキャンシステムの開発に携わっているプログラマーのクリス・アダムス氏が、オープンソースの画像処理・画像認識用ライブラリ「OpenCV」を用いてスキャン書籍から図版だけ抽出する方法を解説している。

tnfighon1.jpg 画像認識の結果(画像出典:アダムス氏のブログ記事)

 アダムス氏は、実験システムにOpenCV、Python(スクリプト言語)、numpy(Python用数値演算ライブラリ)を使用。手動でフィルタ値をスライダー調整しながらイラスト部分の質感を検知する方式のため、全自動とはいかないが、スキャン書籍や新聞などからかなり高精度に図版の抽出に成功したとのこと。

 今後これを発展し、デジタル化蔵書の検索ポータルなどの新UI開発に活用したいとのこと。

Copyright 2015 hon.jp, Inc. All Rights Reserved.

ITmedia Book Club会員登録がまだの方はこちら

電子書籍/紙を問わず、読書を愛する皆さまに向け、特別な情報提供、書籍の献本、著者や業界関係者との懇親会、執筆活動を検討されている方へのサポートなどを順次提供し、皆さまの読書を強力にバックアップします。

コンテンツパートナー

新刊JP
ラノコミ.com
hon.jp
新文化通信社
Good E-Reader Blog
ぶくまる