tesseract-ocr in ios
DESCRIPTION
TRANSCRIPT
![Page 1: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/1.jpg)
![Page 2: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/2.jpg)
0@reiji1020
0長崎県立大学シーボルト校国際情報学部情報メディア学科 2年
0 Obj-C/Unity4/JavaScript/C#
0 http://reiji1020.hatenablog.com/
![Page 3: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/3.jpg)
文具メーカーからはスマホやタブレット用アプリと連動した商品が続々と発売されていますね
![Page 4: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/4.jpg)
ShotNote(KING JIM製)
0ノートタイプ、付箋タイプ、ホワイトボードタイプが用意されている。
0日時、ページを読み取りデータに付加することができる
![Page 5: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/5.jpg)
0 OCRすごい!
0企業発Appにしか搭載されていないのが残念…
0日本語を読んでほしいとは言わないから英語だけでも読めるとすごい
![Page 6: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/6.jpg)
Tesseract-OCR
0フリーの文字認識ライブラリ
0最初はHPが開発していたが今はGoogleが支援・開発を行なっている
0生い立ちなど詳しいことはGoogle先生に聞いてみてね
![Page 7: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/7.jpg)
0ダウンロードは以下のURLから
http://code.google.com/p/tesseract-ocr/
![Page 8: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/8.jpg)
0インストールはWindowsだととても簡単。インストーラがあるので一発インストール
0 Macはmacportに対応しているのでこれまたインストールは簡単
sudo port install tesseract
![Page 9: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/9.jpg)
0 Tesseract-OCRのライブラリはC/C++で書かれている
→Objective-Cでも使うことができる!
但しObj-Cソースコードの拡張子を*.mからObj-C++ソースコードの*.mmに変えなければならない
(obj-C++形式で書いていないソースコードも*.mmに変えておかないとビルドが通らない)
![Page 10: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/10.jpg)
OpenCVと比較して
0 OpenCVでパターンマッチングを行おうと試みたが、実用的な精度が出ず断念
0 IplImageとUIImageの変換を行わなければならない
0 UIImageはRGBAの4チャンネル
0 IplImageはBGRの3チャンネルで扱う
0アプリ内で撮った写真を処理にかけるときは少々面倒である
![Page 11: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/11.jpg)
0カメラ起動ボタンをタップするとカメラが起動
0必要部分をトリミング(自由に切り出せるように改良の余地あり)
0 Useボタンを押すと処理開始
![Page 12: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/12.jpg)
0処理が終わると下に結果が表示される
![Page 13: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/13.jpg)
0メリット0 処理速度がとても速い
0 英数の精度はとても良い
0 日本語も中々精度が高い
0 フリー
0デメリット0 角度を調整してあげないと誤認識が生じる(1→/)
0 数字と英語が混じっている文章では(フォントによって)0(ゼロ)とO(オー)、1とI(アイ)の誤認識が生じる0読み取りたい文章に合わせて言語ライブラリを絞ろう。
![Page 14: Tesseract-OCR in iOS](https://reader034.vdocuments.site/reader034/viewer/2022052504/547534fcb4af9f9d0a8b59d2/html5/thumbnails/14.jpg)
0参考スライド:http://www.slideshare.net/takmin/tesseract-ocr