
【Python】3分でOCR環境を立ち上げ Google Colaboratory
2018-07-232 min read
目次
概要
3分くらいでOCRができる環境を立ち上ます。 Google Colaboratoryを使います。もちろんpython。
Google Colaboratory
Jupyter Notebook環境を無償で利用できる上、Google Driveとの連携が可能。 同様な機能を提供するサービスにAzure Notebooksがありますが、 apt・pipコマンドが叩ける点、GPUが用意されている点などから Google Colaboratoryを使っています。
pyocr
PyOcrを動かせる環境を作ります。 tesseractと関連パッケージ + 日本語の特徴量を導入します。 ノートブックでこのコマンドを叩きます。
!apt install tesseract-ocr libtesseract-dev tesseract-ocr-jpn
!pip install pyocr
これでだけで環境が完成
ファイルアップロード
ローカルの画像をノートブックにアップロードします。
from google.colab import files
uploaded = files.upload()
このコマンドを叩くとファイルアップロードのダイアログが出現します。 アップロードした画像は適当な名前をつけて保存します。
OCR実行
OCR自体は
import pyocr
import pyocr.builders
from PIL import Image
img = Image.open('string_sample.png')
txt = tool.image_to_string(
img,
lang="eng+jpn",
builder=pyocr.builders.TextBuilder(tesseract_layout=6)
)
これで実行可能です。 もう少し精度を上げるためにOpenCVで最適化していきます。
import sys
import pyocr
import pyocr.builders
import cv2
from PIL import Image
import matplotlib.pyplot as plt
tools = pyocr.get_available_tools()
im = cv2.imread('text.png')
im_gray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)
im_blur = cv2.GaussianBlur(im_gray, (5, 5), 0)
th1 = cv2.adaptiveThreshold(im_blur, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
txt = tool.image_to_string(
Image.fromarray(im_gray),
lang = 'eng+jpn'
)
print(txt)
参考
Recommends
【Python】3分でOCR環境を立ち上げ Google Colaboratory
2018-07-23
顔のランドマーク検出とドロネー分割 Python + OpenCV + dlib
2018-11-17
顔のランドマークを検出 Python + OpenCV + dlib を使う
2018-10-28
OpenCV.jsを動かしてみる + デモ
2019-06-22
JPG画像を圧縮する OpenCV + Python
2019-01-20
Python + OpenCVで顕著性 (saliecy) マップを実装
2018-12-14
Python + OpenCVのfillConvexPolyで複雑なポリゴンを描画する
2018-11-27
Python+OpenCVで任意の画像領域:ROIのみに処理 マスク画像を使って
2018-11-25
OpenCVのチャンネルエラー対処: (-215:Assertion failed) (m...
2018-11-25
ドロネー図を描画 Python + OpenCV
2018-11-17
Python+OpenCVでstitching パノラマ画像生成をやってみた
2018-09-06
【Python】顔画像をPOST 、 顔検出 、 canvasで顔にお絵かき【JS】
2018-07-11
CentOS8 に Python + OpenCV をインストール
2021-06-05
画像のプーリング処理 canvas + JavaScript
2019-05-19
JavaScriptによる画像処理と便利なライブラリ
2019-01-14
New Posts
Amazon S3 でライフサイクルポリシーを設定する
2022-06-19
AWS Certified Developer Associate に合格した
2022-01-01
Fisher-Yates shuffleで配列シャッフル [js/ts/php]
2022-06-19
JavaScriptでUTF-16コードを文字列に変換
2022-06-18
[JS]乱数でランダムな整数を生成する
2022-06-18
[JS]BigIntでMathが使えない件
2022-06-12
AWS SAPに合格しました
2022-06-11
[AWS]DataSync/Storage Gateway/Transfer Family...
2022-05-29
[AWS CDK]ECS FargateでNestJSで作成したRESTfull APIデ...
2022-05-24
[AWS CDK]S3 CloudFront OAI Route53 構成 で NextJ...
2022-05-23
[CDK]SNS+SQS+DynamoDBでBounceとComplaint情報を収集する...
2022-04-11
[AmazonSES] node.js と ejs を利用してEメールを送信する
2022-04-09
GatsbyからNext.jsへのサイト移行
2022-04-04
[AWS CDK] Lambda で S3 オブジェクトを読み書きするStackの構築
2022-03-18
[AWS CDK] S3 + CloudFrontの構築とOriginAccessIden...
2022-03-09
Hot posts!
Proxy環境下でcurlを実行する
2019-12-07
OpenCVのMatのタイプ一覧表
2018-11-25
Macでも利用できるDBクライアント MySQL PostgreSQL Oracle など
2019-12-21
TablePlusを使ってみる。シンプルでモダンなSQLクライアントツール
2018-09-30
DBクライアントツールはDBeaverをおすすめしたい
2021-03-08
AWS S3のアクセスキーIDとシークレットアクセスキーの取得 作業用ユーザを作成
2019-06-12
AtCoderで初めて色がつくまでの話(茶色) レートが中々上がらなかった原因
2018-11-25
CentOS8でEPELとPowerToolsリポジトリの有効化
2020-11-30
Macでターミナルからポートスキャンを行う方法。
2018-12-09
Python + OpenCVのfillConvexPolyで複雑なポリゴンを描画する
2018-11-27
Date
▶︎
2022 年 (31)
▶︎
2021 年 (40)
▶︎
2020 年 (30)
▶︎
2019 年 (90)
▶︎
2018 年 (89)
▶︎
2017 年 (1)
Tags
Author