OpenCV MSER detecta áreas de texto - Python

13

Eu tenho uma imagem de fatura e desejo detectar o texto nela. Portanto, planejo usar duas etapas: a primeira é identificar as áreas de texto e, em seguida, usar o OCR para reconhecer o texto.

Estou usando o OpenCV 3.0 em python para isso. Consigo identificar o texto (incluindo algumas áreas sem texto), mas quero também identificar caixas de texto da imagem (excluindo também as áreas sem texto).

Minha imagem de entrada é: easaídaé: e estou usando o código abaixo para isso:

img = cv2.imread('/home/mis/Text_Recognition/bill.jpg')
mser = cv2.MSER_create()
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #Converting to GrayScale
gray_img = img.copy()

regions = mser.detectRegions(gray, None)
hulls = [cv2.convexHull(p.reshape(-1, 1, 2)) for p in regions]
cv2.polylines(gray_img, hulls, 1, (0, 0, 255), 2)
cv2.imwrite('/home/mis/Text_Recognition/amit.jpg', gray_img) #Saving

Agora, desejo identificar as caixas de texto e remover / não identificar quaisquer áreas que não sejam de texto na fatura. Eu sou novo no OpenCV e sou iniciante em Python. Eu posso encontrar alguns exemplos no exemplo MATAB e exemplo de C ++ , mas se eu convertê-los em python, será preciso muito tempo para mim.

Existe algum exemplo com python usando o OpenCV, ou alguém pode me ajudar com isso?

    
por Amit Madan 17.10.2016 в 06:43
fonte

1 resposta

7

Abaixo está o código Importar pacotes

import cv2
import numpy as np

#Create MSER object
mser = cv2.MSER_create()

#Your image path i-e receipt path
img = cv2.imread('/home/rafiullah/PycharmProjects/python-ocr-master/receipts/73.jpg')

#Convert to gray scale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

vis = img.copy()

#detect regions in gray scale image
regions, _ = mser.detectRegions(gray)

hulls = [cv2.convexHull(p.reshape(-1, 1, 2)) for p in regions]

cv2.polylines(vis, hulls, 1, (0, 255, 0))

cv2.imshow('img', vis)

cv2.waitKey(0)

mask = np.zeros((img.shape[0], img.shape[1], 1), dtype=np.uint8)

for contour in hulls:

    cv2.drawContours(mask, [contour], -1, (255, 255, 255), -1)

#this is used to find only text regions, remaining are ignored
text_only = cv2.bitwise_and(img, img, mask=mask)

cv2.imshow("text only", text_only)

cv2.waitKey(0)
    
por RAFI AFRIDI 22.08.2017 / 09:28
fonte