OCR引擎的Python封装,Pyocr 0.2.2 发布

jopen 11年前

Pyocr是OCR引擎(Tesseract, Cuneiform等)的一个简单Python封装。支持Python 2.7 和 Python 3.x 并且需要Pillow。

import Image  import sys  from pyocr import pyocr    tools = pyocr.get_available_tools()[:]  if len(tools) == 0:      print("No OCR tool found")      sys.exit(1)  print("Using '%s'" % (tools[0].get_name()))  tools[0].image_to_string(Image.open('test.png'), lang='fra',                           builder=TextBuilder())
发布说明: 修正Python 3的支持。增加支持Tesseract on Heroku systems。更改Pyocr模块导入方式(向下兼容)。