当前位置: 首页 > wzjs >正文

西安网站建设 玖佰网络百度员工收入工资表

西安网站建设 玖佰网络,百度员工收入工资表,如何在jsp上做网站页面代码,河北省建设工程招标网简介 pytesseract 库是 Google Tesseract OCR (光学字符识别)引擎的一个 Python 封装库,使用广泛且功能强大。 构建 使用 pytesseract 构建一个简单 OCR demo。 步骤一:安装必要的库 您需要在您的 Python 环境中安装 pytessera…

简介

pytesseract 库是 Google Tesseract OCR (光学字符识别)引擎的一个 Python 封装库,使用广泛且功能强大。

构建

使用 pytesseract 构建一个简单 OCR demo。
步骤一:安装必要的库
您需要在您的 Python 环境中安装 pytesseract、Pillow (用于图像处理) 和 OpenCV (虽然不是必需的,但在处理图像时非常有用)。
打开终端或命令提示符,运行以下命令:

pip install pytesseract Pillow opencv-python

步骤二:安装 Tesseract OCR 引擎
pytesseract 只是一个 Python 接口,它需要后台安装的 Tesseract OCR 引擎才能工作。Tesseract 的安装方法因操作系统而异:
Windows: 您可以从 Tesseract 官方 GitHub release 页面 下载安装程序。安装时请记住安装路径,之后可能需要在代码中指定 Tesseract 的可执行文件路径。
macOS: 使用 Homebrew 进行安装:

    brew install tesseract

中文识别 :如果您需要识别中文,请确保:

  • 已通过 brew install tesseract-lang 安装了中文字体数据。
  • 在调用 image_to_string 时使用 lang=‘chi_sim’ (简体中文) 或 lang=‘chi_tra’ (繁体中文)。

Linux (Ubuntu/Debian): 使用 apt-get 进行安装:

    sudo apt-get install tesseract-ocrsudo apt-get install libtesseract-dev

步骤三:编写 Python 代码
创建一个 Python 文件 (例如 simple_ocr.py) 并粘贴以下代码。

import pytesseract
from PIL import Image
import cv2
import os # 获取当前脚本文件的绝对路径
script_path = os.path.abspath(__file__)
# 获取脚本文件所在的目录
script_dir = os.path.dirname(script_path)# 如果您是Windows用户,并且Tesseract没有添加到系统环境变量中。
# tesseract_cmd_path = r'C:\Program Files\Tesseract-OCR\tesseract.exe' # windows
tesseract_cmd_path = r'/opt/homebrew/bin/tesseract' # macOS/Linux 查询命令:which tesseract # Check if the tesseract executable exists at the specified path
if not os.path.exists(tesseract_cmd_path):print(f"Error: Tesseract executable not found at {tesseract_cmd_path}")print("Please update 'tesseract_cmd_path' in the script to your Tesseract installation path.")
else:pytesseract.pytesseract.tesseract_cmd = tesseract_cmd_path# 指定您要进行OCR的图片文件路径
image_path = 'test_image.png' # 请替换为您的图片文件路径
image_path = os.path.join(script_dir, image_path)
# Check if the image file exists
if not os.path.exists(image_path):print(f"Error: Image file not found at {image_path}")print("Please make sure the image file exists and the path is correct.")
else:try:# 使用 Pillow 加载图片# img = Image.open(image_path)# 或者使用 OpenCV 加载图片,方便后续图像处理img_cv = cv2.imread(image_path)# 如果使用 OpenCV 加载,需要转换为 PIL Image 对象或直接传给 image_to_string (cv2.imread returns numpy array)# pytesseract.image_to_string 可以接受 PIL Image 对象或 numpy array# 我们这里直接使用 numpy arrayimg_np = cv2.cvtColor(img_cv, cv2.COLOR_BGR2RGB) # OpenCV读取是BGR格式,Tesseract通常处理RGB# 使用 pytesseract.image_to_string 进行文字识别# lang 参数可以指定语言,例如 'eng' 表示英语,'chi_sim' 表示简体中文# 您需要安装对应语言的 Tesseract 语言包, macOS/Linux: brew install tesseract-langtext = pytesseract.image_to_string(img_np, lang='chi_sim') # 或者 lang='eng' for English# 打印识别结果print("---- 识别结果 ----")print(text)print("----------------")

步骤四:准备测试图片
创建一个名为 test_image.png 的图片文件,其中包含一些您想要识别的文字,并将其放在与 Python 脚本相同的目录下。
在这里插入图片描述

步骤五:运行代码
在终端或命令提示符中,导航到保存 simple_ocr.py 文件的目录,然后运行:

python simple_ocr.py

如果一切顺利,您将在控制台中看到从图片中识别出的文字。
在这里插入图片描述

注意事项:

Tesseract 安装路径:

  • 如果您在 Windows 上运行,请务必将 tesseract_cmd_path 变量的值修改为您系统中 tesseract.exe 的实际安装路径。
  • 在 macOS 或 Linux 上,如果 Tesseract 已通过包管理器安装并添加到 PATH 中,代码中的默认路径通常是正确的,或者您也可以尝试注释掉设置 pytesseract.pytesseract.tesseract_cmd 的那一行,让 pytesseract 自己去寻找。

语言包:

  • 如果您需要识别非英文字符(例如中文),您还需要安装对应的 Tesseract 语言包,并在 pytesseract.image_to_string 函数中指定 lang 参数,例如 lang=‘chi_sim’。
  • 语言包的安装通常是将对应的 .traineddata 文件放到 Tesseract 安装目录下的 tessdata 文件夹中。

图片质量:

  • OCR 识别效果很大程度上取决于输入图片的质量。清晰、高对比度、文字方向正确的图片更容易识别。
  • 对于有噪声或扭曲的图片,您可能需要使用 OpenCV 等库进行预处理(如二值化、去噪、旋转矫正)来提高识别率。代码中也提供了加载图片并进行颜色空间转换的部分,为可能的预处理留下了空间。

进一步探索 pytesseract 的其他功能

  • 例如 image_to_data 获取文字位置信息、image_to_boxes 获取字符边界框等,以便构建更复杂的 OCR 应用。


文章转载自:

http://oiSSG58L.gqhgL.cn
http://F0NAFT4e.gqhgL.cn
http://xMnvJ4gR.gqhgL.cn
http://u0uQ1ObV.gqhgL.cn
http://QpqwTzlL.gqhgL.cn
http://ElGmxAbj.gqhgL.cn
http://EZU5MIA4.gqhgL.cn
http://4cCXBFhQ.gqhgL.cn
http://oPOJ97v6.gqhgL.cn
http://gzbAX3S8.gqhgL.cn
http://0BQa3nT7.gqhgL.cn
http://MYe1yshu.gqhgL.cn
http://7YYCPdt3.gqhgL.cn
http://183rfWKH.gqhgL.cn
http://OL2T4Kds.gqhgL.cn
http://9sDRvIFl.gqhgL.cn
http://wPD5k7or.gqhgL.cn
http://29mnUZRG.gqhgL.cn
http://DOhLLs4C.gqhgL.cn
http://jS0Be3xW.gqhgL.cn
http://cf1vSgDK.gqhgL.cn
http://qsEU3qDK.gqhgL.cn
http://QAIjTzED.gqhgL.cn
http://61mI7v1v.gqhgL.cn
http://Yirnibn0.gqhgL.cn
http://c6SB8CEf.gqhgL.cn
http://ZcfuGEsf.gqhgL.cn
http://zsqVgPfW.gqhgL.cn
http://QqyRoFfX.gqhgL.cn
http://UzwwPZ2J.gqhgL.cn
http://www.dtcms.com/wzjs/616013.html

相关文章:

  • 深圳鼎诚网站建设济南网络公司排行榜
  • 做简单网站用什么软件有没有网站找人帮忙做图
  • 西宁做网站长沙网站搭建公司联系方式
  • 做网站 服务器个人博客网站设计
  • 网页的网站建设在哪里萍乡做网站
  • 中山手机网站设计网站建设公司要多少钱
  • 建设软件资源网站北京做网站好的网站建设公司
  • 网站要怎么盈利一个网站能卖多少钱?
  • 徐州营销型网站建设安康网站开发
  • 如何做一网站首页石家庄做外贸的网站建设
  • 品牌网站建设黑白I狼J做亚马逊和淘宝网站
  • wordpress 双栏主题网站关键词排名手机优化软件
  • 牡丹江做网站的公司天助可以搜索别人网站
  • 行业资讯网站源码电商系统的服务商
  • 营销型网站建设策划书万网董事长是谁
  • 网站制作公司官网首页外贸公司网站建设
  • 营销网站建设培训做网站需要编程吗
  • 网站优化要做哪些工作网站排名配色
  • 中小企业网站用什么技术如何建设股权众筹网站
  • 电子商务网站开发的流程图网站模板下载百度云链接怎么做
  • 大连市城乡建设档案馆网站大型网页设计服务公司
  • 摄影作品发布平台更新网站 seo
  • 商业空间设计案例商用营销型网站建设优化建站
  • 网站建立策划书无印良品官方网络商城
  • 呼和浩特网站建设价格深圳和胜建设公司
  • 中国石油工程建设有限公司网站网站上职业学校排名 该怎么做
  • 开发制作小程序公司seo企业顾问
  • 苏州企业建站系统菏泽百度网站建设
  • 廊坊网站推广外包网站怎么做浏览量才会多
  • dede织梦做的网站 栏目页有切换js 怎么循环子栏目 调子栏目青岛建站软件