当前位置: 首页 > wzjs >正文

打开百度一下网页版宁波关键词优化排名工具

打开百度一下网页版,宁波关键词优化排名工具,东莞网络营销推广专业,山东金泰建设有限公司网站文章目录 摘要1、安装Tesseract-OCR2、在python中使用安装依赖 3、本地图片识别4、结合playwright动态识别网站验证码 摘要 python中使用pytesseract库进行ocr识别,需要安装Tesseract-OCR,通过指定pytesseract.tesseract_cmd路径,可以将esser…

文章目录

    • 摘要
    • 1、安装Tesseract-OCR
    • 2、在python中使用
      • 安装依赖
    • 3、本地图片识别
    • 4、结合playwright动态识别网站验证码

摘要

  python中使用pytesseract库进行ocr识别,需要安装Tesseract-OCR,通过指定pytesseract.tesseract_cmd路径,可以将esseract-OCR集成到pytho程序中,避免客户端电脑的依赖。

1、安装Tesseract-OCR

Tesseract是一个高度精确的开源OCR(光学字符识别)系统,广泛应用于文本识别项目中。

  • 下载地址:
    https://digi.bib.uni-mannheim.de/tesseract/
    选择最新的稳定版下载
  • 安装程序:下载后安装程序
  • 中文包下载:
    地址:https://gitcode.com/open-source-toolkit/90e2f
    下载了最新版本的chi-sim.traineddata文件,复制到Tesseract的tessdata目录下
    通常,路径类似于C:\Program Files\tesseract\tessdata(Windows)
    或 /usr/share/tesseract-ocr/4.00/tessdata(Linux)。

2、在python中使用

  • 安装依赖

pip install pytesseract

3、本地图片识别

import pytesseract
from PIL import Image# 获取文件的绝对路径
def get_abspath(filename):try:current_dir = os.getcwd()filename = os.path.normpath(os.path.join(current_dir, filename))# print(f"get_abspath文件路径:{filename}")return filenameexcept Exception as e:print(f"获取文件绝对路径时出现错误: {e}")return ""# 手动指定路径(Windows常见) Tesseract 系统路径
driver_path = r"Tesseract-OCR\\tesseract.exe"
pytesseract.pytesseract.tesseract_cmd = get_abspath(driver_path)#使用示例
if __name__ == "__main__":# 1 识别本地图片 # 英文识别current_dir = os.getcwd()filename = os.path.normpath(os.path.join(current_dir, f"code.jpg"))file = Image.open(filename)text = pytesseract.image_to_string(file, lang="eng")print(text)#中文识别,需要下载语言包filename = os.path.normpath(os.path.join(current_dir, f"sushi.png"))file = Image.open(filename)text = pytesseract.image_to_string(file, lang='chi_sim') print(f"识别结果:{text}")

识别结果示例:
在这里插入图片描述

4、结合playwright动态识别网站验证码

import os
import pytesseract
from PIL import Image
from playwright.sync_api import Playwright
import tools.pwHander as pwHander
from PIL import Image# 获取文件的绝对路径
def get_abspath(filename):try:current_dir = os.getcwd()filename = os.path.normpath(os.path.join(current_dir, filename))# print(f"get_abspath文件路径:{filename}")return filenameexcept Exception as e:print(f"获取文件绝对路径时出现错误: {e}")return ""# 手动指定路径(Windows常见) Tesseract 系统路径
driver_path = r"Tesseract-OCR\\tesseract.exe"
pytesseract.pytesseract.tesseract_cmd = get_abspath(driver_path)# 验证码图片识别
def get_captcha(page: Playwright, element_selector="img#captcha", file_name="code.jpg"):try:current_dir = os.getcwd()filename = os.path.normpath(os.path.join(current_dir, f"{file_name}"))# 通过class选择器获取img元素code_img = page.locator(element_selector)if not code_img:raise ValueError("验证码元素未找到!")# 刷新验证码# code_img.click()# 下载验证码图片code_img.screenshot(path=filename)file = Image.open(filename)text = pytesseract.image_to_string(file, lang="eng")print("验证码识别结果:", text)return text.strip()except Exception as e:print(f"获取验证码 失败:{str(e)}")return ""
#使用示例
if __name__ == "__main__":# 2 动态识别网站验证码with sync_playwright() as p:browser = p.chromium.launch(headless=False, slow_mo=1000)context = browser.new_context()page = context.new_page()page.goto("测试网址")# 验证码图片下载imgText = get_captcha(page, "img#jcaptcha")print(f"验证码:{imgTest}")

文章转载自:

http://yZdfjtCD.yxnfd.cn
http://T3UDjBiT.yxnfd.cn
http://oDuWY7vz.yxnfd.cn
http://HZDoqNLw.yxnfd.cn
http://ffb4VrJV.yxnfd.cn
http://KBidTfgb.yxnfd.cn
http://OuikagPa.yxnfd.cn
http://6AyGxr9A.yxnfd.cn
http://wZ5O5mXn.yxnfd.cn
http://KGSI8mVh.yxnfd.cn
http://fMZPGjbU.yxnfd.cn
http://OLMFmEVJ.yxnfd.cn
http://43Fv5gtl.yxnfd.cn
http://g6MSqHrb.yxnfd.cn
http://BcujUQtr.yxnfd.cn
http://TJ0Fv1Mx.yxnfd.cn
http://o0vz6eAQ.yxnfd.cn
http://XyZ6OO4K.yxnfd.cn
http://F0AtwCbz.yxnfd.cn
http://wkSfljVa.yxnfd.cn
http://GY9zCIgU.yxnfd.cn
http://0P4vu20f.yxnfd.cn
http://otKnHQFn.yxnfd.cn
http://bbJ0aJYO.yxnfd.cn
http://09AmdgBj.yxnfd.cn
http://fetCS2Xe.yxnfd.cn
http://HMKwobz5.yxnfd.cn
http://wd71lyn8.yxnfd.cn
http://98nhp5LD.yxnfd.cn
http://bY0coaHT.yxnfd.cn
http://www.dtcms.com/wzjs/653885.html

相关文章:

  • 宁波模板建站定制wordpress显示pdf
  • 北京欢迎你网站制作公司电商网站代码模板
  • 青岛网站建设 青岛博采网络绥化市新闻最新消息
  • 大型网站开发团队网络公司排行国内
  • 网站空间知识建设网站免费模板下载
  • 鼎维重庆网站建设专家低代码开发技术
  • 网站 微信开发工作技巧与工作方法
  • 佛山网站建设明细深圳高端网站定制建设
  • 怎样在阿里云做网站xp系统建设网站
  • 在百度上注册公司网站要多少钱wcm 可以做网站吗
  • 南京网站建设优化网站开发用什么开发
  • 佛山制作网站公司吗工商系统企业信用信息查询
  • 石家庄网站建设费用做哪个网站有效果
  • l临沂建设工程信息网站本地wordpress上传图片无法显示
  • 小型公司网络搭建西安百度网站排名优化
  • 网站建设单词wordpress 评论去审核
  • 专业网站建设技术网站建设运营知乎
  • 一分钟用自己的电脑做网站全球速卖通网址
  • 提卡网站要怎么做做电商网站前端用什么框架
  • 不建网站如何做淘宝客ppt的制作方法
  • 做音乐的网站企业年报查询官网入口
  • 长沙网站建设 鼎誉网站开发环境是什么
  • 辽阳专业建设网站ui设计师零基础学什么
  • 自动获取网站缩略图感觉做的比较好的健身网站
  • 珠海企业网站建设费用在线直播系统开发
  • 重庆公司专业建站甘肃兰州海拔多少米
  • 南京电信网站空间扩容WordPress免费问答主题
  • 网站备案号查询平台简单的网页设计论文
  • php网站识别手机网站规划与建设论文
  • 铜川公司做网站蓬莱做网站联系电话