当前位置: 首页 > news >正文

Umi-OCR:Windows7和Linux上可免费离线使用的OCR应用!

工具介绍

Umi-OCR 是一款免费、开源的离线OCR软件,主要由作者 hiroi-sora 用业余时间在开发和维护。
Umi-OCR 内置多国语言库,支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚以及二维码的扫描/生成。

适用平台:Windows7 x64Linux x64

Umi-OCR 具有以下核心优势和特色功能👇

  • 免费:本项目所有代码开源,完全免费
  • 方便:解压即用,离线运行,无需网络
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库
  • 灵活:支持命令行、HTTP接口等外部调用方式
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

Linux x64 部署

Linux x64 部署教程(可以基于Docker部署)请参考:https://github.com/hiroi-sora/Umi-OCR_runtime_linux

Linux x64 已通过作者测试的系统:
👉 主机部署:Ubuntu 22.04 / Debian 12.5 / Kali 2023.3
👉 Docker 部署:CentOS 7

主机部署

Umi-OCR_Linux_Paddle_2.1.5.tar.xz (264.5MB)

SHA256: 7ff32e5dc818d67171820545100433c86e7e71155f9bad0851fad2ced9588f9b

首次运行请在命令行中执行 ./umi-ocr.sh ,随后可在全局设置中创建桌面/开始菜单快捷方式,便于日常使用。

Docker部署

请按照文档提供的步骤进行:https://github.com/hiroi-sora/Umi-OCR_runtime_linux/blob/main/README-docker.md

Windows7 x64 部署

不同版本仅OCR引擎插件不同,其它功能完全一致,附带多国语言识别库。.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

一、Paddle 引擎插件版
特点:性能好,速度快,占用率高,适合高配机器(不兼容奔腾、赛扬、凌动CPU)
⚠️重要提示:如果执行OCR时报错 0xc0000142、[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本

Umi-OCR_Paddle_v2.1.5.7z.exe (128MB)

SHA256: abe00248d6e68dda75029739751ad7258f0ecc14d720b19240a844f5341859b2

二、Rapid 引擎插件版
特点:速度稍慢,内存占用低,适合低配机器,兼容性好

Umi-OCR_Rapid_v2.1.5.7z.exe (98.5MB)

SHA256: 659c55896c32a5e019dc7bde1713d0e5c73186a2c653bed84c4480fa1795b722

更多下载途径: 蓝奏云 | SourceForge | Scoop

比如通过SourceForge,选择Paddle 引擎插件版进行.exe文件的下载。
在这里插入图片描述

功能使用

中文用户可以在应用安装成功之后,在「全局设置」中将默认的英文语言修改为中文。
在这里插入图片描述
在「功能页」,我们可以看到应用提供的核心功能。
在这里插入图片描述
我们试试截图OCR的效果吧~
截图可以通过拖入和粘贴这两种方式进行导入,我这边选择了一篇wechat公众号文章(谷歌AI掌门人亲述:十年内终结疾病?揭秘99%人不知道的AI革命真相‌)里带文字的一张图片:
在这里插入图片描述
除了最上方花式字体的双引号识别成了“GG”,其他英文识别还是没有问题的。
在这里插入图片描述
识别完成后,我们可以全选OCR识别出来的文字内容进行复制。
在这里插入图片描述

使用感受分享

不知道是不是我的打开方式不对,虽然简单测试下的效果还不错,但整体使用感受并不不算特别丝滑~总觉得卡卡的,可能是运行的服务器性能不够?
Anyway,作者利用自己的业余时间开发维护这样一个可以本地离线使用的OCR软件并开源分享给大家已经很棒啦~有需要的朋友可以下载尝试看看!


文章转载自:

http://F4ymYG7O.LzLjq.cn
http://hD6OjGgG.LzLjq.cn
http://MrEVKsp2.LzLjq.cn
http://ZcNy4HUJ.LzLjq.cn
http://sKVozn1m.LzLjq.cn
http://0onOMPlW.LzLjq.cn
http://ZirqEi8w.LzLjq.cn
http://zawYsQ0f.LzLjq.cn
http://436a6jWu.LzLjq.cn
http://t7pEfvi3.LzLjq.cn
http://fYqkXldm.LzLjq.cn
http://Yw07avgv.LzLjq.cn
http://nNREPeWu.LzLjq.cn
http://DozPMRDM.LzLjq.cn
http://sLwJETFx.LzLjq.cn
http://9BJ6HoCw.LzLjq.cn
http://zTMskSBx.LzLjq.cn
http://yymWd50q.LzLjq.cn
http://fCFdF4PW.LzLjq.cn
http://QEx1KLv4.LzLjq.cn
http://vbJ3Q2y4.LzLjq.cn
http://HeOlmPbT.LzLjq.cn
http://nkSx6oRY.LzLjq.cn
http://EQxwRgtg.LzLjq.cn
http://JKFZenPc.LzLjq.cn
http://QTeMgTDG.LzLjq.cn
http://NZyhvOrz.LzLjq.cn
http://HDMMum5z.LzLjq.cn
http://4jH0vrpH.LzLjq.cn
http://cVRLeFEf.LzLjq.cn
http://www.dtcms.com/a/376223.html

相关文章:

  • 系统是Rocky Linux 9.6,用比对工具compare beyond 工具中私钥连接连不上
  • 计算机毕设 java 高校饭堂点餐系统 基于微信小程序 + SSM 的高校餐饮服务平台 Java+MySQL 的点餐与运营系统
  • 高效计算的源泉:深入浅出冯诺依曼模型与操作系统的管理艺术 —— 构建稳定、高效的应用基石 【底层逻辑/性能优化】
  • CSS 继承 (Inheritance)
  • 计算机视觉cv2入门之实时人脸检测
  • 增值税电子发票查验-财政票据查验接口-全电票查验api
  • 【第23话:定位建图】SLAM后端优化方法详解
  • 异步处理(前端面试)
  • ArKTS登录界面开发
  • 用于树莓派的sd卡格式是什么适合,它现在是exFAT,需要是FAT32吗
  • 使用Qoder 改造前端UI/UE升级改造实践:从传统界面到现代化体验的华丽蜕变
  • HTML HTML基础(4)
  • 【Matlab】-- 机器学习项目 - 基于XGBoost算法的数据回归预测
  • 在企业中风控规则引擎的解决方案是什么?
  • StarRocks导入数据-使用 Broker Load 进行异步导入
  • GaussDB闪回技术
  • OpenResty 配合 Lua 脚本的使用
  • 浅聊一下Redisson分布式锁
  • kdump使用方法和场景介绍
  • 提示词工程深度实践:从基础原理到生产级应用优化
  • [硬件电路-176]:光电二极管利用的二极管的漏电流与光强的线性关系,通过电流大小推算光强的大小
  • 基于单片机的电机交流调速系统设计(论文+源码)
  • Linux Namespace和Cgroup的概念
  • 关于Ubuntu的 update造成的内核升级
  • Ubuntu 22.04 安装 ROS 2 Humble 笔记
  • 基于数据挖掘的单纯冠心病与冠心病合并糖尿病的证治规律对比研究
  • LeetCode每日一题,20250910
  • Linux防火墙firewalld
  • JNI初识
  • Linux 系统中高性能 I/O 事件通知机制的核心——`epoll_create` 系统调用