Umi-OCR:Windows7和Linux上可免费离线使用的OCR应用!
工具介绍
Umi-OCR 是一款免费、开源的离线OCR软件,主要由作者 hiroi-sora 用业余时间在开发和维护。
Umi-OCR 内置多国语言库,支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚以及二维码的扫描/生成。
适用平台:Windows7 x64 、Linux x64
Umi-OCR 具有以下核心优势和特色功能👇
- 免费:本项目所有代码开源,完全免费
- 方便:解压即用,离线运行,无需网络
- 高效:自带高效率的离线OCR引擎,内置多种语言识别库
- 灵活:支持命令行、HTTP接口等外部调用方式
- 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别
Linux x64 部署
Linux x64 部署教程(可以基于Docker部署)请参考:https://github.com/hiroi-sora/Umi-OCR_runtime_linux
Linux x64 已通过作者测试的系统:
👉 主机部署:Ubuntu 22.04 / Debian 12.5 / Kali 2023.3
👉 Docker 部署:CentOS 7
主机部署
Umi-OCR_Linux_Paddle_2.1.5.tar.xz (264.5MB)
SHA256: 7ff32e5dc818d67171820545100433c86e7e71155f9bad0851fad2ced9588f9b
首次运行请在命令行中执行 ./umi-ocr.sh
,随后可在全局设置中创建桌面/开始菜单快捷方式,便于日常使用。
Docker部署
请按照文档提供的步骤进行:https://github.com/hiroi-sora/Umi-OCR_runtime_linux/blob/main/README-docker.md
Windows7 x64 部署
不同版本仅OCR引擎插件不同,其它功能完全一致,附带多国语言识别库。.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
一、Paddle 引擎插件版
特点:性能好,速度快,占用率高,适合高配机器(不兼容奔腾、赛扬、凌动CPU)
⚠️重要提示:如果执行OCR时报错 0xc0000142、[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.5.7z.exe (128MB)
SHA256: abe00248d6e68dda75029739751ad7258f0ecc14d720b19240a844f5341859b2
二、Rapid 引擎插件版
特点:速度稍慢,内存占用低,适合低配机器,兼容性好
Umi-OCR_Rapid_v2.1.5.7z.exe (98.5MB)
SHA256: 659c55896c32a5e019dc7bde1713d0e5c73186a2c653bed84c4480fa1795b722
更多下载途径: 蓝奏云 | SourceForge | Scoop
比如通过SourceForge,选择Paddle 引擎插件版进行.exe
文件的下载。
功能使用
中文用户可以在应用安装成功之后,在「全局设置」中将默认的英文语言修改为中文。
在「功能页」,我们可以看到应用提供的核心功能。
我们试试截图OCR的效果吧~
截图可以通过拖入和粘贴这两种方式进行导入,我这边选择了一篇wechat公众号文章(谷歌AI掌门人亲述:十年内终结疾病?揭秘99%人不知道的AI革命真相)里带文字的一张图片:
除了最上方花式字体的双引号识别成了“GG”,其他英文识别还是没有问题的。
识别完成后,我们可以全选OCR识别出来的文字内容进行复制。
使用感受分享
不知道是不是我的打开方式不对,虽然简单测试下的效果还不错,但整体使用感受并不不算特别丝滑~总觉得卡卡的,可能是运行的服务器性能不够?
Anyway,作者利用自己的业余时间开发维护这样一个可以本地离线使用的OCR软件并开源分享给大家已经很棒啦~有需要的朋友可以下载尝试看看!