当前位置: 首页 > news >正文

MinerU2.5 windows 本地部署

一、环境准备

1. 检查系统环境
  • 无需检查CUDA和GPU(CPU版本无需NVIDIA显卡),直接进行下一步。
2. 创建并激活虚拟环境
# 方案一:默认路径创建Python 3.10环境
conda create -n mineru python=3.10  # 创建环境
conda activate mineru               # 激活环境(命令行前出现"(mineru)"即为成功)# 方案二:自定义路径(适合C盘空间不足)
conda create --prefix=自定义路径\mineru python=3.10  # 替换为实际路径
conda activate 自定义路径\mineru

二、安装MinerU CPU版本

  1. 安装包管理工具:

    pip install uv
    
  2. 清理可能的旧版本(防止冲突):

    pip uninstall mineru -y
    
  3. 安装MinerU核心组件:

    uv pip install -U "mineru[core]" -i https://mirrors.aliyun.com/pypi/simple
    
  4. 安装CPU版本的PyTorch(无需CUDA支持):

    pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cpu
    

三、验证安装

执行以下命令,能正常输出版本和帮助信息即安装成功:

mineru --version  # 查看版本
mineru --help     # 查看帮助

四、下载模型文件

自动下载所需模型(约8-12GB,首次下载耗时较长,失败可重试):

mineru-models-download --model_type all

五、功能测试(CPU模式)

1. 准备测试文件
mkdir test_pdfs    # 创建测试文件目录(存放PDF)
mkdir test_output  # 创建输出目录

将待测试的PDF文件放入test_pdfs目录。

2. 执行测试(CPU专用命令)
  • 快速模式(推荐)
    mineru -p ./test_pdfs/your_file.pdf -o ./test_output/ --backend pipeline --device cpu
    
  • 高精度模式
    mineru -p ./test_pdfs/your_file.pdf -o ./test_output/ --backend vlm-transformers --device cpu
    
  • 批量处理
    mineru -p ./test_pdfs/ -o ./test_output/ --backend pipeline --batch-size 4 --device cpu
    

六、启动Web界面

  1. 确保已激活环境:conda activate mineru
  2. 启动Web服务(默认端口8080):
    mineru-gradio --server-port 8080
    
  3. 浏览器访问:http://localhost:8080 即可使用图形界面上传PDF解析。

注意事项

  • 每次使用前需通过conda activate mineru激活环境。
  • CPU版本速度较慢,大文件建议优先使用--backend pipeline(快速模式)。
  • 若端口被占用,可更换端口(例如mineru-gradio --server-port 7860)。
http://www.dtcms.com/a/464756.html

相关文章:

  • UIkit中使用新版UICollectionViewCompositionalLayout进行复杂布局(二)
  • 网站建设的技术问题苏州吴江建设局招标网站
  • 河南省村镇建设处网站网站配色与布局 教材
  • Prometheus运维之路(ES监控接入)
  • OpenAMP专题(一):一文了解OpenAMP全貌
  • C++ 中 rfind 方法详解
  • SpringBoot 教程(十四) SpringBoot之集成 Redis(优化版)
  • 【Linux】线程同步与互斥(上)
  • 图观 模型编辑器
  • Win11 输入延迟与鼠标卡顿:系统化排查与优化指南
  • 【开题答辩全过程】以 爱运动健身小程序的设计与实现为例,包含答辩的问题和答案
  • Linux 内核IIO sensor驱动
  • 《Linux系统编程之入门基础》【Linux的前世今生】
  • 活动汪活动策划网站龙岗建设网站
  • Apache IoTDB 架构特性与 Prometheus+Grafana 监控体系部署实践
  • LLM时代基于unstructured解析非结构化pdf
  • uniapp tab切换及tab锚点效果(wx小程序及H5端)
  • Hadoop面试题及详细答案 110题 (71-85)-- 集群部署与运维
  • 5-1〔OSCP ◈ 研记〕❘ SQL注入攻击▸SQL注入理论基础
  • 南充市企业网站建设wordpress极客主题
  • 企业做小红书关键词搜索排名推广时,怎么找到小红书上有一定搜索量但竞争度低的蓝海词?
  • 数据仓库与数据挖掘基础知识
  • 鸿蒙:使用Rating组件实现五角星打分评价
  • 外国人可以在中国做网站吗做个网站得花多少钱
  • 双均线策略
  • 【vLLM 学习】Neuron
  • 网站做行业认证好处施工企业在施工过程中发现工程设计图纸存在差错的
  • 迅为RK3576开发板挂载Windows以及虚拟机Ubuntu测试
  • 第1篇:创建基础电商AI客服
  • 【MyBatis从入门到入土】告别JDBC原始时代:零基础MyBatis极速上手指南