当前位置: 首页 > wzjs >正文

品牌广告公司网站建设视频建设网站

品牌广告公司网站建设,视频建设网站,珠峰网站建设,宁波网站排名优化MinerU MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发…

MinerU

MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。 相比国内外知名商用产品MinerU还很年轻,如果遇到问题或者结果不及预期请到issue提交问题,同时附上相关PDF

创建一键部署mineru 自动化脚本

  • 以下测试是在CPU模式下进行
  • 以下测试是在Ubuntu 22.04 ,以下自动化脚本支持其它系统 Centos/Redhaht/RockyLinux/AlmaLinux/OracleLinux 8,9,10,ubuntu(20,22,24),debian(11,12)
  • mineru 安装参考官网
  • conda 国内下载 官网下载
  • magic-pdf 命令使用参考
vim /root/MinerU_install.bash
#!/bin/bash
# -*- coding: utf-8 -*-
# Author: CIASM
# update 2025/02/20# 系统支持 Centos/Redhaht/RockyLinux/AlmaLinux/OracleLinux 8,9,10,ubuntu(20,22,24),debian(11,12)# install minerU 参考
# https://mineru.readthedocs.io/zh-cn/latest/user_guide/install/install.html#id3# magic-pdf 使用参考
#https://mineru.readthedocs.io/zh-cn/latest/user_guide/quick_start/command_line.htmlconda_prefix=/root/anaconda3install_basics() {# Check if the script is being run as root
if [ "$(id -u)" != "0" ]; thenecho "This script must be run as root."exit 1
fiif [[ -f /etc/os-release ]]; thenOS=$(cat /etc/*release* | grep "^ID=" | cut -d'=' -f2- | tr -d '"')VERSION=$(awk -F= '/VERSION_ID/{print $2}' /etc/os-release | tr -d '"') #VERSION=$( grep -oE 'VERSION_ID="[^"]+"' /etc/os-release | cut -d'"' -f2)  elseecho -e "\033[31mThis script only supports $OS $VERSION...\033[0m"exit 1
fi# Check the mineru version
if ! [ -d "$conda_prefix" ]; thenecho -e "\033[32m Installing mineru for $OS $VERSION...\033[0m"case $VERSION in# CentOS/RedHat/oracle/RockLinux/AlmaLinux 8 install 8|8.1|8.2|8.3|8.4|8.5|8.6|8.7|8.8|8.9|8.10)echo Installing basics...yum install -y http://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpmyum install -y net-tools wget curlyum install -y mesa-libGL# install mineruinstall_mineru;;# CentOS/RedHat/oracle/RockLinux/AlmaLinux 9 install9.0|9.1|9.2|9.3|9.4|9.5|9.6|9.7|9.8|9.9|9.10) echo Installing basics...yum install -y http://dl.fedoraproject.org/pub/epel/epel-release-latest-9.noarch.rpmyum install -y net-tools wget curlyum install -y mesa-libGL# install mineruinstall_mineru;;# CentOS/RedHat/oracle/RockLinux/AlmaLinux 10 install10.0|10.1|10.2|10.2|10.3|10.4|10.5|10.6|10.7|10.8|10.9|10.10)  echo Installing basics...yum install -y http://dl.fedoraproject.org/pub/epel/epel-release-latest-10.noarch.rpmyum install -y net-tools wget curlyum install -y mesa-libGL# install mineruinstall_mineru;;# openEuler 20,22,23,24 Linux install20.03|22.03|23.03|24.03) echo "add epel repo"openEuler_epel_repoecho Installing basics...yum install -y net-tools wget curlyum install -y mesa-libGL# install mineruinstall_mineru;;# ubuntu 20,21,22,23,24 Linux install20.04|21.04|22.04|23.04|24.04)echo Installing basics...apt updateecho "Pop-up block"sed -i '$ a\export DEBIAN_FRONTEND=noninteractive' /etc/profilesource /etc/profileecho "install libgl1-mesa-glx"apt-get updateapt-get install -y libgl1-mesa-glx# install mineruinstall_mineru;;# Debian 10,11.1210|11|12)echo Installing basics...apt updateecho "Pop-up block"sed -i '$ a\export DEBIAN_FRONTEND=noninteractive' /etc/profilesource /etc/profileecho "install libgl1-mesa-glx"apt-get updateapt-get install -y libgl1-mesa-glx# install mineruinstall_mineru;;*)echo -e "\033[31m Unsupported $OS $VERSION...\033[0m" exit 1;;
esacecho -e "\033[32m mineru for $OS $VERSION successfully installed...\033[0m"
elseecho -e "\033[33m mineru for $OS $VERSION already installed...\033[0m"
fi}# Obtain the system version number
VERSION_ID=$(cat /etc/os-release | grep "^VERSION_ID=" | cut -d'=' -f2 | tr -d '"')# openEuler 20.03 22.03 23.03 24.03 add epel 8,9
openEuler_epel_repo (){if [[ $VERSION_ID =~ ^2[2-4]\.03$ ]]; thenrepo_version=9
elif [[ $VERSION_ID == 20.03 ]]; thenrepo_version=8
fiecho "openEuler add epel repo"
cat <<EOF>>/etc/yum.repos.d/epel.repo
[epel]
name=epel
baseurl=https://dl.fedoraproject.org/pub/epel/${repo_version}/Everything/x86_64/
enabled=1
gpgcheck=0
priority=1
EOF
}# install mineru
install_mineru (){echo "install anaconda"
wget -N -P /root/ -U NoSuchBrowser/1.0 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2024.06-1-Linux-x86_64.sh
bash /root/Anaconda3-2024.06-1-Linux-x86_64.sh -b -p /root/anaconda3
echo 'export PATH=/root/anaconda3/bin:$PATH' >>  ~/.bashrc
echo 'export PATH=/root/anaconda3/etc/profile.d:$PATH' >>  ~/.bashrc
source ~/.bashrcecho "install python3.10 MinerU"
conda create -n MinerU python=3.10 -y
source /root/anaconda3/etc/profile.d/conda.sh
conda activate MinerU
pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com -i https://mirrors.aliyun.com/pypi/simpleecho "Download the model weight file"
pip install modelscope
wget https://gitee.com/myhloli/MinerU/raw/master/scripts/download_models.py -O download_models.py
python download_models.py#echo "Download the model weight file"
#pip install huggingface_hub
#wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/scripts/download_models_hf.py -O download_models_hf.py
#python download_models_hf.py
#!echo "test magic-pdf"
source /root/anaconda3/etc/profile.d/conda.sh
conda activate MinerU# 安装完成后进行转换使用
#magic-pdf -p '/root/test.pdf' -o '/root/output' -m auto
}main (){install_basics
}main

执行一键部署mineru

  • 大概需要70分钟左右,实际需要看自己的网络了
bash /root/MinerU_install.bash

magic-pdf 转换

  • magic-pdf 命令参考
  • Xmanager Power Suite 8.0.0005连接工具
source /root/anaconda3/etc/profile.d/conda.sh
conda activate MinerU
magic-pdf -p '/root/test.pdf' -o '/root/output' -m auto

正在转换

转换完成,实际时间根据自己的硬件情况


文章转载自:

http://sHybVXna.ksqyj.cn
http://MtV3bXvG.ksqyj.cn
http://DPCTPPnG.ksqyj.cn
http://MqGyQVZV.ksqyj.cn
http://IRl9MzB7.ksqyj.cn
http://b5TPaEOr.ksqyj.cn
http://KIDcvitX.ksqyj.cn
http://V23jxOaD.ksqyj.cn
http://mWlPh4z2.ksqyj.cn
http://tNM4XC45.ksqyj.cn
http://73Z5BsNb.ksqyj.cn
http://e8vnRRak.ksqyj.cn
http://aaTdweJB.ksqyj.cn
http://TiWZc23q.ksqyj.cn
http://gZaNzME9.ksqyj.cn
http://Y9N6lEeh.ksqyj.cn
http://yx0PnEsH.ksqyj.cn
http://3E6Kd9cc.ksqyj.cn
http://2TrlOquU.ksqyj.cn
http://WnE71q0z.ksqyj.cn
http://Yjz5poKM.ksqyj.cn
http://kgzhBAIL.ksqyj.cn
http://JF036Vdr.ksqyj.cn
http://ZLK1rYWX.ksqyj.cn
http://qHObWEMO.ksqyj.cn
http://jHaKzEDu.ksqyj.cn
http://BTiqO1vU.ksqyj.cn
http://QbNR3pem.ksqyj.cn
http://y6HCUrws.ksqyj.cn
http://b4CbcBPW.ksqyj.cn
http://www.dtcms.com/wzjs/625037.html

相关文章:

  • 静态网站开发实训的目的建设网站相关法律条文
  • 人才引进从事网站建设荔枝视频在线观看高清完整版
  • 临河网站建设asp网站后台失效
  • 环境设计案例网站网站开发报价
  • 阿里巴巴国际站运营福建seo快速排名优化
  • 2个小时学会网站建设兼职做彩平网站
  • 会员网站建设公司内部网站怎么制作
  • 网站seo优化是什么wordpress ip验证不当
  • 网站导航你一定会回来感谢我的wordpress 迁移 404
  • 杭州培训网站建设网站开发业务
  • 婚庆公司网站模板大连网站网站建设
  • qq相册怎么制作网站制作网页时经常使用什么对网页的布局进行控制
  • 爱站官网河北网站备案注销
  • 先做网站还是app什么是网络营销方案
  • 腾云建站官网小程序设计用什么软件
  • 网站建设模板案例响应式惠州网站建设开发团队
  • 干净简约高端的网站网站建设书模板
  • 查公司信息的网站产品ui设计公司
  • 设计在线看网站换域名seo
  • ui在线设计网站网课平台搭建
  • 优设网站怎么下载失败营销案例100例
  • 视频网站做板块栏目wordpress 批量设置标签
  • 海口网站开发师招聘太原怎样优化网站建设
  • 广西金兰工程建设管理有限公司网站企业高端wordpress主题
  • 网站站内链接怎么做电脑网站转手机版
  • 工控主机做网站服务器百度推广开户代理
  • 金融营销的网站设计案例湖南建筑公司网站
  • 网站设计联系广东粤建设计院网站
  • ui图标素材网站如何自己设置网站
  • 单页网站案例分析wordpress 分类小工具