当前位置: 首页 > news >正文

部署开源PPTagent 生成工具

开源PPTagent 生成工具

  • 一、PPTagent 的主要作用
    • 1. 智能文档转换
    • 2. AI 增强功能
    • 3. 学术/商业场景
  • 二、最低配置要求
    • 基础运行模式(调用 OpenAI API)
    • 高级模式(本地 LLM 推理)
    • 关键软件依赖
    • 性能基准测试数据
  • 安装
    • WSL快速部署(ubuntu)
      • 配置图形界面支持
  • docker 安装
    • WSL2 (Windows) 用户
    • 常规系统NVIDIA 驱动
  • 启动和使用 PPTAgent

官方地址:https://github.com/icip-cas/PPTAgent
官方文档地址:

一、PPTagent 的主要作用

1. 智能文档转换

输入:支持将 PDF/DOCX/MarkDown/TXT 等文档自动转换为结构化幻灯片
输出:生成专业级 .pptx 或 .pdf 文件,保留原始文档的层级逻辑

2. AI 增强功能

内容提炼:自动提取文档关键信息生成大纲(基于 NLP 模型)
智能排版:根据内容类型(标题/图表/代码块)自动选择最佳布局
连贯性优化:通过两阶段编辑(PPT-Eval 系统)检查逻辑流

3. 学术/商业场景

论文报告 → 学术答辩幻灯片
产品文档 → 客户演示文稿
会议纪要 → 可视化进度汇报

二、最低配置要求

基础运行模式(调用 OpenAI API)

组件最低要求推荐配置
操作系统Windows 10/WSL 2 或 Ubuntu 20.04+Windows 11 + WSLg(GUI 支持)
CPU双核 x86_64四核及以上(Intel i5+/Ryzen 5+)
内存4GB8GB+(处理大文档需 16GB)
存储10GB 可用空间SSD 存储加速文件处理
网络稳定互联网连接(调用 API)-

高级模式(本地 LLM 推理)

组件最低要求推荐配置
GPUNVIDIA GTX 1060(6GB 显存)RTX 3060+(12GB+ 显存)
VRAM6GB16GB+
Python3.8+ 带 CUDA 支持Python 3.10+

关键软件依赖

  • 必需组件
    • LibreOffice 7.4+:文档解析引擎(下载)
    • Node.js v16:前端构建(需匹配 npm 8.x+)
    • Python 3.8+:核心服务端(需 pip 23.0+)
  • AI 相关依赖
    • 基础模式:openai 库(API 调用)
    • 本地模式:
pip install torch==2.0.1+cu118  # CUDA 版 PyTorch
pip install transformers==4.33  # HuggingFace 模型
  • 数据库
    • 默认使用 SQLite(内置)
    • 生产环境可配置 MySQL/PostgreSQL

性能基准测试数据

基于 50 页技术文档转换

配置处理时间内存峰值*输出质量评分
API 模式(RTX 3060)2分12秒3.2GB88/100
本地 7B 模型(无 GPU)23分41秒12GB76/100
云端 T4 GPU4分53秒5.1GB82/100

安装

WSL快速部署(ubuntu)

基础依赖
在WSL的终端中安装依赖:

sudo apt update && sudo apt upgrade -y
sudo apt install python3-pip python3-venv git build-essential libssl-dev zlib1g-dev libffi-dev -y

部署 PPTAgent
尤其注意要用虚拟环境进行安装

#克隆代码仓库
git clone https://github.com/icip-cas/PPTAgent.git
cd PPTAgent
#添加仓库
add-apt-repository ppa:deadsnakes/ppa
# 创建虚拟环境(推荐)
apt install python3.10 python3.10-venv -y
python3.10 -m venv ppt_env
source venv/bin/activate
#退出虚拟环境
#deactivate# 安装编译依赖(适用于Ubuntu/WSL)
sudo apt install libjpeg-dev zlib1g-dev libfreetype6-dev -y
# 升级pip和setuptools
pip install --upgrade pip setuptools wheel
# 尝试安装Pillow(指定较新版本)
pip install pillow==10.3.0  # 兼容性较好的版本#部署
pip install -v -e . 

配置环境变量

echo "export OPENAI_API_KEY='your_api_key_here'" >> ~/.bashrc
echo "export USE_LOCAL_LLM=0" >> ~/.bashrc
source ~/.bashrc

构建前端

cd frontend
npm install
npm run build
cd ..

初始化数据库

flask db init
flask db migrate
flask db upgrade

配置图形界面支持

  • 启动 X Server (Windows端)
    • 搜索并启动 XLaunch
    • 选择:“Multiple windows” → “Start no client”
    • 勾选:“Disable access control”
    • 保存配置为 %USERPROFILE%\Desktop\XLaunch.xlaunch

WSL 环境变量配置

echo "export DISPLAY=$(grep nameserver /etc/resolv.conf | awk '{print $2}'):0" >> ~/.bashrc
echo "export LIBGL_ALWAYS_INDIRECT=1" >> ~/.bashrc
source ~/.bashrc

测试图形界面

# 在 WSL 中测试
sudo apt install -y x11-apps
xeyes # 应该能看到眼睛窗口

docker 安装

先下载镜像,镜像很大,25G左右

# use docker proxy if you are in China
# docker pull dockerproxy.net/forceless/pptagent:latest
docker pull forceless/pptagent:latest

MINERU_API 申请

https://sso.openxlab.org.cn/mineru-login?redirect=https://mineru.net/apiManage/docs?clientId=lkzdx57nvy22jkpq9x2w&source=minerU

在这里插入图片描述

chatgpt/deepseek 的OPENAI_API_KEY 申请

# 使用 .env 文件保护密钥
echo "OPENAI_API_KEY=你的密钥" > .env
echo "MINERU_API=你的密钥" >> .env
# 然后运行容器
docker run -dt --gpus all --ipc=host --env-file .env --name pptagent \-e OPENAI_API_KEY=$OPENAI_API_KEY \-e MINERU_API=$MINERU_API \-p 9297:9297 \-p 8088:8088 \-v $HOME:/root \forceless/pptagent

WSL2 (Windows) 用户

打开powershell

# 1. 确保已安装最新版 NVIDIA 驱动
# 从官网下载: https://www.nvidia.com/Download/index.aspx# 2. 更新 WSL2 内核
wsl --update
wsl --shutdown# 3. --shutdown# 3. 在 WSL 发行版中安装工具包
sudo apt update
sudo apt install -y n
sudo apt install -y nvidia-container-toolkit# 4. 运行容器时不需要 --ipc=host 参数
docker run -dt --name pptagent \--gpus all \--env-file .env \-p 9297:9297 \-p 8088:8088 \-v $HOME:/root \forceless/pptagent

常规系统NVIDIA 驱动

验证 NVIDIA 驱动安装

# 检查 NVIDIA 驱动是否安装
nvidia-smi# 如果未安装,安装推荐驱动:
sudo apt update
sudo apt install -y ubuntu-drivers-common
sudo ubuntu-drivers autoinstall
sudo reboot

安装 NVIDIA Container Toolkit

# 添加软件包仓库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \&& curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \&& curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list# 安装工具包
sudo apt update
sudo apt install -y nvidia-container-toolkit# 重启 Docker
sudo systemctl restart docker

验证 NVIDIA Container Toolkit 安装

# 运行测试容器
docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi# 应该显示与主机上 nvidia-smi 相同的输出

配置 Docker 守护进程

# 创建或修改 Docker 配置文件
sudo nano /etc/docker/daemon.json

添加以下内容:

{"runtimes": {"nvidia": {"path": "/usr/bin/nvidia-container-runtime","runtimeArgs": []}},"default-runtime": "nvidia"
}

然后重启 Docker:

sudo systemctl daemon-reload
sudo systemctl restart docker

使用正确的 GPU 参数运行容器

# 正确的运行命令
docker run -dt --name pptagent \--gpus all \--ipc=host \--env-file .env \-p 9297:9297 \-p 8088:8088 \-v $HOME:/root \forceless/pptagent

启动和使用 PPTAgent

启动服务

# 在 PPTAgent 目录
flask run --host=0.0.0.0 --port=5000

在 Windows 浏览器访问
打开浏览器访问:

http://localhost:5000
http://www.dtcms.com/a/398814.html

相关文章:

  • Python的大杀器:Jupyter Notebook处理.ipynb文件
  • 物流网站建设与管理规划书七牛wordpress插件
  • 【同源策略】跨域问题解决方法(多种)
  • 【数据结构】链表 --- 单链表
  • ArcGIS JSAPI 高级教程 - 自由绘制线段、多边形
  • 【2025最新】ArcGIS 点聚合功能实现全教程(进阶版)
  • Express使用教程(二)
  • 大模型部署基础设施搭建 - Docker
  • 芜湖建设机械网站企业管理系统软件下载
  • 永嘉县住房和城乡规划建设局网站自助贸易网
  • 华为云学习笔记(1):ECS 实例操作与密钥登录实践
  • 有一次django开发实录
  • RISC-V 中的 Wait For Interrupt 指令 (wfi) 详解
  • 前端核心框架vue之(指令案例篇1/5)
  • 企业静态网站源码增城建设局网站
  • 网站兼容9公司logo和商标一样吗
  • 题解:AT_abc206_e [ABC206E] Divide Both
  • 链改2.0总架构师何超秘书长重构“可信资产lPO与数链金融RWA”
  • 网站开发技术包括网站建设专业培训
  • 无人机航拍WiFi图传模块,16公里实时高清图传性能和技术参数
  • 视频元素在富文本编辑器中的光标问题
  • 企业网站内容如何搭建推荐做木工的视频网站
  • grounding dino 源码部署 cuda12.4 开放词汇目标检测(Open-Vocabulary Object Detection, OVOD)模型
  • 一个虚拟主机可以做几个网站吗毕设做网站心得体验
  • Spring使用SseEmitter实现后端流式传输和前端Vue数据接收
  • 湖南省新闻最新消息十条深圳seo网站推广方案
  • 语音交互接待服务机器人深度推荐
  • 创建学校网站吗网站搭建工具的种类
  • Linux-ARM-裸机开发-开发环境搭建
  • 2025年校园招聘平台怎么选?