当前位置: 首页 > news >正文

潍坊米搜网站建设访客可以用微信回复wordpress

潍坊米搜网站建设,访客可以用微信回复wordpress,宝塔面板怎么安装wordpress,深圳罗湖网站建设公司哪家好文章目录 一、关于 LaTeX OCR1、项目概览架构图2、相关链接资源3、功能特性 二、安装配置基础环境要求Linux 安装Mac 安装 三、使用指南1、快速训练(小数据集)2、完整训练(大数据集) 四、可视化功能训练过程可视化预测过程可视化 …

文章目录

    • 一、关于 LaTeX OCR
      • 1、项目概览
      • 架构图
      • 2、相关链接资源
      • 3、功能特性
    • 二、安装配置
      • 基础环境要求
      • Linux 安装
      • Mac 安装
    • 三、使用指南
      • 1、快速训练(小数据集)
      • 2、完整训练(大数据集)
    • 四、可视化功能
      • 训练过程可视化
      • 预测过程可视化
    • 五、模型评估
    • 六、技术细节
      • 数据处理流程
      • 模型架构


一、关于 LaTeX OCR

1、项目概览

基于 Seq2Seq + Attention + Beam Search 架构的数学公式识别系统,可将数学公式图片转换为 LaTeX 代码。

在这里插入图片描述


架构图

在这里插入图片描述


2、相关链接资源

  • GitHub:https://github.com/LinXueyuanStdio/LaTeX_OCR
  • 增强版:https://github.com/LinXueyuanStdio/LaTeX_OCR_PRO
  • 数据集来源:im2latex-100k , arXiv:1609.04938
  • 参考论文:
    • Show, Attend and Tell
    • Harvard’s paper and dataset
    • Seq2Seq for LaTeX generation

3、功能特性

1、多平台支持

  • 支持 Linux/Mac/Windows 系统
  • 提供一键安装脚本

2、可视化训练

  • 集成 TensorBoard 训练过程可视化
  • 支持注意力机制可视化

3、评估指标

  • 支持 perplexity/EditDistance/BLEU-4/ExactMatchScore 四种评估指标

二、安装配置

基础环境要求

  1. Python 3.5 + TensorFlow 1.12.2
  2. LaTeX (latex 转 pdf)
  3. Ghostscript (图片处理)
  4. ImageMagick (pdf 转 png)

Linux 安装

一键安装

make install-linux

或分步安装

# 创建环境 
virtualenv env35 --python=python3.5
source env35/bin/activate
pip install -r requirements.txt# 安装 latex (latex 转 pdf)
sudo apt-get install texlive-latex-base texlive-latex-extra# 安装 ghostscript
sudo apt-get update && sudo apt-get install ghostscript libgs-dev# 安装 magick (pdf 转 png)
wget http://www.imagemagick.org/download/ImageMagick.tar.gz
tar -xvf ImageMagick.tar.gz
cd ImageMagick-7.*
./configure --with-gslib=yes
make
sudo make install
sudo ldconfig /usr/local/lib
rm ImageMagick.tar.gz
rm -r ImageMagick-7.*

Mac 安装

一键安装

make install-mac

分步安装

sudo pip install -r requirements.txt
wget http://www.imagemagick.org/download/ImageMagick.tar.gz
tar -xvf ImageMagick.tar.gz
cd ImageMagick-7.*
./configure --with-gslib=yes
make
sudo make install
rm ImageMagick.tar.gz
rm -r ImageMagick-7.*

三、使用指南

1、快速训练(小数据集)

一键训练(约2分钟)

make small

分步执行

python build.py --data=configs/data_small.json --vocab=configs/vocab_small.json
python train.py --data=configs/data_small.json --vocab=configs/vocab_small.json --training=configs/training_small.json --model=configs/model.json --output=results/small/
python evaluate_txt.py --results=results/small/
python evaluate_img.py --results=results/small/

2、完整训练(大数据集)

一键训练(2-3小时)

make full

分步执行

python build.py --data=configs/data.json --vocab=configs/vocab.json
python train.py --data=configs/data.json --vocab=configs/vocab.json --training=configs/training.json --model=configs/model.json --output=results/full/
python evaluate_txt.py --results=results/full/
python evaluate_img.py --results=results/full/

四、可视化功能

训练过程可视化

# 小数据集
cd results/small
tensorboard --logdir ./# 大数据集
cd results/full
tensorboard --logdir ./

预测过程可视化

python visualize_attention.py --image=data/images_test/6.png --vocab=configs/vocab.json --model=configs/model.json --output=results/full/

五、模型评估

指标训练分数测试分数
perplexity1.391.44
EditDistance81.6880.45
BLEU-478.2175.42
ExactMatchScore13.9312.44

六、技术细节

数据处理流程

  1. 获取 LaTeX 公式数据
  2. 公式规范化处理
  3. 生成图片数据集
  4. 构建字典和映射文件

模型架构

  • Encoder: CNN
  • Decoder: LSTM/GRU
  • 注意力机制层
  • Beam Search/Greedy 输出策略

伊织 xAI 2025-05-18(日)

http://www.dtcms.com/a/480420.html

相关文章:

  • 如何选择专业网站开发商丁香人才网官方网站
  • 简约 网站净化工程 技术支持 东莞网站建设
  • 网站建设实训的报告网站开发语言 排行榜
  • 机关单位 网站建设方案策划书中国纪检监察报每周几期
  • 武冈网站建设哪家好电脑网页打不开怎么回事
  • 江苏省城乡和住房建设厅网站苏州晶体公司网站
  • WORDPRESS网站如何改版怎么做一个网站app吗
  • 天台高端网站建设公司代理网页 国外
  • 天元建设集团有限公司第八建筑工程公司长沙seo建站
  • 网站搭建公司排行门户网站建设 报告
  • 百度查重免费舟山seo
  • 做地方分类信息网站需要什么资质吗成都网站制作中国互联
  • 赣州网站设计哪家强平台不得诱导下载
  • 南宁网站建设公司哪家好小型网站建设方案
  • 制作旅游网站百度指数专业版app
  • 怎么做旅游网站框架江苏省建设集团是国企吗
  • 仿it资讯类网站源码商城类app制作价格
  • 网站的v2信誉认证怎么做企业邮箱服务
  • 制作微信网页的网站吗中间商可以做网站吗
  • 杭州网站制作外包网站推广软件推荐
  • 网站建设丨找王科杰专业seo wordpress theme
  • 上海做网站的公司怎么做谷歌这样的网站
  • 环保网站设计价格辽宁建设工程信息网联合体投标
  • 织梦模板大气网站建设类网站模板php做网站主题
  • 各大网站大全电商网站建设网络公司
  • 泉州网页模板建站广东基层团组织建设部网站
  • 深圳龙华建设局官方网站织梦网站程序模板
  • 惠州网站建设米普可思微信小程序界面设计
  • 自己做网站需要学什么东西花溪网站建设
  • Linux-vmware虚拟机开发环境安装