当前位置: 首页 > news >正文

AWS Elastic Beanstalk中安装tesseract5.3.4版本

问题

需要在eb(Elastic Beanstalk)的amazon linux 2023中安装tesseract软件。但是,因为amazon linux 2023官方软件库里面没有包含tesseract软件,需要通过开源的Fedora软件源来解决这个问题。

思路

配置Fedora 40软件源(amazon linux 2023的官方文档是说最高兼容Fedora 36,但是这次2025年11月,测试一下Fedora 40软件源中的tesseract5.3.4版本也可以用),然后,使用dnf安装tesseract和中文,英文语言包。

.ebextensions目录结构

├── .ebextensions                    
│   ├── 01launch-template.config
│   ├── 02tesseract.config
│   ├── 03timezone.config
│   └── 04environment-variables.config

01launch-template.config

设置应用程序的环境变量。

option_settings:aws:elasticbeanstalk:application:environment:TESSDATA_PREFIX: /usr/share/tesseract/tessdataaws:autoscaling:launchconfiguration:DisableIMDSv1: trueLaunchTemplateTagPropagationEnabled: true

02tesseract.config

这是安装tesseract库。

files:"/etc/yum.repos.d/fedora.repo":mode: "000644"owner: rootgroup: rootcontent: |[fedora]name=Fedora 40 - $basearch#baseurl=http://download.example/pub/fedora/linux/releases/40/Everything/$basearch/os/metalink=https://mirrors.fedoraproject.org/metalink?repo=fedora-40&arch=$basearchenabled=1metadata_expire=7drepo_gpgcheck=0type=rpmgpgcheck=1gpgkey=https://src.fedoraproject.org/rpms/fedora-repos/raw/f40/f/RPM-GPG-KEY-fedora-40-primaryskip_if_unavailable=Falsecontainer_commands:install_tesseract:command: |sudo dnf install tesseract -ysudo dnf install tesseract-langpack-eng -ysudo dnf install tesseract-langpack-chi_sim -ysudo dnf install tesseract-langpack-chi_sim_vert -yignoreErrors: true

03timezone.config

这是设置时区。

commands:set_timezone:command: |sudo timedatectl set-timezone Asia/ShanghaiignoreErrors: true

04environment-variables.config

设置环境变量

files:"/etc/profile.d/environment_variables.sh":mode: "000755"owner: rootgroup: rootcontent: |#!/bin/bashexport TZ="Asia/Shanghai"export TESSDATA_PREFIX="/usr/share/tesseract/tessdata"container_commands:environment_variables:command: |source /etc/profileignoreErrors: true

总结

这就是eb安装tesseract库和设置时区的过程。执行是按照文件名执行顺序。如果在java中使用Tess4J库通过jni方式调用tesseract,需要注意Tess4J库版本号与tesseract库版本号对应。

参考

  • 在 Elastic Beanstalk 环境的实例上配置 IMDS
  • 在 Amazon Linux 2 及更高版本上运行的 ECS 的实例部署工作流
  • Fedora Public Active Mirrors
  • Tess4J
  • tess4j
  • tesseract fedoraproject
  • Fedora Linux
  • Tess4J API Documentation
  • Tesseract wiki
  • 环境变量和其他软件设置
http://www.dtcms.com/a/572698.html

相关文章:

  • 实战:用Elasticsearch构建爬虫数据搜索引擎
  • 微网站建设及微信公众号长春自助建站软件
  • 修改图片网站卖房app十大排行榜
  • python-爬虫之beautifulsoup
  • Ubuntu 24.04 安装 FreeSWITCH 完整教程
  • LeetCode(python)——49.字母异位词分组
  • Redis 性能优化与故障排查指南
  • 24.java openCV4.x 入门-Imgproc之轮廓凸包与凹陷检测(形状识别)
  • IDEA 插件推荐
  • 虚拟 DOM(Virtual DOM)的工作原理及其性能优化机制
  • git详细使用教程
  • 北京工程工程建设交易信息网站和城乡建设部网站
  • soular零基础学习,如何通过工作台聚合TikLab所有工具链
  • 建立企业网站电商网站建设开题报告
  • css font-size 的妙用
  • Jenkins安装部署
  • 阿里云 CDN + 静态资源(图片 / JS/CSS)缓存优化
  • 荣耀前端开发面试题及参考答案
  • shtml怎么做网站建设学校网站多钱
  • Navicat 连接 SQL Server 报错 [08001] 超时错误(258)的排查与解决方案
  • Linux 使用 `wait` 函数回收子进程
  • 八股训练营第 8 天 | TCP连接三次握手的过程?TCP连接四次挥手的过程?HTTP的Keep-Alive是什么?
  • 【计算网络学习笔记】网络基础之网络协议栈
  • CyberSecEval 2
  • wordpress 两栏专业seo培训学校
  • 【浏览器CORS问题解决方案】SpringBoot+Vue3前后端全覆盖:浏览器跨域问题的多样化解决方案
  • 论述AI和人类的分工
  • 第四阶段C#通讯开发-6:Socket之UDP
  • 广州建设网站公司简介百度seo排名推广
  • 四自由度机械臂运动学与动力学分析