当前位置: 首页 > news >正文

轻量级证件照制作 AI 工具 HivisionIDPhotos 介绍

在这里插入图片描述

介绍

HivisionIDPhotos 是一款基于 AI 技术的开源证件照生成工具,支持智能抠图、背景替换、多尺寸生成等功能,适合个人和企业快速制作标准证件照。

  1. 智能抠图与背景替换

    • 采用深度学习模型(如 MODNet、RetinaFace)实现高精度人像分离,支持纯色背景替换(红、蓝、白等)。
    • 提供多种抠图模型选择,如 rmbg-1.4、birefnet-v1-lite,适应不同场景需求。
  2. 多尺寸证件照生成

    • 支持常见证件照尺寸(1寸、2寸、护照、签证等),并可自定义尺寸。
    • 自动排版为六寸规格,方便批量打印。
  3. 轻量化与高效处理

    • 纯离线运行,仅需 CPU 即可快速推理,无需高性能硬件。
    • 未来将推出美颜、智能换正装等进阶功能。
  4. 目前在 GitHub 上已经收集到 15.7k 星🌟。
    在这里插入图片描述

  5. GitHub:https://github.com/Zeyi-Lin/HivisionIDPhotos

优势与适用场景

  1. 隐私安全:支持纯本地部署,避免照片数据外传。
  2. 灵活扩展:提供 API 接口,可集成至企业系统或第三方应用。
  3. 多场景适用:
    • 个人:居家制作签证、简历照片等。
    • 企业:批量处理员工证件照,或集成到摄影服务中

使用

  1. 环境安装与依赖
  • Python >= 3.7(项目主要测试在 python 3.10)
  • OS: Linux, Windows, MacOS
  1. 克隆项目
git clone https://github.com/Zeyi-Lin/HivisionIDPhotos.git
cd  HivisionIDPhotos
  1. 安装依赖环境
# 建议 conda 创建一个 python3.10 虚拟环境后,执行以下命令
pip install -r requirements.txt
pip install -r requirements-app.txt
  1. 下载人像抠图模型权重文件
python scripts/download_model.py --models all
# 如需指定下载某个模型
# python scripts/download_model.py --models modnet_photographic_portrait_matting

运行 Gradio Demo

运行程序将生成一个本地 Web 页面,在页面中可完成证件照的操作与交互。

python app.py

在这里插入图片描述

Python 推理

  1. 证件照制作:输入 1 张照片,获得 1 张标准证件照和 1 张高清证件照的 4 通道透明 png
python inference.py -i demo/images/test0.jpg -o ./idphoto.png --height 413 --width 295
  1. 人像抠图:输入 1 张照片,获得 1张 4 通道透明 png
python inference.py -t human_matting -i demo/images/test0.jpg -o ./idphoto_matting.png --matting_model hivision_modnet
  1. 透明图增加底色:输入 1 张 4 通道透明 png,获得 1 张增加了底色的 3通道图像
python inference.py -t add_background -i ./idphoto.png -o ./idphoto_ab.jpg  -c 4f83ce -k 30 -r 1
  1. 得到六寸排版照:输入 1 张 3 通道照片,获得 1 张六寸排版照
python inference.py -t generate_layout_photos -i ./idphoto_ab.jpg -o ./idphoto_layout.jpg  --height 413 --width 295 -k 200
  1. 件照裁剪:输入 1 张 4 通道照片(抠图好的图像),获得 1 张标准证件照和 1 张高清证件照的 4 通道透明 png
python inference.py -t idphoto_crop -i ./idphoto_matting.png -o ./idphoto_crop.png --height 413 --width 295

其余方法

  • 部署 API 服务和 Docker 部署请参考原项目说明。

相关文章:

  • 单片机自动排列上料控制程序 下
  • DSP28335 串口中断收发及FIFO使用
  • 剖析 FFmpeg:从基本功能到过滤器,实现音视频处理的灵活性
  • 国内云内网接入方案
  • JAVA房屋租售管理系统房屋出租出售平台房屋销售房屋租赁房屋交易信息管理源码
  • linux中的常用命令(一)
  • 运维打铁:服务器分类及PHP入门
  • ElasticSearch基本概念
  • 手撕基于AMQP协议的简易消息队列-8(单元测试的编写)
  • 【即插即用涨点模块】DSConv动态蛇形卷积:自适应聚焦细长弯曲的局部结构特征,助力分割高效提点【附源码+注释】
  • 从简历筛选到面试管理:开发一站式智能招聘系统源码详解
  • JavaScript 性能优化全攻略:从基础到实战
  • 瑞芯微RK3288解决方案:高性能、高扩展性的嵌入式系统设计理念与应用分析
  • C++ 深入解析 数据结构中的 AVL树的插入 涉及的旋转规则
  • 小米 MiMo 开源:7B 参数凭什么 “叫板” AI行业巨头?
  • 【今日三题】ISBN号码(模拟) / kotori和迷宫(BFS最短路) / 矩阵最长递增路径(dfs)
  • 红黑树的应用场景 —— 进程调度 CFS 与内存管理
  • 视频编解码学习7之视频编码简介
  • 6. 进程控制
  • 初学者的AI智能体课程:构建AI智能体的十堂课
  • 牛市早报|国家发改委:今年将推出约3万亿元优质项目,支持民营企业参与
  • 眉山“笑气”迷局:草莓熊瓶背后的隐秘与危机
  • A股低开高走全线上涨:军工股再度领涨,两市成交12934亿元
  • 商务部再回应中美经贸高层会谈
  • 轿车追尾半挂车致3死1伤,事故调查报告:司机过分依赖巡航系统
  • 体坛联播|米兰逆转热那亚豪取3连胜,阿诺德官宣离开利物浦