当前位置: 首页 > news >正文

LiteRT-LM边缘平台上高效运行语言模型

谷歌发布高效运行语言模型的 C++ 库:LiteRT-LM

LiteRT-LM 支持跨平台高效运行 Gemma-3N 系列模型,支持 2B 和 4B 参数模型,适用于桌面环境(Mac/Windows/Linux)及物联网设备

 

语言模型不再是一个单一模型,而是一个由多个模型和组件协同工作的流水线。LiteRT-LM 基于 LiteRT 构建,以支持这些流水线,包括:

  • C++ API 高效运行语言模型
  • 跨平台支持,通过便携式 C++ 实现广泛部署场景
  • 灵活可定制,满足您的特定功能需求
  • 硬件加速,释放设备硬件的全部潜能

参考开源

https://github.com/google-ai-edge/LiteRT-LM

https://huggingface.co/google/gemma-3n-E2B-it-litert-lm-preview 

http://www.dtcms.com/a/251118.html

相关文章:

  • 第10章:Neo4j与其他技术集成
  • 第8章:Neo4j性能优化
  • 在虚拟机 银河麒麟|ubuntu 中安装和配置NVIDIA显卡驱动
  • 【运维系列】【ubuntu22.04】Docker安装mysql 8.0.36 教程
  • 基于大模型预测缺铁性贫血的综合技术方案大纲
  • 【系统分析师】2011年真题:案例分析-答案及详解
  • UE5错误 Linux离线状态下错误 circular dependency detected;includes/requires
  • 基于MediaPipe的手指目标跟踪与手势识别+人体姿态识别估计:MediaPipe与OpenPose算法对比
  • 第11章:Neo4j实际应用案例
  • LangChain智能体之initialize_agent开发实战深度解析
  • YOLOv11改进 | 注意力机制篇 | SENetV1与C2PSASENet融合策略
  • JavaScript 数据结构详解
  • 【计算机常识:Windows】--CMD命令详解
  • Vue3 axios 请求设置 signal 信号属性,以便 abort 取消请求
  • 牙科医疗设备EMC电磁兼容技术讨论
  • 大模型训练与推理显卡全指南:从硬件选型到性能优化
  • Apache Iceberg与Hive集成:非分区表篇
  • vscode python debugger 如何调试老版本python
  • 构建esp-IDF出现的(Git仓库所有权检测)问题
  • 高速 PCB 设计的材料选择,第 2 部分
  • 深度解析企业风控API技术实践:构建全方位企业风险画像系统
  • SpringBoot新闻项目学习day2-前后端搭建以及数据查询(分页查询)
  • docker部署MinIO对象存储实践:含控制台功能恢复方案
  • 【八股消消乐】构建微服务架构体系—链路超时控制
  • 每日算法刷题Day32 6.15:leetcode枚举技巧7道题,用时1h10min
  • Linux——libevent库
  • 单例模式的好处
  • 《解码SCSS:悬浮与点击效果的高阶塑造法则》
  • 安卓9.0系统修改定制化____安卓 9.0 解包、打包与系统修改基础及工具介绍 常识篇 四
  • (LeetCode 动态规划(基础版)) 279. 完全平方数 (动态规划dp)