当前位置: 首页 > news >正文

1 bit AI 框架:Part 1.1,CPU 上的快速无损 BitNet b1.58 推理

(2024-10-23) 1-bit AI Infra: Part 1.1, Fast and Lossless BitNet b1.58 Inference on CPUs (1 bit AI 框架:Part 1.1,CPU 上的快速无损 BitNet b1.58 推理)

作者: Jinheng Wang; Hansong Zhou; Ting Song; Shaoguang Mao; Shuming Ma; Hongyu Wang; Yan Xia; Furu Wei;
期刊: (发表日期: 2024-10-23)
期刊分区:
本地链接: Wang 等 - 2024 - 1-bit AI Infra Part 1.1, Fast and Lossless BitNet b1.58 Inference on CPUs.pdf
DOI: 10.48550/arXiv.2410.16144
摘要: Recent advances in 1-bit Large Language Models (LLMs), such as BitNet [WMD+23] and BitNet b1.58 [MWM+24], present a promising approach to enhancing the efficiency of LLMs in terms of speed and energy consumption. These developments also enable local LLM deployment across a broad range of devices. In this work, we introduce bitnet.cpp , a tailored software stack designed to unlock the full potential of 1-bit LLMs. Specifically, we develop a set of kernels to support fast and lossless inference of ternary BitNet b1.58 LLMs on CPUs. Extensive experiments demonstrate th

相关文章:

  • CAN转ModbusTCP网关:破解电池生产线设备协议壁垒,实现全链路智能互联
  • excel单元格如果是日期格式,在C#读取的时候会变成45807,怎么处理
  • c++:库(Library)
  • 系统的从零开始学习电子的相关知识,该如何规划?你是工作了18年的电子工程师,请给出你的建议
  • 【Linux】环境变量(图文)
  • learning ray之ray强化学习/超参调优和数据处理
  • ‌FunASR‌阿里开源的语音识别工具
  • 使用 ECharts GL 实现交互式 3D 饼图:技术解析与实践
  • WHAT - 冷启动和热启动
  • 屎上雕花系列-2nd
  • STL?vector!!!
  • 数据可视化大屏——物流大数据服务平台(二)
  • 2025年API安全防御全解析:应对DDoS与CC攻击的智能策略
  • 每天五分钟深度学习框架pytorch:视觉工具包torchvison
  • 什么是直播美颜SDK?跨平台安卓、iOS美颜SDK开发实战详解
  • 【递归,搜索与回溯算法篇】专题(一) - 递归
  • Python爬虫(22)Python爬虫进阶:Scrapy框架动态页面爬取与高效数据管道设计
  • 【官方题解】StarryCoding 入门教育赛 2 | acm | 蓝桥杯 | 新手入门
  • NLP基础
  • Java 23种设计模式 - 结构型模式7种
  • 习近平会见缅甸领导人敏昂莱
  • 欧盟公布对美关税反制清单,瞄准美国飞机等产品
  • 国家主席习近平同普京总统举行小范围会谈
  • 金融监管总局:近五年民企贷款投放年平均增速比各项贷款平均增速高出1.1个百分点
  • 外交部:印巴都表示不希望局势升级,望双方都能保持冷静克制
  • 巴基斯坦军方:印度导弹袭击已造成至少3人死亡