当前位置：首页 > news >正文

1 bit AI 框架：Part 1.1，CPU 上的快速无损 BitNet b1.58 推理

news 2025/11/1 8:29:32

(2024-10-23) 1-bit AI Infra: Part 1.1, Fast and Lossless BitNet b1.58 Inference on CPUs (1 bit AI 框架：Part 1.1，CPU 上的快速无损 BitNet b1.58 推理)


作者: Jinheng Wang; Hansong Zhou; Ting Song; Shaoguang Mao; Shuming Ma; Hongyu Wang; Yan Xia; Furu Wei;
期刊: （发表日期: 2024-10-23）
期刊分区:
本地链接: Wang 等 - 2024 - 1-bit AI Infra Part 1.1, Fast and Lossless BitNet b1.58 Inference on CPUs.pdf
DOI: 10.48550/arXiv.2410.16144
摘要: Recent advances in 1-bit Large Language Models (LLMs), such as BitNet [WMD+23] and BitNet b1.58 [MWM+24], present a promising approach to enhancing the efficiency of LLMs in terms of speed and energy consumption. These developments also enable local LLM deployment across a broad range of devices. In this work, we introduce bitnet.cpp , a tailored software stack designed to unlock the full potential of 1-bit LLMs. Specifically, we develop a set of kernels to support fast and lossless inference of ternary BitNet b1.58 LLMs on CPUs. Extensive experiments demonstrate th

http://www.dtcms.com/a/179781.html

相关文章：

CAN转ModbusTCP网关：破解电池生产线设备协议壁垒，实现全链路智能互联

excel单元格如果是日期格式，在C#读取的时候会变成45807，怎么处理

c++：库（Library）

系统的从零开始学习电子的相关知识，该如何规划？你是工作了18年的电子工程师，请给出你的建议

【Linux】环境变量（图文）

learning ray之ray强化学习/超参调优和数据处理

‌FunASR‌阿里开源的语音识别工具

使用 ECharts GL 实现交互式 3D 饼图：技术解析与实践

WHAT - 冷启动和热启动

屎上雕花系列-2nd

STL？vector！！！

数据可视化大屏——物流大数据服务平台（二）

2025年API安全防御全解析：应对DDoS与CC攻击的智能策略

每天五分钟深度学习框架pytorch：视觉工具包torchvison

什么是直播美颜SDK？跨平台安卓、iOS美颜SDK开发实战详解

【递归，搜索与回溯算法篇】专题（一） - 递归

Python爬虫（22）Python爬虫进阶：Scrapy框架动态页面爬取与高效数据管道设计

【官方题解】StarryCoding 入门教育赛 2 | acm | 蓝桥杯 | 新手入门

NLP基础

Java 23种设计模式 - 结构型模式7种

c++：迭代器（Iterator）

git相关

今日行情明日机会——20250509

从设计到开发，原型标注图全流程标准化

深度学习 ———— 迁移学习

自动驾驶的“眼睛”：用Python构建智能障碍物检测系统

2025医疗信息化趋势：健康管理系统如何重构智慧医院生态

【新品发布】VXI可重构信号处理系统模块系列

内网渗透——红日靶场三

C++ stl中的list的相关函数用法