当前位置: 首页 > news >正文

树莓派 5 上运行 Gemma3:270m 本地大模型体验

树莓派 5 上运行 Gemma3:270m 本地大模型体验

最近脑子里一直有个想法:树莓派 5 能不能直接跑大语言模型?

大模型确实很吃算力,但一些小模型其实已经可以在单板机上运行。于是我就尝试了一下 Gemma3:270m,结果发现:它真的可以跑起来!


请添加图片描述

环境准备

运行环境:

  • 硬件:Raspberry Pi 5 (8GB RAM)

  • 系统:Raspberry Pi OS (Bookworm 64-bit)

  • 模型框架:Ollama

Ollama 在 ARM64 架构下也提供了预编译包,但是因为 Pi 上网络经常拉不下来大文件,我选择了在笔记本上下载好,再传到树莓派。

下载地址:
👉 ollama-linux-arm64.tgz

上传到树莓派之后解压安装:

sudo tar -C /usr -xzf ollama-linux-arm64.tgz

然后创建 ollama 用户并配置 service:

sudo useradd -r -s /bin/false -U -m -d /usr/share/ollama ollama
sudo usermod -a -G ollama $(whoami)

配置 systemd 服务

/etc/systemd/system/ollama.service 新建 service 文件:

[Unit]
Description=Ollama Service
After=network-online.target[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=$PATH"[Install]
WantedBy=multi-user.target

启动服务:

sudo systemctl daemon-reload
sudo systemctl enable ollama
sudo systemctl start ollama
sudo systemctl status ollama

运行 Gemma3:270m

准备工作完成后,就可以直接拉取并运行模型了:

ollama run gemma3:270m

效果如下图:

运行结果示例

在 Raspberry Pi 5 上,Gemma3:270m 可以跑到 约 18 tokens/s,简单的对话完全没有问题。


使用体验与总结

  • 优势

    • 模型小(270M),可以常驻内存

    • 性能在树莓派上完全够用

    • 简单对话、命令控制、语音助手类场景非常合适

  • 不足

    • 模型能力有限,处理复杂问题会力不从心

    • 树莓派的存储和内存还是有限,不适合跑大模型

✨ 总结一句:Gemma3:270m 非常适合作为 Raspberry Pi 上的轻量级本地大语言模型,尤其适合 DIY 语音助手、边缘计算等小场景。

http://www.dtcms.com/a/361280.html

相关文章:

  • 无题250901
  • 什么是MIPS架构?RISC-V架构?有什么区别?【超详细初学者教程】
  • C++ 的随机整数采样
  • 【106】基于51单片机智能油烟机/换气扇【Proteus仿真+Keil程序+报告+原理图】
  • 计算机视觉(五):blur
  • 解锁水系电池机理:原位谱学测试方案全解析-测试GO
  • Apache Commons ConvertUtils
  • FFMPEG 10BIT下 Intel b570 qsv 硬解AV1,H265视频编码测试
  • 《Shell 大道:筑基篇(上)—— 神念控流程,函数成符阵》
  • 机器学习——模型架构
  • ✝常用表格✝
  • 读《独角兽项目:数字化转型》
  • 【开题答辩全过程】以 基于微信小程序的校园二手物品交易平台的设计与实现为例,包含答辩的问题和答案
  • 分布式光伏模式怎么选?从 “凭经验” 到 “靠数据”,iSolarBP 帮你锁定最优解
  • 苹果WWDC25开发秘鉴:AI、空间计算与Swift 6的融合之道
  • 领码方案:低代码平台前端缓存与 IndexedDB 智能组件深度实战
  • GDAL 简介
  • FAST API部署和使用
  • java讲解自己对业务架构、数据架构、应用架构的理解
  • gh-pages部署github page项目
  • 【机器学习入门】5.1 线性回归基本形式——从“选西瓜”看懂线性模型的核心逻辑
  • A2A + MCP 的python实现的最小可运行骨架
  • duilib中CTextUI控件使用技巧与问题总结(CTextUI控件自适应文字宽度特性)
  • 五、练习2:Git分支操作
  • 四、操作系统
  • 腾讯混元翻译大模型Hunyuan-MT-7B:重塑跨语言沟通的技术革命
  • 2025年应届生求职加分指南:这些新兴技能路径让你脱颖而出
  • 电子电气架构 --- 智能电动车EEA电子电气架构(下)
  • 【LeetCode 热题 100】5. 最长回文子串——中心扩散法
  • Linux按键输入实验