当前位置: 首页 > news >正文

技术速递|开启全新的多模态模型 - Microsoft Phi-4-mini Phi-4-multimodal

作者:卢建晖 - 微软高级云技术布道师

排版:Alan Wang

在这里插入图片描述

Microsoft Phi-4 系列模型正式发布,延续先前发布的强推理 Phi-4 (14B)模型, 今天带来了 Phi-4-mini-instruct(3.8B),以及 Phi-4-multimodal(5.6B)模型。我们可以从 Hugging face、Azure AI Foundry Model Catalog、GitHub Models,以及 Ollama 获取使用模型。

Phi-4 除了在多语言、推理以及数学等方面的能力提升外,对于大家期待已久的 Function Calling 也终于支持了。与此同时,Phi-4-multimodal 更是作为全模态模型,具备了视觉、听觉、文本、多语言理解、强推理,以及编码等能力。我们可以把 Phi-4-mini / Phi-4-multimodal 部署在边缘终端,让更多的 IoT 应用场景在算力和网络受限的情况下,可以和生成式人工智能结合。接下来,我们一起探索全新的 Phi-4-mini 以及 Phi-4-multimodal。

Function Calling

这是社区期待已久的功能,有了 Function Calling,我们可以对 Phi-4-mini / Phi-4-multimodal 的文本能力进行扩展,结合搜索引擎,以及连接不同的工具等。如图所示,这是一个通过 Phi-4-mini 查询英超比赛信息的示意图:
在这里插入图片描述
示例代码

量化后的模型部署

在这里插入图片描述
我们可以把量化后的模型部署在边缘设备中,并结合 Microsoft Olive, ONNXRuntime GenAI 把 Phi-4-mini 部署在 Windows、iPhone、Android 等终端上。以下是一个在 iPhone 12 Pro 上运行的示例:

iPhone 12 Pro 运行示例

全模态 SLM

Phi-4-multimodal 是全模态的模型,支持文字、视觉、语音输入。或许大家对视觉场景已经非常熟悉,我们可以根据图片,直接生成代码。

示例

语音功能的整合让 Phi-4 在功能上有了更强的支持,以下是相关示例:

  • 语音提取

  • 语音交互

  • 语音翻译

强推理性

Phi-4 (14B) 发布时,强推理性就是一个卖点,现在 Phi-4-mini 和 Phi-4-multimodal 虽然参数量减少了,但也具备了该能力,我们可以结合 Image 来测试强推理能力。例如上传一张图片,让 Phi-4-multimodal 能根据图片内容结合提示词更有序地生成项目代码。

示例代码

Phi-4-mini 和 Phi-4-multimodal 在有限的参数量上达到了一些 LLM 的效果。我们可以把 Phi-4-mini 和 Phi-4-multimodal 部署在边缘端,让我们的 PC、移动设备、IoT 具备更强的生成式人工智能能力。我们会陆续在 Phi Cookbook(https://aka.ms/Phicookbook)增加示例, 希望 Phi Cookbook 能成为你使用 Phi-4 的必备指南。

学习资源

  • Micorsoft Phi Cookbook

  • Microsoft Phi-4-multimodal techreport

  • Microsoft Phi-4 Paper

相关文章:

  • 无人设备遥控器之遥控帧序列篇
  • c高级第五天
  • “解决 MyBatis 错误:SAXParseException - 文件提前结束导致 XML 映射文件解析失败“
  • 天佐.炼妖壶 带内存泄漏检测的内存池
  • 华为飞腾D2000芯片(基于ARM架构)的欧拉操作系统(openEuler)上部署MySQL
  • doris: Hive
  • 使用Word时无法粘贴,弹出错误提示:运行时错误‘53‘:文件未找到:MathPage.WLL
  • Qt | 目录和文件路径常用函数大全
  • 剧本杀门店预约小程序:市场发展下的刚需
  • AutoGen学习笔记系列(一)Tutorial - Model
  • QT基础十二、标准项模型:QStandardItemModel
  • 2024华为OD机试真题-数据分类算法(C++/Java/Python)-E卷-100分
  • 零基础学习OpenGL(二)查看各工程源码
  • 蓝桥杯备考:动态规划线性dp之下楼梯问题进阶版
  • MacOS 10.15上使用Docker遇到的几个问题
  • Python中的内置函数 - 第一章
  • Linux:vim快捷键
  • VBA中类的解读及应用第二十一讲:利用类方法判断任意单元格类型-4
  • 原生android 打包.aar到uniapp使用
  • 《玩转AI大模型:从入门到创新实践》(12)LLM初步(4)
  • 网站开发用软件/西安seo主管
  • 免费网站空间有什么用/北京seo百科
  • 企业网站模板 下载 论坛/友情链接教程
  • 未来软件网站建设/百度云搜索引擎 百度网盘
  • 做网站简单吗/百度账号客服
  • 常州做网站多少钱/网络推广协议合同范本