当前位置: 首页 > news >正文

玩转ChatGPT:寻找仪器用户手册

一、写在前面

作为犇驫,每天都会遇到一些奇奇怪怪的问题,比如最近又遇到一个:

也不难,得把实验设备或仪器用户手册的电子版给归档了。

然后,大家就开始做这种神奇的工作:

四处搜寻仪器设备的官方品牌、型号、序列号,好不容易有了线索,又得去联系经销商要资料,可这过程简直比登天还难,全国销售、大区销售、省销售、市销售,就跟“踢皮球”似的来回扯皮。

这不禁让人想问,LLM能不能出马搞定这个让人头疼的问题?

  • 序列核对

作为一名懒人,我不打算找什么“官方品牌、型号、序列号”,就直接手机拍个照,然后上传给LLM们,看看他们能不能直接识别?

由于涉及到多模态,这回输入4o、o3、o4-mini-high、Kimi、DS和豆包。

当然啦,这个是多模态任务,而Kimi、DS和豆包还不属于多模态模型,大概率不能胜任这个任务。

(1)咒语

帮我找 图中仪器设备 的官方电子版说明书PDF版本(把照片附上即可)。

记得要拍到一些关键信息。

(2)o4-mini-high

思考了15秒,给了最终答案:

您可以从 Labnet International 官方文档中心下载 6 Liter 水浴锅的完整电子版操作说明书(ClSLN‑AN‑1023DOC Rev 1)PDF:

6 Liter Water Bath Instruction Manual

适用型号:W1106A (6 L Mini General Purpose Water Bath)

内容涵盖:产品概述、安装、操作面板说明、温度设定、维护与故障排除等。

▶️ 下载完整手册 (PDF)

点击链接打开PDF并下载即可:

(2)4o

仪器的类别和型号都识别出来了,但是没提供直接的PDF下载链接:

给出的链接也只是官网的用户手册得下界面:

(3)o3

类似的,仪器的类别和型号都识别出来了,也提供了PDF文件:

宣告成功。

(4)ChatGPT-4.1

几乎瞬间出网址:

(4)Kimi-1.5

失败了,回答中规中矩。可以理解,毕竟不是多模态。

(5)DeepSeek

不是多模态,也是搞不定。

(6)豆包

不是多模态,也是搞不定。

五、写在最后

本期,以实际工作中常见的“寻找仪器电子说明书”为切入点,对多款大语言模型(LLM),尤其是支持多模态输入的ChatGPT系列产品,在处理这一任务上的表现进行了系统测试。结果显示,o4-mini-high、o4、o3和ChatGPT-4.1能够识别设备照片中的关键信息,准确匹配仪器品牌与型号,并提供了较为精准的用户手册下载渠道。其中,o4-mini-high和o3甚至可以直接给出PDF文件下载链接,极大提升了资料获取的效率。相比之下,Kimi-1.5、DeepSeek和豆包等不具备多模态能力的模型则无法完成图片识别类检索任务,仅能给出模糊或通用性的建议。

出现上述差异的主要原因在于多模态理解与网络实时检索能力的进步。具体分析如下:

多模态能力:具备图像识别和文本理解双重能力的LLM能够自动提取照片中的品牌、型号等关键信息,跳过了人工录入环节,极大降低了查找门槛。

实时联网与内容检索:部分模型如o4-mini-high与o3不仅能识别信息,还能在线快速定位到对应的官方资料库,进一步提高了效率。而仅能本地推理的模型则受限于知识更新和无法联网检索,难以满足实际需求。

产品设计差异:如Kimi-1.5、DeepSeek和豆包当前主要聚焦于文本生成与推理,尚未开放或完善多模态识别功能,因此在此类任务下表现有限。

综合来看,具备多模态和联网检索能力的最新LLM,已能在实际科研和管理场景中显著提升资料归档与查询的便捷性,极大节省人力和时间成本。未来,随着大模型多模态能力的持续升级,这类“傻瓜式”检索方式有望进一步普及,并推动实验室管理智能化水平的提升。

http://www.dtcms.com/a/309821.html

相关文章:

  • TEM在量子点发光材料领域的应用-测试GO
  • 汇川ITS7100E触摸屏交互界面开发(一)调试事项说明
  • BIFU币富探索合规新路径 助力用户玩转RWA
  • 两步走解决家庭路由器无法上网
  • Java 根据多个 MM-dd 日期计算总时长(包含当日和次日)
  • python PIL图片转base64字符串
  • [极客大挑战 2019]RCE ME
  • RockAI 的破壁之战:Yan 架构如何啃下“端侧炼丹”硬骨头?
  • Vue3 setup、ref和reactive函数
  • 元策联盈:深耕金融领域,赋能行业发展​
  • 【Flutter3.8x】flutter从入门到实战基础教程(四):自定义实现一个自增的StatefulWidget组件
  • 磁力搜索+磁力下载!无需解释!直接上车!
  • 工作好用小工具积累
  • EGE 流量开关 LG 518 GSP P11237
  • 异步函数被调用多次,多次处理同一个文件导致占用,如何让异步函数按顺序执行?
  • 书生浦语第五期L0G2
  • 【音视频】WebRTC 中的RTP、RTCP、SDP、Candidate
  • Ubuntu-Server-24.04-LTS版本操作系统如何关闭自动更新,并移除不必要的内核
  • C++在类的构造函数中调用另一个构造函数
  • STM32CubeIDE新建项目过程记录备忘(四)EXTI外部中断
  • 网络编程-加密算法
  • Spring Boot 异步执行方式全解析:@Async、CompletableFuture 与 TaskExecutor 对比
  • 面试题:怎么理解 OSI 参考模型(开放式系统互联参考模型) 和 TCP/IP 模型(传输控制协议 / 网际协议模型 )
  • Node.js中Buffer的用法
  • Linux中Docker Swarm介绍和使用
  • 数据结构学习基础和从包装类缓存到泛型擦除的避坑指南
  • QT初入门-界面设置
  • Metamorph、LlamaFusion、MetaQuery论文解读
  • Linux的对称多处理(SMP)机制
  • embodied复现所需docker环境配置粗略流程