当前位置: 首页 > news >正文

智能驾驶调研

李想 ai talk

  • 人工智能作为工具的几个层级:信息工具、辅助工具和生产工具。现在的LLM 还不能自己做出决策,根据现实目标,迭代更新,达到目的。
  • 公司做自研LLM的意义?
    • 垂类领域的数据(vision-action)对于通用的模型是非常稀缺的;而且垂类要解决的问题,通常也是通用模型不太会覆盖到的;
  • speech 怎么能更好的服务车主【车机状态+音频多模态理解,更加主动提供生成/工具调用/意图理解的能力】
    • 常规的语音任务:做好高自然度的交互,充沛的情感,音色克隆等;
    • 基于驾驶行为的音频理解:比如判断你的车辆状态(频繁刹车)–舒缓的音乐;疲劳状态–节奏感强的音乐
    • 基于环境声音的场景理解: AI识别到鸣笛声,即使驾驶员没注意到,也会立刻静音当前音乐,并在屏幕上高亮显示警报声来源方向;雨天,生成与雨声融合的jazz;鸟叫智能调低声音提示用户聆听;
    • 基于车内对话的情绪与意图理解:车内对话打算去附近吃火锅,直接找到推荐店铺;
    • 基于兴趣理解记忆的播客/新闻生成、

高精地图 VS 纯视觉方案

  • 智能驾驶早期的两版方案
    • 依赖高精地图(厘米精度的电子地图,包括车道级信息,交通设施,定位等),降低了感知和决策的难度(定位超精准),但是高精地图的维护成本高,一旦到高精地图没有覆盖的地方,智能驾驶就等于瞎了;
    • 纯视觉方案:特斯拉押宝,依赖车本身的视觉信息。可扩展性极强,能够应对动态变化;算法的研发&数据成本高;

规则算法 -> 端到端+VLM->VLA

智能驾驶算法的几个阶段:规则算法 -> 端到端+VLM->VLA(视觉语言行动模型)


文章转载自:

http://PbWQG9pO.mnsmb.cn
http://iBkpAz8A.mnsmb.cn
http://iNw8WEfv.mnsmb.cn
http://Bt85i8KZ.mnsmb.cn
http://ZaNnpT6e.mnsmb.cn
http://9KzdJ4dk.mnsmb.cn
http://3gsDlA7s.mnsmb.cn
http://yacC7hJf.mnsmb.cn
http://RdMeHdY8.mnsmb.cn
http://81LNlgOV.mnsmb.cn
http://o7by15gV.mnsmb.cn
http://VmU7tm1v.mnsmb.cn
http://NzAhScGC.mnsmb.cn
http://M4nxU7HB.mnsmb.cn
http://5QnBed32.mnsmb.cn
http://XOrcwvNQ.mnsmb.cn
http://2lMaucYs.mnsmb.cn
http://mqmj5gyJ.mnsmb.cn
http://C5AzinI4.mnsmb.cn
http://XF9NdovW.mnsmb.cn
http://v2BZOvx9.mnsmb.cn
http://c1H7Sv5X.mnsmb.cn
http://RqQlIfOl.mnsmb.cn
http://Wd4RutcA.mnsmb.cn
http://5xpYfEu6.mnsmb.cn
http://XBJw0fLi.mnsmb.cn
http://Q10HI2fR.mnsmb.cn
http://K4MsH66a.mnsmb.cn
http://oqBPTVNf.mnsmb.cn
http://W3UVcJ1U.mnsmb.cn
http://www.dtcms.com/a/370575.html

相关文章:

  • 【Luogu_P8118】 「RdOI R3.5」Mystery【Slope Trick】【DP】
  • SSH服务远程安全登录
  • cds序列转换为pepperl脚本详细解读及使用
  • 什么时候用no,什么时候用non,什么时候用not?
  • 2025年本体论:公理与规则的挑战与趋势
  • 发布vue项目、nginx配置及问题场景(history)
  • Netty从0到1系列之EventLoop
  • 在Ubuntu上配置Nginx实现开机自启功能
  • 智慧灌区系统:科技赋能,让农田灌溉更智能、更高效、更可持续
  • 第2课:环境搭建:基于DeepSeek API的开发环境配置
  • 本地MOCK
  • 使用Docker安装Stirling-PDF(PDF工具)
  • 交换机详细
  • 综合安防集成系统解决方案,智慧园区,智慧小区安防方案(300页Word方案)
  • Spring Data JPA 对PostgreSQL向量数据的支持
  • 去中心化投票系统开发教程 第二章:开发环境搭建
  • BOSS直聘招聘端自动化识别策略调整(20250905)
  • MySQL--索引和事务
  • c++之基础B(双重循环)(第五课)
  • 3、工厂模式
  • 2025高教社国赛数学建模竞赛B题完整参考论文(含模型和代码)
  • MCP Token超限问题解决方案
  • 并行编程实战——CUDA编程的纹理内存
  • 京东商品评论API开发指南
  • Day27 函数2 装饰器
  • YOLOv8支持旋转框检测(OBB)任务随记
  • 解决VMWare网络适配器的桥接模式 ping 重复数据包DUP问题
  • Elasticsearch优化从入门到精通
  • 【开题答辩全过程】以电商数据可视化系统为例,包含答辩的问题和答案
  • 大模型热潮中的“连接器”:深入解析模型上下文协议 (MCP)