当前位置: 首页 > news >正文

23-25年总结:23年因为大模型而转型科技,24年起发力具身,25年长沙具身开始一轮轮突飞猛进

注,本文只是先占个坑,很多内容需要抽时间 逐一写,预计25年年底ok


前言

自从之前写了22年下半年总结以后,便一直想总结下23年、24年(至于25年尚未结束),然事情实在是太多太多了

  • 23年,因为chatgpt的诞生,彻底改变了很多人 很多公司的轨迹(包括我个人和我司),使得我司在23年从教育公司全面转型为科技公司,发力并开发了十几个大模型应用
  • ​24年,因为斯坦福mobile aloha/umi/dexcap/idp3,让我司进入了机器人研发领域,全面发力具身智能

今天(25年10.7),我在微博和朋友圈感慨道,十多年的经历,让我发现,评判一个人、或一个公司/一个团队,到底有多牛,最高衡量标准是,对社会有多大益处

我个人认为

  • 如果一个人只是顾全自己 算是活着(无害无利)
  • 如果能促进家庭 甚至家族,则是好的人生
  • 如果还能促进社会,则是牛人

15年 刚开始做教育的时候,我有着非常高的理想,然​,一路浮浮沉沉,一度动摇

​23年感谢大模型,让我再次心中有火,但未完全燃起来

​在经历过24年铺垫、25年长沙具身发力,以及近期一系列痛苦煎熬之后,内心终于开始燃起来了,那就是:和团队通过具身 造福千万人

第一部分 2023年

// 待更

第二部分 2024年

// 待更

第三部分 2025年

3.1 25年1-5月

3.2 25年6-7月,长沙分部第一轮突飞猛进

我在之前的文章中提到过多次,长沙具身团队是我司『七月在线』建设的第二支具身团队,通过5月份的全力招聘,为了冲刺6月底和7月初来长沙办公室考察的第一批客户,过去一个半月来,长沙分部(一开始就5人,另外5人 + 4个实习生后面才逐个逐个进来的) 高速发展

日期(截止到25年7.19日,刚好一个半月 )

机械臂相关

人形相关

6.4

🟢 正值我司注册十周年,在没动南京那边机器的情况下,piper 机械臂 + 宇树 G1 edu 到位

6.6

🟢 VR、吊架到齐

6.8

🟢 VR 可遥操 piper(两人小组,但略有问题,后续解决了后,则更新本行)

6.9–6.13

🟢 长沙分部先后完成键盘 / 手柄 / VR / 主从臂 四种遥操

6.16

🔵 人形硬件补齐(双目+深度相机、3D 打印件)

6.18

🔵 一天搞定VR 遥操宇树 G1(手臂)

(朝阳主刀,july打杂)

摇操是为了做训练数据的采集,从而方便 下一步的模型(策略)训练,最终实现机器人自主做各种任务

6.23

🟢 LeRobot ACT 自主抓杯子(练手项目)

6.24

🟢 抓零食

6.25

🟢 开始耳机线插孔任务(采数据+训练)

6.26

🔵 搞定了让机器人跳舞,且在我司长沙办公室现场让宇树 G1 现场跳查尔斯顿舞

6.27

🔵 再次在长沙办公室给某一车企客户演示了这个查尔斯顿舞

6.29

🟢 文弱在仿真里 100 % 成功抓方块(HIL-SERL)

6.30

🟢 耳机线插孔 自主完成(无遥操)

7.4

🟢 耳机插孔成功率 80 %(纯 IL,无触觉)

7.7–7.11

🟢 openpi 抓零食

相当于因为团队以前经验的积累,加上有朋友的帮助
3天完成openpi在国产臂上的部署 + 数采,2天完成训练、推理

7.12

🟢 openpi 智能分拣
即便被分拣物体被交换了位置,也能成功分拣,毕竟vla还是比单纯il更智能些

🔵 宇树 G1 接入大模型对话

7.19🔵 在7.17才拿到灵巧手的前提下,7.19日,长沙分部同事三天搞定VR遥操灵巧手

总之

  • 机械臂在 6月底完成高难度“耳机线插孔”,7月初快速切换到 openpi
  • 人形则从 6月中补齐硬件,到 6月底就能现场跳舞并对外演示,7月继续拓展大模型交互,以及VR遥操灵巧手

3.3 25年9-11月,长沙分部第二轮突飞猛进

日期

人形manipulation人形loco-manipulation人形locomotion

6.4

9.19

🟢 搞定了GR00T N1.5在人形G1上的部署
『含VR摇操采数据、训练,最后自主执行任务』

🟢 且当晚当即优化出来了第二个版本,全程自主执行抓纸巾,且如果万一没抓住,其会自主尝试直至成功抓取

9.28🔵 9.28日下午 跑通了ASAP
之前有个客户让跳舞,成功之前失败过多次,这次第N个新客户/新项目,涉及走路,先让ASAP来个(自主)小步跳跃的测试,当然了,一般第一版都不咋地

🔵 9.28日晚上,又跑通了宇树开源的RL走路算法 
从而后续便可以扔掉遥控器,调用该算法完成一系列行走-操作
9.29🟢 9.29日上午完成了GR00T N1.5部署在宇树G1上的第3版,自主完成桌面收纳
9.30 自主导航下对我司长沙办公室的SLAM建图

和搬箱子的第一版 第二版

// 待更

http://www.dtcms.com/a/453488.html

相关文章:

  • AI智能体(Agent)大模型入门【7】--构建传统的RAG应用
  • 淮阴区建设局网站网站备案变更公司名称
  • Bittensor 中国巡回 Meetup|上海站
  • S11e Network 商业模型:AI × Web3 × RWA 驱动的实体经济新范式
  • 人脸跟随 ( Channel 实现(缓存5条数据 + 2度过滤 + 平滑移动))
  • 线性表——数组描述
  • 帮客户做网站 没签合同咋办重视网站阵地建设
  • Raven2
  • 面试陷阱:SQL 子查询 vs JOIN 的性能差异
  • 做蛋糕视频的网站非法网站开发
  • 设备管理平台项目部署文档(含自动化脚本)
  • 毕业设计除了网站还可以做啥外贸网站关键词
  • 前端内存泄漏:从原理到实践的全方位解析
  • app手机网站建设黄消防网站模板
  • 成品网站建设咨询怀化最新消息今天
  • 第八章 FPGA 片内 FIFO 读写测试实验
  • 2025年--Lc170--H289. 生命游戏(矩阵)--Java版
  • FC和SFC的原版说明书(扫描的PDF)
  • 网站建设方案文库我们是设计师 网站建设专家
  • 做网站自己买服务器好还是用别人的柳州企业网站建设
  • 震荡市中MACD-KDJ组合的动态参数优化思路
  • 一文了解解耦 Prefilling 与 Decoding(PD 分离)以及典型的 PD 分离方案
  • petri网自学(四)
  • 海思Hi3516CV610/Hi3516CV608开发笔记之环境搭建和固件编译
  • 学生化残差(Studentized Residual):概念、计算与应用
  • 网站建设杭州做rap的网站
  • 华为交换机实战配置案例:从基础接入到核心网络
  • OpenCV(四):视频采集与保存
  • 证券业智能化投研与分布式交易系统架构:全球发展现状、技术创新与未来趋势研究
  • AI Agent竞争进入下半场:模型只是入场券,系统架构决定胜负