AI日报0807 | GPT-5或今晚1点来袭:四大版本全曝光
关注:未来世界2099
每日分享:全球最新AI资讯【应用+商业+技术+其他】
服务:【学习Q】+【资源Q】+【学习资料】+【行业报告】(无限免费下载)
应用
1、讯飞星火代码画布震撼上线:动嘴就能开发,工作效率翻倍!
2、大疆ROMO扫地机器人震撼发布,4399元起开启智能清洁革命
3、Cursor1.4震撼升级:异步长程任务助力大型代码库自动化飞跃
4、Midjourney震撼发布HD视频模式!专业影像品质再升级
5、微软Bing Image Creator免费开放GPT-4o图像生成,AI创作再升级
商业
6、灵心巧手获数亿元融资,全球高自由度灵巧手量产破千台
技术
7、GPT-5重磅来袭!四大版本全曝光,免费用户也能体验神秘功能
8、MiniMax Speech 2.5震撼发布:多语种语音生成再升级,音色复刻逼真度爆表
9、小红书开源多模态大模型dots.vlm1,视觉推理能力直逼Gemini 2.5 Pro
10、通义千问Qwen3-4B小模型震撼更新!手机端也能流畅运行!
11、面壁智能MiniCPM-V 4.0震撼开源:手机端多模态AI迎来革命性突破
12、腾讯AI Lab开源智能体框架,模块化设计助力深度研究革命
13、腾讯开源WeKnora:AI文档解析神器,知识管理迎来革命性突破
14、FlowSpeech震撼登场:AI语音合成技术实现书面语到口语的自然转换
15、微软推出Agent Lightning框架,革新AI代理强化学习训练方式
其他
16、OpenAI以1美元白菜价攻占美国政府市场,ChatGPT企业版大举进军白宫
17、单人AI短剧爆火!《九尾狐男妖爱上我》播放量破1.8亿次
18、AI国际象棋巅峰对决:Grok4惊艳全场,DeepSeek与Kimi K2陷争议漩涡
19、美国紧急启动"ATOM计划"对抗中国开源AI霸主地位
1、讯飞星火代码画布震撼上线:动嘴就能开发,工作效率翻倍!
讯飞星火推出代码画布功能,用户只需一句话、一张草图或一个链接,即可快速生成交互网页和产品原型,大幅提升工作效率,让非技术人员也能轻松实现创意。
核心亮点
🚀一句话生成专业页面,HR、运营等非技术人员也能快速上手使用。
🎨上传草图即可还原产品原型,设计师和创作者能快速实现视觉想法。
💡参考链接复刻同款风格,品牌视觉设计不再需要反复修改调整。
原文链接: https://mp.weixin.qq.com/s/Rk_kgybC2l89RGhdzrK3Ew
2、大疆ROMO扫地机器人震撼发布,4399元起开启智能清洁革命
大疆正式推出扫拖一体机器人ROMO系列,包含S/A/P三型号,配备25000Pa超强吸力和智能感知系统,售价4399元起,重新定义家庭清洁体验。
核心亮点
🐲25000Pa狂暴吸力搭配柔性机械臂,实现100%无死角深度清洁。
🌟透明背盖设计+固态激光雷达,科技感与实用性完美融合。
🍉旗舰款标配UV杀菌除臭模块,打造健康清洁新标准。
原文链接: https://news.aibase.com/zh/news/20290
3、Cursor1.4震撼升级:异步长程任务助力大型代码库自动化飞跃
Cursor1.4版本重磅发布,专注于提升异步和长程任务处理能力,为开发者带来更高效的编码体验,特别优化了大型代码库的自动化进程。
核心亮点
🚀异步任务处理大幅优化,支持自然语言指令启动后台Agent,提升工作效率。
🌐新增多根工作区支持,可同时索引多个代码库,加速复杂依赖关系处理。
🛠️BugBot功能增强,自动审查PR并提供错误反馈,缩短迭代周期。
原文链接: https://news.aibase.com/zh/news/20293
4、Midjourney震撼发布HD视频模式!专业影像品质再升级
Midjourney向Pro和Mega订阅用户推出HD视频模式,分辨率提升4倍,专为广告、影视等专业场景设计。该模式生成成本是标清的3.2倍,但提供无与伦比的细节表现力,延续了平台简洁的工作流程体验。
核心亮点
🎬像素分辨率提升4倍,专业级清晰度满足影视制作高标准需求
💎生成成本达标清3.2倍,但为高端用户提供极致视觉品质保障
🔧无缝集成现有工作流,静态图可一键转换为影院级视频内容
原文链接: https://news.aibase.com/zh/news/20303
5、微软Bing Image Creator免费开放GPT-4o图像生成,AI创作再升级
微软宣布Bing Image Creator现已免费提供OpenAI最新的GPT-4o图像生成模型,为用户带来更强大的AI图像创作体验,支持图片编辑和双模型选择策略。
核心亮点
🐸文本渲染精准度超越DALL-E3,利用知识储备准确理解用户意图。
🍉支持图片上传编辑功能,可作为创意参考生成全新视觉效果。
🌳保留DALL-E3和GPT-4o双模型,用户可自由切换满足不同需求。
原文链接: https://news.aibase.com/zh/news/20320
6、灵心巧手获数亿元融资,全球高自由度灵巧手量产破千台
灵心巧手完成数亿元天使轮融资,由蚂蚁集团领投,成为全球唯一实现高自由度灵巧手千台量产的企业。其工业版灵巧手具备高负载、高自由度特性,推动具身智能技术落地。
核心亮点
🚀全球唯一量产千台高自由度灵巧手,市场份额超80%,领跑行业。
🏭工业版灵巧手负载达20N,寿命超百万次,满足静音生产需求。
💡创新电缸驱动效率达90%,推力200N,性能超传统产品2倍以上。
原文链接: https://mp.weixin.qq.com/s/87I7SHNrS2nw7ig70L2eKA
7、GPT-5重磅来袭!四大版本全曝光,免费用户也能体验神秘功能
OpenAI即将发布GPT-5,据爆料将推出四个不同版本,包括标准版、轻量版、极速版和对话专用版。免费用户将能使用基础版本,而Pro用户可解锁"研究级智能"的高端版本。此外,OpenAI还宣布向所有员工发放150万美元奖金,引发热议。
核心亮点
🚀GPT-5推出四个版本,满足不同场景需求,免费用户也能体验基础功能。
💰OpenAI豪掷150万美元奖金,每位员工都能获得,包括新入职者。
🔍GPT-5 Pro被标注为"研究级智能",性能全面超越前代产品。
原文链接: https://mp.weixin.qq.com/s/1LbWRDILmBl-62q3qLQfBw
8、MiniMax Speech 2.5震撼发布:多语种语音生成再升级,音色复刻逼真度爆表
MiniMax发布新一代语音生成模型Speech 2.5,在多语种表现力、音色复刻精度和语种覆盖范围上实现三大突破,支持40种语言,为企业、创作者和教育者提供全球化语音解决方案。
核心亮点
🎯中文表现全球领先,英文相似度显著提升,40种语言无缝切换无机械感。
🎙️跨语种口音复刻行业天花板,保留地域特色和情绪细节,声动逼真。
🌍新增16种小众语言,覆盖跨境电商、教育等场景,全球化内容一键生成。
原文链接: https://mp.weixin.qq.com/s/4bwpx1kcdtjcBgt_ZmOb4g
9、小红书开源多模态大模型dots.vlm1,视觉推理能力直逼Gemini 2.5 Pro
小红书低调开源多模态大模型dots.vlm1,基于自研视觉编码器构建,在视觉理解和推理任务上表现惊艳,接近SOTA水平,并能解高考数学题、写诗等。
核心亮点
🐸自研12亿参数NaViT视觉编码器,原生支持动态分辨率,性能接近SOTA。
🌳实测表现惊艳,能解数独、高考数学题,甚至模仿李白风格写诗。
🍉两个月内开源三款模型,展现小红书在AI技术自研上的决心与实力。
原文链接: https://mp.weixin.qq.com/s/aftyEJCZleUGAp0s5NBk3w
10、通义千问Qwen3-4B小模型震撼更新!手机端也能流畅运行!
通义千问Qwen3-4B小模型迎来重大更新,优化后可在手机端轻松运行,为用户带来更便捷的AI体验。
核心亮点
🚀Qwen3-4B小模型性能大幅提升,手机端运行毫无压力。
🌟模型优化后体积更小,适合移动设备使用,随时随地享受AI服务。
🍉更新后的模型保持强大功能,满足多样化需求,体验更流畅。
原文链接: https://mp.weixin.qq.com/s/cXAWq0Qkrdh2ag9BcnACPQ
11、面壁智能MiniCPM-V 4.0震撼开源:手机端多模态AI迎来革命性突破
面壁智能开源新一代多模态模型MiniCPM-V 4.0,仅4B参数量即实现同级SOTA性能,支持手机端流畅运行,在多个评测基准中超越GPT-4.1-mini等大模型,同时开源配套部署工具。
核心亮点
🚀4B参数实现同级SOTA,性能超越GPT-4.1-mini,手机端运行丝滑流畅。
📱显存占用仅3.33GB,首响时间大幅缩短,完美适配移动设备需求。
🔥256并发吞吐量达13856tokens/s,远超同类模型,展现强大计算效率。
原文链接: https://news.aibase.com/zh/news/20304
12、腾讯AI Lab开源智能体框架,模块化设计助力深度研究革命
腾讯AI Lab推出开源智能体框架Cognitive Kernel-Pro,采用多模块层次化设计,降低外部依赖,提升研究可复现性,在GAIA基准测试中表现优异。
核心亮点
🐲模块化结构设计,主智能体与子智能体分工协作,确保独立扩展性。
🌳创新"进度状态"机制,智能记录任务步骤,显著提升复杂任务效率。
🍉开源训练配方公开,配套Agent Foundation Model推动社区共同发展。
原文链接: https://news.aibase.com/zh/news/20313
13、腾讯开源WeKnora:AI文档解析神器,知识管理迎来革命性突破
腾讯正式开源基于大语言模型的文档理解与检索工具WeKnora,专为处理复杂多模态文档设计,为企业知识管理、学术研究和行业应用提供强大技术支持,推动文档处理技术向智能化发展。
核心亮点
🐲支持多模态文档解析,从PDF、Word、图片等格式提取结构化内容。
🌟基于大语言模型的上下文理解能力,支持精准问答和多轮对话功能。
🍉采用模块化设计,灵活适配不同行业需求,便于集成和功能扩展。
原文链接: https://news.aibase.com/zh/news/20315
14、FlowSpeech震撼登场:AI语音合成技术实现书面语到口语的自然转换
FlowSpeech是一款创新的AI文本转语音工具,能够将书面文字转换为自然流畅的口语表达,为用户提供更贴近真实对话的语音合成体验。其技术突破在于解决了书面语与口语之间的表达差异问题。
核心亮点
🐸通过上下文感知技术,深度理解文本语义,生成生动自然的语音输出。
🌳具备智能内容筛选功能,自动识别并剪裁不适合朗读的干扰元素。
🍓应用场景广泛,从有声书制作到教育培训,提升用户体验和沉浸感。
原文链接: https://news.aibase.com/zh/news/20321
15、微软推出Agent Lightning框架,革新AI代理强化学习训练方式
微软研究院发布Agent Lightning强化学习框架,通过创新的解耦设计,能够统一训练不同架构的AI代理系统,解决现有框架通用性和灵活性不足的问题。
核心亮点
🐸采用解耦设计思路,将AI代理执行与强化学习训练完全分离,提升通用性。
🌳配套LightningRL分层强化学习算法,能合理分配任务整体奖励到每个动作步骤。
🍉支持多代理协作和复杂工具调用,测试中在文本转SQL等任务表现持续提升。
原文链接: https://news.aibase.com/zh/news/20324
16、OpenAI以1美元白菜价攻占美国政府市场,ChatGPT企业版大举进军白宫
OpenAI宣布以每份1美元的象征性价格向美国联邦机构提供ChatGPT Enterprise订阅服务,旨在让政府工作人员几乎免费使用其AI技术,同时计划在华盛顿特区开设办事处加强政府合作。
核心亮点
🐸1美元超低价策略打破市场常规,快速渗透美国政府核心部门。
🚀与GSA合作提供60天高级语音模式体验,展示技术实力。
🌐华盛顿特区办事处即将设立,深化政府关系布局长远发展。
原文链接: https://news.aibase.com/zh/news/20291
17、单人AI短剧爆火!《九尾狐男妖爱上我》播放量破1.8亿次
AI技术推动短剧制作革命,单人团队打造的《九尾狐男妖爱上我》在社交平台爆红,播放量突破1.8亿次,全流程自动化生成仅需数小时。
核心亮点
🦊单人团队完成全流程制作,AI短剧制作周期缩短至数小时。
🎬《九尾狐男妖爱上我》播放量破1.8亿,展现AI内容创作潜力。
💰商业化仍在探索阶段,从业者月收入普遍在五位数左右。
原文链接: https://news.aibase.com/zh/news/20309
18、AI国际象棋巅峰对决:Grok4惊艳全场,DeepSeek与Kimi K2陷争议漩涡
首届AI国际象棋大赛由谷歌与Kaggle联合举办,Grok4凭借超凡战术表现成为首日焦点,而DeepSeek R1和Kimi K2则因争议性结果引发热议,赛事成为AI决策能力的试金石。
核心亮点
🐉Grok4展现惊人实力,首日比赛即成为全场最亮眼的明星选手。
🎭Kimi K2因频繁违规面临淘汰,引发观众对比赛公平性的质疑。
🌐国际象棋复杂规则成为测试AI"涌现能力"的完美实验场。
原文链接: https://news.aibase.com/zh/news/20311
19、美国紧急启动"ATOM计划"对抗中国开源AI霸主地位
面对中国在开源AI领域的迅猛发展,美国正式启动"ATOM计划",旨在重新夺回全球AI领导权。该计划将建立非营利性AI实验室,配备超万块先进GPU芯片。
核心亮点
🚀中国开源AI模型占据全球性能前15中的5席,全部由中国企业开发。
🐲美国集结科技巨头与学界领袖,组建万人GPU算力联盟应对挑战。
🌐计划发起人警告:若不迅速行动,美国将失去AI技术发展方向话语权。
原文链接: https://news.aibase.com/zh/news/20323