Cyber Weekly #63
赛博·新闻
1、阿里持续开源Qwen3新模型
阿里通过一周内连续发布三款顶尖开源模型,系统性打破“闭源模型更强”的行业偏见,展现其AI研发的体系化实力与持续迭代能力。
- 通用模型标杆:Qwen3-235B-A22B(非思考版)在GPQA、AIME25等专业评测中全面领先,被权威机构Artificial Analysis认证为“全球最智能的非思考基础模型”,甚至超越Claude 4 Opus等闭源模型,同时支持256K上下文,显著提升长文本理解能力。
- 编程模型突破:Qwen3-Coder-480B以480B参数MoE架构(激活35B)实现开源领域SOTA,原生支持256K上下文(可拓展至1M),在Agentic Coding、浏览器交互等任务中媲美Claude 4 Sonnet;配套工具链Qwen Code进一步优化开发效率。
- 推理模型巅峰:Qwen3-235B-A22B-Thinking-2507在SuperGPQA、LiveCodeBench等推理任务中比肩Gemini-2.5 Pro、o4-mini,刷新开源推理性能上限,原生256K上下文支持深度多步思考。
开发者反响印证成功:HuggingFace CEO公开称赞模型质量,OpenRouter调用量飙升至趋势榜前三,反映全球开发者的主动采纳。阿里以五年3800亿投入为支撑,通过高频、高质量开源迭代,推动AI技术民主化——从昙花一现的刷榜,转向可持续的生态赋能,为开发者提供“稳稳的幸福”,彻底改写开源与闭源的竞争格局。
2、字节扣子宣布开源多个项目
日前,字节跳动旗下扣子(Coze)正式开源两个核心项目:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)。两个项目均采用 Apache 2.0 许可证。据悉,Coze Studio 是字节跳动新一代 AI Agent 开发平台扣子(Coze)的开源版本。通过 Coze Studio 提供的可视化设计与编排工具,开发者可以通过零代码或低代码的方式,快速打造和调试智能体、应用和工作流,实现强大的 AI 应用开发和更多定制化业务逻辑。而 Coze Loop 是一个面向开发者,专注于 AI Agent 开发与运维的平台级解决方案。 它可以解决 AI Agent 开发过程中面临的各种挑战,提供从开发、调试、评估、到监控的全生命周期管理能力。本次开源版本免费对开发者开放核心基础功能模块,以开源模式共享核心技术框架,开发者可根据业务需求定制与扩展。
- Coze Studio:https://github.com/coze-dev/coze-studio?tab=readme-ov-file
- Coze Loop:https://github.com/coze-dev/cozeloop?tab=readme-ov-file
3、智谱开源最新旗舰模型GLM-4.5
智谱最新推出的GLM-4.5是一款专为Agent应用打造的开源旗舰模型,采用混合专家架构(MoE),提供GLM-4.5(3550亿总参数/320亿激活参数)和GLM-4.5-Air(1060亿总参数/120亿激活参数)两个版本,已在Hugging Face与ModelScope平台以MIT License开源,支持混合推理模式,API调用成本低至输入0.8元/百万tokens、输出2元/百万tokens,生成速度高达100 tokens/秒。该模型首次在单个模型中融合推理、编码和智能体能力,在MMLU Pro、AIME 24等12个评测基准中综合排名全球第三、国产第一、开源第一,并通过52个真实编程任务的实战测试证明其工具调用可靠性和任务完成度优异,如Demo中可一句话生成功能完备的搜索引擎或交互式3D地球页面,且兼容Claude Code等主流框架。技术上,凭借高效参数设计(如GLM-4.5-Air以较小参数量逼近Gemini 2.5 Flash性能),结合15万亿通用数据和8万亿领域数据的预训练及强化学习,实现性能与成本的双重突破,被OpenAI点名认可其在全球AI竞赛中的进展,凸显智谱作为国产厂商在开源迭代、技术稳定性和商业化节奏上的领先优势。
4、阶跃星辰发布新一代基模Step 3
阶跃星辰在WAIC 2025前夕发布新一代开源基础大模型Step 3,该模型采用MoE架构(321B总参数/38B激活参数),以“强智能、低成本、可开源、多模态”为核心设计理念,成为推理时代面向应用场景的标杆产品。其原生多模态能力在MMMU、MathVision等榜单达开源SOTA水平,可精准完成反光菜单识别、消费分摊计算等复杂任务;通过系统架构创新实现极致推理效率,在国产芯片上效率达DeepSeek-R1的300%,Hopper架构芯片吞吐量提升超70%,显著降低部署成本。阶跃同步构建“1+N”模型矩阵,升级Step 3o Vision多模理解生成一体化模型及Step-Audio 2语音模型,并联合华为昇腾、沐曦等近十家芯片厂商成立“模芯生态创新联盟”,推动全产业链协同创新——与上海国投达成深度战略合作,在手机Agent(覆盖超半数国产头部厂商)、汽车AI座舱(与吉利合作实现端到端语音模型首次量产上车)及金融、零售等垂直领域加速落地,7月31日开源后将贡献全球最强开源多模态推理能力。
5、 豆包上线视觉深度推理功能
7月29日,豆包App视觉推理能力升级,图片分析支持深度思考。在深度思考模式下,用户拍摄或上传一张图片,豆包就能对图片放大、裁剪,并支持图片搜索,边想边搜,进一步提升结果的准确性。
6、Manus推出多线程任务处理功能Wide Research
7月31日,Manus宣布推出新功能Wide Research。该功能会同时调用大量Agent协同工作,将大规模任务分拆成多个同时运行的子任务,在数分钟内完成诸如「批量生成100张不同的海报」「生成100份针对不同宾客的个性化请柬」「分析100只股票近期的市场走势」之类的并行工作。在Manus看来,Wide Research的价值在于将「利用云计算自定义工作流程」这件事变得简单——每个Manus会话背后都运行着基于云的虚拟机,因此现在用户可以通过Agent来编排工作流程。Wide Research现已开放给月费199美元的Manus Pro用户使用,后续也会向月费39美元的Plus用户和月费19美元的Basic用户开放。
赛博·洞见
1、黄仁勋交流会15000字实录:谈中美芯片、H20、CUDA兼容,信息量超大
英伟达CEO黄仁勋今年第三次访华,出席链博会开幕式并表达诚意,强调中国供应链高度发达、基础设施完善、生态系统成熟、制造规模庞大,是构成全球AI硬件和智能工厂建设的重要基础。他不介意中国厂商开发兼容CUDA的平台,认为技术生态互联互通是产业演进关键。H20芯片已获重新批准销售,英伟达将推动更多Blackwell架构产品落地中国,如RTX Pro专为数字孪生和机器人设计。黄仁勋高度评价中国在AI模型、工程人才和产业应用的全球领先地位,指出中国教育系统培养了世界50%的AI研究人员,DeepSeek等开源模型是革命性突破。他赞扬中国电动汽车产业,如小米、蔚来和小鹏重塑全球竞争格局,并称华为在芯片和光子技术方面值得学习。针对AI发展,他划分四个阶段:感知、生成、推理和机器人,强调当前算力需求巨大且不足,存在“算力焦虑”,未来AGI可能很快实现但需明确定义。黄仁勋日常使用OpenAI、Gemini Pro等多款AI工具进行交叉验证,鼓励年轻人保持热情进入AI领域,认为机遇持续存在。
2、星流/美图/Manus...6大主流视频Agent横测,我们在1句成片这条路上走了多远?
视频Agent技术已显著进步,能在创意和demo阶段高效辅助人类完成视频制作任务,通过实测AIpai、星流、纳米AI、美图RoboNeo、Flowith和Manus六款产品,作者使用统一提示语生成剧情短片和产品广告视频,发现纳米AI和AIpai在画面一致性、剧情完整性及交互体验上表现较优,星流动画精美但镜头连贯性不足,RoboNeo艺术化处理强但分镜数量少,Flowith和Manus存在输出格式或一致性缺陷;尽管视频Agent目前分镜较少、动态感弱、AI配音明显,尚无法直接商用,但已能大幅降低比稿预演等场景的时间与人力成本,证明AI是创作搭档而非替代者,通过协作激发创意、提升效率,未来视频制作将演化为人类与AI共同推动表达自由的合作过程。
3、AI 教父 Hinton 中国首次演讲实录:人类可能就是大语言模型|WAIC 2025
WAIC 首日,便以重磅嘉宾开场——诺贝尔奖得主,人工智能教父 Geoffrey Hinton,发表了开幕演讲。Geoffrey Hinton在演讲中追溯AI从符号主义与连接主义范式的发展,指出大语言模型通过多维特征组合理解语言的方式类似人类,但AI具备知识永生、低能耗和高效率等优势,可能超越人类智能并带来失控风险,因此呼吁建立国际AI安全研究网络以全球合作确保AI向善;MiniMax CEO闫俊杰则基于十五年AI研发实践,强调AI是普惠性生产力工具,能通过生成创意内容(如半年产出超三亿条视频)大幅降低个体创作门槛、增强社会能力,并论证AI不会被垄断——因模型对齐目标多样化、多智能体系统兴起、开源模型性能逼近闭源,以及推理成本指数级下降(未来或再降十倍),使AGI成为全社会共同实现的成果,最终服务于每个人而非少数组织。两位讲者共同指向AI需在技术突破与安全治理中寻求平衡,实现可持续的普惠价值。
4、上市首日暴涨 250%,All in AI 战略,拆解 Figma 的核心竞争力到底是什么?
Figma在纽交所成功上市,成为今年美股最大IPO,开盘后股价飙升250%,市值达到680亿美元。Figma已从单纯的UI/UX设计工具转型为覆盖前端工作全流程的协作平台,用户群包括设计师、前端工程师和产品经理各占三分之一,月活达1300万。通过Cloud-based协作和PLG策略,Figma实现增长飞轮,并推出AI产品Figma Make,该产品高度AI-native,内嵌于工作流支持设计稿一键生成代码,提升开发效率,同时集成品牌资产库确保一致性。增长驱动力包括用户渗透(如前端工程师比例提升)、企业级变现(ARR超10万美元客户增长47%)和国际化潜力(非美用户占比85%但收入贡献低),但面临1-2年后增长中枢下滑风险。长期来看,Figma旨在成为AI时代的“前端协作开发操作系统”,推动设计与代码一体化,尽管需应对AI颠覆前端工作流和竞争挑战。其IPO和AI战略凸显生态优势,但需持续迭代以维持领导地位。
5、AI Agent的终极未来|3万字圆桌实录
AI智能体圆桌讨论围绕其定义、形态、挑战与未来达成核心共识:智能体是以大模型为驱动、具备记忆、规划与工具调用能力的任务执行系统(张俊九),核心价值在于"完成任务"(廉和)或成为"人机协作接口"(揭光发),未来将演进为AI原生应用的主流形态。技术挑战集中在上下文记忆管理、幻觉控制及复杂任务稳定性(揭光发),当前产品形态分为内嵌基模型(如DeepResearch)与独立工程化Agent(如Cursor),前者体验流畅但成本高,后者灵活适配垂直场景。商业化路径分化:C端需解决用户付费意愿问题,或通过Agent间服务竞争形成新广告生态(廉和);B端以流程提效为先,短期聚焦SOP场景替代人力(张俊九),长期或催生"数字员工"服务模式。爆发依赖基模幻觉率大幅降低(如GPT-5突破)与多模态上下文支持,物理世界智能体(具身智能)被视为补全AGI的关键拼图。终极图景中,Agent将成为社会主流生产力(揭光发),推动人类向创造性价值领域迁移,但需警惕能力依赖导致成长停滞。
6、OpenAI 前首席研究官:AGI 核心突破已实现
在Sequoia Capital播客中,OpenAI前首席研究主管Bob McGrew指出,通用人工智能(AGI)发展的三大支柱——Transformer架构、规模化预训练和逻辑推理能力——已奠定未来十年技术基础,2025年成为“逻辑推理元年”,逻辑推理领域存在算力、数据和算法效率提升的巨大空间,是当前最大机遇,但预训练收益递减。智能体将商品化,服务定价基于算力成本而非人类稀缺性,颠覆法律和医疗等行业;专有数据价值在减弱,因AI能复制人类劳动,仅客户授权数据例外。创业公司应在机器人技术(受益语言交互与视觉进步)或企业应用(如Palantir和Distyl的深度业务整合方案)中寻找机遇,避免与顶级实验室竞争。整体上,AI发展聚焦根本性转变,强调AGI技术路径已成型。
赛博·资源
1、Will’s GenAI网页产品数据 2025年6月
Will发布了2025年6月生成式AI产品全球数据榜单,涵盖19个核心榜单,基于Similarweb数据(单位:万访问量),旨在揭示AI市场的竞争格局和发展趋势。全球总榜显示ChatGPT以绝对优势领先,出海总榜和国内总榜突显中国产品的崛起,如阿里通义千问月访问量达5313万;增速榜亮点包括Chaport环比增长215%、Kimi.com国内增长130%,以及早期产品如MiniMax Agent激增784%。榜单细分到AI Chatbots、搜索引擎、虚拟角色、Agent等12个类别,展示各领域领导者(如Character.ai在聊天机器人领先)和新兴力量(如Black Forest Labs图像生成增长597%)。核心观点是通过数据快照呈现AI行业的快速演进,强调中国市场在全球的强劲表现(如Kimi.com 87%流量来自中国)、高增长产品的创新潜力,以及生成式AI在视频、图像、编程等场景的广泛应用,为行业提供实时洞察和竞争参考,反映技术全球化与本地化并存的特征。
2、DeepSeek半年之后 I 哪些职业受AI影响最大?
基于2024年6月至2025年5月的全网社媒大数据分析,《AI浪潮下的职业真实图景分析》揭示DeepSeek技术爆发推动AI讨论从技术探索转向场景落地,职场提效与自我成长成为核心议题。程序员、医生、教师位列受AI影响最大的TOP3职业,其中程序员情感值在DeepSeek后上升至36%,体现AI作为效率工具(如代码生成)和职业机遇(大模型人才稀缺),但引发岗位两极分化和能力退化争议;医生情感值从82%降至69%,AI虽辅助诊断全流程提升效率与资源平衡,却挑战专业权威并可能延误治疗;教师情感值降至67%,AI优化教学效率和学科互动(如数学动态建模、语文智能批改),但面临AI写作伦理困境和形式主义压力;设计师情感值骤降至64%,AI驱动创意拓展和工作流优化,但加剧行业低价内卷与版权风险;心理咨询师情感值跌至60%,AI打破地域限制提供情绪支持与专业辅助,但衍生信任危机和情感退化隐忧。整体而言,AI重构职业图景,在释放效率红利(如自动化低效任务)的同时,伴随岗位替代、责任界定和人类独特价值(如医生决策责任、教师情感关怀)的深层挑战,凸显技术革新对职业生态的双刃剑效应。
3、QuestMobile2025 中国移动互联网半年大报告
2025年上半年中国移动互联网呈现稳健增长与深度变革:全网月活跃用户达12.67亿(同比增长2.5%),用户黏性显著提升,人均单日使用时长7.97小时、频次117.9次;增量主要来自年轻及银发群体,用户加速向一线城市聚集。头部企业格局分化,腾讯、阿里、抖音、百度组成超11亿用户的第一梯队,京东、抖音用户量同比大增13%/12%,而即时零售赛道竞争白热化(淘宝/京东/美团重合用户3.88亿,+22.8%)。AI技术全面渗透各行业,AI原生App(如DeepSeek用户增1.63亿)、应用插件(微信AI搜索增1.63亿)、PC网页端(百度AI助手增1306万)三态并行,AI搜索引擎成最大黑马赛道,80%的TOP30应用由互联网巨头主导,百度、阿里、抖音、腾讯分别侧重技术、电商、内容与社交生态。广告市场Q2规模超2000亿元(+6.8%),36.3%品牌硬广投放超千万,美妆国产品牌加速品牌建设(品牌广告占比升至7.4%)。文旅消费爆发带动在线旅游用户1.56亿(+4.4%),携程/美团/京东重合用户6521万(+20.4%),"演唱会经济"与"村超苏超"现象推动文体旅融合;618大促驱动电商增长,京东闪购、抖音货架场、美团即时零售成新引擎,云闪付MAU1.88亿(+80%)借国补政策跃升。金融领域加速AI化,证券智能投顾成刚需,预示技术驱动下的生态重构与消费升级持续深化。
4、AI产品进入淘汰赛阶段!TOP5占据超半数市场,千万级新增仅豆包夸克
2025年上半年,国内AI产品格局经历显著洗牌,用户增长路径从“拼规模”转向“提粘性”,流量红利见顶导致竞争全面内卷,互联网大厂如字节、阿里、腾讯重掌主导权,AI产品进入第二轮同质化淘汰赛的“大鱼吃小鱼”阶段。数据显示,6月Web端总访问量达6亿、月活超1.25亿,APP端单月新增下载1.3亿、日活破2亿,但增速普遍放缓,Web端访问量不及3月峰值,APP端新增下载环比下滑15%。市场马太效应加剧,TOP 5产品(豆包、夸克、DeepSeek等)占Web与APP端超50%份额,头部集中化明显:APP端豆包和夸克垄断新增与DAU榜首(H1下载均超1.5亿),Web端DeepSeek、夸克、豆包占45%访问量。AI智能助手仍为核心刚需,占APP端DAU近40%,而深度研究、全模态及Agentic产品(如星流、天工Skywork)成为新赛点;但同质化竞争下,中小玩家突围空间有限,行业迈入存量淘汰周期。