人工智能领域、图欧科技、IMYAI智能助手2025年6月更新月报
2025年6月AI领域重要模型更新与平台优化汇总
摘要: 本文汇总了2025年6月期间AI领域发布的多项重要模型更新及平台功能优化信息,涵盖Google Gemini、阿里通义万相、字节豆包、百度文心一言、MiniMax海螺02、Google Veo3、快手可灵2.1、FLUX Kontext等模型的最新进展,以及IMYAI平台的相关功能调整与体验优化。
2025年06月29日
- Gemini Deep Research 功能上线(后续因难以维护已下线): Google Gemini 模型推出创新功能“Gemini Deep Research”,旨在辅助用户高效处理复杂研究任务。该功能通过自动化流程,将用户需求转化为结构化研究计划,经用户确认后,系统将自主进行网络信息搜索,并根据搜索结果迭代优化分析,最终生成包含关键发现及原始来源链接的详细报告。其核心优势在于“深度”与“迭代”特性,能够根据新线索调整搜索方向,确保报告的全面性与准确性。该功能基于 Gemini 2.5 Pro 模型,支持多模态(文本、图像、视频)分析,结合 Google 搜索索引与知识图谱技术提供高质量结果。用户仅需输入研究问题,即可在较短时间内获得专业级报告,适用于研究人员、学生及商业用户进行跨领域知识密集型分析。
2025年06月28日
-
IMYAI 平台优化与更新:
-
付费扩展包入口调整: AI视频板块付费扩展包的额度显示UI已优化,购买与充值入口移至左侧栏底部。
-
AI视频模型上新:通义万相(Wan2.1):阿里云推出的视频生成模型,支持文生视频、图生视频(支持中英文提示)。该模型能够精准模拟物理规律(如碰撞、反弹)以提升画面逼真度,并在影视质感与指令遵循方面表现突出。其中,Wan2.1-14B-Turbo为14B模型的加速版,单个视频生成时间压缩约30%。注: 该模型在IMYAI平台仅消耗高级积分额度,不消耗付费拓展包,平台高级会员及永久会员可无限次使用。
-
BUG修复: 修复了特定情况下(如图片尺寸过大或过长)上传图片卡在99%的问题。
-
2025年06月24日
- AI视频模型上新:字节豆包 Doubao-Seedance-1.0-pro: 字节跳动推出的先进AI视频生成模型(即梦3.0 Pro同款)。在Artificial Analysis评测中,其文生视频与图生视频能力均位列全球第一。支持文字/图片输入,可生成10秒1080p高清视频,具备2-3个镜头的无缝切换能力,强调镜头连贯性与内容稳定性。在视觉质量、创意性及提示词理解方面表现优异。
2025年06月23日
- 多款AI视频模型集中上线:
- 海螺02 (Hailuo 02 - MiniMax): 参数量与训练数据量分别为前代3倍与4倍,擅长生成符合物理规律的高质量复杂场景视频(如体操翻转、喷火特效、城市特技、玻璃倒影),在镜头运动与动态效果上表现突出,风格化能力强。
- Veo3 (Google): 先进的文生视频模型,可生成高质量视频内容并自动匹配音频,创造沉浸式体验(如4K ASMR视频、穿越历史场景的Vlog)。推动了AI视频内容的创新与普及。注: 官网API暂不支持图生视频。
- 可灵2.1 (Kuaishou): 相比前代,在人物动作、场景细节(如蝴蝶飞行、花瓣飘动)方面物理真实感更高,语义理解能力优化。适用于短视频、广告、教育及影视预览。注: 官网暂不支持文生视频。
2025年06月20日
- 功能更新: Gemini 2.5 Pro(最新正式版)已支持通过提示词(如“画一张XX”)触发文生图功能。
2025年06月18日
-
重要模型上线:
-
Google Imagen 4: 新一代文生图模型。显著提升图像质量、细节呈现(如织物纹理、水滴折射、动物毛发)与文本渲染能力,支持生成2K分辨率图像及多种艺术风格(超现实主义、抽象艺术、插图、摄影等)。
-
Gemini 2.5 Pro (正式版): Google旗舰多模态大模型(由06-05预览版升级)。在编程、推理、科学、数学领域表现卓越(LMArena 1470分,WebDevArena 1443分,Aider Polyglot 82.2%通过率超越Claude Opus 4与DeepSeek R1)。支持100万token上下文,可处理文本、图像、音频、视频等多模态复杂任务。
-
MiniMax-m1 (同期上线): 国产推理模型上线,实际测试表现(如解答高考数学题)有待进一步观察。
-
2025年06月16日
- 功能上线:即梦图生图3.0: 即梦3.0(AI中文海报设计模型)的全量图生图能力已开放。用户可基于上传图片进行重绘与设计,保持良好一致性,中文显示稳定性优于前代,适用于海报制作。
2025年06月13日
- IMYAI 平台体验优化:
- AI对话: LaTeX数学公式排版渲染优化,独立公式居中排列,视觉效果提升。
- AI绘画:
-
垫图粘贴框UI优化。
-
进入相册视图自动收起左侧栏,扩大视野。
-
模型选择列表UI优化,整理归类更清晰。
-
GPT-4o多模态生图支持通过提示词(“尺寸为横屏/竖屏”或“尺寸:16:9/9:16”)控制输出比例(实际分辨率受限于官方规格,如横屏为1536×1024)。
-
2025年06月11日
- 模型上新:百度文心一言系列:
- ERNIE-4.5-Turbo: 知识增强大模型,在去幻觉、逻辑推理、代码能力方面有提升。相比4.5版本速度更快。支持多轮长对话和长文档理解,适用于中文知识问答、创作、写作、对话、推理、计算及工具调用。
- ERNIE-X1-Turbo: 专注于推理任务,性能与DeepSeek R1相当。具备深度思考能力,擅长多模态推理与高级工具使用(高级搜索、图像生成/解释、网页阅读、TreeMind概念映射等)。
2025年06月06日
- 知识库更新: FLUX Kontext 玩法教程已上线。
2025年06月04日
- 模型上线与平台更新:
- FLUX Kontext (专业绘画板块): 支持图生图。实测表明,上传单张参考图效果最佳。提示词模板建议:【人物样貌和姿势保持不变,背景改为XXX,服装改为XXX(或保持不变)】。
- 平台UI/功能优化:
- 专业绘画板块新增“相册布局”,支持调整图片展示数量、多选图片批量收藏/下载。
- 合并导出图片、文档及分享对话为链接按钮至功能栏。
- 优化语音播报(降低延迟,提高速度)、Suno音乐播放器UI等细节。
- 网站稳定性整体提升。
2025年06月03日
- 模型上线:
-
FLUX Kontext (AI对话板块): Black Forest Labs开发的多模态图文生成与编辑工具。核心优势包括:角色一致性(多次修改保持关键元素一致)、精准局部编辑、风格迁移(油画、3D渲染等)、快速交互(1024×1024图生成约3-5秒)。FLUX-Kontext-pro适合快速迭代,FLUX-Kontext-max追求极致输出质量。
-
秘塔搜索升级:
- 极速模式: 最高处理速度达400 tokens/秒,大部分问题响应在2秒内,准确率与逻辑清晰度提升。
- 学术模式: 聚焦专业期刊/论文检索,提供摘要预览与原文链接跳转,支持中英文文献搜索。
-
2025年06月01日
- 新站点上线: IMYAI Midjourney+Grok 直连站正式开放。该站点功能与玩法更为丰富,UI界面还原官网,模型数据由官方账号实时传递。访问地址:https://ai.imyaichat.com。相关卡密可在商城获取。