当前位置：首页 > news >正文

人工智能领域、图欧科技、IMYAI智能助手2025年6月更新月报

news 2025/11/3 21:23:00

2025年6月AI领域重要模型更新与平台优化汇总

摘要： 本文汇总了2025年6月期间AI领域发布的多项重要模型更新及平台功能优化信息，涵盖Google Gemini、阿里通义万相、字节豆包、百度文心一言、MiniMax海螺02、Google Veo3、快手可灵2.1、FLUX Kontext等模型的最新进展，以及IMYAI平台的相关功能调整与体验优化。

在这里插入图片描述

2025年06月29日

Gemini Deep Research 功能上线（后续因难以维护已下线）： Google Gemini 模型推出创新功能“Gemini Deep Research”，旨在辅助用户高效处理复杂研究任务。该功能通过自动化流程，将用户需求转化为结构化研究计划，经用户确认后，系统将自主进行网络信息搜索，并根据搜索结果迭代优化分析，最终生成包含关键发现及原始来源链接的详细报告。其核心优势在于“深度”与“迭代”特性，能够根据新线索调整搜索方向，确保报告的全面性与准确性。该功能基于 Gemini 2.5 Pro 模型，支持多模态（文本、图像、视频）分析，结合 Google 搜索索引与知识图谱技术提供高质量结果。用户仅需输入研究问题，即可在较短时间内获得专业级报告，适用于研究人员、学生及商业用户进行跨领域知识密集型分析。

2025年06月28日

IMYAI 平台优化与更新：
- 付费扩展包入口调整： AI视频板块付费扩展包的额度显示UI已优化，购买与充值入口移至左侧栏底部。
- AI视频模型上新：通义万相（Wan2.1）：阿里云推出的视频生成模型，支持文生视频、图生视频（支持中英文提示）。该模型能够精准模拟物理规律（如碰撞、反弹）以提升画面逼真度，并在影视质感与指令遵循方面表现突出。其中，Wan2.1-14B-Turbo为14B模型的加速版，单个视频生成时间压缩约30%。注：该模型在IMYAI平台仅消耗高级积分额度，不消耗付费拓展包，平台高级会员及永久会员可无限次使用。
- BUG修复： 修复了特定情况下（如图片尺寸过大或过长）上传图片卡在99%的问题。

2025年06月24日

AI视频模型上新：字节豆包 Doubao-Seedance-1.0-pro： 字节跳动推出的先进AI视频生成模型（即梦3.0 Pro同款）。在Artificial Analysis评测中，其文生视频与图生视频能力均位列全球第一。支持文字/图片输入，可生成10秒1080p高清视频，具备2-3个镜头的无缝切换能力，强调镜头连贯性与内容稳定性。在视觉质量、创意性及提示词理解方面表现优异。

2025年06月23日 在这里插入图片描述

多款AI视频模型集中上线：
- 海螺02 (Hailuo 02 - MiniMax)： 参数量与训练数据量分别为前代3倍与4倍，擅长生成符合物理规律的高质量复杂场景视频（如体操翻转、喷火特效、城市特技、玻璃倒影），在镜头运动与动态效果上表现突出，风格化能力强。
- Veo3 (Google)： 先进的文生视频模型，可生成高质量视频内容并自动匹配音频，创造沉浸式体验（如4K ASMR视频、穿越历史场景的Vlog）。推动了AI视频内容的创新与普及。注：官网API暂不支持图生视频。
- 可灵2.1 (Kuaishou)： 相比前代，在人物动作、场景细节（如蝴蝶飞行、花瓣飘动）方面物理真实感更高，语义理解能力优化。适用于短视频、广告、教育及影视预览。注：官网暂不支持文生视频。

2025年06月20日 在这里插入图片描述

功能更新： Gemini 2.5 Pro（最新正式版）已支持通过提示词（如“画一张XX”）触发文生图功能。

2025年06月18日

重要模型上线：
- Google Imagen 4： 新一代文生图模型。显著提升图像质量、细节呈现（如织物纹理、水滴折射、动物毛发）与文本渲染能力，支持生成2K分辨率图像及多种艺术风格（超现实主义、抽象艺术、插图、摄影等）。
- Gemini 2.5 Pro (正式版)： Google旗舰多模态大模型（由06-05预览版升级）。在编程、推理、科学、数学领域表现卓越（LMArena 1470分，WebDevArena 1443分，Aider Polyglot 82.2%通过率超越Claude Opus 4与DeepSeek R1）。支持100万token上下文，可处理文本、图像、音频、视频等多模态复杂任务。
- MiniMax-m1 (同期上线)： 国产推理模型上线，实际测试表现（如解答高考数学题）有待进一步观察。

2025年06月16日 在这里插入图片描述

功能上线：即梦图生图3.0： 即梦3.0（AI中文海报设计模型）的全量图生图能力已开放。用户可基于上传图片进行重绘与设计，保持良好一致性，中文显示稳定性优于前代，适用于海报制作。

2025年06月13日

IMYAI 平台体验优化：
1. AI对话： LaTeX数学公式排版渲染优化，独立公式居中排列，视觉效果提升。
2. AI绘画：
  - 垫图粘贴框UI优化。
  - 进入相册视图自动收起左侧栏，扩大视野。
  - 模型选择列表UI优化，整理归类更清晰。
  - GPT-4o多模态生图支持通过提示词（“尺寸为横屏/竖屏”或“尺寸：16:9/9:16”）控制输出比例（实际分辨率受限于官方规格，如横屏为1536×1024）。

2025年06月11日 在这里插入图片描述

模型上新：百度文心一言系列：
- ERNIE-4.5-Turbo： 知识增强大模型，在去幻觉、逻辑推理、代码能力方面有提升。相比4.5版本速度更快。支持多轮长对话和长文档理解，适用于中文知识问答、创作、写作、对话、推理、计算及工具调用。
- ERNIE-X1-Turbo： 专注于推理任务，性能与DeepSeek R1相当。具备深度思考能力，擅长多模态推理与高级工具使用（高级搜索、图像生成/解释、网页阅读、TreeMind概念映射等）。

2025年06月06日 在这里插入图片描述

知识库更新： FLUX Kontext 玩法教程已上线。

2025年06月04日 在这里插入图片描述

模型上线与平台更新：
- FLUX Kontext (专业绘画板块)： 支持图生图。实测表明，上传单张参考图效果最佳。提示词模板建议：【人物样貌和姿势保持不变，背景改为XXX，服装改为XXX（或保持不变）】。
- 平台UI/功能优化：
  - 专业绘画板块新增“相册布局”，支持调整图片展示数量、多选图片批量收藏/下载。
  - 合并导出图片、文档及分享对话为链接按钮至功能栏。
  - 优化语音播报（降低延迟，提高速度）、Suno音乐播放器UI等细节。
  - 网站稳定性整体提升。

2025年06月03日

模型上线：
- FLUX Kontext (AI对话板块)： Black Forest Labs开发的多模态图文生成与编辑工具。核心优势包括：角色一致性（多次修改保持关键元素一致）、精准局部编辑、风格迁移（油画、3D渲染等）、快速交互（1024×1024图生成约3-5秒）。FLUX-Kontext-pro适合快速迭代，FLUX-Kontext-max追求极致输出质量。
- 秘塔搜索升级：
  - 极速模式： 最高处理速度达400 tokens/秒，大部分问题响应在2秒内，准确率与逻辑清晰度提升。
  - 学术模式： 聚焦专业期刊/论文检索，提供摘要预览与原文链接跳转，支持中英文文献搜索。