当前位置: 首页 > news >正文

用“Gemini 2.0 Flash Preview Image Generation”模型修改图片,有哪些常用的提示词和方法

 

  1. 选定模型
    在 Google AI Studio 或 API 中切换到 gemini-2.0-flash-preview-image-generation 并将输出格式设为 Image + Text,否则不会返回图片。12

  2. 上传或贴入待修改的图片
    在 Studio 中点击 “➕” 上传;调用 API 时,把图片作为 inline_data 或多 part 请求的一部分。3

  3. 输入编辑指令
    与聊天相同直接用自然语言描述,例如

    「把这辆蓝色轿车改成敞篷,然后再变成黄色。」
    Gemini 会连续记忆并在多轮对话中迭代修改。1

  4. 下载或保存结果
    Studio 中点击图片右上角即可下载;API 返回 inline_data,自行用 PIL 保存。1


高命中率的提示词/句式模板

下表列出常见编辑需求及对应的动词 + 描述要素,可直接替换方括号内容组合使用。

需求英/中动词句式示例(中文)
颜色/材质替换change / replace / 变更将[对象]的颜色改为[目标色调],材质呈[金属/丝绸]质感
添加元素add / insert / 添加在[位置]添加一只[元素],大小约占画面[比例]%
删除元素remove / erase / 移除移除画面右下角的[水印]并填补背景
风格滤镜apply / make / 应用整体应用[赛博朋克霓虹]风格,带微弱颗粒感
光线天气set / change / 调整场景切换到[黄昏逆光],天空呈金橙色云层
构图视角zoom / crop / 拉近将镜头拉近突出[人脸],裁剪为4:5竖幅
情感表情make / let / 让让人物露出[惊讶]表情,眼睛瞪大
前景-背景keep / put / 区分保持[建筑]在前景,背景添加柔和[蓝紫夜空]
文本投射project / write / 投射在建筑立面投射巨型文字:“Gemini 2.0 Now”2

细节提示
为获得一致且真实的结果,官方文档建议在指令中加入情绪、天气、光线、颜色层次、前后景定位等具体信息。3


多轮编辑范式示例(纯文本对话)

用户:上传图片(蓝色轿车)
用户:将这辆车改成敞篷。
Gemini:返回敞篷图
用户:现在把车漆改成亮黄色,并增加傍晚暖光。
Gemini:返回修改后图

该多轮“先局部再整体”方式即官方推荐的 multi-turn image editing 聊天流程。1


提示词进阶技巧

  • 让 LLM 先“润色”指令:先要求 Gemini 把你的简短需求扩写成专业图像提示,再用扩写后的文本去触发生成,能显著提升质量。4

  • 指令越具体越好:特别是人物情感、光照角度(如 “45° 侧逆光”)、镜头参数(“85 mm F1.4 人像”)等会直接影响写实度。3

  • 同一次调用可输出多张图 + 文字,只需在 prompt 中说明“生成三种配色方案,并附解释”。2

  • 确保 responseModalities:["TEXT","IMAGE"],否则只返回文字。1


常见问题与规避

  • 最大长边固定 1024 px,短边 690-850 px 漂移,无法精确分辨率控制。3

  • 部分地区暂不开放生成能力;若只返回文字,多尝试或改写提示为“请生成图片”。1

  • 人像编辑已放宽但仍受安全过滤,尽量避免模糊或敏感请求。2


如需进一步细化某条提示词,或希望生成可直接复制的 API 调用样例,请告诉我!

  1. https://ai.google.dev/gemini-api/docs/image-generation
  2. https://cloud.google.com/vertex-ai/generative-ai/docs/multimodal/image-generation
  3. https://www.kapwing.com/resources/how-to-use-gemini-flash-2-0-image-generator-and-editor/
  4. https://www.reddit.com/r/GeminiAI/comments/1jfg264/i_found_a_trick_to_make_gemini20flashexp_generate/
  5. Gemini 2.0 Flash: Unleashing Native Image Generation - A Tech Deep Dive - DEV Community
  6. https://developers.googleblog.com/ja/generate-images-gemini-2-0-flash-preview/
  7. https://cloud.google.com/vertex-ai/generative-ai/docs/release-notes
  8. https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-0-flash
  9. Gemini-2.0-Flash-Preview-Image-Generation quality reduction in recent update - Gemini API - Google AI Developers Forum
  10. https://note.com/samuraijuku_biz/n/nc297996fe56b

相关文章:

  • 计算机网络零基础完全指南
  • 九尾狐编程语言新算法“超维时空演算体”
  • 加密货币:什么是稳定币?
  • 《Go语言圣经》结构体
  • 宽度优先遍历(bfs)(3)——最小路径问题
  • RTSP播放器低延迟实践:一次对毫秒级响应的技术探索
  • SpringBoot扩展——发送邮件!
  • flink的多种部署模式
  • Kaggle-Plant Seedlings Classification-(多分类+CNN+图形处理)
  • 解决“在EFI系统上,Windows只能安装到GPT磁盘“错误
  • DINO-R1:激励推理能力的视觉基础模型
  • 最简单的方式突破远程桌面封锁
  • 算法导论第十九章 并行算法:解锁计算新维度
  • Matplotlib 绘图库使用技巧介绍
  • Python 数据分析与可视化 Day 1 - Pandas 数据分析基础入门
  • day037-openssh服务与http协议
  • 视频相似度检测算法(带课设报告)
  • GNSS介绍
  • 【AI编程】第3期,针对AI生成的改枪码列表创建对应的数据库表
  • 50-Oracle awr报告生成-实操
  • 在线做动图的网站/石家庄百度快照优化排名
  • 做网站用什么配置的电脑/网络营销培训
  • 自己做网站 最好的软件下载/电商运营培训班
  • 有做外国人的零售网站吗/淘宝新店怎么快速做起来
  • joomla wordpress drupal/惠州抖音seo
  • 做网站常用什么软件/关键词大全