当前位置：首页 > news >正文

用“Gemini 2.0 Flash Preview Image Generation”模型修改图片，有哪些常用的提示词和方法

news 2025/9/23 20:36:19

选定模型
在 Google AI Studio 或 API 中切换到 gemini-2.0-flash-preview-image-generation 并将输出格式设为 Image + Text，否则不会返回图片。12
上传或贴入待修改的图片
在 Studio 中点击 “➕” 上传；调用 API 时，把图片作为 inline_data 或多 part 请求的一部分。3
输入编辑指令
与聊天相同直接用自然语言描述，例如

「把这辆蓝色轿车改成敞篷，然后再变成黄色。」
Gemini 会连续记忆并在多轮对话中迭代修改。1
下载或保存结果
Studio 中点击图片右上角即可下载；API 返回 inline_data，自行用 PIL 保存。1

高命中率的提示词/句式模板

下表列出常见编辑需求及对应的动词 + 描述要素，可直接替换方括号内容组合使用。

需求	英/中动词	句式示例（中文）
颜色/材质替换	change / replace / 变更	将[对象]的颜色改为[目标色调]，材质呈[金属/丝绸]质感
添加元素	add / insert / 添加	在[位置]添加一只[元素]，大小约占画面[比例]%
删除元素	remove / erase / 移除	移除画面右下角的[水印]并填补背景
风格滤镜	apply / make / 应用	整体应用[赛博朋克霓虹]风格，带微弱颗粒感
光线天气	set / change / 调整	场景切换到[黄昏逆光]，天空呈金橙色云层
构图视角	zoom / crop / 拉近	将镜头拉近突出[人脸]，裁剪为4:5竖幅
情感表情	make / let / 让	让人物露出[惊讶]表情，眼睛瞪大
前景-背景	keep / put / 区分	保持[建筑]在前景，背景添加柔和[蓝紫夜空]
文本投射	project / write / 投射	在建筑立面投射巨型文字：“Gemini 2.0 Now”2

细节提示
为获得一致且真实的结果，官方文档建议在指令中加入情绪、天气、光线、颜色层次、前后景定位等具体信息。3

多轮编辑范式示例（纯文本对话）

用户：上传图片（蓝色轿车）
用户：将这辆车改成敞篷。
Gemini：返回敞篷图
用户：现在把车漆改成亮黄色，并增加傍晚暖光。
Gemini：返回修改后图

该多轮“先局部再整体”方式即官方推荐的 multi-turn image editing 聊天流程。1

提示词进阶技巧

让 LLM 先“润色”指令：先要求 Gemini 把你的简短需求扩写成专业图像提示，再用扩写后的文本去触发生成，能显著提升质量。4
指令越具体越好：特别是人物情感、光照角度（如 “45° 侧逆光”）、镜头参数（“85 mm F1.4 人像”）等会直接影响写实度。3
同一次调用可输出多张图 + 文字，只需在 prompt 中说明“生成三种配色方案，并附解释”。2
确保 responseModalities:["TEXT","IMAGE"]，否则只返回文字。1

常见问题与规避

最大长边固定 1024 px，短边 690-850 px 漂移，无法精确分辨率控制。3
部分地区暂不开放生成能力；若只返回文字，多尝试或改写提示为“请生成图片”。1
人像编辑已放宽但仍受安全过滤，尽量避免模糊或敏感请求。2

如需进一步细化某条提示词，或希望生成可直接复制的 API 调用样例，请告诉我！

https://ai.google.dev/gemini-api/docs/image-generation
https://cloud.google.com/vertex-ai/generative-ai/docs/multimodal/image-generation
https://www.kapwing.com/resources/how-to-use-gemini-flash-2-0-image-generator-and-editor/
https://www.reddit.com/r/GeminiAI/comments/1jfg264/i_found_a_trick_to_make_gemini20flashexp_generate/
Gemini 2.0 Flash: Unleashing Native Image Generation - A Tech Deep Dive - DEV Community
https://developers.googleblog.com/ja/generate-images-gemini-2-0-flash-preview/
https://cloud.google.com/vertex-ai/generative-ai/docs/release-notes
https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-0-flash
Gemini-2.0-Flash-Preview-Image-Generation quality reduction in recent update - Gemini API - Google AI Developers Forum
https://note.com/samuraijuku_biz/n/nc297996fe56b

http://www.dtcms.com/a/254914.html

相关文章：

计算机网络零基础完全指南

九尾狐编程语言新算法“超维时空演算体”

加密货币：什么是稳定币？

《Go语言圣经》结构体

宽度优先遍历(bfs)(3)——最小路径问题

RTSP播放器低延迟实践：一次对毫秒级响应的技术探索

SpringBoot扩展——发送邮件！

flink的多种部署模式

Kaggle-Plant Seedlings Classification-(多分类+CNN+图形处理)

解决“在EFI系统上，Windows只能安装到GPT磁盘“错误

DINO-R1：激励推理能力的视觉基础模型

最简单的方式突破远程桌面封锁

算法导论第十九章并行算法：解锁计算新维度

Matplotlib 绘图库使用技巧介绍

Python 数据分析与可视化 Day 1 - Pandas 数据分析基础入门

day037-openssh服务与http协议

视频相似度检测算法（带课设报告）

GNSS介绍

【AI编程】第3期，针对AI生成的改枪码列表创建对应的数据库表

50-Oracle awr报告生成-实操

Promise静态方法 race

LangGraph--结构化输出（.with_structured_output() 方法）

【论文笔记】【强化微调】AgentThink：思维链推理 + 工具调用

高度雾实时渲染~轻松营造GIS场景真实感

2025虚幻引擎文件与文件夹命名规律

ssh 服务和 rsync 数据同步

MFC中使用CRichEditCtrl控件让文本框中的内容部分加粗

面试第三期

C#语言入门-task2 ：C# 语言的基本语法结构

C#实现语音预处理:降噪/静音检测/自动增益