当前位置: 首页 > news >正文

【AI智能体】图像处理-人生四宫格

你一定在很多 App 上看到过用特效让自己回到小时候的照片,和大家分享一个通过扣子图像节点制作的小工具,用户只需输入一张照片就可以生成人生四个年龄阶段的「人生四宫格」。

Agent 效果

单击体验人生四宫格 Agent:人生四宫格。

应用场景

在抖音「回到三岁」的特效爆火,接近千万次的模板使用,多款特效软件因生成小时候/老年时的照片有着不错的转化裂变效果,例如 FaceApp、Age Booth(4.5 星评价,4.5k 评论) 和 Oldify 等垂类应用。从用户心理分析主要有以下一些原因:

  • 情感共鸣:看到小时候的自己或未来年老时的样子,能够引发强烈的情感共鸣。对过去的怀念和对未来的好奇让用户产生深刻的个人连接,仿佛与时间对话,感受到时间的流逝和生命的变化。
  • 满足好奇心:很多人对未来的自己充满好奇。通过技术手段模拟出老年时的模样,满足了人们对未来样貌的想象和期待。而重现小时候的样子则让人们回到过去,回顾童年记忆。
  • 社交分享:这些照片往往是独特的、有趣的,容易引起社交平台上的互动。用户喜欢分享这些照片,与朋友和家人互动,引发讨论和共鸣,从而增加传播性。
  • 娱乐与新奇:这种功能带有很强的娱乐性和新奇感,能够给用户带来愉悦的体验。通过这种有趣的方式,用户不仅可以打发时间,还能获得与众不同的视觉体验。

Agent 设计

人生四宫格的功能主要通过图像节点实现,其中图像生成节点用于根据参考图生成照片,画板节点用于四宫格排版。

图像节点的编排方式如下:

功能实现

使用 Coze 图像节点和画板功能生成「人生四宫格」能在同一张海报中展现用户四个年龄阶段的样貌,我们的需求实际上就是通过一张照片,使用「图像生成」工具生成用户四个年龄阶段的照片,然后使用「画板工具」将四张照片合并起来。

图像参考:添加参考图

添加一个图像参考节点,为图像生成添加参考图,并设定参考条件。在图像参考节点中,选择「人物一致」和「人物姿势」的模型。另外为了保证生成的四张图片姿势统一,让四宫格更具有整体性,这里我们选择人物姿势 0.9 的参考程度。从 0 到 1 这个数值越高,就越忠于原图。

图像生成:生成照片

因为要生成四张照片,为了避免混淆,可以为「图像生成」节点命名:童颜天真、少女如花、盛年如夏、银发如霜

提示词设计注意事项:

  • 提示词中标注年龄,以及标注单人
  • 提示中提到不同年龄阶段的面容表情细节
  • 注意不要在提示词里添加非面容相关的提示词,例如腿部、鞋子等,否则可能生成全身或其他身体部位的图像。

画板:图片排版

将这四个年龄段照片合成到一张画板上,并未在右下方加上文字 See your life through every age 遇见不同时期的自己。这样用户转发该照片的时候,大家也能意识到这是在分享 AI 生成的不同年龄的自己。

效果调优

在实际操作上,第一版也可以生成四张照片,但是存在一个比较大的问题,即图像参考值高了(0.8)以后,区分不了四个年龄阶段的样貌,老年也没有皱纹,图像参考值低(0.5)导致生成以后和用户上传的照片不像。

所以在第二版图像节点的设计上,我们选择两个图像参考值作为输入:

  • 参考值高(少年)换脸(中年)参考值低(幼年与老年)
  • 优化了 Prompt 中对面容描写的提升词

图像参考:添加参考图

图像参考节点的优化如下:

图像生成:生成照片

图像生成节点的优化方式如下:

阶段

提示词

示例

幼年

图像参考 0.4 人物一致

1child, age 5, solo, traditional media, round face, long hair, simple background, playful expression, white background, panoramic view.Round, cherubic face, smooth, unblemished skin, bright, gentle, soft contours around the eyes

少年

图像参考 0.7 人物一致

1girl, age 12, solo, traditional media, youthful features, long straight hair, simple background, white background, panoramic view. wearing a school uniform, clean and tidy appearance, shoulder-length hair, slightly defined creases at the corners of the eyes

青年

图像参考 0.7 人物一致+换脸

1woman, age 35, solo, traditional media, wearing professional attire, blazer, pencil skirt, blouse, confident expression, long wavy hair, simple background, white background.Refined facial features with confident expression, soft lines around the eyes from years of smiles, defined, yet graceful crow's feet, subtle weathered lines reflecting a balanced life

老年

图像参考 0.4 人物一致

1 elderly woman, age 70, solo, twrinkled,raditional media, 1elderly woman, wrinkled skin, long gray hair in a bun, simple background, solo,white background,Delicate crow's feet,Aged creases around the eyes,Simple shirt,Soft creases in the corners of the eyes,Weathered lines marking a life well-lived

画板:图片排版

画板节点的优化方式如下:

相关资源

体验人生四宫格 Agent:人生四宫格

相关文章:

  • Python Wget详解:从入门到实战的网络文件下载指南
  • 零基础langchain实战二:大模型输出格式化成json
  • FPGA设计的时序分析概要
  • autoas/as 工程的RTE静态消息总线实现与端口数据交换机制详解
  • Flutter基础(控制器)
  • eTools 开源发布
  • 如何用VS Code、Sublime Text开发51单片机
  • Mysql架构
  • 顺序表的常见算法
  • 【编程实践】利用python在Blender生成三维模型
  • Stable Diffusion入门-ControlNet 深入理解 第四课:风格迁移与重绘控制模型——让AI也有“艺术天赋”!
  • FPGA设计的上板调试
  • 微信小程序实现简版点赞动画
  • 【linux】文件与目录命令 - iconv
  • Kafka 消费者重平衡问题排查与优化实践
  • 下载最新版本的OpenOCD
  • (LeetCode 每日一题) 2099. 找到和最大的长度为 K 的子序列 (排序)
  • 【C++】transform, reduce, scan是什么意思?理解常用并行算法及其实现原理
  • [Andrej Karpathy_2] vibe coding | 大型语言模型的1960年代 | 自主性滑块
  • 【云桌面容器KasmVNC】如何关闭SSL使用HTTP