AI热点 6月前 97 阅读 0 评论

刚刚,谷歌放出Nano Banana六大正宗Prompt玩法,手残党速来

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

机器之心报道

机器之心编辑部


最近几天,谷歌 Nano Banana 可是被广大网友玩出了新花样。


比如制作精致可爱的产品照片:


来源:https://x.com/azed_ai/status/1962878353784066342


将 13 张图像合并为单个图像 :


来源:https://x.com/MrDavids1/status/1960783672665128970


给人一键换衣:



反正你想到的,想不到的脑洞,都被广大网友挖掘出来了。


但别忘了,这些效果可不是凭空生成的。背后真正的魔法,其实是提示词。网友们正是用一条条巧妙的提示词,把这个模型玩出了无限可能。


就在刚刚,谷歌官方公布了 Nano Banana 六个文本转图像提示:



原文链接:https://x.com/googleaistudio/status/1962957615262224511


根据这些提示,你可以进行以下操作:


  • 文本生成图像:通过简单或复杂的文本描述生成高质量图像。
  • 图像 + 文本生成图像(图像编辑):提供一张图片,并使用文本提示词添加、删除或修改图像元素,调整风格或颜色。
  • 多图合成与风格迁移:输入多张图片,合成新的场景,或将其中一张的风格迁移到另一张上。
  • 迭代式优化:通过对话逐步优化图像,每次做小调整,直到达到理想效果。
  • 文本渲染:生成包含清晰、布局合理文字的图像,适用于 logo、图表、海报等视觉创作。


谷歌强调,这些指令可以最大限度的发挥 Nano Banana 的图像生成能力。


接下来,我们看看这些提示具体包含的内容:


1、照片级写实场景


对于写实风格的图像,要像摄影师一样思考。prompt 中要提及机位角度、镜头类型、光线以及细节描写,这样可以引导模型生成更逼真的效果。


模板如下:


A photorealistic [shot type] of [subject], [action or expression], set in [environment]. The scene is illuminated by [lighting description], creating a [mood] atmosphere. Captured with a [camera/lens details], emphasizing [key textures and details]. The image should be in a [aspect ratio] format.


下图使用的完整 prompt 为「A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful. Vertical portrait orientation.」



2、风格化插画与贴纸


在制作贴纸、图标或项目素材时,在 prompt 中明确说明需要的风格;另外,如果需要白色背景,记得在 prompt 中提出来。


模板如下:


A [style] sticker of a [subject], featuring [key characteristics] and a [color palette]. The design should have [line style] and [shading style]. The background must be white.


下图使用的完整 prompt 为「A kawaii-style sticker of a happy red panda wearing a tiny bamboo hat. It"s munching on a green bamboo leaf. The design features bold, clean outlines, simple cel-shading, and a vibrant color palette. The background must be white.」



3、图上添加精准的文字


Gemini 擅长渲染文字。此类任务最好在 prompt 中明确说明文字内容、字体风格(用描述性的方式),以及整体设计。


模板如下:


Create a [image type] for [brand/concept] with the text "[text to render]" in a [font style]. The design should be [style description], with a [color scheme].


下图使用的完整 prompt 为「Create a modern, minimalist logo for a coffee shop called "The Daily Grind". The text should be in a clean, bold, sans-serif font. The design should feature a simple, stylized icon of a coffee bean seamlessly integrated with the text. The color scheme is black and white. 」



4、产品模型与商业摄影


适合在电商、广告或品牌宣传时制作干净、专业的产品照片。


模板如下:


A high-resolution, studio-lit product photograph of a [product description] on a [background surface/description]. The lighting is a [lighting setup, e.g., three-point softbox setup] to [lighting purpose]. The camera angle is a [angle type] to showcase [specific feature].

Ultra-realistic, with sharp focus on [key detail]. [Aspect ratio].


下图使用的完整 prompt 为「A high-resolution, studio-lit product photograph of a minimalist ceramic coffee mug in matte black, presented on a polished concrete surface. The lighting is a three-point softbox setup designed to create soft, diffused highlights and eliminate harsh shadows. The camera angle is a slightly elevated 45-degree shot to showcase its clean lines. Ultra-realistic, with sharp focus on the steam rising from the coffee. Square image.」



5、极简与留白设计


适合用于创建网站、演示文稿或营销素材的背景,并在其上叠加文字内容。


模板如下:


A minimalist composition featuring a single [subject] positioned in the [bottom-right/top-left/etc.] of the frame. The background is a vast, empty [color] canvas, creating significant negative space. Soft, subtle lighting. [Aspect ratio].


下图使用的完整 prompt 为「A minimalist composition featuring a single, delicate red maple leaf positioned in the bottom-right of the frame. The background is a vast, empty off-white canvas, creating significant negative space for text. Soft, diffused lighting from the top left. Square image.」



6、连续性艺术(漫画分镜 / 分镜头脚本)


通过逐格描绘,创作引人入胜的视觉叙事,适合用于开发分镜头脚本、漫画条幅或任意形式的连续性艺术。重点在于清晰的场景描述。


模板如下:


A single comic book panel in a [art style] style. In the foreground, [character description and action]. In the background, [setting details]. The panel has a [dialogue/caption box] with the text "[Text]". The lighting creates a [mood] mood. [Aspect ratio].


下图使用的完整 prompt 为「A single comic book panel in a gritty, noir art style with high-contrast black and white inks. In the foreground, a detective in a trench coat stands under a flickering streetlamp, rain soaking his shoulders. In the background, the neon sign of a desolate bar reflects in a puddle. A caption box at the top reads "The city was a tough place to keep secrets." The lighting is harsh, creating a dramatic, somber mood. Landscape.」



这一套 prompt 模板学下来,你大概就能掌握使用 Nano Banana 的精髓了。


不过,用户在使用中还有其他困扰,比如「在对已有图像进行编辑时,模型往往会返回一张一模一样的图像。」



另外有人指出了 Nano Banana 在编辑时存在的更多问题,「它在一致性上表现不如 Qwen 和 Kontext Pro,也不够稳定,特别是在持续对话过程中。对于文本转图像,直接用 Imagen 会更好且更可控。」



大家在使用 Nano Banana 的过程中有哪些独到的心得与技巧?欢迎在评论区分享出来。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!