全网实测 Nano Banana Pro,网友直呼“这模型里到底装了什么东西”

炸裂!太炸裂了!

谷歌 Nano Banana Pro 一出世,全网都开始直呼:

这模型里到底装了什么鬼东西!

硅谷 VC 大佬 Deedy 首先分享了自己的实测案例,看完只能说真不怪网友大惊小怪(doge)。

扔给它一份英伟达最新财报 PDF 文件,结果它秒秒钟生成了一张重点突出、内容精致的图表:

图片

又或者直接将未加工的 Graphviz 图表代码丢给它,结果一次性就生成了带 logo 的可视化效果图:

图片

更别提各种论文流程图、核心概念解释图了(连 Transformer 架构图都能 AI 直出):

图片

总之短短几小时过去,现在已经掀起了一股 Nano Banana Pro 疯玩热潮:

图片

呼~Nano Banana Pro 真有这么强吗?咱们这就实测见真章。

实测 Nano Banana Pro

前情提醒,Nano Banana Pro 是谷歌趁着 Gemini 3 Pro 好评如潮而推出的最新、最强文生图模型。

它又名 Gemini 3 Pro Image,整合了 Gemini 3 Pro 的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑。

其主要升级之处体现在:

目前,普通用户可以在 Gemini 应用中免费体验 —— 选择“创建图像”功能时就能使用,不过免费用户有额度限制,超出后会回退到原始的 Nano Banana 模型。Google AI Plus、Pro 和 Ultra 订阅用户则享有更高的配额。

实测第一弹,先上个开胃小菜 —— 拆解一辆自行车

提示词:Exploded view diagram of a bicycle frame and components, technical blueprint, aesthetic cyanotype print, annotated with measurements in millimeters, disassembled gears and chain, perspective view, clean lines, on a white background —ar 16:9 —style raw

图片

大概要求是,生成一辆自行车车架及组件的爆炸视图,拥有已拆卸的齿轮和链条,以毫米为单位进行尺寸标注等。

而 Nano Banana Pro 经过一番深度思考后,很快就生成了下图:

图片

肉眼对比原图好像确实像样儿,不过为了更严谨点,我们这里找来了 ChatGPT 帮忙“客观点评”一下。

而 ChatGPT 也对照要求进行了逐项打分,最终认定:完成度确实很高

图片

再试试图像融合呢~ 为了节省时间,我们直接把难度拉满 —— 让 14 只娃娃坐在一起看电视

提示词:These dolls are seated on the same sofa while watching TV.

图片

而 Nano Banana Pro 原图直出如下:

先不说别的,整个氛围感确实很符合要求,玩偶们排排坐在沙发上看动画。而且落地灯照出的光影和玩偶在窗户里的背影这些细节都考虑到了,整体生成效果相当不错。

唯一的遗憾是娃娃数量凑不够 14 只,转念一想可能是有的玩偶不爱看电视吧(bushi~

图片

当然,最大的问题或许还是出在提示词上,这里我们指代的过于宽泛了(“These dolls”),换成更清晰的 14 个娃娃可能效果会好一点。

因为深扒 Nano Banana Pro 的思考过程,我们发现它自己其实会重点考虑这些细节之处的指令遵循情况。

图片

同样的情况,谷歌那边就尝试成功了:

图片

以及提醒一下,大约测试了三回左右,咱们普通用户的体验之旅就到此结束了(遗憾退场……

图片

不过,从上述简单实测我们也能感受到,Nano Banana Pro 确实能打。其整体实力相当强悍,几乎凭一己之力使得我们离 AI 生成的图片完全真正可用更进一步了。

更多网友实测也印证了这一点 ——

Nano Banana Pro 正在掀起生图热潮

有一说一,AI 生图这事儿确实和每个人的提示词构思水平息息相关。

你瞧,如果把 Nano Banana Pro 放到一些脑洞大开、拥有各种奇思妙想的网友手中,那才叫一个玩出花了。

把谷歌博客照搬进一本杂志里,什么配图、排版…… 通通 Nano Banana Pro 自己搞定。

图片

“灵魂草图”反手就变成了撕漫感插画,尤其是很好地拿捏住了这不屑的眼神:“灵魂草图”反手就变成了撕漫感插画,尤其是很好地拿捏住了这不屑的眼神:

图片

给一张人物参考图,Nano Banana Pro 仅需 1 分钟就生成了带故事情节的条漫,制作水平令网友直呼可怕。

图片

动动嘴还能直出世界杯对决海报:

图片

各种结构分解图更是手拿把掐:

图片

谷歌 CEO 皮猜和哈萨比斯的同框图也有了:

图片

用来制作一些精美的手册、指南也不是不行(下图为奥地利州狩猎参考指南):

图片

甚至,由于它对物理世界的理解更强了,所以生成的透明物体也经受住了光影考验。

图片

一片热闹中,连谷歌 CEO 皮猜也亲自贡献了一张图,顺带也替 Nano Banana Pro 站了一波台:

它拥有最先进的图像生成和编辑功能,具备更高级的世界知识、文本渲染、精度和控制能力。基于 Gemini 3 构建,它非常擅长制作复杂的图表 —— 就像工程师看待世界的方式一样

图片

so,你觉得 Nano Banana Pro 这波表现如何?你还发现了哪些玩法吗?

(欢迎评论区带图分享)

参考链接:

本文来自微信公众号:量子位(ID:QbitAI),作者:一水