新闻 发表于 2026-1-26 18:36

AI生图真的很简单,一句话就够了

作者:微信文章
大家好,我是越山,专注在AI智能体的落地应用。

上篇文章发出后,好几个读者留言问我那张信息图是怎么做的。我说用的Nano Banana(就是Google Gemini的生图模型),然后就有人追着要提示词。

说实话,我当时用的提示词简单得发指,就一句话:"将以下内容做一张信息图,突出重点,适合向公众展示的,注意用语。文字一定要清晰,排版整洁。"然后把整篇文章直接扔进去,就出来了。


gem
为什么这么简单就够了?

很多人还在纠结提示词的格式、结构、用词,觉得要写得很复杂才能出好结果。其实对于现在这些顶级大模型来说,完全没必要。

你想想编程语言的演进。第一代是机器码,第二代汇编,第三代C++、Java,第四代Python,越来越接近自然语言。到了AI时代,自然语言本身就是编程语言了,这已经是抽象的最顶层了。

那到了最顶层,还要怎么抽象?没有第五代、第六代了。提示词只是这个语言的不同表达方式,有的简单,有的复杂,但核心是把你要的说清楚就行。

说到简单,我还一直有用一个极简单的系统提示词,在chatbox里,配合gemini-3-pro或者gemini-3-flash使用,效果非常好。

“非常犀利地,一针见血地回复我,简洁不说废话”。

每次有复杂一点的问题或概念想要了解,跟它对话几轮都清晰多了。

具体怎么做?

我那次生图,就是把MCP、Skills、Sub-agent这几个概念的文章整篇扔进去。没有提炼要点,因为AI有提炼能力。我只强调了两个核心要求:文字清晰、排版整洁。

生成的图,配色、布局、图标这些设计感,我自己肯定做不出来。哪怕做出来也没那么美观。而且表达很准确,一次或者两轮对话就是我想要的结果。

国内模型也可以

不一定要用Nano Banana。国产的豆包用的Seedance 4.0也很强。直接在对话里说"生成信息图",后面跟上内容,它一次给你出四张图,选你喜欢的。不满意的话,针对那张图继续改就行。



豆包的改图能力也挺强,智能编辑,区域重绘,扩图,擦除都可以。比如上面这张图,我想要让卡片显得更立体点,那就点“智能编辑”,提要求。生成的图片都有水印,没关系,可以截图嘛,或者打开 百度图片,里面编辑去水印是免费的,效果还不错。



如果生成的图文字有乱码(中文有时会这样),可以用WPS AI的图片转PPT功能,或者lovart.ai这种支持局部修改的工具,针对性改文字。

别纠结格式,多轮对话才是关键

很多人想一次把所有要求都说全,提示词写得特别长。其实没必要。

AI生成内容的核心原则就是多轮对话。第一次不完美很正常,有不足的地方再调整就行。你的输入里把背景信息、目标、核心要求说清楚,比写一堆格式化的指令有用得多。

对于这种最顶级的大模型,你不用去写复杂的提示词。把你最关注的点清晰表达出来,然后通过多轮对话微调,这才是正确的协作方式。

去试试吧,别再纠结提示词格式了。
页: [1]
查看完整版本: AI生图真的很简单,一句话就够了