AI生图真的很简单,一句话就够了
作者:微信文章大家好,我是越山,专注在AI智能体的落地应用。
上篇文章发出后,好几个读者留言问我那张信息图是怎么做的。我说用的Nano Banana(就是Google Gemini的生图模型),然后就有人追着要提示词。
说实话,我当时用的提示词简单得发指,就一句话:"将以下内容做一张信息图,突出重点,适合向公众展示的,注意用语。文字一定要清晰,排版整洁。"然后把整篇文章直接扔进去,就出来了。
gem
为什么这么简单就够了?
很多人还在纠结提示词的格式、结构、用词,觉得要写得很复杂才能出好结果。其实对于现在这些顶级大模型来说,完全没必要。
你想想编程语言的演进。第一代是机器码,第二代汇编,第三代C++、Java,第四代Python,越来越接近自然语言。到了AI时代,自然语言本身就是编程语言了,这已经是抽象的最顶层了。
那到了最顶层,还要怎么抽象?没有第五代、第六代了。提示词只是这个语言的不同表达方式,有的简单,有的复杂,但核心是把你要的说清楚就行。
说到简单,我还一直有用一个极简单的系统提示词,在chatbox里,配合gemini-3-pro或者gemini-3-flash使用,效果非常好。
“非常犀利地,一针见血地回复我,简洁不说废话”。
每次有复杂一点的问题或概念想要了解,跟它对话几轮都清晰多了。
具体怎么做?
我那次生图,就是把MCP、Skills、Sub-agent这几个概念的文章整篇扔进去。没有提炼要点,因为AI有提炼能力。我只强调了两个核心要求:文字清晰、排版整洁。
生成的图,配色、布局、图标这些设计感,我自己肯定做不出来。哪怕做出来也没那么美观。而且表达很准确,一次或者两轮对话就是我想要的结果。
国内模型也可以
不一定要用Nano Banana。国产的豆包用的Seedance 4.0也很强。直接在对话里说"生成信息图",后面跟上内容,它一次给你出四张图,选你喜欢的。不满意的话,针对那张图继续改就行。
豆包的改图能力也挺强,智能编辑,区域重绘,扩图,擦除都可以。比如上面这张图,我想要让卡片显得更立体点,那就点“智能编辑”,提要求。生成的图片都有水印,没关系,可以截图嘛,或者打开 百度图片,里面编辑去水印是免费的,效果还不错。
如果生成的图文字有乱码(中文有时会这样),可以用WPS AI的图片转PPT功能,或者lovart.ai这种支持局部修改的工具,针对性改文字。
别纠结格式,多轮对话才是关键
很多人想一次把所有要求都说全,提示词写得特别长。其实没必要。
AI生成内容的核心原则就是多轮对话。第一次不完美很正常,有不足的地方再调整就行。你的输入里把背景信息、目标、核心要求说清楚,比写一堆格式化的指令有用得多。
对于这种最顶级的大模型,你不用去写复杂的提示词。把你最关注的点清晰表达出来,然后通过多轮对话微调,这才是正确的协作方式。
去试试吧,别再纠结提示词格式了。
页:
[1]