🖼️
【图文教程】✨GPT-4o炸裂生图案例汇总

用户1812

1月29日修改

💁

欢迎大开脑洞，在文档里补充你的案例

官网文档：https://openai.com/index/introducing-4o-image-generation/

技术报告：https://cdn.openai.com/11998be9-5319-4302-bfbf-1167e093f1fb/Native_Image_Generation_System_Card.pdf

使用：3月27日起，4o图像生成功能将作为 ChatGPT 默认图像生成器，面向Plus、Pro、Team及免费用户（免费版用户有使用次数限制）全面开放，企业版和教育版用户也将很快获得访问权限。免费用户将很快每天免费获得三次试用机会。该功能亦可在Sora平台使用。若您对DALL·E情有独钟，仍可通过专用DALL·E GPT继续使用。​

开发者即将能够通过API接口调用GPT-4o进行图像生成，相关访问权限将在未来数周内逐步开放。​

通过GPT-4o生成与定制图像，犹如日常对话般简单——只需描述您的需求，包括画幅比例、十六进制色值等具体参数，抑或是透明背景等特殊要求。由于该模型生成的图像更为精细，渲染时间通常需要一分钟左右。​

核心能力👏

•
文本呈现：精准生成图像内嵌文字，支持菜单、海报、LOGO、信息图表等场景，尤其擅长英文文本渲染，中文字符偶现错漏。通过语义理解确保文字与画面意境匹配。​

•
多轮生成：支持通过自然对话持续优化图像，保持多轮交互中的上下文一致性。确保角色特征在迭代中不偏离初始设定。​

•
指令遵循：能处理包含10-20个对象的复杂指令，严格还原细节要求。如生成4x4网格图时，精准排列蓝色星星、红色三角形等16个元素，并控制其颜色、形状与位置关系。​

•
情境学习：可分析用户上传的图像，整合其风格与细节到新创作中。​

•
世界知识：调用内置知识库生成符合逻辑的图像，如制作“旧金山多雾成因”信息图，或绘制牛顿棱镜实验示意图。​

•
改图：通过简单指令局部修改图像，调整场景风格或修复拼写错误。但编辑精度仍有限，可能意外改变其他部分或引入新错误。​

•
照片级质感：生成超逼真图像，如纽约街景中女巫阅读路标的画面，毛发纹理、光影效果细腻，甚至可模拟手机拍摄的日常照片，达到以假乱真效果。​

实用玩法案例总结🐎

1.
设计师的灵感外挂 🎨​

官网游戏界面小猫案例：

多轮对话仍保持高度形象一致

common.docs_name - LarkCCM_Docs_Menu_Image

50%

代码块

给这只猫一顶侦探帽和单片眼镜​
Turn this into a triple-A video game made with a 4k game engine and add some User interface as overlay from a mystery RPG where we can see a health bar and a minimap at the top as well as spells at the bottom with consistent iconography​