分享
【图文教程】✨GPT-4o炸裂生图案例汇总
输入“/”快速插入内容
🖼️
【图文教程】✨GPT-4o炸裂生图案例汇总
用户1812
用户1812
1月29日修改
💁
欢迎大开脑洞,在文档里补充你的案例
官网文档:
https://openai.com/index/introducing-4o-image-generation/
技术报告:
https://cdn.openai.com/11998be9-5319-4302-bfbf-1167e093f1fb/Native_Image_Generation_System_Card.pdf
使用:3月27日
起,4o图像生成功能将作为 ChatGPT 默认图像生成器,面向Plus、Pro、Team及免费用户(免费版用户有使用次数限制)全面开放,企业版和教育版用户也将很快获得访问权限。
免费用户将很快每天免费获得三次试用机会。
该功能亦可在Sora平台使用。若您对DALL·E情有独钟,仍可通过专用DALL·E GPT继续使用。
开发者即将能够通过API接口调用GPT-4o进行图像生成,相关访问权限将在未来数周内逐步开放。
通过GPT-4o生成与定制图像,犹如日常对话般简单——只需描述您的需求,包括画幅比例、十六进制色值等具体参数,抑或是透明背景等特殊要求。由于该模型生成的图像更为精细,渲染时间通常需要一分钟左右。
核心能力👏
•
文本呈现:
精准生成图像内嵌文字,支持菜单、海报、LOGO、信息图表等场景,尤其擅长英文文本渲染,中文字符偶现错漏。通过语义理解确保文字与画面意境匹配。
•
多轮生成:
支持通过自然对话持续优化图像,保持多轮交互中的上下文一致性。确保角色特征在迭代中不偏离初始设定。
•
指令遵循:
能处理包含10-20个对象的复杂指令,严格还原细节要求。如生成4x4网格图时,精准排列蓝色星星、红色三角形等16个元素,并控制其颜色、形状与位置关系。
•
情境学习:
可分析用户上传的图像,整合其风格与细节到新创作中。
•
世界知识:
调用内置知识库生成符合逻辑的图像,如制作“旧金山多雾成因”信息图,或绘制牛顿棱镜实验示意图。
•
改图:
通过简单指令局部修改图像,调整场景风格或修复拼写错误。但编辑精度仍有限,可能意外改变其他部分或引入新错误。
•
照片级质感:
生成超逼真图像,如纽约街景中女巫阅读路标的画面,毛发纹理、光影效果细腻,甚至可模拟手机拍摄的日常照片,达到以假乱真效果。
实用玩法案例总结🐎
1.
设计师的灵感外挂
🎨
官网游戏界面小猫案例:
多轮对话仍保持高度形象一致
50%
50%
代码块
Plain Text
给这只猫一顶侦探帽和单片眼镜
Turn this into a triple-A video game made with a 4k game engine and add some User interface as overlay from a mystery RPG where we can see a health bar and a minimap at the top as well as spells at the bottom with consistent iconography