
2025年最新LangChain Agent教程:从入门到精通
DALL·E 很可能被视为 2020 年代最重要的科技产品之一,它无疑开启了当前的生成式 AI热潮。但自 2022 年推出以来,其他图像生成器(如Stable Diffusion和Midjourney)一直在创作越来越令人印象深刻的 AI 艺术作品。有一段时间,DALL·E 确实感觉落后了。
但随着《DALL·E 3》的发布和最新一轮更新,这种情况发生了改变。
DALL·E 3是 OpenAI 的 AI 艺术生成器的最新版本。它比 DALL·E 2 有了很大的升级,无论是使用方式还是生成质量都得到了提升。再一次,它可以与所有其他可用的 AI 图像生成器相媲美。
最大的变化是 DALL·E 3 不再是一个独立的应用程序,至少目前不是。相反,它与 ChatGPT 集成在一起。这使得它更容易使用,但仍有一些怪癖——正如我们对任何人工智能工具的预期一样。
因此让我们深入研究一下。
目前,DALL·E 3 仅供ChatGPT Plus订阅者使用。要访问它,请注册一个ChatGPT 帐户,然后单击左侧边栏底部的升级计划。选择每月 20 美元的 ChatGPT Plus 订阅计划,输入您的付款详情,您就可以开始了。
到目前为止,DALL·E 3 似乎与 GPT-4 具有相同的上限:你可以每三个小时发送 50 个请求。理论上,这意味着你每天可以创建超过一千张图片。这比你通常使用 Dream Studio(使用稳定扩散)或 Midjourney 等 AI 图像生成器获得的图像数量要多得多,尽管整体定价并不一致。而且我怀疑,如果你经常开始处理这么多提示,OpenAI 可能会有话要说。
如果您想在不注册 ChatGPT Plus 的情况下试用 DALL·E 3,您也可以在Designer(Microsoft Copliot 的一部分)中的 Image Creator 中进行测试。您没有相同级别的控制权,但它使用相同的底层模型。从技术上讲,它是免费使用的,尽管图像带有水印,并且它使用“提升”信用系统。一旦您用完配额,Image Creator 可能需要更长时间才能呈现您的提示。
要访问 DALL·E 3,请前往ChatGPT,并确保您使用的是 ChatGPT 4 或 ChatGPT 4o。(您也可以使用DALL·E GPT。)
此后,使用 DALL·E 3 就像使用 ChatGPT 一样。您可以输入普通文本提示,也可以使用自然语言与其交互。如果您直接通过 ChatGPT 4 或 4o 使用 DALL·E,则每个提示只会生成一张图片。如果您使用 DALL·E 3 GPT,您将获得两张不同的图片可供选择。
可以尝试以下操作:
如果您使用专用的GPT,您还会看到一些建议的提示和其界面的纵横比。
DALL·E 3 与众不同之处在于它会自动改进和迭代您的提示。它还会针对生成的每幅图像使用略有不同的提示。
例如,当我输入“一头好奇的奶牛,宽高比,表现主义”时,它实际使用的提示之一是:
“表现主义风格的好奇奶牛,使用鲜艳的抽象色彩来捕捉动物的情感和好奇心。奶牛被描绘成具有夸张的特征,例如大大的眼睛和略微倾斜的头部,暗示着好奇心。背景是大胆的印象派笔触漩涡,暗示着田园风光,增强了表现主义的异想天开和强烈的感觉。图像的宽高比很宽。”
要查看 DALL·E 3 用作任何图像提示的内容,请单击该图像,然后单击i按钮。它尝试生成的内容将显示在提示框中。
要下载图像,请点击右上角的下载图标。
使用 DALL·E 3 的最大好处是,您可以通过 ChatGPT 跟进自然语言请求。如果您不喜欢某些内容,或者希望通过不同的结果强调某些内容,您可以直接提出请求。
我尝试过的一些方法包括:
值得注意的是,如果您以这种方式控制 DALL·E 3,它会根据您的请求创建一个新的提示,然后生成一组新的图像,而不是直接进行编辑。有时两幅图像之间的变化很小,而且正是您想要的——当这种情况发生时,感觉就像魔术一样。但其他时候,DALL·E 3 也会抛弃您对任何给定图像的喜爱之处。
如果您想要更直接的控制,请单击图像,然后单击顶部菜单栏中的选择工具。
在要编辑的图像区域上涂抹。您可以更改屏幕顶部的画笔大小,以简化此操作。
然后在侧边栏中,提示 DALL·E 3 你想要更改的内容。
它会尽力修改你的形象。
虽然这些编辑控件的功能仍不如 DALL·E 2 中的那么强大 — — 并且 DALL·E 3 完全改变了图像而您只想进行一些小调整时,这可能会令人烦恼 — — 它们易于使用并且非常有效。您只需使用 DALL·E 3 微调提示即可获得您想要的结果。
虽然 DALL·E 3 仍在积极开发中,但就目前而言,使用它就可以获得一些很棒的效果。特别是,我发现 DALL·E 3 在创建绘图、绘画和其他类型的艺术品方面非常出色,而不是照片写实的图像。以下是一些需要记住的事项,以帮助您获得最佳效果。
尽管 DALL·E 3 通过本身推断出很多东西,让使用更简单的提示变得更容易,但如果你想要一个特定的图像,请在提示中添加大量细节。例如,下面的屏幕截图以我的提示开始:
“这是一幅细节丰富的油画,画中一只比利时马林诺斯犬扮成海盗,带领着自己的船与另一艘船展开激烈的海盗大战。他戴着三角帽,手持手枪,向船员们大声发号施令。海浪汹涌,大雨倾盆,一切都有些混乱。色彩阴暗而忧郁。我们不知道他是否能活下来。”
很不错,对吧?
尽管仍然有可能在提示中用大量细节使 DALL·E 3 超载,但这比 DALL·E 2 要困难得多。尽管它还不完美,但 DALL·E 3 对数字和图像中不同元素的位置等事物的理解有了更好的改善。
例如,您可以要求它在图像的前景或左侧生成一些东西,它很可能会这样做。同样,如果您要求它给出某个东西的具体数字,它通常会正确回答。
如果您要求 DALL·E 3 根据其结果之一做出变化,它有时会对初始提示做出相当大的改变。如果您希望它保持更相似的状态,请要求它做出“细微的变化”。虽然这不会阻止它生成全新的图像,但我发现它对初始提示的改变较少。
为了写这篇文章,我花了两天时间对 DALL·E 3 进行了大量测试,但从未达到上限。花点时间告诉它该做什么,并处理每张图片。如果不真正尝试,你不太可能达到上限。
说真的,真正了解 DALL·E 3 能做什么和不能做什么的唯一方法就是亲自尝试一下。ChatGPT 能够完成一些我认为很难完成的请求,但它也完全搞砸了我认为简单的更改。
DALL·E 3 是最好的图像生成器之一,但通过 ChatGPT 使用它并不适合每个工作流程。
如果您将 DALL·E 连接到 Zapier,则可以自动生成 AI 图像,以便直接从您最常使用的其他应用程序创建图像。详细了解如何自动生成 AI 图像,或开始使用其中一个工作流程。