创建AI图像速度提高30倍Dall-E3和稳定扩散技术落后

2024-03-26 17:32:40

导读麻省理工学院的一个团队缩短了著名人工智能图像生成器的多阶段流程。这不仅减少了生成成品图像所需的时间。所需的计算能力和功耗也以同样的...

麻省理工学院的一个团队缩短了著名人工智能图像生成器的多阶段流程。这不仅减少了生成成品图像所需的时间。所需的计算能力和功耗也以同样的速度降低。

Dall-E或稳定扩散的魔力现在应该很熟悉了。通过对场景、内容的简短描述，或许还有一两条评论，一幅或多或少真实的画面就出现了。幸运的是，这通常可以被认为是人工智能生成的作品，但它也达到了它的目的：我不必把狗放在冲浪板上或把狐狸放在宇航员服中。只需点击几下即可获得所需的图像。

然而，在后台，这是一个计算密集型过程，由算法的多次迭代和不断重复组成，以最终获得所需的图像。然而，麻省理工学院的研究人员已经成功地省去了这些众多的中间步骤。相反，所描述的场景是在一步之后创建的。

这使得可以实现可比较的结果，同时显着减少必要的计算能力或等待时间。同时，驱动称为“分布匹配蒸馏(DMD)”的系统所需的电力更少。

更形象地说：用于训练的图像被分解为更粗糙的区域。这将根据拍摄对象确定大致的图像构图。此外，还分析了各种图像元素的概率，以便最终获得连贯的场景。

最终，详细信息和复杂性都减少了，因此图像生成器变得更快。每个图像的处理时间不是2到3秒，而是大约100毫秒(三十分之一)。

如果仔细观察图像，可以清楚地看到细节的减少。背景稍微模糊，图像元素可以重复。在某些情况下，这些图案仍然看起来更好，并且仍然更容易被识别为人工智能的整体作品，或者至少是人造的。另一个积极的影响。

除了狐狸宇航员之外，这里还可以找到许多其他DMD模型的示例。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢。

标签：

上一篇:27英寸三星OdysseyG51C游戏显示器在亚马逊春季大促销中享受34%的大幅折扣

下一篇:最后一页