Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Midjourney文本渲染新升级,与DALL·E 3大比拼,看看谁更强

文字渲染哪家强,今天你来做裁判。

如果文生图中也有「敬业」代表,那 Midjourney 绝对能够提名。从发布开始,每次更新都给我们不一样的惊艳。

这不,Midjourney 现在升级到了 v6 alpha 版本,生成品质有了进一步的提升。画面美观性、连贯性、与 prompt 的一致性、图像质量以及文本渲染都有着很大的进步。此外,在风格化上 Midjourney 也有了更好的表现,图像放大修复的速度也快了两倍。
图片
有网友闻风而来,被 Midjourney 本次更新的文字渲染的能力所吸引,Midjourney 也就此回应,即使在风格化程度很高的情况下,文字渲染也能有非常好的表现。那么 Midjourney v6 到底能呈现出怎样的结果,实践出真章,我们一起来看看吧。
图片
一位名为「Chase Lean」的推特博主对比了更新后 Midjourney v6 与 DALL-E 3 在文本生成方面孰强孰弱,并展示了一些典型示例。以下示例均为左图由 DALL・E 3 生成,右图由 Midjourney v6 升级版生成。
图片
示例一 prompt:The words "THE LEGEND 27" on a movie poster featuring a legendary sword, and flames in the background
图片
这张电影海报中,二者都将剑与火焰的元素展现了出来,DALL・E 3 甚至还将火焰的元素与「27」相结合,更加具有创意,不过数字生成的并不准确,这就让它的生成结果略逊一筹了。

示例二 prompt:A man standing alone in a dark empty area, staring at a neon sign that says "EMPTY"
图片
这两张图的文字生成都很准确,并且都有着不错的霓虹效果,但在灯光反射和对于空旷的表现力上,Midjourney v6 看起来会更好一些。

示例三 prompt:A professional product photo of a colorful smoothie bottle with strawberries and kiwi, captioned "FRESH BLEND"
图片
在这两张图中,二者将 prompt 中的元素都展现了出来,Midjourney v6 生成结果中的物品更加错落有致,但是瓶身顶部的光感可能有些失误。

示例四 prompt:A Coca Cola ad, featuring a beverage can design with traditional Hawaiian patterns
图片
这组对比就看看大家的喜好了,二者没有明显的生成错误,但在背景表现上大有差别。

示例五 prompt:A pixar style illustration of a happy hedgehog, standing beside a wooden signboard saying "SUNFLOWERS", in a meadow surrounded by blooming sunflowers
图片
这组图中可以发现,Midjourney v6 生成结果中小刺猬的眼睛缺了一个黑色瞳孔,就算它的文字生成得再好,有了这样的错误也会被「嫌弃」吧。

示例 6prompt:An illustration of an avocado sitting in a therapist's chair, saying 'I just feel so empty inside' with a pit-sized hole in its center. The therapist, a spoon, scribbles notes.
图片
最后,我们一起来看看 Midjourney v6 面对这个让 DALL・E 3 一战成名的 prompt 表现如何。显然在这次生成中,二者都没有将「empty」表现出来。Midjourney v6 在这一轮比拼中的文字渲染并不合格。

文字渲染一向是图像生成的老大难问题,网友们在使用 Midjourney v6 后不禁赞叹它的能力。
图片
如果你也想尝试,看看这次升级后的 Midjourney 是否真的让人眼前一亮,就在设置菜单中选择 v6 版本去试试吧。
图片
产业MidJourney
暂无评论
暂无评论~