Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
Midjourney文本渲染新升级,与DALL·E 3大比拼,看看谁更强
如果文生图中也有「敬业」代表,那 Midjourney 绝对能够提名。从发布开始,每次更新都给我们不一样的惊艳。这不,Midjourney 现在升级到了 v6 alpha 版本,生成品质有了进一步的提升。画面美观性、连贯性、与 prompt 的一致性、图像质量以及文本渲染都有着很大的进步。此外,在风格化上 Midjourney 也有了更好的表现,图像放大修复的速度也快了两倍。有网友闻风而来,被 Midjourney 本次更新的文字渲染的能力所吸引,Midjourney 也就此回应,即使在风格化程度很高的情况下,文字渲染也能有非常好的表现。那么 Midjourney v6 到底能呈现出怎样的结果,实践出真章,我们一起来看看吧。一位名为「Chase Lean」的推特博主对比了更新后 Midjourney v6 与 DALL-E 3 在文本生成方面孰强孰弱,并展示了一些典型示例。以下示例均为左图由 DALL・E 3 生成,右图由 Midjourney v6 升级版生成。示例一 prompt:The words "THE LEGEND 27" on a movie poster featuring a legendary sword, and flames in the background这张电影海报中,二者都将剑与火焰的元素展现了出来,DALL・E 3 甚至还将火焰的元素与「27」相结合,更加具有创意,不过数字生成的并不准确,这就让它的生成结果略逊一筹了。示例二 prompt:A man standing alone in a dark empty area, staring at a neon sign that says "EMPTY"这两张图的文字生成都很准确,并且都有着不错的霓虹效果,但在灯光反射和对于空旷的表现力上,Midjourney v6 看起来会更好一些。示例三 prompt:A professional product photo of a colorful smoothie bottle with strawberries and kiwi, captioned "FRESH BLEND"在这两张图中,二者将 prompt 中的元素都展现了出来,Midjourney v6 生成结果中的物品更加错落有致,但是瓶身顶部的光感可能有些失误。示例四 prompt:A Coca Cola ad, featuring a beverage can design with traditional Hawaiian patterns这组对比就看看大家的喜好了,二者没有明显的生成错误,但在背景表现上大有差别。示例五 prompt:A pixar style illustration of a happy hedgehog, standing beside a wooden signboard saying "SUNFLOWERS", in a meadow surrounded by blooming sunflowers这组图中可以发现,Midjourney v6 生成结果中小刺猬的眼睛缺了一个黑色瞳孔,就算它的文字生成得再好,有了这样的错误也会被「嫌弃」吧。示例 6prompt:An illustration of an avocado sitting in a therapist's chair, saying 'I just feel so empty inside' with a pit-sized hole in its center. The therapist, a spoon, scribbles notes.最后,我们一起来看看 Midjourney v6 面对这个让 DALL・E 3 一战成名的 prompt 表现如何。显然在这次生成中,二者都没有将「empty」表现出来。Midjourney v6 在这一轮比拼中的文字渲染并不合格。文字渲染一向是图像生成的老大难问题,网友们在使用 Midjourney v6 后不禁赞叹它的能力。如果你也想尝试,看看这次升级后的 Midjourney 是否真的让人眼前一亮,就在设置菜单中选择 v6 版本去试试吧。 相关数据
文本生成是生成文本的任务,其目的是使人类书写文本难以区分。