[ad_1]
越来越好: 由于最近的所有新闻都围绕着 ChatGPT 和其他大型语言模型,很容易忘记它们的表亲——AI 图像生成器——仍在改进。 人们可能已经想出了如何渲染眼睛和手而不让主体看起来像噩梦中的东西。 然而,结果仍然让一些人感到毛骨悚然。
本周早些时候,研究实验室 Midjourney 发布了其同名 AI 成像软件第 5 版的测试版。 根据其通过 Twitter 发布的公告,最新版本增加了更高的图像质量、更“多样化”的结果、更广泛的样式范围、无缝纹理等等。
从今天开始,我们的社区可以测试 Midjourney V5。 它具有更高的图像质量、更多样化的输出、更广泛的风格范围、对无缝纹理的支持、更宽的纵横比、更好的图像提示、更宽的动态范围等等。 让我们一起探索吧!
– 中途 (@midjourney) 2023 年 3 月 15 日
用户已经发布了数百个令人惊叹的结果,并且对这些改进的感受不一。 大多数人印象深刻,因为成像 AI 一直在努力产生阴影、反射、眼睛和手等方面。 下面是我们使用 OpenAI 的 Dall-E 创建的图像,作为机器出现问题的示例。
构图有点不对劲,总体感觉很卡通。 灯光全错了。 眼睛和手严重变形。 腿上布满了人工制品,爆米花容器和对象旁边的座位也是如此。 这个结果是四个不同程度存在类似问题的结果之一。
Midjourney 的第 5 版似乎在这方面有所改进,至少从其他人分享的示例来看是这样。 简单提示的结果接近恐怖谷——在许多情况下足够逼真,可以作为专业照片通过,但仍然具有你无法确定的奇怪质量。 虽然非常逼真,但许多人将这些图像描述为令人毛骨悚然。
Midjourney v5 来了! (这次是真的,哈哈)
这是我的提示的一些并排部分,v4 与 v5,以及一些新的提示和人群照片。 我会在实验时添加更多内容。
𧵠pic.twitter.com/qSEZWQBXou
——尼克·圣皮埃尔 (@nickfloats) 2023 年 3 月 15 日
我们自己的 Kishalaya Kundu 在查看了一系列近乎完美的 Midjourney V5 照片后说:“老实说,我更害怕而不是印象深刻”。 令人担心的是,人们可以很容易地创建一个假图像并将其作为真实图像传递出去。
撇开蠕变因素不谈,与 V4 相比,Midjourney V5 的质量有了显着提高。 平面设计师 Julie Wieland 使用 Midjourney V4(去年 11 月发布)已有一段时间,并表示第 5 版具有“令人难以置信的逼真”皮肤纹理。 光照效果也好很多,包括反射、眩光和阴影。 也许最重要的是,AI 生成的手和眼睛在大多数情况下看起来都很自然。
�”� MJ 提示:V5 终于可以透过窗户拍摄了!
我一直渴望“我的蓝莓之夜”——自从我第一次尝试 Dalle2 以来的审美(它确实不错),但 v5 令人难以置信!
�’ 在图像的 ALT 文本中找到提示 #合成 #midjourneyv5 pic.twitter.com/kAOagopucG
— 朱莉·W·设计 (@juliewdesign_) 2023 年 3 月 17 日
“眼睛几乎是完美的,不再有问题了,”维兰德告诉 Ars Technica。 “手大部分时间都是正确的,一只手有 5 个手指,而不是 7-10 个。MJ v5 目前对我来说感觉像是在忽视视力不好太久之后终于戴上了眼镜。突然间你看到了 4k 的一切;它感觉很奇怪,但也很神奇。”
1960 年代年轻女子的街头风格照片,坐着,帆船,绿色迪奥连衣裙,丝绸绿色连衣裙,绿色连衣裙,丝绸,珍珠项链,蒂芙尼珍珠,蒂芙尼珍珠项链,日落,海洋,用 Agfa Vista 200 拍摄,4k –ar 16:9
v4(左)v5(右) pic.twitter.com/wz7GbI3fvA
——尼克·圣皮埃尔 (@nickfloats) 2023 年 3 月 15 日
Midjourney 还将原始分辨率从 512x512px 提高到 1024x1024px。 增加使其与 Dall-E 保持一致。 然而,第 4 版可以进行超采样以将原始分辨率加倍。 期望 V5 使用相同的技术来生成 2048×2048 图像并非没有道理,但这是为了进一步的更新。
底线是 MidJourney 一年前才进入 AI 领域。 本周涌入 Twitter 的这些图片中有许多(不是全部)都没有受到影响。 此前,Weiland 使用了多种技术来提高 Midjourney 4 的视觉质量,包括使用 Dall-E 进行“涂装”和在 Photoshop 中进行修饰。 第 5 版承诺更少的后期编辑和可能比我们想象的更快的照片完美图像。 这种前景确实既令人兴奋又令人恐惧。
[ad_2]
Source link