文章作者: Artem Popov,icontext 机构(iConText Group)新媒体主管。
众所周知,随着人工智能的出现,许多企业迎来了一个充满创造内容(主要是视觉内容)机会的全新而美好的世界。他们在几秒钟内就完成了设计师需要数小时甚至数天才能完成的工作。
进步?无疑。对于那些提供服务而非实体商品的人,我们可以使用神经网络来可视化这种服务。但是那些拥有特定产品和严格品牌手册的人应该怎么做呢?如何应用神经网络的功能,例如 Midjourney?
为了回答这个问题,我们进行了一系列测试,试图让 Midjourney 将客户的产品正确地放置在视觉效果上。
剧透!到目前为止我们还没有成功,但我们不会放弃尝试。
测试的想法是如何产生的
进行测试的想法源自我们一位时尚行业客户提出的请求。他想看看是否有可能将目录照片放置在已经生成的人物上,而无需借助额外的技巧和设计师服务。
这个问题并不是无意义的,因为客户已经遇到了与快速形成不同人所穿衣服的目录相关的某些困难。
然后我们决定测试神经网络的功能。我们以Midjourney为基础,作为最便捷、最快捷的网络,截至2023年上半年,尽可能准确地绘制人们的面孔和身材。
我们将两幅图像合并为一幅
我们首先使用基线模型测试了该方法。为此,他们利用神经网络创建了一个身穿简单白色连衣裙的“基本女孩”,以便稍后处理该图像。选择白色作为与其他颜色对比最鲜明的颜色,以便神经网络可以正确地将一种类型的衣服与另一种类型的衣服区分开来。
然后我们从一位客户那里挑选了几种服装。我们采用了不同的模型,但它们都有一个共同点:对比。测试内容包括夹克、工作服以及牛仔裤和轻便毛衣等普通服装组合。
首先,我们使用 Blend 命令,它可以让我们将 手机号码列表 两幅图像无缝地合并为一幅。我们将所有内容加载到神经网络中并将其交给它,无需进行任何调整。
正如你所见,结果只能说是部分正确。例如,网络在工作服方面表现相当不错。但我仍然继续删除或添加细节,添加衣领,改变尺寸、口袋类型和腰带形状。
即使在澄清请求(提示)之后,情况也没有改变。可能,尽管计算机视觉拥有所有功能,但神经网络仍然无法完全重复产品的照片,并且会继续部分绘制细节。
如果你看一下牛仔裤和毛衣的搭配,就会发 今天在威斯敏斯特 现网络在这里已经彻底失败了。我们收到了非常奇怪的图像。尽管有进一步的澄清细节,但情况仍未改变。
夹克的纹理和颜色传达得相当好。
上传带有说明提示的产品照片
当我们意识到与 Blend 团队的故事没有产生 whatsapp 号码 预期的效果时,我们尝试上传产品照片并附上澄清提示以供生成。结果,我们得到了更可预测的结果,并且荒谬和奇怪的照片的百分比减少了。这是因为没有第二张照片,这让神经网络感到困惑,迫使它在图像中添加奇怪的元素。