在使用 Midjourney 时,就发现有这个问题(V5 版本对「手」做了很大的优化,但还不到完美的程度),AI 生成的手总是会显得不自然,比如 6 根手指,或者奇怪的姿势。这个视频 就聊了这个现象背后的原因,主要有 3 个:
解决方案的话,可以增加手的样本量,丰富描述,还可以通过 RLHF(人工反馈的强化学习,也是 ChatGPT 采用的方法)来告诉 AI 哪些手画的好,哪些不好,让它逐渐找到画好手的诀窍。
这可能也是用照片训练 AI 的一个局限,不像现实生活中,我们可以立体地观摩对象,还可以从解剖学的角度去理解它的运行机制,从而对目标建立更深刻的认知。如果 AI 可以感知现实中的事物,或许可以创作出更丰富更逼真的作品。
PS: 视频的评论中有人提到,我们做梦时,也无法看到清晰的手的形态,或者有点畸变,所以可以通过看手来判断是在梦里还是在现实中。会不会人类经常以与 AI 相似的方式构建心理图像?
👍