AI 生图工具 Flux,俨然已经掀起了全网的风暴。这张情侣写真逼真、细腻,打光、纹理、毛发,都是挑不出破绽的程度。视频、声音、口型,AI 的进化越来越完美了!
最近 Flux 的爆火,简直把所有人的三观都撼动了。
不懂就问:现在网上的东西,还有什么是真的?
Flux 震惊全网
如今,开源文生图模型 Flux,俨然已经在全网掀起了一股风暴。
下面这些合影,竟然全是 AI 生成的?简直把这位博主震惊到怀疑人生。
正面特写大光圈,脸部打光、肌肉纹理、毛发,看不出丝毫破绽。
注意,即使是背景板人物们,也很自然,挑不出太大毛病。
镜头远一点,光线暗一点呢?也很自然。
两个人物在光线明暗处的对比,简直搞出了世界名画的光影质感。
就问细不细腻,真不真实吧?
人再多一点,Flux 也没在怕的。
无论是三个人、四个人、五个人,乃至更多人,画面依然挑不出错。
挑刺的网友们,还在努力寻找着细小的 bug。
最容易一眼看破是 AI 的,无疑就是徽标上的文字了。
感受到了 AI 想蒙混过关的努力
还有一些细节,比如 AI 不懂人类的帽子和项链是干嘛使的,所以画出来还是会有漏洞。
顺便,一年半前 Midjourney V5 惊艳全网的情侣合照长这样:
一大波二创来袭
现在,全网已经掀起了 Flux 生图的风暴,人们一致感叹:Flux 把 AI 生图带到了新的一级台阶。
每当我们觉得 AI 生图不可能变得更好时,它都会再次证明:我们错了。
用这位博主的话来说就是,AI 正在失控,潘多拉魔盒正在被打开!
尤其是 Flux 如此高超的生图能力和开源可玩性,也给各种二创、视频、语音的创作提供了极大的空间。
这些被疯转的 TEDx 演讲者,就不必说了。
这位网友用 Flux、可灵 AI 和 synclabs,做出一段 YouTube 网红博主的视频。
虽然仍有 AI 的痕迹,但图像和视频上的进步已属惊人。
作者表示,自己的目的并不只是创建网红,而是制作自动化广告、YouTube、TikTok 视频、教学视频、营销、讲解课程等等。
甚至当 AI 达到足够快时,它就能达到实时生成,FaceTime AI 朋友或者 AI 治疗师都有望成真。
是的,要说 AI 有什么最恐怖,那就是它的速度了。
渲染一段 AI 短片,时间只需要几秒、几分钟。毫无疑问,AI 正在走向世界,所有人对此都很乐观。
这位网友直言:把 Flux.1、Midjourney 引入 AI 视频后,虽然不完美,但已经是迄今为止自己见过最好的 AI 作品了。
这位博主结合了 Flux 和 LoRA,发现 LoRA 对现实主义图像和绘画 / 艺术图像,也都有很好的处理效果。
Flux.1 和 LoRA,对动漫生成效果也很好,单个 4090 就可跑。
这位网友表示,自己用了不到 1 个小时,就做出了两个香水广告。他直言:我们已经接近 AI 视频的奇点。
AI 超进化,只用 18 个月
沃顿商学院 AI 方向的副教授看到了最近的 AI 生成视频后,做出预言 ——AI 将在 18 个月之后完成进化。
之所以有这种观点,是因为 AI 模型的进化速度实在超乎想象。
比如下面这几张「水獭在飞机上使用 wifi」的图片,在一两周的时间内就有肉眼可见的进步。
再看看一年多之后,现在的 AI 进化成什么样子了 ——
不仅水獭的形象更加逼真可爱,操作手机时的手部动作也没有破绽。
再来对比一下同款产品的进化速度:MidJourney v3 和 v4 之间就有非常明显的进步。
一秒换脸马斯克,口型同步不露馅
不仅如此,最近 GitHub 一项爆火研究称,只需一张照片,就能换脸直播。
下面的视频中,只见马斯克「本尊」戴上眼镜,开启了实时无延迟直播。
是连马斯克的妈都要骗过的程度。
还有 LeCun 大佬,也被网友拿来换脸直播。
目前,项目已经在 GitHub 上收获了 14k 星,刷榜 Trending。
项目地址:https://github.com/hacksider/Deep-Live-Cam
与此同时,各种对口型技术,比如 ReSyncer,也让 AI 视频人物的嘴型无比自然。
至此,AI 把一整个工作流都跑通了!从此在网上看到再逼真的影像,我们心里恐怕都要打个问号了。
提高饱和度,AI 生图露怯
所以,究竟有没有什么方法,能用火眼金睛识别出 AI 的痕迹?
蹭着最近这波 AI 生图热度,前谷歌搜索创始人之一 Deedy 提出 ——
识别 AI 图片最好的方法,就是提高图像饱和度,并仔细查看麦克风接口、牙齿的部位。
就比如,最近爆火的 TED 演讲者的图片,将饱和度设为 200%,可以看到让人惊悚的牙齿。
值得一提的是,识别工具的代码均是由 Claude 编写的,而且还是公开可用。
传送门:https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46
不过,再拿另一张 AI 生成的 TED 演讲者图片进行测试,却毫无破绽。
这张图片中,牙齿并不奇怪,而且在正题颜色区域色彩更加一致。
Deedy 称,如果对真实图像进行 JPG 压缩,可能会破坏这种一致性。
网友:只能拔网线了
当我们身处一个被 AI 包围的「楚门的世界」,人类最后的退路在哪里?
也许,是时候拔掉网线了。
参考资料:
本文来自微信公众号:微信公众号(ID:null),作者:新智元,原标题:《情侣合照逼真到恐怖,竟被代码识出破绽?沃顿教授预言 AI 18 个月封神!》