广告区域

广告区域

传奇知识网 - 一个你身边的百科全书

现实不存在了?不,这就是现实

2024-02-16 14:09:03投稿人 : admin围观 : 3 次0 评论

转自:星空财研 

这样的技术并没有超越现有科技水平,但它确实是一次创新。它让我们意识到,之前的 AI 绘画模型可能走错了方向。Sora 的成功告诉我们,将 AI 与游戏引擎相结合,可以实现更为高效和逼真的画面生成。

一觉醒来,AI讨论群里热血沸腾。

一头雾水的我看了数百条的聊天记录,发现原来OpenAI发布了最新的视频大模型Sora。

OpenAI的CEO奥特曼发布了一些演示视频,众所周知,当初谷歌演示的时候涉嫌造假,奥特曼干脆让网友提需求,他即时生成。

截止现在(北京时间2月16日11点),一部分海外IP用户反馈,已经可以在ChatGPT4上试用。

演示视频显示,60秒的一镜到底,视频中的女主角、背景人物,都达到了惊人的一致性,各种镜头随意切换,人物都是保持了神一般的稳定性。

Video Player is loading.

Play Video

Play

Loaded: 0%

Current Time 0:00

/

Duration 0:00

Mute

Fullscreen

This is a modal window.

No compatible source was found for this media.

Beginning of dialog window. Escape will cancel and close the window.

Text

Color

White

Black

Red

Green

Blue

Yellow

Magenta

Cyan

Transparency

Opaque

Semi-Transparent

Background

Color

Black

White

Red

Green

Blue

Yellow

Magenta

Cyan

Transparency

Opaque

Semi-Transparent

Transparent

Window

Color

Black

White

Red

Green

Blue

Yellow

Magenta

Cyan

Transparency

Transparent

Semi-Transparent

Opaque

Font Size

50%

75%

100%

125%

150%

175%

200%

300%

400%

Text Edge Style

None

Raised

Depressed

Uniform

Dropshadow

Font Family

Proportional Sans-Serif

Monospace Sans-Serif

Proportional Serif

Monospace Serif

Casual

Script

Small Caps

Reset restore all settings to the default valuesDone

Close Modal Dialog

End of dialog window.

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

我对 Sora 生成的画面非常感兴趣,尤其是它在不崩、不闪方面的表现。

确实,Sora 的出现为 AI 视频领域带来了新的突破,其生成的画面质量令人印象深刻。

首先,我们来分析一下脸崩现象的原因。在目前的 AI 绘画工具中,许多大模型在处理大幅画面时,往往会遇到面部细节处理困难的问题。这是因为这些模型在训练过程中,可能没有接触到足够多的、具有大幅面画面的训练数据。因此,当它们面对实际问题时,就会出现细节处理不足的情况,也就是我们所说的“脸崩”。

此外,目前的 AI 大模型都是通过逐帧生成画面,然后将这些画面拼接成视频。这种方法在画面细节发生变化时,容易出现闪烁现象。这是因为每一帧的画面都是独立生成的,它们之间的差异会在视觉上形成闪烁效果。

然而,Sora 似乎成功地解决了这两个问题。有分析人士认为,Sora 使用了游戏引擎。我对此表示认同。事实上,使用游戏引擎来生成视频,可以有效地避免逐帧生成画面再拼接的弊端。通过游戏引擎,可以实现更为连续和自然画面生成,从而避免脸崩和闪烁现象。

英伟达高级科学家 Jim Fan 对 Sora 发表了一些观点。他认为 Sora 是一个数据驱动的物理引擎,它可以对真实世界和虚构世界进行模拟。这种模拟器通过去噪和梯度学习方式,学习了复杂的渲染、直观的物理、长期推理和语义理解。如果 Sora 真的使用了虚幻引擎 5 并接受了大量合成数据的训练,那么它的表现就一点也不令人惊讶了。

在 ChatGPT 3.5 推出之前,ChatGPT 发布了几个版本。尽管这些版本的表现令人惊艳,但它们的能力有限,并没有引起广泛关注。然而,ChatGPT 3.5 的推出让一切都变了。它一炮走红后,紧接着推出了付费的 4.0 版本。

与 ChatGPT 类似,Sora 的出现也让人感到措手不及。就在不久前,大家还在为 AI 视频去闪问题而努力。毕竟,我们都看过基于现有技术水平的论文,知道瓶颈在哪里,知道上限在哪里。然而,Sora 的出现就像是从天而降的天顶星科技,打破了我们的认知。

但是,如果 Sora 真的使用了游戏引擎,比如虚幻 5,那么这一切又都可以理解了。只能说之前的 AI 视频走的是 AI 绘画的老路,想当然地认为视频等于绘画逐帧叠加。Sora 巧妙地换了一条路,依然遵循 ChatGPT 的逻辑,用数据去驱动游戏引擎,再由游戏引擎生成画面。

这样的技术并没有超越现有科技水平,但它确实是一次创新。它让我们意识到,之前的 AI 绘画模型可能走错了方向。Sora 的成功告诉我们,将 AI 与游戏引擎相结合,可以实现更为高效和逼真的画面生成。

现实不存在了?不,这就是现实

随着 Sora 的成功,我们可以预见,未来会有越来越多的 AI 大模型接入游戏引擎。这种结合将为绘画大模型带来降维打击,让它们在画面生成方面面临巨大的挑战。不过,这也是 AI 技术发展的必然趋势。只有不断尝试创新,才能推动技术的进步。

并非现实不存在了。

这,就是现实。

内容由AI生成

本文作者:天渊三,来源:星空财研,原文标题:《现实不存在了?不,这就是现实》

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

来源:传奇知识网,转载请注明作者或出处,尊重原创!

相关文章

发表评论
推荐文章