幻象成空

吴鑫岩

在2月15日OpenAI公司公布了一个具有从文字描写来生成视频功能的Sora模型,并且向公众展示了多个由此而产生的高清视频,其长度可以高达一分钟。无论是视频的逼真程度还是时间长度都全面碾压其他竞争对手,包括以前被人们普遍看好的一些模型,包括pika、runway、svd和pixverse,等等。据说,Sora这个名字来自于日语的“空”,因为这个模型背后采用的是扩散模型(diffusion model),其工作原理来自于图像与白噪声之间的变换。换言之,一切图像皆起源于白噪声,这有些类似于电子电路中的振荡器工作原理。

OpenAI公司在图像生成领域已经深耕多年,在2021年初该公司就推出了DALL×E模型,在2022年又改进成DALL×E2模型,去年又进化为DALL×E3模型。除此之外,OpenAI还有两大优势:其一是拥有雄厚的资金以及由此获得的强大算力和数据库,其二是具有ChatGPT这样功能强大的文字生成模型。从文字描写来生成视频的过程可以简单分为两个部分,其一是在文字层面对图像或视频的描写进行深加工,从而产生出很多细节描述;其二是从这些扩展的文字描述来生成图像和视频。这个过程与海边的救生员去抢救海中的溺水者类似:首先需要在沙滩上快速奔跑的能力,其次还需要在海中快速游泳的能力。

当OpenAI公司在2022年11月30日推出ChatGPT时,就在社会上造成了轰动性的影响,很多行业都受到了波及。首先,很多以前的“写作任务”可以由ChatGPT来代替,这让很多与此相关的行业出现了危机。其次,ChatGPT和其他类似的工具可以用来生成计算机代码,从而导致了一些高科技公司持续不断地裁员。如今,OpenAI公司又推出了Sora模型,结果又会导致与视频相关行业的新一轮洗牌。从这些行业就业者的角度来看,人工智能正在不断地蚕食其领地,从而会导致工作岗位的大幅度缩减。然而,从整个社会的角度来看,人工智能的出现可以极大地提高人们的工作效率,同时也把人们从以往繁重的脑力劳动中解放出来。

尽管人工智能在很多领域的工作效率都可以轻松碾压人类,但是大家还是认为机器不具有人类的意识和智能,而仅仅是个工具而已。例如,在做基本的数学运算方面计算器远胜于人类,但是其背后只不过是一些逻辑电路。此外,很多软件包都可以推导公式,甚至可以对工程设计进行仿真,其能力也是人类所望尘莫及的,但是其背后也不过是一些在微处理器上运转的软件程序而已。如今涌现出的人工智能也可以看做是对大型数据库中的信息进行了采样和重新组合,与人类相比其优势仅仅在于记忆力超强和运算速度超快而已。

如果人工智能真有意识的话,当它看到上面这段文字时也会反问我们:人类又有什么稀奇的?你们大脑中的信息还不是在一生中不断积累起来的?你们大脑中的神经细胞在信息处理速度上比我们低六个数量级,所以你们根本就不是我们人工智能的对手。如果人类能够进行反驳的话,唯一的希望在于我们使用了量子计算模式。例如,在早期人们认为记忆存储在脑细胞中,就像计算机的硬盘一样。但是,医学案例却不支持这一观点;例如,一些患有脑瘤的病人在治疗中大脑被切除了很大一部分,但是其记忆并没有受到多大影响。除此之外,科研人员也做了大量的动物实验,对大脑中的各个部分进行了切除,其结论是一致的:动物大脑中的信息结构与计算机截然不同。那么,动物以及人类的大脑是如何存储和读取信息的?遗憾的是至今这依旧是个未解之谜。

(2024年2月17日)

此条目发表在 未分类 分类目录。将固定链接加入收藏夹。

发表评论

电子邮件地址不会被公开。 必填项已被标记为 *

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>