业界观察 | AIGC将改变我们什么?
本文作者
王洪海
中共上海市委党校研究生
AIGC是Artificial Intelligence Generated Content的首字母缩写,中文译为“人工智能生成内容”,又称“生成式AI”,是互联网继专业生产内容PGC(Professionally Generated Content)和用户生产内容UGC(User Generated Content)之后的新型内容生产方式。它与PGC和UGC的最大不同是内容生产主体不同,PGC是专业团队,UGC是普通用户、网民,而AIGC则是计算机、人工智能。
进一步理解,AIGC是指应用预训练模型,通过计算机对已有海量数据的深度学习和模型训练,生成契合用户需求内容的人工智能技术。从用户的角度,简单来说,就是AI根据用户的自然语言、关键词或样本提示,生成与之相匹配的内容。文本、图片、音频、视频都是AIGC的内容范畴。Sora的出现,将AI的生成内容从文字、文章、图片推进到音视频领域,大大加快了AIGC的发展进程。
加速构建“数字孪生”世界
✦
✦
✦
当今,科技一日千里。特别是近年来以数据、算法和算力为核心的人工智能技术以“迅雷不及掩耳”之势,向我们不断“袭”来。元宇宙、AIGC和ChatGPT、Sora等概念和应用一个接一个走进我们的视野。无论是机遇还是挑战,它们必将影响并改变我们的现实生活。我们唯有主动学习、深谙机理,在透彻了解的基础上,积极“迎接”它们的到来。
Sora是OpenAI(美国人工智能研究公司)于今年2月15日正式对外发布的人工智能文生视频大模型。它可以根据用户的文本提示快速创建出一段逼真的、最高长达一分钟时长的视频,而且一镜到底,没有切换。
这些新技术,看似眼花缭乱,实则一脉相承。AIGC的“内容”从文字、图像到音视频,把虚拟世界从“一维”“二维”拓展到“三维”,今后必将达到“多维”,从而使虚拟世界更玄、更逼真。无论是OpenAI的GPT系列、DALL·E系列、Sora,还是其他公司,诸如Google的Bard,Microsoft的NewBing,Baidu的文心一言、文心一格,还有Midjourney、Stable Diffusion Online等等产品,都构成AIGC“大家庭”的一部分和“一级”。
与现有其他视频模型相比,Sora不仅能够呈现画面,更重要的是能处理画面里物体与物体之间的关系,克服了画面不稳定、不连贯的缺陷和人物渲染方面的“恐怖谷效应”,从而达到以假乱真的效果。Sora的“高明”之处在于,它能在“理解”的基础上进行“模拟”,它通过大量学习视频素材来理解现实世界的动态变化,并用计算机视觉技术来模拟这些变化,从而根据用户的提示创作出全新的视觉内容,它模仿了人类“先记忆,再预测”的方式进行学习,模拟世界与人类的交互方式。它不局限于学习图片和视频,而且学习“世界”的物理规律,从而加强了与“世界”的联系。Sora不单纯是一个视频模型,而更多作为“世界模拟器”向前发展。这标志着生成式AI对人类世界的理解从文字、图像已经发展到构建世界3D模型和对其中物理定律的理解,从而打破虚拟和现实的边界,在理解和模拟变化和运动中的物理世界方面迈上了一个新台阶。
时间、空间和物质构成宇宙的基本框架。元宇宙是再造一个与现实世界平行的虚拟世界,以及一个或多个与人类真身相对应的数字分身,使人类在虚实两个世界的多维时空中自由穿梭,在原身和分身之间自由切换,并从事与现实世界相关的各种经济和社会活动的虚拟物质、时间和空间的集合体。从目前的认识来看,元宇宙可分为“数字孪生”元宇宙、“扩展现实”元宇宙和“虚实共生”元宇宙三个等级。
AIGC的“内容”是构造元宇宙的关键要素。Sora加快了虚拟世界的“内容”生成进程,它把虚拟的“人”、虚拟的“物”在虚拟世界建立类似真实世界人和物的“联系”,构成一个又一个虚拟“叙事”,为创造出一个巨大的“数字孪生”世界准备了条件。
元宇宙底层技术是诸多尖端技术的集合体,包括网络、运算、管理、虚实链接和虚实交互等部分。当前来看,以Sora领头的AIGC技术无疑向构建“数字孪生”元宇宙推进了一大步,它的内容生产丰实了元宇宙虚拟空间,使得元宇宙不再停留在“概念”阶段,而成为“实实在在”的落地实践。
事实上,AIGC新产品的不断“涌现”,避免了元宇宙发展过程中将会出现类似当年信息高速公路的“有路无车”的路车矛盾问题,使得元宇宙不再成为“海市蜃楼”和“空中楼阁”。
辅助提升人脑创造力
✦
✦
✦
由于具有情感、意识和主观想象能力,人脑比计算机高明。从现阶段来看,虽然人工智能落后于人类创造力,但需要迫切关注它所带来的冲击和挑战。人类只有不断学习和提升自己,才能延缓人工智能“奇点”的到来。
培养青少年群体创造力是提升人类社会整体创造力的关键。国家已经作出高水平科技自立自强的决策,强调基础教育既要夯实学生的知识基础,也要激发学生崇尚科学、探索未知的兴趣,培养其探索性、创新性思维品质,还特别强调了要在教育“双减”中做好科学教育加法,激发青少年好奇心、想象力、探求欲,培育具备科学家潜质、愿意献身科学研究事业的青少年群体。创造力教育已经成为学校教育的重点。
另一方面,读书、学习前人的知识是提升创造力的又一重要途径。活到老,学到老。读书自学是走出校门、步入社会提升创造力的终身教育方式。其实,机器学习是一种深度学习,是通过构建深度神经网络模型来模拟人脑神经元的连接方式,从而实现对复杂数据的处理和学习。这些复杂数据,有结构性的、非结构性的,但都是人、人的活动以及人机活动的结晶。机器提供算法、算力,但不能凭空“创造”数据。另外,人类的“复杂数据”还表现为存贮于人脑中不能言表、难以言状的技能、经验、诀窍以至洞察力、价值观和心智模式等隐性数据。人脑的“隐性数据”成为人类潜在的竞争力。但是,计算机相比人脑,在算力、算法上占绝对优势,计算会更快和更准确,机器学习的速度远超人脑学习的速度。因此人类要不断学习,以保持旺盛的“创造力”。
促进人机协作
✦
✦
✦
Sora横空出世,再次引发人们关于人类生存和职业危机等问题的思考和大讨论。
有人说,Sora将会导致明星、导演、摄像师等失业,这犹如ChatGPT刚问世时人们大呼会取代客服等标准化职业一样。
其实,虽然随着技术的进步,虚拟和真实的界限变得越来越模糊,但是人类对真实的渴求没有变。事实上,我们一边沉浸于虚拟世界的欢乐、享受AI技术带来的快感和“红利”,但我们又惧怕虚拟、虚假和虚伪带来的“混淆视听”和伤害,而终究会回到面对面“温暖”真实世界的怀抱。这就和老朋友需要见面叙旧、网友渴望“线下见面”的现象一样。
虽然现实世界的一草一物甚至人都可以通过计算机的算法“模拟”出来,就算Sora等生成式AI能在“理解”的基础上“模拟”,但离人脑创造还有不少距离。只要人工智能“奇点”还未发生,计算机还“受制”于人,人类和人工智能将会长期处于“共生共赢”的状态。
人类最核心的能力是无限的“创造力”。根据人工智能运行原理,ChatGPT和Sora都是需要人工输入一定的“表达式”即自然语言才能生成“内容”。而这个“表达式”的优劣是由人的创造力决定的,描述的语言直接关系到答案的好坏和视频的质量,提问越深入、表达越准确、情感越丰富,输出的文字和视频就越体现提问者的个性和能力。每个人有每个人的创造,人工智能只是延展了人的双手、延伸了人的大脑,辅助把人脑的创造力转化为效能,服务于人类社会,而不是非此即彼的“替代”关系。从这个角度来说,人工智能并没有抢人类的“饭碗”,而是不断“督促”人类进步、促进人机协作。未来,将是人机共存和协作的时代。