2024年全国中青年学者文旅经济研讨会演讲实录丨潘云鹤:人工智能+文化产业
尊敬的各位领导、各位专家、各位代表:
大家上午好!很高兴来到美丽的德清,和大家一起讨论文旅经济的发展。看到台下都是朝气蓬勃的中青年学者,我感到我国的文旅产业在下一阶段一定会有很大的发展。我今天讲的题目是“人工智能+文化产业”。国务院最近发布“人工智能+、AI+行动指南”,“AI+”理所应当进入文化产业。
一、AI技术的突破
人工智能发展至今,已进入 2.0 时代。进入本世纪以来,人工智能技术发生了重大变化。自去年起,人工智能掀起新的热潮,全世界对 OpenAI 公司的 ChatGPT 新程序议论纷纷。常刊登经济、政治、军事信息的《参考消息》在去年2月用两个版面来报道ChatGPT。
这一影响延续到了今年,今年的诺贝尔奖评选结果引起了学术界的广泛关注与热议,物理学奖与化学奖授予人工智能领域学者的决定,引发了强烈反响。10月8日,诺贝尔物理学奖公布,被授予两位在人工智能领域做出突出贡献的学者。第一位是来自美国的Hopfield,他最早提出了神经网络的概念,尽管当时并未展现出明显的实用价值,但他奠定了神经网络模型的基础。另一位是来自加拿大的Hinton教授,他在深度神经网络领域处于开创性地位。正是由于近年来大模型技术的突破,尤其是ChatGPT等先进模型的推动,使得学界逐渐意识到深度神经网络对人工智能发展的重大影响。虽然他们的研究领域与物理学存在较大差距,但物理学领域最终选择将奖项授予他们,在一定程度上表明了物理学界对人工智能理论基础和模型创新的高度认可,以往信息学并未设立诺贝尔奖项,今年是首次将该领域的研究成果纳入其中。
此外,10月9日公布的诺贝尔化学奖同样令人瞩目,获奖的三位科学家中,有两位来自人工智能领域。首位获奖者是来自美国华盛顿大学的生物学家,他在蛋白质分子结构研究方面取得了重要进展。后面两位,其中第三位是AlphaGo的研究者,第二位是AlphaFold的研究者,他们的工作重点是通过人工智能算法预测蛋白质结构。正是由于这些人工智能专家的参与,蛋白质分子结构的研究才得以取得当前的重大突破。因此,这位生物学家极力推荐将诺贝尔化学奖与两位人工智能专家共同分享。
由此可见,人工智能对各个学科发展的影响之大。当然我今天要讲的不光是学科,更要讲的是技术和产业。
去年5月,科技部开始研究中国大模型的发展方向。在杭州召开的全国人工智能发展会议上,二十余位专家讨论认为,进入这一阶段,人工智能有四大重要要素,即大数据、大模型、大知识、大用户。同时,认为ChatGPT的问世,标志着人工智能进入了一个全新的领域,即人工智能生成内容(AIGC)。AIGC代表了人工智能技术的重大突破,被视为智能生成领域的核心进展。
为什么认为AIGC是人工智能技术的重大突破呢?回顾人工智能近70年的发展历程,在过去的69年里,人工智能大致经历了两个阶段。第一个阶段,称之为人工智能1.0,持续了50年,这期间,人工智能主要做两件事情,第一件事情是逻辑和推理,后来扩大到知识和推理,第二件事情是行动模拟,如机器人;进入21世纪,人工智能迎来了第二次大发展,也就是人工智能2.0阶段,这一时期,人工智能在图像识别、车牌识别、街道场景识别、文字识别以及机器翻译等领域取得了突破,这些技术的进步从本质上看都是对识别技术的深入发展,然而,ChatGPT的出现推动了人工智能进入了另一个崭新的领域:生成,生成的出现为创造奠定了基础,创造的关键就在于生成那些从未存在的事物。当前,人工智能在这一点上还需进一步提升,以便能够通过想象和推理构建出真正独创的内容。一旦实现这一点,人工智能将迈入人类创造领域,对依赖创造力的职业和领域产生深远影响。
事实上,智能生成技术在过去已经有所应用。早在1982年,中国就开始利用人工智能进行图案设计。通过对一个剪影元素的不同组合,即可生成风格迥异的图案。像这样的图案用人工智能生成一幅大约需要3分钟,而使用现代计算机只需短短3秒钟即可完成。但从理论上讲,当时只提出“图案设计专家系统”没有提出智能生成AIGC的概念,其主要原因在于当时概念还不够深入,只是将其视为专家系统在图案创作中的一种应用,而且,当时的技术条件并不具备进入智能生成的三大要素:大数据、大模型和大知识。当时生成图案所需的构图知识和色彩知识,都是通过手工方式输入到系统中的,由人工操作来引导数据生成各种图案。
随着ChatGPT的出现,今年中国的企业迅速跟进,其中表现最为突出的便是百度。去年国庆节期间,从百度的CTO那得知,百度已经具备了写诗的能力,这一进展源于我此前对ChatGPT的批评,认为其在创作中国诗词方面表现欠佳,而如今情况已有所改善。为了验证这一点,去年十月,我要求百度创作一首描写杭州秋天的诗,百度很快生成了一首诗,其中写道:“杭州秋来桂香浓,金花怒放映日红。山湖如诗景色美,桂花飘香入人梦。”虽然这首诗的韵律基本符合要求,但我认为它缺乏真正的诗意。当时,我也即兴创作了一首诗作为对比:“金银桂月日渐丰,瓜果豆蔬俱称雄。只待秋阳霁面雨,满城无处不香风。”相比之下,我觉得自己创作的诗在意境上更胜一筹,这也表明,现阶段人工智能在诗词创作方面大致处于中等水平以下。
由此可见,对于诗人和小说家而言,人工智能的创作能力尚不足以引发焦虑。尽管AI可以生成一些基础的作品,但在真正需要创意的领域,如诗词的诗意表达或小说中的各种悬念设计等方面,人工智能还无法达到人类的水平。因此,人工智能可以成为创作者的得力助手,但还不足以取代他们,我们应当掌握并利用这一技术,以更好地推动创作的前进。
但人工智能在绘画领域的表现,令人刮目相看。以“文心一言”为例,它拥有在文字生成与图像生成上的双重潜力。在去年10月份能够实现绘画生成还是相当先进的。我要求它用诗句“黄河入海流”创作一幅印象派风格的油画,结果很快生成了一幅作品,我认为这幅画的水平比AI写诗的表现更为出色。为了进一步检验其艺术风格的表现能力,我提出让它基于“白日依山尽,黄河入海流”这句诗,以梵高的风格创作一幅画,结果可以说它成功地将梵高的风格与诗意结合。接着,我又要求它用马奈的风格来表现同样的诗句,这一次生成的画作在色彩和风格上展现了典型的马奈风格,与梵高的风格和之前的作品截然不同,充分展现了它在风格转换方面的能力。这显示了人工智能在绘画领域的快速发展,已经接近实用化。然而,目前的问题在于其对画面细节的控制还不够精确,仍需进一步提升。
自去年以来,人工智能领域取得了显著的发展。今年,OpenAI 宣布推出了“Sora”,它能够自动生成一段 60 秒的视频,其画质已经达到相当高的水平。这一成果发布后,引起了全球人工智能界的广泛关注和赞叹。然而,短短半年时间,中国企业在该领域也取得了类似的突破,展现了中国在人工智能技术追赶和创新上的非凡速度。
(一)创作和设计的智能化平台
人工智能的技术一定会使得文化创作的技术进行一次非常大的变化,我认为这种变化从去年的下半年就已经开始。随着ChatGPT的推出,人工智能迅速向跨媒体方向发展,催生了众多新平台,例如Stability AI,这一平台提供了全新的工具和方法,帮助用户进行各种形式的文化和艺术创作。Stability AI的使用方式十分直观:用户只需绘制一个简单的草图,勾勒出大致的动态轮廓,再输入一段描述文字,即可生成相应的画面,无论是钢铁侠、美国队长、蜘蛛侠或是熊猫、老虎,它都能迅速生成。此外,用户还能通过上传照片,结合轮廓线和文字描述,轻松实现照片内容的转换,例如将男性变为女性,或女性变为男性等。
这类工具的诞生,让我们可以快速创作出大量的图像作品。虽然当前使用Stability AI需要支付一定费用,但其几乎等同于一个互联网平台经济的公司,过去碰到的平台经济如滴滴打车、阿里巴巴等,如今平台经济将进入2.0时代,新型平台经济的核心在于技术驱动。
在这类平台今后可以做很多事情,例如,浙江大学的一位博士拍摄临安的照片,用Stable Diffusion图生图功能,以“油画大笔触+油画小笔触”相结合的微调模型,辅以提示词,以及ps精修,最终生成理想的油画作品。照片是由他拍摄的,画面内容由他提出要求,最后的画面绘制是由人工智能完成,因此这幅作品成为了他与人工智能合作的成果。随着这一技术的发展,版权问题的探讨也日益迫切,尽管目前关于人工智能生成内容的版权归属尚无定论,但在未来,这些问题有望得到合理的解决。当前,这种平台的操作还不够方便,正在积极改进,以期提升用户界面,使其更加友好,让人人都可以轻松创作油画作品。同时,这位博士还利用平台为临安青山湖未来城项目设计了方案图,通过结合Stable Diffusion和其他平台,生成了高质量的效果图。他还利用平台生成《吴越揽胜图》的山水长卷,以吴越王雕塑、钱塘时代、钱塘江定朝串联起吴越王的成长故事,沿着天目山向西湖前进,最后变成南山和北山,这幅画目前还未完成,需通过进一步修改,形成一部新的优秀长卷。
(Stable Diffusion、PhotoShop以临安实景照片生成的油画)
通过这些实例可以看出,人工智能与人类创作的结合已进入实用阶段,正在开启一个全新的时代。过去,我们用毛笔绘制国画,用刷子创作油画,用刀进行篆刻,而今后,我们将使用AI工具进行绘画,新的画种将会出现,这些画种将覆盖油画、摄影、国画等多种形式,甚至涵盖更多新的艺术表现方式。AI不仅是工具的转变,它正在推动全新画种的诞生,为艺术创作带来无限可能。
(二)大模型发展的指向
当前人工智能领域的发展主要依托于大型模型的进步,而这一进程远未停止。目前,全球已经出现了329个语言大模型,其中103个来自中国,且大多集中在北京,即所谓的“百模大战”,许多研究人员专程前往北京中关村调研大模型,仍有许多模型尚未找到合适的使用场景。对此,我建议他们将这些模型带到杭州进行应用,杭州拥有丰富的资源和更多的应用机会。
尽管已有300多个基础大模型问世,但围绕这些模型开发的应用大模型数量远远超过基础大模型,全球范围内已经开始评选应用大模型的Top50榜单,力图从中挑选出最具影响力的应用。根据浙江大学工业信息研究所的研究结果,今年3月和8月的Top50榜单对比显示,在短短半年内,已有30%发生了新陈代谢,既有新兴企业崛起,也有老牌企业退出,这说明大模型领域的竞争异常激烈。更为引人注目的是,52%的应用大模型指向了文化创意领域,此前预测大模型将首先在金融或绘画等领域得到应用,然而今年,大模型在图像、视频、音乐、语音方面的表现尤为突出,浙江大学的团队用生成式人工智能参与了亚运会部分音乐的创作,展示了大模型在文化创意领域的巨大潜力。
与基础大模型、应用大模型发展速度相比,人工智能工具的增长更为迅猛。据浙江大学工业信息研究所的统计,截至今年8月30日,全球已有19783种人工智能工具问世,短短五个月内,这些工具的数量增加了4000个,涵盖了文字、图像、视频、音频等多种类型。这些工具不仅在文化创意领域有着广泛应用,还在代码生成方面展现出了巨大的潜力。代码生成技术的兴起,预示着大量程序员的工作可能在未来被人工智能部分取代,成为人工智能工具中一个重要且具有挑战性的应用方向。
把工具和应用平台用好,文化创意就会迅速发展。在众多企业中,字节跳动是最为成功的例子之一,尽管它并未直接参与基础大模型或应用大模型的开发,却通过整合多种人工智能工具,打造了六个应用平台,这些平台中的五个被评为全球Top50应用平台,成为了文化创意领域中人工智能应用的重要代表。
(三)全球发展概观
从全球视角来看,不看技术,只聚焦于文化企业,福布斯在2024年评选出全球人工智能50强,而CB Insights则公布了人工智能100强企业名单,共评出了150家最具实力的人工智能企业,其中涉及文化领域的企业达到了94家,比例相当显著。这一现象表明,使用大模型的人工智能企业已大量进入文化领域,如果文化领域的从业者对此还没有足够的意识,将面临严峻的挑战。在这94家企业中,中国企业有41家,海外企业则有53家,尽管中国企业数量并不算少,但与海外企业相比,其关注点存在明显差异,中国的企业主要集中在文化装备和产品领域,如电视机和各类摄像设备等文化产品;而美国最大的公司则更加注重于设计和内容制作,这种差异值得我们深入探讨并加以重视。
从另一个角度来看,我们可以将文化企业划分为“文化新势力”和“文化老势力”。这种分类类似于汽车产业中的新旧势力划分,传统汽车企业如丰田、本田、上汽等属于“老势力”,而新兴品牌如比亚迪、领跑则代表“新势力”。在文化领域,我们同样可以划分出文化的老势力与新势力,传统媒体如电视台和出版社即为“老势力”,而诸如《黑神话:悟空》这样的新兴文化企业则被视为“新势力”。划分文化新旧势力的一种方式是以成立时间为基准,将2019年以前成立的企业归为“老势力”,而2019年以后成立的企业则归为“新势力”。从数据来看,中国企业自1998年开始发展,并在2009年达到一个高峰,随后保持相对平稳增长;而海外企业在2019年后则呈现出迅猛的崛起态势。2019年标志着人工智能大模型的迅速兴起,海外企业在此期间迅速发展,而中国企业在此浪潮中还不够敏感,未能充分跟进。
(海内外AI头部企业成立年份分布)
三、文化艺术产业将有大变革
从人工智能技术、文化发展的技术及商业模式来看,我们可以得出一个明确的结论:文化艺术产业将面临一场重大的变革,这一变革已经来临。可以明确的是,这场变革体现在以下三个方面:
首先,人工智能生成将使文艺创作与设计的效率和产业形态发生巨变。过去,老板通常给予设计师两个月的时间来完成设计任务,但在未来,随着人工智能工具的普及,同样的任务可能只需两周甚至两天的时间便可完成。
其次,设计与创作工具与平台(平台经济2.0)将使得全民参与文艺创作时代到来。如今,已经在摄影领域有所体现,只需一部手机,人们就有可能拍摄出高质量的照片。未来,这种现象可能在绘画、美术创作、视频制作、音乐创作等领域愈加普遍,更多非专业人士将通过平台参与到文化创作中,从而掀起文化内容的新高潮。
第三,能够掌握人工智能平台进行文艺创作或设计的人才将更加重要,反之,个人的就业空间将大大压缩。这一趋势在近年来已经初现端倪,但尚未达到高潮,一旦达到高潮,如果相关文化艺术院校的课程内容不进行相应改革,那么文化艺术专业的学生在就业市场上将面临更大的挑战;反之,若顺应这一趋势进行改革,今后的就业前景将更加广阔。
除了文化内容设计之外,文化装备领域的变化同样迅速。各种智能化的文化装备正在不断涌现,以浙江大学工业信息研究所与浙江大学合作的智能篆刻项目为例,该项目的研究工作主要包括三部分:首先,将篆字和字体进行了数字化处理;其次,实现了篆字在图形上的生成;最后,通过自动雕刻机完成篆刻,不再依赖手工雕刻。最初生成的篆字艺术性不足,浙大工艺所今年研发了一个人工智能系统,建立了一个印铺,系统中包含了赵之谦、吴昌硕等篆刻家的作品,人工智能的篆刻水平大概已经可以达到人的水平。该系统还被用于亚运会,为获奖运动员刻制印章,这一系统不仅大幅提升了雕刻效率,也展示了智能化文化装备的巨大潜力。
在我看来,人工智能所带来的文化产业变革是不可逆转的潮流,而这一潮流将与另外两个大潮相互叠加,产生多重机遇。第一个大潮是中国文化的复兴。近年来,中国文化复兴势头强劲,如国庆节期间人们身穿汉服的现象就是一个明显的标志,在游戏产业方面,以《黑神话:悟空》为代表的新作不仅登顶各大平台销售榜单,还推动了传统文化的传播,和历史文化遗迹的火爆,受此影响,国内外对《西游记》的兴趣激增,不少人为了理解游戏中的剧情而深入研究中国经典文学。
第二个大潮是文化产业的社会效应与经济效应的双重显现,表现出强大的市场潜力。据《经济日报》报道,全国规模以上的文化产业企业在2024年上半年实现营收达到64900亿元,占国内生产总值的约1/10,且增长速度较去年同期增加了5.7%。这说明,文化产业本身在中国就有很大的市场和动力,再加上人工智能与中华文化的崛起,这三大趋势的叠加必将推动中国智能文化生成产业的飞速发展。