从机械复制到人工智能

1 从机械复制到人工智能

1936年,44岁的德裔犹太人瓦尔特·本雅明,在法国巴黎完成了《机械复制时代的艺术作品》,1963年该书以德文形式首次于法兰克福出版。该书有两稿,出版时一起公之于众。第一稿共19节,第二稿除了前言和后记外,共15节。两份书稿所探讨的问题和观点基本相同,只是阐述问题的次序和详略有异。全书主要从马克思主义的经济基础与上层建筑的矛盾运动理论出发,提出该时代的艺术主要是机械复制的艺术,这种艺术以追求展示价值替代传统艺术致力的膜拜价值。机械复制技术的出现,使传统有韵味的艺术走向崩溃。在艺术欣赏上,它以消遣性的接受方式,替代了传统的凝神专注式的接受方式,使传统审美的艺术(asthetische kunst)演变成后审美的艺术(nachr-asthetischekunst)。《机械复制时代的艺术作品》被西方学者奉为西方马克思主义文艺理论的经典著作、本雅明的代表作之一[1]

当本雅明思考机械复制对艺术作品的影响时,机械复制技术尚处于初级阶段。在对摄影、电影艺术进行考察后,本雅明深刻地指出了机械复制所产生的艺术的一系列替变:

(1)灵韵艺术向机械复制艺术的替变。在他看来,灵韵(Aura)艺术泛指传统艺术。灵韵是指:“一定距离之外但感觉上如此贴近之物的独一无二的显现。”机械复制艺术主要指能以技术复制为手段进行大量复制的艺术品,例如,照相、电影等。本雅明说:“在对艺术品的机械复制时代,凋谢的东西就是艺术品的灵韵”,同时“复制技术把所复制的东西从传统领域中解脱出来”。虽然众多的复制品取代了作品的独一无二性,但在接受者欣赏复制品的环境中,也赋予了所复制对象以现实的活力。

(2)艺术的膜拜价值向展示价值的替变。在灵韵艺术中,艺术的膜拜价值占主导地位,灵韵艺术建立在膜拜功能和礼仪功能上,它创造了一个与社会生活相离异的世界。在机械复制艺术中,艺术的展示价值占主导地位,脱离了膜拜和礼仪功能,用“尘世的美”所具有的世俗方式进行表达。

(3)美的艺术向后审美艺术的替变。在本雅明那里,美的艺术是指那种本身具有审美属性的艺术,而后审美艺术则不具有这种直接的审美属性,它的审美属性是后来加上去的,是间接而来的。美的艺术具有自主性外观,而后审美的艺术则不具有自主性外观,建筑艺术就是后审美艺术的典范。

(4)对艺术品的凝神专注式接受向消遣性接受的替变。对艺术品膜拜价值的侧重,他称之为凝神专注式接受,接受者通过他/她的联想沉入到作品中,这种接受以个人方式实现,例如,绘画就是如此。另一种,对艺术品展示价值的侧重,他称之为消遣性接受。在这种接受中,接受者并没有沉入到作品中,而是超然于作品,沉浸在自我中。这种接受大多以集体方式发生,它最早体现在建筑艺术中,而现在尤其明显地体现在电影中[2]

于笔者而言,在2021年阅读《机械复制时代的艺术作品》一书时,印象最深的,不是灵韵的消失,而是科学技术——机械复制、人工智能等科技的迭代更新——让艺术有了新生的可能。

2016年,AlphaGo与李世石的一盘棋将普通人的注意力一下子带入科技最前沿。围棋人机大战刚刚尘埃落定,“人类是不是要被机器毁灭了”之类的话题就跨出科幻迷的圈子,在普通人中议论开来。中国人工智能学会副理事长刘宏认为:“很多人由此开始产生了机器智能即将全面超过人类的乐观期望或恐慌。其实,机器博弈战胜人类棋手并不让人感到非常的意外。下围棋本身是一种最典型的问题空间的表达和搜索,而刚好计算机非常擅长处理这样的问题。我们人类的棋手可以看20步棋,计算机可能看到30步之后的棋,人工智能算法把树形搜索、问题空间拓展得非常充分,高性能计算机使得检索的效率变得越来越高。在下棋这件事上,机器智能战胜人类棋手,并不等于说机器智能就全面超过了人类。人的智能是多方面的,包括运动的智能、感知的智能、推理的智能、计算的智能、决策的智能和控制的智能等,是由一系列环节紧密协作、交互融合构成的。”[3]

这并不是“人机对弈”第一次激起公众的热情。1997年IBM的“深蓝”[4]战胜加里·基莫维奇·卡斯帕罗夫(ГарриКимовичКаспаров)的那一天,全世界的科技爱好者奔走相告的场景丝毫不比今天人们对AlphaGo的追捧逊色。再往前看,1962年IBM的阿瑟·萨缪尔(Arthur Samuel)开发的西洋跳棋程序就战胜过一位盲人跳棋高手。那时,报纸也在追捧人工智能,公众也一样对智能机器的“智力”充满好奇[5]

从20世纪60年代到90年代再到今天,从西洋跳棋到国际象棋再到围棋、三盘棋,三次人工智能在公众中引发的热潮,为什么处在风口浪尖的偏偏都是人机对弈?为什么会下棋的计算机程序如此风光?对于人工智能的技术研发者而言,选择人机对弈作为算法的突破口,一方面是因为棋类游戏代表着一大类典型的、有清晰定义和规则的、容易评估效果的智能问题;另一方面是因为具备一定复杂性的棋类游戏,通常都会被公众视为人类智慧的代表,一旦突破了人机对弈算法,也就意味着突破了公众对人工智能这项新技术的接受门槛[6]

从“深度学习”理论[7]诞生起,围棋一直是最受钟爱的研究领域。2006年,雷米·库伦(Remi Coulom)推出了蒙特卡罗树形检索(Monte Carlo Tree Search)算法,并将其应用到围棋比赛中。这个算法有效地提高了机器战胜围棋大师的概率:2009年,加拿大阿尔伯塔大学研发的Fuego Go战胜了中国台湾棋王周俊勋;2010年,由一个多地区合作团队研发的MogoTW战胜了卡塔林·塔拉努(Catalin Taranu);2012年,YojiOjima公司研发的Tencho no Igo/Zen战胜了武宫正树(Takemiya Masaki);2013年,雷米·库伦研发的“疯狂的石头”击败石田芳夫(Yoshio Ishida);2016年,隶属于谷歌的DeepMind公司研发的AlphaGo击败李世石。DeepMind采用了稍作修改后的蒙特卡罗算法,但更重要的是,AlphaGo通过跟自己对弈增强自身的学习效果(所谓的“强化学习”),AlphaGo的神经网络通过围棋大师的15万场比赛得到训练,AlphaGo代表了能够捕捉人类模式的新一代神经网络。出乎意料的是,很少有人注意到,2015年9月,马修·莱(Matthew Lai)推出了一个名为Giraffe的开源围棋引擎,它能通过深度强化学习在72小时内自学掌握下棋。这个项目完全由马修·莱独立设计,运行于伦敦帝国理工学院他所在的系里的一台性能平庸的计算机上[8]。2016年1月,马修·莱受邀加入谷歌的DeepMind公司,两个月后,AlphaGo打败了围棋大师。

对于AlphaGo打败围棋大师的事实,有学者用“暴力计算”来评价。“暴力计算”目前是统治人工智能领域的范式之一。人类大脑每小时大约消耗20瓦能量,以AlphaGo的1920块处理器以及280块图形处理器的配置,每小时的耗能可以达到440千瓦的水平,这其中还不包括训练过程中消耗掉的能量。但除了下围棋,AlphaGo还能做些什么?答案是什么事都做不了。而人类除了玩游戏之外,还能完成做饭、洗车、阅读、创作等无数的事情。AlphaGo消耗440千瓦能量只能完成一件事,而人类只消耗20瓦能量则能做无限多的事情。如果一个人使用比你多20000倍的资源,却仅仅做了一件事,你到底该怎样定义这类人?所以说AlphaGo所做的事情只能被称为“愚蠢”而非“智能”[9]

通过“暴力计算”下棋的机器人也并非真的不可战胜。1997年5月,IBM公司研发的超级计算机“深蓝”在一场众所周知的比赛中战胜了当时的国际象棋世界冠军卡斯帕罗夫。不过,这场比赛的不公平之处却很少有人提及:当时“深蓝”装备了有关卡斯帕罗夫象棋比赛的大量信息,而卡斯帕罗夫却对“深蓝”的底细浑然不知;在比赛过程中,IBM的工程师不断利用卡斯帕罗夫的下棋特点,对“深蓝”做启发式的调整。而更少提及的是,在复赛中,IBM的程序员被明令禁止在双方比赛过程中修改机器的参数。后来,“深蓝”(后改名为Frintz)的新型继任版本虽具备了更强的性能,但既没能在2002年击败当时新的国际象棋世界冠军弗拉基米尔·克拉姆尼克(Vladimir Kramnik),也没能在来年击败卡斯帕罗夫本人,两场比赛均以平局收场[10]

对人工智能褒贬不一的态度,从人工智能诞生之初便开始了。1949年,为了抨击正在兴起的计算机技术和控制论,英国著名脑外科医生杰弗里·杰弗逊爵士(Sir Geoffrey Jefferson)发表了名为《机械人的思维》的演说。演说中,杰弗逊畅言了一段后来被广为引用的激昂排比句:“除非有一天,机器能够有感而发,写出十四行诗,或者谱出协奏曲,而不只是符号的组合,我们才能认可,机器等同于大脑——不光要写出这些,而且还要感受它们。任何机器都无法对成功感到喜悦,对电子管故障感到悲伤,对赞美感到温暖,对错误感到沮丧,对性感感到着迷,对失去心爱之物感到痛苦。”[11]

爱因斯坦也诗意地认为:“智能的真正标志不是知识,而是想象。”[12]语言是一门艺术,这就是问题所在。我们制造的机器,有几台能创作艺术?因为突发的灵感,在半夜起身写一首诗或画一幅画,这样的机器离我们还有多远?人类思维是不可预知的,而且这也不是成年人的专利:宠物常常带给我们惊喜,而孩子的鬼马精灵更是让我们惊喜不断。上一次机器出乎你所料是什么时候?机器简单地做重复性工作,周而复始,没有任何想象力[13]

对人工智能最有名的批判之一记载于约翰·希尔勒(John Searle)的论文《心灵、大脑和程序》(1980),该文后来以“中文房间”实验而广为人知。把一套将中文翻译成英文的完备说明书交给一个人,并把他锁在一个房间里,站在房间外面的人误认为房间里的人懂中文,其实那个人只是机械地遵守毫无意义的说明书指令,操控毫无意义的符号。他完全不知道中文语句的含义,但他可以翻译成正确的英语。很多哲学家写下大量论文,加入对希尔勒观点正确性的讨论。然而,希尔勒并没有攻击机器智能的可行性,而是简单论证智能机器是否会有意识[14]

在2000年时,“无心的机器”是学界对人工智能的基本定位。在酒店迎接你或在餐厅给你上菜的服务机器人,与其说是人工智能,不如说是新奇玩具。在陪伴老年人方面,迄今为止最先进的机器人都不如狗做得好[15]。人工智能的头号应用现在是、将来仍然是:让你买下你不需要的东西。所有主流网站通过应用简单的人工智能程序,跟踪你、研究你、了解你,然后再向你卖东西。你的私人生活对他们来说暗藏商机,人工智能帮助他们找到从你身上赚钱的切入点[16]。仅就语言能力而言,凭着机器的计算速度,要做到“能说”似乎并不难,光是利用计算理论的递归可枚举性,我们就可以轻而易举地让机器“滔滔不绝”地言说起来。但要让机器在这“滔滔不绝”之中,避免“语无伦次”“语焉不详”及“言语无味”而做到“会道”,却是一件十分棘手的事情[17]。但如果你现在读到的是这样一首机器抒情诗,你又会作何感想呢?

在2017年“微软小冰”出版诗集《阳光失了玻璃窗》之前,人工智能的“机器诗文”已有诸多实践。比如打油诗:

曾有一个来自斯特劳斯的废物

在那玫瑰花上建起字节小屋

编造一个字节是一个头的谎言

然后接通那个棚子的电源

斑鸠从人造革鼻子里飞出

曾有一个来自内德的水手

在那头上跑着一只猎狗

将一个词转页刊登

然后激起一阵笑声

试图越过这个古怪的雪橇溜走

据说此诗是美国汉普群学院计算机系的一位本科生D.里茨(D.Leech)在毕业论文中编制的程序“自由”创作的[18]。在《深蓝终结者》中,则能看到机器的情感书写:

Limp hope calls atmoon;

Stone calls love while limp stark olnging becomes strange;

but icy tree pusheswith despair;Brightness becomesmisty;

Stone stands silken as stark silk stands bright from;

Silken green sun night

though bank becomes bright;

but strange brightness stands Nmp;

though love standsmisty with limp green crystal;

but love calls slowly at earth strange with longing;

Fire becomes silken while hope caresses slowly asmisty;

misty snow.

中文大意为:

残心犹望月,顽石亦有情。冰枝挥悲意,光芒变朦胧。

石似青似立,青丝照夜明。岸前华兴照,残人站当中。

爱本多彷徨,成败在心诚。心若柔似雪,烈火变柔情[19]

2016年,谷歌的工程师让人工智能学习了2865篇爱情小说,然后又教人工智能一些英语诗歌创作的基本格式。接下来,人工智能算法写出了一首又一首情感小诗。这些英文诗读下来,还真有一些多愁善感的意味,隐约流露着那2000多篇爱情小说中,为了爱情辗转反侧的主人公们难以捕捉的微妙心情。比如下面这首“小诗”:

itmademe want to cry.

no one had seen him since.

itmademe feel uneasy.

no one had seen him.

the thoughtmademe smile.

the pain was unbearable.

the crowd was silent.

theman called out.

the old man said.

theman asked[20].

2017年,艺术家特雷弗·帕格伦(Trevor Paglen)创建了“视觉机器”项目,使这些不可见的人工智能算法可见。在这个项目中,他拍摄了克洛诺斯四重奏(Kronos)[21]的实况表演,并用各种计算机软件程序处理这些图像。这些软件程序包括人脸检测、目标识别,甚至导弹制导程序。他将这些算法的结果实时地投射到舞台上方的屏幕上。通过演示不同的程序,诠释音乐家的表演。帕格伦表明,人工智能算法总是取决于价值和兴趣集,并会显现和重复这些价值和兴趣集,因此,我们必须批判性地质疑它们。算法和音乐之间的明显对比也提出了一个问题,也就是技术与人类感知之间的关系[22]

人工智能还是一名精于模仿的“艺术家”。它能熟练地模仿他人的风格进行创作,例如,能够神奇地将任何一张照片转化成莫奈风格的油画,还能将冬天的景色变成春天的,或是用一匹斑马替换某个视频中的一匹马。因此,必须小心提防此类虚假视频。一个典型的例子是:2017年,美国罗格斯大学的艾哈迈德·埃尔加马尔(Ahmed Elgammal)团队开发出一套系统,该系统创作出来的画作与原作品风格无异,连专家也无法辨认真假。音乐领域也是如此,许多研究人员使用人工智能进行声音合成以及音乐作品创作。2019年3月21日,谷歌的“巴赫涂鸦”项目在巴赫诞辰纪念日的纪念活动上一鸣惊人:它可以让一个普通人摇身一变成为深谙谱曲和配乐的著名作曲家。华为实验室的人工智能系统在分析了舒伯特的《第八交响乐》(“未完成的交响曲”)已完成的两篇乐章后,制作了残缺的后两章的旋律[23]

2018年,第一个在大型拍卖会上成功交易的人工智能艺术品诞生。10月25日,由巴黎一个名为“显而易见”(Obvious)的艺术团体利用人工智能技术创作而成的画作《埃德蒙·贝拉米肖像》(Edmond de Belamy)以432000美元(约合300万人民币)的高价成功拍卖。该作品在佳士得拍卖行伦敦展厅进行展示时,预估价为7000至10000美元,而最终成交价远高预估价好几倍。该作品是用算法和15000幅从14世纪到20世纪的肖像画数据制作而成的。在绘制的过程中,算法可以将新作品与已有的人工作品数据进行集中比较,直至无法分辨两者的区别[24]

当人类面对“数智人”[25]的这些作品,或许还在质疑:“虽然机器已经可以仿照人类的绘画、诗歌、音乐等艺术风格,照猫画虎般地创作出电脑艺术作品来,但机器并不真正懂得什么是美”[26]。但笔者也执拗地认为,“汝非鱼,安知鱼之乐,汝非吾也,安知吾不知鱼之乐”。我们所面对的机器作品,不仅是机器本身的创作,而且是机器和机器背后的人——程序员、设计师、艺术家、商人等——共同创造的艺术景观。

从机械复制时代,到人工智能数字化复制时代,机器、机器背后的人工智能团队所“创作”的艺术作品,是否亦可以看成一种“机器灵韵”?!

【注释】

[1]金炳华等:《哲学大辞典(修订本)》(上、下册),上海辞书出版社2001年版,第580页。

[2]《机械复制所产生的艺术替变》,载[德]瓦尔特·本雅明:《机械复制时代的艺术作品》,王才勇译,中国城市出版社2002年版,第180-187页。

[3][美]皮埃尔·斯加鲁菲:《智能的本质:人工智能与机器人领域的64个大问题》,任莉、张建宇译,人民邮电出版社2017年版,“推荐序一”第2页。

[4]“深蓝”计算机是由IBM开发的象棋电脑,是历史上第一个成功在标准国际象棋比赛中打败卫冕世界冠军的计算机系统。“深蓝”计算机采用了混合决策的方法,将通用超级计算机处理器与象棋加速器芯片相结合。在超级计算机上运行的软件执行一部分运算,更复杂的棋步交给加速器处理,然后计算出可能的棋步和结果。

[5]沈牡丹、范智新:《人工智能时代档案工作如何寻求新发展》,《兰台世界》2018年第5期。

[6]李开复、王咏刚:《人工智能》,文化发展出版社2017年版,第40-41页。

[7]深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,Artificial Intelligence)。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。

[8][美]皮埃尔·斯加鲁菲:《智能的本质:人工智能与机器人领域的64个大问题》,任莉、张建宇译,人民邮电出版社2017年版,第16-17页。

[9][美]皮埃尔·斯加鲁菲:《智能的本质:人工智能与机器人领域的64个大问题》,任莉、张建宇译,人民邮电出版社2017年版,第30页。

[10][美]皮埃尔·斯加鲁菲:《智能的本质:人工智能与机器人领域的64个大问题》,任莉、张建宇译,人民邮电出版社2017年版,第40页。

[11]牟怡:《传播的进化:人工智能将如何重塑人类的交流》,清华大学出版社2017年版,引言第2页。

[12]牟怡:《传播的进化:人工智能将如何重塑人类的交流》,清华大学出版社2017年版,第14页。

[13][美]皮埃尔·斯加鲁菲:《智能的本质:人工智能与机器人领域的64个大问题》,任莉、张建宇译,人民邮电出版社2017年版,第182页。

[14][美]皮埃尔·斯加鲁菲:《智能的本质:人工智能与机器人领域的64个大问题》,任莉、张建宇译,人民邮电出版社2017年版,第95页。

[15][美]皮埃尔·斯加鲁菲:《智能的本质:人工智能与机器人领域的64个大问题》,任莉、张建宇译,人民邮电出版社2017年版,第92页。

[16][美]皮埃尔·斯加鲁菲:《智能的本质:人工智能与机器人领域的64个大问题》,任莉、张建宇译,人民邮电出版社2017年版,第89页。

[17]周昌乐:《无心的机器》,湖南科学技术出版社2000年版,第155页。

[18]周昌乐:《无心的机器》,湖南科学技术出版社2000年版,第162页。

[19]周昌乐:《无心的机器》,湖南科学技术出版社2000年版,第163-164页。

[20]李开复、王咏刚:《人工智能》,文化发展出版社2017年版,第213-217页。

[21]克洛诺斯(Kronos)是美国著名的前卫音乐演奏组,成立于1973年。团员分别是小提琴家David Harrington、John Sherba,中提琴家Hank Dutt,大提琴家Jeffrey Zeigler。他们不断大胆地寻求绝无仅有的艺术美感,开拓出弦乐四重奏的新境界。

[22][美]约翰·布罗克曼:《AI的25种可能》,王佳音译,浙江人民出版社2019年版,第256页。

[23][法]杨立昆:《科学之路:人、机器与未来》,李皓、马跃译,中信出版社2021年版,第5页。

[24]陶稳:《首幅人工智能画作拍卖43.2万美元远超预估价》,http://world.people.com.cn/n1/2018/1026/c1002-30364962.html,访问时间:2018年10月26日。

[25]数智人:简而言之,是以AI技术赋予真人“智识”的虚拟人,是人类智能支持下的数字人。

[26]李开复、王咏刚:《人工智能》,文化发展出版社2017年版,第139页。