前言
技术发展之迅猛,不断刷新我们对时间的体验。短短一年就被生龙活虎地过成了三五年,直逼“一年一代沟”这十分尴尬又令人兴奋的现实。
早在(得说早在了)2011年年底,中科院数学研究院邀请我去作一个讲座,主题是用计算机自动生成影像的可能性,因为那年我刚刚获得电影学博士学位,这个主题与我的博士研究课题有关。当时,我给出的答案是:“目前(截至2011年底)来看还不太可能。”
今年(2017年),阿法狗毫无悬念地击败了柯洁。人类虽败犹荣,因为机器也是由人来设计并制造的,只是它的学习能力比任何个人都更强大而且从不知疲倦。
近来看到人工智能在影像方面的进展:人工智能系统可以先对某一类型的100部预告片进行学习(比如进行视觉、音频、场景构成等的分析),然后,将一部同类型完整影片Morgan导入该系统。系统迅速从中挑出10个最适合制作预告片的电影场景,并为制作人筛选出六分钟的片段,让电影预告片的剪辑时间缩减到24小时。该技术目前已有了不少实际应用场景。
那么,如果站在今天(截至2017年夏天)要来回答当年的这个问题,答案又是什么?我得说:“现在还并没有,将来仍是个未知数……”
因为,计算机强于逻辑,它目前能做到的基本都能转化为明确的参数和指令,比如画面明度、色彩、运动速度、音量、音高、音长……通过这些参数所进行的判断和选择,仍在较低的认知维度上——尽管,我们不得不承认,它的判断速度的确“秒杀”人类。
您现在手中的这本书,试图探索的是高维的影像世界。表面看来,这是一本切入点很小的书,小到了只包含着十五个“词语”。但正如马克思所说,“语言是思维的物质外壳”,这本关于“电影语言”的书(或者说,“电影语言词典”的雏形)背后,是每个词所蕴含的丰富可能性,它无疑指向更高维的认知世界。
那么,这本书是给谁看的?电影专业的学生、影像制作的初学者,甚至电影从业者,如果觉得缺少创意时,都可以看,愿你能从中找到灵感。当然,计算机也可以“看”,这可以作为神经深度网络学习的素材之一吧?
只是不知道,在这场新的人机学习竞赛中,人类能否胜出并扳回一局、在机器面前保住人类的尊严?这个答案,得交给每一位读者自己来判断。
体例说明:
1.每个电影案例,包括“图片+文字”两部分,文字在对应图片的左边或右边
2.案例标题中的“*个镜头,段落长度*′*″”指的是该段落本身的相关信息,而非它在整部电影中的位置
3.图片左边或右边的文字所标注的“镜*”也是基于该段落内部的镜号排序。如果前后几幅图的镜号一致,则表示它们来自同一个镜头,镜头运动可能使构图产生了变化