1932年1月4日,上海大戏院迎来了一位常客——鲁迅。后者原本打算看一部名为《城市之光》(City Lights,1931)的电影,但因为影院满座,只好改看《蛮女恨》(Aloha,1931),直到6天之后的1月10日,才如愿看到这部卓别林名作。[1]
鲁迅可能是最爱看电影的民国作家之一。文献记载显示,1916~1936年,鲁迅一共看过149部电影[2],其中有121部是美国电影,包括知名IP电影《人猿泰山》《金刚》和《陈查理探案》系列。[3]
这背后更多是市场因素:美式电影利用其高效工业化模式(标准化流程 规模化生产),轻松占领了中国的早期电影院线。
大绵羊 | 作者
一萌 | 编辑
放大灯团队 | 策划
影视业的第二次工业革命
鲁迅两度光临戏院看《城市之光》的年代,正值卓别林享誉世界的巅峰时期。而卓别林能有此成绩,也是因为他最早见证、参与并塑造了美国电影早期工业化的历史进程。
1913年9月,查理·卓别林以175美元周薪的价格,和启斯东影业公司(Keystone Film Company)签约,开启了他的电影生涯。巧的是,被誉为“喜剧之王”的启斯东制片人麦克·塞尼特(Mack Sennett),正是美式工业化电影的开创者:在塞尼特手中,制片人统筹全局,电影生产被切分成若干环节,创意、笑料等分给不同的人完成,实现流水化、规模化生产。
在与这家美国最好的默片公司签约的一年间,卓别林出演和拍摄了35部作品。并跟随塞尼特学到了现代电影的精髓:工业化生产。后期,卓别林投入全部积蓄1500美元,完成了他的前两部导演作品《20分钟的爱》(Twenty Minutes of Love,1914)和《遇雨》(Caught in the Rain,1914)。[4]
从1912年至今的一百多年中,美国电影行业经历了多次进化,最终,项目化、标准化、流程化的好莱坞模式成为美式工业电影的范本。
但以往的变革中,更多的是流程模式的改进,技术从来不是娱乐的主要驱动因素。直到最近几年,影视行业“第二次工业革命浪潮”来临后,事情正在起变化。
5G、大数据、云计算、人工智能等技术,成了影视行业工业化转型的重要工具。
在这场工业革命浪潮中,也出现了国内影视平台的身影。爱奇艺在今年的2021年世界大会上就提出了制作商业智能系统(PBIS)、智能集成制作系统(IIPS)和智能制作工具集(IPTS)三大块技术方案。通过一系列智能制作技术,为制片人提供IP评估、流量预测,测试作品开发等工具,以预判项目前景,辅助决策判断。
无论是云计算实现后期特效渲染(2019年最热的国产科幻电影《流浪地球》的后期制作中,就使用了华为的云渲染技术),还是5G帮助院线实现无硬盘拷贝发行,技术在娱乐业扮演的无非是工具角色,但以人工智能代表的“智能化技术”则不一样。
剪辑方面,2016年,IBM的人工智能Watson为生化科幻主题电影《摩根》(Morgan)做了剪辑[5];选角方面,爱奇艺的智能选角工具“艺汇”,选出了国内网络剧《最好的我们》的男主刘昊然,《泡沫之夏》中的女主张雪迎等,热门网综《中国有嘻哈》导师吴亦凡也是AI选出来的[6];辅助剧本创作方面,2016年伦敦科幻电影节参加展映的短片《阳春》(SunSpring),编剧就是一个名叫“本杰明”(Benjamin)的人工智能[7];2020年,另一部名为《律师》(Solicitors)的短剧的剧本,则使用了GPT-3技术编写。[8]
虽然目前人工智能的剧本写作风格还有些古怪(比如《阳春》里的动作指示就令人摸不着头脑:“他坐在行星上,坐在地板上。”创造者认为,写剧本的本杰明“介于作者和工具、作者和反馈者之间”)[7],但它们已试图制作一套评价体系,给人类写的剧本打分。
2016年,比利时创业公司Scriptbook推出“剧本打分”业务,通过剧本评估电影票房潜力;同年,国内网络视频平台爱奇艺,开始用人工智能为原创影视的剧本评分,2019年该工具升级为“知文系统”。
能不能火,AI知道
一部好剧本,不光是好口碑和大流量的基础,也能带来更高的商业回报。因此,在评价剧本时,需要认真对待。
与一般艺术作品的评价形式类似,影视行业也有一套完善的标准,用来给剧本打分。
参与剧本评价的成员,一份评分表,在每一条细则上打分。绝大多数情况下,总分反映剧本的好坏,并决定其接下来的命运。
无论中国还是外国,剧本的审读者用自己的标准,影响着剧本创作。然而,这样的标准对于剧本创作来说,多少显得主观,并有意无意地迎合分析师或剧本审阅人的口味,甚至展开了有趣的攻防游戏。
典型的如影视数据专家史蒂芬·弗洛斯(Stephen Follows),他研究了12309部失败剧本,并指出,一份剧本成功与否的三个关键是人物塑造、情节和风格,而最不重要的三个因素则是格式、原创性和剧本的悬念。
他甚至总结出数条技巧,帮助编剧打动分析师和制片人。[9]
不过,如果越来越多的剧本都用了这些技巧,反而会增加筛选难度。实际上,视频平台每年要播出的网剧就有上百部,这还不算每年上线的网络电影数量,对平台来说,为了降低海量影视剧的筛选成本,就需要一个靠谱的工具,辅助专家决策、作者创作和文本审核。
人工智能可以解救编剧们于水火吗?这得看AI审剧本的原理是否靠谱。
国内外的剧本智能评价系统,都建立在NLP(自然语言处理)技术上。利用这一技术,计算机就可以“读懂”剧本,这是AI评价剧本的基础。
NLP技术是人工智能领域的一个分支,是一种能够转换人类文字语言与二进制语言的技术,能够实现人与计算机之间的有效通信。简单来说,就是人和计算机之间的一个“翻译机”。
能看懂剧本还不够,更重要的是让AI形成标准,知道该怎么读懂、评价剧本。
国内外目前比较普遍让AI理解长文本的做法,是利用BERT等深度学习语言模型,对长文本内容进行分析与评估。模型的训练,需要搜集大量样本数据训练AI,让模型“学习知识”,再让它把学到的经验投入应用。
爱奇艺知文系统技术负责人温旭告诉放大灯团队(ID:guokr233),作为爱奇艺内部使用的内容理解平台,知文主要综合使用经典机器算法(贝叶斯平均、DBSCAN、XGBoost等)和深度语言模型(Attention、BERT、GRU等)[18],通过去中心化调度模式和统一管理平台,对长文本进行分析和评估。
那……如何训练AI呢?还得靠人类。
温旭表示,知文系统在开发初期,对标注数据十分依赖,需要大量的人工标注员做标注工作。
这些标注员的工作,就是在剧本里“打标签”。简单的如标记一个人名、地名,复杂的则有人物关系、人物性格、情节点等,AI看到剧本里的标注,就知道剧本写得好不好了。
在训练AI时,“题海战术”非常关键——AI看的剧本越多,积累的知识和经验也越丰富,最后的评价结果也就越准。
爱奇艺的知文系统有海量训练集,每一个样本都有几十乃至上百万字。知文团队还在通过内外部渠道,获取更多剧本训练AI。
学成归来,AI才有资格进行“实战”。
无论真人还是AI,对剧本的评估维度无非字数、场次、结构、人物、情节等。
两者的差别在于,AI评价剧本的粒度足够细致,而且因为标准统一,剧本能够得到相对公正的对待。但不同的AI剧本评估系统,所关注的侧重点也有所不同。
比利时的AI评估系统Scriptbook,就更关注影视的票房表现。
该公司创始人纳迪拉·艾泽玛伊(Nadira Azermai)是美国根特大学的应用经济学硕士[10]。在搭建Scriptbook的算法模型时,纳迪拉便利用这方面的经验,“在融资、制作和发行之前,对电影的商业价值进行客观评估”。[11]
Scriptbook曾回顾性确定了2015~2017年间,索尼32部作品中有22部是“票房毒药”。在2018年一场公开演讲中,纳迪拉表示“索尼本可以避免这22次失败的投资,前提是使用Scriptbook的系统。”[12]
相比Scriptbook“事后诸葛亮”式的回顾性研究,市场显然更需要预测性研究的产品。
一个案例是南加州大学维特比工程学院研发的AI工具。它依然基于NLP技术,能够在影片制作前对作品进行评级,帮助制片人调整暴力程度,降低后期重新拍摄或编辑的压力。[13]
爱奇艺的知文系统,与南加大的产品又有不同。在爱奇艺,知文能够接触到一批最新、最好的剧本,有机会直接应用于大量优质剧本,锻炼出深度的理解分析能力。这是创业公司和学校研究所无法提供的优势。
此外,知文还更关注剧本本身。
“主要是从长文本分析入手,侧重点在于对剧本或者小说内容本身的分析。”温旭表示,用户只需要上传前几集剧本,知文就能从剧本的字数、场次、人物、情节等维度,进行初步分析。
这些维度也是有排序的,人物和情节对剧本的重要性更高,两者的优先级也更高。其中,人物包括角色有谁、角色性格、角色间的关系、角色的出场、互动、戏份、情感变化,而情节则包括冲突和精彩度等。知文会评估每一个细节,并给出一个总的结论和评分。
总之,知文的工作就是尽可能地把剧本评价数据化、标准化。温旭表示:“因为评价逻辑是一致的,它给出的评估结果,在大体方向上与编导的意见也不会相左。”
赚钱不是影视行业的评价的唯一标准,剧本本身是否优秀更加关键。
知文系统识别劣质剧本的人机一致率高达88%。正如爱范儿对这类产品的评价:“在这个烂片层出不穷的时代,如果能用AI把一些辣眼睛的电影扼杀在摇篮里,那也是极好的。”[14]
解密爆款的钥匙
在剧本评价上,AI更像一个辅助角色。
在爱奇艺内部的提案会上,知文的评分已经成为剧本审阅人们的辅助参考。而技术团队对知文的最终定位,也是给每一个制片人找一个“优秀的助手”,利用算法和策略能力,帮他们提高决策效率。
但即便是辅助,在审核剧本时,AI仍需要解决不少挑战。
无论人类还是AI审核剧本,都需要人工标注,工作量和难度都很大。温旭告诉我们,与新闻、图像的标注不同,一个剧本动辄数万字,标注的时间成本更长,复杂度更高。另外,在涉及人物关系、角色性格、情节点等主观判断时,还需要标注人员具备一定的专业知识。他们上岗前,往往还需接受培训。
其次,AI剧评的算法模型仍有待完善。剧本分析场景过于特殊,目前学界和业界在这类场景中的开源平台和预训练模型较少。学习样本不够,直接影响AI评价的准确率。
ScriptBook就曾“翻车”——ScriptBook判断电影《爱乐之城》总票房将达到5900万美元,而实际上,它的业务价值超过1亿美元[15]。无论Scriptbook还是知文,都得不断为AI投喂训练样本,以提高评价准确度。
最大的困难,还是在与业务方的沟通上。AI剧评是个新生事物,不少业务方还难以接受让计算机参与日常的剧评工作。温旭表示,知文一方面要加强与业务方的沟通,转变他们的思想,另一方面要理解业务方需求,输出他们需要的技术。
到目前,知文系统分析过的拍摄潜力比较高的头部优质剧本已经超过3000部,爱奇艺现有的60多个工作室中,半数活跃工作室都用上知文系统。今年上半年,在爱奇艺播出的两部家庭剧——《生活万岁》和《生活家》顺利上线,也离不开知文系统的作用。
1927年1月24日,鲁迅看完国产电影《诗人挖目记》,严厉批评其“浅妄极矣”[16]。但他也对中国电影抱了一丝希望:“幸而国产电影也在挣扎起来,耸身一跳,上了高墙,举手一扬,掷出飞剑……”[17]
工业化是中国影视崛起的良方,而大数据和人工智能等技术,则是其中重要的催化剂。让从业者接受,并利用起这个AI剧评技术,不过是时间问题。国内影视行业将迈出工业化的关键一步,我们距离“东方好莱坞”也更近了些。
References:
[1] 鲁迅. 日记·1932年1月4日、1月10日. 鲁迅博物馆.
[2] 刘东方. 从鲁迅所观看电影的统计管窥其电影观——兼及鲁迅电影观的当下启示[J]. 鲁迅研究月刊, 2012, 000(001):18-25.
[3] 刘笑. 传播学视野下的鲁迅与电影研究[D]. 湖南大学, 2010.
[4] Vance J , Bowman M , Robinson D . Chaplin : genius of the cinema[M]. Harry N. Abrams, 2003.
[5] Philip Hodgetts. IBM Watson cuts trailer for Morgan.Philiphodgetts.com 2016-8-31
[6] 比萨.你追的热播剧主演,可能都是机器选出来的. 传媒圈. 2019-7-15
[7] Annalee Newitz. Movie written by algorithm turns out to be hilarious and intense. Arts Technica. 2020-5-30
[8] Luke Dormehl. A.I. creativity is improving fast. This hilarious GPT3-generated film is proof. DigitalTrends. 2020-10-20
[9] Stephen follows. Judgeing Screenplays by Their Coverage
[10] Nadira Azermai的LinkedIn主页
[11] John Biggs. ScriptBook uses AI to pull great movie scripts from the slush pile. Techcrunch. 2016-9-13
[12] Peter Caranicas. Artificial Intelligence Could One Day Determine Which Films Get Made. Variety. 2018-7-5
[13] Jeff Spry. USC'S New Script-reading AI Tool Can Predit A Film's Rating in A Flash.syfy wire. 2021-1-3
[14] 吴羚. 拒绝烂片,这个 AI 能给剧本打分. 爱范儿. 2016.9.13
[15] Peter Caranicas. Artificial Intelligence could one day determine which films get made. The Star. 2018-7-9
[16] 鲁迅.日记. 1927年1月24日. 鲁迅博物馆
[17] 鲁迅. 准风月谈·电影的教训.
[18] 爱奇艺技术产品团队. 深度语义理解在剧本角色情感分析中的探索与应用.2020.7.24
,