一条成年抹香鲸和幼鲸在加勒比地区多米尼加附近游弋,通过咔哒声交流。科学家计划利用机器学习去破译它们之间的对话,这可能是历史上规模最大的跨物种交流尝试。
摄影:BRIAN SKERRY
撰文:CRAIG WELCH
2008年春天,一个神清气爽的早晨,加拿大生物学家Shane Gero无意间听见两条鲸鱼在聊天。Gero一直在追踪加勒比地区多米尼加附近的抹香鲸,两条来自同一家族的雄性鲸鱼突然出现在距离船不远的地方。它们是“水滴”(Drop)和“双弯”(Doublebend),用四四方方的脑袋互相蹭了蹭,开始交谈。
抹香鲸用“咔哒声”交谈,这是一系列有节奏的声音,被称为“密码曲”(coda)。3年来,Gero用水下录音机捕捉了几百条鲸的密码曲,但他从未听过这样的声音。这些鲸鱼“交谈”了40分钟,有时一动不动,有时像绳子一样旋转银色的身体,很少长时间沉默。Gero从未这么急切地想知道它们在说些什么。他觉得自己好像在偷听两兄弟在自己的房间里较劲。“它们就像兄弟姐妹那样,聊天,玩耍,”他说:“很显然,正在发生些什么事。”
在之后的13年里,国家地理探险家Gero记录并认识了几百条抹香鲸。但他不断回想起聆听水滴和双弯对话时获得的启发:如果人类想要破译鲸的语言,或者确定鲸是否有被称之为语言的东西,那么需要把它们的咔哒声与周围背景匹配起来。揭开鲸交流的关键在于了解这些动物是谁,它们发出声音时正在做什么。
海洋生物学家Shane Gero已经认识了多米尼加附近的几百条抹香鲸,包括被他称为“F家族”的这几只。他和鲸类动物翻译计划团队希望,把鲸的咔哒声与行为相匹配,从而了解它们发声的含义。摄影:BRIAN SKERRY
人类一直有一个愿望,那就是有朝一日可以和其他物种对话。Gero的观点发表后的几年里(这是部分原因),弥合交流鸿沟不再是天方夜谭。4月19日,一组科学家宣布,他们以Gero的成果为基础,开启一项尖端研究项目,为期5年,尝试破译抹香鲸之间的对话。
就在几年前,这样的尝试似乎还很荒唐。除了Gero外,研究团队还包括语言学、机器人、机器学习和摄像工程方面的专家。他们很大程度上依赖人工智能的进步;现在,人工智能可以在不借助罗塞塔石碑或语调的帮助下,把一种人类语言翻译成另一种。这个项目被称为“鲸类动物翻译计划”(Cetacean Translation Initiative,简称CETI),或将成为史上规模最大的破译跨物种交流项目。
这些科学家已经开始制作视频和音频专业记录设备。他们的目标是记录几百万条鲸类密码曲,并进行分析,从而了解鲸交流的底层架构:构成鲸交流的单位是什么?是否存在语法、句法,或者类似单词和句子的东西?专家们将追踪鲸发出和听到咔哒声时的行为,并利用自然语言处理领域的突破,尝试解读这些信息。自然语言处理是人工智能的一个分支,帮助Alexa和Siri响应语音命令。
我们训练狗对指令作出反应,海豚会模仿人类的口哨声;我们教黑猩猩和大猩猩学手语,通过敲击键盘上的符号教倭黑猩猩回答问题。首尔的大象Koshik甚至会说几句韩语。但从未有过这样的尝试。
这次的目标不是让鲸了解人类(语言),而是人类去了解生活在野外的抹香鲸彼此间说些什么。
“听起来就像摩尔斯电码”
这个项目始于另一位海洋生物学家和一个简单的构想:多个快速发展的学科的顶级专家合作,往往会带来巨大进展。
David Gruber也是国家地理探险家,但他的兴趣早已跨越了传统的学科界限。作为纽约城市大学的生物学和环境科学教授,他用潜水艇研究珊瑚礁。他在所罗门群岛发现了一种具有生物荧光的海龟,一群群发光的鱼利用亮光调节游动情况;他还研究了让猫鲨和一些鳗鱼发光的分子,并制作了模仿鲨鱼视角的相机。他曾与一位机器人专家合作,开发了一种有6根触手的精巧装置,方便研究人员拾取水母,同时不伤害它们。
语言学家认为,即便是最聪明的非人类动物,也没有能被称为语言的交流系统。鲸会是例外吗?
2017年,Gruber是哈佛大学拉德克利夫学院的研究员,也是一名潜水员。他读完一本关于研究抹香鲸的自由潜水员的书后,迷上世界上最大的齿鲸——抹香鲸。一天,他正在用笔记本电脑听鲸类密码曲,拉德克利夫学院的另一位研究员Shafi Goldwasser恰巧经过。
“那些声音真的很有趣,听起来就像摩尔斯电码,”Gruber回忆Goldwasser说。她负责为拉德克利夫学院的研究人员组织关于机器学习的讲座;机器学习是人工智能的一个分支领域,利用算法来寻找和预测数据模式。今天,从搜索引擎到鲁姆巴家用真空吸尘器,再到自动驾驶汽车,机器学习已经融入了生活的各个方面。她催促Gruber与学院里的研究团队分享这些咔哒声。
团队里有不少计算机领域的高手。Goldwasser是计算机科学家,也是全球密码学最重要的专家之一。Michael Bronstein是伦敦帝国理工学院的机器学习教授,创立过一家机器学习公司,后卖给了推特,用来监测假新闻。团队对Gruber的展示很感兴趣。机器学习能帮助人类理解动物的交流吗?
Gruber看到了机会。在职业生涯中,他一直在专注于各种神奇的事物,比如珊瑚、生物荧光和水母,让人们感受海洋的魔力。也许这个项目可以激发人们的想象力,让人们沉浸在大海的神秘和奇观之中。“我曾想过,如果我能让人们爱上水母,那他们也会爱上其他东西,”Gruber说:“而鲸的身上确实有一些东西引起了人们对好奇心。”
Gruber需要与了解鲸的人交流。于是,他找到了多米尼加抹香鲸计划(该计划旨在追踪鲸家族动态)的创始人Gero,给他发了一封邮件。Gero同意听听Gruber的想法。
语言学家认为,即便是最聪明的非人类动物,也没有能被称为语言的交流系统。鲸会是例外吗?人类语言进化的部分原因在于协调社会关系,而Gero已经证明抹香鲸有复杂的社会生活。
在动物王国里,抹香鲸的大脑最大,比人类大6倍。它们的社会网络以雌性为主导,通过一种跳音二重奏交流,尤其是靠近水面时。它们分成几百或几千个部族,用不同的咔哒声密码曲表明自己的身份。从某种意义上来说,部族之间有不同的方言。抹香鲸还会通过特别的咔哒声模式辨别对方,仿佛在呼唤名字。它们学习密码曲就像人类学习语言一样,幼年时咿呀学语,直至掌握家族的全部技能。
多年来,Gero已经辨别出多米尼加两大部族的几百条抹香鲸。凭借尾叶的独特斑纹,他一眼就能认出很多。他还通过分析粪便和皮肤样本的DNA,辨别出祖母、阿姨、兄弟和姐妹。
Gero保存着详细记录,包括几千份有着详尽注释的咔哒声记录。这些咔哒声描述了谁在说话,它们属于哪个部族,它们和谁在一起,以及它们当时在做些什么。
这足以展开测试。Gruber的机器学习领域的同事把人工智能技术应用到Gero的一些音频中,训练计算机通过声音辨别个体抹香鲸,正确率超过94%。
激动万分的Gruber建立了一个工作组,希望扩展这次的研究成果。除了Gero和Gruber在拉德克利夫学院的计算机领域的同事,还有鲸类生物学家、麦克阿瑟奖得主Roger Payne,他在20世纪六七十年代推广了迷人的座头鲸之歌,帮助发起“拯救鲸类”运动;哈佛大学的机器人专家Robert Wood,他和Gruber一起制作了水母处理器,他的实验室制作了自折叠式折纸和昆虫大小的无人机;麻省理工学院的计算机科学和人工智能主任Daniela Rus,同样也是麦克阿瑟奖得主。
他们认为,人类首次掌握了某种工具,可以更充分地理解动物们在说什么,甚至是那些大部分时间生活在黑暗中、在海面下300米处捕食鱿鱼的生物。
事实上,这些动物几乎完全依赖声音信息,这可能会让任务变得简单一点。在距离哈佛园几个街区之外的一家餐厅里,研究团队草拟了新阿波罗计划的方案,这一次的重点是破译深海外星人的语言。一度有人甚至提出,如果他们成功了,那么可能将为与外星生命对话提供一个框架。“我环顾四周,原以为会听到笑声,但并没有,很多人在点头,”Gruber说。
机器学习带来突破
但这并不意味着科学家胜券在握。
过去的几十年里,我们已经了解了很多动物独特的交流方式,草原犬鼠的叫声取决于接近者是鹰,是郊狼,还是人类。它们甚至还会根据人的高矮、衣着是白色还是红色,发出不同的声音。有些猴子会对特定的危险发出不同警报,看到豹子靠近和看到鹰时的叫声是不一样的。
在人工智能的帮助下,科学家发现了越来越多的动物交流。2016年,研究人员借助机器学习,破译了埃及果蝠争抢食物和休息地时的不同叫声。大鼠和小鼠交流的声音远远超出人类的听力范围。2019年,科学家把这些声音转换成声波图,并把这些图像投射到受人类大脑启发开发的人工神经网络上,把不同的声音与行为联系起来,比如逃离危险或试图吸引配偶。研究人员把他们的算法命名为“DeepSqueak”。
每小时里只有10分钟时间,抹香鲸会浮上海面,因此研究人员正在开发一系列视频和音频记录设备,捕捉它们的深海对话。人工智能将从它们喋喋不休的对话中,寻找规律。摄影:BRIAN SKERRY
现在这些想法之所以有可能实现,是因为过去10年里,随着算法更加复杂,计算机处理能力大幅提升,机器学习领域很快取得了突破。
一些计算机学习是“监督式的”,也就是说科学家给算法提供带有人类注释的案例,进行训练。比如,通过分析上千张标记为“猫”的图片,算法可以学习识别其他照片里的猫。
但神经网络则能在没有人类帮助的情况下,发现语言等事物的规律。有了几百万条谷歌新闻,以及缺失一些元素的短语,神经网络就能够为这种语言建立一个数学模型。这个模型会学习单词之间的联系,比如“巴黎”与“法国”,“罗马”与“意大利”。现在,这些模型是自然语言处理的基础,例如判断Yelp网站的餐馆评论是否是差评,或者检测垃圾邮件。
但仍有很多挑战要面对。对于人类来说,机器翻译之所以行得通,有一部分原因是不同语言之间的词语联想是相似的,比如“月亮”与“天空”(英语“moon”与“sky”;法语“lune”与“ciel”)。“但对于鲸而言,最大的问题是这些事物是否存在,”麻省理工学院自然语言处理专家、CETI的团队成员Jacob Andreas说:“这个交流系统中,是否存在像语言一样的最小基本单位,它们之间是否存在组合规则?”
为了找到答案,研究团队打算利用一系列技术。例如,深层网络方法,从语言规则体系中随机选出一些,检查对话“单元”是否符合这些规则。如果不符合,进行调整,再次尝试。计算机“调整和验证规则的过程非常迅速,可以重复成千上万次,生成一套比较贴合数据的规则,”Andreas说。
当然,研究进展取决于研究人员能否收集到足够多的数据。机器学习需要大量信息,但Gero的记录只有几千条。寻找鲸的对话规律可能需要几千万条密码曲,甚至更多。
而且,正如Gero对水滴和双弯的推测,科学家认为需要把交流与行为进行匹配。在捕猎行为之前,是否有一个特别的密码曲?或者在决定交配前,鲸类是否有特别的语言序列?
“这是鸡尾酒会问题,”Gruber说。在聚会上放置好几个麦克风,我们会听到好几段对话。但观察现场,比如谁碰了谁的胳膊,或者谁扫视全场寻找更好的伙伴,“整个场景就会变得更有意义,”Gruber说。
动物交流研究革新
4月19日,研究团队朝这个方向迈进了一大步。CETI领导者与多米尼加建立了伙伴关系,在该国的水域中采用了更多鲸类监测技术。CETI被列为TED“大胆计划”,这个计划会为8个大胆的项目筹集资金。研究团队还得到了国家地理学会的资助。
CETI的研究人员已经用了一年时间研发出大量精密的高分辨率水下传感器,在Gero研究鲸类的大部分水域,一天24小时记录声音。其中3个监听系统与水面浮标相连,可以直接沉入几百米之下的海底,每隔几百米就有一个水听器。
聆听鲸在自己的环境中,按照自己的方式说话。我们想知道它们在说些什么,我们很在意这一点。
David Gruber,海洋生物学家,国家地理探险家
国家地理勘探技术实验室和哈佛大学的机器人专家、国家地理探险家Wood帮助设计了新一代摄像机,它可以用吸盘附着在鲸类身上。不同于之前的版本,这款摄像机可以经受住鲸类捕食深度的海水压力,在几乎漆黑的环境中拍摄画面,录制高质量的音频。
麻省理工学院的Rus正在研究其他机器人技术,帮助开发空中、漂浮和水下无人机,悄然记录声音和视频。她最近帮助开发了一款泳动机器人,可以模仿岩礁鱼类摆动尾巴,悄无声息地游动。
“我们想尽可能多知道一些情况,”Gruber说:“天气怎么样?谁在和谁说话?10公里以外发生了什么事?鲸鱼饿了,病了,怀孕了,还是在交配?但同时我们也希望自己尽可能地隐形。”
外界专家表示,CETI可能会彻底改变野生动物研究,乔治敦大学的教授Janet Mann在澳大利亚研究海豚已有几十年,她表示,这个计划“不仅对研究抹香鲸,对研究其他动物的交流系统,都具有开创性意义。”
康奈尔大学的声学生态学家Michelle Fournet说,这项计划解决了动物研究中的一个关键难题。包括科学家在内,人们总是希望从动物的行为中看到类似人类的规律。“我们看见座头鲸摆动胸鳍,会觉得它们在打招呼。”但座头鲸通常只是在展现攻击性。人工智能可以消除我们的偏见,更准确地发现交流与行为的意义,Fournet说。
对于CETI研究人员来说,更多的价值在于发现过程本身。阿波罗计划把人类送上了月球,而在这个过程中,人类发明了计算器、尼龙搭扣和晶体管,帮助开启了数字时代。即使CETI无法破译抹香鲸的密码曲,研究人员也会在机器学习、动物交流和了解世界上最神秘的动物方面,取得重大的进步。
而且,多年之后,如果我们对抹香鲸的发声结构有了更清晰的了解,研究团队可能会尝试与它们进行交流,不是进行跨物种对话,而是观察抹香鲸的回应是否与预测的一样。这么做的目的是验证研究团队对抹香鲸交流的评估。
“问题出现了:你打算对它们说些什么?这似乎有点不得要领,”Gero说:“我们假设,它们有一种语言,来谈论我们,谈论船、天气,或者我们想问它们的事情。 ”
Gruber也同意这一点。“不是我们和它们对话,”他说:“是我们在聆听鲸类在自己的环境中,按照自己的方式说话。我们想知道它们在说些什么,我们很在意这一点。”
(译者:Sky4)
,