不知道你有没有想过这个问题:大数据眼中的我,究竟是怎么样的?
在互联网时代,算法推荐并不是什么新奇的概念。不过,“别人都被推荐了啥,和我又有什么不同”总是大家乐此不疲的话题——
不然,各大音乐软件出年度报告的时候,为什么大家都要“凡尔赛”地分享一下,体现自己独特的音乐品位?
最近,我和同事又发现了一个对比惨烈的“算法推荐实例”。
在一个平平无奇的工作日下午,同事突然发来一句话:“在购物软件里搜索‘连体衣’,看看互联网大数据对你的印象。”
出于好奇,我们几个人都在某橙色软件里输入了“连体衣”,随后发现了“令人大受震撼”的差异:
(友情提示:如果你好奇自己的结果,建议先退出该文章自行搜索,以免被下文的图片影响算法推荐)
热爱运动、刚入职一年的同事小A,搜索出来的结果,是学生党的最爱——背带裤。
嗯,这很合理,小A表示很满意。
而充满母性光辉、疼爱孩子的同事小B,则搜索出了婴儿连体服——
尽管她的孩子已经上了高中。虽然这算法推荐有些偏差,但也勉强还说得过去。
而男同事小C,在同事的注视下打开手机,搜出的结果是一件性感睡衣。
小C本人称:“我必须澄清一点——第一次搜索的时候(结果)不是这样的,因为我刚才看了微博上别人分享的几张搜索结果,算法才给我换成了这个。”
在其他人表示接受这一解释后,小C暗自松了一口气。
最离谱的其实是我们的实习生小D。
这位看上去很低调的00后,搜出来的结果竟然是裹住全身的“夜行衣”。
那一刻,我觉得坐在隔壁的小D更加陌生了——
这代表什么?难道他平时都在看忍者动画吗?
话说回来,这件衣服竟然是体操专用演出服,我也是没想到。
假如你是一位影视剧爱好者,搜索出的结果还可能是:
奥特曼的全身装备、《千与千寻》中的无脸人服装、《恶作剧之吻》中女主的万圣节装扮......
我这才发现,世界上还有这么多千奇百怪的连体衣,原来不是贫穷,而是算法限制了我的想象。
你看,这其实是一件会发光的连体衣。
实际上,在互联网大数据高速发展的当下,这样的“连体衣测试”早已有之——它的1.0版本,叫做“电饭煲测试”。
根据互联网流行语词典——《小鸡词典》的释义,“电饭煲测试”的具体过程如下:
在2021年,人们上橙色软件搜索“电饭煲”,出来的前四个产品的价格如果低于300元,就能说明你是被商家官方认证的“屌丝”,消费能力不行——
能通过“电饭煲测试”的人不在少数,我们部门事业有成的大领导,搜索出的结果是8000元的电饭煲;普通的学生党,搜到的都是300元上下的电饭煲;而吃土的打工人,甚至还能搜到一个1.9元的电饭煲(非常离谱)。
一个事实是,算法推荐是会随时变化的:
我在去年的“吃土”时期搜索“电饭煲”时,大数据向我推荐的还是200元左右的价位;而今年公司发完年终奖之后,最近一次搜索“电饭煲”,大数据已经开始向我推荐1000元以上的价位了——
还好别人不能看到我的搜索结果,这也让试图向爸妈隐瞒收入、暗藏私房钱的我暗自捏了一把汗。
当然,算法推荐也是一把双刃剑。
为了解除人们对“大数据侵犯个人隐私”“大数据杀熟”等问题的担忧,国家网信办等四部门近日联合发布了《算法推荐管理规定》。
该规定明确指出,商家不得利用算法操纵榜单、控制热搜,不得设置诱导用户沉迷、过度消费等违法或违背伦理道德的算法模型,如违反相关规定,算法推荐服务提供者或被处以罚款等,必要时追究刑责。
那些被猫猫打开过的网站,不知道会不会被算法“逐一收纳”。
不过,我们现在也还不用担心“算法过于精准”这个问题。
毕竟算法推荐被人们吐槽不准,也不是一天两天的事情了:国外的YouTube网站,就因为经常向人们推送一些他们不感兴趣,甚至是多年以前的视频,被吐槽“人工智能就像人工智障”。
2020年10月25日,南京大学人工智能学院教授俞扬,也曾在一场演讲中指出算法推荐的不足之处:
“以往的商品推荐是通过消费者的历史数据,预测未来会买什么样的东西。比如说,今天我家搬家了,买了一个冰箱,商品推荐就会按照我的历史数据,再给我推荐几台冰箱,那么这对于我来说就是一个错误的推荐。”
“不得人心”的算法,就像音乐软件推出的年度报告一样——你的“年度歌手”,也只是根据听歌次数得出的结论,却未必是你的最爱。
那么回到开头的问题,你的连体衣测试做得如何?
,