有媒体报道,通过搜索引擎,可以找到一些“相约自杀”的QQ群、微信群等,成为有些年轻人自杀的诱因。搜索引擎方面自然对这种联想词功能的问题责无旁贷,然而媒体和公众花样翻新的测试,总是让产品设计者防不胜防。
为了让我们更方便的使用搜索,联想词是必然要加入的一项功能。而对人们的意图进行联想和预测,也是未来人工智能语音助手变得更好用的基础前提。但是,人类固有的思维盲区,让他们在设计算法和流程的时候,实在是难以预料用户会出现什么样的不当使用行为,导致什么奇葩的结果。
往往只有在媒体曝光,公众关注以后,他们才能知道运算的结果如何,然而此时,错误已经铸成。
年轻人在网上相约自杀的行为,中外都有。在中国,主要的网络平台载体就是QQ群、微信群等地。几天前《法制晚报》报道,又有三名青年通过QQ群“相约自杀”成功。
看到孩子遗体的父亲在悲恸欲绝之余,还质问网络平台说:
“聊了那么久,网站看不到吗?网络平台没有审核么?不承担任何一丁点的责任么?”
不管事实上看不看得到,从公司主观层面,腾讯当然都要说看不到用户的聊天记录。这一点可能不会遭遇什么异议,你当然也不希望自己在群里刚说了一句话,五分钟后就有警车呼啸而至什么的吧。
不过,在《法制晚报》的报道中,记者在百度上搜索“自杀群”关键字,就能非常容易地找到很多QQ群的号码。公开展示的信息,和私密的群聊是两码事。
报道称:结果页面不仅有聊天记录截屏。相关新闻报道,而且每次点击结果后,都会通过联想词自动“为您推荐”一些关键字,包括“约死微信群2018、 2018 相约死亡群、 2018 想死扣扣群”等。
笔者小时候曾经帮不太懂电脑的同学和家长找过资料,时常被询问“为什么我这么半天搜不出来,你一搜就有了”,这实在三言两语很难讲清楚。
但是,很显然百度的这些关键词联想功能,给了一些可能不太熟悉搜索引擎语法的用户机会,让他们可以获得更精准的结果。
记者向百度反映之后,百度已经修正了相关检索结果。现在你再搜索“自杀群”时,就不再显示带有具体群号码的讨论,基本上看到的都是相关事件的新闻,持续十几二十几页都是这样。
而且,让航通社感受颇深的是,跟“相约自杀”有关的搜索结果清理工作,在今天( 6 月 26 日)持续一整天都在不断进行。
今天上午,航通社测试在百度贴吧搜索框当中打“相约自杀”,并选择“全吧搜索”,还会发现带着QQ群号码的一些帖子;“相约烧炭”“烧碳”等一些变种也有帖子存在。但到了下午 4 点左右再测试,这些页面刷新之后基本都被清理了。
然而,媒体曝光的问题修改起来总是容易的。进一步操作的话就会发现,还有一些“高危”的短句搜索结果未作处理。
在贴吧搜索“相约烧炭”,旁边的“大家都在搜”提示了“烧炭多久可致人死亡”、“车里烧碳”、“烧碳如何确保必死”、“ 2017 有烧碳死的吗”这些短语。
笔者相信它们的形成机制,和报纸记者测试出现的“约死微信群2018”等是一样的,机器不太可能无中生有地造出这些排列组合。每一个关键字的后面,很大程度上都可能有不止一个真人亲自打出过这些词。
只要简单想想,就令人后背发麻。
在知乎,有关于百度的三个“经典问题”:
“百度作了哪些恶?”
“为什么有人说百度以一己之力全面降低了中国互联网体验?”
“为什么老师说‘百度搜索不是什么正经的东西’?”
在这些问题下的数千个回答中,有些提到的现象现在再看,已经无法重现。而有时在某个回答成为热门之后很短时间,其中提到的不妥当的搜索结果就会被清理。
笔者一度怀疑,有专门的百度员工盯着这些“招黑”的帖子和媒体报道。不过有自称的百度员工回帖说,一般他们都是路过看到,顺手贴进内网论坛,也通过这一渠道报了很多Case。
实际上,面对一部分搜索结果的Bug(特别是和盈利不明显挂钩的问题),百度并不是毫无作为,同时也乐于将一些搜索结果的改善大举宣传,作为企业履行社会责任的一部分表现。
具体到“自杀”问题,百度和国内其他搜索引擎,均已和国内相关的心理干预机构建立了合作关系。在一些比较容易想到的词语,比如说:“自杀”,“我想自杀”这类关键词结果页,都会出现求助热线电话号码,以及求助方式,基础知识等等。
至少有一部分人选择自杀时,并不是经过深思熟虑的,只是一时间想不开。与此同时,他又没有接触过关于自杀的一些基础知识,包括死亡的代价,寻死的疼痛,无法挽回和来不及后悔的具体含义。
也许,如果他们有机会了解到相关的知识,那么他可能就会被吓到,或者被劝阻,从而重新认真的思考自己这一决策是否合理。