2016年初,Instagram的工程师们碰上一项棘手的任务。管理层担心用户会错过消息流中最重要的内容,要求工程师修改算法:不再按时间顺序展示朋友发的帖子,而是根据用户个人喜好对时间线的排序进行调整。Facebook的动态消息正是采用了这样的算法。全世界身价最高的一群工程师花了大量时间才将Facebook的这个算法开发成功,它决定了 Facebook的20亿用户能看到什么内容。
Facebook的应用机器学习项目负责人Joaquin Candela表示,到了 Instagram那里,三四个工程师只用了不到五周时间就搞定了。因为Instagram的团队可以复制Facebook动态消息现成的算法,只需稍加改动让它适用于Instagram即可。不管Instagram工程师到底改了多少,就Instagram能直接从Facebook动态消息直接汲取巨大动力这件事来看, Facebook的基础引擎可谓相当成功,具有压倒性优势。我们不妨将这种引擎(以及它背后无数的模块化人工智能)视为Facebook的主算法(这是我的说法,Facebook没有这样说过)。
最近,Candela讲述了自己的团队如何与公司其他设计团队合作,如何为他们开发工具,以及人工智能如何一步步成为Facebook大部分业务的核心技术。如果Facebook存在的意义就是告诉我们接下来看什么,那么不断向用户推送这些内容的人工智能无疑就是这家公司最重要、有时也是最具争议的知识产权。这种为了提高用户参与度而精心挑选、排序的消息推送是策略的产物,也许有朝一日,历史学家会将其视为一座里程碑,将它摆到与蒸汽机同样重要的位置上。
不过人们也发现,这套旨在吸引用户注意力的设计会被别有用心的人利用,即便正常运作,也可能对我们的民主制度产生不利影响。美国国会为此在11月传唤Facebook等科技公司出席听证会。Facebook一度沦为俄罗斯左右舆论的工具,平台上虚假消息泛滥,可能让很多用户平添了嫉妒和烦恼。Facebook主算法一边对内容进行个性化,一些观点极端的新闻网站一边争相为主算法提供素材。两相结合之下,许多用户看到的个性化内容对重要性的呈现已偏离现实。与此同时,Facebook宣布招聘更多员工帮助过滤广告与贴文,这说明Facebook的功能中有许多人工智能无法独立完成的事项。
人工智能算法向来十分神秘,其运作方式很难参透–就连Facebook的很多工程师也不了解。 “Facebook四分之一以上的工程师会调用我们的人工智能平台,”Candela说,“但(其中)70%以上的人并不是人工智能专家。”Candela表示,这些Facebook工程师没有必要懂得如何构建人工智能算法就能使用它,因为这套系统“就像模块做成的千层蛋糕,你想在哪一层插入都可以。”他补充道,“这种神奇的力量实在是太难描述了。”这个平台分为不同的部分,分别执行Facebook旗下产品(比如翻译、语音识别等)各个“特定领域”的任务。
信息管家,还是时间吸血鬼?
Facebook的月活跃用户达20亿人,每当一个用户打开Facebook应用程序时,个性化算法就会对用户可能看到的所有推文进行分类,并将它认为用户想先看的内容推送到前面来。Candela说,系统需要权衡成百上千个不断更新的趋势,没有人工智能,许多趋势是无法分析的。
Facebook近来打击“标题党”内容的行为就是权重更新的一个例子,所谓“标题党”,就是骗你去点击一些“误导人、哗众取宠的故事或垃圾信息”的链接。训练算法需要耗费人力:一个团队分析了10种语言的成千上万的贴文,标记出有问题的标题,它们要么藏着掖着(“……的一件事”),要么夸大其词(“震惊!……”)。最后开发出的系统能自主扫描链接,然后根据人类所收集的数据,下调符合这些标准的内容的排序。
Candela说,Facebook的主算法现在还可以从我们发布的贴文和照片中提取额外的信息。例如“推荐”功能,用户可以用这个功能查询在巴塞罗那旅行时哪些地方值得去。由于Facebook的人工智能确实“知道”圣家堂(La Sagrada Familia)是什么、在哪里,因此任何在评论中推荐它的人都会在贴文上方的地图中看到它弹出来。Candela表示,这个功能有很多种用途,Facebook的用户就发明过许多出人意料的玩法。伊尔玛飓风(Hurricane Irma)袭击佛罗里达州时,人们用Facebook做了一张地图,在上面标记出售卖瓶装水的商店地址。写贴文的人先激活“推荐”功能,其他人只要在回覆中报出店家地址就可以添加了。
Candela说,公司团队为Facebook的主算法添加了新功能,“为社交互动增添价值”。首席执行官马克·扎克伯格(Mark Zuckerberg)最近说,Facebook的使命是“让世界连接得更紧密”。Candela说,溢美之词都是次要的,主要的衡量标准还得看人们与Facebook应用程序和社交网络的互动情况。比如点赞和评论是否增加了?用户是否觉得机器翻译的贴文有用?用户使用Facebook Messenger智能助手M的频率如何?等等。
Facebook的收入与用户花在其各种产品上的时间息息相关。在最近的一次报告中,这个数字正在上升:2016年4月,Facebook称每个美国人每天花在该平台上的平均时间为50分钟,而2014年7月时,这个数字还是40分钟。在Facebook两万多名员工取得的这项成绩背后,有个不言自明的假设,即:人们多用Facebook是好事。当然,我们很难想象一个没有Facebook的世界,它早已成为人们相互联系、了解新闻和家人朋友动态的中心。然而基于我们过去一年来所经历的事情(俄罗斯左右舆论),还是很有必要问一句:这个功能强大的主算法到底是善意的?还是包藏祸心?(转载自华尔街日报中文网)