“写稿机器人会让我以后失业吗?”坐在我对面的是腾讯内容机器人项目负责人刘康,这是我向他抛出的第一个问题。尽管这个问题由我–一个报道人工智能动态的科技编辑提出来,显得颇为反讽。短短两三年间,周围比我年轻的同行们,工作方式大多经历着剧变:传统门户纷纷转型成为内容分发平台,机器的介入让内容分发更加流水线化,个人内容生产者越来越多……
除了分发之外,一部分简单的原创稿件现在也可以由机器人代劳,机器写稿并不是今年这一轮人工智能热的结果。彭博、路透等全球各大新闻机构早已有可以快速生成财经新闻的软件。根据腾讯提供的数据,在2015年下半年开始应用的腾讯写稿机器人Dream Writer,如今在财经应用的发稿量已超过2,000篇/天,包括每天的行情报盘和板块异动、大量的上市公司公告和财报,还有宏观数据报道。体育产量达到500篇/天的规模,包括篮球NBA、足球意甲、德甲、西甲、法甲、英超、欧冠等赛事实时报道,具体到小节赛。
从写稿机器人到写诗机器人,机器对写作、创作–这一人类思维最高级表现形式的介入,让人类惶恐不已。机器写稿每介入一个新领域,都会引起一轮“机器人会不会跟记者抢饭碗”的热议。几乎所有变革的初衷都是为了提高效率,却在后来的过程中极大地改变了行业生态。虽然人工智能可能永远没有办法代替记者实地采访,但未来可能真的不需要这么多媒体人了。
在“2017FT中国人工智能前沿发展论坛”上,我与腾讯内容机器人项目负责人刘康的访谈,自然围绕类似话题展开,顺带也夹杂了我个人私心–作为新旧交替时代的媒体人,怎样才能不被机器人取代?
“未来的资讯消费是分场景和效率的”
“工作原理还是得分场景”,刘康向我介绍Dream Writer的工作原理时说道,“我们最开始做财经的时候,是抓宏观数据、行情数据,比如股票类的财报类的数据,这种数据不是很有成本门槛的。然后到收盘的时候,它有一些股价的异动,板块的异动,甚至到个股的异动,都会触发一个指令让机器来写,我们会给它提前设置多种多样的模板,是通过多样的模板和机器对规则的学习来写东西的。”而体育新闻的机器写作则是另一套方法,刘康向外界介绍体育新闻的写作规则时常常会拿奥运会的跳水项目来举例,因为“奥运会的官方数据非常好”,用他的话来形容就是“颗粒度细”。比如说单人跳水有好多的动作细节,走板、起跳、水花等等,每一个动作都有难度系数,评委都会打分,“我们可以把每一个得分、数据还原成一个动作,你可以把它理解为一个表格,每一个分数就会完成一个动作、动作描述。但是怎么成文还是需要机器自己去根据上下文的语境,适配一些连词语气词,它还会根据分数的悬殊来选择一个合适的风格,比方说分数差距特别大,它就会给一些比较惊叹的表述。”
除了财经和体育外,Dream Writer的机器写作也在考虑拓展到其他有较好数据源和数据量的资讯领域,比如房产和汽车。而刘康团队,在Dream Writer的基础上做了应用层面的升级,开发出一款由机器人编辑的智能资讯App,名称尚未确定,内部代号叫“新闻超秘”。与现下流行的今日头条和腾讯旗下天天快报风格不同的是,这款App是为用户“省时间”的:将每天的重要新闻由写稿机器人做整合概况,以语音交互的方式投放给用户。“也就是说,我每天早上起来对着它说:告诉我今天有什么重要新闻,然后它就可以把重要新闻在一分钟之内告诉我。”刘康这样形容它的使用场景。
在养生八卦、标题党、各种夸张新闻抢占用户时间的当下,这样一款主打简洁的资讯App真的会受到用户的欢迎吗,这是浮上我心头的最大疑问。“我并不奢望很多人来用,我只服务这些时间特别紧,或者对硬资讯需求特别强的这部分人。”“未来人们对资讯的消费是分场景和效率的,这个我们都得考虑进去,那也是机器人的强项所在。”刘康补充道。
“假新闻不应该怪机器”
对特定领域的新闻进行简单而准确的报道、对现有新闻内容进行整合概况,对机器人来讲已经不算是什么难事,但就现阶段而言,机器依然无法对数据或事件进行分析和解读,这也一定程度上限制了机器写作门类的拓展。“现阶段AI的自然语言理解相对比较弱,就是它还没有能力像我们人一样读懂一篇文章,它现在只能基于统计学原理,把这篇文章或者某一个事件文本里面重要信息提取出来,它还不能说出来这个文章是为什么重要?意义在哪里?我怎么解读这一部分的内容?”刘康预计,在未来一到三年内,AI语义识别上会有所进步,也许可以在这一方面有所进步。
同样,机器写作技术的突破依赖于底层技术的发展,比如自然语言的处理、交互能力、算法等的进化。“其实我们在这个机器写作只是一个技术的应用,每一次技术的应用的爆发都是基于现有技术的成熟,比如我们现在的语音技术确实有一定的突破,虽然还没有到特别厉害的时候,但它突破了一个小瓶颈,所以带来了一波丰富的应用,比如车载产品、app、音箱。”
除了技术上带来的局限性,将AI引入分发环节的各个门户和资讯网站面临着更大的问题:大量假新闻、软文甚至“黑稿”堂而皇之地通过机器分发,出现在读者眼前。算法还没有成熟到可以像人类编辑一样识别假新闻甚至软文,Facebook也曾因此而“中招”。“假新闻不应该怪机器,这是人的行为,人要发假新闻,自然会通过各种渠道去发。”刘康认为,针对这一问题或许可以从分发环节进行克制,比如说引入信用体系。对于权威机构给予高信用级别,而一旦被发现发布假新闻,则对其降级或者禁业。
媒体人要学会凌驾在机器之上
断言已经介入媒体内容生产和分发的机器人会完全取代人类记者可能太过夸张,但机器的介入对整个媒体行业形态意味着一种变革。这种变革不仅仅体现在媒体人数量上,更体现在工作方式上。“机器介入媒体行业,可以理解成一种进化,里面包含着主动进化和被动进化。” 刘康认为,将工作中比较简单的部分交给机器来处理,媒体人可以做到凌驾在机器之上,但跟其他行业一样,如何跟机器相处,也是媒体人面临的新问题。“如何和机器相处,如何和机器一起合作来提高效率,是下一个大家要探讨的问题,未来人们要首先要适应的一点就是人机交互。”
刘康甚至对媒体行业的人机交互场景做了个设想:“比如给每一个媒体人配备一个媒体版的机器人。比如我们要做一些选题,早上一来,大家先开个选题会,把这周要做哪几个题定下来,之后剩下的工作交给机器去做,比如收集资料,设定具体的模板框架,把不同风格的文本都准备好……写完之后交给编辑来审,编辑根据不同风格发到不同渠道。”
“被机器淘汰”与“凌驾在机器之上”的临界点究竟在哪里,依然是新旧交替时代的媒体人们困惑的议题。刘康认为,不会被机器淘汰的媒体人至少应该拥有以下三种特质之一:第一是有个人资源,拥有第一手的可靠信源;第二是优秀的写作甚至“创作”能力;第三就是分析理解能力,他举了个例子:“比如证券领域我们认为比较难的不是写东西,而是解读分析,因为我们加了好几个计算模型过去之后,发现我们要解读行情异动、个股异动依然很难,因为他不仅仅涉及一个数学问题,你很难把所有的维度全部对齐。” “我们未来要做的事情就是尽量让自己凌驾在那个临界点之上,我们要管机器,不能被机器管、不能被机器取代。”他最后强调。(转载自FT中文网)