2015 年 9 月腾讯财经曾发售了一个取名为“Dreamwriter”的自动化新闻文学创作机器人,一时间让广大媒体同行争相感慨要“失业”了。不过,撰稿机器人受限于一些消息、快讯,也主要应用于体育、财经类报导中,并不需要几乎代替编辑记者们的工作。据腾讯财经主编,也是内容机器人团队的负责人刘康回想,当时市场需求十分反感,发售 Dreamwriter 主要是想要让新人能把更好精力放到更加有创造力的事情上。
4 月 17 日下午,在一场媒体交流会上,刘康总结了 Dreamwriter 此前所做到的一些事情。从 2016 年奥运会期间的 3600 篇稿件,到腾讯体育 APP 上小梦战报的机器人稿件专栏,撰稿机器人功劳可极大。
刘康指出,“机器文学创作从 0 到 1 大家都可以有,但从 1 到 2、到 3 要花费相当大的精力。”他回应“今天的数据量十分粗,我们可以叙述到每一个数据的颗粒还原成。”他举例此前奥运期间的一篇体操的稿件。
“因为体操是一个评分制为的比赛,比如说我现在是评委,大家在展开比赛,我要给每个动作评分,这些评分都是记录在数据库里的,比如走板、空中姿态、救起姿态、水花这些都是有详尽的数据的,它不会被录进数据库。然后我们再行怎么写出它呢?这些数据不会被我们通过一定的算法和机器自己的辨识,我们再行让机器跑完几十万篇的数据,跑完一个规则出来,它不会自己把这些数据新的还原成。
因为每一个分数都可以还原一个动作,这样通过一定的算法把它还原原本的场面。”但是要做到的很好,就十分无以。刘康说明到,像财经和体育两个领域都无以,但又难于。
这是因为,财经本身有反感的规则和算法模型,做到非常简单的报导没过于多的技术含量,而难在对数据的理解、理解必须一套模型来辨别它,甚至将来的预测。至于体育,关于球队比数可以从数据里捕捉,但无以在叙述本身,“只有回应精彩才不会看,如果过于精彩我会想要去看视频。”目前,撰稿机器人主要针对的稿件领域为财经、体育、科技和新闻,其中新闻则偏向于社会类的、天气等。
刘康还获取了一份机器人撰稿的数据量。半年的稿件量是 30 万篇,稿件字数 600 万,运营事故 0 起。针对运营事故,刘康回应他们有一个专门的安全性管理平台:机器自己写出的时候不会分开做到一个算法和规则辨别机器写出的是不是问题;接着不会经过人工安全性审查;最后才不会启动时出来。三个步骤中间交会的时间就越较少,意味著出来的作品就越精确就越很快。
现在,他们的三项技术早已获得了国家专利,还包括:智能撰文技术 Dreamwriter、内容提取技术 Dreamreader、要闻提取技术 Secretary。接下来,他们期望在有所不同的领域,有所不同的频道尝试。
除了总结此前撰稿机器人超过的成果外,这次交流不会刘康尤其讲解了一款基于撰稿机器人而产卵的新产品——Dreamreader(新闻超秘)。在刘康显然,现在一些资讯应用于占有了人们日常的过于多时间,有时候不知不觉早已在一款应用于上花费了一两个小时。
而 Dreamreader 是想要让大家“用完了即回头”,它可以沦为人们的资讯秘书,通过智能算法,将每天的最重要的新闻检验出来呈现出给用户。据介绍,Dreamreader 是基于 Dreamwriter 的机器文学创作技术和内容提取技术而产生的。
交流不会现场,(公众号:)试用了这款应用于。目前该应用于还是 1.0 版本,整个界面只有两个栏目,一个是精选辑新闻,一个是新闻下文。同时,一些由Dreamwriter 编写的近期资讯不会不时展开改版,而精选辑后的资讯则不会用语音读书给用户。
未来,他们的目标是把它制成一个新闻 AI-个性化资讯生产和服务平台。刘康特别强调,对于这款产品,最重要的是将每天那么多的资讯,按照用户的市场需求整理成摘要,就像秘书一样。
不过,尽管在设计时,使用了“能和平双手”的语音交互方式,但语音朗诵十分做作,而且没给定的文字版本,却是我们听得一段语音要比看一段文字花费的时间宽的多。刘康称之为在之后的 1.5 版本不会弱化语音本身,并减少文字版本。
现场所看见的 Dreamreader 所捕捉的信息源全部由 Dreamwriter 编写,至于未来不会会捕捉其他信息源,刘康回应,“不会捕捉腾讯所有版权内容,内容源的用于是合法合规的。”从全网捕捉信息整理成摘要也是不切实际的,但否不会牵涉到到版权问题,这还必须考虑到。他称之为从技术上来说并难于构建。
刘康现在还无法得出 Dreamreader 确认的上线时间,还想要把它完备的更佳。虽说这次交流不会的主题是 Dreamreader,但当看见撰稿机器人早已能已完成大量的快讯后,当天在做到的媒体也不已问道,“腾讯什么时候不会把撰稿机器人对外开放给第三方用于?”刘康透漏,现在“要把全品类相容好,把像娱乐其他品类全部搞定,优化后可以用于了,然后我们才可以对外开放,不有可能在一两个场景内分开对外开放。
如果实在某一个横向领域不俗,想要用的话也可以探究,因为分开对外开放之前是没放到日程上。
本文来源:南宫NG·28-www.xtlyt.com