编辑机器人1
什么是机器人
首先,对于机器人的释义,我认同以下两个观点:
“机器人不是人,没有必要在形体、功能、感官上像人一样。”
“机器人是自动控制机器的俗称,自动控制机器包括一切模拟人类行为或思想与模拟其他生物的机械。”
做机器智能而不是人工智能
在2017年的云栖大会上,阿里着重强调机器智能的概念,认为我们努力的方向应该是让机器更加的智能,而不是致力于让机器模仿并超越人某些能力的人工智能。所谓机器智能,我认为应该包含以下几点:
1、在控制上更方便使用。这包含更方便人使用的人机交互技术、跟科学地任务自主规划设计技术等。
2、具有自洽的独立运行环境。随着智能化的不断深入,机器应该具有自己的一套活动规则,例如智能车不一定要按照人类习惯的交通规则运行、智能厨房不一定要按照人类平时烹饪的方法等。例如课上所讲未来将取消交通信号灯的事例,未来智能汽车必然是无人操控的、任务自动规划的、具备符合自身运转逻辑的风险控制能力。
3、我们对机器智能发展的把握,不仅要站在人类生活经验的视角,更要站在机器发展视角,按照机器发展的规律进行顶层设计。
编辑机器人
(一)发展现状调研
目前编辑机器人有两大较为成功的应用,一种是作为记者,自动监听主要信息渠道,通过自动抓取信息对日常新闻或是突发状况进行自动编辑报道。另一种是作为编辑,审阅平台上的文章,根据规则对其进行审阅和修改。
1、机器人记者
目前在工业中较为成功的应用,最早来源于2009年,美国职业棒球大联盟季后赛上,一款名为StatsMonkey的人工软件完成的一篇机器稿件,随后两年,包括《福布斯》在内的顶级媒体里开始尝试机器人写稿,其完成的文章应用在在商业、政治等各个领域。2014年7月美联社引进“机器人同事”后,全世界的新闻编辑室纷纷引入自动生成新闻技术。《纽约时报》《华盛顿邮报》《洛杉矶时报》《卫报》和路透社等西方媒体都走上了自动化新闻发展的道路。在国内,2015年9月,腾讯财经的机器人Dreamwriter正式出道,同年11月,新华社推出“快笔小新”,主打财经新闻。2016年,第一财经发布智能写稿机器人“DT稿王”。
2、机器人编辑
2001年,维基百科引入了机器人编辑者的概念,任何用户可以为自己研发的机器人单独建立一个维基百科帐号,只要根据维基百科社区官方的规定对帐号进行标注,即可让机器人参与维基百科的编辑。2014年,机器人在维基百科的所有语言中完成了15%的编辑动作,他们识别、撤销破坏行为,锁定遭到频繁篡改的页面、识别错别字和病句、创建不同语言之间的链接、自动导入站外内容、进行数据挖掘、识别侵权的内容并为新手编辑者提供引导等等。
(二)设计编辑机器人
根据课上所讲机器人工程研究及应用范式,围绕“机器人记者”方向应用,对编辑机器人进行系统架构的设计。
1、理念、领域、目的、前提、价值
充分发挥机器智能精准、高效、公正客观等优势,建立编辑机器人,用于包含但不限于财经、体育等各个新闻生产实践领域,逐步探索、自我完善,进入深度调查报道、解释性新闻等“硬核”领域。
可以将新闻记者从重复性、低时效比的劳动中解放出来,人类记者可以专注于具有创新性的、带有人文要素的高质量新闻产品的创作。同时,提供给用户客观、及时、准确的新闻报道。
2、可能涉及到的技术和方法
数据搜集整理、数据挖掘、模式化新闻写作、自然语言理解、深度强化学习等。
3、系统架构
基本系统架构如下图所示:
首先,拓宽信息获取渠道,综合使用专业平台API接入、网络爬虫获取新闻及社交媒体资讯、历史信息索引等多种方式,获取新闻媒体领域信息。
其次,在分析处理数据过程中,综合运用自然语言识别、数据挖掘、经济社会模型建模等方式,快速、准确判别数据是否为常规数据,如果为常规数据,则按照常规新闻模式进行文本编写,如果出现“黑天鹅”事件或重大事件,则进入突发新闻撰写模式。
第三,在两种文本撰写模式中,分别探索用户在阅读一般新闻和突发性新闻是的习惯,按照新闻写作的模式进行文本撰写。
第四,区别两种新闻的特点,部署针对用户个人特色的信息发布策略。
第五,收集用户接收新闻信息阅读情况,包括是否点开,停留时间,是否评论、是否转发等。建立用户反馈模型,改进各个模块。