编辑机器人1

2018-03-19 本文已影响35人大补丸

什么是机器人

首先，对于机器人的释义，我认同以下两个观点：

“机器人不是人，没有必要在形体、功能、感官上像人一样。”

“机器人是自动控制机器的俗称，自动控制机器包括一切模拟人类行为或思想与模拟其他生物的机械。”

做机器智能而不是人工智能

在2017年的云栖大会上，阿里着重强调机器智能的概念，认为我们努力的方向应该是让机器更加的智能，而不是致力于让机器模仿并超越人某些能力的人工智能。所谓机器智能，我认为应该包含以下几点：

1、在控制上更方便使用。这包含更方便人使用的人机交互技术、跟科学地任务自主规划设计技术等。

2、具有自洽的独立运行环境。随着智能化的不断深入，机器应该具有自己的一套活动规则，例如智能车不一定要按照人类习惯的交通规则运行、智能厨房不一定要按照人类平时烹饪的方法等。例如课上所讲未来将取消交通信号灯的事例，未来智能汽车必然是无人操控的、任务自动规划的、具备符合自身运转逻辑的风险控制能力。

3、我们对机器智能发展的把握，不仅要站在人类生活经验的视角，更要站在机器发展视角，按照机器发展的规律进行顶层设计。

编辑机器人

（一）发展现状调研

目前编辑机器人有两大较为成功的应用，一种是作为记者，自动监听主要信息渠道，通过自动抓取信息对日常新闻或是突发状况进行自动编辑报道。另一种是作为编辑，审阅平台上的文章，根据规则对其进行审阅和修改。

1、机器人记者

目前在工业中较为成功的应用，最早来源于2009年，美国职业棒球大联盟季后赛上，一款名为StatsMonkey的人工软件完成的一篇机器稿件，随后两年，包括《福布斯》在内的顶级媒体里开始尝试机器人写稿，其完成的文章应用在在商业、政治等各个领域。2014年7月美联社引进“机器人同事”后，全世界的新闻编辑室纷纷引入自动生成新闻技术。《纽约时报》《华盛顿邮报》《洛杉矶时报》《卫报》和路透社等西方媒体都走上了自动化新闻发展的道路。在国内，2015年9月，腾讯财经的机器人Dreamwriter正式出道，同年11月，新华社推出“快笔小新”，主打财经新闻。2016年，第一财经发布智能写稿机器人“DT稿王”。

2、机器人编辑

2001年，维基百科引入了机器人编辑者的概念，任何用户可以为自己研发的机器人单独建立一个维基百科帐号，只要根据维基百科社区官方的规定对帐号进行标注，即可让机器人参与维基百科的编辑。2014年，机器人在维基百科的所有语言中完成了15%的编辑动作，他们识别、撤销破坏行为，锁定遭到频繁篡改的页面、识别错别字和病句、创建不同语言之间的链接、自动导入站外内容、进行数据挖掘、识别侵权的内容并为新手编辑者提供引导等等。

（二）设计编辑机器人

根据课上所讲机器人工程研究及应用范式，围绕“机器人记者”方向应用，对编辑机器人进行系统架构的设计。

1、理念、领域、目的、前提、价值

充分发挥机器智能精准、高效、公正客观等优势，建立编辑机器人，用于包含但不限于财经、体育等各个新闻生产实践领域，逐步探索、自我完善，进入深度调查报道、解释性新闻等“硬核”领域。

可以将新闻记者从重复性、低时效比的劳动中解放出来，人类记者可以专注于具有创新性的、带有人文要素的高质量新闻产品的创作。同时，提供给用户客观、及时、准确的新闻报道。

2、可能涉及到的技术和方法

数据搜集整理、数据挖掘、模式化新闻写作、自然语言理解、深度强化学习等。

3、系统架构

基本系统架构如下图所示：

首先，拓宽信息获取渠道，综合使用专业平台API接入、网络爬虫获取新闻及社交媒体资讯、历史信息索引等多种方式，获取新闻媒体领域信息。

其次，在分析处理数据过程中，综合运用自然语言识别、数据挖掘、经济社会模型建模等方式，快速、准确判别数据是否为常规数据，如果为常规数据，则按照常规新闻模式进行文本编写，如果出现“黑天鹅”事件或重大事件，则进入突发新闻撰写模式。

第三，在两种文本撰写模式中，分别探索用户在阅读一般新闻和突发性新闻是的习惯，按照新闻写作的模式进行文本撰写。

第四，区别两种新闻的特点，部署针对用户个人特色的信息发布策略。

第五，收集用户接收新闻信息阅读情况，包括是否点开，停留时间，是否评论、是否转发等。建立用户反馈模型，改进各个模块。