如何设计一款优秀的企业级数据产品(一)欢迎来到智能时代
店长小白的故事
海马生鲜做为一家发展多年的公司,在线下已经有多家主营生鲜商品的门店。小白作为门店的店长,每天上班最重要的事情之一就是订货。小白将门店订货需求在系统中输入以后,海马生鲜全国各地的供应商如农产品生产合作社、水产养殖基地等即根据各店长需求开始进行采摘、打捞、质检、包装等工作,然后从源产地经干线物流到分拨中心再经城市物流送达各个门店。有了这样一个高效的物流系统,今天订的货,在后天早上即可到达门店上架销售。
但是,这里还有一个非常关键问题,那就是到底订什么货?订多少?这是很考验店长能力的事情。小白订货时一般会考虑以下因素:
- 历史销量。订货时小白首先会参考近期、去年同期的销量情况,做为订货的基础;
- 天气。如果天气预报说后天大雨滂沱,那进店的人数会大大减少,整体订货量就都要减下来;而如果不是这种恶劣天气,仅仅是气温的变化,则预估订货量时就要针对单品,比如当气温低于20度时,西瓜是比较难卖的,那就要减少订货量;
- 商圈和节假日。如果小白的门店是开在景区周围,节假日的人流会大幅上升,那订货量也要进行相应提升;而如果小白的门店开在写字楼附近,因为节假日放假,则人流会断崖式下跌,订货量则要相应降低;
- 促销。比如,最近公司5周年庆,推出了全场5折的促销活动,预计人流会超多,订货量相较平时需要大幅增加;
- 不同产品保质期和新鲜度的要求。比如,鲜活水产品,在门店的存活期为2天左右;而冰鲜的水产品可保存7天;冷藏水产品可保存15天;干货水产品可保存30天。现在消费者都很重视生产日期和保质期,不要说是过期商品,即使是临期商品,都很难卖得出去;
- 货品广度和宽度。现在很多消费者喜欢去商超购物,就是因为其货品品类丰富(即广度较广,如苹果、香蕉、鱼、虾都属于不同的品类),同一个品类下有较多不同商品选择(即宽度较宽,如虾有基围虾、明虾、小龙虾、皮皮虾等),可实现一站式购物。所以为让消费者愿意进店消费,货品的广度和宽度也是要考虑的重要因素。但是,与此同时还需要综合考虑管理和运营的成本;
订货的好坏与门店的经营绩效有非常强的关系。订的好,库存该高的高,该低的低,则既能控制断货保证销售机会,又能控制报损降低成本。反之,则可能有的货品早早断货,有的堆积严重,迟迟卖不出去,只能报损。
海马生鲜也做了多种努力,以提升店长的订货水平,比如有经验店长对见习店长为期一年的传帮带计划,定期组织公司内部优秀店长分享经验等等。小白也是依靠较长时间的培训、学习以及个人在实践中摸索和积累才成为订货水平相对优秀的店长,订货时考虑的因素相对全面。
但是对小白来说,这些因素的影响到底有多大,仍然是很难的一个问题。比如,下雨会降低客流,但是小雨和暴雨分别会影响多少呢?再比如,促销会增加客流,那8折促销和5折促销区别有多大呢?更何况现在各个商家的促销政策都是花样繁多,折扣、满减、买赠可能会一同出现。这还只是单个因素,如果出现多个因素叠加和相互影响,问题会更加复杂。比如,小白的门店在西湖景区附近,恰逢十一假期,并且公司也打算推出全场8折,再叠加满500减50的优惠,但是,不巧的是,后天要下中雨,那该如何订货呢?面对这么多因素的考量和权衡,小白也只能凭着自身的经验和感觉去订货。
那么如何解决这个问题呢?智能时代的企业级数据产品就是问题的答案。
企业级数据产品的三个阶段
从广义上来说,企业内部和数据相关的系统都可称为数据产品,其大致分为以下三个发展阶段:
1. 事务处理系统
企业运营和管理过程中涉及多个流程,包括采购、生产、销售、付款、收款等。每个流程又涉及到多种事务,如采购流程中的采购订单下达、供应商送货、质量合格商品的入库、供应商发票的入账、给供应商的付款等等;
最初企业都是通过手工的方式对这些事务进行记录,如:
- 海马生鲜10月1日向供应商阳澄湖管理有限公司采购了1000只大闸蟹,要求到货时间为10月3日;
- 因为货源抢手,2018年10月3日阳澄湖管理有限公司仅送来了900只;
- 在清点时发现,运输途中有10只不幸死去,入库的数量为890只;
- 截至10月底,海马生鲜共向阳澄湖管理有限公司采购了25,000只大闸蟹,收到供应商开票金额共498,000;
- 海马生鲜给供应商的账期为60天,12月底因公司资金周转原因,上述款项仅付款400,000,剩余款项将在下个月初进行支付;
单个商品手工记录的方式看起来不是那么复杂,但是当企业发展到一定规模,如商品数量有数千种,供应商有几百家的时候,复杂度会急剧上升,依靠手工的方式很难记录清楚。所以,事务处理型数据系统就出现了,如企业常用的ERP(企业资源计划系统)、CRM(客户关系管理系统)、SRM(供应商关系管理系统)、WMS(仓储管理系统)、TMS(运输管理系统)、MES(制造执行系统)、POS(销售终端管理系统)、OA(办公自动化系统)、QA(质量管理系统)皆属于此类。这类系统着重于企业内部业务流转过程中事务数据的记录,再辅之以各类报表对相关事务数据进行分析和监控,如采购明细报表、应付账龄表、库存收发存报表等。从数据分析的角度看,这个是数据产品的初级形态。
2. 决策支持系统
随着企业内部事务处理系统的增多,数据烟囱、信息孤岛和碎片化现象越来越严重,企业管理人员(尤其是高层)需要关注的数据散落在各个系统中,比如门店的销量、销售额、客单价等销售统计和分析数据要在POS系统中看,采购供应商送货及时率、价格波动等采购统计和分析数据又得在SRM系统中查看,颇为不便。
更重要的是,很多数据需要结合起来多维度分析,才能形成洞见。比如从SRM系统分析看某供应商送货及时率和价格处于前20%,但是从QA系统中看到该供应商质量合格率处于后20%,那可能就需要将此供应商降级甚至排除出合格供应商名单。
所以,数据整合就成为迫切的需求。很多企业为此也做了很多努力,如通过数据接口,把多个系统的数据都同步至ERP系统,在ERP做数据的清洗、整合、分析和展现。但是因为这类系统尤其是底层数据库设计之初是面向事务处理的(即OLTP,Online Transaction Processing),主要着重点在数据的快速写入,因此采用的是行存储的方式。但是,做数据分析时,主要着重点在数据的快速读取和查询,尤其当积累和整合的数据量越来越大时,行存储的数据库显得越来越力不从心。比如中大型的连锁零售企业,一年可能产生数亿条交易记录;更不用说京东、阿里这种大型电商,产生的数据量更是天文数字;所以,很多面向分析的技术就出现了(即OLAP,Online Analytical Processing),如列存储数据库(关于列存储数据库的介绍请参见:https://en.wikipedia.org/wiki/Column-oriented_DBMS)、分布式数据库等。这些技术的出现导致数据查询速度出现了飞跃,如某些列存储数据库已可做到300亿条数据count查询仅需0.9秒,详见https://mp.weixin.qq.com/s/4WCgzvTjOvNONrrZLc7yOQ
原有的事务处理系统,除了数据查询性能的短板以外,在数据展示上也存在不足,事务处理系统主要通过表格对数据进行展示,但是这种方式很不直观,在发现趋势、寻找相关性、分析相似性等方面尤其是如此。所以,后面又出现了可视化的技术,将数据通过图形直观展示出来,以发现其中的规律。所以,才有「一图胜千言」的说法。
将列存储数据库、可视化等多种技术综合应用即成为当今企业非常流行的BI(Business Intelligence,商务智能)系统,其将企业中现有的数据进行有效的整合,为企业管理者决策提供快速、准确、全面的数据支持,是一种最典型的决策支持系统。
3. 智能决策系统
有了决策支持系统,小白就可以很快速地知道商品不同时间的销量以及断货、报损等关键指标,但是为什么会导致这样子的销量、断货和报损呢?要靠人理清其与天气、促销、节假日等因素的关系,仍然是一件很困难的事情。所以,就出现了数据挖掘(data mining)的技术。「挖掘」这个词很很形象,这种技术就是要在一堆数据中找出有用的信息、规律和模式。数据挖掘用到了多种学科的知识,包括统计学、机器学习、运筹学等。当然,相关行业的专业知识必不可少。Garter将商业数据分析分为四个层次,分别为描述性分析、诊断性分析、预测性分析和处方式分析。决策支持系统一般做到的主要是描述性分析,即发生了什么、现状是什么。而智能决策系统还要做到诊断性分析、预测性分析和处方式分析,即告诉用户为什么发生、预计未来会发生什么以及该采取何种行动进行应对。而后三个分析层次用到的也是数据挖掘的技术。这四个层次具体介绍可查看个人写的系列文章《商业数据分析的四个层次》。
智能决策系统最关键的因素有三点:数据、算法和算力,而这三个方面现在都取得了长足进步:
- 首先,是数据方面。20年前,ERP在国内刚开始兴起时,知名企业家柳传志说过一句流传甚广的话:不上ERP是等死,上了ERP是找死。而现在如果再有企业家说这种话,就是贻笑大方了。当前很多小企业(年营收大于100万)都部署了ERP系统,更不用说中大型企业,现在中大型企业已经在部署更专业的事务处理系统,如CRM、SRM、WMS、MES等。而且,随着物联网技术的快速进步和发展,企业也在逐步应用此技术,相信全面应用后企业能获得的数据会爆炸性增长。这些都将为智能决策系统的使用打下坚实基础。
- 其次,是算法方面。AlphaGo之所以能打遍天下无敌手,就是因为了其研发团队在算法上做出了巨大改进。曾经在1997年击败人类国际象棋冠军的「深蓝」主要靠的穷举这种笨办法,而AlphaGo靠的是让机器真正能够去「学习」,其使用了深度学习、强化学习等算法,不仅仅是能够从人类的经验去学习,更能够在自我对弈中去学习,所以它能下出超越人类智慧和理解的好棋来。
- 最后,是算力方面。世界上第一台通用计算机“ENIAC”诞生于1946年,其每秒可进行5000次运算,当前苹果手机最新的A12处理器已经可以达到每秒5万亿次的运算速度,而谷歌专为机器学习而定制的芯片最新版TPU3.0已经可以达到每秒1000万亿次计算。
当前在贷款审核、汽车自动驾驶、医学影像分析等多个领域和场景已经在使用机器学习的技术,这些都预示着人类已经进入智能时代。但是,在商业领域仍然仅仅处于刚开始的阶段。比如,在企业实际库存管理中,为了应对需求波动,一般需要备一部分安全库存,而安全库存的合理性与库存管理的绩效有非常大的关系。大部分ERP系统也会有此参数。但是,如何设置这个参数却要用户自己去想办法。所以,在B端,智能决策类的数据产品大有可为,凡是涉及到决策的地方,其都可以发挥作用。
如何设计优秀的智能决策系统
本系列的主题为设计数据产品,这样表述大家更容易理解,但是更准确的说应该是如何设计一款优秀的智能决策系统。因为这个题目太大,所以一直都没有信心能驾驭得了这个主题,产生畏难情绪,迟迟无法动笔。但是,不管怎么样,智能时代已经到来,为了抛砖引玉,还是下定决心尽自己所能去写此系列文章。
《用户体验要素》这本书提出了一个很好的产品设计框架,称为5S,包括:战略层(Strategy)、范围层(Scope)、结构层(Structure)、框架层(Skeleton)和表现层(Surface)。本系列文章将从这5个层次探讨如何设计一款优秀的智能决策系统,
下一篇文章将从战略层开始。
参考资料
《巷口商学院》作者:胜见明 / 铃木敏文、野中御次郎 ,译者:陈俊廷;
《AI.未来》作者:李开复;
《智能时代》作者:吴军;
《用户体验要素》作者:Jesse James Garrett,译者:范晓燕 ;