我爱编程

人工智能创业那些事

2016-12-14  本文已影响0人  方弟

人工智能创业一定是先了解场景,不要太多关心人工智能本身。创始团队一定要深入到场景的第一线去,天天去思考客户的思维是什么,需求是什么,他作为一个活生生的人要的什么。

人工智能创业都是长跑,至少要跑十年才会有成绩。头两三年就想摸清楚是及其罕见的。所以创始人一定要有十年抗战的心理素质和身体素质。团队也一定要是踏实、务实,能经得起长征考验的。

为了融资要做炫酷demo,但是千万不要自己陷进去了。大多数场景不需要多炫酷的算法就能服务的。玩炫酷,成本非常高,一下子搞二三十个甚至更多牛逼工程师,开始烧钱就恶性循环了。先小规模证明商业前景,再徐徐发展。

不要面向VC思考。面向客户思考。VC要追求的目标和客户要解决的问题是完全不同的。

不要迷信明星,不要迷信技术。人工智能技术没有什么神奇,大多数情况下都是人工智障。好的效果都要工程师一点一点打磨出来,有多少人工就有多少智能。控制开发成本,追求有限目标。创始人自己懂AI,就先招优秀的工程师,而不是一堆科学家。

刷榜在我看来是没有意义的。企业在有商业场景理解能力之前(证据就是有人愿意给钱,哪怕是很小的一笔钱),就不应该分心在和商业目标解决无关的事情上。即使这对招聘有一丢丢作用——完全可以有更廉价的招聘宣传,比如创始人去做几个讲座。

技术一定是逐步迭代,在每一个迭代版本都要考虑商业化的可能。开始的辛苦钱也要挣,不要幻想一下子就挣几百万、几千万,非大单不要。钱是一分一分挣出来的。创业公司有原罪,想一下子从大客户手里拿单是幻想。

不要幻想一下子就会有一个标准化的产品。往往要从和天使客户的服务中,逐渐总结出一个产品来。对天使客户用心服务,但是一定要付费(哪怕是很少很少的钱),不付费的就不是客户。通过定制、咨询、服务,逐步改进产品。不要幻想憋几年大招,客户就会买单。

不要烧钱、不要烧钱、不要烧钱。控制团队规模,控制办公室成本,不要做无谓的市场营销。

其实特别是过去5年,人工智能真的成熟了,我们这里可以看到右边从对奕(AlphaGO)到感知(微软小冰)或者是IBM沃森到决策,现在比如说谷歌已经可以自动帮我们回邮件了,这背后都是人工智能,还有很多其他的技术,进步都非常快,这都是过去5年的时间。如果你在七年前投移动互联网,一定要投产品经理;如果你今天要投人工智能,一定是投人工智能科学家,这是没有任何疑问和悬念的。

只有算法的公司不值钱,能触及数据的才值钱,能自动产生数据的公司更值钱。

要求一:数据一定要是海量的,是千万级别的。如果有人跟你说我有10万个大数据什么的,就不要再听下去了,10万个数据是做不了深度学习的,是需要千万级的数据。

要求二:顶尖的AI科学家。你随便找一个特别厉害的计算机科学家、数学家是没有用的,一定要懂AI的才有可能,世界上这样的人可能只有上万,没有上十万,所以这种人的价值现在在快速提升。

一个人工智能的技术只懂一个领域,领域越清晰、狭窄、有边界,就越能够用人工智能,跨领域就没戏了。再往下需要自动标注的数据,所以有些公司找你来融钱,说我在网上爬了很多数据,也不用再听下去了,网上爬的数据没有价值的,是需要标注的。

其实除了互联网的数据还有传统的数据,其实传统领域的数据是非常好的,传统领域里面数据最好的就是金融界了:

原因一:因为金融界是相对隔离得非常清晰的,金融的领域是不跟其他领域混在一起的,金融的领域里股票就是股票、保险就是保险、银行就是银行、账单就是账单,这些东西是非常能够用来计算的,是狭窄领域的。

原因二:利用手中拥有的很大的数据量,然后可以获取更多的数据,这个也是很好的。

原因三:金融是最无摩擦的领域,钱进钱出,我们只要算在这个钱进钱出的过程当中,怎么样最大化我们的收入就好了,我们这里没有生产、没有仓库、没有物流,我们是纯金钱的。也就是刚才所说的,人工智能最好的应用领域之一就是能够最快看到你赚更多钱或者省更多钱的,没有比金融领域更好衡量的。

如果你要用在一个百货公司,他有各种的消费;如果你用在电子商务,他有各种的消费。金融领域是唯一一个纯数字和钱的领域,所以说这个领域是最好的。

人工智能当然不可能永远都是这么好的世界,但是因为现在中国的市场刚刚开放这一类的交易机会,打造新的这种对冲的机会实在是太多了,即便现在可能有一些限制,但是我们不用靠量取胜、靠快取生,完全可以靠智能取生,因为你的智能算出来的交易,哪怕是当天或者隔一天的交易,都要比人算出来的更清晰。

我们在移动互联网时代,一个产品经理带着两个工程师,可能100万就可以创业了,成了再融下一轮,不成了就关门了。但是AI创业是不需要的,你需要顶尖AI科学家,他们的期望值至少年薪40万美金,然后还需要海量的数据,要买很贵,自己做很花时间,超级大的计算量,每买机器就要花两三百万,所以一个基础的AI创业可能就要两千万,所以它的创业成本又突然大幅度地提升了;

也就是说AI的创意精英能自我赋能,能将技术知识、商业头脑与创意才思融合为一;数据是用来构建信息的,信息是用来承载知识的,知识是用来驱动智能的;

我们回顾一下硅谷创业者的圣杯就是对所有行业进行破坏—要想挣大钱就必须这样做;AI走向:专用智能—合成智能—通用智能;AI真正的战斗在于数据而非程序;先进的计算机技术可以让它从数据中获得巨大的利润;情感系统包含(情感识别、情感分析、情感表述)

推理是普遍的工具,适用于每一个场合,所以机器部件也需要具体的排列方式才能在每个特定的场合发挥作用;只记录解决问题的方法仅仅有助于我们解决相似的问题,而如果我们可以记录自己是如何发现这些解决方法的,就有助于处理更为广泛的情况;

只有等数据分析和挖掘都普及到一定程度上才能加上拟人情感系统识别表达解决机器情感问题,这就需要感知、学习和反应,从大数据继承的是海量数据处理,额外再加上良好的人机交互、对人类情感上的理解,最终才会形成一种伙伴型的机器人;

截止时间2016年3月:人工智能在语音和图像上已经取得了阶段性成果但语义暂时还看不到彻底解决的迹象;但单靠一块人工智能芯片实质上还是不可能解决深度学习在终端上跑大量数据的问题;我觉得云端数据+终端数据=机器人数据;

我们人工智能根本还没有走完0到1的过程;因为互联网与移动互联网时代是由创意、运营、模式这些东西驱动的而非由技术驱动但不是技术要求门槛特别高;智能型的软件(人工智能)时代上来就是算法、数据、GPU;

即使谷歌把这些技术开源后但想驾驭这些技术框架也需要理解机器学习的人,否则没法针对垂直领域优化,而数据和GPU则会很耗钱;一个直接后果是传统的程序员搞不定这个人工智能这个行当,即便纯碎的把人工智能在软件上进行落地,谷歌的图片搜索也还不算是非常成功的,意味着智能化落地到产品里去需要整合软硬件;

一旦需要把智能整合到硬件里,事情就变得复杂化了,需要有人搞操作系统,有人搞工业设计,有人搞声学,最后还需要搞定供应链;即使这些所有环节都搞定了,还不一定把产品卖出去;如果真的需要制造那种四处乱窜的机器人,你还需要清晰感知环境并进行分析处理,自主移动回避技术、机械部分处理、关节减速并能用多少次等等复杂的技术;

人工智能领域属于少数人的资本游戏;如果搞人工智能领域的创业企业一旦获得技术上优势加上能够很好的落地取到相应对应的高质量数据,那这家企业就会成为下一代的巨头;

在数据—学习类算法—行为,这条脉络中,数据本身会对最终行为产生最关键的影响,所以数据受到污染那机器最终输出的行为就是有故障甚至乱码伤害人类;所以为了防止数据污染与失控风险,我们可能需要一种能连通又有效率足够分散的网络;

我们目前的互联网形态属于一种极度中心化的状态,所以人工智能需要一种多样性与权责系统生态网络体系;现在的人工智能是数据驱动,数据越多智能程序度越好,而不可能所有的数据都放进某个机器人的“脑子”里,这导致机器人一定需要连接到某个庞大的网上系统来不断更新自己的知识,所以人工智能大脑是超级数据信息知识推理大脑;

我记得阿西莫夫的对机器人定义的三个定律:第一法则:机器人不得伤害人类,或坐视人类受到伤害;第二法则:除非违背第一法则,机器人必须服从人类的命令;第三发则:在不违背第一及第二法则下,机器人必须保护自己;

我发现往往阻碍思维变得更强大的往往是信息不够,阻碍个人生产制造的往往是力量不够;现在世界的数据化和人工智能会解决这种失衡的问题,人工智能足够强大后就可以帮助一个人从互联网上获取各种信息,并按照人的需求从不同视角来分析问题,这是思维力度的提升;

比如一个人可以通过人工智能获得相关知识信息数据,纳米制造技术又会给他带来把某种想法变成现实的能力,这样只要有足够的权限来使用能量和某个平台,他就可以在家里或者借助某个公共的生产平台生产出各种东西;

没有大数据就不需要分布式中间件和云计算云存储:1、不构建B2B2C的端到端产业链就不会有大数据 2、没有智能物联传感设备就不会有大数据 3、没有智能手机的照片语音视频就不会有大数据 4、没有搜索爬虫就没有大数据;现在市面上搞大数据的,都扎堆在两极工作:1、要么搞点击流收集/流量统计/用户行为分析/用户画像 2、要么搞可视化;

从产业链角度看,中国工业机器人正在从下游向中上游转变。工业机器人产业链主要分为上游核心零部件、中游设备制造商和机器人本土、下游系统集成商三个层面。

我国工业机器人产业链上游的减速器等核心零部件,制约了国产机器人的成本,产业链中游的本体技术被国外龙头企业垄断,国内的机器人企业多为产业链下游的系统集成商,95%的企业将利润聚集在下游环节。

目前国内工业机器人产业关注的重点以及国家的政策扶持方向都是以技术突破为核心,以打破国外垄断为发展目标,同时为空间依然很大的市场扩充产能。

我还发现我们很多人工智能初创企业由于团队基因等原因,一味地追求算法和技术上的领先,招募大批科研人才,而工程人才欠缺。拥有大量科研人才有利于做公关,也利于吸引VC的投资,但这一方面可能带来过高的成本,牛人扎堆后更难管理,谁也不服谁,可能会因为学术兴趣不同而造成“神仙打架”,导致产品方向的偏差。

毕竟初创公司不是研究院,不以促进学术发展为目的,不以发paper为目的,而是要以产品为核心的商业机构。做2C的创业,需要创始团队非常有产品思维,而这往往是科学家出生的团队最缺乏的,而做垂直领域的应用,也要求创始团队有行业资源。这些都需要寻找合作伙伴来补齐。

而节奏感的控制除了来自对人工智能技术发展程度的判断,还有来自对融资环境的判断,对市场发展速度和变化的判断,对竞争对手的判断。有这几个方向的判断,就大概能知道是否步子应该迈得大一些。

在人工智能产业链中,基础层是构建生态的基础,价值最高,大公司会长期进行战略布局。在基础计算能力、数据,通用算法、框架和技术方面布局,聚集大量开发者和用户,这基本是兵家必争之地。

比如谷歌、亚马逊、微软都纷纷推出了自己的人工智能的基础设施、API和开源框架,包括了计算机视觉、语音、语言、知识图谱、搜索等几大类。

对于通用型的产品,大公司会贯彻人工智能优先的策略,来提升效率、改善用户体验,对于通用技术层,这是构建大公司护城河的基础,大公司也一定会布局。比如谷歌贯彻AI First的策略,改进智能助手(语音和NLP)、谷歌翻译(机器翻译)、YouTube(推荐算法)、图片搜索(计算机视觉)等等。

创业公司可以选择做垂直领域的先行者,积累用户和数据,结合技术和算法优势,成为垂直领域的颠覆者。不过即使是做垂直领域,也不建议和传统公司硬碰硬,而是迂回包抄,边缘突破。创业公司也可以专注于细分场景应用,做窄品类的应用,提供解决方案,直戳行业痛点。

一个产品落地,内部的链条很长,除了技术和研发,剩下70%的人可能是做产品、销售、生产、渠道。如果是硬件,需要考虑硬件以年计的开发周期。如果是面向企业的解决方案,还需要考虑不同企业和客户的繁琐需求。人工智能2C产品上,消费者不会为算法和技术买单,技术必须转化为产品,用于改善产品体验或者提升效率;

大家不可能什么应用都配个几百台机器的集群。线上预测是直接给用户使用的,对速度要求很高。目前有几种方案:

1. GPU:功耗高,几百W很正常,高端GPU成本也不低,同时个头大,占地方,最重要的是数据中心需要增加散热和供电的能力,这个可不简单。

2. CPU:性能不行,不适合并行计算。

3. ASIC:研发和流片费用高,周期长,同时逻辑不能动态调整,不适合互联网公司,毕竟各种应用的算法总是在变化。

4. FPGA:功耗低,一般低于40W。中端FPGA成本低,几百美金。自定义逻辑,也可以动态调整。

上一篇下一篇

猜你喜欢

热点阅读