人工智能的门槛这样低?普通人都能在家DIY?
人工智能(AI)会将我们变成超人,前提是它最终不会取代我们。 但我们对AI的真正含义是什么?我们可以用它做些什么呢? 在这篇文章中,我将介绍最先进的技术,以及如何使用便宜的Raspberry Pi计算机和谷歌的一些名为TensorFlow的免费软件构建自己的“DIY”。
AI现在主要是聚焦模式识别 - 静止和运动图像,还有声音(识别单词和句子)和文本(本文用英文写成)。一个很好的例子是上图中的Raspberry Pi徽标。即使认为它有点模糊,我们看不到整个事物,大多数人会认识到图片包含某种浆果。熟悉这种小型低成本计算机的人几乎可以立即发现图片中包含Raspberry Pi徽标 - 电路板背景可能有助于慢慢记忆。
当我们谈论“智能”时,事实是这种模式识别非常愚蠢。智能(如果有的话)由人类提供,添加一些规则,告诉计算机在匹配模式时要注意哪些模式以及要做什么。所以让我们尝试一下小实验 - 我们会将相机和扬声器连接到我们的Raspberry Pi上,教它识别相机看到的物体,然后告诉我们它在看什么。这是一个非常缓慢而笨重的低技术版本的OrCam,这是一项新的发明,帮助失明和视力不佳的人独立生活。
谷歌的TensorFlow是一个开源的机器学习系统。机器学习是支撑大多数现代AI系统的技术,它负责我刚才谈论的模式识别。 Google采取了大胆的举措,不仅让TensorFlow免费提供,还让每个人都可以通过“开源”来访问软件的源代码。这意味着全世界的开发人员都可以(并且确实)增强它并分享他们的变化。
AIY Voice Kit 语音套件
Voice Kit 允许您构建自己的自然语言处理器。 它使用Google语音助手为Raspberry Pi添加了语音控制功能。 构建时,将顶部(HAT)板上的语音硬件附件与Raspberry Pi板连接。
这些物品由纸板组成,并连接到盒子外面的大按钮和扬声器。 扬声器通过两根电线连接到HAT板。 这些电线传输电信号,由扬声器转换为声音。 这就是设备获得声音的方式。
存储卡插入Raspberry Pi,设备连接到电源。 使用Google AIY Projects应用程序无线设置和配置套件。 iOS设备尚未推出类似的应用程序。
AIY Vision Kit 视觉套件
Google 的AIY Vision Kit 可让您使用图像识别功能构建自己的智能相机。它介绍了可以检测常见物体和面部表情的神经网络概念。 用户可以使用Google AIY Projects应用程序将套件附加到他们的计算机和/或控制它。 它由两块板组成,即Vision Bonnet 和 Raspberry Pi,通过电缆连接器连接。
Vision Bonnet 采用Intel Movidius MA2450,这是一款低功耗视觉处理单元,能够在设备上运行神经网络模型。 它与各种图像识别神经网络的兼容性将让您自定义它的外观和方式。这些设备连接到相机和蜂鸣器。
谷歌在其网站上引入了一个AIY模型区域,展示了一系列预先构建的AI模型,这些模型旨在与其内置的AIY工具包配合使用。 您可以将新模型加载到他们的设备中,以探索AI的不同应用场景。 例如,您可以使用微笑探测器模型来查看是否有人在观察他们的Vision Kit是否在微笑。
随着Google Home 和 Echo 的广泛使用,建立更便宜的AI工具的魅力将会增加。 人类有创造的基本需求,DIY市场和AI市场都将起飞。
机器学习的好处是,在能够成功执行我正在讨论的模式识别之前,您需要提供大量的示例数据。想象一下,你正在使用自动驾驶汽车 - 在能够合理地确定汽车前面的猫跑出来之前,人工智能将需要训练。你通常会通过展示很多猫在汽车前跑出来的照片来做到这一点,也许是在你的驾驶员辅助测试运行期间收集的。你还会展示很多可能遇到的不是猫的东西的照片,并告诉它哪些照片是猫的照片。在引擎盖下,TensorFlow构建了一个“神经网络”,这是一个粗略的模拟我们自己的大脑工作的方式。
现在为了坦白 - 我实际上并没有坐下来教几个小时。 相反,我使用了现成的TensorFlow模型,Google使用ImageNet进行了培训,ImageNet是一个包含超过1400万张图像的免费数据库。 在Raspberry Pi本身上构建这个模型需要很长时间,因为它不是很强大。 如果您想创建自己的复杂模型并且无法访问超级计算机,您可以租用Google,Microsoft和Amazon等计算机来为您完成工作。
你会用TensorFlow做什么?