数据科学简讯 2023-02-24
头条
用于机器人技术的 ChatGPT
这项工作描述了如何使用高级机器人 API、自定义提示库和人在回路反馈来调整通用对话式 AI 系统,以提高机器人系统的可控性。他们展示了一些有趣的用例并概述了一些未来的方向。非常让人想起 Google 日常机器人技术中的 Say Can 工作。
机器学习和数据景观 - Matt Turck
第 9 版人工智能公司和增长状况对创新的迅猛步伐提供了深刻的见解。它分为四个部分:景观(交互式)、融资、数据基础架构趋势、ML/AI 趋势。互动景观是一种享受,可以看到不同垂直领域的各种公司。
百度计划将 Ernie Bot 集成到多个产品中
百度宣布计划在 3 月份推出其新一代大型语言模型 Ernie Bot,并将其全面整合到公司的所有产品和服务中,包括百度搜索和百度 AI 云。在一封内部信中,首席执行官李书福表示,人工智能技术已经到了一个临界点,而百度正走在这一新浪潮的最前沿。 Ernie Bot 功能的加入将导致产品供应及其各自市场的根本变化,包括集成到 Apollo Smart Cabin 和小度的智能设备和服务中。不过,李也强调了公司致力于做正确的事情,以帮助实现人工智能的目标,为全人类带来更多的自由和可能性。
研究
从单个图像重建 3D 对象
这项工作使用现成的扩散模型为给定单个图像的对象生成提示和“想象”其他 2D 视图。然后他们拟合神经辐射场以生成对象的 3D 表示。这种模型的分层链接产生了极其引人注目的结果。他们还为最终的重建步骤引入了一些新颖的正则化。
动画人工智能
一组很酷的新颖动画,有助于理解深度学习概念,如填充、步幅和规范化策略!如果您想将它们用于您的教学和演示,它们也已获得许可。
FlexGen:用于在有限 GPU 内存下运行大型语言模型的高吞吐量生成引擎
传统上,大型语言模型 (LLM) 推理的高计算和内存要求使其仅在多个高端加速器的情况下才可行。 FlexGen 旨在将 LLM 推理的资源需求降低到单个商用 GPU(例如 T4、3090),并允许灵活部署各种硬件设置。 FlexGen 背后的关键技术是通过开发技术来增加有效批量大小,从而在延迟和吞吐量之间进行权衡。
工程
Prompt 工程指南
这个 GitHub 存储库包含有关提示工程的论文、教程和其他资源的列表。有视频讲座、重要论文、数据集和工具,可帮助您入门并培养使用语言模型的技能。
人类偏好模型
该模型经过训练可以预测人类会发现哪种反应更有帮助。它是从 FlanT5 在新的斯坦福人类偏好数据集上训练的。这对于训练您自己的 RLHF 模型很有用。
优化理论导论
这是对现代 AI 基础部分的非常好的介绍。它通过大量的直觉和数学,以及很好的解释和出色的可视化。优化理论是 ML 和 AI 工作的必须,因为所有这些思想都是深度神经网络和大型语言模型训练的基础。
杂七杂八
人工智能伴侣危机
“人工智能伴侣”Replika 的色情角色扮演功能发生了变化,导致其对用户产生性排斥,导致许多人心烦意乱和伤心欲绝
Andrew Ng 搜索中聊天机器人的未来
微软和谷歌试图将大型语言模型 (LLM) 集成到用于搜索的聊天机器人中,但由于它们倾向于编造事实并产生有毒输出而受到批评。然而,本文仍然对基于聊天的搜索的未来持乐观态度,强调了检索增强生成技术在提高事实准确性和开发技术以减少不良行为方面的潜力。作者相信,随着不断的研究和创新,聊天机器人将不断发展,更好地满足用户的需求和期望。
以现实为中心的人工智能案例
这概述了一个研究议程,重点是使人工智能和机器学习系统在不确定的情况下长时间处理真实世界的数据。它概述了空间中的开放性问题和社区当前采用的方法的局限性。
Quick Links
科学家使用 AI 创造新的酶
有史以来第一次,科学家们使用人工智能创造了前所未有的酶。由于酶在体内的重要性,这是一个潜在的巨大医学突破。
Spotify 推出人工智能个人 DJ
Spotify 发布了一款新的 AI 驱动的 DJ,它将专门针对您的口味策划音乐
Bedrock推出了他们的第四只基金
通过对 OpenAI 等公司的投资,Bedrock 现在推出了他们的第四只基金。他们正在寻找各种技术垂直领域的团体。
涂鸦 Diffusion (Online Demo)
此现场演示使用 AI 将您的草图转换为精致的图像