TensorFlow 2.0 新功能
TensorFlow
已经发展为世界上最受欢迎和被广泛采用的机器学习平台之一,Google
衷心感谢一直以来支持Google
的各界的开发者和他们的贡献:
- 研究人员:(预测地震余震、检测前列腺癌)
- 开发人员:(识别患病植物、帮助人们减肥的应用 …… )
- 企业应用:(中国电信、浙江移动、金山、扇贝 ……通过 AI 改善客户体验)
- 还有很多 ……
2018 年 11 月,TensorFlow
迎来了它的3 岁生日,Google
回顾了几年来它增加的功能,进而对另一个重要里程碑 TensorFlow 2.0
感到兴奋 !
TensorFlow 2.0
将专注于 简单性和 易用性,具有以下更新:
- 使用
Keras
和eager execution
,轻松构建模型 - 在任意平台上实现生产环境的稳健模型部署
- 为研究提供强大的实验工具
- 通过清理废弃的 API 和减少重复来简化 API
在过去的几年里,Google
为 TensorFlow
添加了许多组件。在 TensorFlow 2.0
中,它们将被打包成一个全面的平台,支持从训练到部署的机器学习工作流程。让Google
使用如下所示的简化概念图来了解 TensorFlow 2.0
的新架构:
注:上图的训练部分虽然侧重于 Python API
,但 TensorFlow.js
也支持训练模型。也支持其他语言,包括 Swift,R 和 Julia
简单的模型构建
在最近的文章中,Google
宣布 Keras API
将成为 TensorFlow
中构建和训练模型的核心高级 API。Keras API
使得使用TensorFlow
开启项目变得简单。重要的是,Keras
提供了几个模型构建API ( Sequential, Functional, 和 Subclassing )
,因此您可以选择适合的抽象级别。TensorFlow
的实现包含多项增强功能,包括即时迭代和直观调试,以及tf.data
,用于构建可扩展的输入管道。
下面是一个工作流程示例 ( 在接下来的几个月里,Google
将更新下面所述内容的指南 ):
-
使用 tf.data 加载数据。使用输入管道读取训练数据,用
tf.data
创建的输入线程读取训练数据。使用tf.feature_column
描述特征,例如嵌套和特征交叉。还支持从内存数据(例如NumPy
)中方便地输入 -
使用 tf. Keras 或 Premade Estimators 构建、训练和验证模型。
Keras 与 TensorFlow
的其余部分紧密集成,因此您可以随时访问TensorFlow
的功能。一组标准的打包模型 ( 例如,线性或逻辑回归、梯度增强树、随机森林 ) 也可以直接使用 ( 利用tf.estimator API
实现 )。如果你不想从头开始训练一个模型,你很快就能通过TensorFlow Hub
的模块利用迁移学习来训练Keras 或 Estimator
模型 -
使用 eager execution 运行和调试,然后在图形上使用 tf.function。TensorFlow 2.0 在默认情况下以
eager execution
方式运行,以便于使用和顺利调试。此外,tf.function annotation
透明地将Python
程序转换成TensorFlow
图。这个过程保留了TensorFlow 1.x
基于图执行的所有优点:性能优化、远程执行以及轻松序列化、导出和部署的能力,同时增加了使用简单的Python
表达程序的灵活性和易用性 -
使用分布策略进行分布式训练。对于大型机器学习训练任务来讲,
Distribution Strategy API
使得在不更改模型定义的情况下,在不同硬件配置上分布和训练模型变得很容易。由于TensorFlow
提供了对CPU、GPU 和 TPU
等一系列硬件加速器的支持,因此可以将训练工作负载分布到单节点 / 多加速器以及多节点 / 多加速器配置,包括TPU Pods
。虽然此 API 支持各种集群配置,但还提供了在本地或云环境中部署 Kubernetes 集群训练的模板 -
导出到 SavedModel。TensorFlow 将在 SavedModel 上标准化,作为
TensorFlowServing、TensorFlow Lite、TensorFlow.js、TensorFlow Hub
等的交换格式
想要了解TensorFlow
指南详细信息,请参阅:
https://tensorflow.google.cn/guide/?hl=zh-CN
在任何平台上的生产环境中进行稳健的模型部署TensorFlow
始终为生产提供了直接途径。无论是在服务器、边缘设备或者web
上,无论您使用哪种语言或平台,TensorFlow
都可以让您轻松地训练和部署模型。在 TensorFlow 2.0
中,Google
通过标准化交换格式和调整 API 来提高平台和组件之间的兼容性和一致性。
一旦您训练并保存了模型,就可以直接在应用程序中执行它,或者使用以下部署库之一为它提供服务:
-
TensorFlow Serving:TensorFlow 库允许模型通过
HTTP / REST 或 gRPC /
协议缓冲区提供服务 -
TensorFlow Lite:
TensorFlow
针对移动和嵌入式设备的轻量级解决方案提供了在Android、iOS 和 Raspberry Pi 和 Edge tpu
等嵌入式系统上部署模型的能力 -
TensorFlow.js:支持在
JavaScript
环境中部署模型,例如通过Node.js
在web
浏览器或服务器端部署模型。TensorFlow.js
还支持用JavaScript
定义模型,并使用类似于keras
的API
直接在web
浏览器中进行训练
TensorFlow
还支持其他语言 ( 一些由更广泛的社区维护 ),包括C, Java, Go, C#, Rust, Julia, R
等。
为研究提供强大的实验工具
TensorFlow
使从概念到代码、从模型到发布的新思想变得容易。TensorFlow 2.0
集成了许多功能,可以在不牺牲速度或性能的情况下定义和训练最新模型:
-
Keras Functional API 和 Model Subclassing API
:允许创建复杂的拓扑,包括使用剩余层、自定义的多输入 / 输出模型和强制写入的正向传递 - 自定义训练逻辑:使用
tf.GradientTape 和 tf.custom_gradient
对梯度计算进行细粒度控制 - 为了获得更大的灵活性和更好的控制,低级别
TensorFlow API
始终可用,并与高级别抽象结合在一起,以实现完全可定制的逻辑
TensorFlow 2.0
带来了一些新功能,允许研究人员和高级用户使用丰富的扩展 ( 如 Ragged Tensors, TensorFlow Probability, Tensor2Tensor
等) 进行实验。
除了这些功能外,TensorFlow
提供eager excution
,便于原型制作和调试,Distribution Strategy API
和 AutoGraph
进行规模化训练, 以及对TPU
的支持, 使 TensorFlow 2.0
成为一个易于使用、可定制和高度可扩展的平台,用于进行最先进的机器学习研究并将研究转化为生产流水线。
TensorFlow 1.x 和 2.0 的区别
自从Google
最初开源 TensorFlow
以来,已经有了许多版本和 API 迭代。随着机器学习的快速发展,该平台得到了极大的发展,现在支持具有不同需求的不同用户组合。使用 TensorFlow 2.0
,Google
有机会清理和模块化基于语义版本控制的平台。
以下是一些较大的变化:
- 删除
queue runner
以支持tf.data
- 删除图形集合
- 改变变量的处理方式
- 符号的移动和重命名
此外,tf_contrib
将从TensorFlow
核心存储库和构建流程中删除。TensorFlow
的 contrib
模块已经超出了单个存储库所能维护和支持的范围。较大的项目最好单独维护,而较小的扩展将逐步过渡到核心 TensorFlow
代码。一个特别兴趣小组 ( SIG )
已经成立,以维持和进一步发展未来一些更重要的contrib
项目。
如果您有兴趣贡献,请回复此贴:
https://github.com/tensorflow/community/pull/37
兼容性和连续性
为了简化向 TensorFlow 2.0
的过渡,将有一个转换工具,它可以更新TensorFlow 1.x
,Python
代码以使用 TensorFlow 2.0
兼容 API,或者标记代码无法自动转换的情况。
并非所有更改都可以完全自动完成。例如,某些已弃用的 API 没有直接等效项。这就是Google
引入 tensorflow.compat.v1
兼容性模块的原因,该模块保留了对完整 TensorFlow 1.x API(不包括 tf.contrib)
的支持。 该模块将在 TensorFlow 2.x
的生命周期内维护,并允许使用TensorFlow 1.x
编写的代码保持功能。
此外,SavedModels
或存储的 GraphDefs
将向后兼容。 使用1.x
保存的 SavedModels
将继续在2.x
中加载和执行。 但是,2.0
中的更改将意味着原始检查点中的变量名称可能会更改,因此使用2.0
之前的检查点而具有已转换为2.0
的代码时可能无法保证正常工作。
有关详细信息,请参阅 TensorFlow 2.0
指南:
https://github.com/tensorflow/docs/blob/master/site/en/r2/guide/effective_tf2.md
Google
相信TensorFlow 2.0
将为应用开发带来巨大的益处,Google
已投入大量精力使转换变得尽可能简单。但是,Google
也认识到迁过渡当前的线程需要时间,Google
非常关心社区目前对学习和使用TensorFlow
的投资。 Google
将在最后的1.x
版本中提供 12 个月的安全补丁,以便为现有用户提供充足的时间进行过渡并获得 TensorFlow 2.0
的所有优势。
TensorFlow 2.0
预览版已于今年年初发布。
您已经可以通过使用tf.keras 和 eager execution
,预打包模型和部署库来开发 TensorFlow 2.0 了。Distribution Strategy API
目前已部分可用。
Google
对 TensorFlow 2.0
以及即将到来的变化感到非常兴奋。TensorFlow
已经从一个用于深度学习的软件库成长为一个适用于所有机器学习类型的完整生态系统。TensorFlow 2.0
将简单易用,适用于所有平台上的所有用户。