评论删除后,数据将无法恢复
TensorFlow on YARN (TonY) 是一个构建在 Hadoop YARN 上的 TensorFlow 框架。
TonY 可以将单节点或分布式 TensorFlow 训练作为 Hadoop 应用程序运行。此原生连接器与其他 TonY 功能一起,旨在可靠,灵活地运行 TensorFlow 训练。
在 YARN 的 TonY 上运行 TensorFlow
TonY 的架构
TonY 主要包含三个要素:Client、ApplicationMaster 和 TaskExecutor。运行 TonY 作业的端到端处理过程如下:
-
用户向 Client 提交 TensorFlow 模型训练代码、参数及其 Python 虚拟环境(包含 TensorFlow 依赖)。
-
Client 设置 ApplicationMaster(AM)并将其提交给 YARN 集群。
-
AM 与 YARN 基于用户资源请求的资源管理(Resource Manager)进行资源协商(参数服务器及线程、内存和 GPU 的数量)。
-
一旦 AM 收到分配,它就会在分配的节点上生成 TaskExecutor。
-
TaskExecutor 启动用户的训练代码并等待其完成。
-
用户的训练代码启动,TonY 定期在 TaskExecutor 和 AM 之间跳动,以检查其活性。
TonY 加入 LF AI & Data 作为新的孵化项目
LF AI & Data 基金会——该组织正在构建一个生态系统,以支持人工智能(AI)和数据开源项目的开源创新,今天宣布TonY[1]为其最新孵化项目。 TonY 是一个在 Apache Hadoop 上原生运行深度学习...

LinkedIn 开源 TonY,让 Hadoop 原生支持 TensorFlow
LinkedIn 开源 TonY 项目,允许用户在单个节点或大型 Hadoop 集群上构建基于 YARN 的 TensorFlow 应用程序解决方案。 TonY 的工作方式就像在 Hadoop 中的 MapReduce,执行 Pig 和 Hive 脚本的...

没有更多内容
加载失败,请刷新页面
没有更多内容

暂无问答
