命令行工具:t9k
TensorStack CLI(简称 T9k CLI)是 TensorStack AI 平台的命令行工具,用于对 TensorStack AI 平台的各种资源对象进行增、删、改、查操作。
功能
TensorStack CLI 目前包含了两大功能:其一是管理 T9k 集群计算资源分配,主要的使用者是 TensorStack AI 平台管理员;其二是管理 TensorStack AI 平台中被创建的作业、服务等资源,主要的使用者是使用平台进行机器学习模型开发、训练、部署等工作的数据科学家。
TensorStack CLI 的目标是:提供对于 T9k 自定义资源的有效支持。对于平台管理员来说,这些功能可以作为 kubectl 的补充来管理 TensorStack AI 平台。对于数据科学家来说,这些功能和控制台一起,帮助他们在 TensorStack AI 平台上开展机器学习相关的工作,而不需要过多的 Kubernetes 基础知识。
资源类型
T9k CLI 支持的资源类型有:
- 基于 Kubernetes 定义的,用来解决机器学习相关问题的 TensorStack AI 平台资源:
- AutoTune
 - BeamJob
 - ColossalAIJob
 - DeepSpeedJob
 - GenericJob
 - MLService
 - MPIJob
 - Notebook
 - PyTorchTrainingJob
 - SimpleMLService
 - TensorFlowTrainingJob
 - WorkflowTemplate
 - WorkflowRun
 - XGBoostTrainingJob
 
 - 基于 Kubernetes 定义的,用来管理集群资源及权限的 TensorStack AI 平台资源:
- PodGroup
 - Project
 - Queue