资产管理
资产管理模块(Asset Hub,以下简称 AH)提供对模型和数据集的管理功能,包括版本管理、持续开发和协同开发等。这里的资产指的是模型、数据集等 AI 相关的重要资产。
版本控制
AH 支持多版本模型管理,用户可以训练和提交多个临时版本模型,发布其中符合预期的模型。
多版本管理通过以下机制实现:
- Branch:分支,用户可以创建一个新分支来记录模型的临时版本;将新分支合并到主分支上,完成模型的发布。
- Commit:“交付”,相当于版本快照,便于确定版本和追溯历史。
- Tag:标签,用户可以为具有“特殊意义”的 Commit 标记标签,比如 best、v1 等。
数据集同样支持 Branch、Commit 和 Tag 的管理方式,不过数据集不会如模型那样频繁产出,所以一般建议数据集只在主分支上持续更新。
S3 接口
在训练(或部署服务)时,除了将数据集和模型下载到本地使用,大多数框架也支持直接从 S3 数据服务上动态获取数据文件。
AH 提供 S3 接口,用户可以在 AH 控制台上创建 S3 凭证,然后使用页面上生成的 S3 配置文件在训练过程中直接通过 S3 接口获取数据。
协同开发
AH 支持文件夹粒度的权限共享。用户可以将一组模型或数据集分享给其他人,实现多人共同开发和训练结果共享的目的。
可分享的权限包括查看权限或编辑权限,编辑权限包含查看权限。分享的目标可以是另一个用户、用户组或者公开给所有人。
下一步
- 学习如何使用 Asset Hub 管理 AI 资产