任务
OpenAPI 名称 | 描述 | 操作 |
---|---|---|
CreateJob![]() | 创建一个任务到集群中运行。您可以指定数据源配置、代码源配置、启动命令以及任务运行的每个节点的计算资源配置等信息 | 查看文档去调试 |
ListJobs![]() | 获取任务列表,支持分页、排序和按条件过滤 | 查看文档去调试 |
GetJob![]() | 获取一个任务的详细配置和运行时信息 | 查看文档去调试 |
GetJobSanityCheckResult | 获取DLC任务某次算力健康检测结果 | 查看文档去调试 |
ListJobSanityCheckResults | 获取某个DLC任务所有算力健康检测的检测结果 | 查看文档去调试 |
GetPodLogs![]() | 获取(或者下载)任务某个节点的日志,日志来源于系统和用户脚本的stdout和stderr | 查看文档去调试 |
GetPodEvents | 通过获取任务中特定节点的系统事件,来进行问题的定位与排查 | 查看文档去调试 |
GetJobMetrics![]() | 获取一个任务的监控数据,包括CPU、GPU、Memory的使用率、Network、Disk读写速率等 | 查看文档去调试 |
GetJobEvents | 获取一个任务的系统事件 | 查看文档去调试 |
ListEcsSpecs![]() | 查询当前支持的机器资源配置列表 | 查看文档去调试 |
GetWebTerminal | 提供获取容器访问HTTP链接的方法和步骤 | 查看文档去调试 |
GetToken | 获取用户Token | 查看文档去调试 |
UpdateJob![]() | 更新一个任务的配置信息,例如修改一个排队中任务的优先级 | 查看文档去调试 |
StopJob![]() | 停止一个正在运行的任务 | 查看文档去调试 |
DeleteJob![]() | 删除一个运行结束(或者已停止)的任务 | 查看文档去调试 |
Tensorboard
OpenAPI 名称 | 描述 | 操作 |
---|---|---|
CreateTensorboard![]() | 创建一个Tensorboard,可以通过一个任务或者指定数据源配置来创建 | 查看文档去调试 |
ListTensorboards | 查询已创建的Tensorboard列表 | 查看文档去调试 |
GetTensorboard | 获取一个Tensorboard的详细信息 | 查看文档去调试 |
GetTensorboardSharedUrl | 获得Tensorboard的分享链接。该链接中包含数字令牌。使用该分享链接可以访问被分享的Tensorboard任务 | 查看文档去调试 |
StartTensorboard | 启动一个Tensorboard | 查看文档去调试 |
UpdateTensorboard | 更新一个Tensorboard | 查看文档去调试 |
StopTensorboard | 停止一个Tensorboard | 查看文档去调试 |
DeleteTensorboard | 删除一个已经停止的Tensorboard | 查看文档去调试 |