CreateDatasetJob_人工智能平台 PAI - AI 工作空间_API文档

插件下载了解更多
VS Code 插件
安装插件之前,确保已安装 VS Code安装插件之前,确保已安装 VS Code
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
JetBrains 插件
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.

流控信息

请求速率为15/1(s)。

授权信息

如下是此API对应的授权信息,用于RAM权限策略语句的Action元素中,为RAM用户或RAM角色授予调用此API的权限。请通过 RAM 访问控制设置,使用方法可参考访问控制帮助文档

具体说明如下:展开详情

操作访问级别资源类型条件关键字关联操作
paidataset:CreateDatasetJob
Create
全部资源
*

请求语法

POST /api/v1/datasets/{DatasetId}/datasetjobs HTTP/1.1

路径参数

字段名称字段详情
DatasetIdstring

数据集 ID。如何获取数据集 ID,详情请参见 ListDatasets

示例值:d-rbvg5wz****c9ks92参考取值来源:
    ListDatasets
    CreateDataset

请求参数

字段名称字段详情
bodyobject

请求体。

请求说明

CreateDatasetJob 中的 JobSpec 参数说明: (1)语义索引任务

示例: { "modelId": "xxx", "modelVersion": "1.0.0", "contentList": ["file"] }

其中 modelId 为模型 ID,modelVersion 为模型版本,contentList 为索引内容,目前只支持 file(文件)。

(2)智能打标任务

示例: { "modelId": "qwen-max-0428" }

其中 modelId 为打标模型 ID。

(3)元数据导出任务

示例: { "source": "TAG", "queryText": "汽车", "topK": 100, "scoreThreshold":0.6, "fileUri": "oss://mybucket.oss-cn-beijing.aliyuncs.com/mypath" }

其中 source 表示结果来源,值为 TAG 表示来源为标签,值为 VECTOR 表示来源为 embedding 向量; queryText 表示待搜索文本内容; topK 表示导出最大数量; scoreThreshold 表示相似度得分,只返回大于 ScoreThreshold 的结果,在 Source=VECTOR 时有效; fileUri 表示导出文件的 OSS 存储路径。

返回参数

字段名称字段详情
RequestIdstring

请求 ID。

示例值:99341606-****-0757724D97EE
DatasetJobIdstring

数据集任务 ID

示例值:dsjob-9jx1******uj9e

返回示例

变更历史

变更时间变更内容概要操作
2025-02-28
新增OpenAPI,创建数据集任务

相关示例