CreateDatasetJob
创建数据集任务
服务地址:
华东1(杭州)
输入参数
只看必填
DatasetId数据集ID
body请求体
DatasetVersion数据集版本名称
WorkspaceId工作空间ID
JobAction任务操作
JobMode任务类型
Description描述
JobSpec任务明细
插件下载了解更多
VS Code 插件
安装插件之前,确保已安装 VS Code安装插件之前,确保已安装 VS Code
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
JetBrains 插件
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.

请求语法

POST /api/v1/datasets/{DatasetId}/datasetjobs HTTP/1.1

路径参数

字段名称字段详情
DatasetIdstring

数据集 ID。如何获取数据集 ID,详情请参见 ListDatasets

示例值:d-rbvg5wz****c9ks92参考取值来源:
    ListDatasets
    CreateDataset

请求参数

字段名称字段详情
bodyobject

请求体。

请求说明

CreateDatasetJob 中的 JobSpec 参数说明: (1)语义索引任务

示例: { "modelId": "xxx", "modelVersion": "1.0.0", "contentList": ["file"] }

其中 modelId 为模型 ID,modelVersion 为模型版本,contentList 为索引内容,目前只支持 file(文件)。

(2)智能打标任务

示例: { "modelId": "qwen-max-0428" }

其中 modelId 为打标模型 ID。

(3)元数据导出任务

示例: { "source": "TAG", "queryText": "汽车", "topK": 100, "scoreThreshold":0.6, "fileUri": "oss://mybucket.oss-cn-beijing.aliyuncs.com/mypath" }

其中 source 表示结果来源,值为 TAG 表示来源为标签,值为 VECTOR 表示来源为 embedding 向量; queryText 表示待搜索文本内容; topK 表示导出最大数量; scoreThreshold 表示相似度得分,只返回大于 ScoreThreshold 的结果,在 Source=VECTOR 时有效; fileUri 表示导出文件的 OSS 存储路径。

返回参数

字段名称字段详情
RequestIdstring

请求 ID。

示例值:99341606-****-0757724D97EE
DatasetJobIdstring

数据集任务 ID

示例值:dsjob-9jx1******uj9e
变更历史
变更时间变更内容概要操作
2025-02-28
新增OpenAPI,创建数据集任务