找不到 API ? 点击 反馈吧
- 服务
- 创建服务CreateService
- 开通服务自动扩缩容CreateServiceAutoScaler
- 开通服务定时扩缩容CreateServiceCronScaler
- 开通服务流量镜像CreateServiceMirror
- 创建应用服务CreateAppService
- 获取群组端点列表DescribeGroupEndpoints
- 获取服务端点列表DescribeServiceEndpoints
- 获取服务免登录Web链接DescribeServiceSignedUrl
- 复制服务CloneService
- 删除服务DeleteService
- 删除服务标签DeleteServiceLabel
- 关闭服务自动扩缩容DeleteServiceAutoScaler
- 关闭服务定时扩缩容DeleteServiceCronScaler
- 重启服务实例DeleteServiceInstances
- 关闭服务流量镜像DeleteServiceMirror
- 更新服务UpdateService
- 更新服务标签UpdateServiceLabel
- 启动服务StartService
- 停止服务StopService
- 重启服务RestartService
- 更新服务自动扩缩容配置UpdateServiceAutoScaler
- 更新服务定时扩缩容配置UpdateServiceCronScaler
- 开发服务DevelopService
- Commit容器并发布CommitService
- 更新服务流量镜像配置UpdateServiceMirror
- 切换服务版本UpdateServiceVersion
- 更新服务安全锁UpdateServiceSafetyLock
- 更新服务实例属性UpdateServiceInstance
- 更新应用服务UpdateAppService
- 调整服务流量权重和流量状态ReleaseService
- 查询服务详情DescribeService
- 查看服务自动扩缩容信息DescribeServiceAutoScaler
- 查看服务定时扩缩容信息DescribeServiceCronScaler
- 查看服务诊断详情DescribeServiceDiagnosis
- 查看服务实例诊断详情DescribeServiceInstanceDiagnosis
- 查看服务日志DescribeServiceLog
- 查询服务事件DescribeServiceEvent
- 查看服务流量镜像信息DescribeServiceMirror
- 查看服务群组详情DescribeGroup
- 查询抢占式实例历史价格DescribeSpotDiscountHistory
- 查询服务实例列表ListServiceInstances
- 查询服务历史版本ListServiceVersions
- 查询服务的容器列表ListServiceContainers
- 查询服务列表ListServices
- 查看服务组列表ListGroups
- 查询公共资源组可用机器规格列表DescribeMachineSpec
- 资源组
- 压测任务
- 私有网关
- 其他
CreateService
创建PAI-EAS服务
服务地址:
华东1(杭州)
参数配置
高级配置
输入参数
只看必填
注意事项
文档
调用结果
SDK 示例
CLI示例
相关示例
调用历史
错误码
流控
插件下载了解更多
Alibaba Cloud Developer ToolkitbetaAlibaba Cloud OpenAPI
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
Alibaba Cloud Developer ToolkitbetaAlibaba Cloud OpenAPI
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.
接口说明
请确保在使用该接口前,已充分了解 EAS 产品的收费方式和价格。
请求语法
POST /api/v2/services HTTP/1.1
请求参数
字段名称 | 字段详情 |
---|---|
bodystring | 请求 body。其中关键请求参数配置说明,请参见下方的表 1. 请求 Body 参数和表 2. metadata 参数。更多参数配置详情,请参见服务模型所有相关参数说明。 示例值:镜像部署服务:
{
"name": "foo",
"metadata": {
"instance": 2,
"memory": 7000,
"cpu": 4
},
"containers": [
{
"image": "****",
"script": "**** --listen=0.0.0.0 --server_port=8000 --headless",
"port": 8000
}
],
"storage": [
{
"oss": {
"path": "oss://examplebuket/data111/",
"readOnly": false
},
"properties": {
"resource_type": "model"
},
"mount_path": "/data"
}
]
}
镜像部署AI-Web应用:
{
"name": "foo",
"metadata": {
"instance": 1,
"memory": 7000,
"cpu": 4,
"enable_webservice": true
},
"containers": [
{
"image": "****",
"script": "**** --listen=0.0.0.0 --server_port=8000 --headless",
"port": 8000
}
],
"storage": [
{
"oss": {
"path": "oss://examplebucket/data111/",
"readOnly": false
},
"properties": {
"resource_type": "model"
},
"mount_path": "/data"
}
]
}
模型+processor部署服务:
{
"metadata": {
"instance": 1,
"memory": 7000,
"cpu": 4
},
"name": "foo",
"model_config": {},
"processor_type": "python",
"processor_path": "oss://****",
"processor_entry": "a.py",
"model_path": "oss://****"
} |
Developstring | 是否进入开发模式。 示例值:true枚举值:truefalse |
Labelsmap<string> | 用户自定义标签。 |
WorkspaceIdstring | 工作空间 ID。 示例值:123456 |
请求说明
表 1. 请求 Body 参数
名称 | 类型 | 是否必选 | 说明 |
---|---|---|---|
name | String | 是 | 服务名称,在同一个地域内全局唯一。 |
token | String | 否 | 指定用于访问鉴权的 Token 字符串,若不指定则按generate_token自动生成。 |
model_path | String | 否 | 模型相关的文件,支持 HTTP 和 OSS 两种格式,HTTP 地址需为 Public 可访问的。若为 OSS 地址,则输入可以是目录或者文件;若文件为.tar.gz 、.tar.bz2 、.zip 等压缩包,会自动解压。 |
role_arn | string | 否 | model_path或processor_path为 OSS 地址时,需要指定用于 OSS 授权的 role_arn,role_arn 的获取参数 Role_ARN。 |
oss_endpoint | String | 否 | model_path或processor_path为 OSS 地址时,需要指定 OSS Bucket 对应的 endpoint。 |
model_entry | String | 否 | 模型的入口文件,若不指定,则使用model_path中的文件名,可以包含任意文件,主文件的路径会传递给 Processor 中的Load() 函数。 |
processor_path | String | 是 | Processor 相关的文件包,支持本地文件和 HTTP 链接地址,若文件为.tar.gz 、.tar.bz2 、.zip 等压缩包,会自动解压。 |
processor_entry | String | 否 | C、C++、Python 类型必选。Processor 的主文件,其中包含了预测所需要Load() 函数和Process() 函数的实现。 |
processor_mainclass | String | 否 | Java 类型必选。Processor 的主文件,JAR 包中的 mainclass。 |
processor_type | String | 是 | processor 实现的语言,目前已支持 C、C++、Java、Python。 |
metadata | Dict | 否 | 服务的 meta 信息。详见下表 2。 |
cloud | Dict | 否 | 目前只有指定机型部署时会用到,传参的样式为"cloud":{"computing":{"instance_type": "ecs.gxxxxxx.large"}} 。 |
containers | List | 否 | 自定义镜像部署。如果 Processor 部署无法满足需求,可以使用自定义镜像部署,详情请参见服务部署:自定义镜像。 |
说明
model_path 和 processor_path 为输入模型数据和 processor 数据的数据来源,支持 HTTP 和 OSS 两种数据源,使用 test 命令进行本地调试时支持本地文件和目录。
- 若使用 HTTP 地址,则需要将相关文件打包成.tar.gz、.tar.bz2、.zip 等压缩包,可上传至 OSS 并生成 HTTP 地址。
- 若使用 OSS 地址,则输入可以是目录,也可以是文件。
表 2. metadata 参数
名称 | 类型 | 是否必选 | 描述 | 示例值 |
---|---|---|---|---|
instance | Int | 否 | 服务启动的 Worker 数目。 | 1 |
cpu | Int | 否 | 每个 Worker 需要的 CPU 数目。 | 1 |
gpu | Int | 否 | 每个 Worker 需要的 GPU 数目。 | 0 |
memory | Int | 否 | 每个 Worker 需要的内存大小,单位为 MB。 | 1000 |
resource | String | 否 | 服务所属的资源组。 | eas-r-aaabbbccc |
rpc.worker_threads | Int | 否 | 每个 Instance 中用于并发处理请求的线程数。 | 5 |
rpc.max_queue_size | Int | 否 | 请求处理时队列的最大长度,队列满时新请求会被以 450 状态码丢弃。 | 64 |
rpc.keepalive | Int | 否 | 请求的超时时间,单位为毫秒。 | 5000 |
rpc.rate_limit | Int | 否 | 单实例请求限流的 QPS 值,单实例 QPS 超出该值后的请求会被返回 429 丢弃。 | 0 |
release | Bool | 否 | 若为 true,则要创建一个灰度发布服务。 | false |
返回参数
字段名称 | 字段详情 |
---|---|
RequestIdstring | 请求 ID。 示例值:40325405-579C-4D82**** |
ServiceIdstring | 新创建服务的服务 ID。 示例值:eas-m-aaxxxddf |
ServiceNamestring | 新创建服务的服务名字。 示例值:yourname |
Statusstring | 新服务的当前状态。 示例值:Creating |
Regionstring | 新创建服务所属的区域 ID。 示例值:cn-shanghai |
InternetEndpointstring | 新创建服务的公网 Endpoint。 示例值:http://pai-eas.vpc.cn-shanghai.**** |
IntranetEndpointstring | 新创建服务的内网 Endpoint。 示例值:http://pai-eas.cn-shanghai.**** |
变更历史
暂无变更历史