CreateDataFlow
创建一个CPFS文件系统与源端存储的数据流动
服务地址:
华东1 金融云
输入参数
只看必填
FileSystemId文件系统ID
FsetIdFileset ID
SourceStorage源端存储的访问地址
SourceSecurityType源端存储的安全保护类型
Throughput数据流动的传输带宽上限
Description数据流动的描述
AutoRefreshs自动更新配置信息集合
0
RefreshPath自动更新目录
AutoRefreshPolicy自动更新策略
AutoRefreshInterval自动更新间隔时间
DryRun是否对此次创建请求执行预检
请选择布尔值
SourceStoragePath源端存储Bucket内的访问路径
FileSystemPathCPFS智算版文件系统内的目录
幂等性参数
ClientToken保证请求幂等性
插件下载了解更多
VS Code 插件
安装插件之前,确保已安装 VS Code安装插件之前,确保已安装 VS Code
Alibaba Cloud Developer Toolkit is a collection of extensions that can help access Alibaba Cloud services in Visual Studio Code.
JetBrains 插件
安装插件之前,确保已安装 JetBrains IDE安装插件之前,确保已安装 JetBrains IDE
The Alibaba Cloud Developer Toolkit for JetBrains makes it easier to access Alibaba Cloud services.

接口说明

  • 基础操作

    • CPFS 2.2.0 及以上版本、CPFS 智算版 2.4.0 及以上版本支持数据流动。
    • CPFS、CPFS 智算版状态为运行中,才能创建数据流动。
    • 一个文件存储 CPFS 或者 CPFS 智算版文件系统最大允许创建 10 个数据流动。
    • 创建数据流动一般耗时 2~5 分钟,您可通过 DescribeDataFlows 检查数据流动创建是否完成。
  • 权限

    创建数据流动时,文件存储 CPFS 会获取AliyunServiceRoleForNasOssDataflowAliyunServiceRoleForNasEventNotification两个服务关联角色。更多信息,请参见 CPFS 服务关联角色

  • CPFS 使用说明

    • 计费

      • 创建数据流动将按照数据流动带宽计费。更多信息,请参见 CPFS 计费说明
      • 使用自动更新(AutoRefresh)时,需要通过 EventBridge 收集源端 OSS 存储的对象修改事件,事件将产生费用。更多信息,请参见 EventBridge 计费说明
    • 数据流动规格

      • 数据流动带宽(Throughput)支持 600 MB/s、1200 MB/s 和 1500 MB/s 三种规格。数据流动带宽是指该数据流动进行导入或导出数据时能达到的最大传输带宽。
      • 创建一个数据流动,会消耗 1 个文件存储 CPFS 挂载点使用的 vSwitch IP 地址,请您确保该 vSwitch IP 资源充足。
      • 库存查询:当设置 DryRun 为 true 时,可校验创建该规格的数据流动的资源是否满足。
    • Fileset

      • 数据流动的目的端是 CPFS 文件系统中的 Fileset。Fileset 是 CPFS 文件系统中一种新的目录树结构,是在父文件系统中的一个小型文件系统,拥有独立的 inode 空间和管理能力。
      • 当文件系统类型为 CPFS 时,创建数据流动时该 Fileset 必须已存在,且不能与其他 Fileset 嵌套。一个 Fileset 上只能创建一个数据流动,对应一个源端存储。
      • Fileset 内的文件数量上限是 100 万,如果从 OSS Bucket 导入的文件数量超过上限,创建新文件会报错no space
    说明 如果 Fileset 中已存在数据,创建数据流动后,Fileset 内的已有数据会被清空,替换为 OSS 端同步过来的数据。
    • 自动更新

      • 配置自动更新(AutoRefresh)后,当源端存储数据发生变化时,变化的元数据会自动同步到 CPFS 文件系统,变化的数据会在用户访问文件时按需加载,或者启动数据流动任务加载数据。
      • 自动更新依赖 EventBridge 收集源端 OSS 存储的对象修改事件。需要先开通 EventBridge 服务
      • 自动更新的作用范围是 prefix,由参数 RefreshPath 指定。一个数据流动最多可配置 5 个自动更新目录。
      • 自动更新间隔(AutoRefreshInterval)指 CPFS 设置的自动更新时间,检查源端 OSS Bucket 该 prefix 内是否存在数据更新,如果有数据更新则启动自动更新任务。当 OSS 源端的对象修改事件频率超过 CPFS 数据流动处理能力时,自动更新任务会堆积,元数据更新会延迟,数据流动的状态为Misconfigured,您可以提升数据流动规格,或者降低 OSS 修改频率来解决。
      • 在文件存储 CPFS 数据流动对 prefix 配置自动更新时,会在用户侧创建事件总线,并创建源端 OSS Bucket 的 prefix 的事件规则。当源端 OSS Bucket 的 prefix 内发生对象修改后,会在 EventBridge 中产生 OSS 事件,由 CPFS 数据流动处理。
      说明 文件存储 CPFS 在 EventBridge 创建的事件总线、事件规则带有Create for cpfs auto refresh的描述,事件总线、事件规则都不能修改或删除,否则自动更新无法正常工作。
    • 源端存储

      • 源端存储仅支持 OSS。数据流动的源端存储(SourceStorage)必须是 OSS Bucket。
      • CPFS 数据流动支持加密和非加密两种方式访问 OSS。选择加密(SSL)方式访问 OSS 时,需确认 OSS Bucket 的传输加密支持加密访问方式。
      • 如果多个 CPFS 的数据流动、或者同一个文件存储 CPFS 的多个数据流动的源端存储是同一个 OSS Bucket,为了防止多个文件存储 CPFS 向同一个源导出数据产生数据冲突,需要该 OSS Bucket 开启版本控制。
      • 不支持跨地域的 OSS 数据流动,OSS Bucket 必须与 CPFS 文件系统在同一个地域。
      说明 创建数据流动前,您需要先给源端 OSS Bucket 设置标签(key: cpfs-dataflow, value: true),以便 CPFS 数据流动访问该 Bucket 的数据。在数据流动的使用过程中,不能删除和修改该标签,否则 CPFS 数据流动无法访问 Bucket 的数据。
  • CPFS 智算版使用说明

    • 源端存储

      • 源端存储仅支持 OSS。数据流动的源端存储(SourceStorage)必须是 OSS Bucket。
      • CPFS 智算版数据流动支持加密和非加密两种方式访问 OSS。选择加密(SSL)方式访问 OSS 时,需确认 OSS Bucket 的传输加密支持加密访问方式。
      • 如果多个 CPFS 智算版的数据流动、或者同一个 CPFS 智算版的多个数据流动的源端存储是同一个 OSS Bucket,为了防止多个 CPFS 智算版向同一个源导出数据产生数据冲突,需要该 OSS Bucket 开启版本控制。
      • 不支持跨地域的 OSS 数据流动,OSS Bucket 必须与 CPFS 文件系统在同一个地域。
      • CPFS 智算版 2.6.0 及以上版本支持使用跨账号 OSS 进行数据流动的创建。
      • 只有在使用跨账号的 OSS 时,需要设置 account id 参数。
      • 使用跨账号的 OSS 时,需要先进行账号授权。具体授权请参考跨账号数据流动授权
        说明 创建数据流动前,您需要先给源端 OSS Bucket 设置标签(key: cpfs-dataflow, value: true),以便 CPFS 智算版数据流动访问该 Bucket 的数据。在数据流动的使用过程中,不能删除和修改该标签,否则 CPFS 智算版数据流动无法访问 Bucket 的数据。
    • 数据流动对文件系统的限制

      • 在数据流动关联的文件系统路径中,不可对非空目录执行重命名操作,否则报错 Permission Denied 或者目录非空。
      • 目录、文件名中的特殊字符需要谨慎使用,支持大小写字母、数字、感叹号(!)、短划线(-)、下划线(_)、半角句号(.)、星号(*)和半角圆括号(())。
      • 不支持超长路径,数据流动支持的路径最大长度是 1023 字符。
    • 数据流动导入限制

      • Symlink 类型的文件导入到 CPFS 智算版后,会转变为包含数据的普通文件,并丢失 Symlink 信息。
      • 如果 OSS Bucket 存在多个版本,则只复制最新的版本。
      • 不支持长度大于 255 字节的文件名或子目录名。
    • 数据流动导出限制

      • Symlink 类型的文件在同步到 OSS 后,不会同步 Symlink 所指向的文件,而是会变成一个普通的无数据空白对象。
      • Hardlink 类型的文件仅作为普通文件同步到 OSS。
      • Socket、Device、Pipe 类型的文件导出到 OSS Bucket 时,会变成一个普通的无数据空白对象。
      • 不支持长度大于 1023 字符的目录路径。

请求参数

字段名称字段详情
FileSystemIdstring

文件系统 ID。展开详情

示例值:cpfs-099394bd928c****参考取值来源:
    CreateFileSystem
    DescribeFileSystems
    SetFilesetQuota
FsetIdstring

Fileset ID。展开详情

示例值:fset-1902718ea0ae****
SourceStoragestring

源端存储的访问地址。格式:<storage type>://[<account id>:]<path>展开详情

示例值:oss://178321033379****:bucket-01字符长度 <= 128
SourceSecurityTypestring

源端存储的安全保护类型,如果源端存储必须通过安全保护访问,请指定源端存储的安全保护类型。取值:展开详情

示例值:SSL
Throughputinteger<int64>

数据流动的传输带宽上限,单位:MB/s 。取值: 展开详情

注意 该字段类型为 Long,在序列化/反序列化的过程中可能导致精度丢失,请注意数值不得大于 9007199254740991。
示例值:600枚举值:600120015002000
Descriptionstring

数据流动的描述。 展开详情

示例值:Bucket01 DataFlow
AutoRefreshsarray<object>

自动更新配置信息集合。展开详情

子级条数 <= 10
AutoRefreshPolicystring

自动更新策略,源端数据更新以后,数据更新导入到 CPFS 的策略。展开详情

示例值:None枚举值:NoneImportChanged
AutoRefreshIntervalinteger<int64>

自动更新间隔时间,每隔该时间间隔,CPFS 检查目录内是否存在数据更新,如果有数据更新,启动自动更新任务,单位:分钟。展开详情

注意 该字段类型为 Long,在序列化/反序列化的过程中可能导致精度丢失,请注意数值不得大于 9007199254740991。
示例值:10取值 <= 525600
DryRunboolean

是否对此次创建请求执行预检。展开详情

示例值:false
ClientTokenstring

保证请求幂等性,从您的客户端生成一个参数值,确保不同请求间该参数值唯一。展开详情

示例值:123e4567-e89b-12d3-a456-42665544****字符长度 <= 64字符长度 >= 1
SourceStoragePathstring

源端存储 Bucket 内的访问路径。限制如下。展开详情

示例值:/prefix/字符长度 <= 1023字符长度 >= 1
FileSystemPathstring

CPFS 智算版文件系统内的目录。限制如下。展开详情

示例值:/path/参考取值来源:
    CreateFileset
    DescribeFilesets
字符长度 <= 1023字符长度 >= 1

返回参数

字段名称字段详情
RequestIdstring

请求 ID。

示例值:473469C7-AA6F-4DC5-B3DB-A3DC0D****3E
DataFlowIdstring

数据流动 ID。

示例值:df-194433a5be31****
变更历史
暂无变更历史