- 集成
- 反向代理
- Azure:Microsoft Azure
- AWS:亚马逊网络服务
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Databricks</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GCP:Google云端平台</font></font>
- 记录
- BigQuery的
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQuery运算符</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryCheckOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryValueCheckOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryIntervalCheckOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryGetDataOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryCreateEmptyTableOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryCreateExternalTableOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryDeleteDatasetOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryTableDeleteOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryToBigQueryOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryToCloudStorageOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryHook</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQuery运算符</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>云DataFlow</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlow运算符</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlowJavaOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataflowTemplateOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlowPythonOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlowHook</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlow运算符</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Cloud DataProc</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProc运算符</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocClusterCreateOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocClusterScaleOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocClusterDeleteOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcPigOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcHiveOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcSparkSqlOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcSparkOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcHadoopOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcPySparkOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocWorkflowTemplateInstantiateOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocWorkflowTemplateInstantiateInlineOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProc运算符</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>云数据存储区</font></font>
- 云ML引擎
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>云ML引擎运营商</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineBatchPredictionOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineModelOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineTrainingOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineVersionOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Cloud ML Engine Hook</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>云ML引擎运营商</font></font>
- 云储存
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>存储运营商</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>FileToGoogleCloudStorageOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageCreateBucketOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageDownloadOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageListOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageToBigQueryOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageToGoogleCloudStorageOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageHook</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>存储运营商</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>谷歌Kubernetes引擎</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Google Kubernetes引擎集群运营商</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GKEClusterCreateOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GKEClusterDeleteOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GKEPodOperator</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Google Kubernetes Engine Hook</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Google Kubernetes引擎集群运营商</font></font>
- 原文
集成
反向代理
可以在反向代理后面设置气流,并能够灵活地设置其端点。
例如,您可以配置反向代理以获取:
https : // lab . mycompany . com / myorg / airflow /
为此,您需要在<cite>airflow.cfg中</cite>设置以下设置:
base_url = http : // my_host / myorg / airflow
此外,如果您使用Celery Executor,您可以使用以下命令获取<cite>/</cite> in <cite>myorg / flower中的</cite> Flower:
flower_url_prefix = / myorg / flower
您的反向代理(例如:nginx)应配置如下:
传递url和http标头作为Airflow网络服务器,没有任何重写,例如:
server {
listen 80;
server_name lab.mycompany.com;
location /myorg/airflow/ {
proxy_pass http://localhost:8080;
proxy_set_header Host $host;
proxy_redirect off;
proxy_http_version 1.1;
proxy_set_header Upgrade $http_upgrade;
proxy_set_header Connection "upgrade";
}
}
重写花端点的url:
server {
listen 80;
server_name lab.mycompany.com;
location /myorg/flower/ {
rewrite ^/myorg/flower/(.*)$ /$1 break; # remove prefix from http header
proxy_pass http://localhost:5555;
proxy_set_header Host $host;
proxy_redirect off;
proxy_http_version 1.1;
proxy_set_header Upgrade $http_upgrade;
proxy_set_header Connection "upgrade";
}
}
Azure:Microsoft Azure
Airflow对Microsoft Azure的支持有限:仅存在Azure Blob存储和Azure Data Lake的接口。 Blob存储的钩子,传感器和操作员以及Azure Data Lake Hook都在contrib部分。
Azure Blob存储
所有类都通过Window Azure Storage Blob协议进行通信。 确保存在类型为<cite>wasb</cite>的Airflow连接。 可以通过在额外字段中提供登录(=存储帐户名称)和密码(= KEY),或登录和SAS令牌来完成授权(有关<cite>示例</cite> ,请参阅连接<cite>wasb_default</cite> )。
- WasbBlobSensor :检查Azure Blob存储上是否存在blob。
- WasbPrefixSensor :检查Azure Blob存储上是否存在与前缀匹配的blob。
- FileToWasbOperator :将本地文件作为blob 上载到容器。
- WasbHook :与Azure Blob存储的接口。
WasbBlobSensor
class airflow.contrib.sensors.wasb_sensor.WasbBlobSensor(container_name, blob_name, wasb_conn_id='wasb_default', check_options=None, *args, **kwargs)
基础: airflow.sensors.base_sensor_operator.BaseSensorOperator
等待blob到达Azure Blob存储。
| 参数: |
- container_name ( str ) - 容器的名称。
- blob_name ( str ) - blob的名称。
- wasb_conn_id ( str ) - 对wasb连接的引用。
check_options ( dict ) - <cite>WasbHook.check_for_blob()</cite>采用的可选关键字参数。
|
| —- | —- |
poke(context)
传感器在派生此类时定义的功能应该覆盖。
WasbPrefixSensor
class airflow.contrib.sensors.wasb_sensor.WasbPrefixSensor(container_name, prefix, wasb_conn_id='wasb_default', check_options=None, *args, **kwargs)
基础: airflow.sensors.base_sensor_operator.BaseSensorOperator
等待与前缀匹配的blob到达Azure Blob存储。
| 参数: |
- container_name ( str ) - 容器的名称。
- prefix ( str ) - blob的前缀。
- wasb_conn_id ( str ) - 对wasb连接的引用。
check_options ( dict ) - <cite>WasbHook.check_for_prefix()</cite>采用的可选关键字参数。
|
| —- | —- |
poke(context)
传感器在派生此类时定义的功能应该覆盖。
FileToWasbOperator
class airflow.contrib.operators.file_to_wasb.FileToWasbOperator(file_path, container_name, blob_name, wasb_conn_id='wasb_default', load_options=None, *args, **kwargs)
基础: airflow.models.BaseOperator
将文件上载到Azure Blob存储。
| 参数: |
- file_path ( str ) - 要加载的文件的路径。 (模板)
- container_name ( str ) - 容器的名称。 (模板)
- blob_name ( str ) - blob的名称。 (模板)
- wasb_conn_id ( str ) - 对wasb连接的引用。
load_options ( dict ) - <cite>WasbHook.load_file()</cite>采用的可选关键字参数。
|
| —- | —- |
execute(context)
将文件上载到Azure Blob存储。
WasbHook
class airflow.contrib.hooks.wasb_hook.WasbHook(wasb_conn_id='wasb_default')
基础: airflow.hooks.base_hook.BaseHook
通过wasb://协议与Azure Blob存储进行交互。
在连接的“额外”字段中传递的其他选项将传递给<cite>BlockBlockService()</cite>构造函数。 例如,通过添加{“sas_token”:“YOUR_TOKEN”}使用SAS令牌进行身份验证。
| 参数: | wasb_conn_id ( str ) - 对wasb连接的引用。 |
| —- | —- |
check_for_blob(container_name, blob_name, **kwargs)
检查Azure Blob存储上是否存在Blob。
| 参数: |
- container_name ( str ) - 容器的名称。
- blob_name ( str ) - blob的名称。
kwargs ( object ) - <cite>BlockBlobService.exists()</cite>采用的可选关键字参数。
|
| —- | —- |
| 返回: | 如果blob存在则为True,否则为False。 |
| —- | —- |
:rtype布尔
check_for_prefix(container_name, prefix, **kwargs)
检查Azure Blob存储上是否存在前缀。
| 参数: |
- container_name ( str ) - 容器的名称。
- prefix ( str ) - blob的前缀。
kwargs ( object ) - <cite>BlockBlobService.list_blobs()</cite>采用的可选关键字参数。
|
| —- | —- |
| 返回: | 如果存在与前缀匹配的blob,则为True,否则为False。 |
| —- | —- |
:rtype布尔
get_conn()
返回BlockBlobService对象。
get_file(file_path, container_name, blob_name, **kwargs)
从Azure Blob存储下载文件。
| 参数: |
- file_path ( str ) - 要下载的文件的路径。
- container_name ( str ) - 容器的名称。
- blob_name ( str ) - blob的名称。
kwargs ( object ) - <cite>BlockBlobService.create_blob_from_path()</cite>采用的可选关键字参数。
|
| —- | —- |
load_file(file_path, container_name, blob_name, **kwargs)
将文件上载到Azure Blob存储。
| 参数: |
- file_path ( str ) - 要加载的文件的路径。
- container_name ( str ) - 容器的名称。
- blob_name ( str ) - blob的名称。
kwargs ( object ) - <cite>BlockBlobService.create_blob_from_path()</cite>采用的可选关键字参数。
|
| —- | —- |
load_string(string_data, container_name, blob_name, **kwargs)
将字符串上载到Azure Blob存储。
| 参数: |
- string_data ( str ) - 要加载的字符串。
- container_name ( str ) - 容器的名称。
- blob_name ( str ) - blob的名称。
kwargs ( object ) - <cite>BlockBlobService.create_blob_from_text()</cite>采用的可选关键字参数。
|
| —- | —- |
read_file(container_name, blob_name, **kwargs)
从Azure Blob Storage读取文件并以字符串形式返回。
| 参数: |
- container_name ( str ) - 容器的名称。
- blob_name ( str ) - blob的名称。
kwargs ( object ) - <cite>BlockBlobService.create_blob_from_path()</cite>采用的可选关键字参数。
|
| —- | —- |
Azure文件共享
SMB文件共享的云变体。 确保存在类型为<cite>wasb</cite>的Airflow连接。 可以通过在额外字段中提供登录(=存储帐户名称)和密码(=存储帐户密钥)或登录和SAS令牌来完成授权(有关<cite>示例</cite> ,请参阅连接<cite>wasb_default</cite> )。
AzureFileShareHook
class airflow.contrib.hooks.azure_fileshare_hook.AzureFileShareHook(wasb_conn_id='wasb_default')
基础: airflow.hooks.base_hook.BaseHook
与Azure FileShare存储交互。
在连接的“额外”字段中传递的其他选项将传递给<cite>FileService()</cite>构造函数。
| 参数: | wasb_conn_id ( str ) - 对wasb连接的引用。 |
| —- | —- |
check_for_directory(share_name, directory_name, **kwargs)
检查Azure文件共享上是否存在目录。
| 参数: |
- share_name ( str ) - 共享的名称。
- directory_name ( str ) - 目录的名称。
kwargs ( object ) - <cite>FileService.exists()</cite>采用的可选关键字参数。
|
| —- | —- |
| 返回: | 如果文件存在则为True,否则为False。 |
| —- | —- |
:rtype布尔
check_for_file(share_name, directory_name, file_name, **kwargs)
检查Azure文件共享上是否存在文件。
| 参数: |
- share_name ( str ) - 共享的名称。
- directory_name ( str ) - 目录的名称。
- file_name ( str ) - 文件名。
kwargs ( object ) - <cite>FileService.exists()</cite>采用的可选关键字参数。
|
| —- | —- |
| 返回: | 如果文件存在则为True,否则为False。 |
| —- | —- |
:rtype布尔
create_directory(share_name, directory_name, **kwargs)
在Azure文件共享上创建新的目标。
| 参数: |
- share_name ( str ) - 共享的名称。
- directory_name ( str ) - 目录的名称。
kwargs ( object ) - <cite>FileService.create_directory()</cite>采用的可选关键字参数。
|
| —- | —- |
| 返回: | 文件和目录列表 |
| —- | —- |
:rtype列表
get_conn()
返回FileService对象。
get_file(file_path, share_name, directory_name, file_name, **kwargs)
从Azure文件共享下载文件。
| 参数: |
- file_path ( str ) - 存储文件的位置。
- share_name ( str ) - 共享的名称。
- directory_name ( str ) - 目录的名称。
- file_name ( str ) - 文件名。
kwargs ( object ) - <cite>FileService.get_file_to_path()</cite>采用的可选关键字参数。
|
| —- | —- |
get_file_to_stream(stream, share_name, directory_name, file_name, **kwargs)
从Azure文件共享下载文件。
| 参数: |
- stream (类文件对象 ) - 用于存储文件的文件句柄。
- share_name ( str ) - 共享的名称。
- directory_name ( str ) - 目录的名称。
- file_name ( str ) - 文件名。
kwargs ( object ) - <cite>FileService.get_file_to_stream()</cite>采用的可选关键字参数。
|
| —- | —- |
list_directories_and_files(share_name, directory_name=None, **kwargs)
返回存储在Azure文件共享中的目录和文件列表。
| 参数: |
- share_name ( str ) - 共享的名称。
- directory_name ( str ) - 目录的名称。
kwargs ( object ) - <cite>FileService.list_directories_and_files()</cite>采用的可选关键字参数。
|
| —- | —- |
| 返回: | 文件和目录列表 |
| —- | —- |
:rtype列表
load_file(file_path, share_name, directory_name, file_name, **kwargs)
将文件上载到Azure文件共享。
| 参数: |
- file_path ( str ) - 要加载的文件的路径。
- share_name ( str ) - 共享的名称。
- directory_name ( str ) - 目录的名称。
- file_name ( str ) - 文件名。
kwargs ( object ) - <cite>FileService.create_file_from_path()</cite>采用的可选关键字参数。
|
| —- | —- |
load_stream(stream, share_name, directory_name, file_name, count, **kwargs)
将流上载到Azure文件共享。
| 参数: |
- stream (类文件 ) - 打开的文件/流作为文件内容上传。
- share_name ( str ) - 共享的名称。
- directory_name ( str ) - 目录的名称。
- file_name ( str ) - 文件名。
- count ( int ) - 流的大小(以字节为单位)
kwargs ( object ) - <cite>FileService.create_file_from_stream()</cite>采用的可选关键字参数。
|
| —- | —- |
load_string(string_data, share_name, directory_name, file_name, **kwargs)
将字符串上载到Azure文件共享。
| 参数: |
- string_data ( str ) - 要加载的字符串。
- share_name ( str ) - 共享的名称。
- directory_name ( str ) - 目录的名称。
- file_name ( str ) - 文件名。
kwargs ( object ) - <cite>FileService.create_file_from_text()</cite>采用的可选关键字参数。
|
| —- | —- |
记录
可以将Airflow配置为在Azure Blob存储中读取和写入任务日志。 请参阅将日志写入Azure Blob存储 。
Azure Data Lake
AzureDataLakeHook通过与WebHDFS兼容的REST API进行通信。 确保存在<cite>azure_data_lake</cite>类型的气流连接。 可以通过提供登录(=客户端ID),密码(=客户端密钥)和额外字段租户(租户)和account_name(帐户名称)来完成授权
(有关<cite>示例</cite> ,请参阅<cite>azure_data_lake_default</cite>连接)。
- AzureDataLakeHook :与Azure Data Lake的接口。
AzureDataLakeHook
class airflow.contrib.hooks.azure_data_lake_hook.AzureDataLakeHook(azure_data_lake_conn_id='azure_data_lake_default')
基础: airflow.hooks.base_hook.BaseHook
与Azure Data Lake进行交互。
客户端ID和客户端密钥应该在用户和密码参数中。 租户和帐户名称应为{“租户”:“<TENANT>”,“account_name”:“ACCOUNT_NAME”}的额外字段。
| 参数: | azure_data_lake_conn_id ( str ) - 对Azure Data Lake连接的引用。 |
| —- | —- |
check_for_file(file_path)
检查Azure Data Lake上是否存在文件。
| 参数: | file_path ( str ) - 文件的路径和名称。 |
| —- | —- |
| 返回: | 如果文件存在则为True,否则为False。 |
| —- | —- |
:rtype布尔
download_file(local_path, remote_path, nthreads=64, overwrite=True, buffersize=4194304, blocksize=4194304)
从Azure Blob存储下载文件。
| 参数: |
- local_path ( str ) - 本地路径。 如果下载单个文件,将写入此特定文件,除非它是现有目录,在这种情况下,将在其中创建文件。 如果下载多个文件,这是要写入的根目录。 将根据需要创建目录。
- remote_path ( str ) - 用于查找远程文件的远程路径/ globstring。 不支持使用<cite>**的</cite>递归glob模式。
- nthreads ( int ) - 要使用的线程数。 如果为None,则使用核心数。
- overwrite ( bool ) - 是否强制覆盖现有文件/目录。 如果False和远程路径是目录,则无论是否覆盖任何文件都将退出。 如果为True,则实际仅覆盖匹配的文件名。
- buffersize ( int ) - int [2 ** 22]内部缓冲区的字节数。 此块不能大于块,并且不能小于块。
blocksize ( int ) - int [2 ** 22]块的字节数。 在每个块中,我们为每个API调用编写一个较小的块。 这个块不能大于块。
|
| —- | —- |
get_conn()
返回AzureDLFileSystem对象。
upload_file(local_path, remote_path, nthreads=64, overwrite=True, buffersize=4194304, blocksize=4194304)
将文件上载到Azure Data Lake。
| 参数: |
- local_path ( str ) - 本地路径。 可以是单个文件,目录(在这种情况下,递归上传)或glob模式。 不支持使用<cite>**的</cite>递归glob模式。
- remote_path ( str ) - 要上传的远程路径; 如果有多个文件,这就是要写入的dircetory根目录。
- nthreads ( int ) - 要使用的线程数。 如果为None,则使用核心数。
- overwrite ( bool ) - 是否强制覆盖现有文件/目录。 如果False和远程路径是目录,则无论是否覆盖任何文件都将退出。 如果为True,则实际仅覆盖匹配的文件名。
- buffersize ( int ) - int [2 ** 22]内部缓冲区的字节数。 此块不能大于块,并且不能小于块。
blocksize ( int ) - int [2 ** 22]块的字节数。 在每个块中,我们为每个API调用编写一个较小的块。 这个块不能大于块。
|
| —- | —- |
AWS:亚马逊网络服务
Airflow广泛支持Amazon Web Services。 但请注意,Hook,Sensors和Operators都在contrib部分。
AWS EMR
- EmrAddStepsOperator :向现有EMR JobFlow添加步骤。
- EmrCreateJobFlowOperator :创建EMR JobFlow,从EMR连接读取配置。
- EmrTerminateJobFlowOperator :终止EMR JobFlow。
- EmrHook :与AWS EMR互动。
EmrAddStepsOperator
class airflow.contrib.operators.emr_add_steps_operator.EmrAddStepsOperator(job_flow_id, aws_conn_id='s3_default', steps=None, *args, **kwargs)
基础: airflow.models.BaseOperator
向现有EMR job_flow添加步骤的运算符。
| 参数: |
- job_flow_id - 要添加步骤的JobFlow的ID。 (模板)
- aws_conn_id ( str ) - 与使用的aws连接
步骤 ( 列表 ) - 要添加到作业流的boto3样式步骤。 (模板)
|
| —- | —- |
EmrCreateJobFlowOperator
class airflow.contrib.operators.emr_create_job_flow_operator.EmrCreateJobFlowOperator(aws_conn_id='s3_default', emr_conn_id='emr_default', job_flow_overrides=None, *args, **kwargs)
基础: airflow.models.BaseOperator
创建EMR JobFlow,从EMR连接读取配置。 可以传递JobFlow覆盖的字典,覆盖连接中的配置。
| 参数: |
- aws_conn_id ( str ) - 与使用的aws连接
- emr_conn_id ( str ) - 要使用的emr连接
job_flow_overrides - 用于覆盖emr_connection extra的boto3样式参数。 (模板)
|
| —- | —- |
EmrTerminateJobFlowOperator
class airflow.contrib.operators.emr_terminate_job_flow_operator.EmrTerminateJobFlowOperator(job_flow_id, aws_conn_id='s3_default', *args, **kwargs)
基础: airflow.models.BaseOperator
运营商终止EMR JobFlows。
| 参数: |
- job_flow_id - 要终止的JobFlow的id。 (模板)
aws_conn_id ( str ) - 与使用的aws连接
|
| —- | —- |
EmrHook
class airflow.contrib.hooks.emr_hook.EmrHook(emr_conn_id=None, *args, **kwargs)
基地: airflow.contrib.hooks.aws_hook.AwsHook
与AWS EMR交互。 emr_conn_id只是使用create_job_flow方法所必需的。
create_job_flow(job_flow_overrides)
使用EMR连接中的配置创建作业流。 json额外哈希的键可以具有boto3 run_job_flow方法的参数。 此配置的覆盖可以作为job_flow_overrides传递。
AWS S3
- S3Hook :与AWS S3交互。
- S3FileTransformOperator :将数据从源S3位置复制到本地文件系统上的临时位置。
- S3ListOperator :列出与S3位置的键前缀匹配的文件。
- S3ToGoogleCloudStorageOperator :将S3位置与Google云端存储分区同步。
- S3ToHiveTransfer :将数据从S3移动到Hive。 操作员从S3下载文件,在将文件加载到Hive表之前将其存储在本地。
S3Hook
class airflow.hooks.S3_hook.S3Hook(aws_conn_id='aws_default')
基地: airflow.contrib.hooks.aws_hook.AwsHook
使用boto3库与AWS S3交互。
check_for_bucket(bucket_name)
检查bucket_name是否存在。
| 参数: | bucket_name ( str ) - 存储桶的名称 |
| —- | —- |
check_for_key(key, bucket_name=None)
检查存储桶中是否存在密钥
| 参数: |
- key ( str ) - 指向文件的S3键
bucket_name ( str ) - 存储文件的存储桶的名称
|
| —- | —- |
check_for_prefix(bucket_name, prefix, delimiter)
检查存储桶中是否存在前缀
check_for_wildcard_key(wildcard_key, bucket_name=None, delimiter='')
检查桶中是否存在与通配符表达式匹配的密钥
get_bucket(bucket_name)
返回boto3.S3.Bucket对象
| 参数: | bucket_name ( str ) - 存储桶的名称 |
| —- | —- |
get_key(key, bucket_name=None)
返回boto3.s3.Object
| 参数: |
- key ( str ) - 密钥的路径
bucket_name ( str ) - 存储桶的名称
|
| —- | —- |
get_wildcard_key(wildcard_key, bucket_name=None, delimiter='')
返回与通配符表达式匹配的boto3.s3.Object对象
| 参数: |
- wildcard_key ( str ) - 密钥的路径
bucket_name ( str ) - 存储桶的名称
|
| —- | —- |
list_keys(bucket_name, prefix='', delimiter='', page_size=None, max_items=None)
列出前缀下的存储桶中的密钥,但不包含分隔符
| 参数: |
- bucket_name ( str ) - 存储桶的名称
- prefix ( str ) - 一个密钥前缀
- delimiter ( str ) - 分隔符标记键层次结构。
- page_size ( int ) - 分页大小
max_items ( int ) - 要返回的最大项目数
|
| —- | —- |
list_prefixes(bucket_name, prefix='', delimiter='', page_size=None, max_items=None)
列出前缀下的存储桶中的前缀
| 参数: |
- bucket_name ( str ) - 存储桶的名称
- prefix ( str ) - 一个密钥前缀
- delimiter ( str ) - 分隔符标记键层次结构。
- page_size ( int ) - 分页大小
max_items ( int ) - 要返回的最大项目数
|
| —- | —- |
load_bytes(bytes_data, key, bucket_name=None, replace=False, encrypt=False)
将字节加载到S3
这是为了方便在S3中删除字符串。 它使用boto基础结构将文件发送到s3。
| 参数: |
- bytes_data ( bytes ) - 设置为密钥内容的字节。
- key ( str ) - 指向文件的S3键
- bucket_name ( str ) - 存储文件的存储桶的名称
- replace ( bool ) - 一个标志,用于决定是否覆盖密钥(如果已存在)
encrypt ( bool ) - 如果为True,则文件将在服务器端由S3加密,并在S3中静止时以加密形式存储。
|
| —- | —- |
load_file(filename, key, bucket_name=None, replace=False, encrypt=False)
将本地文件加载到S3
| 参数: |
- filename ( str ) - 要加载的文件的名称。
- key ( str ) - 指向文件的S3键
- bucket_name ( str ) - 存储文件的存储桶的名称
- replace ( bool ) - 一个标志,用于决定是否覆盖密钥(如果已存在)。 如果replace为False且密钥存在,则会引发错误。
encrypt ( bool ) - 如果为True,则文件将在服务器端由S3加密,并在S3中静止时以加密形式存储。
|
| —- | —- |
load_string(string_data, key, bucket_name=None, replace=False, encrypt=False, encoding='utf-8')
将字符串加载到S3
这是为了方便在S3中删除字符串。 它使用boto基础结构将文件发送到s3。
| 参数: |
- string_data ( str ) - 要设置为键的内容的字符串。
- key ( str ) - 指向文件的S3键
- bucket_name ( str ) - 存储文件的存储桶的名称
- replace ( bool ) - 一个标志,用于决定是否覆盖密钥(如果已存在)
encrypt ( bool ) - 如果为True,则文件将在服务器端由S3加密,并在S3中静止时以加密形式存储。
|
| —- | —- |
read_key(key, bucket_name=None)
从S3读取密钥
| 参数: |
- key ( str ) - 指向文件的S3键
bucket_name ( str ) - 存储文件的存储桶的名称
|
| —- | —- |
select_key(key, bucket_name=None, expression='SELECT * FROM S3Object', expression_type='SQL', input_serialization={'CSV': {}}, output_serialization={'CSV': {}})
使用S3 Select读取密钥。
| 参数: |
- key ( str ) - 指向文件的S3键
- bucket_name ( str ) - 存储文件的存储桶的名称
- expression ( str ) - S3选择表达式
- expression_type ( str ) - S3选择表达式类型
- input_serialization ( dict ) - S3选择输入数据序列化格式
output_serialization ( dict ) - S3选择输出数据序列化格式
|
| —- | —- |
| 返回: | 通过S3 Select检索原始数据的子集 |
| —- | —- |
| 返回类型: | 海峡 |
| —- | —- |
也可以看看
有关S3 Select参数的更多详细信息: http : //boto3.readthedocs.io/en/latest/reference/services/s3.html#S3.Client.select_object_content
S3FileTransformOperator
class airflow.operators.s3_file_transform_operator.S3FileTransformOperator(source_s3_key, dest_s3_key, transform_script=None, select_expression=None, source_aws_conn_id='aws_default', dest_aws_conn_id='aws_default', replace=False, *args, **kwargs)
基础: airflow.models.BaseOperator
将数据从源S3位置复制到本地文件系统上的临时位置。 根据转换脚本的指定对此文件运行转换,并将输出上载到目标S3位置。
本地文件系统中的源文件和目标文件的位置作为转换脚本的第一个和第二个参数提供。 转换脚本应该从源读取数据,转换它并将输出写入本地目标文件。 然后,操作员接管控制并将本地目标文件上载到S3。
S3 Select也可用于过滤源内容。 如果指定了S3 Select表达式,则用户可以省略转换脚本。
| 参数: |
- source_s3_key ( str ) - 从S3检索的密钥。 (模板)
- source_aws_conn_id ( str ) - 源s3连接
- dest_s3_key ( str ) - 从S3写入的密钥。 (模板)
- dest_aws_conn_id ( str ) - 目标s3连接
- replace ( bool ) - 替换dest S3密钥(如果已存在)
- transform_script ( str ) - 可执行转换脚本的位置
select_expression ( str ) - S3选择表达式
|
| —- | —- |
S3ListOperator
class airflow.contrib.operators.s3_list_operator.S3ListOperator(bucket, prefix='', delimiter='', aws_conn_id='aws_default', *args, **kwargs)
基础: airflow.models.BaseOperator
列出桶中具有名称中给定字符串前缀的所有对象。
此运算符返回一个python列表,其中包含可由<cite>xcom</cite>在下游任务中使用的对象名称。
| 参数: |
- bucket ( string ) - S3存储桶在哪里找到对象。 (模板)
- prefix ( string ) - 用于过滤名称以此前缀开头的对象的前缀字符串。 (模板)
- delimiter ( string ) - 分隔符标记键层次结构。 (模板)
aws_conn_id ( string ) - 连接到S3存储时使用的连接ID。
|
| —- | —- |
Example:
以下运算符将列出data
存储区中S3 customers/2018/04/
key的所有文件(不包括子文件夹)。
s3_file = S3ListOperator (
task_id = 'list_3s_files' ,
bucket = 'data' ,
prefix = 'customers/2018/04/' ,
delimiter = '/' ,
aws_conn_id = 'aws_customers_conn'
)
S3ToGoogleCloudStorageOperator
class airflow.contrib.operators.s3_to_gcs_operator.S3ToGoogleCloudStorageOperator(bucket, prefix='', delimiter='', aws_conn_id='aws_default', dest_gcs_conn_id=None, dest_gcs=None, delegate_to=None, replace=False, *args, **kwargs)
基础: airflow.contrib.operators.s3_list_operator.S3ListOperator
将S3密钥(可能是前缀)与Google云端存储目标路径同步。
| 参数: |
- bucket ( string ) - S3存储桶在哪里找到对象。 (模板)
- prefix ( string ) - 前缀字符串,用于过滤名称以此前缀开头的对象。 (模板)
- delimiter ( string ) - 分隔符标记键层次结构。 (模板)
- aws_conn_id ( string ) - 源S3连接
- dest_gcs_conn_id ( 字符串 ) - 连接到Google云端存储时要使用的目标连接ID。
- dest_gcs ( 字符串 ) - 要存储文件的目标Google云端存储分区和前缀。 (模板)
- delegate_to ( string ) - 模拟的帐户(如果有)。 为此,发出请求的服务帐户必须启用域范围委派。
replace ( bool ) - 是否要替换现有目标文件。
|
| —- | —- |
示例 :.. code-block :: python
s3_to_gcs_op = S3ToGoogleCloudStorageOperator(
task_id =’s3_to_gcs_example’,bucket =’my-s3-bucket’,prefix =’data / customers-201804’,dest_gcs_conn_id =’google_cloud_default’,dest_gcs =’gs://my.gcs.bucket/some/customers/‘ ,replace = False,dag = my-dag)
请注意, bucket
, prefix
, delimiter
和dest_gcs
是模板化的,因此如果您愿意,可以在其中使用变量。
S3ToHiveTransfer
class airflow.operators.s3_to_hive_operator.S3ToHiveTransfer(s3_key, field_dict, hive_table, delimiter=', ', create=True, recreate=False, partition=None, headers=False, check_headers=False, wildcard_match=False, aws_conn_id='aws_default', hive_cli_conn_id='hive_cli_default', input_compressed=False, tblproperties=None, select_expression=None, *args, **kwargs)
基础: airflow.models.BaseOperator
将数据从S3移动到Hive。 操作员从S3下载文件,在将文件加载到Hive表之前将其存储在本地。 如果create
或recreate
参数设置为True
,则会生成CREATE TABLE
和DROP TABLE
语句。 Hive数据类型是从游标的元数据中推断出来的。
请注意,Hive中生成的表使用STORED AS textfile
,这不是最有效的序列化格式。 如果加载了大量数据和/或表格被大量查询,您可能只想使用此运算符将数据暂存到临时表中,然后使用HiveOperator
将其加载到最终目标中。
| 参数: |
- s3_key ( str ) - 从S3检索的密钥。 (模板)
- field_dict ( dict ) - 字段的字典在文件中命名为键,其Hive类型为值
- hive_table ( str ) - 目标Hive表,使用点表示法来定位特定数据库。 (模板)
- create ( bool ) - 是否创建表,如果它不存在
- recreate ( bool ) - 是否在每次执行时删除并重新创建表
- partition ( dict ) - 将目标分区作为分区列和值的字典。 (模板)
- headers ( bool ) - 文件是否包含第一行的列名
- check_headers ( bool ) - 是否应该根据field_dict的键检查第一行的列名
- wildcard_match ( bool ) - 是否应将s3_key解释为Unix通配符模式
- delimiter ( str ) - 文件中的字段分隔符
- aws_conn_id ( str ) - 源s3连接
- hive_cli_conn_id ( str ) - 目标配置单元连接
- input_compressed ( bool ) - 布尔值,用于确定是否需要文件解压缩来处理标头
- tblproperties ( dict ) - 正在创建的hive表的TBLPROPERTIES
select_expression ( str ) - S3选择表达式
|
| —- | —- |
AWS EC2容器服务
- ECSOperator :在AWS EC2容器服务上执行任务。
ECSOperator
class airflow.contrib.operators.ecs_operator.ECSOperator(task_definition, cluster, overrides, aws_conn_id=None, region_name=None, launch_type='EC2', **kwargs)
基础: airflow.models.BaseOperator
在AWS EC2 Container Service上执行任务
| 参数: |
- task_definition ( str ) - EC2容器服务上的任务定义名称
- cluster ( str ) - EC2 Container Service上的群集名称
- aws_conn_id ( str ) - AWS凭证/区域名称的连接ID。 如果为None,将使用凭证boto3策略( http://boto3.readthedocs.io/en/latest/guide/configuration.html )。
- region_name - 要在AWS Hook中使用的区域名称。 覆盖连接中的region_name(如果提供)
launch_type - 运行任务的启动类型(’EC2’或’FARGATE’)
|
| —- | —- |
| 帕拉姆: | 覆盖:boto3将接收的相同参数(模板化): http ://boto3.readthedocs.org/en/latest/reference/services/ecs.html#ECS.Client.run_task |
| —- | —- |
| 类型: | 覆盖:dict |
| —- | —- |
| 类型: | launch_type:str |
| —- | —- |
AWS Batch Service
- AWSBatchOperator :在AWS Batch Service上执行任务。
AWSBatchOperator
class airflow.contrib.operators.awsbatch_operator.AWSBatchOperator(job_name, job_definition, job_queue, overrides, max_retries=4200, aws_conn_id=None, region_name=None, **kwargs)
基础: airflow.models.BaseOperator
在AWS Batch Service上执行作业
| 参数: |
- job_name ( str ) - 将在AWS Batch上运行的作业的名称
- job_definition ( str ) - AWS Batch上的作业定义名称
- job_queue ( str ) - AWS Batch上的队列名称
- max_retries ( int ) - 服务器未合并时的指数退避重试,4200 = 48小时
- aws_conn_id ( str ) - AWS凭证/区域名称的连接ID。 如果为None,将使用凭证boto3策略( http://boto3.readthedocs.io/en/latest/guide/configuration.html )。
region_name - 要在AWS Hook中使用的区域名称。 覆盖连接中的region_name(如果提供)
|
| —- | —- |
| 帕拉姆: | 覆盖:boto3将在containerOverrides上接收的相同参数(模板化): http ://boto3.readthedocs.io/en/latest/reference/services/batch.html#submit_job |
| —- | —- |
| 类型: | 覆盖:dict |
| —- | —- |
AWS RedShift
- AwsRedshiftClusterSensor :等待Redshift群集达到特定状态。
- RedshiftHook :使用boto3库与AWS Redshift交互。
- RedshiftToS3Transfer :对带有或不带标头的CSV执行卸载命令。
- S3ToRedshiftTransfer :从S3执行复制命令为CSV,带或不带标题。
AwsRedshiftClusterSensor
class airflow.contrib.sensors.aws_redshift_cluster_sensor.AwsRedshiftClusterSensor(cluster_identifier, target_status='available', aws_conn_id='aws_default', *args, **kwargs)
基础: airflow.sensors.base_sensor_operator.BaseSensorOperator
等待Redshift群集达到特定状态。
| 参数: |
- cluster_identifier ( str ) - 要ping的集群的标识符。
target_status ( str ) - 所需的集群状态。
|
| —- | —- |
poke(context)
传感器在派生此类时定义的功能应该覆盖。
RedshiftHook
class airflow.contrib.hooks.redshift_hook.RedshiftHook(aws_conn_id='aws_default')
基地: airflow.contrib.hooks.aws_hook.AwsHook
使用boto3库与AWS Redshift交互
cluster_status(cluster_identifier)
返回群集的状态
| 参数: | cluster_identifier ( str ) - 集群的唯一标识符 |
| —- | —- |
create_cluster_snapshot(snapshot_identifier, cluster_identifier)
创建群集的快照
| 参数: |
- snapshot_identifier ( str ) - 群集快照的唯一标识符
cluster_identifier ( str ) - 集群的唯一标识符
|
| —- | —- |
delete_cluster(cluster_identifier, skip_final_cluster_snapshot=True, final_cluster_snapshot_identifier='')
删除群集并可选择创建快照
| 参数: |
- cluster_identifier ( str ) - 集群的唯一标识符
- skip_final_cluster_snapshot ( bool ) - 确定群集快照创建
final_cluster_snapshot_identifier ( str ) - 最终集群快照的名称
|
| —- | —- |
describe_cluster_snapshots(cluster_identifier)
获取群集的快照列表
| 参数: | cluster_identifier ( str ) - 集群的唯一标识符 |
| —- | —- |
restore_from_cluster_snapshot(cluster_identifier, snapshot_identifier)
从其快照还原群集
| 参数: |
- cluster_identifier ( str ) - 集群的唯一标识符
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>snapshot_identifier</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>str</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 群集快照的唯一标识符</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>RedshiftToS3Transfer</font></font>
<font style="vertical-align: inherit;">class airflow.operators.redshift_to_s3_operator.RedshiftToS3Transfer(schema,table,s3_bucket,s3_key,redshift_conn_id ='redshift_default',aws_conn_id ='aws_default',unload_options =(),autocommit = False,parameters = None,include_header = False,* args,* * kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>执行UNLOAD命令,将s3作为带标题的CSV</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对redshift数据库中特定模式的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对redshift数据库中特定表的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>s3_bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定S3存储桶的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>s3_key</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定S3密钥的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>redshift_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定redshift数据库的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>aws_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定S3连接的引用</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>unload_options</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对UNLOAD选项列表的引用</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>S3ToRedshiftTransfer</font></font>
<font style="vertical-align: inherit;">class airflow.operators.s3_to_redshift_operator.S3ToRedshiftTransfer(schema,table,s3_bucket,s3_key,redshift_conn_id ='redshift_default',aws_conn_id ='aws_default',copy_options =(),autocommit = False,parameters = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>执行COPY命令将文件从s3加载到Redshift</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对redshift数据库中特定模式的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对redshift数据库中特定表的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>s3_bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定S3存储桶的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>s3_key</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定S3密钥的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>redshift_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定redshift数据库的引用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>aws_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定S3连接的引用</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>copy_options</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对COPY选项列表的引用</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Databricks</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Databricks</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>贡献了一个Airflow运算符,可以将运行提交到Databricks平台。</font><font style=”vertical-align: inherit;”>在运营商内部与</font></font>api/2.0/jobs/runs/submit
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>端点进行通信</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DatabricksSubmitRunOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.databricks_operator.DatabricksSubmitRunOperator(json = None,spark_jar_task = None,notebook_task = None,new_cluster = None,existing_cluster_id = None,libraries = None,run_name = None,timeout_seconds = None,databricks_conn_id ='databricks_default',polling_period_seconds = 30,databricks_retry_limit = 3,do_xcom_push = False,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>使用</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>api / 2.0 / jobs / runs / submit</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>API端点</font><font style=”vertical-align: inherit;”>向Databricks提交Spark作业运行</font><font style=”vertical-align: inherit;”>。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有两种方法可以实例化此运算符。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在第一种方式,你可以把你通常用它来调用的JSON有效载荷</font></font>api/2.0/jobs/runs/submit
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>端点并将其直接传递到我们</font></font>DatabricksSubmitRunOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>通过</font></font>json
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数。</font></font>例如
json = {
'new_cluster' : {
'spark_version' : '2.1.0-db3-scala2.11' ,
'num_workers' : 2
},
'notebook_task' : {
'notebook_path' : '/Users/airflow@example.com/PrepareData' ,
},
}
notebook_run = DatabricksSubmitRunOperator ( task_id = 'notebook_run' , json = json )
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>另一种完成同样事情的方法是直接使用命名参数</font></font>DatabricksSubmitRunOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>请注意,</font></font>runs/submit
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>端点</font><font style=”vertical-align: inherit;”>中的每个顶级参数都只有一个命名参数</font><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>在此方法中,您的代码如下所示:</font></font>
new_cluster = {
'spark_version' : '2.1.0-db3-scala2.11' ,
'num_workers' : 2
}
notebook_task = {
'notebook_path' : '/Users/airflow@example.com/PrepareData' ,
}
notebook_run = DatabricksSubmitRunOperator (
task_id = 'notebook_run' ,
new_cluster = new_cluster ,
notebook_task = notebook_task )
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在</font><font style=”vertical-align: inherit;”>提供</font><font style=”vertical-align: inherit;”>json参数</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>和</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>命名参数</font><font style=”vertical-align: inherit;”>的情况下</font><font style=”vertical-align: inherit;”>,它们将合并在一起。</font><font style=”vertical-align: inherit;”>如果在合并期间存在冲突,则命名参数将优先并覆盖顶级</font></font>json
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>键。</font></font>
<font style="vertical-align: inherit;">目前DatabricksSubmitRunOperator支持的命名参数是</font>
spark_jar_task
notebook_task
new_cluster
existing_cluster_id
libraries
run_name
timeout_seconds
| 参数: |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>json</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>包含API参数的JSON对象,将直接传递给</font></font>
api/2.0/jobs/runs/submit
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>端点。</font><font style=”vertical-align: inherit;”>其他命名参数(即</font></font>spark_jar_task
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,</font></font>notebook_task
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>..)到该运营商将与此JSON字典合并如果提供他们。</font><font style=”vertical-align: inherit;”>如果在合并期间存在冲突,则命名参数将优先并覆盖顶级json键。</font><font style=”vertical-align: inherit;”>(模板)</font></font>也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有关模板的更多信息,请参阅</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Jinja模板</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://docs.databricks.com/api/latest/jobs.html#runs-submit</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>spark_jar_task</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>JAR任务的主要类和参数。</font><font style=”vertical-align: inherit;”>请注意,实际的JAR在</font></font>
libraries
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。中</font><font style=”vertical-align: inherit;”>指定</font><font style=”vertical-align: inherit;”>。</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>无论是</font></font>spark_jar_task
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>或</font></font>notebook_task
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>应符合规定。</font><font style=”vertical-align: inherit;”>该字段将被模板化。</font></font>也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>notebook_task</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>笔记本任务的笔记本路径和参数。</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>无论是</font></font>
spark_jar_task
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>或</font></font>notebook_task
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>应符合规定。</font><font style=”vertical-align: inherit;”>该字段将被模板化。</font></font>也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>new_cluster</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将在其上运行此任务的新群集的规范。</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>无论是</font></font>
new_cluster
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>或</font></font>existing_cluster_id
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>应符合规定。</font><font style=”vertical-align: inherit;”>该字段将被模板化。</font></font>也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>existing_cluster_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要运行此任务的现有集群的ID。</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>无论是</font></font>
new_cluster
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>或</font></font>existing_cluster_id
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>应符合规定。</font><font style=”vertical-align: inherit;”>该字段将被模板化。</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>图书馆</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dicts列表</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>这个运行的库将使用。</font><font style=”vertical-align: inherit;”>该字段将被模板化。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>run_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于此任务的运行名称。</font><font style=”vertical-align: inherit;”>默认情况下,这将设置为Airflow</font> </font>
task_id
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>这</font></font>task_id
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>是超类的必需参数</font></font>BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>该字段将被模板化。</font></font>- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>timeout_seconds</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int32</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 此次运行的超时。</font><font style=”vertical-align: inherit;”>默认情况下,使用值0表示没有超时。</font><font style=”vertical-align: inherit;”>该字段将被模板化。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>databricks_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要使用的Airflow连接的名称。</font><font style=”vertical-align: inherit;”>默认情况下,在常见情况下,这将是</font></font>
databricks_default
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>要使用基于令牌的身份验证,请</font></font>token
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在连接的额外字段中</font><font style=”vertical-align: inherit;”>提供密钥</font><font style=”vertical-align: inherit;”>。</font></font> - <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>polling_period_seconds</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 控制我们轮询此运行结果的速率。</font><font style=”vertical-align: inherit;”>默认情况下,操作员每30秒轮询一次。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>databricks_retry_limit</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果Databricks后端无法访问,则重试的次数。</font><font style=”vertical-align: inherit;”>其值必须大于或等于1。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>do_xcom_push</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>boolean</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 我们是否应该将run_id和run_page_url推送到xcom。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GCP:Google云端平台</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Airflow广泛支持Google Cloud Platform。</font><font style=”vertical-align: inherit;”>但请注意,大多数Hooks和Operators都在contrib部分。</font><font style=”vertical-align: inherit;”>这意味着他们具有</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>beta</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>状态,这意味着他们可以在次要版本之间进行重大更改。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>请参阅</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GCP连接类型</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>文档以配置与GCP的连接。</font></font>
记录
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>可以将Airflow配置为在Google云端存储中读取和写入任务日志。</font><font style=”vertical-align: inherit;”>请参阅</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将日志写入Google云端存储</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
BigQuery的
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQuery运算符</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryCheckOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:对SQL查询执行检查,该查询将返回具有不同值的单行。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryValueCheckOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:使用SQL代码执行简单的值检查。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryIntervalCheckOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:检查作为SQL表达式给出的度量值是否在days_back之前的某个容差范围内。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryCreateEmptyTableOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在指定的BigQuery数据集中创建一个新的空表,可选择使用模式。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryCreateExternalTableOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:使用Google Cloud Storage中的数据在数据集中创建新的外部表。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryDeleteDatasetOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:删除现有的BigQuery数据集。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在特定的BigQuery数据库中执行BigQuery SQL查询。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryToBigQueryOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:将BigQuery表复制到另一个BigQuery表。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryToCloudStorageOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:将BigQuery表传输到Google Cloud Storage存储桶</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryCheckOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_check_operator.BigQueryCheckOperator(sql,bigquery_conn_id ='bigquery_default',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.operators.check_operator.CheckOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>对BigQuery执行检查。</font><font style=”vertical-align: inherit;”>该</font></font>BigQueryCheckOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>预期的SQL查询将返回一行。</font><font style=”vertical-align: inherit;”>使用python</font> </font>bool
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>强制转换</font><font style=”vertical-align: inherit;”>评估第一行的每个值</font><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>如果任何值返回,</font></font>False
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>则检查失败并输出错误。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>请注意,Python bool强制转换如下</font></font>False
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:</font></font>
False
0
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>空字符串(</font></font>
""
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>)</font></font> - <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>空列表(</font></font>
[]
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>)</font></font> - <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>空字典或集(</font></font>
{}
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>)</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>给定一个查询</font><font style=”vertical-align: inherit;”>,它只会在计数时失败</font><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>您可以制作更复杂的查询,例如,可以检查表与上游源表的行数相同,或者今天的分区计数大于昨天的分区,或者一组指标是否更少7天平均值超过3个标准差。</font></font>SELECT COUNT(*) FROM foo``== 0
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>此运算符可用作管道中的数据质量检查,并且根据您在DAG中的位置,您可以选择停止关键路径,防止发布可疑数据,或者在旁边接收电子邮件替代品阻止DAG的进展。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>sql</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要执行的sql</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bigquery_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对BigQuery数据库的引用</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryValueCheckOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_check_operator.BigQueryValueCheckOperator(sql,pass_value,tolerance = None,bigquery_conn_id ='bigquery_default',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.operators.check_operator.ValueCheckOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>使用sql代码执行简单的值检查。</font></font>
| 参数: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>sql</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要执行的sql</font></font> |
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryIntervalCheckOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_check_operator.BigQueryIntervalCheckOperator(table,metrics_thresholds,date_filter_column ='ds',days_back = -7,bigquery_conn_id ='bigquery_default',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.operators.check_operator.IntervalCheckOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>检查作为SQL表达式给出的度量值是否在days_back之前的某个容差范围内。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>此方法构造一个类似的查询</font></font>
SELECT { metrics_threshold_dict_key } FROM { table }
WHERE { date_filter_column } =< date >
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>str</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 表名</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>days_back</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - ds与我们要检查的ds之间的天数。</font><font style=”vertical-align: inherit;”>默认为7天</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>metrics_threshold</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 由指标索引的比率字典,例如’COUNT(*)’:1.5将需要当前日和之前的days_back之间50%或更小的差异。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryGetDataOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_get_data.BigQueryGetDataOperator(dataset_id,table_id,max_results ='100',selected_fields = None,bigquery_conn_id ='bigquery_default',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>从BigQuery表中获取数据(或者为所选列获取数据)并在python列表中返回数据。</font><font style=”vertical-align: inherit;”>返回列表中的元素数将等于获取的行数。</font><font style=”vertical-align: inherit;”>列表中的每个元素将再次是一个列表,其中元素将表示该行的列值。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>结果示例</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:</font></font>[['Tony', '10'], ['Mike', '20'], ['Steve', '15']]
注意
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果传递的字段</font></font>selected_fields
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>的顺序与BQ表中已有的列的顺序不同,则数据仍将按BQ表的顺序排列。</font><font style=”vertical-align: inherit;”>例如,如果BQ表有3列,</font></font>[A,B,C]
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>并且您传递’B,</font></font>selected_fields
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>那么数据</font><font style=”vertical-align: inherit;”>中的A’</font> <font style=”vertical-align: inherit;”>仍然是表格</font></font>'A,B'
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
示例 :
get_data = BigQueryGetDataOperator (
task_id = 'get_data_from_bq' ,
dataset_id = 'test_dataset' ,
table_id = 'Transaction_partitions' ,
max_results = '100' ,
selected_fields = 'DATE' ,
bigquery_conn_id = 'airflow-service-account'
)
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataset_id</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 请求的表的数据集ID。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>table_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 请求表的表ID。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>max_results</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 从表中获取的最大记录数(行数)。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>selected_fields</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要返回的字段列表(逗号分隔)。</font><font style=”vertical-align: inherit;”>如果未指定,则返回所有字段。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bigquery_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定BigQuery钩子的引用。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryCreateEmptyTableOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_operator.BigQueryCreateEmptyTableOperator(dataset_id,table_id,project_id = None,schema_fields = None,gcs_schema_object = None,time_partitioning = {},bigquery_conn_id ='bigquery_default',google_cloud_storage_conn_id ='google_cloud_default',delegate_to = None,* args ,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在指定的BigQuery数据集中创建一个新的空表,可选择使用模式。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>可以用两种方法之一指定用于BigQuery表的模式。</font><font style=”vertical-align: inherit;”>您可以直接传递架构字段,也可以将运营商指向Google云存储对象名称。</font><font style=”vertical-align: inherit;”>Google云存储中的对象必须是包含架构字段的JSON文件。</font><font style=”vertical-align: inherit;”>您还可以创建没有架构的表。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 将表创建的项目。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataset_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于创建表的数据集。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>table_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要创建的表的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema_fields</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果设置,则此处定义的架构字段列表:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/bigquery/docs/reference/rest/v2/jobs#configuration.load.schema</font></font>
示例 :
schema_fields = [{ "name" : "emp_name" , "type" : "STRING" , "mode" : "REQUIRED" },
{ "name" : "salary" , "type" : "INTEGER" , "mode" : "NULLABLE" }]
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcs_schema_object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 包含模式(模板化)的JSON文件的完整路径。</font><font style=”vertical-align: inherit;”>例如:</font></font>
gs://test-bucket/dir1/dir2/employee_schema.json
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>time_partitioning</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>配置可选的时间分区字段,即按API规范按字段,类型和到期分区。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bigquery_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定BigQuery挂钩的引用。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google_cloud_storage_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定Google云存储挂钩的引用。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>示例(在GCS中使用模式JSON)</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:</font></font>
CreateTable = BigQueryCreateEmptyTableOperator (
task_id = 'BigQueryCreateEmptyTableOperator_task' ,
dataset_id = 'ODS' ,
table_id = 'Employees' ,
project_id = 'internal-gcp-project' ,
gcs_schema_object = 'gs://schema-bucket/employee_schema.json' ,
bigquery_conn_id = 'airflow-service-account' ,
google_cloud_storage_conn_id = 'airflow-service-account'
)
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>对应的Schema文件</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font>employee_schema.json
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>):</font></font>
[
{
"mode" : "NULLABLE" ,
"name" : "emp_name" ,
"type" : "STRING"
},
{
"mode" : "REQUIRED" ,
"name" : "salary" ,
"type" : "INTEGER"
}
]
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>示例(在DAG中使用模式)</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:</font></font>
CreateTable = BigQueryCreateEmptyTableOperator (
task_id = 'BigQueryCreateEmptyTableOperator_task' ,
dataset_id = 'ODS' ,
table_id = 'Employees' ,
project_id = 'internal-gcp-project' ,
schema_fields = [{ "name" : "emp_name" , "type" : "STRING" , "mode" : "REQUIRED" },
{ "name" : "salary" , "type" : "INTEGER" , "mode" : "NULLABLE" }],
bigquery_conn_id = 'airflow-service-account' ,
google_cloud_storage_conn_id = 'airflow-service-account'
)
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryCreateExternalTableOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_operator.BigQueryCreateExternalTableOperator(bucket,source_objects,destination_project_dataset_table,schema_fields = None,schema_object = None,source_format ='CSV',compression ='NONE',skip_leading_rows = 0,field_delimiter =',',max_bad_records = 0 ,quote_character = None,allow_quoted_newlines = False,allow_jagged_rows = False,bigquery_conn_id ='bigquery_default',google_cloud_storage_conn_id ='google_cloud_default',delegate_to = None,src_fmt_configs = {},* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>使用Google云端存储中的数据在数据集中创建新的外部表。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>可以用两种方法之一指定用于BigQuery表的模式。</font><font style=”vertical-align: inherit;”>您可以直接传递架构字段,也可以将运营商指向Google云存储对象名称。</font><font style=”vertical-align: inherit;”>Google云存储中的对象必须是包含架构字段的JSON文件。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 指向外部表的存储桶。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_objects</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 指向表格的Google云存储URI列表。</font><font style=”vertical-align: inherit;”>(模板化)如果source_format是’DATASTORE_BACKUP’,则列表必须只包含一个URI。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_project_dataset_table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于将数据加载到(模板化)的虚线(<project>。)<dataset>。<table> BigQuery表。</font><font style=”vertical-align: inherit;”>如果未包含<project>,则项目将是连接json中定义的项目。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema_fields</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果设置,则此处定义的架构字段列表:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/bigquery/docs/reference/rest/v2/jobs#configuration.load.schema</font></font>
示例 :
schema_fields = [{ "name" : "emp_name" , "type" : "STRING" , "mode" : "REQUIRED" },
{ "name" : "salary" , "type" : "INTEGER" , "mode" : "NULLABLE" }]
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>当source_format为’DATASTORE_BACKUP’时,不应设置。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema_object</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 如果设置,则指向包含表的架构的.json文件的GCS对象路径。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema_object</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 字符串</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_format</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 数据的文件格式。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>compression</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - [可选]数据源的压缩类型。</font><font style=”vertical-align: inherit;”>可能的值包括GZIP和NONE。</font><font style=”vertical-align: inherit;”>默认值为NONE。</font><font style=”vertical-align: inherit;”>Google Cloud Bigtable,Google Cloud Datastore备份和Avro格式会忽略此设置。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>skip_leading_rows</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 从CSV加载时要跳过的行数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>field_delimiter</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于CSV的分隔符。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>max_bad_records</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - BigQuery在运行作业时可以忽略的最大错误记录数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>quote_character</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于引用CSV文件中数据部分的值。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>allow_quoted_newlines</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>boolean</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 是否允许引用的换行符(true)或不允许(false)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>allow_jagged_rows</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bool</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 接受缺少尾随可选列的行。</font><font style=”vertical-align: inherit;”>缺失值被视为空值。</font><font style=”vertical-align: inherit;”>如果为false,则缺少尾随列的记录将被视为错误记录,如果错误记录太多,则会在作业结果中返回无效错误。</font><font style=”vertical-align: inherit;”>仅适用于CSV,忽略其他格式。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bigquery_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定BigQuery挂钩的引用。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google_cloud_storage_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定Google云存储挂钩的引用。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>src_fmt_configs</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 配置特定于源格式的可选字段</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryDeleteDatasetOperator</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_operator.BigQueryOperator(bql = None,sql = None,destination_dataset_table = False,write_disposition ='WRITE_EMPTY',allow_large_results = False,flatten_results = False,bigquery_conn_id ='bigquery_default',delegate_to = None,udf_config = False ,use_legacy_sql = True,maximum_billing_tier = None,maximum_bytes_billed = None,create_disposition ='CREATE_IF_NEEDED',schema_update_options =(),query_params = None,priority ='INTERACTIVE',time_partitioning = {},* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在特定的BigQuery数据库中执行BigQuery SQL查询</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BQL</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>可接收表示SQL语句中的海峡</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>海峡列表</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>SQL语句</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>)</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,或</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参照模板文件模板引用在“.SQL”结束海峡认可。</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - (不推荐使用。</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>SQL</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数代替)要执行的sql代码(模板化)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>SQL</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>可接收表示SQL语句中的海峡</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>海峡列表</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>SQL语句</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>)</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,或</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参照模板文件模板引用在“.SQL”结束海峡认可。</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - SQL代码被执行(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_dataset_table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 一个虚线(<project>。| <project>:)<dataset>。<table>,如果设置,将存储查询结果。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>write_disposition</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 指定目标表已存在时发生的操作。</font><font style=”vertical-align: inherit;”>(默认:’WRITE_EMPTY’)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>create_disposition</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 指定是否允许作业创建新表。</font><font style=”vertical-align: inherit;”>(默认值:’CREATE_IF_NEEDED’)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>allow_large_results</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>boolean</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 是否允许大结果。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>flatten_results</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>boolean</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果为true且查询使用旧版SQL方言,则展平查询结果中的所有嵌套和重复字段。</font></font>
allow_large_results
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>必须是</font></font>true
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果设置为</font></font>false
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>对于标准SQL查询,将忽略此标志,并且结果永远不会展平。</font></font> - <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bigquery_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定BigQuery钩子的引用。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>udf_config</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 查询的用户定义函数配置。</font><font style=”vertical-align: inherit;”>有关</font><font style=”vertical-align: inherit;”>详细信息,</font><font style=”vertical-align: inherit;”>请参阅</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://cloud.google.com/bigquery/user-defined-functions</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>use_legacy_sql</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>boolean</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 是使用旧SQL(true)还是标准SQL(false)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>maximum_billing_tier</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>整数</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用作基本价格乘数的正整数。</font><font style=”vertical-align: inherit;”>默认为None,在这种情况下,它使用项目中设置的值。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>maximum_bytes_billed</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>float</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 限制为此作业计费的字节数。</font><font style=”vertical-align: inherit;”>超出此限制的字节数的查询将失败(不会产生费用)。</font><font style=”vertical-align: inherit;”>如果未指定,则将其设置为项目默认值。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema_update_options</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>tuple</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 允许更新目标表的模式作为加载作业的副作用。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>query_params</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 包含查询参数类型和值的字典,传递给BigQuery。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>priority</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 指定查询的优先级。</font><font style=”vertical-align: inherit;”>可能的值包括INTERACTIVE和BATCH。</font><font style=”vertical-align: inherit;”>默认值为INTERACTIVE。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>time_partitioning</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 配置可选的时间分区字段,即按API规范按字段,类型和到期分区。</font><font style=”vertical-align: inherit;”>请注意,’field’不能与dataset.table $ partition一起使用。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryTableDeleteOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_table_delete_operator.BigQueryTableDeleteOperator(deletion_dataset_table,bigquery_conn_id ='bigquery_default',delegate_to = None,ignore_if_missing = False,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>删除BigQuery表</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>deletion_dataset_table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 一个虚线(<project>。| <project>:)<dataset>。<table>,指示将删除哪个表。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bigquery_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定BigQuery钩子的引用。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>ignore_if_missing</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>boolean</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果为True,则即使请求的表不存在也返回成功。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryToBigQueryOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_to_bigquery.BigQueryToBigQueryOperator(source_project_dataset_tables,destination_project_dataset_table,write_disposition ='WRITE_EMPTY',create_disposition ='CREATE_IF_NEEDED',bigquery_conn_id ='bigquery_default',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将数据从一个BigQuery表复制到另一个。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有关这些参数的详细信息,请访问:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/bigquery/docs/reference/v2/jobs#configuration.copy</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_project_dataset_tables</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list | string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 一个或多个点(项目:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>|</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>项目。)<dataset>。<table>用作源数据的BigQuery表。</font><font style=”vertical-align: inherit;”>如果未包含<project>,则项目将是连接json中定义的项目。</font><font style=”vertical-align: inherit;”>如果有多个源表,请使用列表。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_project_dataset_table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 目标BigQuery表。</font><font style=”vertical-align: inherit;”>格式为:(project:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>|</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>project。)<dataset>。<table>(模板化)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>write_disposition</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 表已存在时的写处置。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>create_disposition</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果表不存在,则创建处置。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bigquery_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定BigQuery钩子的引用。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryToCloudStorageOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.bigquery_to_gcs.BigQueryToCloudStorageOperator(source_project_dataset_table,destination_cloud_storage_uris,compression ='NONE',export_format ='CSV',field_delimiter =',',print_header = True,bigquery_conn_id ='bigquery_default',delegate_to = None,* args, ** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将BigQuery表传输到Google Cloud Storage存储桶。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有关这些参数的详细信息,请访问:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/bigquery/docs/reference/v2/jobs</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_project_dataset_table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用作源数据的虚线(<project>。| <project>:)<dataset>。<table> BigQuery表。</font><font style=”vertical-align: inherit;”>如果未包含<project>,则项目将是连接json中定义的项目。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_cloud_storage_uris</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 目标Google云端存储URI(例如gs://some-bucket/some-file.txt)。</font><font style=”vertical-align: inherit;”>(模板化)遵循此处定义的惯例:https://cloud.google.com/bigquery/exporting-data-from-bigquery#exportingmultiple</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>compression</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要使用的压缩类型。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>export_format</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 要导出的文件格式。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>field_delimiter</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 提取到CSV时使用的分隔符。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>print_header</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>boolean</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 是否打印CSV文件提取的标头。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bigquery_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定BigQuery钩子的引用。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>BigQueryHook</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.hooks.bigquery_hook.BigQueryHook(bigquery_conn_id ='bigquery_default',delegate_to = None,use_legacy_sql = True)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font></font>airflow.contrib.hooks.gcp_api_base_hook.GoogleCloudBaseHook
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,</font></font>airflow.hooks.dbapi_hook.DbApiHook
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,</font></font>airflow.utils.log.logging_mixin.LoggingMixin
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>与BigQuery交互。</font><font style=”vertical-align: inherit;”>此挂钩使用Google Cloud Platform连接。</font></font>
<font style="vertical-align: inherit;">get_conn()</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>返回BigQuery PEP 249连接对象。</font></font>
<font style="vertical-align: inherit;">get_pandas_df(sql,parameters = None,dialect = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>返回BigQuery查询生成的结果的Pandas DataFrame。</font><font style=”vertical-align: inherit;”>必须重写DbApiHook方法,因为Pandas不支持PEP 249连接,但SQLite除外。</font></font>看到:
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://github.com/pydata/pandas/blob/master/pandas/io/sql.py#L447</font> </font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://github.com/pydata/pandas/issues/6900</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>sql</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要执行的BigQuery SQL。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>映射</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>或</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>可迭代</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于呈现SQL查询的参数(未使用,请保留覆盖超类方法)</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dialect</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>{‘legacy’</font> </font>__<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>’standard’}中的</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font><font style=”vertical-align: inherit;”>) - BigQuery SQL的方言 - 遗留SQL或标准SQL默认使用</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>self.use_legacy_sql(</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果未指定)</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">get_service()</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>返回一个BigQuery服务对象。</font></font>
<font style="vertical-align: inherit;">insert_rows(table,rows,target_fields = None,commit_every = 1000)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>目前不支持插入。</font><font style=”vertical-align: inherit;”>从理论上讲,您可以使用BigQuery的流API将行插入表中,但这尚未实现。</font></font>
<font style="vertical-align: inherit;">table_exists(project_id,dataset_id,table_id)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>检查Google BigQuery中是否存在表格。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要在其中查找表的Google云项目。</font><font style=”vertical-align: inherit;”>提供给钩子的连接必须提供对指定项目的访问。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataset_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要在其中查找表的数据集的名称。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>table_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要检查的表的名称。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>云DataFlow</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlow运算符</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlowJavaOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:启动用Java编写的Cloud Dataflow作业。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataflowTemplateOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:启动模板化的Cloud DataFlow批处理作业。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlowPythonOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:启动用python编写的Cloud Dataflow作业。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlowJavaOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataflow_operator.DataFlowJavaOperator(jar,dataflow_default_options = None,options = None,gcp_conn_id ='google_cloud_default',delegate_to = None,poll_sleep = 10,job_class = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>启动Java Cloud DataFlow批处理作业。</font><font style=”vertical-align: inherit;”>操作的参数将传递给作业。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在dag的defaultargs中定义dataflow *参数是一个很好的做法,例如项目,区域和分段位置。</font></font>
default_args = {
'dataflow_default_options' : {
'project' : 'my-gcp-project' ,
'zone' : 'europe-west1-d' ,
'stagingLocation' : 'gs://my-staging-bucket/staging/'
}
}
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>您需要使用</font></font>jar
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数</font><font style=”vertical-align: inherit;”>将路径作为文件引用传递给数据流</font><font style=”vertical-align: inherit;”>,jar需要是一个自动执行的jar(请参阅以下文档:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:</font><font style=”vertical-align: inherit;”>//beam.apache.org/documentation/runners/dataflow/#self-执行jar</font><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>使用</font></font>options
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>转嫁选项你的工作。</font></font>
t1 = DataFlowOperation (
task_id = 'datapflow_example' ,
jar = '{{var.value.gcp_dataflow_base}}pipeline/build/libs/pipeline-example-1.0.jar' ,
options = {
'autoscalingAlgorithm' : 'BASIC' ,
'maxNumWorkers' : '50' ,
'start' : '{{ds}}' ,
'partitionType' : 'DAY' ,
'labels' : { 'foo' : 'bar' }
},
gcp_conn_id = 'gcp-airflow-service-account' ,
dag = my - dag )
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>这两个</font></font>jar
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>和</font></font>options
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>模板化,所以你可以在其中使用变量。</font></font>
default_args = {
'owner' : 'airflow' ,
'depends_on_past' : False ,
'start_date' :
( 2016 , 8 , 1 ),
'email' : [ 'alex@vanboxel.be' ],
'email_on_failure' : False ,
'email_on_retry' : False ,
'retries' : 1 ,
'retry_delay' : timedelta ( minutes = 30 ),
'dataflow_default_options' : {
'project' : 'my-gcp-project' ,
'zone' : 'us-central1-f' ,
'stagingLocation' : 'gs://bucket/tmp/dataflow/staging/' ,
}
}
dag = DAG ( 'test-dag' , default_args = default_args )
task = DataFlowJavaOperator (
gcp_conn_id = 'gcp_default' ,
task_id = 'normalize-cal' ,
jar = '{{var.value.gcp_dataflow_base}}pipeline-ingress-cal-normalize-1.0.jar' ,
options = {
'autoscalingAlgorithm' : 'BASIC' ,
'maxNumWorkers' : '50' ,
'start' : '{{ds}}' ,
'partitionType' : 'DAY'
},
dag = dag )
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataflowTemplateOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataflow_operator.DataflowTemplateOperator(template,dataflow_default_options = None,parameters = None,gcp_conn_id ='google_cloud_default',delegate_to = None,poll_sleep = 10,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>启动模板化云DataFlow批处理作业。</font><font style=”vertical-align: inherit;”>操作的参数将传递给作业。</font><font style=”vertical-align: inherit;”>在dag的defaultargs中定义dataflow *参数是一个很好的做法,例如项目,区域和分段位置。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://cloud.google.com/dataflow/docs/reference/rest/v1b3/LaunchTemplateParameters</font> </font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://cloud.google.com/dataflow/docs/reference/rest/v1b3/RuntimeEnvironment</font></font>
default_args = {
'dataflow_default_options' : {
'project' : 'my-gcp-project'
'zone' : 'europe-west1-d' ,
'tempLocation' : 'gs://my-staging-bucket/staging/'
}
}
}
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>您需要将路径作为带</font></font>template
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数</font><font style=”vertical-align: inherit;”>的文件引用传递给数据流模板</font><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>使用</font></font>parameters
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>来传递参数给你的工作。</font><font style=”vertical-align: inherit;”>使用</font></font>environment
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>对运行环境变量传递给你的工作。</font></font>
t1 = DataflowTemplateOperator (
task_id = 'datapflow_example' ,
template = '{{var.value.gcp_dataflow_base}}' ,
parameters = {
'inputFile' : "gs://bucket/input/my_input.txt" ,
'outputFile' : "gs://bucket/output/my_output.txt"
},
gcp_conn_id = 'gcp-airflow-service-account' ,
dag = my - dag )
template
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,</font></font>dataflow_default_options
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>并且</font></font>parameters
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>是模板化的,因此您可以在其中使用变量。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlowPythonOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataflow_operator.DataFlowPythonOperator(py_file,py_options = None,dataflow_default_options = None,options = None,gcp_conn_id ='google_cloud_default',delegate_to = None,poll_sleep = 10,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style="vertical-align: inherit;">执行(上下文)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>执行python数据流作业。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataFlowHook</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.hooks.gcp_dataflow_hook.DataFlowHook(gcp_conn_id ='google_cloud_default',delegate_to = None,poll_sleep = 10)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.contrib.hooks.gcp_api_base_hook.GoogleCloudBaseHook
<font style="vertical-align: inherit;">get_conn()</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>返回Google云端存储服务对象。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Cloud DataProc</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProc运算符</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocClusterCreateOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Google Cloud Dataproc上创建新群集。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocClusterDeleteOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:删除Google Cloud Dataproc上的群集。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocClusterScaleOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Google Cloud Dataproc上向上或向下扩展群集。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcPigOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Cloud DataProc集群上启动Pig查询作业。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcHiveOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Cloud DataProc群集上启动Hive查询作业。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcSparkSqlOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Cloud DataProc集群上启动Spark SQL查询作业。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcSparkOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Cloud DataProc集群上启动Spark作业。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcHadoopOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Cloud DataProc集群上启动Hadoop作业。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcPySparkOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Cloud DataProc群集上启动PySpark作业。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocWorkflowTemplateInstantiateOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Google Cloud Dataproc上实例化WorkflowTemplate。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocWorkflowTemplateInstantiateInlineOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Google Cloud Dataproc上实例化WorkflowTemplate内联。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocClusterCreateOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataprocClusterCreateOperator(cluster_name,project_id,num_workers,zone,network_uri = None,subnetwork_uri = None,internal_ip_only = None,tags = None,storage_bucket = None,init_actions_uris = None,init_action_timeout ='10m',metadata =无,image_version =无,属性=无,master_machine_type ='n1-standard-4',master_disk_size = 500,worker_machine_type ='n1-standard-4',worker_disk_size = 500,num_preemptible_workers = 0,labels = None,region =' global',gcp_conn_id ='google_cloud_default',delegate_to = None,service_account = None,service_account_scopes = None,idle_delete_ttl = None,auto_delete_time = None,auto_delete_ttl = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Google Cloud Dataproc上创建新群集。</font><font style=”vertical-align: inherit;”>操作员将等待创建成功或创建过程中发生错误。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数允许配置群集。</font><font style=”vertical-align: inherit;”>请参阅</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有关不同参数的详细说明。</font><font style=”vertical-align: inherit;”>链接中详述的大多数配置参数都可作为此运算符的参数。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要创建的DataProc集群的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于创建集群的Google云项目的ID。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>num_workers</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 旋转的工人数量</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>storage_bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要使用的存储桶,设置为None允许dataproc为您生成自定义存储桶</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>init_actions_uris</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font> </font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>[</font> </font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font> </font>__<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>]</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 包含数据空间初始化脚本的GCS uri列表</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>init_action_timeout</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - init_actions_uris中可执行脚本必须完成的时间</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>元数据</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字典</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要添加到所有实例的键值google计算引擎元数据条目的字典</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>image_version</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - Dataproc集群内的软件版本</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>属性</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字典</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -性能上的配置文件设置的字典(如火花defaults.conf),见</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://cloud.google.com/dataproc/docs/reference/rest/v1/</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>projects.regions.clusters#SoftwareConfig</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>master_machine_type</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 计算要用于主节点的引擎机器类型</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>master_disk_size</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 主节点的磁盘大小</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>worker_machine_type</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 计算要用于工作节点的引擎计算机类型</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>worker_disk_size</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 工作节点的磁盘大小</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>num_preemptible_workers</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要旋转的可抢占工作节点数</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>labels</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要添加到集群的标签的字典</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>zone</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 群集所在的区域。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>network_uri</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于机器通信的网络uri,不能用subnetwork_uri指定</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>subnetwork_uri</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 无法使用network_uri指定要用于机器通信的子网uri</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>internal_ip_only</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bool</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果为true,则群集中的所有实例将只具有内部IP地址。</font><font style=”vertical-align: inherit;”>这只能为启用子网的网络启用</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>tags</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font> </font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>[</font> </font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font> </font>__<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>]</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要添加到所有实例的GCE标记</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>地区</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 作为’全球’留下,可能在未来变得相关。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>service_account</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - dataproc实例的服务帐户。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>service_account_scopes</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font> </font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>[</font> </font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font> </font>__<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>]</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要包含的服务帐户范围的URI。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>idle_delete_ttl</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 群集在保持空闲状态时保持活动状态的最长持续时间。</font><font style=”vertical-align: inherit;”>通过此阈值将导致群集被自动删除。</font><font style=”vertical-align: inherit;”>持续时间(秒)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>auto_delete_time</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>datetime.datetime</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 自动删除群集的时间。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>auto_delete_ttl</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 群集的生命周期,群集将在此持续时间结束时自动删除。</font><font style=”vertical-align: inherit;”>持续时间(秒)。</font><font style=”vertical-align: inherit;”>(如果设置了auto_delete_time,则将忽略此参数)</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocClusterScaleOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataprocClusterScaleOperator(cluster_name,project_id,region ='global',gcp_conn_id ='google_cloud_default',delegate_to = None,num_workers = 2,num_preemptible_workers = 0,graceful_decommission_timeout = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Google Cloud Dataproc上进行扩展,向上或向下扩展。</font><font style=”vertical-align: inherit;”>操作员将等待,直到重新调整群集。</font></font>
示例 :
task_id =’dataproc_scale’,project_id =’my-project’,cluster_name =’cluster-1’,num_workers = 10,num_preemptible_workers = 10,graceful_decommission_timeout =’1h’dag = dag)
<font style="vertical-align: inherit;">t1 = DataprocClusterScaleOperator(</font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有关扩展群集的更多详细信息,请参阅以下参考:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/dataproc/docs/concepts/configuring-clusters/scaling-clusters</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要扩展的集群的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 群集运行的Google云项目的ID。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 数据通路簇的区域。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>num_workers</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 新的工人数量</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>num_preemptible_workers</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 新的可抢占工人数量</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>graceful_decommission_timeout</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 优雅的YARN decomissioning超时。</font><font style=”vertical-align: inherit;”>最大值为1d</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocClusterDeleteOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataprocClusterDeleteOperator(cluster_name,project_id,region ='global',gcp_conn_id ='google_cloud_default',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>删除Google Cloud Dataproc上的群集。</font><font style=”vertical-align: inherit;”>操作员将等待,直到群集被销毁。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要创建的集群的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 群集运行的Google云项目的ID。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 保留为“全局”,将来可能会变得相关。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcPigOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataProcPigOperator(query = None,query_uri = None,variables = None,job_name ='{{task.task_id}} _ {{ds_nodash}}',cluster_name ='cluster-1',dataproc_pig_properties =无,dataproc_pig_jars =无,gcp_conn_id ='google_cloud_default',delegate_to =无,region ='全局',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Cloud DataProc群集上启动Pig查询作业。</font><font style=”vertical-align: inherit;”>操作的参数将传递给集群。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在dag的defaultargs中定义dataproc *参数是一种很好的做法,比如集群名称和UDF。</font></font>
default_args = {
'cluster_name' : 'cluster-1' ,
'dataproc_pig_jars' : [
'gs://example/udf/jar/datafu/1.2.0/datafu.jar' ,
'gs://example/udf/jar/gpig/1.2/gpig.jar'
]
}
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>您可以将pig脚本作为字符串或文件引用传递。</font><font style=”vertical-align: inherit;”>使用变量传递要在群集上解析的pig脚本的变量,或者使用要在脚本中解析的参数作为模板参数。</font></font>
示例 :
t1 = DataProcPigOperator (
task_id = 'dataproc_pig' ,
query = 'a_pig_script.pig' ,
variables = { 'out' : 'gs://example/output/{{ds}}' },
dag = dag )
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有关工作提交的更多详细信息,请参阅以下参考:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/dataproc/reference/rest/v1/projects.regions.jobs</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>query</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对查询文件的查询或引用(pg或pig扩展)。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>query_uri</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 云存储上的猪脚本的uri。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>variables</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 查询的命名参数的映射。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>job_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群中使用的作业名称。</font><font style=”vertical-align: inherit;”>默认情况下,此名称是附加执行数据的task_id,但可以进行模板化。</font><font style=”vertical-align: inherit;”>该名称将始终附加一个随机数,以避免名称冲突。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_pig_properties</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - Pig属性的映射。</font><font style=”vertical-align: inherit;”>非常适合放入默认参数</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_pig_jars</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 在云存储中配置的jars的URI(例如:用于UDF和lib),非常适合放入默认参数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 创建数据加载集群的指定区域。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcHiveOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataProcHiveOperator(query = None,query_uri = None,variables = None,job_name ='{{task.task_id}} _ {{ds_nodash}}',cluster_name ='cluster-1',dataproc_hive_properties =无,dataproc_hive_jars =无,gcp_conn_id ='google_cloud_default',delegate_to =无,region ='全局',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Cloud DataProc群集上启动Hive查询作业。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>query</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 查询或对查询文件的引用(q扩展名)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>query_uri</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 云存储上的hive脚本的uri。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>variables</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 查询的命名参数的映射。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>job_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群中使用的作业名称。</font><font style=”vertical-align: inherit;”>默认情况下,此名称是附加执行数据的task_id,但可以进行模板化。</font><font style=”vertical-align: inherit;”>该名称将始终附加一个随机数,以避免名称冲突。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群的名称。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_hive_properties</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - Pig属性的映射。</font><font style=”vertical-align: inherit;”>非常适合放入默认参数</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_hive_jars</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 在云存储中配置的jars的URI(例如:用于UDF和lib),非常适合放入默认参数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 创建数据加载集群的指定区域。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcSparkSqlOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataProcSparkSqlOperator(query = None,query_uri = None,variables = None,job_name ='{{task.task_id}} _ {{ds_nodash}}',cluster_name ='cluster-1',dataproc_spark_properties =无,dataproc_spark_jars =无,gcp_conn_id ='google_cloud_default',delegate_to =无,region ='全局',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Cloud DataProc集群上启动Spark SQL查询作业。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>query</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 查询或对查询文件的引用(q扩展名)。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>query_uri</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 云存储上的一个spark sql脚本的uri。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>variables</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 查询的命名参数的映射。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>job_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群中使用的作业名称。</font><font style=”vertical-align: inherit;”>默认情况下,此名称是附加执行数据的task_id,但可以进行模板化。</font><font style=”vertical-align: inherit;”>该名称将始终附加一个随机数,以避免名称冲突。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_spark_properties</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - Pig属性的映射。</font><font style=”vertical-align: inherit;”>非常适合放入默认参数</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_spark_jars</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 在云存储中配置的jars的URI(例如:用于UDF和lib),非常适合放入默认参数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 创建数据加载集群的指定区域。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcSparkOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataProcSparkOperator(main_jar = None,main_class = None,arguments = None,archives = None,files = None,job_name ='{{task.task_id}} _ {{ds_nodash}}',cluster_name ='cluster-1',dataproc_spark_properties =无,dataproc_spark_jars =无,gcp_conn_id ='google_cloud_default',delegate_to =无,region ='全局',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Cloud DataProc群集上启动Spark作业。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>main_jar</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 在云存储上配置的作业jar的URI。</font><font style=”vertical-align: inherit;”>(使用this或main_class,而不是两者一起)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>main_class</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 作业类的名称。</font><font style=”vertical-align: inherit;”>(使用this或main_jar,而不是两者一起)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>arguments</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 作业的参数。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>archives</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 将在工作目录中解压缩的已归档文件列表。</font><font style=”vertical-align: inherit;”>应存储在云存储中。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>files</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要复制到工作目录的文件列表</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>job_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群中使用的作业名称。</font><font style=”vertical-align: inherit;”>默认情况下,此名称是附加执行数据的task_id,但可以进行模板化。</font><font style=”vertical-align: inherit;”>该名称将始终附加一个随机数,以避免名称冲突。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_spark_properties</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - Pig属性的映射。</font><font style=”vertical-align: inherit;”>非常适合放入默认参数</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_spark_jars</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 在云存储中配置的jars的URI(例如:用于UDF和lib),非常适合放入默认参数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 创建数据加载集群的指定区域。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcHadoopOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataProcHadoopOperator(main_jar = None,main_class = None,arguments = None,archives = None,files = None,job_name ='{{task.task_id}} _ {{ds_nodash}}',cluster_name ='cluster-1',dataproc_hadoop_properties =无,dataproc_hadoop_jars =无,gcp_conn_id ='google_cloud_default',delegate_to =无,region ='全局',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Cloud DataProc群集上启动Hadoop作业。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>main_jar</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 在云存储上配置的作业jar的URI。</font><font style=”vertical-align: inherit;”>(使用this或main_class,而不是两者一起)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>main_class</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 作业类的名称。</font><font style=”vertical-align: inherit;”>(使用this或main_jar,而不是两者一起)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>arguments</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 作业的参数。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>archives</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 将在工作目录中解压缩的已归档文件列表。</font><font style=”vertical-align: inherit;”>应存储在云存储中。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>files</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要复制到工作目录的文件列表</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>job_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群中使用的作业名称。</font><font style=”vertical-align: inherit;”>默认情况下,此名称是附加执行数据的task_id,但可以进行模板化。</font><font style=”vertical-align: inherit;”>该名称将始终附加一个随机数,以避免名称冲突。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_hadoop_properties</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - Pig属性的映射。</font><font style=”vertical-align: inherit;”>非常适合放入默认参数</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_hadoop_jars</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 在云存储中配置的jars的URI(例如:用于UDF和lib),非常适合放入默认参数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 创建数据加载集群的指定区域。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataProcPySparkOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataProcPySparkOperator(main,arguments = None,archives = None,pyfiles = None,files = None,job_name ='{{task.task_id}} _ {{ds_nodash}}',cluster_name =' cluster-1',dataproc_pyspark_properties = None,dataproc_pyspark_jars = None,gcp_conn_id ='google_cloud_default',delegate_to = None,region ='global',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Cloud DataProc群集上启动PySpark作业。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>main</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - [必需]用作驱动程序的主Python文件的Hadoop兼容文件系统(HCFS)URI。</font><font style=”vertical-align: inherit;”>必须是.py文件。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>arguments</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 作业的参数。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>archives</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 将在工作目录中解压缩的已归档文件列表。</font><font style=”vertical-align: inherit;”>应存储在云存储中。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>files</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要复制到工作目录的文件列表</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>pyfiles</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要传递给PySpark框架的Python文件列表。</font><font style=”vertical-align: inherit;”>支持的文件类型:.py,.egg和.zip</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>job_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群中使用的作业名称。</font><font style=”vertical-align: inherit;”>默认情况下,此名称是附加执行数据的task_id,但可以进行模板化。</font><font style=”vertical-align: inherit;”>该名称将始终附加一个随机数,以避免名称冲突。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - DataProc集群的名称。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_pyspark_properties</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - Pig属性的映射。</font><font style=”vertical-align: inherit;”>非常适合放入默认参数</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dataproc_pyspark_jars</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 在云存储中配置的jars的URI(例如:用于UDF和lib),非常适合放入默认参数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 创建数据加载集群的指定区域。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocWorkflowTemplateInstantiateOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataprocWorkflowTemplateInstantiateOperator(template_id,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.contrib.operators.dataproc_operator.DataprocWorkflowTemplateBaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Google Cloud Dataproc上实例化WorkflowTemplate。</font><font style=”vertical-align: inherit;”>操作员将等待WorkflowTemplate完成执行。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>请参阅:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/dataproc/docs/reference/rest/v1beta2/projects.regions.workflowTemplates/instantiate</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>template_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模板的id。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模板运行所在的Google云项目的ID</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 保留为“全局”,将来可能会变得相关</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DataprocWorkflowTemplateInstantiateInlineOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.dataproc_operator.DataprocWorkflowTemplateInstantiateInlineOperator(template,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.contrib.operators.dataproc_operator.DataprocWorkflowTemplateBaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Google Cloud Dataproc上实例化WorkflowTemplate内联。</font><font style=”vertical-align: inherit;”>操作员将等待WorkflowTemplate完成执行。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>请参阅:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/dataproc/docs/reference/rest/v1beta2/projects.regions.workflowTemplates/instantiateInline</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>template</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>map</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模板内容。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模板运行所在的Google云项目的ID</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 保留为“全局”,将来可能会变得相关</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>云数据存储区</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>数据存储区运营商</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DatastoreExportOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:将实体从Google Cloud Datastore导出到云存储。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DatastoreImportOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:将实体从云存储导入Google Cloud Datastore。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DatastoreExportOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.datastore_export_operator.DatastoreExportOperator(bucket,namespace = None,datastore_conn_id ='google_cloud_default',cloud_storage_conn_id ='google_cloud_default',delegate_to = None,entity_filter = None,labels = None,polling_interval_in_seconds = 10,overwrite_existing = False,xcom_push =假,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将实体从Google Cloud Datastore导出到云存储</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要备份数据的云存储桶的名称</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>namespace</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>str</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 指定云存储桶中用于备份数据的可选命名空间路径。</font><font style=”vertical-align: inherit;”>如果GCS中不存在此命名空间,则将创建该命名空间。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>datastore_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要使用的数据存储区连接ID的名称</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cloud_storage_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 强制写入备份的云存储连接ID的名称</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>entity_filter</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 导出中包含项目中哪些数据的说明,请参阅</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://cloud.google.com/datastore/docs/reference/rest/Shared.Types/EntityFilter</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>labels</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 客户端分配的云存储标签</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>polling_interval_in_seconds</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 再次轮询执行状态之前等待的秒数</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>overwrite_existing</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bool</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果存储桶+命名空间不为空,则在导出之前将清空它。</font><font style=”vertical-align: inherit;”>这样可以覆盖现有备份。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>xcom_push</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bool</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 将操作名称推送到xcom以供参考</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DatastoreImportOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.datastore_import_operator.DatastoreImportOperator(bucket,file,namespace = None,entity_filter = None,labels = None,datastore_conn_id ='google_cloud_default',delegate_to = None,polling_interval_in_seconds = 10,xcom_push = False,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将实体从云存储导入Google Cloud Datastore</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 云存储中用于存储数据的容器</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>file</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 指定云存储桶中备份元数据文件的路径。</font><font style=”vertical-align: inherit;”>它应该具有扩展名.overall_export_metadata</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>namespace</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>str</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 指定云存储桶中备份元数据文件的可选命名空间。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>entity_filter</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 导出中包含项目中哪些数据的说明,请参阅</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://cloud.google.com/datastore/docs/reference/rest/Shared.Types/EntityFilter</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>labels</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 客户端分配的云存储标签</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>datastore_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要使用的连接ID的名称</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>polling_interval_in_seconds</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 再次轮询执行状态之前等待的秒数</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>xcom_push</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bool</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 将操作名称推送到xcom以供参考</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>DatastoreHook</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.hooks.datastore_hook.DatastoreHook(datastore_conn_id ='google_cloud_datastore_default',delegate_to = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.contrib.hooks.gcp_api_base_hook.GoogleCloudBaseHook
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>与Google Cloud Datastore互动。</font><font style=”vertical-align: inherit;”>此挂钩使用Google Cloud Platform连接。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>此对象不是线程安全的。</font><font style=”vertical-align: inherit;”>如果要同时发出多个请求,则需要为每个线程创建一个钩子。</font></font>
<font style="vertical-align: inherit;">allocate_ids(partialKeys)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>为不完整的密钥分配ID。</font><font style=”vertical-align: inherit;”>请参阅</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://cloud.google.com/datastore/docs/reference/rest/v1/projects/allocateIds</font></font>
| 参数: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>partialKeys</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 部分键列表</font></font> |
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>完整密钥列表。</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">begin_transaction()</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>获取新的事务处理</font></font>
也可以看看
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>交易句柄</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">提交(体)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>提交事务,可选地创建,删除或修改某些实体。</font></font>
也可以看看
| 参数: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>body</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 提交请求的主体</font></font> |
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>提交请求的响应主体</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">delete_operation(名称)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>删除长时间运行的操作</font></font>
| 参数: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>name</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 操作资源的名称</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">export_to_storage_bucket(bucket,namespace = None,entity_filter = None,labels = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将实体从Cloud Datastore导出到Cloud Storage进行备份</font></font>
<font style="vertical-align: inherit;">get_conn(版本= 'V1')</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>返回Google云端存储服务对象。</font></font>
<font style="vertical-align: inherit;">GET_OPERATION(名称)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>获取长时间运行的最新状态</font></font>
| 参数: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>name</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 操作资源的名称</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">import_from_storage_bucket(bucket,file,namespace = None,entity_filter = None,labels = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将备份从云存储导入云数据存储</font></font>
<font style="vertical-align: inherit;">lookup(keys,read_consistency = None,transaction = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>按键查找一些实体</font></font>
也可以看看
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>keys</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 要查找的键</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>read_consistency</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 要使用的读取一致性。</font><font style=”vertical-align: inherit;”>默认,强或最终。</font><font style=”vertical-align: inherit;”>不能与事务一起使用。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>transaction</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 要使用的事务,如果有的话。</font></font>
|
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>查找请求的响应主体。</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">poll_operation_until_done(name,polling_interval_in_seconds)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>轮询备份操作状态直到完成</font></font>
<font style="vertical-align: inherit;">回滚(事务)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>回滚交易</font></font>
也可以看看
| 参数: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>transaction</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 要回滚的事务</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">run_query(体)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>运行实体查询。</font></font>
也可以看看
| 参数: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>body</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 查询请求的主体</font></font> |
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>批量查询结果。</font></font> |
| —- | —- |
云ML引擎
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>云ML引擎运营商</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineBatchPredictionOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:启动Cloud ML Engine批量预测作业。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineModelOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:管理Cloud ML Engine模型。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineTrainingOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:启动Cloud ML Engine培训工作。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineVersionOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:管理Cloud ML Engine模型版本。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineBatchPredictionOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.mlengine_operator.MLEngineBatchPredictionOperator(project_id,job_id,region,data_format,input_paths,output_path,model_name = None,version_name = None,uri = None,max_worker_count = None,runtime_version = None,gcp_conn_id ='google_cloud_default',delegate_to =无,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>启动Google Cloud ML Engine预测作业。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>注意:对于模型原点,用户应该考虑以下三个选项中的一个:1。仅填充“uri”字段,该字段应该是指向tensorflow savedModel目录的GCS位置。</font><font style=”vertical-align: inherit;”>2.仅填充’model_name’字段,该字段引用现有模型,并将使用模型的默认版本。</font><font style=”vertical-align: inherit;”>3.填充“model_name”和“version_name”字段,这些字段指特定模型的特定版本。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在选项2和3中,模型和版本名称都应包含最小标识符。</font><font style=”vertical-align: inherit;”>例如,打电话</font></font>
MLEngineBatchPredictionOperator (
... ,
model_name = 'my_model' ,
version_name = 'my_version' ,
... )
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果所需的型号版本是“projects / my_project / models / my_model / versions / my_version”。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有关</font><font style=”vertical-align: inherit;”>参数的更多文档,</font><font style=”vertical-align: inherit;”>请参阅</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https://cloud.google.com/ml-engine/reference/rest/v1/projects.jobs</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 提交预测作业的Google Cloud项目名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>job_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - Google Cloud ML Engine上预测作业的唯一ID。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>data_format</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 输入数据的格式。</font><font style=”vertical-align: inherit;”>如果未提供或者不是[“TEXT”,“TF_RECORD”,“TF_RECORD_GZIP”]之一,它将默认为“DATA_FORMAT_UNSPECIFIED”。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>input_paths</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串列表</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 批量预测的输入数据的GCS路径列表。</font><font style=”vertical-align: inherit;”>接受通配符运算符</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>*</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,但仅限于结尾处。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>output_path</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 写入预测结果的GCS路径。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于运行预测作业的Google Compute Engine区域。(模板化)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>model_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于预测的Google Cloud ML Engine模型。</font><font style=”vertical-align: inherit;”>如果未提供version_name,则将使用此模型的默认版本。</font><font style=”vertical-align: inherit;”>如果提供了version_name,则不应为None。</font><font style=”vertical-align: inherit;”>如果提供uri,则应为None。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>version_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于预测的Google Cloud ML Engine模型版本。</font><font style=”vertical-align: inherit;”>如果提供uri,则应为None。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>uri</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于预测的已保存模型的GCS路径。</font><font style=”vertical-align: inherit;”>如果提供了model_name,则应为None。</font><font style=”vertical-align: inherit;”>它应该是指向张量流SavedModel的GCS路径。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>max_worker_count</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于并行处理的最大worker数。</font><font style=”vertical-align: inherit;”>如果未指定,则默认为10。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>runtime_version</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于批量预测的Google Cloud ML Engine运行时版本。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于连接到Google Cloud Platform的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用doamin范围的委派。</font></font>
|
| —- | —- |
Raises:
ValueError
:如果无法确定唯一的模型/版本来源。
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineModelOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.mlengine_operator.MLEngineModelOperator(project_id,model,operation ='create',gcp_conn_id ='google_cloud_default',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>管理Google Cloud ML Engine模型的运营商。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - MLEngine模型所属的Google Cloud项目名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>型号</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字典</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>包含有关模型信息的字典。</font><font style=”vertical-align: inherit;”>如果</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>操作</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>是</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>create</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,则</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>model</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数应包含有关此模型的所有信息,例如</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>name</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>操作</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>是</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>get</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,则</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>model</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数应包含</font><cite><font style=”vertical-align: inherit;”>模型</font></cite><font style=”vertical-align: inherit;”>的</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>名称</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>操作</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>-</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>执行的操作。</font><font style=”vertical-align: inherit;”>可用的操作是:</font></font>
create
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:创建</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>model</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数</font><font style=”vertical-align: inherit;”>提供的新模型</font><font style=”vertical-align: inherit;”>。</font></font>get
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:获取在模型中指定名称的特定</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>模型</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 获取连接信息时使用的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineTrainingOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.mlengine_operator.MLEngineTrainingOperator(project_id,job_id,package_uris,training_python_module,training_args,region,scale_tier = None,runtime_version = None,python_version = None,job_dir = None,gcp_conn_id ='google_cloud_default',delegate_to = None,mode ='生产',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>启动MLEngine培训工作的操作员。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 应在其中运行MLEngine培训作业的Google Cloud项目名称(模板化)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>job_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 提交的Google MLEngine培训作业的唯一模板化ID。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>package_uris</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - MLEngine培训作业的包位置列表,其中应包括主要培训计划+任何其他依赖项。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>training_python_module</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 安装’package_uris’软件包后,在MLEngine培训作业中运行的Python模块名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>training_args</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 传递给MLEngine训练程序的模板化命令行参数列表。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>region</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于运行MLEngine培训作业的Google Compute Engine区域(模板化)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>scale_tier</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - MLEngine培训作业的资源层。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>runtime_version</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于培训的Google Cloud ML运行时版本。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>python_version</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 训练中使用的Python版本。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>job_dir</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于存储培训输出和培训所需的其他数据的Google云端存储路径。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 获取连接信息时使用的连接ID。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>mode</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 可以是’DRY_RUN’/‘CLOUD’之一。</font><font style=”vertical-align: inherit;”>在“DRY_RUN”模式下,不会启动真正的培训作业,但会打印出MLEngine培训作业请求。</font><font style=”vertical-align: inherit;”>在“CLOUD”模式下,将发出真正的MLEngine培训作业创建请求。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineVersionOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.mlengine_operator.MLEngineVersionOperator(project_id,model_name,version_name = None,version = None,operation ='create',gcp_conn_id ='google_cloud_default',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>管理Google Cloud ML Engine版本的运营商。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - MLEngine模型所属的Google Cloud项目名称。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>model_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 版本所属的Google Cloud ML Engine模型的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>version_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于正在操作的版本的名称。</font><font style=”vertical-align: inherit;”>如果没有人及</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>版本</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>的说法是没有或不具备的值</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>名称</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>键,那么这将是有效载荷中用于填充</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>名称</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>键。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>version</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 包含版本信息的字典。</font><font style=”vertical-align: inherit;”>如果</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>操作</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>是</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>create</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,则</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>version</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>应包含有关此版本的所有信息,例如name和deploymentUrl。</font><font style=”vertical-align: inherit;”>如果</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>操作</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>是</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>get</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>或</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delete</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,则</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>version</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数应包含</font><cite><font style=”vertical-align: inherit;”>版本</font></cite><font style=”vertical-align: inherit;”>的</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>名称</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>如果是None,则唯一</font><font style=”vertical-align: inherit;”>可能</font><font style=”vertical-align: inherit;”>的</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>操作</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>是</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>操作</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>执行的操作。</font><font style=”vertical-align: inherit;”>可用的操作是:</font></font>
create
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>model_name</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>指定的</font><cite><font style=”vertical-align: inherit;”>模型中</font></cite><font style=”vertical-align: inherit;”>创建新版本</font><font style=”vertical-align: inherit;”>,在这种情况下,</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>version</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数应包含创建该版本的所有信息(例如</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>name</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>deploymentUrl</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>)。</font></font>get
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:获取</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>model_name</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>指定的</font><cite><font style=”vertical-align: inherit;”>模型中</font></cite><font style=”vertical-align: inherit;”>特定版本的完整信息</font><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>应在</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>version</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数中</font><font style=”vertical-align: inherit;”>指定版本的名称</font><font style=”vertical-align: inherit;”>。</font></font>list
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:列出</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>model_name</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>指定的</font><cite><font style=”vertical-align: inherit;”>模型的</font></cite><font style=”vertical-align: inherit;”>所有可用版本</font><font style=”vertical-align: inherit;”>。</font></font>delete
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:</font><font style=”vertical-align: inherit;”>从</font><cite><font style=”vertical-align: inherit;”>model_name</font></cite><font style=”vertical-align: inherit;”>指定的</font><cite><font style=”vertical-align: inherit;”>模型中</font></cite><font style=”vertical-align: inherit;”>删除</font></font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>version</font></font></cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>参数中</font><font style=”vertical-align: inherit;”>指定的</font><cite><font style=”vertical-align: inherit;”>版本</font></cite><font style=”vertical-align: inherit;”>。</font><font style=”vertical-align: inherit;”>应在</font><cite><font style=”vertical-align: inherit;”>version</font></cite><font style=”vertical-align: inherit;”>参数中</font><font style=”vertical-align: inherit;”>指定版本的名称</font><font style=”vertical-align: inherit;”>。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>gcp_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 获取连接信息时使用的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Cloud ML Engine Hook</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>MLEngineHook</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.hooks.gcp_mlengine_hook.MLEngineHook(gcp_conn_id ='google_cloud_default',delegate_to = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.contrib.hooks.gcp_api_base_hook.GoogleCloudBaseHook
<font style="vertical-align: inherit;">create_job(project_id,job,use_existing_job_fn = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>启动MLEngine作业并等待它达到终端状态。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 将在其中启动MLEngine作业的Google Cloud项目ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>工作</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字典</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>应该提供给MLEngine API的MLEngine Job对象,例如:</font></font>
{
'jobId' : 'my_job_id' ,
'trainingInput' : {
'scaleTier' : 'STANDARD_1' ,
...
}
}
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>use_existing_job_fn</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>function</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果已存在具有相同job_id的MLEngine作业,则此方法(如果提供)将决定是否应使用此现有作业,继续等待它完成并返回作业对象。</font><font style=”vertical-align: inherit;”>它应该接受MLEngine作业对象,并返回一个布尔值,指示是否可以重用现有作业。</font><font style=”vertical-align: inherit;”>如果未提供“use_existing_job_fn”,我们默认重用现有的MLEngine作业。</font></font>
|
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果作业成功到达终端状态(可能是FAILED或CANCELED状态),则为MLEngine作业对象。</font></font> |
| —- | —- |
| 返回类型: | 字典 |
| —- | —- |
<font style="vertical-align: inherit;">create_model(project_id,model)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>创建一个模型。</font><font style=”vertical-align: inherit;”>阻止直到完成。</font></font>
<font style="vertical-align: inherit;">create_version(project_id,model_name,version_spec)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在Google Cloud ML Engine上创建版本。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果版本创建成功则返回操作,否则引发错误。</font></font>
<font style="vertical-align: inherit;">delete_version(project_id,model_name,version_name)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>删除给定版本的模型。</font><font style=”vertical-align: inherit;”>阻止直到完成。</font></font>
<font style="vertical-align: inherit;">get_conn()</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>返回Google MLEngine服务对象。</font></font>
<font style="vertical-align: inherit;">get_model(project_id,model_name)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>获取一个模型。</font><font style=”vertical-align: inherit;”>阻止直到完成。</font></font>
<font style="vertical-align: inherit;">list_versions(project_id,model_name)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>列出模型的所有可用版本。</font><font style=”vertical-align: inherit;”>阻止直到完成。</font></font>
<font style="vertical-align: inherit;">set_default_version(project_id,model_name,version_name)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将版本设置为默认值。</font><font style=”vertical-align: inherit;”>阻止直到完成。</font></font>
云储存
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>存储运营商</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>FileToGoogleCloudStorageOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:将文件上传到Google云端存储。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageCreateBucketOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:创建新的云存储桶。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageListOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:列出存储桶中的所有对象,并在名称中添加字符串前缀和分隔符。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageDownloadOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:从Google云端存储中下载文件。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageToBigQueryOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:将Google云存储中的文件加载到BigQuery中。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageToGoogleCloudStorageOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:将对象从存储桶复制到另一个存储桶,并在需要时重命名。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>FileToGoogleCloudStorageOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.file_to_gcs.FileToGoogleCloudStorageOperator(src,dst,bucket,google_cloud_storage_conn_id ='google_cloud_default',mime_type ='application / octet-stream',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将文件上传到Google云端存储</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>src</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 本地文件的路径。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dst</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 指定存储桶中的目标路径。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要上传的存储桶。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google_cloud_storage_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要上传的Airflow连接ID</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>mime_type</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - mime类型字符串</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">执行(上下文)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将文件上传到Google云端存储</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageCreateBucketOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.gcs_operator.GoogleCloudStorageCreateBucketOperator(bucket_name,storage_class ='MULTI_REGIONAL',location ='US',project_id = None,labels = None,google_cloud_storage_conn_id ='google_cloud_default',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>创建一个新存储桶。</font><font style=”vertical-align: inherit;”>Google云端存储使用平面命名空间,因此您无法创建名称已在使用中的存储桶。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有关详细信息,请参阅存储桶命名指南:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/storage/docs/bucketnaming.html#requirements</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 存储桶的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>storage_class</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>这定义了存储桶中对象的存储方式,并确定了SLA和存储成本(模板化)。</font><font style=”vertical-align: inherit;”>价值包括</font></font>
MULTI_REGIONAL
REGIONAL
STANDARD
NEARLINE
COLDLINE
<font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果在创建存储桶时未指定此值,则默认为STANDARD。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>位置</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>水桶的位置。</font><font style=”vertical-align: inherit;”>(模板化)存储桶中对象的对象数据驻留在此区域内的物理存储中。</font><font style=”vertical-align: inherit;”>默认为美国。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - GCP项目的ID。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>labels</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用户提供的键/值对标签。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google_cloud_storage_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 连接到Google云端存储时使用的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
Example:
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>以下运算符将</font><font style=”vertical-align: inherit;”>在</font><font style=”vertical-align: inherit;”>区域中</font><font style=”vertical-align: inherit;”>创建</font></font>test-bucket
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>具有</font></font>MULTI_REGIONAL
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>存储类</font><font style=”vertical-align: inherit;”>的新存储桶</font></font>EU
CreateBucket = GoogleCloudStorageCreateBucketOperator (
task_id = 'CreateNewBucket' ,
bucket_name = 'test-bucket' ,
storage_class = 'MULTI_REGIONAL' ,
location = 'EU' ,
labels = { 'env' : 'dev' , 'team' : 'airflow' },
google_cloud_storage_conn_id = 'airflow-service-account'
)
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageDownloadOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.gcs_download_operator.GoogleCloudStorageDownloadOperator(bucket,object,filename = None,store_to_xcom_key = None,google_cloud_storage_conn_id ='google_cloud_default',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>从Google云端存储下载文件。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对象所在的Google云存储桶。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要在Google云存储桶中下载的对象的名称。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>filename</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 应将文件下载到的本地文件系统(正在执行操作符的位置)上的文件路径。</font><font style=”vertical-align: inherit;”>(模板化)如果未传递文件名,则下载的数据将不会存储在本地文件系统中。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>store_to_xcom_key</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果设置了此参数,操作员将使用此参数中设置的键将下载文件的内容推送到XCom。</font><font style=”vertical-align: inherit;”>如果未设置,则下载的数据不会被推送到XCom。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google_cloud_storage_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 连接到Google云端存储时使用的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageListOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.gcs_list_operator.GoogleCloudStorageListOperator(bucket,prefix = None,delimiter = None,google_cloud_storage_conn_id ='google_cloud_default',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>使用名称中的给定字符串前缀和分隔符列出存储桶中的所有对象。</font></font>
<font style="vertical-align: inherit;">此运算符返回一个python列表,其中包含可供其使用的对象的名称</font>
xcom在下游任务中。
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于查找对象的Google云存储桶。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>prefix</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 前缀字符串,用于过滤名称以此前缀开头的对象。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delimiter</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要过滤对象的分隔符。</font><font style=”vertical-align: inherit;”>(模板化)例如,要列出GCS目录中的CSV文件,您可以使用delimiter =’。csv’。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google_cloud_storage_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 连接到Google云端存储时使用的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
Example:
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>以下运算符将列出</font><font style=”vertical-align: inherit;”>存储桶中</font><font style=”vertical-align: inherit;”>文件</font></font>sales/sales-2017
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>夹中的</font><font style=”vertical-align: inherit;”>所有Avro文件</font></font>data
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
GCS_Files = GoogleCloudStorageListOperator (
task_id = 'GCS_Files' ,
bucket = 'data' ,
prefix = 'sales/sales-2017/' ,
delimiter = '.avro' ,
google_cloud_storage_conn_id = google_cloud_conn_id
)
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageToBigQueryOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.gcs_to_bq.GoogleCloudStorageToBigQueryOperator(bucket,source_objects,destination_project_dataset_table,schema_fields = None,schema_object = None,source_format ='CSV',compression ='NONE',create_disposition ='CREATE_IF_NEEDED',skip_leading_rows = 0,write_disposition =' WRITE_EMPTY',field_delimiter =',',max_bad_records = 0,quote_character = None,ignore_unknown_values = False,allow_quoted_newlines = False,allow_jagged_rows = False,max_id_key = None,bigquery_conn_id ='bigquery_default',google_cloud_storage_conn_id ='google_cloud_default',delegate_to = None,schema_update_options =(),src_fmt_configs = {},external_table = False,time_partitioning = {},* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将文件从Google云存储加载到BigQuery中。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>可以用两种方法之一指定用于BigQuery表的模式。</font><font style=”vertical-align: inherit;”>您可以直接传递架构字段,也可以将运营商指向Google云存储对象名称。</font><font style=”vertical-align: inherit;”>Google云存储中的对象必须是包含架构字段的JSON文件。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要加载的桶。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_objects</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 要加载的Google云存储URI列表。</font><font style=”vertical-align: inherit;”>(模板化)如果source_format是’DATASTORE_BACKUP’,则列表必须只包含一个URI。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_project_dataset_table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于加载数据的虚线(<project>。)<dataset>。<table> BigQuery表。</font><font style=”vertical-align: inherit;”>如果未包含<project>,则项目将是连接json中定义的项目。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema_fields</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果设置,则此处定义的架构字段列表:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>https</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:</font><font style=”vertical-align: inherit;”>//cloud.google.com/bigquery/docs/reference/v2/jobs#configuration.load</font><font style=”vertical-align: inherit;”>当source_format为’DATASTORE_BACKUP’时,不应设置。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema_object</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 如果设置,则指向包含表的架构的.json文件的GCS对象路径。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema_object</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 字符串</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_format</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要导出的文件格式。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>compression</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - [可选]数据源的压缩类型。</font><font style=”vertical-align: inherit;”>可能的值包括GZIP和NONE。</font><font style=”vertical-align: inherit;”>默认值为NONE。</font><font style=”vertical-align: inherit;”>Google Cloud Bigtable,Google Cloud Datastore备份和Avro格式会忽略此设置。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>create_disposition</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果表不存在,则创建处置。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>skip_leading_rows</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 从CSV加载时要跳过的行数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>write_disposition</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 表已存在时的写处置。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>field_delimiter</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 从CSV加载时使用的分隔符。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>max_bad_records</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>int</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - BigQuery在运行作业时可以忽略的最大错误记录数。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>quote_character</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于引用CSV文件中数据部分的值。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>ignore_unknown_values</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bool</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - [可选]指示BigQuery是否应允许表模式中未表示的额外值。</font><font style=”vertical-align: inherit;”>如果为true,则忽略额外值。</font><font style=”vertical-align: inherit;”>如果为false,则将具有额外列的记录视为错误记录,如果错误记录太多,则在作业结果中返回无效错误。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>allow_quoted_newlines</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>boolean</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 是否允许引用的换行符(true)或不允许(false)。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>allow_jagged_rows</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bool</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 接受缺少尾随可选列的行。</font><font style=”vertical-align: inherit;”>缺失值被视为空值。</font><font style=”vertical-align: inherit;”>如果为false,则缺少尾随列的记录将被视为错误记录,如果错误记录太多,则会在作业结果中返回无效错误。</font><font style=”vertical-align: inherit;”>仅适用于CSV,忽略其他格式。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>max_id_key</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果设置,则是BigQuery表中要加载的列的名称。</font><font style=”vertical-align: inherit;”>在加载发生后,Thsi将用于从BigQuery中选择MAX值。</font><font style=”vertical-align: inherit;”>结果将由execute()命令返回,该命令又存储在XCom中供将来的操作员使用。</font><font style=”vertical-align: inherit;”>这对增量加载很有帮助 - 在将来的执行过程中,您可以从最大ID中获取。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bigquery_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定BigQuery挂钩的引用。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google_cloud_storage_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对特定Google云存储挂钩的引用。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>schema_update_options</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>list</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 允许更新目标表的模式作为加载作业的副作用。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>src_fmt_configs</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 配置特定于源格式的可选字段</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>external_table</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bool</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于指定目标表是否应为BigQuery外部表的标志。</font><font style=”vertical-align: inherit;”>默认值为False。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>time_partitioning</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 配置可选的时间分区字段,即按API规范按字段,类型和到期分区。</font><font style=”vertical-align: inherit;”>请注意,“field”在dataset.table $ partition的并发中不可用。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageToGoogleCloudStorageOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.gcs_to_gcs.GoogleCloudStorageToGoogleCloudStorageOperator(source_bucket,source_object,destination_bucket = None,destination_object = None,move_object = False,google_cloud_storage_conn_id ='google_cloud_default',delegate_to = None,* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将对象从存储桶复制到另一个存储桶,并在需要时重命名。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对象所在的源Google云存储桶。</font><font style=”vertical-align: inherit;”>(模板)</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>要在Google云存储分区中复制的对象的源名称。</font><font style=”vertical-align: inherit;”>(模板化)如果在此参数中使用通配符:</font></font>
> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>您只能在存储桶中使用一个通配符作为对象(文件名)。</font><font style=”vertical-align: inherit;”>通配符可以出现在对象名称内或对象名称的末尾。</font><font style=”vertical-align: inherit;”>不支持在存储桶名称中附加通配符。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_bucket</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 目标Google云端存储分区</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>对象应该在哪里。</font><font style=”vertical-align: inherit;”>(模板化):type destination_bucket:string:param destination_object:对象的目标名称</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>目标Google云存储桶。</font><font style=”vertical-align: inherit;”>(模板化)如果在source_object参数中提供了通配符,则这是将添加到最终目标对象路径的前缀。</font><font style=”vertical-align: inherit;”>请注意,将删除通配符之前的源路径部分;</font> <font style=”vertical-align: inherit;”>如果需要保留,则应将其附加到destination_object。</font><font style=”vertical-align: inherit;”>例如,使用prefix</font> </font>
foo/*
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>和destination_object’blah</font> </font><cite><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>/</font></font></cite><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">,文件</font></font>
foo/baz<font style="vertical-align: inherit;"><font style="vertical-align: inherit;">将被复制到</font></font>
blah/baz<font style="vertical-align: inherit;"><font style="vertical-align: inherit;">;</font> <font style="vertical-align: inherit;">保留前缀写入destination_object,例如</font></font>
blah/foo<font style="vertical-align: inherit;"><font style="vertical-align: inherit;">,在这种情况下,复制的文件将被命名</font></font>
blah/foo/baz`<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
| 参数: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>move_object</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 当移动对象为True时,移动对象</font></font> |
| —- | —- |
这相当于mv命令而不是cp命令。
<font style="vertical-align: inherit;">复制到新位置。</font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google_cloud_storage_conn_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 连接到Google云端存储时使用的连接ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delegate_to</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 模拟的帐户(如果有)。</font><font style=”vertical-align: inherit;”>为此,发出请求的服务帐户必须启用域范围委派。</font></font>
|
| —- | —- |
Examples:
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>下面的操作将命名一个文件复制</font></font>sales/sales-2017/january.avro
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>在</font></font>data
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>桶的文件和名为</font><font style=”vertical-align: inherit;”>斗</font></font>copied_sales/2017/january-backup.avro
in the `data_backup
copy_single_file = GoogleCloudStorageToGoogleCloudStorageOperator (
task_id = 'copy_single_file' ,
source_bucket = 'data' ,
source_object = 'sales/sales-2017/january.avro' ,
destination_bucket = 'data_backup' ,
destination_object = 'copied_sales/2017/january-backup.avro' ,
google_cloud_storage_conn_id = google_cloud_conn_id
)
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>以下运算符会将文件</font></font>sales/sales-2017
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>夹中的</font><font style=”vertical-align: inherit;”>所有Avro文件</font><font style=”vertical-align: inherit;”>(即名称以该前缀开头)</font><font style=”vertical-align: inherit;”>复制到</font><font style=”vertical-align: inherit;”>存储</font></font>data
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>桶中的</font></font>copied_sales/2017
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>文件夹中</font></font>data_backup
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>。</font></font>
copy_files = GoogleCloudStorageToGoogleCloudStorageOperator (
task_id = 'copy_files' ,
source_bucket = 'data' ,
source_object = 'sales/sales-2017/*.avro' ,
destination_bucket = 'data_backup' ,
destination_object = 'copied_sales/2017/' ,
google_cloud_storage_conn_id = google_cloud_conn_id
)
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>以下运算符会将文件</font></font>sales/sales-2017
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>夹中的</font><font style=”vertical-align: inherit;”>所有Avro文件</font><font style=”vertical-align: inherit;”>(即名称以该前缀开头)移动到</font></font>data
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>存储桶中的同一文件夹</font></font>data_backup
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>,删除过程中的原始文件。</font></font>
move_files = GoogleCloudStorageToGoogleCloudStorageOperator (
task_id = 'move_files' ,
source_bucket = 'data' ,
source_object = 'sales/sales-2017/*.avro' ,
destination_bucket = 'data_backup' ,
move_object = True ,
google_cloud_storage_conn_id = google_cloud_conn_id
)
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GoogleCloudStorageHook</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.hooks.gcs_hook.GoogleCloudStorageHook(google_cloud_storage_conn_id ='google_cloud_default',delegate_to = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.contrib.hooks.gcp_api_base_hook.GoogleCloudBaseHook
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>与Google云端存储互动。</font><font style=”vertical-align: inherit;”>此挂钩使用Google Cloud Platform连接。</font></font>
<font style="vertical-align: inherit;">copy(source_bucket,source_object,destination_bucket = None,destination_object = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将对象从存储桶复制到另一个存储桶,并在需要时重命名。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_bucket或destination_object可以省略,在这种情况下使用源桶/对象,但不能同时使用两者。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要从中复制的对象的存储桶。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要复制的对象。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要复制到的对象的目标。</font><font style=”vertical-align: inherit;”>可以省略;</font> <font style=”vertical-align: inherit;”>然后使用相同的桶。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_object</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 给定对象的(重命名)路径。</font><font style=”vertical-align: inherit;”>可以省略;</font> <font style=”vertical-align: inherit;”>然后使用相同的名称。</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">create_bucket(bucket_name,storage_class ='MULTI_REGIONAL',location ='US',project_id = None,labels = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>创建一个新存储桶。</font><font style=”vertical-align: inherit;”>Google云端存储使用平面命名空间,因此您无法创建名称已在使用中的存储桶。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>有关详细信息,请参阅存储桶命名指南:</font><font style=”vertical-align: inherit;”>https</font><font style=”vertical-align: inherit;”>:</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>//cloud.google.com/storage/docs/bucketnaming.html#requirements</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket_name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 存储桶的名称。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>storage_class</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>这定义了存储桶中对象的存储方式,并确定了SLA和存储成本。</font><font style=”vertical-align: inherit;”>价值包括</font></font>
MULTI_REGIONAL
REGIONAL
STANDARD
NEARLINE
COLDLINE
<font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果在创建存储桶时未指定此值,则默认为STANDARD。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>位置</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) -</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>水桶的位置。</font><font style=”vertical-align: inherit;”>存储桶中对象的对象数据驻留在此区域内的物理存储中。</font><font style=”vertical-align: inherit;”>默认为美国。</font></font>
也可以看看
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>project_id</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - GCP项目的ID。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>labels</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用户提供的键/值对标签。</font></font>
|
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果成功,则返回</font></font>id
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>桶的内容。</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">删除(桶,对象,生成=无)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果未对存储桶启用版本控制,或者使用了生成参数,则删除对象。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对象所在的存储桶的名称</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要删除的对象的名称</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>generation</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果存在,则永久删除该代的对象</font></font>
|
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果成功则为真</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">下载(bucket,object,filename = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>从Google云端存储中获取文件。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要获取的存储桶。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要获取的对象。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>filename</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果设置,则应写入文件的本地文件路径。</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">存在(桶,对象)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>检查Google云端存储中是否存在文件。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对象所在的Google云存储桶。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要在Google云存储分区中检查的对象的名称。</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">get_conn()</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>返回Google云端存储服务对象。</font></font>
<font style="vertical-align: inherit;">get_crc32c(bucket,object)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>获取Google Cloud Storage中对象的CRC32c校验和。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对象所在的Google云存储桶。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要在Google云存储分区中检查的对象的名称。</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">get_md5hash(bucket,object)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>获取Google云端存储中对象的MD5哈希值。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对象所在的Google云存储桶。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要在Google云存储分区中检查的对象的名称。</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">get_size(bucket,object)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>获取Google云端存储中文件的大小。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对象所在的Google云存储桶。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要在Google云存储分区中检查的对象的名称。</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">is_updated_after(bucket,object,ts)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>检查Google Cloud Storage中是否更新了对象。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 对象所在的Google云存储桶。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要在Google云存储分区中检查的对象的名称。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>ts</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>datetime</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要检查的时间戳。</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">list(bucket,versions = None,maxResults = None,prefix = None,delimiter = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>使用名称中的给定字符串前缀列出存储桶中的所有对象</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 存储桶名称</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>versions</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>boolean</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 如果为true,则列出对象的所有版本</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>maxResults</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>整数</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 在单个响应页面中返回的最大项目数</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>prefix</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 前缀字符串,用于过滤名称以此前缀开头的对象</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>delimiter</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 根据分隔符过滤对象(例如’.csv’)</font></font>
|
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>与过滤条件匹配的对象名称流</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">重写(source_bucket,source_object,destination_bucket,destination_object = None)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>具有与复制相同的功能,除了可以处理超过5 TB的文件,以及在位置和/或存储类之间复制时。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_object可以省略,在这种情况下使用source_object。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要从中复制的对象的存储桶。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>source_object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要复制的对象。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要复制到的对象的目标。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>destination_object</font></font><font style=”vertical-align: inherit;”> <font style=”vertical-align: inherit;”>- 给定对象的(重命名)路径。</font><font style=”vertical-align: inherit;”>可以省略;</font> <font style=”vertical-align: inherit;”>然后使用相同的名称。</font></font>
|
| —- | —- |
<font style="vertical-align: inherit;">upload(bucket,object,filename,mime_type ='application / octet-stream')</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>将本地文件上传到Google云端存储。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>bucket</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要上传的存储桶。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>object</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 上载本地文件时要设置的对象名称。</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>filename</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>字符串</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要上载的文件的本地文件路径。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>mime_type</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>string</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 上载文件时要设置的MIME类型。</font></font>
|
| —- | —- |
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>谷歌Kubernetes引擎</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Google Kubernetes引擎集群运营商</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GKEClusterDeleteOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:在Google Cloud Platform中创建Kubernetes群集</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GKEPodOperator</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>:删除Google Cloud Platform中的Kubernetes群集</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GKEClusterCreateOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.gcp_container_operator.GKEClusterCreateOperator(project_id,location,body = {},gcp_conn_id ='google_cloud_default',api_version ='v2',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GKEClusterDeleteOperator</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.operators.gcp_container_operator.GKEClusterDeleteOperator(project_id,name,location,gcp_conn_id ='google_cloud_default',api_version ='v2',* args,** kwargs)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.models.BaseOperator
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>GKEPodOperator</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>Google Kubernetes Engine Hook</font></font>
<font style="vertical-align: inherit;">class airflow.contrib.hooks.gcp_container_hook.GKEClusterHook(project_id,location)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>基地:</font> </font>airflow.hooks.base_hook.BaseHook
<font style="vertical-align: inherit;">create_cluster(cluster,retry = <object object>,timeout = <object object>)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>创建一个群集,由指定数量和类型的Google Compute Engine实例组成。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>cluster</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>dict</font> </font>__<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>或</font></font> <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google.cloud.container_v1.types.Cluster</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 群集protobuf或dict。</font><font style=”vertical-align: inherit;”>如果提供了dict,它必须与protobuf消息的格式相同google.cloud.container_v1.types.Cluster</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>重试</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google.api_core.retry.Retry</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 用于重试请求的重试对象(google.api_core.retry.Retry)。</font><font style=”vertical-align: inherit;”>如果指定None,则不会重试请求。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>timeout</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>float</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 等待请求完成的时间(以秒为单位)。</font><font style=”vertical-align: inherit;”>请注意,如果指定了重试,则超时适用于每次单独尝试。</font></font>
|
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>新集群或现有集群的完整URL</font></font> |
| —- | —- |
ParseError:在尝试转换dict时出现JSON解析问题AirflowException:cluster不是dict类型也不是Cluster proto类型
<font style="vertical-align: inherit;">:加薪</font>
<font style="vertical-align: inherit;">delete_cluster(name,retry = <object object>,timeout = <object object>)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>删除集群,包括Kubernetes端点和所有工作节点。</font><font style=”vertical-align: inherit;”>在群集创建期间配置的防火墙和路由也将被删除。</font><font style=”vertical-align: inherit;”>群集可能正在使用的其他Google Compute Engine资源(例如,负载均衡器资源)如果在初始创建时不存在,则不会被删除。</font></font>
| 参数: |
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>name</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>str</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 要删除的集群的名称</font></font>
- <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>重试</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>google.api_core.retry.Retry</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 重</font><font style=”vertical-align: inherit;”>试用</font><font style=”vertical-align: inherit;”>于确定何时/是否重试请求的对象。</font><font style=”vertical-align: inherit;”>如果指定None,则不会重试请求。</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>timeout</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>float</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 等待请求完成的时间(以秒为单位)。</font><font style=”vertical-align: inherit;”>请注意,如果指定了重试,则超时适用于每次单独尝试。</font></font>
|
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>如果成功则删除操作的完整URL,否则为None</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">get_cluster(name,retry = <object object>,timeout = <object object>)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>获取指定集群的详细信息:param name:要检索的集群的名称:type name:str:param retry:用于重试请求的重试对象。</font><font style=”vertical-align: inherit;”>如果指定了None,</font></font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>请求不会被重试。</font></font>
| 参数: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>timeout</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>(</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>float</font></font><font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>) - 等待请求完成的时间(以秒为单位)。</font><font style=”vertical-align: inherit;”>请注意,如果指定了重试,则超时适用于每次单独尝试。</font></font> |
| —- | —- |
| 返回: | <font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>一个google.cloud.container_v1.types.Cluster实例</font></font> |
| —- | —- |
<font style="vertical-align: inherit;">GET_OPERATION(OPERATION_NAME)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>从Google Cloud获取操作:param operation_name:要获取的操作的名称:type operation_name:str:return:来自Google Cloud的新的更新操作</font></font>
<font style="vertical-align: inherit;">wait_for_operation(操作)</font>
<font style=”vertical-align: inherit;”><font style=”vertical-align: inherit;”>给定操作,持续从Google Cloud获取状态,直到完成或发生错误:param操作:等待的操作:键入操作:google.cloud.container_V1.gapic.enums.Operator:return:a new,updated从Google Cloud获取的操作</font></font>
原文
提供更好的翻译建议