Migrating Google AutoML example_dags to sys tests (#32368)

--------- Co-authored-by: Amogh Desai <[email protected]>
apache · Jul 7, 2023 · 6c854dc · 6c854dc
1 parent 3a14e84
commit 6c854dc
Show file tree

Hide file tree

Showing 6 changed files with 93 additions and 31 deletions.
diff --git a/.../example_automl_nl_text_classification.py → .../example_automl_nl_text_classification.py b/.../example_automl_nl_text_classification.py → .../example_automl_nl_text_classification.py
@@ -39,13 +39,9 @@
 GCP_AUTOML_LOCATION = os.environ.get("GCP_AUTOML_LOCATION", "us-central1")
 GCP_AUTOML_TEXT_CLS_BUCKET = os.environ.get("GCP_AUTOML_TEXT_CLS_BUCKET", "gs://INVALID BUCKET NAME")
 
-# Example values
-DATASET_ID = ""
-
 # Example model
 MODEL = {
  "display_name": "auto_model_1",
- "dataset_id": DATASET_ID,
  "text_classification_model_metadata": {},
 }
 
@@ -55,6 +51,7 @@
  "text_classification_dataset_metadata": {"classification_type": "MULTICLASS"},
 }
 
+
 IMPORT_INPUT_CONFIG = {"gcs_source": {"input_uris": [GCP_AUTOML_TEXT_CLS_BUCKET]}}
 
 extract_object_id = CloudAutoMLHook.extract_object_id
@@ -65,24 +62,23 @@
  start_date=datetime(2021, 1, 1),
  catchup=False,
  tags=["example"],
-) as example_dag:
+) as dag:
  create_dataset_task = AutoMLCreateDatasetOperator(
  task_id="create_dataset_task", dataset=DATASET, location=GCP_AUTOML_LOCATION
  )
 
  dataset_id = cast(str, XComArg(create_dataset_task, key="dataset_id"))
+ MODEL["dataset_id"] = dataset_id
 
  import_dataset_task = AutoMLImportDataOperator(
  task_id="import_dataset_task",
  dataset_id=dataset_id,
  location=GCP_AUTOML_LOCATION,
  input_config=IMPORT_INPUT_CONFIG,
  )
-
  MODEL["dataset_id"] = dataset_id
 
  create_model = AutoMLTrainModelOperator(task_id="create_model", model=MODEL, location=GCP_AUTOML_LOCATION)
-
  model_id = cast(str, XComArg(create_model, key="model_id"))
 
  delete_model_task = AutoMLDeleteModelOperator(
@@ -99,10 +95,23 @@
  project_id=GCP_PROJECT_ID,
  )
 
+ # TEST BODY
  import_dataset_task >> create_model
+ # TEST TEARDOWN
  delete_model_task >> delete_datasets_task
 
  # Task dependencies created via `XComArgs`:
  # create_dataset_task >> import_dataset_task
  # create_dataset_task >> create_model
  # create_dataset_task >> delete_datasets_task
+
+ from tests.system.utils.watcher import watcher
+
+ # This test needs watcher in order to properly mark success/failure
+ # when "tearDown" task with trigger rule is part of the DAG
+ list(dag.tasks) >> watcher()
+
+from tests.system.utils import get_test_run # noqa: E402
+
+# Needed to run the example DAG with pytest (see: tests/system/README.md#run_via_pytest)
+test_run = get_test_run(dag)
diff --git a/..._dags/example_automl_nl_text_sentiment.py → ...utoml/example_automl_nl_text_sentiment.py b/..._dags/example_automl_nl_text_sentiment.py → ...utoml/example_automl_nl_text_sentiment.py
@@ -39,13 +39,9 @@
 GCP_AUTOML_LOCATION = os.environ.get("GCP_AUTOML_LOCATION", "us-central1")
 GCP_AUTOML_SENTIMENT_BUCKET = os.environ.get("GCP_AUTOML_SENTIMENT_BUCKET", "gs://INVALID BUCKET NAME")
 
-# Example values
-DATASET_ID = ""
-
 # Example model
 MODEL = {
  "display_name": "auto_model_1",
- "dataset_id": DATASET_ID,
  "text_sentiment_model_metadata": {},
 }
 
@@ -66,12 +62,13 @@
  catchup=False,
  user_defined_macros={"extract_object_id": extract_object_id},
  tags=["example"],
-) as example_dag:
+) as dag:
  create_dataset_task = AutoMLCreateDatasetOperator(
  task_id="create_dataset_task", dataset=DATASET, location=GCP_AUTOML_LOCATION
  )
 
  dataset_id = cast(str, XComArg(create_dataset_task, key="dataset_id"))
+ MODEL["dataset_id"] = dataset_id
 
  import_dataset_task = AutoMLImportDataOperator(
  task_id="import_dataset_task",
@@ -100,11 +97,24 @@
  project_id=GCP_PROJECT_ID,
  )
 
+ # TEST BODY
  import_dataset_task >> create_model
+ # TEST TEARDOWN
  delete_model_task >> delete_datasets_task
 
  # Task dependencies created via `XComArgs`:
  # create_dataset_task >> import_dataset_task
  # create_dataset_task >> create_model
  # create_model >> delete_model_task
  # create_dataset_task >> delete_datasets_task
+
+ from tests.system.utils.watcher import watcher
+
+ # This test needs watcher in order to properly mark success/failure
+ # when "tearDown" task with trigger rule is part of the DAG
+ list(dag.tasks) >> watcher()
+
+from tests.system.utils import get_test_run # noqa: E402
+
+# Needed to run the example DAG with pytest (see: tests/system/README.md#run_via_pytest)
+test_run = get_test_run(dag)
diff --git a/...xample_dags/example_automl_translation.py → ...loud/automl/example_automl_translation.py b/...xample_dags/example_automl_translation.py → ...loud/automl/example_automl_translation.py
@@ -41,13 +41,9 @@
  "GCP_AUTOML_TRANSLATION_BUCKET", "gs://INVALID BUCKET NAME/file"
 )
 
-# Example values
-DATASET_ID = "TRL123456789"
-
 # Example model
 MODEL = {
  "display_name": "auto_model_1",
- "dataset_id": DATASET_ID,
  "translation_model_metadata": {},
 }
 
@@ -60,6 +56,7 @@
  },
 }
 
+
 IMPORT_INPUT_CONFIG = {"gcs_source": {"input_uris": [GCP_AUTOML_TRANSLATION_BUCKET]}}
 
 extract_object_id = CloudAutoMLHook.extract_object_id
@@ -69,10 +66,11 @@
 with models.DAG(
  "example_automl_translation",
  start_date=datetime(2021, 1, 1),
+ schedule="@once",
  catchup=False,
  user_defined_macros={"extract_object_id": extract_object_id},
  tags=["example"],
-) as example_dag:
+) as dag:
  create_dataset_task = AutoMLCreateDatasetOperator(
  task_id="create_dataset_task", dataset=DATASET, location=GCP_AUTOML_LOCATION
  )
@@ -106,11 +104,25 @@
  project_id=GCP_PROJECT_ID,
  )
 
+ # TEST BODY
  import_dataset_task >> create_model
+ # TEST TEARDOWN
  delete_model_task >> delete_datasets_task
 
  # Task dependencies created via `XComArgs`:
  # create_dataset_task >> import_dataset_task
  # create_dataset_task >> create_model
  # create_model >> delete_model_task
  # create_dataset_task >> delete_datasets_task
+
+ from tests.system.utils.watcher import watcher
+
+ # This test needs watcher in order to properly mark success/failure
+ # when "tearDown" task with trigger rule is part of the DAG
+ list(dag.tasks) >> watcher()
+
+
+from tests.system.utils import get_test_run # noqa: E402
+
+# Needed to run the example DAG with pytest (see: tests/system/README.md#run_via_pytest)
+test_run = get_test_run(dag)
diff --git a/...toml_video_intelligence_classification.py → ...toml_video_intelligence_classification.py b/...toml_video_intelligence_classification.py → ...toml_video_intelligence_classification.py
@@ -41,13 +41,9 @@
  "GCP_AUTOML_VIDEO_BUCKET", "gs://INVALID BUCKET NAME/hmdb_split1.csv"
 )
 
-# Example values
-DATASET_ID = "VCN123455678"
-
 # Example model
 MODEL = {
  "display_name": "auto_model_1",
- "dataset_id": DATASET_ID,
  "video_classification_model_metadata": {},
 }
 
@@ -69,12 +65,13 @@
  catchup=False,
  user_defined_macros={"extract_object_id": extract_object_id},
  tags=["example"],
-) as example_dag:
+) as dag:
  create_dataset_task = AutoMLCreateDatasetOperator(
  task_id="create_dataset_task", dataset=DATASET, location=GCP_AUTOML_LOCATION
  )
 
  dataset_id = cast(str, XComArg(create_dataset_task, key="dataset_id"))
+ MODEL["dataset_id"] = dataset_id
 
  import_dataset_task = AutoMLImportDataOperator(
  task_id="import_dataset_task",
@@ -103,11 +100,24 @@
  project_id=GCP_PROJECT_ID,
  )
 
+ # TEST BODY
  import_dataset_task >> create_model
+ # TEST TEARDOWN
  delete_model_task >> delete_datasets_task
 
  # Task dependencies created via `XComArgs`:
  # create_dataset_task >> import_dataset_task
  # create_dataset_task >> create_model
  # create_model >> delete_model_task
  # create_dataset_task >> delete_datasets_task
+
+ from tests.system.utils.watcher import watcher
+
+ # This test needs watcher in order to properly mark success/failure
+ # when "tearDown" task with trigger rule is part of the DAG
+ list(dag.tasks) >> watcher()
+
+from tests.system.utils import get_test_run # noqa: E402
+
+# Needed to run the example DAG with pytest (see: tests/system/README.md#run_via_pytest)
+test_run = get_test_run(dag)
diff --git a/...ple_automl_video_intelligence_tracking.py → ...ple_automl_video_intelligence_tracking.py b/...ple_automl_video_intelligence_tracking.py → ...ple_automl_video_intelligence_tracking.py
@@ -42,13 +42,10 @@
  "gs://INVALID BUCKET NAME/youtube_8m_videos_animal_tiny.csv",
 )
 
-# Example values
-DATASET_ID = "VOT123456789"
 
 # Example model
 MODEL = {
  "display_name": "auto_model_1",
- "dataset_id": DATASET_ID,
  "video_object_tracking_model_metadata": {},
 }
 
@@ -70,12 +67,13 @@
  catchup=False,
  user_defined_macros={"extract_object_id": extract_object_id},
  tags=["example"],
-) as example_dag:
+) as dag:
  create_dataset_task = AutoMLCreateDatasetOperator(
  task_id="create_dataset_task", dataset=DATASET, location=GCP_AUTOML_LOCATION
  )
 
  dataset_id = cast(str, XComArg(create_dataset_task, key="dataset_id"))
+ MODEL["dataset_id"] = dataset_id
 
  import_dataset_task = AutoMLImportDataOperator(
  task_id="import_dataset_task",
@@ -104,11 +102,24 @@
  project_id=GCP_PROJECT_ID,
  )
 
+ # TEST BODY
  import_dataset_task >> create_model
+ # TEST TEARDOWN
  delete_model_task >> delete_datasets_task
 
  # Task dependencies created via `XComArgs`:
  # create_dataset_task >> import_dataset_task
  # create_dataset_task >> create_model
  # create_model >> delete_model_task
  # create_dataset_task >> delete_datasets_task
+
+ from tests.system.utils.watcher import watcher
+
+ # This test needs watcher in order to properly mark success/failure
+ # when "tearDown" task with trigger rule is part of the DAG
+ list(dag.tasks) >> watcher()
+
+from tests.system.utils import get_test_run # noqa: E402
+
+# Needed to run the example DAG with pytest (see: tests/system/README.md#run_via_pytest)
+test_run = get_test_run(dag)
diff --git a/...example_automl_vision_object_detection.py → ...example_automl_vision_object_detection.py b/...example_automl_vision_object_detection.py → ...example_automl_vision_object_detection.py
@@ -41,13 +41,9 @@
  "GCP_AUTOML_DETECTION_BUCKET", "gs://INVALID BUCKET NAME/img/openimage/csv/salads_ml_use.csv"
 )
 
-# Example values
-DATASET_ID = ""
-
 # Example model
 MODEL = {
  "display_name": "auto_model",
- "dataset_id": DATASET_ID,
  "image_object_detection_model_metadata": {},
 }
 
@@ -69,12 +65,13 @@
  catchup=False,
  user_defined_macros={"extract_object_id": extract_object_id},
  tags=["example"],
-) as example_dag:
+) as dag:
  create_dataset_task = AutoMLCreateDatasetOperator(
  task_id="create_dataset_task", dataset=DATASET, location=GCP_AUTOML_LOCATION
  )
 
  dataset_id = cast(str, XComArg(create_dataset_task, key="dataset_id"))
+ MODEL["dataset_id"] = dataset_id
 
  import_dataset_task = AutoMLImportDataOperator(
  task_id="import_dataset_task",
@@ -103,11 +100,24 @@
  project_id=GCP_PROJECT_ID,
  )
 
+ # TEST BODY
  import_dataset_task >> create_model
+ # TEST TEARDOWN
  delete_model_task >> delete_datasets_task
 
  # Task dependencies created via `XComArgs`:
  # create_dataset_task >> import_dataset_task
  # create_dataset_task >> create_model
  # create_model >> delete_model_task
  # create_dataset_task >> delete_datasets_task
+
+ from tests.system.utils.watcher import watcher
+
+ # This test needs watcher in order to properly mark success/failure
+ # when "tearDown" task with trigger rule is part of the DAG
+ list(dag.tasks) >> watcher()
+
+from tests.system.utils import get_test_run # noqa: E402
+
+# Needed to run the example DAG with pytest (see: tests/system/README.md#run_via_pytest)
+test_run = get_test_run(dag)