열 데이터 마스킹

이 문서에서는 민감한 정보를 선택적으로 숨길 수 있도록 데이터 마스킹을 구현하는 방법을 보여줍니다. 데이터 마스킹을 구현하면 다양한 사용자 그룹에 다양한 수준의 가시성을 제공할 수 있습니다. 일반적인 정보는 데이터 마스킹 소개를 참조하세요.

열에 데이터 정책을 추가하여 데이터 마스킹을 구현합니다. 열에 데이터 마스킹 정책을 추가하려면 다음 단계를 완료해야 합니다.

  1. 하나 이상의 정책 태그가 있는 분류를 만드세요.
  2. 선택사항: 생성한 정책 태그 중 하나 이상에서 Data Catalog 세분화된 권한의 리더 역할을 하나 이상의 주 구성원에게 부여합니다.
  3. 정책 태그에 최대 3개의 데이터 정책을 만들어 마스킹 규칙 및 주 구성원(사용자 또는 그룹을 나타냄)을 해당 태그에 매핑합니다.
  4. 열에 정책 태그를 설정합니다. 그러면 정책 태그와 연결된 데이터 정책이 선택한 열에 매핑됩니다.
  5. 마스킹된 데이터에 액세스해야 하는 사용자를 BigQuery 마스킹된 리더 역할에 할당합니다. 데이터 정책 수준에서 BigQuery 마스킹된 리더 역할을 할당하는 것이 좋습니다. 프로젝트 수준 이상에서 역할을 할당하면 사용자에게 프로젝트의 모든 데이터 정책에 대한 권한이 부여되어 과도한 권한으로 인한 문제가 발생할 수 있습니다.

Google Cloud 콘솔 또는 BigQuery Data Policy API를 사용하여 데이터 정책 작업을 수행할 수 있습니다.

이러한 단계를 완료하면 해당 열에 대해 쿼리를 실행하는 사용자에게 자신이 속한 그룹 및 부여된 역할에 따라 마스킹 해제된 데이터, 마스킹된 데이터 또는 액세스 거부 오류가 발생합니다. 자세한 내용은 마스킹된 리더 및 세분화된 권한의 리더 역할 상호작용 방법을 참조하세요.

시작하기 전에

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  3. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  4. API Data Catalog and BigQuery Data Policy 사용 설정

    API 사용 설정

  5. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  6. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  7. API Data Catalog and BigQuery Data Policy 사용 설정

    API 사용 설정

  8. BigQuery는 자동으로 새 프로젝트에서 사용 설정되지만 기존 프로젝트에서 활성화해야 할 수도 있습니다.

    BigQuery API 사용 설정

    API 사용 설정

  9. 커스텀 마스킹 루틴을 참조하는 데이터 정책을 만드는 경우 다음 단계에서 사용할 수 있도록 연결된 마스킹 UDF를 만듭니다.

분류 만들기

분류를 만드는 사용자나 서비스 계정에 Data Catalog 정책 태그 관리자 역할을 부여해야 합니다.

콘솔

  1. Google Cloud 콘솔에서 정책 태그 분류 페이지를 엽니다.

    정책 태그 분류 페이지 열기

  2. 분류 만들기를 클릭합니다.
  3. 새 분류 페이지에서 다음을 수행합니다.

    1. 분류 이름에 만들려는 분류의 이름을 입력합니다.
    2. 설명에 설명을 입력합니다.
    3. 필요한 경우 프로젝트 아래에 나열된 프로젝트를 변경합니다.
    4. 필요한 경우 위치 아래에 나열된 위치를 변경합니다.
    5. 정책 태그에 정책 태그 이름과 설명을 입력합니다.
    6. 정책 태그에 하위 정책 태그를 추가하려면 하위 태그 추가를 클릭합니다.
    7. 다른 정책 태그와 수준이 같은 새 정책 태그를 추가하려면 + 정책 태그 추가를 클릭합니다.
    8. 분류에 필요한 정책 태그와 하위 정책 태그를 계속 추가합니다.
    9. 계층 구조에 대한 정책 태그 만들었으면 저장을 클릭합니다.

API

기존 분류를 사용하려면 다음 절차의 첫 두 단계 대신 taxonomies.import를 호출합니다.

  1. taxonomies.create를 호출하여 분류를 만듭니다.
  2. taxonomies.policytag.create를 호출하여 정책 태그를 만듭니다.

정책 태그 사용

정책 태그를 보거나 업데이트하는 방법과 같이 정책 태그 작업을 수행하는 방법에 대한 자세한 내용은 정책 태그로 작업하기를 참조하세요. 추가 권장사항은 BigQuery에서 정책 태그 사용을 위한 권장사항을 참조하세요.

데이터 정책 만들기

데이터 정책을 만드는 사용자 또는 서비스 계정에는 bigquery.dataPolicies.create, bigquery.dataPolicies.setIamPolicy, datacatalog.taxonomies.get 권한이 있어야 합니다.

커스텀 마스킹 루틴을 참조하는 데이터 정책을 만드는 경우 루틴 권한도 필요합니다.

이러한 권한은 BigQuery 관리자 및 BigQuery 데이터 소유자 역할에 포함되어 있습니다.

정책 태그에 데이터 정책을 최대 9개까지 만들 수 있습니다. 이러한 정책 중 하나는 열 수준 액세스 제어 설정용으로 예약되어 있습니다.

콘솔

  1. Google Cloud 콘솔에서 정책 태그 분류 페이지를 엽니다.

    정책 태그 분류 페이지 열기

  2. 열려는 분류 이름을 클릭합니다.
  3. 정책 태그를 선택합니다.
  4. 데이터 정책 관리를 클릭합니다.
  5. 데이터 정책 이름에 데이터 정책 이름을 입력합니다. 데이터 정책 이름은 데이터 정책이 있는 프로젝트 내에서 고유해야 합니다.
  6. 마스킹 규칙의 경우 사전 정의된 마스킹 규칙 또는 커스텀 마스킹 루틴을 선택합니다. 커스텀 마스킹 루틴을 선택하는 경우 프로젝트 수준에서 bigquery.routines.getbigquery.routines.list 권한이 모두 있는지 확인합니다.
  7. 주 구성원에 열에 대한 마스킹된 액세스 권한을 부여하려는 하나 이상의 사용자 또는 그룹 이름을 입력합니다. 여기에 입력하는 모든 사용자 및 그룹에 BigQuery 마스킹된 리더 역할이 부여됩니다.
  8. 제출을 클릭합니다.

API

  1. create 메서드를 호출합니다. 다음 요구사항을 충족하는 DataPolicy 리소스를 전달합니다.

    • dataPolicyType 필드는 DATA_MASKING_POLICY으로 설정됩니다.
    • dataMaskingPolicy 필드는 사용할 데이터 마스킹 규칙 또는 루틴을 식별합니다.
    • dataPolicyId 필드는 데이터 정책이 있는 프로젝트 내에서 고유한 데이터 정책의 이름을 제공합니다.
  2. setIamPolicy 메서드를 호출하고 Policy를 전달합니다. Policy는 마스킹된 데이터에 대한 액세스 권한이 부여된 주 구성원을 식별하고 role 필드에 roles/bigquerydatapolicy.maskedReader를 지정해야 합니다.

열에 정책 태그 설정

데이터 정책과 연결된 정책 태그를 열에 연결하여 열에 데이터 정책을 설정합니다.

정책 태그를 설정하는 사용자나 서비스 계정에 datacatalog.taxonomies.get 권한과 bigquery.tables.setCategory 권한이 필요합니다. datacatalog.taxonomies.get은 Data Catalog 정책 태그 관리자 역할과 프로젝트 뷰어 역할에 포함되어 있습니다. bigquery.tables.setCategory는 BigQuery 관리자(roles/bigquery.admin) 및 BigQuery 데이터 소유자(roles/bigquery.dataOwner) 역할에 포함되어 있습니다.

콘솔

Google Cloud 콘솔을 사용하여 스키마를 수정해 정책 태그를 설정합니다.

  1. Google Cloud Console에서 BigQuery 페이지를 엽니다.

    BigQuery 페이지로 이동

  2. BigQuery 탐색기에서 업데이트할 테이블을 찾아 선택합니다. 테이블의 테이블 스키마가 열립니다.

  3. 스키마 수정을 클릭합니다.

  4. 현재 스키마 화면에서 대상 열을 선택하고 정책 태그 추가를 클릭합니다.

  5. 정책 태그 추가 화면에서 열에 적용할 정책 태그를 선택합니다.

  6. 선택을 클릭합니다. 다음과 같은 화면이 표시됩니다.

    스키마 수정

  7. 저장을 클릭합니다.

bq

  1. 스키마를 로컬 파일에 씁니다.

    bq show --schema --format=prettyjson \
       project-id:dataset.table > schema.json
    

    각 항목의 의미는 다음과 같습니다.

    • project-id는 프로젝트 ID입니다.
    • dataset는 업데이트할 테이블이 포함되어 있는 데이터 세트의 이름입니다.
    • table은 업데이트할 테이블의 이름입니다.
  2. schema.json을 수정하여 열에 정책 태그를 설정합니다. policyTagsnames 필드 값에 정책 태그 리소스 이름을 사용합니다.

    [
     ...
     {
       "name": "ssn",
       "type": "STRING",
       "mode": "REQUIRED",
       "policyTags": {
         "names": ["projects/project-id/locations/location/taxonomies/taxonomy-id/policyTags/policytag-id"]
       }
     },
     ...
    ]
    
  3. 스키마를 업데이트합니다.

    bq update \
       project-id:dataset.table schema.json
    

API

기존 테이블의 경우 tables.patch를 호출하거나 새 테이블의 경우 tables.insert를 호출합니다. 전달하는 Table 객체의 schema 속성을 사용하여 스키마 정의에 정책 태그를 설정합니다. 정책 태그를 설정하는 방법은 명령줄 예시 스키마를 참조하세요.

기존 테이블을 사용하는 경우 tables.update 메서드가 전체 테이블 리소스를 대체하므로 tables.patch 메서드를 사용하는 것이 좋습니다.

액세스 제어 적용

정책 태그에 데이터 정책을 만들면 액세스 제어가 자동으로 적용됩니다. 해당 정책 태그가 적용된 모든 열은 마스킹된 리더 역할이 있는 사용자의 쿼리에 대한 응답으로 마스킹된 데이터를 반환합니다.

액세스 제어 적용을 중지하려면 먼저 분류에서 정책 태그와 연결된 모든 데이터 정책을 삭제해야 합니다. 자세한 내용은 액세스 제어 적용을 참조하세요.

데이터 정책의 IAM 권한 확인

데이터 정책에 대해 갖고 있는 권한을 확인하려면 testIamPermissions 메서드를 호출합니다.

데이터 정책 업데이트

데이터 정책을 업데이트하는 사용자 또는 서비스 계정에는 bigquery.dataPolicies.update 권한이 있어야 합니다. 데이터 정책이 연결된 정책 태그를 업데이트하는 경우 datacatalog.taxonomies.get 권한도 필요합니다.

데이터 정책과 연결된 주 구성원을 업데이트하려면 bigquery.dataPolicies.setIamPolicy 권한이 필요합니다.

bigquery.dataPolicies.updatebigquery.dataPolicies.setIamPolicy 권한은 BigQuery 관리자 및 BigQuery 데이터 소유자 역할에 포함되어 있습니다. datacatalog.taxonomies.get 권한은 Data Catalog 관리자 역할과 Data Catalog 뷰어 역할에 포함되어 있습니다.

콘솔

  1. Google Cloud 콘솔에서 정책 태그 분류 페이지를 엽니다.

    정책 태그 분류 페이지 열기

  2. 열려는 분류 이름을 클릭합니다.
  3. 정책 태그를 선택합니다.
  4. 데이터 정책 관리를 클릭합니다.
  5. 원하는 경우 마스킹 규칙을 변경합니다.
  6. 선택사항: 주 구성원을 추가하거나 삭제합니다.
  7. 제출을 클릭합니다.

API

데이터 마스킹 규칙을 변경하려면 patch 메서드를 호출하고 업데이트된 dataMaskingPolicy 필드와 함께 DataPolicy 리소스에 전달합니다.

데이터 정책과 연결된 주 구성원을 변경하려면 setIamPolicy 메서드를 호출하고 마스킹된 데이터에 대한 액세스 권한이 부여된 주 구성원을 업데이트하는 Policy에 전달합니다.

데이터 정책 삭제

데이터 정책을 만드는 사용자 또는 서비스 계정에는 bigquery.dataPolicies.delete 권한이 있어야 합니다. 이 권한은 BigQuery 관리자 및 BigQuery 데이터 소유자 역할에 포함되어 있습니다.

콘솔

  1. Google Cloud 콘솔에서 정책 태그 분류 페이지를 엽니다.

    정책 태그 분류 페이지 열기

  2. 열려는 분류 이름을 클릭합니다.
  3. 정책 태그를 선택합니다.
  4. 데이터 정책 관리를 클릭합니다.
  5. 삭제할 데이터 정책 옆에 있는 를 클릭합니다.
  6. 제출을 클릭합니다.
  7. 확인을 클릭합니다.

API

데이터 정책을 삭제하려면 delete 메서드를 호출합니다.