OCR(광학 문자 인식)

세계적 수준의 Google Cloud AI를 통한 OCR(광학 문자 인식)

이미지 및 문서에서 텍스트 및 데이터를 추출하고, 구조화되지 않은 콘텐츠를 비즈니스에서 사용할 수 있는 구조화된 데이터로 변환하고, 유용한 정보를 얻을 수 있습니다.

API를 통해 OCR 기능을 애플리케이션에 통합합니다.

신규 고객에게는 가입 시 문서 요약 OCR 솔루션에 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.

개요

OCR이란 무엇인가요?

광학 문자 인식(OCR)은 이미지에서 입력되거나 필기 또는 인쇄된 텍스트를 머신으로 인코딩된 텍스트로 변환하는 데 사용되는 기본 기술입니다.

Google Cloud는 어떤 유형의 OCR을 제공하나요?

Google Cloud는 문서의 OCR과 이미지 및 동영상의 OCR이라는 두 가지 유형의 OCR을 제공합니다.

기본 기술을 공유하지만 Document AI는 문서 처리에 최적화된 문서 이해 플랫폼입니다. 커스텀 추출기는 GenAI를 기반으로 하며, 전문 프로세서를 선택할 필요 없이 일반 문서와 분야별 문서를 모두 더 정확하고 빠르게 처리합니다. 

Cloud Vision은 일반적으로 이미지와 동영상에서 텍스트, 필기, 다양한 사물을 감지하는 데 사용됩니다.

Google Cloud에서 OCR은 어떻게 작동하나요?

Google Cloud는 동급 최고의 AI로 OCR을 지원합니다. 데이터 이해, 구성, 보강으로 기존 텍스트 인식을 뛰어넘어 궁극적으로 비즈니스에 필요한 유용한 정보를 얻을 수 있습니다. 

OCR 도구를 효율성을 위해 간소화된 통합 도구 모음(예: Document AI)으로 사용하거나 Google Cloud 콘솔에서 직접 사용할 수 있는 관련 API를 호출하여 OCR 기능을 애플리케이션에 통합할 수 있습니다.

Google Cloud AI와 OCR은 어떻게 함께 작동하나요?

위에서 언급한 모든 OCR 솔루션을 사용하면 API를 통해 즉시 배포하거나 업트레이닝을 통해 특정 요구사항에 대한 정확성을 개선할 수 있는 선행 학습된 ML 모델에 액세스할 수 있습니다. 

AutoML을 사용하면 머신러닝 전문 지식이 없어도 자체 커스텀 모델을 학습시킬 수 있습니다. 

커스텀 ML 모델 빌드에 대한 AutoML 문서를 확인하세요.

어떤 OCR 솔루션이 나에게 적합한가요?

문서를 분석하거나 자동화된 문서 처리 파이프라인을 빌드하려면 Document AI를 사용하세요. 문서 이해부터 추출된 데이터와 함께 문서 검색, 저장, 제어, 관리에 이르기까지 전체 워크플로를 한 곳에서 처리합니다.

이미지를 분석 및 처리하려면 다른 Google Cloud 제품과 함께 Cloud Vision을 사용하여 최상의 결과를 얻으세요. 세부정보 및 빠른 시작 가이드는 '일반적인 용도 섹션'을 참조하세요.

두 API 모두 Google Cloud 계정으로 무료로 사용해 볼 수 있습니다.

OCR 서비스 비교

OCR 서비스적합한 환경주요 특징

짧은 지연 시간과 높은 용량이 필요한 일반 텍스트 추출 사용 사례

이미지 라벨 지정, 얼굴 및 랜드마크 인식, OCR, 세이프서치와 같은 사전 빌드된 기능이 있습니다. 

Enterprise Document OCR

문서(PDF, 이미지 형태의 스캔한 문서 또는 Microsoft DocX 파일)의 텍스트를 디지털화합니다.

200개 이상의 언어, 50개 필기 입력 언어로 텍스트를 추출합니다.

수학 공식, 스타일 등을 인식하는 부가기능입니다.



Document AI Workbench

생성형 AI (기반 모델)로 모든 문서를 추출, 분류, 분할

커스텀 추출기: 기반 모델을 사용하여 광범위한 데이터 라벨 지정이나 학습 없이 빠르게 파서를 만듭니다.

효율적인 처리를 위한 맞춤 분류 기준 및 문서 분할기입니다.

선행 학습된 모델

도메인별 문서에서 텍스트 및 필드 추출

다양한 조달, 대출, 신원, 계약 문서에서 텍스트 추출 및 디지털화

적합한 환경

주요 특징

짧은 지연 시간과 높은 용량이 필요한 일반 텍스트 추출 사용 사례

이미지 라벨 지정, 얼굴 및 랜드마크 인식, OCR, 세이프서치와 같은 사전 빌드된 기능이 있습니다. 

적합한 환경

Enterprise Document OCR

주요 특징

문서(PDF, 이미지 형태의 스캔한 문서 또는 Microsoft DocX 파일)의 텍스트를 디지털화합니다.

200개 이상의 언어, 50개 필기 입력 언어로 텍스트를 추출합니다.

수학 공식, 스타일 등을 인식하는 부가기능입니다.



적합한 환경

Document AI Workbench

주요 특징

생성형 AI (기반 모델)로 모든 문서를 추출, 분류, 분할

커스텀 추출기: 기반 모델을 사용하여 광범위한 데이터 라벨 지정이나 학습 없이 빠르게 파서를 만듭니다.

효율적인 처리를 위한 맞춤 분류 기준 및 문서 분할기입니다.

적합한 환경

선행 학습된 모델

주요 특징

도메인별 문서에서 텍스트 및 필드 추출

다양한 조달, 대출, 신원, 계약 문서에서 텍스트 추출 및 디지털화

작동 방식

문서를 이해하고 처리하려면 Document AI를 사용합니다.

이미지의 경우 Cloud Vision을 사용하는 것이 좋습니다.

두 가지 모두 API 또는 업트레이닝을 통해 있는 그대로 배포할 수 있는 선행 학습된 ML 모델에 대한 액세스 권한을 제공합니다. AutoML을 사용하면 머신러닝 전문 지식이 없어도 커스텀 모델을 처음부터 학습시킬 수 있습니다. 

Cloud Vision 또는 문서 OCR을 사용하면 매월 처음 1,000개의 단위가 무료로 제공됩니다. API를 호출하기만 하면 됩니다.

함께 작동하는 클라우드 제품을 보여주는 이미지
Cloud Vision이 이미지를 인식하고 분류하는 방법

데모

자체 문서에서 문서 OCR의 실제 작동 방식 보기

간단한 드래그 앤 드롭으로 Document AI API를 사용해 보세요.

일반적인 용도

생성형 AI로 문서에서 텍스트 추출

Document AI로 미묘한 문서에서 유용한 정보 확보

기반 모델을 기반으로 하는 Document AI 커스텀 추출기는 문서에서 일반 및 분야별로 텍스트와 데이터를 더 빠르고 정확하게 추출합니다. 5~10개의 문서만으로 손쉽게 미세 조정하여 성능을 한층 더 높일 수 있습니다.

 자체 모델을 학습시키려면 데이터 세트에 기반 모델로 자동 라벨을 지정하여 프로덕션 시간을 단축하세요.

선행 학습된 특수 프로세서를 사용할 수도 있습니다. 전체 프로세서 목록을 참고하세요. 


Document AI API 배포

Document AI로 미묘한 문서에서 유용한 정보 확보

기반 모델을 기반으로 하는 Document AI 커스텀 추출기는 문서에서 일반 및 분야별로 텍스트와 데이터를 더 빠르고 정확하게 추출합니다. 5~10개의 문서만으로 손쉽게 미세 조정하여 성능을 한층 더 높일 수 있습니다.

 자체 모델을 학습시키려면 데이터 세트에 기반 모델로 자동 라벨을 지정하여 프로덕션 시간을 단축하세요.

선행 학습된 특수 프로세서를 사용할 수도 있습니다. 전체 프로세서 목록을 참고하세요. 


Document AI API 배포

주택담보대출 처리 속도를 높이기 위해 Google AI를 사용하는 Mr. Cooper

Mr. Cooper는 미국 최대 규모의 주택담보대출 서비스 제공업체 중 하나로, 주택 소유자에게 다양한 서비스 및 대출 상품, 서비스, 기술을 제공하는 데 주력하고 있습니다.

Google의 OCR 기술 스택에 모듈식 아키텍처로 컨테이너 기반 문서 처리 파이프라인을 구축하여 다음과 같은 결과를 달성했습니다.

- 중요한 문서에서 95% 이상의 정확성 달성

- 최대 처리량 분당 4,000페이지, 평균 처리량은 분당 2,000페이지

- 문서 처리 효율성이 400% 향상

전체 우수사례에서 기술 세부정보 확인하기
Mr. Cooper 문서 처리 파이프라인 아키텍처 다이어그램

    엔드 투 엔드 문서 솔루션 빌드

    문서 처리 및 파이프라인 이해 빌드

    GenAI를 기반으로 하는 Document AI는 다양한 레이아웃과 품질의 문서에서 매우 정확하게 데이터를 추출할 수 있습니다. Cloud Storage와 연결하면 구조화되지 않은 문서에서 엔터프라이즈급 규정을 준수할 수 있습니다. BigQuery를 사용하면 추출된 데이터를 원하는 방식으로 일괄 처리하고 분석할 수 있습니다. Looker를 사용하면 BigQuery 테이블을 기반으로 손쉽게 시각화를 빌드할 수 있습니다. Vertex AI Search를 사용하면 대화 방식으로 또는 기존에 Cloud Storage의 문서를 쿼리하고 검색할 수 있습니다.

    Document AI API 배포
    여러 Google Cloud 제품이 포함된 엔드 투 엔드 문서 솔루션의 참조 아키텍처

    위와 같이 전체 파이프라인을 설정하는 데는 60~90분이 걸리며 Document AI 부분에는 10분이 걸립니다.

    문서 처리 및 파이프라인 이해 빌드

    GenAI를 기반으로 하는 Document AI는 다양한 레이아웃과 품질의 문서에서 매우 정확하게 데이터를 추출할 수 있습니다. Cloud Storage와 연결하면 구조화되지 않은 문서에서 엔터프라이즈급 규정을 준수할 수 있습니다. BigQuery를 사용하면 추출된 데이터를 원하는 방식으로 일괄 처리하고 분석할 수 있습니다. Looker를 사용하면 BigQuery 테이블을 기반으로 손쉽게 시각화를 빌드할 수 있습니다. Vertex AI Search를 사용하면 대화 방식으로 또는 기존에 Cloud Storage의 문서를 쿼리하고 검색할 수 있습니다.

    Document AI API 배포
    여러 Google Cloud 제품이 포함된 엔드 투 엔드 문서 솔루션의 참조 아키텍처

    위와 같이 전체 파이프라인을 설정하는 데는 60~90분이 걸리며 Document AI 부분에는 10분이 걸립니다.

    이미지에서 텍스트 추출

    Cloud Vision API를 사용해 이미지에서 텍스트 추출

    Cloud Vision API를 통해 다른 언어로 된 이미지에서 텍스트 및 필기 텍스트를 감지하고 추출할 수 있습니다. 또한 대륙 수준의 데이터 스토리지와 OCR 처리를 지정할 수 있는 멀티 리전 지원도 제공합니다.

    적은 수의 이미지(요청당 최대 16개)에 대한 즉각적인 결과를 얻거나 더 많은 수의 이미지(요청당 최대 2,000개)에 대해 비동기식으로 일괄 처리하여 나중에 결과를 얻을 수 있습니다.

    Cloud Vision API 배포
    Cloud Vision API 참조 아키텍처

    Cloud Vision API를 사용해 이미지에서 텍스트 추출

    Cloud Vision API를 통해 다른 언어로 된 이미지에서 텍스트 및 필기 텍스트를 감지하고 추출할 수 있습니다. 또한 대륙 수준의 데이터 스토리지와 OCR 처리를 지정할 수 있는 멀티 리전 지원도 제공합니다.

    적은 수의 이미지(요청당 최대 16개)에 대한 즉각적인 결과를 얻거나 더 많은 수의 이미지(요청당 최대 2,000개)에 대해 비동기식으로 일괄 처리하여 나중에 결과를 얻을 수 있습니다.

    Cloud Vision API 배포
    Cloud Vision API 참조 아키텍처

    가격 책정 예시

    오른쪽에 나온 것처럼 이미지에서 텍스트를 추출하는 기본 처리 파이프라인을 실행하려면 월별 비용$27.36입니다.

    사용량 가정은 가격 계산기에서 확인할 수 있습니다.

    매월 처음 1,000개 단위는 무료입니다.

    더 복잡한 설정은 Google에 문의하세요
    이미지 처리

      가격 책정

      내 사용 사례의 비용은 얼마인가요?필요한 제품과 주요 사용 가정을 바탕으로 사용 사례를 해결하기 위한 월별 비용을 파악할 수 있습니다.
      사용 사례사용 제품사용량 가정월별 예상 비용(USD)
      이미지 태그 지정, 처리, 검색

      Cloud Vision

      Cloud Storage

      Pub/Sub

      Cloud Run

      1. 월간 Cloud Vision 라벨 감지 API 호출 15,000회

      2. 월간 스토리지 100GiB

      3. 1.25GiB CPU 1개

      4. Pub/Sub를 통해 매일 4GiB 게시

      계산기에서 계산 세부정보 보기

      $27.36

      문서에서 텍스트 및 통계 추출

      Document AI

      Cloud Storage

      BigQuery

      Cloud Functions

      1. 월간 Document AI 양식 파서 API 호출 1,000회

      2. 월간 스토리지 100GiB

      3. 월간 쿼리 1TiB

      4. RAM: 512MB, CPU: 800MHz

      계산기의 계산 세부정보 보기

      $71.87

      이미지에서 텍스트 추출

      Cloud Vision

      Cloud Storage

      Pub/Sub

      Cloud Run

      1. 월간 Cloud Vision OCR API 호출 15,000회

      2. 월간 스토리지 100GiB

      3. 1.25GiB CPU 1개

      4. Pub/Sub를 통해 매일 4GiB 게시

      계산기에서 계산 세부정보 보기

      $27.36

      Document AI, Vision API, AutoML의 전체 단가 가격 책정 세부정보를 확인하세요.

      내 사용 사례의 비용은 얼마인가요?

      필요한 제품과 주요 사용 가정을 바탕으로 사용 사례를 해결하기 위한 월별 비용을 파악할 수 있습니다.

      이미지 태그 지정, 처리, 검색
      사용 제품

      Cloud Vision

      Cloud Storage

      Pub/Sub

      Cloud Run

      사용량 가정

      1. 월간 Cloud Vision 라벨 감지 API 호출 15,000회

      2. 월간 스토리지 100GiB

      3. 1.25GiB CPU 1개

      4. Pub/Sub를 통해 매일 4GiB 게시

      계산기에서 계산 세부정보 보기

      월별 예상 비용(USD)

      $27.36

      문서에서 텍스트 및 통계 추출
      사용 제품

      Document AI

      Cloud Storage

      BigQuery

      Cloud Functions

      사용량 가정

      1. 월간 Document AI 양식 파서 API 호출 1,000회

      2. 월간 스토리지 100GiB

      3. 월간 쿼리 1TiB

      4. RAM: 512MB, CPU: 800MHz

      계산기의 계산 세부정보 보기

      월별 예상 비용(USD)

      $71.87

      이미지에서 텍스트 추출
      사용 제품

      Cloud Vision

      Cloud Storage

      Pub/Sub

      Cloud Run

      사용량 가정

      1. 월간 Cloud Vision OCR API 호출 15,000회

      2. 월간 스토리지 100GiB

      3. 1.25GiB CPU 1개

      4. Pub/Sub를 통해 매일 4GiB 게시

      계산기에서 계산 세부정보 보기

      월별 예상 비용(USD)

      $27.36

      Document AI, Vision API, AutoML의 전체 단가 가격 책정 세부정보를 확인하세요.

      가격 계산기

      필요한 모든 도구를 한곳으로 가져와 프로젝트 비용을 예측합니다.

      커스텀 견적

      영업팀에 문의하여 조직의 고유한 요구사항에 맞는 커스텀 견적을 받아 보세요.

      개념 증명 시작

      신규 고객에게는 최대 $300의 무료 크레딧이 제공되어 Google Cloud 제품을 사용해 볼 수 있습니다

      대규모 프로젝트가 있나요?

      OCR 솔루션 및 사용 사례의 코드 샘플 보기

      Cloud Vision API로 라벨을 감지하는 방법 알아보기

      Google AI로 문서 처리 파이프라인을 자동화하는 방법 알아보기

      Google Cloud
      • ‪English‬
      • ‪Deutsch‬
      • ‪Español‬
      • ‪Español (Latinoamérica)‬
      • ‪Français‬
      • ‪Indonesia‬
      • ‪Italiano‬
      • ‪Português (Brasil)‬
      • ‪简体中文‬
      • ‪繁體中文‬
      • ‪日本語‬
      • ‪한국어‬
      콘솔
      Google Cloud