실습 설정 안내 및 요구사항

계정과 진행 상황을 보호하세요. 이 실습을 실행하려면 항상 시크릿 브라우저 창과 실습 사용자 인증 정보를 사용하세요.

Document AI 프로세서 만들기 및 테스트

실습 20분 universal_currency_alt 크레딧 1개 show_chart 입문

info 이 실습에는 학습을 지원하는 AI 도구가 통합되어 있을 수 있습니다.

GSP924
개요
설정 및 요건
태스크 1. Cloud Document AI API 사용 설정
태스크 2. 일반적인 양식 프로세서 만들기 및 테스트
태스크 3. 실습 인스턴스 설정
태스크 4. curl을 사용하여 동기식 문서 처리 요청
태스크 5. Python 클라이언트 라이브러리를 사용하여 Document AI 양식 프로세서 테스트
태스크 6. Document AI Python 코드 실행
수고하셨습니다

이 콘텐츠는 아직 휴대기기에 최적화되지 않음

최상의 경험을 위해 데스크톱 컴퓨터에서 이메일로 전송된 링크를 사용하여 방문하세요.

GSP924

Google Cloud 사용자 주도형 실습 로고

개요

Document AI API는 문서, 이메일과 같은 비정형 데이터를 가져와서 데이터를 더 쉽게 이해, 분석, 사용할 수 있도록 해주는 문서 이해 솔루션입니다. 이 실습에서 사용된 일반 양식 프로세서를 사용하면 간단한 문서에서 키-값 쌍을 추출할 수 있습니다.

이 실습에서는 Document AI를 사용하여 문서 파서를 만들고, Cloud 콘솔 및 명령줄을 사용하여 Google Cloud를 통해 처리할 문서를 제출하고, Python을 사용하여 동기식 API 호출을 수행하는 방법을 알아봅니다.

학습할 내용

다음 태스크를 수행하는 방법을 알아봅니다.

콘솔을 사용하여 Document AI 프로세서를 만들고 테스트합니다.
명령줄을 사용하여 Document AI 프로세서를 테스트합니다.
Python을 사용하여 Document AI 동기식 API 호출을 테스트합니다.

설정 및 요건

실습 시작 버튼을 클릭하기 전에

다음 안내를 확인하세요. 실습에는 시간 제한이 있으며 일시중지할 수 없습니다. 실습 시작을 클릭하면 타이머가 시작됩니다. 이 타이머는 Google Cloud 리소스를 사용할 수 있는 시간이 얼마나 남았는지를 표시합니다.

실무형 실습을 통해 시뮬레이션이나 데모 환경이 아닌 실제 클라우드 환경에서 실습 활동을 진행할 수 있습니다. 실습 시간 동안 Google Cloud에 로그인하고 액세스하는 데 사용할 수 있는 새로운 임시 사용자 인증 정보가 제공됩니다.

이 실습을 완료하려면 다음을 준비해야 합니다.

표준 인터넷 브라우저 액세스 권한(Chrome 브라우저 권장)

참고: 이 실습을 실행하려면 시크릿 모드(권장) 또는 시크릿 브라우저 창을 사용하세요. 개인 계정과 학습자 계정 간의 충돌로 개인 계정에 추가 요금이 발생하는 일을 방지해 줍니다.

실습을 완료하기에 충분한 시간(실습을 시작하고 나면 일시중지할 수 없음)

참고: 이 실습에는 학습자 계정만 사용하세요. 다른 Google Cloud 계정을 사용하는 경우 해당 계정에 비용이 청구될 수 있습니다.

실습을 시작하고 Google Cloud 콘솔에 로그인하는 방법

실습 시작 버튼을 클릭합니다. 실습 비용을 결제해야 하는 경우 결제 수단을 선택할 수 있는 대화상자가 열립니다. 왼쪽에는 다음과 같은 항목이 포함된 실습 세부정보 창이 있습니다.
- Google Cloud 콘솔 열기 버튼
- 남은 시간
- 이 실습에 사용해야 하는 임시 사용자 인증 정보
- 필요한 경우 실습 진행을 위한 기타 정보
Google Cloud 콘솔 열기를 클릭합니다(Chrome 브라우저를 실행 중인 경우 마우스 오른쪽 버튼으로 클릭하고 시크릿 창에서 링크 열기를 선택합니다).

실습에서 리소스가 가동되면 다른 탭이 열리고 로그인 페이지가 표시됩니다.

팁: 두 개의 탭을 각각 별도의 창으로 나란히 정렬하세요.
참고: 계정 선택 대화상자가 표시되면 다른 계정 사용을 클릭합니다.
필요한 경우 아래의 사용자 이름을 복사하여 로그인 대화상자에 붙여넣습니다.
{{{user_0.username | "Username"}}}
실습 세부정보 창에서도 사용자 이름을 확인할 수 있습니다.
다음을 클릭합니다.
아래의 비밀번호를 복사하여 시작하기 대화상자에 붙여넣습니다.
{{{user_0.password | "Password"}}}
실습 세부정보 창에서도 비밀번호를 확인할 수 있습니다.
다음을 클릭합니다.
중요: 실습에서 제공하는 사용자 인증 정보를 사용해야 합니다. Google Cloud 계정 사용자 인증 정보를 사용하지 마세요. 참고: 이 실습에 자신의 Google Cloud 계정을 사용하면 추가 요금이 발생할 수 있습니다.
이후에 표시되는 페이지를 클릭하여 넘깁니다.
- 이용약관에 동의합니다.
- 임시 계정이므로 복구 옵션이나 2단계 인증을 추가하지 않습니다.
- 무료 체험판을 신청하지 않습니다.

잠시 후 Google Cloud 콘솔이 이 탭에서 열립니다.

참고: Google Cloud 제품 및 서비스에 액세스하려면 탐색 메뉴를 클릭하거나 검색창에 제품 또는 서비스 이름을 입력합니다. 탐색 메뉴 아이콘 및 검색창

Cloud Shell 활성화

Cloud Shell은 다양한 개발 도구가 탑재된 가상 머신으로, 5GB의 영구 홈 디렉터리를 제공하며 Google Cloud에서 실행됩니다. Cloud Shell을 사용하면 명령줄을 통해 Google Cloud 리소스에 액세스할 수 있습니다.

Google Cloud 콘솔 상단에서 Cloud Shell 활성화 를 클릭합니다.
다음 창을 클릭합니다.
- Cloud Shell 정보 창을 통해 계속 진행합니다.
- 사용자 인증 정보를 사용하여 Google Cloud API를 호출할 수 있도록 Cloud Shell을 승인합니다.

연결되면 사용자 인증이 이미 처리된 것이며 프로젝트가 학습자의 PROJECT_ID, (으)로 설정됩니다. 출력에 이 세션의 PROJECT_ID를 선언하는 줄이 포함됩니다.

Your Cloud Platform project in this session is set to {{{project_0.project_id | "PROJECT_ID"}}}

gcloud는 Google Cloud의 명령줄 도구입니다. Cloud Shell에 사전 설치되어 있으며 명령줄 자동 완성을 지원합니다.

(선택사항) 다음 명령어를 사용하여 활성 계정 이름 목록을 표시할 수 있습니다.

gcloud auth list

승인을 클릭합니다.

출력:

ACTIVE: * ACCOUNT: {{{user_0.username | "ACCOUNT"}}} To set the active account, run: $ gcloud config set account `ACCOUNT`

(선택사항) 다음 명령어를 사용하여 프로젝트 ID 목록을 표시할 수 있습니다.

gcloud config list project

출력:

[core] project = {{{project_0.project_id | "PROJECT_ID"}}}

참고: gcloud 전체 문서는 Google Cloud에서 gcloud CLI 개요 가이드를 참고하세요.

태스크 1. Cloud Document AI API 사용 설정

이 태스크에서는 Document AI API를 사용 설정하고, 일반적인 양식 프로세서를 만들고 테스트합니다. 일반적인 양식 프로세서는 어떤 유형의 문서도 처리 가능하며, 문서 내에서 식별할 수 있는 모든 텍스트 콘텐츠를 추출합니다. 인쇄된 텍스트뿐만 아니라 필기 텍스트도 텍스트 방향에 관계없이 처리할 수 있으며, 여러 언어를 지원합니다. 또한 양식 데이터 요소가 서로 어떻게 연관되어 있는지 이해하여 텍스트 라벨이 있는 양식 필드의 키-값 쌍을 추출할 수도 있습니다.

Cloud Document AI API 사용 설정하기

Document AI를 사용하려면 우선 API를 사용 설정해야 합니다.

탐색 메뉴()에서 API 및 서비스 > 라이브러리를 클릭합니다.
Cloud Document AI API를 검색한 다음, 사용 설정 버튼을 클릭하여 Google Cloud 프로젝트에서 API를 사용합니다.

Cloud Document AI API가 이미 사용 설정되어 있는 경우 관리 버튼이 표시되며, 그러면 실습의 나머지 부분을 계속 진행할 수 있습니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.

Cloud Document AI API 사용 설정

태스크 2. 일반적인 양식 프로세서 만들기 및 테스트

다음으로 Document AI 양식 파서를 사용하여 Document AI 프로세서를 만듭니다.

프로세서 만들기

콘솔의 탐색 메뉴()에서 Document AI > 개요를 클릭합니다.
프로세서 살펴보기를 클릭합니다.
일반적인 프로세서 유형인 양식 파서에 대해 프로세서 만들기를 클릭합니다.
프로세서 이름을 form-parser로 지정하고, 리전은 목록에서 US(미국)를 선택합니다.
만들기를 클릭하여 일반적인 form-parser 프로세서를 생성합니다.

그러면 프로세서가 만들어지고 프로세서 ID, 상태, 예측 엔드포인트가 표시된 프로세서 세부정보 페이지로 돌아가게 됩니다.

프로세서 ID를 적어 둡니다. 나중에 curl을 사용하여 API에 POST 호출을 수행하는 태스크에서 이 ID를 사용합니다.

샘플 양식 다운로드하기

이 태스크에서는 Cloud Storage에서 샘플 양식을 다운로드합니다. 다음 태스크에서 이 양식을 업로드하려면 먼저 로컬 머신에 다운로드해야 합니다.

form.pdf 파일을 로컬 머신에 다운로드합니다.

파일이 바로 다운로드됩니다. 파일이 브라우저에서 열리면 브라우저 내의 파일 컨트롤을 사용하여 파일을 다운로드합니다. form.pdf 파일은 샘플 수기 데이터가 포함된 건강 상태 확인 양식입니다.

Document AI 처리를 위한 양식 업로드하기

다음으로 다운로드한 샘플 양식을 form-parser 프로세서에 업로드합니다. 그러면 분석이 진행되고 결과가 콘솔에 표시됩니다.

form-parser 페이지에서 테스트 문서 업로드 버튼을 클릭합니다. 대화상자가 팝업되면 이전 태스크에서 다운로드한 파일을 선택하여 업로드합니다.

진행률 표시줄은 분석 프로세스의 완료 수준을 나타내며, 마지막으로 결과가 표시됩니다. 일반 프로세서가 양식의 데이터를 키/값 쌍 집합으로 캡처한 것을 확인할 수 있습니다.

소스 문서에서 파싱된 키-값 쌍이 콘솔에 표시됩니다. 왼쪽 창에는 데이터가 나열되어 있고 오른쪽 창에는 파싱된 문서의 소스 위치가 파란색 사각형으로 강조 표시되어 있습니다. 출력을 검토하고 결과를 소스 데이터와 비교합니다.

파서 분석, 왼쪽 창의 결과 데이터

이 태스크에서는 명령줄에서 API 호출을 수행하여 Document AI 일반 양식 프로세서를 테스트합니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.

일반적인 양식 프로세서 만들기 및 테스트

태스크 3. 실습 인스턴스 설정

이 섹션에서는 Document AI API를 사용하도록 실습 인스턴스를 설정합니다.

SSH를 사용하여 실습 VM 인스턴스에 연결하기

그 외 실습 태스크는 document-ai-dev라는 실습 VM에서 수행합니다.

탐색 메뉴()에서 Compute Engine > VM 인스턴스를 클릭합니다.
document-ai-dev라는 VM 인스턴스의 SSH 링크를 클릭합니다.

이 단계에서는 태스크 1에서 만든 프로세서의 Document AI 프로세서 ID가 필요합니다. 저장하지 않은 경우 Cloud 콘솔 탭에서 다음을 수행합니다.

탐색 메뉴()를 엽니다.
Document AI > 프로세서를 클릭합니다.
프로세서 이름을 클릭하여 세부정보 페이지를 엽니다.
여기에서 프로세서 ID를 복사할 수 있습니다.

SSH 세션에서 Document AI 프로세서 ID를 포함하는 환경 변수를 만듭니다. [your processor id] 자리표시자를 바꿔야 합니다.

export PROCESSOR_ID=[your processor id]

SSH 세션에서 환경 변수에 Document AI 프로세서 ID가 포함되어 있는지 확인합니다.

echo Your processor ID is:$PROCESSOR_ID

이렇게 하면 다음과 비슷한 프로세서 ID가 출력됩니다.

프로세서 ID는 4897d834d2f4415d입니다.

이 SSH 세션을 사용하여 이 실습의 나머지 태스크를 수행합니다.

API 요청 인증하기

Document AI API에 요청을 수행하려면 유효한 사용자 인증 정보를 제공해야 합니다. 이 태스크에서는 서비스 계정을 만들고, 해당 서비스 계정에 부여된 권한을 실습에 필요한 권한으로 제한한 다음, Document AI API 요청을 인증하는 데 사용할 수 있는 해당 계정에 대한 사용자 인증 정보를 생성합니다.

이 실습 전체에서 사용할 프로젝트 ID로 환경 변수를 설정합니다.

export PROJECT_ID=$(gcloud config get-value core/project)

다음을 사용하여 Document AI API에 액세스할 새 서비스 계정을 만듭니다.

export SA_NAME="document-ai-service-account" gcloud iam service-accounts create $SA_NAME --display-name $SA_NAME

서비스 계정을 Document AI API 사용자 역할에 결합합니다.

gcloud projects add-iam-policy-binding ${PROJECT_ID} \ --member="serviceAccount:$SA_NAME@${PROJECT_ID}.iam.gserviceaccount.com" \ --role="roles/documentai.apiUser"

새 서비스 계정으로 로그인하는 데 사용될 사용자 인증 정보를 만들고 작업 디렉터리의 key.json이라는 JSON 파일에 저장합니다.

gcloud iam service-accounts keys create key.json \ --iam-account $SA_NAME@${PROJECT_ID}.iam.gserviceaccount.com

라이브러리에서 사용자 인증 정보를 찾는 데 사용하는 GOOGLE_APPLICATION_CREDENTIALS 환경 변수를 사용자 인증 정보 파일을 가리키도록 설정합니다.

export GOOGLE_APPLICATION_CREDENTIALS="$PWD/key.json"

GOOGLE_APPLICATION_CREDENTIALS 환경 변수가 앞에서 만든 사용자 인증 정보 JSON 파일의 전체 경로로 설정되어 있는지 확인합니다.

echo $GOOGLE_APPLICATION_CREDENTIALS

이 환경 변수는 gcloud 명령줄 도구에서 명령어를 실행할 때 사용할 사용자 인증 정보를 지정하는 데 사용됩니다. 이러한 양식 인증에 대한 자세한 내용은 애플리케이션 기본 사용자 인증 정보 가이드를 참조하세요.

샘플 양식을 VM 인스턴스에 다운로드하기

이제 샘플 양식을 다운로드한 다음 base64 인코딩하여 Document AI API에 제출할 수 있습니다.

SSH 창에 다음 명령어를 입력하여 샘플 양식을 작업 디렉터리에 다운로드합니다.

gsutil cp gs://spls/gsp924/health-intake-form.pdf .

처리를 위해 base64 인코딩된 양식을 제출하는 JSON 요청 파일을 만듭니다.

echo '{"inlineDocument": {"mimeType": "application/pdf","content": "' > temp.json base64 health-intake-form.pdf >> temp.json echo '"}}' >> temp.json cat temp.json | tr -d \\n > request.json

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.

API 요청 인증 및 샘플 양식 다운로드

태스크 4. curl을 사용하여 동기식 문서 처리 요청

이 태스크에서는 curl을 사용하여 동기식 Document AI API 엔드포인트를 호출하여 샘플 문서를 처리합니다.

curl을 통해 처리할 양식을 제출합니다. 결과는 output.json에 저장됩니다.

export LOCATION="us" export PROJECT_ID=$(gcloud config get-value core/project) curl -X POST \ -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \ -H "Content-Type: application/json; charset=utf-8" \ -d @request.json \ https://${LOCATION}-documentai.googleapis.com/v1beta3/projects/${PROJECT_ID}/locations/${LOCATION}/processors/${PROCESSOR_ID}:process > output.json

output.json 파일에 API 호출 결과가 포함되어 있는지 확인합니다.

cat output.json

인증 오류가 발생하면 GOOGLE_APPLICATION_CREDENTIALS 환경 변수가 이전에 만든 사용자 인증 정보 JSON 파일을 가리키도록 설정했는지 확인합니다. IAM 정책이 전파되는 데 몇 분 정도 걸릴 수 있으므로 오류가 발생하면 다시 시도해 보세요.

Cloud IAM 서비스 계정의 액세스 토큰은 즉시 생성되어 Authorization: HTTP 헤더를 사용하여 API에 전달됩니다. 응답에는 output.json 파일에 저장된 JSON 형식의 데이터가 포함되어 있습니다.

양식 항목 추출하기

다음으로 샘플 양식에서 추출한 일부 정보를 살펴봅니다.

문서에서 감지된 원시 텍스트를 다음과 같이 추출합니다.

sudo apt-get update sudo apt-get install jq cat output.json | jq -r ".document.text"

업로드된 문서에서 감지된 모든 텍스트가 나열됩니다.

양식 프로세서가 감지한 양식 필드 목록을 추출합니다.

cat output.json | jq -r ".document.pages[].formFields"

문서에서 감지된 모든 양식 필드의 객체 데이터가 나열됩니다. 각 양식의 textAnchor.startIndex 및 textAnchor.endIndex 값을 사용하여 document.text 필드에서 감지된 양식의 이름을 찾을 수 있습니다. 다음 태스크에서 사용할 Python 스크립트가 이 매핑을 수행합니다.

JSON 파일에는 base64 인코딩된 소스 문서와 감지된 모든 텍스트 및 문서 속성이 포함되어 있어 파일 크기가 상당히 큽니다. 텍스트 편집기에서 파일을 열거나 jq와 같은 JSON 쿼리 도구를 사용하여 JSON 파일을 탐색할 수 있습니다.

문서가 Document AI API로 처리되었는지 확인합니다.

태스크 5. Python 클라이언트 라이브러리를 사용하여 Document AI 양식 프로세서 테스트

Python Document AI 클라이언트 라이브러리를 사용하여 Document AI API에 동기식 호출을 수행합니다.

이제 동기식 엔드포인트를 사용하여 문서를 처리합니다. 한 번에 대량의 문서를 처리해야 할 경우에는 비동기식 API를 사용하면 됩니다. Document AI API 사용에 대해 자세히 알아보려면 이 가이드를 읽어보세요.

Python 스크립트를 직접 실행하려면 스크립트에 적절한 사용자 인증 정보를 제공해야 합니다. 그러면 스크립트가 올바른 권한으로 구성된 서비스 계정을 사용하여 API를 호출할 수 있습니다. 이러한 인증 형식을 구성하는 방법에 대한 자세한 내용은 서비스 계정으로 인증 문서를 참조하세요.

Document AI Python 클라이언트를 사용하도록 VM 인스턴스 구성하기

이제 Python Google Cloud 클라이언트 라이브러리를 VM 인스턴스에 설치합니다.

SSH 터미널 셸에 다음 명령어를 입력하여 실습 파일을 VM 인스턴스로 가져옵니다.

gsutil cp gs://spls/gsp924/synchronous_doc_ai.py .

다음 명령어를 입력하여 Document AI에 필요한 Python 클라이언트 라이브러리와 이 실습에 필요한 다른 라이브러리를 설치합니다.

sudo apt install python3-pip python3 -m pip install --upgrade google-cloud-documentai google-cloud-storage prettytable

라이브러리가 성공적으로 설치되었음을 알리는 출력이 표시됩니다.

Document AI API Python 코드 검토하기

잠시 시간을 내어 샘플 파일에서 Python 코드를 검토합니다. vi 또는 nano와 같은 원하는 편집기를 사용하여 SSH 세션에서 코드를 검토하거나, 이전 섹션의 명령어를 사용하여 예시 코드를 Cloud Shell에 복사하고 코드 편집기를 사용하여 소스 코드를 볼 수도 있습니다.

처음 두 개의 코드 블록은 필요한 라이브러리를 가져오고 파라미터를 파싱하여 Document AI 프로세서와 입력 데이터를 식별하는 변수를 초기화합니다.

import argparse from google.cloud import documentai_v1beta3 as documentai from google.cloud import storage from prettytable import PrettyTable parser = argparse.ArgumentParser() parser.add_argument("-P", "--project_id", help="Google Cloud Project ID") parser.add_argument("-D", "--processor_id", help="Document AI Processor ID") parser.add_argument("-F", "--file_name", help="Input file name", default="form.pdf") parser.add_argument("-L", "--location", help="Processor Location", default="us") args = parser.parse_args()

process_document 함수는 Document AI 프로세서를 동기식으로 호출하는 데 사용됩니다. 이 함수는 Document AI API 클라이언트 객체를 만듭니다.

API 호출에 필요한 프로세서 이름은 project_id, location, processor_id 파라미터를 사용해 만들며, 처리할 문서를 읽고 mime_type 구조로 저장합니다.

그런 다음 프로세서 이름과 문서가 Document API 클라이언트 객체에 전달되고 API에 대한 동기식 호출이 이루어집니다. 요청이 성공하면 반환된 문서 객체에는 Document AI 프로세서가 감지한 데이터를 담고 있는 속성이 포함됩니다.

def process_document(project_id, location, processor_id, file_path ): # Instantiates a client client = documentai.DocumentProcessorServiceClient() # The full resource name of the processor, e.g.: # projects/project-id/locations/location/processor/processor-id # You must create new processors in the Cloud Console first name = f"projects/{project_id}/locations/{location}/processors/{processor_id}" # Read the file into memory with open(file_path, "rb") as image: image_content = image.read() # Create the document object document = {"content": image_content, "mime_type": "application/pdf"} # Configure the process request request = {"name": name, "document": document} # Use the Document AI client synchronous endpoint to process the request result = client.process_document(request=request) return result.document

그런 다음 스크립트가 필요한 파라미터로 process_document 함수를 호출하고 document 변수에 응답을 저장합니다.

document = process_document(args.project_id,args.location,args.processor_id,args.file_name )

마지막 코드 블록은 문서에서 감지된 모든 텍스트를 포함하는 .text 속성을 출력한 다음 양식 파서가 감지한 각 양식 필드에 대한 텍스트 앵커 데이터를 사용하여 양식 정보를 표시합니다.

print("Document processing complete.") # print the raw text print("Text: \n{}\n".format(document.text)) # Define a function to retrieve an object dictionary for a named element def get_text(doc_element: dict, document: dict): """ Document AI identifies form fields by their offsets in document text. This function converts offsets to text snippets. """ response = "" # If a text segment spans several lines, it will # be stored in different text segments. for segment in doc_element.text_anchor.text_segments: start_index = ( int(segment.start_index) if segment in doc_element.text_anchor.text_segments else 0 ) end_index = int(segment.end_index) response += document.text[start_index:end_index] return response # Grab each key/value pair and their corresponding confidence scores. document_pages = document.pages print("Form data detected:\n") # For each page fetch each form field and display fieldname, value and confidence scores for page in document_pages: print("Page Number:{}".format(page.page_number)) for form_field in page.form_fields: fieldName=get_text(form_field.field_name,document) nameConfidence = round(form_field.field_name.confidence,4) fieldValue = get_text(form_field.field_value,document) valueConfidence = round(form_field.field_value.confidence,4) print(fieldName+fieldValue +" (Confidence Scores: (Name) "+str(nameConfidence)+", (Value) "+str(valueConfidence)+")\n")

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.

Document AI 양식 프로세서 테스트

태스크 6. Document AI Python 코드 실행

샘플 코드를 실행하고 이전과 동일한 파일을 처리합니다.

프로젝트 ID와 IAM 서비스 계정 사용자 인증 정보 파일의 환경 변수를 만듭니다.

export PROJECT_ID=$(gcloud config get-value core/project) export GOOGLE_APPLICATION_CREDENTIALS="$PWD/key.json"

필요한 파라미터를 사용하여 synchronous_doc_ai.py Python 프로그램을 호출합니다.

python3 synchronous_doc_ai.py \ --project_id=$PROJECT_ID \ --processor_id=$PROCESSOR_ID \ --location=us \ --file_name=health-intake-form.pdf | tee results.txt

다음 텍스트 블록 출력이 표시됩니다. FakeDoc M.D. HEALTH INTAKE FORM Please fill out the questionnaire carefully. The information you provide will be used to complete your health profile and will be kept confidential. Date: Sally Walker Name: 9/14/19 ...

첫 번째 텍스트 블록은 문서의 모든 텍스트를 포함하는 단일 텍스트 요소입니다. 이 텍스트 블록에는 양식 기반 데이터에 대한 인식이 포함되어 있지 않으므로 Date 및 Name 항목과 같은 일부 항목이 이 원시 텍스트 값에 혼합되어 있습니다.

그러면 코드는 form-parser가 문서 구조에서 추론한 양식 데이터를 사용하여 데이터의 구조화된 뷰를 출력합니다. 이 구조화된 출력에는 양식 필드 이름과 값에 대한 신뢰도 점수도 포함됩니다. 이 섹션의 출력은 Date 및 Name 양식 필드와 해당 값 사이의 연결에서 볼 수 있듯이 양식 필드 이름과 값 사이의 훨씬 더 유용한 매핑을 제공합니다.

Form data detected: Page Number:1 Phone #: (906) 917-3486 (Confidence Scores: (Name) 1.0, (Value) 1.0) ... Date: 9/14/19 (Confidence Scores: (Name) 0.9999, (Value) 0.9999) ... Name: Sally Walker (Confidence Scores: (Name) 0.9973, (Value) 0.9973) ...

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.

Document AI Python 코드 실행

수고하셨습니다

Document AI API를 사용하여 일반 양식 프로세서를 통해 문서에서 데이터를 추출했습니다. 이 실습에서는 콘솔과 명령줄을 사용하여 Document AI 프로세서를 만들고 테스트했으며 Python을 사용하여 Document AI 동기식 API 호출을 수행했습니다.

다음 단계/더 학습하기

Cloud Document AI API 문서에서 자세히 알아보세요.

Google Cloud 교육 및 자격증

Google Cloud 기술을 최대한 활용하는 데 도움이 됩니다. Google 강의에는 빠른 습득과 지속적인 학습을 지원하는 기술적인 지식과 권장사항이 포함되어 있습니다. 기초에서 고급까지 수준별 학습을 제공하며 바쁜 일정에 알맞은 주문형, 실시간, 가상 옵션이 포함되어 있습니다. 인증은 Google Cloud 기술에 대한 역량과 전문성을 검증하고 입증하는 데 도움이 됩니다.

설명서 최종 업데이트: 2024년 4월 17일

실습 최종 테스트: 2023년 12월 7일

Document AI 프로세서 만들기 및 테스트

GSP924

개요

학습할 내용

설정 및 요건

실습 시작 버튼을 클릭하기 전에

실습을 시작하고 Google Cloud 콘솔에 로그인하는 방법

Cloud Shell 활성화

태스크 1. Cloud Document AI API 사용 설정

Cloud Document AI API 사용 설정하기

태스크 2. 일반적인 양식 프로세서 만들기 및 테스트

프로세서 만들기

샘플 양식 다운로드하기

Document AI 처리를 위한 양식 업로드하기

태스크 3. 실습 인스턴스 설정

SSH를 사용하여 실습 VM 인스턴스에 연결하기

API 요청 인증하기

샘플 양식을 VM 인스턴스에 다운로드하기

태스크 4. curl을 사용하여 동기식 문서 처리 요청

양식 항목 추출하기

태스크 5. Python 클라이언트 라이브러리를 사용하여 Document AI 양식 프로세서 테스트

Document AI Python 클라이언트를 사용하도록 VM 인스턴스 구성하기

Document AI API Python 코드 검토하기

태스크 6. Document AI Python 코드 실행

수고하셨습니다

다음 단계/더 학습하기

Google Cloud 교육 및 자격증

시작하기 전에

시크릿 브라우징 사용

콘솔에 로그인

시크릿 브라우징을 사용하여 실습 실행하기