Notice
Recent Posts
Recent Comments
Link
250x250
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 배포
- Ai
- CSS
- threejs
- 티스토리챌린지
- jquery
- polygon
- 회고
- WSL
- Remix
- nginx
- 블록체인
- chatGPT
- React
- huggingface
- NextJS
- nft
- exceljs
- node
- miniconda
- Kaikas
- 라라벨
- netfunnel
- PM2
- metamask
- Laravel
- AWS
- docker
- Python
- 오블완
Archives
- Today
- Total
목록프로세스 (1)
박주니 개발 정리

원본 PDF 분석시 주의사항1. Google Cloud Vision을 사용하는 이유PDF는 이미지로 되어있기 때문에 이미지내 텍스트를 추출하는 방식으로 접근해야합니다. 그런데 이때 화질에 따라서 텍스트가 깨져서 나올 수 있기 때문에 Tesseract OCR 무료 라이브러리 적용해도 제대로 추출이 안될 수 있기 때문에 Google Cloud Vsion을 사용해서 이미지내 텍스트 추출을 진행했습니다. 2. Google Cloud Storage를 사용하는 이유 Google Cloud Vision을 이용시 Storage를 사용 안할 때에는 이미지 url 하나에서 텍스트 추출할 때이고 그 외에 보통 PDF는 한장이 아니라 여러장을 분석해야하기 때문에 Google Cloud Storage내 저장 후 가져오는 방식..
회고
2025. 2. 25. 15:50