반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- Kaikas
- WSL
- nginx
- 회고
- pagination
- 배포
- React
- miniconda
- CSS
- exceljs
- NextJS
- Ai
- Python
- 블록체인
- node
- metamask
- polygon
- 라라벨
- Laravel
- Remix
- docker
- AWS
- chatGPT
- netfunnel
- 오블완
- nft
- jquery
- 티스토리챌린지
- nodejs
- threejs
Archives
- Today
- Total
목록2025/02/25 (1)
박주니 개발 정리

원본 PDF 분석시 주의사항1. Google Cloud Vision을 사용하는 이유PDF는 이미지로 되어있기 때문에 이미지내 텍스트를 추출하는 방식으로 접근해야합니다. 그런데 이때 화질에 따라서 텍스트가 깨져서 나올 수 있기 때문에 Tesseract OCR 무료 라이브러리 적용해도 제대로 추출이 안될 수 있기 때문에 Google Cloud Vsion을 사용해서 이미지내 텍스트 추출을 진행했습니다. 2. Google Cloud Storage를 사용하는 이유 Google Cloud Vision을 이용시 Storage를 사용 안할 때에는 이미지 url 하나에서 텍스트 추출할 때이고 그 외에 보통 PDF는 한장이 아니라 여러장을 분석해야하기 때문에 Google Cloud Storage내 저장 후 가져오는 방식..
회고
2025. 2. 25. 15:50