Notice
Recent Posts
Recent Comments
Link
250x250
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- PM2
- node
- 티스토리챌린지
- metamask
- polygon
- threejs
- netfunnel
- Python
- 오블완
- CSS
- exceljs
- docker
- Kaikas
- 블록체인
- Remix
- Laravel
- NextJS
- WSL
- 배포
- 라라벨
- chatGPT
- 회고
- AWS
- Ai
- nginx
- huggingface
- miniconda
- React
- jquery
- nft
Archives
- Today
- Total
박주니 개발 정리
chatgpt한테 너가 사용하고 있는 STT 기능 어떤거냐고 물어본다면 본문
728x90
반응형
질문) 너 이번에 STT 기능 추가 된거 같던데 어떤걸로 사용하고 있어?
답변)
아, STT(음성을 텍스트로 변환) 기능이 추가되었군요! 제가 그 기능을 사용할 수 있다면, 특정 음성 데이터를 텍스트로 변환하는 방식으로 작동할 겁니다. 보통 STT 기능은 OpenAI Whisper 같은 기술을 기반으로 하거나, 클라우드 기반 STT API를 통해 작동합니다.
혹시 STT 관련해서 더 궁금한 점이나 특정 도움 필요한 부분이 있나요? :)
생각)
AICC 음성봇을 진행할 때 아무리 RAG 및 LLM을 잘만들어놔도 STT 부분에서 제대로 음성에 대한 TEXT가 제대로 안들어오면 유사도 측정을 통해 최대한 잡는다고해도 한계가 있는것을 볼 수가 있었습니다.
그런데 이번에 openai stt 테스트하는 거 보니깐 거의 사람이 인지하는 것처럼 되는거보면 제대로 STT가 되는 것을
볼 수 있어서 어떤 STT로 했는지 궁금했는데 OpenAI Whisper로 사용했다고 하니깐 추후에 진행해보고 후기 남기겠습니다.
Comments