박주니 개발 정리

chatgpt한테 너가 사용하고 있는 STT 기능 어떤거냐고 물어본다면 본문

일상

chatgpt한테 너가 사용하고 있는 STT 기능 어떤거냐고 물어본다면

박주니 2024. 11. 22. 16:52
728x90
반응형

질문) 너 이번에 STT 기능 추가 된거 같던데 어떤걸로 사용하고 있어?

답변)

아, STT(음성을 텍스트로 변환) 기능이 추가되었군요! 제가 그 기능을 사용할 수 있다면, 특정 음성 데이터를 텍스트로 변환하는 방식으로 작동할 겁니다. 보통 STT 기능은 OpenAI Whisper 같은 기술을 기반으로 하거나, 클라우드 기반 STT API를 통해 작동합니다.

혹시 STT 관련해서 더 궁금한 점이나 특정 도움 필요한 부분이 있나요? :)

 

생각)

AICC 음성봇을 진행할 때 아무리 RAG 및 LLM을 잘만들어놔도 STT 부분에서 제대로 음성에 대한 TEXT가 제대로 안들어오면 유사도 측정을 통해 최대한 잡는다고해도 한계가 있는것을 볼 수가 있었습니다. 

그런데 이번에 openai stt 테스트하는 거 보니깐 거의 사람이 인지하는 것처럼 되는거보면 제대로 STT가 되는 것을 

볼 수 있어서 어떤 STT로 했는지 궁금했는데 OpenAI Whisper로 사용했다고 하니깐 추후에 진행해보고 후기 남기겠습니다.

Comments