주의: API 키는 비밀번호와 동일합니다. GitHub, 블로그, SNS에 절대 공개하지 마세요.
키가 노출되면 즉시 Revoke(삭제)하고 새 키를 발급받으세요.
사용 한도 설정을 통해 예상치 못한 과다 청구를 방지할 수 있습니다.
비용 관리 팁
OpenAI 콘솔 → Usage Limits에서 월 한도 설정 권장 (예: $5)
Whisper API는 분당 $0.006 → 100분 파일 기준 약 $0.60 (≈ 800원)
response_format=text로 설정하면 JSON보다 빠르고 저렴하게 처리
다른 STT 서비스와 비교
클로바노트, 네이버 클로바 등 기존 서비스와 비교했을 때의 장단점을 정리했습니다.
항목
이 앱 (Whisper)
클로바노트
네이버 클로바
Google STT
파일 크기 제한
100MB+ 지원
200MB
60분 제한
10MB 제한
MP3 지원
✓
✓
✓
변환 필요
M4A 지원
✓
✓
✗
✗
한국어 정확도
매우 높음
매우 높음
높음
보통
타임스탬프
✓ (선택)
✓
✓
✓
서버 저장 여부
없음 (로컬)
저장됨
저장됨
저장됨
비용
$0.006/분
무료 (광고)
유료 플랜
$0.016/분
오프라인 사용
불가 (API)
불가
불가
불가
💡
결론: 개인정보가 중요한 회의록, 내부 인터뷰, 민감한 강의 내용을 변환할 때 특히 유용합니다.
파일이 외부 서버에 저장되지 않아 보안에 민감한 환경에서도 안심하고 사용할 수 있습니다.
활용 사례
📋 회의록 자동 작성
스마트폰으로 녹음한 회의 음성(보통 M4A 형식)을 업로드하면 텍스트로 변환됩니다.
타임스탬프 모드를 활용하면 어느 시점에 어떤 말이 나왔는지 확인하기도 편리합니다.
60분 회의 기준 약 3~5분 이내 처리됩니다.
📚 강의·세미나 텍스트화
유튜브 강의나 사내 세미나를 녹음한 파일을 텍스트로 변환해 학습 자료로 활용할 수 있습니다.
특히 건축, 법률, 의학 등 전문 용어가 많은 영역에서도 Whisper의 인식 정확도가 높습니다.
🎙 인터뷰·팟캐스트 자막 제작
타임스탬프 포함 출력 모드를 사용하면 SRT 자막 파일 형식으로 변환하기 쉬운 텍스트를 얻을 수 있습니다.
인터뷰 콘텐츠, 팟캐스트 쇼 노트 작성에 유용합니다.
🏢 현장 보고·점검 음성 메모
건설 현장이나 시설 점검 시 음성으로 메모한 내용을 텍스트화하여 보고서에 바로 활용할 수 있습니다.
현장에서 녹음 후 사무실에서 바로 텍스트로 변환해 문서화하는 워크플로우에 최적입니다.
자주 묻는 질문
파일이 외부에 저장되나요? ▼
음성 파일은 OpenAI Whisper API 서버로 전송되어 텍스트 변환 후 즉시 삭제됩니다.
이 앱 자체는 파일을 저장하거나 별도 서버로 전송하지 않습니다.
다만 OpenAI의 데이터 처리 정책에 따라 학습에 사용될 수 있으므로,
매우 민감한 정보는 Zero Data Retention 옵션을 검토하세요.
어떤 브라우저에서 작동하나요? ▼
Chrome, Edge, Firefox, Safari 최신 버전에서 모두 작동합니다.
파일 분할에 ArrayBuffer와 Blob API를 사용하므로 IE는 지원하지 않습니다.
모바일 브라우저(크롬 모바일, 사파리 iOS)에서도 사용 가능하지만, 대용량 파일 처리 시 메모리 부족이 발생할 수 있습니다.
100MB 이상 파일은 처리가 안 되나요? ▼
100MB 이상도 처리 가능하지만, 브라우저 메모리 한계로 인해 불안정할 수 있습니다.
100MB 이상 파일은 외부 도구(FFmpeg, Audacity 등)로 미리 분할한 후 사용하는 것을 권장합니다.
청크 크기를 10~15MB로 낮추면 더 안정적으로 처리됩니다.
변환 중에 인터넷이 끊기면 어떻게 되나요? ▼
현재 처리 중인 청크가 실패하고 오류 메시지가 표시됩니다.
이미 완료된 청크의 결과는 화면에 표시되어 있으므로 부분적으로 복사·저장 가능합니다.
재시도 시 처음부터 다시 시작해야 합니다. 향후 이어받기 기능을 추가할 예정입니다.
인식 정확도가 낮을 때 어떻게 하나요? ▼
다음을 확인해보세요:
• 배경 소음이 많은 파일은 노이즈 제거 후 업로드
• 비트레이트가 너무 낮으면(32kbps 이하) 품질 개선 후 재시도
• Whisper는 명확한 발음과 표준어에서 더 높은 정확도를 보입니다
• 사투리나 전문 용어가 많을 경우 일부 오인식이 발생할 수 있습니다
ChatGPT API와 Whisper API가 다른 건가요? ▼
네, 다릅니다. ChatGPT API(GPT-4 등)는 텍스트 생성용이고,
Whisper API는 음성→텍스트 변환 전용입니다.
같은 OpenAI 계정과 API 키를 사용하지만 별도로 과금됩니다.
이 앱은 Whisper API만 사용합니다.
이 앱이 도움이 되셨다면 공유해 주세요. 개선 아이디어나 버그 제보는 댓글로 남겨주시면 반영하겠습니다.
향후 화자 분리(Speaker Diarization), SRT 자막 직접 출력 기능도 추가할 예정입니다.