OpenAI는 분당 요금을 청구하니, 오디오 속도를 올려서 시간 단축하기
- OpenAI의 오디오 트랜스크립션 요금은 입력 오디오의 길이에 따라 산정됨
- ffmpeg 같은 도구로 오디오를 2~3배 속도로 변환한 뒤 업로드하면 트랜스크립션 품질 저하 없이 처리 속도와 비용 절감 가능함
- 실제 40분 오디오를 2배, 3배로 속도 변환 시 비용이 23~33% 절감됨
- gpt-4o-transcribe 모델은 25분 미만 오디오만 지원하므로, 속도 올리기가 유용한 우회책임
- 2~3배까지는 결과 품질이 유지되나 4배 속도에서는 트랜스크립션 정확도 급락 현상 발생함