Интерфейс распознавание голоса (Speech Recognition API, SRAPI) – это интерфейс, к лучшим из которых относят: Google Speech-to-Text, AssemblyAI, AWS Transcribe, DeepSpeech, Wav2Letter, SpeechBrain, Coqui.
[Чесалов А. Ю. Глоссариум по искусственному интеллекту: 2500 терминов/ А. Ю. Чесалов — «Издательские решения» 2022 г., 670 стр.]