Le logiciel de transcription transcrit automatiquement l'audio d'interviews, de conversations, de dictées, de séquences vidéo, et plus encore en texte. Bien que ces outils utilisent des technologies telles que le traitement du langage naturel (NLP) et l'apprentissage automatique pour transcrire la parole, certains outils utilisent un modèle humain-dans-la-boucle (HITL) pour aider à garantir la qualité de la transcription. Contrairement aux logiciels de reconnaissance vocale, qui fournissent des API ou des services web pour l'intégration dans des pages web ou avec d'autres logiciels, le logiciel de transcription offre une plateforme autonome facile à utiliser dans le but de transcrire la parole, également connue sous le nom de parole en texte (STT).
Les solutions de cette catégorie permettent aux utilisateurs de télécharger de l'audio sur la plateforme, en plus de transcrire la parole dictée directement dans le logiciel. Ces outils peuvent également permettre aux utilisateurs d'incorporer la transcription en direct dans des séquences vidéo. D'autres fonctionnalités au sein des outils de transcription peuvent inclure l'intégration d'API, l'édition collaborative, et le reporting analytique sur le débit et la précision de la transcription.
Pour être inclus dans la catégorie Transcription, un produit doit :
Fournir une plateforme pour transcrire l'audio par des moyens automatisés
Télécharger de l'audio sur la plateforme à transcrire
Exploiter la technologie d'apprentissage automatique ou de NLP pour transcrire le texte
Faciliter l'édition de la transcription via un éditeur de texte