Kaldi ASR

Par Slashdot Media

Profil non revendiqué

Claim Kaldi ASR profile for Free

Your G2 page is often the first place buyers evaluate you. Take control of how your brand shows up.

WHAT YOU UNLOCK

Control your profile

Update logo, screenshots, pricing info

Engage with customers

Respond to reviews, build trust with prospects

See buyer activity

Track who’s viewing, understand engagement

Collect reviews

Create landing page and collect reviews

Sellers who actively manage their G2 profile build more trust and convert more buyers

4.1 sur 5 étoiles

Comment évalueriez-vous votre expérience avec Kaldi ASR ?

Cela fait deux mois que ce profil n'a pas reçu de nouvel avis
Laisser un avis
Compare this with other toolsSave it to your board and evaluate your options side by side.
Save to board

Avis et détails du produit Kaldi ASR

Image de l'avatar du produit

Avez-vous déjà utilisé Kaldi ASR auparavant?

Répondez à quelques questions pour aider la communauté Kaldi ASR

Avis Kaldi ASR (21)

Voir les avis vidéo de 1
Avis

Avis Kaldi ASR (21)

Voir les avis vidéo de 1
4.1
Avis 21

Review Summary

Generated using AI from real user reviews
Les utilisateurs louent constamment les résultats ASR de haute qualité et la flexibilité de Kaldi, notant ses fonctionnalités robustes et sa structure modulaire qui répondent aussi bien aux chercheurs qu'aux praticiens de l'industrie. Beaucoup apprécient sa nature open-source et le soutien communautaire étendu, bien que certains trouvent le processus d'installation et la documentation difficiles.
Rechercher des avis
Filtrer les avis
Effacer les résultats
Les avis G2 sont authentiques et vérifiés.
Nagendra K.
NK
Senior Engineer - Data Scientist
Entreprise (> 1000 employés)
"Vérification de locuteur utilisant l'outil Kaldi"
Qu'aimez-vous le plus à propos de Kaldi ASR?

C'est un ensemble d'outils open-source et très bien entretenu par le groupe principal du laboratoire de reconnaissance vocale de l'Université Johns Hopkins. Nous pouvons extraire diverses caractéristiques de pointe telles que l'i-vector, le x-vector qui peuvent être utilisées pour diverses tâches liées à la parole. Pour les tâches liées à la parole, nous pouvons atteindre le résultat de pointe. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

L'installation de Kaldi avec le support GPU est un cauchemar pour moi. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Technologie de l'information et services
UT
Petite entreprise (50 employés ou moins)
"La version actuelle de Kaldi n'est ni intuitive ni conviviale."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Les avantages de Kaldi sont que, une fois que vous le connaissez très profondément après beaucoup d'expérience, les possibilités deviennent presque infinies pour personnaliser les modèles acoustiques. La communauté d'utilisateurs de Kaldi est assez vaste, interactive, et il y a de fortes chances que quelqu'un ait eu le même problème que vous si vous savez simplement quoi chercher. Il y a de nombreux outils utiles dans le dossier utils/, même s'ils nécessitent tous une personnalisation approfondie pour une utilisation appropriée dans la construction de modèles, car le processus est intrinsèquement axé sur les données. Kaldi ressemble à un immense puzzle, et l'assembler est assez gratifiant d'une manière étrange et masochiste. C'est formidable que, puisqu'il est basé sur la communauté, il existe de nombreuses recettes préexistantes facilement personnalisables pour divers cas d'utilisation et que vous puissiez contribuer avec votre propre recette. Mon propre saint graal auquel je reviens toujours est le tutoriel d'Eleanor Chodroff pour construire des modèles acoustiques Kaldi, car il décrit la structure de données particulière requise pour le processus. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Eh bien. Il y a de nombreux problèmes que je dois aborder concernant Kaldi. Ce ne sont que quelques-unes de ces choses que tout le monde connaît et a acceptées, mais en fin de compte, Kaldi n'est actuellement ni convivial ni intuitif. Bien qu'il y ait beaucoup de recettes, elles sont toutes presque inutiles car elles doivent toutes être soigneusement personnalisées, car le but de créer un modèle ASR personnalisé est qu'il soit entièrement axé sur les données. Il n'y a aucune explication sur ce que sont les nombreux utilitaires ou pourquoi ils doivent être utilisés dans un certain ordre. La seule façon d'apprendre à utiliser Kaldi est par un apprentissage approfondi par essais et erreurs. Si vous essayez de poser des questions à Dan Povey sur le forum, vous recevrez une réponse passive-agressive à peine déguisée en conseil vous disant de changer de carrière et d'arrêter de faire de la reconnaissance vocale. L'ensemble du cadre est si peu intuitif qu'il n'a aucun sens. Littéralement, n'importe quelle interface utilisateur ou des instructions plus complètes et directes seraient excellentes. Ce qui m'irrite aussi, c'est qu'il existe tant de systèmes de représentation linguistique fantastiques avec lesquels on peut créer un excellent LM, mais comme Kaldi ne fonctionne qu'avec le format ARPA, cela empêche tout grand progrès dans la qualité de l'ASR en ce qui concerne les LMs. Une autre chose est que si vous faites une erreur, vous devez pratiquement tout recommencer. Surtout que Kaldi est tellement axé sur les données, il est particulièrement difficile d'automatiser les processus de construction AM, ce qui freine la croissance de l'entreprise si Kaldi est l'outil principal utilisé là-bas. Avis collecté par et hébergé sur G2.com.

Nadeem P.
NP
Machine Learning Engineer
Marché intermédiaire (51-1000 employés)
"Kaldi est un outil convivial, qui nous donne la liberté d'explorer des choses comme la reconnaissance vocale."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Création de modèle linguistique et création de FST. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

La génération de lexique nécessite l'aide de linguistes si les données de lexique open source ne sont pas disponibles. Avis collecté par et hébergé sur G2.com.

Ayush J.
AJ
Software developer
Petite entreprise (50 employés ou moins)
"J'ai une excellente expérience avec l'outil Kaldi."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Vitesse, précision. Cela rend le travail plus simple. La vitesse était excellente. Toute la documentation était là. Il n'y a pas d'autre outil comme kaldi pour mettre en œuvre la conversion de la parole en texte. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Compatibilité du système d'exploitation. J'ai rencontré un problème avec le système d'exploitation Windows. Kaldi était plus rapide sous Linux mais il était difficile à mettre en œuvre sous Windows. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Éducation primaire/secondaire
Petite entreprise (50 employés ou moins)
"Kaldi - un outil pour la reconnaissance vocale automatique (ASR) personnalisée et synchronisée dans le temps"
Qu'aimez-vous le plus à propos de Kaldi ASR?

Il dispose de fst pour LM, ce qui en fait une solution très flexible et personnalisable pour cibler le domaine d'application. Il génère également les horodatages des phonèmes dans la sortie ctm, ce qui en fait une solution idéale pour la synchronisation temporelle et l'étalonnage des scores de confiance. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Il faut beaucoup, beaucoup de ressources mémoire pour charger les modèles acoustiques volumineux et les graphes LM. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Technologie de l'information et services
UT
Petite entreprise (50 employés ou moins)
"kaldi est un outil très bien pensé et écrit"
Qu'aimez-vous le plus à propos de Kaldi ASR?

recettes, stabilité et convivialité,

Des personnes très intelligentes et brillantes ont travaillé dessus.

Kaldi est un excellent outil qui continue de mener la recherche dans les technologies ASR. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Le code de base est en C++. De nos jours, s'il était en Python, il serait beaucoup plus facilement accessible à un plus large public. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Soins hospitaliers et de santé
CS
Petite entreprise (50 employés ou moins)
"Kaldi est un outil utile pour la reconnaissance vocale."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Il est très pratique et utile de convertir des fichiers audio en fichiers structurés. Cela peut être utilisé dans de nombreux langages de programmation, y compris Python et C++. Son processus automatique aide à gagner du temps. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Le manuel de Kaldi n'est pas assez clair et parfois vous devez chercher sur Google et vérifier pour comprendre totalement le sens de certains paramètres. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Enseignement supérieur
UE
Marché intermédiaire (51-1000 employés)
"Très utile mais limité pour les cas d'utilisation"
Qu'aimez-vous le plus à propos de Kaldi ASR?

L'outil Kaldi est très rapide et facile à manipuler. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Au début, il est difficile d'apprendre. Si vous l'apprenez seul, cela semble difficile à utiliser. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Logiciels informatiques
AL
Petite entreprise (50 employés ou moins)
"Kaldi est un très bon logiciel pour la recherche vocale, tant pour les débutants que pour les utilisateurs avancés."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Les fonctionnalités. Comme plusieurs algorithmes pour l'extraction de caractéristiques. Support pour de nombreuses architectures neuronales. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

À moins que nous soyons des maîtres en C++, il est assez difficile de pirater le code source. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Logiciels informatiques
UL
Petite entreprise (50 employés ou moins)
"utile pour tous les chercheurs en discours"
Qu'aimez-vous le plus à propos de Kaldi ASR?

accès facile à un script d'exemple pour construire des modèles basés sur la parole. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Il ne peut pas gérer les modèles d'architecture de bout en bout. Une provision devrait être prévue pour ceux-ci. Avis collecté par et hébergé sur G2.com.

Des questions sur Kaldi ASR? Demandez à de vrais utilisateurs ou explorez les réponses de la communauté

Obtenez des réponses pratiques, des flux de travail réels et des avantages et inconvénients honnêtes de la communauté G2 ou partagez vos idées.

Utilisateur vérifié
G2
Utilisateur vérifié

What is Kaldi model?

0 votes positifs
0
Rejoindre la conversation
Utilisateur vérifié
G2
Utilisateur vérifié
Dernière activité il y a plus de 4 ans

Will Kaldi 2.0 be more user friendly, and will it be compatible with other language representation models such as BERT for language modelling?

1 vote positif
0
Rejoindre la conversation
Tarification

Les détails de tarification pour ce produit ne sont pas actuellement disponibles. Visitez le site du fournisseur pour en savoir plus.

Comparaisons Kaldi ASR
Image de l'avatar du produit
OpenAI Whisper
Comparer maintenant
Image de l'avatar du produit
HTK (Hidden Markov Model...
Comparer maintenant
Image de l'avatar du produit
Google Cloud Speech-to-Text
Comparer maintenant