G2 ist stolz darauf, unvoreingenommene Bewertungen über userzufriedenheit in unseren Bewertungen und Berichten zu zeigen. Wir erlauben keine bezahlten Platzierungen in unseren Bewertungen, Rankings oder Berichten. Erfahren Sie mehr über unsere Bewertungsmethoden.
Enterprise-Voice-AI-Plattform, die für Entwickler entwickelt wurde, die sprachgesteuerte Produkte mit Speech-to-Text-, Text-to-Speech- oder Speech-to-Speech-APIs erstellen. Über 200.000 Entwickler bau
Deepgram ist eine Transkriptionsplattform, die Sprach-zu-Text-Dienste mit Echtzeitfähigkeiten und zusätzlichen Funktionen wie Diarisierung, Zeichensetzung und Spracherkennung bietet. Rezensenten schätzen die hohe Genauigkeit und Geschwindigkeit des Transkriptionsdienstes von Deepgram, seine Fähigkeit, hohe Gleichzeitigkeit zu bewältigen, und die einfache Integration in bestehende Systeme, wobei viele Benutzer seine Kosteneffizienz und robuste Leistung unter intensiven Belastungen loben. Benutzer berichteten über gelegentliche API-Ausfälle, Herausforderungen bei der Preisgestaltung für Startups, Einschränkungen bei der Speicherung von Ergebnissen, Probleme bei der korrekten Transkription von wiederholten Nullen und Ungenauigkeiten bei der Sprecherdiarisierung, insbesondere in Besprechungen mit mehreren Teilnehmern und sich überschneidenden Stimmen.
Die Speech API von Google Cloud verarbeitet mehr als 1 Milliarde Sprachminuten pro Monat mit nahezu menschlichem Verständnis für viele häufig gesprochene Sprachen. Angetrieben von den besten KI-Forsch
Gegründet im Jahr 2017 und mit Hauptsitz in San Francisco, ist AssemblyAI eine Sprach-KI-Plattform, die über 200.000 Entwickler weltweit bedient. AssemblyAI ist spezialisiert auf die Bereitstellung vo
AssemblyAI ist ein Transkriptionsdienst, der genaue Transkriptionen, Sprecherdiarisierung und automatische Spracherkennung bietet. Benutzer schätzen die hohe Transkriptionsgenauigkeit, Geschwindigkeit, Erschwinglichkeit und die Fähigkeit, mehrere Sprachen und Sprecher zu verarbeiten, sowie die einfache Integration und Nutzung. Benutzer berichteten über Probleme mit der API, die kompliziert zu handhaben ist, gelegentliche Ungenauigkeiten bei starken Akzenten oder schnellem Sprechen und Einschränkungen bei der Unterstützung von Videodateien und bestimmten Sprachen.
Krisp ist eine Plattform für Sprachproduktivität und Echtzeit-KI-Kommunikation, die Teams, Kontaktzentren und Entwicklern hilft, klarere Gespräche durch Echtzeit-Geräuschunterdrückung, Akzentkonvertie
Krisp ist ein Rauschunterdrückungswerkzeug, das entwickelt wurde, um die Qualität von virtuellen Meetings und Anrufen zu verbessern, mit Funktionen wie automatisierten Meeting-Notizen, Transkriptionen und Aktionspunkten. Rezensenten mögen die überlegene Geräuschunterdrückung, die Fähigkeit, in jeder Umgebung ohne Hintergrundgeräuschstörungen zu arbeiten, und die automatisierten Besprechungsnotizen und Transkriptionen, die ihnen Zeit sparen. Benutzer erwähnten Probleme wie hohen RAM-Verbrauch, gelegentliche Verzögerungen bei der Verarbeitung von Transkriptionen, Fehler in der eigenständigen App und Schwierigkeiten mit der Benutzeroberfläche auf dem Desktop.
Azure AI Speech ist eine umfassende Suite von KI-gestützten Sprachdiensten, die entwickelt wurde, um Anwendungen mit fortschrittlichen Sprachfunktionen zu verbessern. Sie bietet Entwicklern Werkzeuge,
Azure AI Speech is a speech recognition and synthesis tool that supports multiple languages and offers features such as sentiment analysis and language translation. Users like the high accuracy of Azure AI Speech, its multilingual support, and its seamless integration with other Microsoft tools and services, which simplifies deployment and enhances daily activities. Users experienced issues with Azure AI Speech's accuracy when dealing with quick speaker changes or low-quality audio, and found the setup and configuration process complex, the pricing structure complicated, and the official documentation lacking in simplicity and robustness.
Otter.ai ist der führende KI-Meeting-Assistent, der Vertriebs-, Marketing-, Produkt-, Finanz-, Betriebsdesign-, Kundenerfolgs-, Kundensupport- und funktionsübergreifenden Teams hilft, automatisch alle
Otter.ai ist ein Transkriptionswerkzeug, das Gespräche während Besprechungen aufzeichnet und automatisch Notizen und Zusammenfassungen erstellt. Rezensenten schätzen die Fähigkeit von Otter.ai, Echtzeit-Transkriptionen bereitzustellen, Zusammenfassungen zu erstellen und Checklisten mit Aktionspunkten zu generieren, was Zeit spart und Meetings produktiver macht. Rezensenten erwähnten Probleme mit der Genauigkeit von Otter.ai bei der Transkription von Namen und Fachbegriffen, sein begrenztes Verständnis für verschiedene Sprecher und die Notwendigkeit von Verbesserungen bei der Spracherkennung und Audioaufnahme.
Speechmatics: Best-in-Market Speech-to-Text & Voice AI für Unternehmen Speechmatics liefert branchenführende Speech-to-Text- und Voice-AI-Lösungen, die für Unternehmen entwickelt wurden, die erst
Speechmatics is a transcription technology that provides speech-to-text services, speaker identification, and language recognition. Users frequently mention the high accuracy of transcriptions, the speed of the service, the ability to recognize multiple languages, and the responsive support staff. Users experienced limitations with the free trial plan, lack of support for diverse local languages, deletion of transcription jobs after 7 days, and the need to combine Speechmatics technology with other capabilities for specialized use-cases.
Digitale Beweise haben sich im letzten Jahrzehnt um das 10- bis 100-fache vermehrt – Körperkameras an jedem Beamten, Dashcams in jedem Auto, Smartphones und Türklingeln, die jeden Vorfall aufzeichnen,
Rev ist ein Transkriptionsdienst, der sowohl menschliche als auch KI-Transkription, Zeitstempelung und KI-Zusammenfassungen für Audio- und Videodateien anbietet. Rezensenten erwähnen häufig die Geschwindigkeit und Genauigkeit des Dienstes, die Benutzerfreundlichkeit und die Nützlichkeit von Funktionen wie Zeitstempelung und KI-Zusammenfassungen. Rezensenten erwähnten Probleme mit der Genauigkeit der KI-Transkription, Schwierigkeiten mit der Benutzeroberfläche und Navigation sowie Bedenken hinsichtlich der Kosten und Preisstruktur.
Notta ist ein hochentwickelter KI-Notiznehmer, der entwickelt wurde, um Benutzern dabei zu helfen, Sprachgespräche effizient in umsetzbaren Text umzuwandeln. Es kann sowohl Live-Reden als auch aufgeze
Notta ist ein Transkriptionswerkzeug, das automatische Übersetzungen für Besprechungen sowie Audio- oder Videodateien anbietet und auch Funktionen wie Mind Mapping, Terminplanung und zweisprachige Transkription umfasst. Rezensenten erwähnen häufig die Benutzerfreundlichkeit, die Genauigkeit der Transkription, die wertvolle Mind-Mapping-Funktion und die Bequemlichkeit des Meeting-Planers sowie die zweisprachigen Transkriptionsmöglichkeiten. Rezensenten erwähnten Probleme bei der Identifizierung von Sprechern, Einschränkungen im kostenlosen Plan, gelegentliche Ungenauigkeiten bei der Übersetzung und den Wunsch nach mehr Sprachvielfalt.
Von asynchronem zu Live-Streaming, Gladia's API befähigt Ihre Plattform mit präziser, mehrsprachiger Spracherkennung und umsetzbaren Erkenntnissen. Über 300.000+ Nutzer und über 700+ Unternehmenskund
Gladia is a speech recognition model that offers real-time transcription, multilingual support, and easy integration for developers. Users like Gladia's high accuracy, low latency, and the ability to handle rich context conversations, making it suitable for customer support in a complex multilingual setup. Users experienced issues with transcription accuracy for non-English languages, unclear pricing for large volume enterprise use, and minor documentation issues.
Kaldi ist ein automatisches Spracherkennungstoolkit, das lineare Transformationen, MMI, verstärktes MMI und MCE diskriminatives Training, diskriminatives Training im Merkmalsraum und tiefe neuronale N
Speech Logger ist eine webbasierte Spracherkennungs- und Sprachübersetzungssoftware, die automatische Zeichensetzung, automatisches Speichern, Zeitstempel, Bearbeitungsmöglichkeiten im Text, Transkrip