
Comparação com Amazon Transcribe:
Começamos com o Amazon (AWS) Transcribe pensando que deveria ser o melhor. Depois de gastar muito dinheiro (é muitas vezes mais caro que o Deepgram), paciência (é inferior em qualidade) e tempo, desistimos.
Executando Whisper em uma máquina AWS:
Decidimos executar o Whisper em uma máquina da Amazon. Afinal, o Whisper é gratuito e só pagaríamos pelo uso de computação. A qualidade era definitivamente melhor. Mas logo percebemos que com T@ grande ($500/mês) estávamos enfrentando uma latência muito alta durante as horas de pico do dia e ainda estávamos pagando pela computação ociosa nas horas restantes.
Mudança para Deepgram:
Após mudar para o Deepgram, descobrimos que não só são de alta qualidade, mas também mais rápidos (latência de menos de um minuto para arquivos de áudio de até uma hora), mais baratos (sem necessidade de computação ociosa, só pagamos pelo uso), e a mesma qualidade que o Whisper com um dos modelos que escolhemos chamado Nova (eles também oferecem outros dois modelos, incluindo Whisper e mais um).
Agora estamos explorando sua transcrição em tempo real, LLM para análise em tempo real de fluxos, e também a infraestrutura necessária para desenvolver bots de voz. Análise coletada por e hospedada no G2.com.
Nada até agora que encontramos. Temos estado completamente satisfeitos com o serviço. Análise coletada por e hospedada no G2.com.
Avaliações em Vídeo
270 de 271 Avaliações Totais para Deepgram
Sentimento Geral da Revisão para Deepgram
Entre para ver o sentimento das avaliações.
I love that Deepgram captures the audio and video, transcribing them with such accuracy. It’s worked great for transcribing client meetings and internal discussions. With the features to store and share transcriptions with platforms such as Google Drive, it’s easy to integrate with. If you attend live meetings or events the best part is the ability to transcribe in real time. Moreover, the AI itself gets better, so each transcription gets better and better as time progresses. Análise coletada por e hospedada no G2.com.
One thing I’ve found annoying in Deepgram is that sometimes background noise causes problems with the transcription. Essentially the system works fine, but sometimes when a long transcription job goes a little long the system will lag. I wish I could also customize more to get the outputs how I would like them. They work well, but they still miss context at times, especially with technical or domain specific words and you still need to edit them. Análise coletada por e hospedada no G2.com.
Com seu reconhecimento de fala, o Deepgram é incrivelmente rápido e incrivelmente preciso, tornando a escuta de transcrições de reuniões e chamadas muito mais fácil. Também gosto que ele se integra muito bem com o Slack e o Zoom, oferecendo fácil acesso às transcrições diretamente no aplicativo. Essa capacidade de trabalhar com muitos sotaques e dialetos diferentes é fundamental para nossa equipe diversa. Além disso, a configuração simples e a API fácil de usar permitem a personalização do software para atender precisamente às nossas necessidades de fluxo de trabalho. Análise coletada por e hospedada no G2.com.
A única falha que vi com o Deepgram é que ele interpreta mal um áudio com muito ruído de fundo. Ele funciona bem em ambientes silenciosos, mas a qualidade da transcrição cai quando há interferência de ruído. E às vezes ele entende mal a linguagem técnica, que eu tenho que corrigir por padrão. Não é tudo ruim, no entanto, seria simplesmente bom se o suporte ao cliente fosse um pouco mais rápido porque às vezes eles demoram a responder a perguntas mais complexas. Análise coletada por e hospedada no G2.com.

Deepgram fornece uma transcrição de alta qualidade a partir de gravações de áudio que podemos contar para usar em nosso sistema, bem como para nossos clientes empresariais. Temos usado o serviço de transcrição há vários meses e ele tem funcionado de forma consistente e confiável durante esse tempo. Análise coletada por e hospedada no G2.com.
Deepgram tem funcionado muito bem e nossa equipe realmente não consegue apontar uma desvantagem ainda, apesar de usá-lo há vários meses em uma capacidade de produção. Análise coletada por e hospedada no G2.com.
Temos usado o Deepgram para nossas necessidades de transcrição de fala para texto na SpeakX.ai, e estamos extremamente satisfeitos com seu desempenho. Seja para transcrição de áudio em tempo real ou transcrição de áudio baseada em arquivos, o Deepgram entrega consistentemente resultados precisos e rápidos, tornando-se uma parte essencial de nosso conjunto de ferramentas.
Os preços também são muito competitivos, oferecendo um ótimo valor pela qualidade do serviço prestado. É revigorante encontrar um serviço que atenda aos nossos altos padrões sem estourar o orçamento. Estamos animados para ver o que mais podemos construir com o Deepgram no futuro, à medida que continuamos a inovar e expandir nossas ofertas. Análise coletada por e hospedada no G2.com.
Embora estejamos geralmente satisfeitos com o desempenho do Deepgram, experimentamos algumas falhas intermitentes na API, embora sejam raras. Além disso, notamos tempos de expiração inconsistentes para as chaves da API, o que pode ser um pouco inconveniente. Análise coletada por e hospedada no G2.com.
Deepgram oferece serviços de TTS multicanal incrivelmente rápidos, que são perfeitos para lidar com vários fluxos de áudio de forma eficiente. O suporte para cerca de 30 idiomas o torna versátil para aplicações globais. Além disso, o recurso de inteligência de áudio para detecção de intenção é extremamente útil, fornecendo insights valiosos que aumentam a precisão e a profundidade de nossas transcrições. A integração é perfeita, e o desempenho é consistentemente confiável. Análise coletada por e hospedada no G2.com.
O serviço pode ser um pouco caro para startups com orçamentos apertados, especialmente se o uso aumentar rapidamente. Análise coletada por e hospedada no G2.com.
Deepgram API has been a great for our healthcare application. Its real-time transcription is incredibly fast and accurate, enabling low-latency AI-patient conversations without interruptions. The API handles medical jargon effectively with their medical model. Specific words can also be boosted if needed. Integration was easy, and it scales effortlessly with our needs. Análise coletada por e hospedada no G2.com.
Documentation can be more robust. We found some common use-cases with no ways to achieve it according to the documentation. Their Discord support was excellent though so we ended up getting custom help from their team to uncover undocumented functionalities. Análise coletada por e hospedada no G2.com.

Deepgram nunca parou, mesmo depois de avançar significativamente no lado do ASR. Eles demonstraram um compromisso mais forte com seu mais recente sistema TTS chamado Aura, que realmente ajuda os clientes a permanecerem com uma única empresa para ambos ASR e TTS. Isso é realmente muito útil. Eles têm muita documentação boa e isso ajuda a comunidade de desenvolvedores a começar rapidamente com suas soluções. A facilidade de implementação começa com uma boa documentação. As APIs da Deepgram e sua abordagem simplista em relação às APIs, mesmo que estejam construindo modelos complicados para obter modelos de voz de última geração, na verdade tornam o uso fácil. Análise coletada por e hospedada no G2.com.
Seus modelos e APIs ainda não oferecem a funcionalidade completa de detecção de sentimentos e emoções em fala em tempo real. Até agora, está restrito à detecção e previsão de emoções para arquivos de áudio offline, enquanto seria mais útil para cenários em tempo real. Espero que essa funcionalidade chegue em breve. Análise coletada por e hospedada no G2.com.
Eu gosto especialmente de como o uso do Deepgram destaca o aspecto da precisão da transcrição. Ele registra até mesmo as interações mais detalhadas e isso significa que nossas relações com os clientes são muito melhores. Há muitos recursos úteis nele, como processamento em tempo real e os idiomas que ele suporta. Além disso, o suporte ao cliente deles nos ajuda a resolver quaisquer problemas que possamos encontrar. Em suma, posso concluir que o Deepgram beneficiou muito nosso processo de trabalho e aumentou a produtividade. Análise coletada por e hospedada no G2.com.
A principal desvantagem do Deepgram é que ele tem problemas com transcrições que contêm sotaque e pode levar a mal-entendidos no suporte ao cliente. Isso resulta em atraso no tempo dos processos e procedimentos de resolução de problemas. Além disso, a implementação foi, até certo ponto, difícil e exigiu mais conhecimento técnico, o que inicialmente dificultou nosso progresso. Embora esses possam ser considerados problemas menores, eles ocasionalmente impactaram nossa eficiência. Análise coletada por e hospedada no G2.com.

Tenho usado por mais de 2 anos. O produto deles é muito bom e eles estão sempre lançando melhorias. Construímos produtos de acessibilidade de vídeo e áudio, então ter uma boa transcrição/arquivo srt é imprescindível. As pessoas de suporte e vendas são muito responsivas e prestativas. Os preços são muito competitivos e eles têm ótimos programas para organizações iniciantes. Os pontos de integração são bem documentados e o painel do cliente é fácil de entender. Podemos experimentar rapidamente novas opções com pouca programação. Análise coletada por e hospedada no G2.com.
Não há muito que eu não goste sobre o Deepgram. Alguns dos seus modelos não se encaixam no meu caso de uso, mas eu não preciso usá-los. Acho que eles são muito justos e prestativos. Análise coletada por e hospedada no G2.com.

Geralmente, a maioria das APIs de terceiros são apenas razoáveis ou são ruins. Deepgram é uma das poucas, junto com talvez a Stripe, que realmente parece que escreveram sua documentação pensando em desenvolvedores reais, cobrindo tudo, desde casos de uso até o funcionamento interno de suas classes. Muito fácil de implementar e começar a usar, considerando o quão complexa a transcrição pode ser, e ainda parece um código de trapaça por ser tão rápida e acessível. Análise coletada por e hospedada no G2.com.
Nada, o que é raro. Meu único desejo é que fosse mais fácil trabalhar com dados de áudio ao vivo de uma maneira mais declarativa. Além disso, acho que eles precisam de mais documentação sobre design de sistemas, por exemplo, construir com Deepgram de uma maneira escalável com websockets, serviços em nuvem, etc. Análise coletada por e hospedada no G2.com.