Flexibilidad de usar lenguajes como Python, Pyspark y SQL. Nueva función de llegada de archivos. Variedad de opciones para conectarse con casi todo tipo de fuente. Implementación muy simple del catálogo de unidad que era difícil de gestionar inicialmente. Volumen que funciona sin problemas con código de python/pandas. Reseña recopilada por y alojada en G2.com.
Databricks diagnosticar sugerencia de error. No se pudo proporcionar consultas para la extracción de archivos adjuntos de correo, código de cifrado AES 256, etc. Muy bueno para soporte en código de python, pyspark y SQL, pero no en casos de uso raros como los mencionados anteriormente. Reseña recopilada por y alojada en G2.com.
Reseñas en Video
424 Databricks Data Intelligence Platform Reseñas
Sentimiento General de la Reseña para Databricks Data Intelligence Platform
Inicia sesión para ver el sentimiento de la revisión.
Esta arquitectura de casa del lago reúne lo mejor de los lagos de datos y los almacenes, por lo que no tenemos que lidiar con la complejidad innecesaria. Los lagos Delta aseguran fiabilidad mientras que la interfaz basada en cuadernos hace que la colaboración sea fluida. La capacidad de la plataforma para manejar cargas de trabajo por lotes, en streaming y de aprendizaje automático en un solo lugar es una gran ventaja. Reseña recopilada por y alojada en G2.com.
El precio puede volverse caro, especialmente si las cargas de trabajo no están optimizadas adecuadamente, también, aunque los cuadernos son excelentes, podrían usar un mejor control de versiones para el trabajo colaborativo. La curva de aprendizaje inicial puede ser un poco empinada para aquellos que son nuevos en Spark, pero una vez que lo dominas, es una herramienta poderosa. Reseña recopilada por y alojada en G2.com.
Me encanta Databricks porque consolida la ingeniería de datos, el aprendizaje automático y la analítica en uno solo, y la hazaña de usar cuadernos colaborativos también permite un trabajo en equipo en tiempo real y sin problemas entre un ingeniero de datos que trabaja en canalizaciones de datos y un científico de datos que realiza varios experimentos. Y maneja datos a gran escala con bastante facilidad y ejecuta consultas SQL complejas en segundos sin problemas relacionados con la infraestructura. Además, tiene algunas herramientas de gobernanza integradas como el catálogo de unidad que me ayudan a gestionar el linaje de datos y controlar el acceso. Reseña recopilada por y alojada en G2.com.
Databricks puede ser bastante abrumador para los principiantes, especialmente si no tienen un buen dominio de SQL y Spark para empezar. Y el ritmo de sus actualizaciones, aunque es bastante bueno, tiende a introducir cambios que pueden ser difíciles de seguir. Además, el precio puede volverse caro a gran escala, especialmente para equipos que trabajan con conjuntos de datos realmente grandes. Reseña recopilada por y alojada en G2.com.
Databricks es una herramienta que está en constante evolución. Realmente aprecio la cantidad de características que lanzan y el hecho de que están actualizados. Es una plataforma diaria que se adapta a todos los casos de uso y es fácil de integrar. Es una solución todo en uno con ETL con almacenes, Python, Spark, Scala, aprendizaje automático y GenAI. Reseña recopilada por y alojada en G2.com.
A veces desearía que actualizaran más la documentación, que no hubiera tantos cambios en la API. Las notas de la versión de los cambios estaban mejor explicadas para nosotros y que tuviéramos tiempo para abordar los cambios. El soporte al cliente es algo que también tienen que mejorar. Reseña recopilada por y alojada en G2.com.
La única palabra que puedo decir sobre Data bricks es que tienen servicios de primera clase en el campo de la gestión de datos. Su plataforma tiene el poder de manejar grandes cantidades de datos con módulos muy simples sin integraciones adicionales. Los servicios que estamos utilizando de Data bricks dan libertad para manejar datos en cada paso. Reseña recopilada por y alojada en G2.com.
Siempre que necesitamos almacenar datos y analizarlos, utilizamos las vistas analíticas de Data bricks para eso y realmente ofrecen las mejores perspectivas de los datos. Reseña recopilada por y alojada en G2.com.
su integración perfecta de la ingeniería de datos, la ciencia de datos y los flujos de trabajo de aprendizaje automático en una plataforma unificada. Mejora la colaboración, acelera el procesamiento de datos y proporciona soluciones escalables para análisis complejos, todo mientras mantiene una interfaz fácil de usar. Reseña recopilada por y alojada en G2.com.
Otra desventaja es la limitación con RDDs y la falta de soporte para ML Runtime en el nivel de computación estándar. El modelo de precios, que puede volverse costoso a medida que el uso escala, especialmente para equipos o proyectos más pequeños. Reseña recopilada por y alojada en G2.com.
Las características avanzadas de Data bricks ofrecen una solución muy efectiva para el análisis y la gestión de datos. Tienen todas las características que realmente necesitamos para gestionar los grandes volúmenes de datos. La calidad de sus servicios y la fácil integración hacen de esta mi plataforma favorita para la gestión de datos. Reseña recopilada por y alojada en G2.com.
Realmente aprecio su equipo de soporte que siempre está ahí y proporciona respuestas rápidas a cualquier consulta sobre nuestra herramienta e integración. Nunca he tenido una mala experiencia en su plataforma. Reseña recopilada por y alojada en G2.com.
La fiabilidad de Data bricks siempre ofrece servicios de valor añadido para almacenar grandes cantidades de datos con total seguridad. Su integración y número de características proporcionan una implementación fácil que gestiona toda nuestra canalización de datos con el mejor panel analítico. Reseña recopilada por y alojada en G2.com.
Todos los servicios que estamos recibiendo de Data Bricks son de alta calidad y aún no tenemos ningún comentario en su contra. Realmente apreciamos sus servicios de calidad en nuestra organización. Reseña recopilada por y alojada en G2.com.
Como ingeniero de datos que ha estado trabajando con Databricks durante los últimos dos años, puedo decir honestamente que la plataforma ha transformado por completo la forma en que abordamos los proyectos de ingeniería de datos. Antes de Databricks, mi equipo y yo a menudo enfrentábamos desafíos con la gestión de grandes conjuntos de datos y asegurando una colaboración fluida entre ingenieros de datos y científicos de datos. Hubo momentos en que los flujos de trabajo se sentían desarticulados, y resolver problemas a través de diferentes herramientas consumía mucho de nuestro tiempo.
Databricks ha cambiado todo eso. La función de cuadernos colaborativos, en particular, ha sido un cambio radical. Ahora puedo trabajar sin problemas con los científicos de datos en tiempo real, resolviendo problemas e iterando soluciones mucho más rápido. Por ejemplo, durante un proyecto reciente, pudimos refinar un modelo de aprendizaje automático en cuestión de días, gracias a la capacidad de compartir cuadernos fácilmente y ejecutar experimentos rápidamente juntos. Este nivel de colaboración solía tomar semanas con herramientas anteriores.
La función de autoescalado ha sido un salvavidas. Recuerdo vívidamente luchar con problemas de rendimiento al procesar grandes conjuntos de datos en nuestra antigua infraestructura. Ahora, Databricks ajusta automáticamente los recursos según la carga de trabajo, por lo que nunca tenemos que preocuparnos por gestionar la potencia de cómputo. Esto ha reducido drásticamente los tiempos de procesamiento. Por ejemplo, un trabajo de transformación de datos que solía tomar horas ahora se completa en una fracción del tiempo, lo que nos permite entregar proyectos más rápido.
Delta Lake también ha sido invaluable. Antes de comenzar a usarlo, la consistencia y calidad de los datos eran preocupaciones constantes, especialmente al tratar con fuentes de datos grandes y variadas. Ahora, con Delta Lake, podemos confiar en que nuestros datos no solo son de alta calidad, sino también fácilmente accesibles y consultables. Un ejemplo particular fue cuando tuvimos que reconstruir una tubería de datos compleja. Delta Lake nos permitió trabajar con actualizaciones de datos incrementales, haciendo el proceso mucho más eficiente y confiable.
En resumen, Databricks ha reducido enormemente el tiempo de desarrollo y mejorado la calidad general de nuestras entregas. Me ha ayudado a simplificar flujos de trabajo complejos, mejorar la colaboración entre equipos y, lo más importante, entregar soluciones basadas en datos más rápido y con mayor confianza. Reseña recopilada por y alojada en G2.com.
Optimización de Costos - Aunque aprecio la información detallada de facturación proporcionada, predecir costos para proyectos grandes o entornos compartidos aún puede parecer opaco. Muchos equipos luchan por controlar los costos descontrolados de clústeres inactivos o configuraciones subóptimas. Introducir un escalado automático más inteligente y recomendaciones adaptadas a nuestras cargas de trabajo sería invaluable. Por ejemplo, alertas para "clústeres inactivos" o "puntos críticos de costo" en nuestro entorno podrían ahorrar presupuestos de manera proactiva y mejorar la eficiencia.
Gobernanza y Seguridad Simplificadas - Gestionar el acceso a niveles detallados puede ser engorroso. Por ejemplo, controlar quién puede ver versus quién puede ejecutar un cuaderno o trabajo a menudo requiere soluciones alternativas. Los registros de auditoría son excelentes, pero darles sentido para obtener información procesable a veces se siente como resolver un rompecabezas. Un control de acceso basado en atributos (ABAC) mejorado y controles más intuitivos basados en la interfaz de usuario para la gestión de permisos agilizarían enormemente las operaciones.
Experiencia del Usuario - La interfaz colaborativa de cuadernos es una de las características destacadas de Databricks, sin embargo, hay áreas donde podría ser más fluida. La colaboración a veces se ve obstaculizada cuando dos usuarios editan el mismo cuaderno. El control de versiones se siente básico en comparación con los sistemas basados en Git. La depuración dentro de los cuadernos, especialmente para cargas de trabajo no basadas en Python, podría mejorar significativamente. Agregar comentarios en línea, herramientas de resolución de conflictos y características de depuración robustas llevaría la plataforma al siguiente nivel. Un feed de actividad a nivel de espacio de trabajo para mostrar lo que está sucediendo en proyectos compartidos también sería inmensamente útil.
Automatización de Flujos de Trabajo - Incluir ideas impulsadas por IA para optimizar flujos de trabajo (por ejemplo, detectar cuellos de botella o ineficiencias). Habilitar una integración más fácil con herramientas externas de automatización de flujos de trabajo. Reseña recopilada por y alojada en G2.com.
La experiencia de visualización de datos con Data Bricks es muy buena y sus servicios de primera calidad hacen que el trabajo sea más fácil y fluido para el aprendizaje automático. Tienen integración donde podemos desplegar fácilmente módulos de ML en ellos sin ninguna integración adicional. Reseña recopilada por y alojada en G2.com.
Todos son buenos y muy solidarios, su equipo siempre está allí cuando necesitamos ayuda, responden muy rápido con una solución. Realmente disfruté de su integración de múltiples funciones que los convierte en nuestra herramienta frecuente para el desarrollo de ML y aprendizaje profundo. Reseña recopilada por y alojada en G2.com.
La mejor parte de Data bricks es que nos proporcionan múltiples características que gestionan todo el trabajo de gestión de datos en un solo lugar sin ningún problema y también tienen herramientas de inteligencia de datos muy efectivas. Reseña recopilada por y alojada en G2.com.
Fácil de usar su implementación brinda el mejor apoyo en nuestro trabajo que ofrece un nivel superior de experiencia y la mejor experiencia de usuario para trabajar en su plataforma. Reseña recopilada por y alojada en G2.com.