Descripción y características de Dataiku DSS

Reúna a analistas de datos, ingenieros y científicos. Habilite el análisis de autoservicio y ponga en funcionamiento el aprendizaje automático. Obtenga resultados hoy y construya para el mañana. Dataiku DSS es la plataforma de software de ciencia de datos colaborativa para equipos de científicos de datos, analistas de datos e ingenieros para explorar, crear prototipos, construir y entregar sus propios productos de datos de manera más eficiente. Use cuadernos (Python, R, Spark, Scala, Hive, etc.) o una interfaz visual personalizable de arrastrar y soltar en cualquier paso del proceso de creación de prototipos de flujo de datos predictivo, desde la discusión hasta el análisis y el modelado. Perfile los datos visualmente en cada paso del análisis. Explore y grabe sus datos de forma interactiva con más de 25 gráficos integrados. Prepare, enriquezca, combine y limpie datos con más de 80 funciones integradas. Aproveche las tecnologías de aprendizaje automático (Scikit-Learn, MLlib, TensorFlow, Keras, etc.) en una interfaz de usuario visual. Cree y optimice modelos en Python o R e integre cualquier biblioteca de ML externa a través de API de código.

Dataiku DSS

Opiniones de usuarios – Pros y Contras

Anónimo (verificado)

“Dataiku – Revisión”

Pros: (+) Integración con varias fuentes de datos como snowflake, s3 y muchas otras plataformas.
(+) Puede codificar en varios lenguajes como Python, R, SQL.
(+) Fácil de usar y adaptar y tiene una interfaz muy ordenada.
(+) Puede crear un diagrama de flujo de todo su proyecto en una representación pictórica.
(+) Varios colaboradores pueden trabajar a la vez en un solo proyecto.

Contras: (-) Capacidades de representación (visualización) limitadas.
(-) Su incapacidad para compilar todo el código en un solo documento.
(-) La recarga de código es un problema (problema de la interfaz de usuario).

En general: Recientemente comencé a usar Dataiku para proyectos de ciencia de datos, la herramienta es muy buena. Admite una gran cantidad de fuentes de datos y varios lenguajes de programación. He usado las notas jupyter incorporadas en Dataiku. Puede establecer optimizaciones según los requisitos, como puede optimizar la puntuación F1 o la recuperación o AUC, que es una característica muy interesante y se puede utilizar de manera excelente.

A nivel general, es una muy buena herramienta para proyectos de ciencia de datos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *