Data Visualization Tools (Open Source)

Es tan importante una correcta integración de los datos, como hemos podido ver en dos anteriores post: “Data Ingestion & Distribution by Apache NiFi” y “[Distributed Real-Time Stream Processing](Distributed Real-Time Stream Processing)” también es más que importante una correcta visualización de los mismos y hoy, traemos tres posibilidades:

Superset

Este proyecto, originalmente llamado Panoramix, que cambió su nombre posteriormente a Caravel en marzo de 2016 y actualmente se denomina Superset desde noviembre de 2016.

Algunos de los detalles más importantes de Superset son:

  • Un gran abanico de de visualizaciones de datos,
  • Una interfaz gráfica fácil de usar para explorar y visualizar datos,
  • Crear y compartir “Dashboard”,
  • Autenticación basada en base de datos, OpenID, LDAP, OAuth y REMOTE_USER a través de Flask AppBuilder,
  • Un modelo de seguridad/permiso extensible y de alta granularidad que permite reglas sobre quién puede acceder a las características individuales y al conjunto de datos,
  • Una capa semántica simple, que nos permite a los usuarios controlar las fuentes de datos, definiendo qué campos deben aparecer en el menú desplegable y qué medidas de agregación y función están disponibles para el resto de usuarios,
  • Integración con la mayoría de los RDBMS SQL a través de SQLAlchemy,
  • Integración con Druid.io.

Superset Dashboard Example

Metabase

Metabase es una herramienta open source, para visualización de datos con una interfaz gráfica muy simple y sencilla. Muy rápidamente podremos configurar informes, sean en formato tabla o gráficamente. Podremos conectar a Metabase fuentes de datos basadas en, por ejemplo: MySQL, MongoDB, Elasticsearch o PostgreSQL de forma muy simple. Está escrito en Java y Javascript y podemos encontrar en Docker y AWS Marketplace imagenes para arrancar rápidamente.

Metabase Dashboard Example

Redash

Redash es una solución, muy parecida a las anteriores y open source. Redash nos proporciona una colección útil de fuentes de datos: PostgreSQL, Redshift, Greenplum, MySQL, Google BigQuery, Graphite, MongoDB, ElasticSearch, InfluxDB, Presto y muchos otros. Está escrita en Python y Javascript y una de las ventajas respecto al resto es que almacena, temporalmente, la información del cálculo en caché (Redis) antes de mostrar los dashboard. La solución también proporciona algunas funciones útiles como el intercambio social para sus paneles e imágenes.

Redash Dashboard Example