<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=1267344923293614&amp;ev=PageView&amp;noscript=1">

Blog

I migliori 4 Time Series Database open source del 2020

Stefano Marfella

Stefano Marfella, 24 aprile 2020 | Time Series Database

Che si parli di macchinari aziendali o dispositivi per la smart-home, è certo che la mole di dati prodotti da oggetti “intelligenti” connessi a internet cresce di giorno in giorno. Tali dati hanno inoltre una caratteristica particolare, ossia quella di essere dotati di un time-stamp, una marca temporale che serve a correlare la metrica misurata con il momento esatto in cui essa è stata misurata.

E data l’enorme quantità di dati prodotti e la conseguente necessità di poterli analizzare nel loro insieme, è fondamentale per le aziende dotarsi di database in grado di archiviare questi dati correttamente e renderli fruibili tramite la loro visualizzazione in dashboard analizzabili.

Clicca qui per scaricare la guida ai Time Series Database!

Si pensi, ad esempio, ad un impianto di produzione della carta che deve poter monitorare costantemente non solo lo stato dei macchinari, ma anche lo spessore della carta prodotto, la lunghezza del rotolo di carta, la velocità a cui questo rotolo viene avvolto, e deve poter correlare tutti queste serie storiche di dati per ottenere informazioni preziose sull'efficienza dell’impianto, il consumo energico e molto altro.

Quando si sceglie un Time Series Database per le serie storiche, rivolgersi al mondo dell’Open Source comporta numerosi vantaggi, primo fra tutti quello di poter contare su community di sviluppatori che hanno contribuito alla messa a punto di DB robusti e ottimizzati per le serie storiche.

In questo articolo vedremo quattro soluzioni in particolare di Time Series Database che si distinguono nel 2020. Scopriamoli insieme!

Perché scegliere un Time Series Database open source?

Le community di sviluppatori che contribuiscono al codice dei DB sono, come abbiamo già menzionato, sicuramente tra i principali vantaggi di una soluzione DB open source per le serie storiche: questo perché i continui test garantiscono che i bug vengano identificati e risolti con facilità e velocemente. Inoltre, i DB open source sono solitamente software cluster scalabili e compatibili con gli scenari dei Big Data.

Infine, numerose sono le aziende che offrono supporto avanzato e professionale per le loro edizioni open source dei Time Series DB, come per esempio fa InfluxData per InfluxDB. In questo modo l’utente finale può contare sulle migliori funzionalità di un DB accompagnate da un processo di sviluppo trasparente e affidabile.

I migliori 4 Time Series Database open source del 2020

Vediamo da vicino quali sono i migliori 4 DB open source del 2020 per le serie storiche di dati.

OpenTSDB

OpenTSDB è un database time series distribuito e scalabile capace di supportare una velocità di scrittura di milioni di dati al secondo. Tale livello di performance è dovuto al layer di base, dipendente da HBase, che utilizza un’architettura distribuita per garantire un’altissima velocità di scrittura. Rispetto ad altri Time Series Database, OpenTSDB è maggiormente mirato alla comunità open source grazie all’uso della LGPL. Anche se in origine era stato ideato per il monitoraggio di dispositivi di network, sistemi operativi e applicazioni, oggi trova ulteriori e ampie applicazioni d’uso.

Sebbene questo database sia notevole per la velocità di scrittura dei dati e la precisione nella loro archiviazione, quello che manca è la capacità di eseguire il querying e l’analisi dei dati registrati e conservati. Allo stesso tempo, l’API di OpenTSDB è una delle più ricche in termini di funzionalità e costituisce uno standard del settore.

Apache Druid

Apache Druid è un database open source per le real-time analytics sviluppato per offrire Data Warehouse di tipo SQL e OLAP (Online Analytical Processing) per il querying dei dati time-stamped. Viene utilizzato nei casi in cui l’elaborazione di dati in real-time e un alto uptime sono le priorità del progetto: ambiti comuni di applicazione sono il network performance monitoring, le analytics per il manufacturing, le metriche sulla performance delle applicazioni, la business intelligence e le analytics per il digital marketing.

Apache Druid è particolarmente indicato per le interfacce grafiche di applicazioni per le analytics o come backend di API che necessitano di aggregazioni ad alta velocità, permettendo di visualizzare dati in real-time e aiutando di conseguenza le aziende a prendere decisioni nell’immediato.

Graphite

Graphite è un time series database open-source che archivia series storiche numeriche e le visualizza on demand tramite la propria interfaccia web ad una velocità sostenuta. Nella maggior parte dei casi viene utilizzato come archivio per le metriche di performance di sistemi, network e applicazioni, permettendo alle aziende di individuare con facilità blackout e problemi nelle loro architetture informatiche.

Rispetto ad altri TSDB, Graphite non punta sulla velocità e sulla capacità di storage al secondo, ma offre strumenti avanzati di visualizzazione delle serie storiche di dati.

InfluxDB

InfluxDB è un database time series realizzato specificatamente per le serie storiche: è in grado di archiviare, comprimere e di eseguire il querying in real time di enormi quantità di dati tramite un'interfaccia del tipo command-line. È di facile installazione e utilizza un linguaggio, InfluQL, simile a SQL, per aiutare gli sviluppatori a lavorare con facilità sulla base di linguaggi a loro già familiari.

È il database che più si sta affermando nell'ambito dei dati time series grazie alla capacità di gestire milioni di data point al secondo e soprattutto grazie all’ecosistema di strumenti di cui fa parte, il TICK stack, che include Telegraph, Chronograph e Kapacitor, altri progetti open source che abilitano la gestione di enormi quantità di informazioni temporali per il monitoraggio e l’analisi in real-time.
InfluxDB è particolarmente indicato per estrarre e archiviare grandi moli di dati time-stamped che necessitano di venire archiviati per lunghi periodi di tempo, e offre strumenti che automatizzano il downsampling e il processo di eliminazione dei dati (con Continuous Queries e Retention Policies).

Leggi anche: Time Series Database per grandi volumi di dati: intervista con InfluxDB

Conclusioni

Se stai valutando quale Time Series Database scegliere per le tue esigenze di gestione e archiviazione delle serie storiche di dati, Extra Red ti consiglia InfluxDB per la sua capacità di gestione di grandissime quantità di dati al millisecondo e soprattutto per l’ecosistema di strumenti open source integrati di cui fa parte.

Prenota una consulenza gratuita con noi per scoprire da vicino i vantaggi e le funzionalità di InfluxDB, cliccando sul pulsante qui sotto!

Extra Red Time Series Database

Lascia un commento