<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=1267344923293614&amp;ev=PageView&amp;noscript=1">

Blog

Qual è la differenza tra Time Series e Relational Database?

Samuele Di Cataldo

Samuele Di Cataldo, 15 febbraio 2020 | Time Series Database

Le serie storiche di dati non sono un concetto del tutto nuovo nell’ambito dell’analisi e del monitoraggio dei sistemi: quello che è cambiato oggi è la mole di dati con timestamp prodotti da sensori e oggetti connessi nell’Internet of Things e la velocità a cui devono essere registrati. Ne consegue che i classici database relazionali non sono più la soluzione migliore per permettere alle aziende di trarre informazioni di business utili da questi dati.

Scopri cosa sono i Time Series Database. Scarica il nostro ebook gratuito!

In questo articolo vedremo insieme quali sono le principali differenze tra i database relazionali e i Time Series Database, e per quale motivo per le series storiche di dati è più vantaggioso puntare su una soluzione DB ottimizzata per la lettura dei timestamp.

Cosa sono le serie storiche di dati (Time Series Data)?

Cercando di dare una definizione sintetica di Time Series Data, o serie storiche di dati, possiamo dire che questi tipi di dati rappresentano collettivamente il modo in cui un sistema o un processo cambiano nel tempo. A ciascun data point in una serie storica è associato un timestamp, che viene registrato ogni volta su una nuova riga. È proprio questa caratteristica che li rende così potenti, perché permette di tracciare il cambiamento di un sistema nel tempo, di monitorare l’andamento nel presente e arrivare anche a predire i cambiamenti nel futuro.

Oggi le aziende hanno a che fare con enormi quantità di dati, i Big Data, in cui l’analisi del fattore temporale può rappresentare la chiave di volta per individuare aree di intervento per aumentare l’efficienza e diminuire i costi. Dal punto di vista temporale, i dati possono essere categorizzati come dati storici, recenti o in real-time, e le aziende devono poter essere in grado di accedere e analizzare questi dati con gli strumenti giusti, per ottenere una visione di business completa.

Time Series Database vs Relational Database: in cosa sono diversi?

Nell’ambito delle tecnologie per l’Industria 4.0, l’Internet of Things è lo scenario principale in cui entrano in gioco i Time Series Data: i macchinari delle fabbriche sono connessi al cloud aziendale e generano continuamente serie di dati storici sullo stato del sistema; i sensori degli Smart Device registrano misurazioni in tempo reale, producendo enormi quantità di dati in rapida successione che devono essere poter analizzati nel loro insieme per trarne informazioni di valore. Le serie storiche di dati, come abbiamo detto, esistono da tempo, ma quello che è cambiato è il tipo di database necessario ad analizzarli e visualizzarli in dashboard intuitive, un database che deve essere in grado di gestire l’enorme mole di dati registrati ad una velocità altissima.

Per questo motivo i classici database relazionali sono da considerarsi non adatti all’analisi delle serie storiche di dati, per le quali l’attenzione si focalizza sul fattore tempo. I database relazionali permettono di archiviare e analizzare data point relazionati l’uno con l’altro, rappresentati in tabelle. Ciascuna riga della tabella ha un ID unico denominato “chiave”, mentre le colonne rappresentano gli attributi del dato: ciascuna riga riporta un valore per ogni attributo, permettendo di mettere i data point in relazione tra di loro.

Idealmente, in questi database, per registrare le serie storiche basterebbe aggiungere una colonna riportante l’attributo del timestamp, ma i database relazionali sono ottimizzati per processare velocemente grandi quantità di key e degli attributi ad esse correlati, non per archiviare e presentare i timestamp per ciascuna key in modo efficiente sia dal punto di vista dell’archiviazione che dell’esecuzione. Le serie storiche possono arrivare a migliaia di righe di dati registrati: è necessaria una soluzione DB che permetta di cogliere l’andamento nel tempo del dato registrato.

Quali sono i vantaggi di un Time Series Database per le serie storiche?

L’efficienza e l’affidabilità sono i due vantaggi principali che contraddistinguono l’uso di un Time Series Database per l’aggregazione e il monitoraggio delle serie storiche provenienti anche da diverse fonti. A questi due si aggiungono scalabilità e usabilità. La scalabilità del database è un fattore determinante nell’Internet of Things, in cui un sensore che genera milioni di dati con timestamp non può essere gestito tramite un database relazionale, che richiederebbe il querying di milioni di righe in una tabella. In un database per le serie storiche, scalabilità equivale a un’alta capacità di scrittura anche su storage distribuiti, con conseguenti vantaggi per gli addetti al monitoraggio dei sistemi.

I Time Series Database garantiscono inoltre usabilità dei dati archiviati, grazie a linguaggi di query specializzati per la registrazione del timestamp che permettono di analizzare i dati non l’uno in relazione all’altro, come appunto in un database relazionale, bensì nel contesto temporale per aggregarli tra di loro e individuare dei trend. Non si tratta soltanto di selezionare il migliore DB per questo tipo di analisi, si tratta di scegliere come impiegare le risorse in modo efficiente per estrarre informazioni rilevanti per il business nel minor tempo possibile.

Conclusioni

Le aziende che vogliono adottare una soluzione DB performante per l’analisi dei dati prodotti dai propri macchinari possono rivolgersi ai Time Series Database, che sono ottimizzati precisamente per fornire una visione d’insieme dell’andamento dei sistemi focalizzando l’attenzione sul fattore tempo. Se vuoi approfondire l’argomento e scoprire tutti gli ambiti di applicazione dei Time Series DB, scarica l’ebook gratuito dedicato alle aziende: ti basta un clic qui sotto!

Extra Red Time Series Database

Lascia un commento