<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=1267344923293614&amp;ev=PageView&amp;noscript=1">

Blog

Cosa sono i Time Series Database?

Davide Avella

Davide Avella, 28 febbraio 2020 | Time Series Database

Per garantire i massimi livelli di efficienza e performance, l’Industria 4.0 e i dispositivi iper-connessi dell’Internet of Things hanno portato a una sempre più urgente necessità di analisi e monitoraggio dei dati, che in ambito IoT sono caratterizzati dalla presenza del timestamp sul data point, i cosiddetti Time Series Data.

Scarica il nostro ebook sui Time Series Database per le aziende!

Non è il timestamp in sé a rendere complesso il monitoraggio dei dati nell’IoT, quanto piuttosto la mole di dati generati e la frequenza di monitoraggio a cui devono essere sottoposti. Basti pensare alle esigenze di una grande azienda manifatturiera che possiede moltissimi macchinari di produzione connessi tra di loro, e alla quantità di dati Time Series che vengono generati ad altissima velocità. Per poter archiviare e analizzare questi dati ai fini di tenere l’impianto di produzione monitorato ed evitare guasti, oltre che utilizzarli per attività di Business Intelligence, è necessaria una soluzione di database adatta, ossia un Time Series Database.

Cosa sono i Time Series Data?

Facciamo un passo indietro e chiariamo cosa si intende per Time Series Data.

Non si tratta soltanto di una sequenza di data point che misurano qualcosa nel corso del tempo e vengono archiviati secondo un ordine cronologico. Le caratteristiche che accomunano questi dati sono 3: come abbiamo già detto, l’alto volume di dati generati; il valore intrinseco del dato, che aumenta proprio grazie alla presenza del timestamp; e infine il fatto che i Time Series Data acquisiscono più valore quando analizzati in dataset, piuttosto che come singoli data point.

Alcuni esempi di questi dati comprendono i dati di monitoraggio nel DevOps, i flussi di eventi delle applicazioni web/mobile e, come abbiamo visto, i dati dei macchinari industriali nell’IoT. Per tutti questi dati, la dimensione temporale fa sì che il dato acquisti valore anche dopo l’acquisizione, e deve essere conservato nel tempo per finalità di analisi e monitoring. Questo tipo di dati però si accumula facilmente: è quindi necessario un Database performante che permetta alle aziende di trasformare questi flussi di dati nell’efficientamento della produzione e nella previsione di guasti e malfunzionamenti.

La differenza fondamentale tra una serie storica di dati e la semplice aggiunta di un campo temporale in un data set è data dal modo in cui vengono tracciati gli aggiornamenti nel data set. Nell’ambito IoT, infatti, i dati raccolti da un sensore non possono essere sovrascritti man mano che vengono generati se si vuole essere in grado di monitorare lo stato del sistema nel corso del tempo.

I principali settori di impiego dei Time Series Data: IoT e DevOps maintenance

Le serie storiche di dati vengono generati da dispositivi e sistemi IoT presenti nella nostra quotidianità: basti pensare ai dispositivi smart nelle nostre case che registrano dati temporali su temperatura e consumo elettrico, oppure alla possibilità di effettuare un ordine online e ricevere il pacco nello stesso giorno, che è data dalla capacità delle industrie retail di monitorare i loro asset con estrema precisione proprio grazie all’analisi dei Time Series Data.

Nell’ambito del monitoraggio DevOps, invece, i Time Series Data ricoprono un ruolo fondamentale per identificare trend e raggiungere il 100% di uptime del sistema. Unite al Machine Learning, le serie storiche di dati permettono di adottare un approccio proattivo nei confronti del monitoraggio dei sistemi aiutando ad individuare le anomalie sulla base dello storico dei dati.

Perché è necessario un Time Series Database per i Time Series Data?

Teoricamente, qualsiasi tipo di DB è utilizzabile per l’archiviazione delle serie storiche di dati, ma i problemi sopraggiungono quando si tratta di effettuare analisi su di essi. Data la natura dei data set delle series storiche, la scelta del database deve essere basata sulla scalabilità e sull'high availability. I database relazionali non forniscono sufficienti capacità di portata e di archiviazione per i Time Series Data, che sono legati a processi veloci e per i quali è fondamentale adottare una soluzione di DB creata appositamente per la loro analisi.

La scelta di un Time Series Database per i dati storici è la più sensata se si vogliono ottimizzare le risorse di banda e memoria: questi database usano come chiave primaria il timestamp di raccolta del dato (il momento in cui viene letto) e sono ottimizzati per le applicazioni che mettono in primo piano la scansione di punti rilevati su un arco di tempo ampio e la creazione di report basati sulla sintesi di tali punti.

Tra i Time Series Database più performanti troviamo InfluxDB, un DB open source specializzato nell’alta scrittura e nella consistenza degli eventi, anche su sistemi distribuiti: è progettato per semplificare l’interazione con le serie storiche e fa parte di uno stack, il TICK stack, che fornisce tutti gli strumenti per l’archiviazione, l’analisi e la visualizzazione dei Time Series Data. Su InfluxDB le query di dati si basano su un linguaggio simile a SQL, facilitando così agli sviluppatori il compito di integrare le applicazioni esistenti con il DB.

Se la tua azienda vuole investire nell’Internet of Things e trarre vantaggio dall’analisi delle serie storiche di dati, scarica la nostra guida gratuita introduttiva ai Time Series Data per le aziende, ti basta un clic sul pulsante qui sotto!

Extra Red Time Series Database

Lascia un commento