Secondo la Global Data Management Community (DAMA), la Data Quality consiste nella pianificazione, implementazione e controllo delle attività che applicano tecniche di gestione della qualità dei dati, al fine di garantire che siano adatti allo scopo e soddisfino le esigenze degli utilizzatori.

Oggi buona parte delle imprese si professa Data-Driven poiché le principali decisioni strategiche vengono indirizzate dall’analisi dei dati. Tuttavia spesso il modello usato non è corretto o non adeguato agli obiettivi di business;

lo strumento che gioca un ruolo chiave nello scegliere le giuste strategie aziendali è la qualità delle informazioni. I dati devono essere affidabili, rilevanti, corretti, accurati e soprattutto adatti alla funzione d’analisi da svolgere.

Perché la qualità dei dati è così importante per lo sviluppo del business e dell’innovazione?

Una recente ricerca ha evidenziato che avere a che fare con dati di scarsa qualità è la causa principale del superamento dei costi previsti nel budget di un progetto e contribuisce a distruggere il valore del business. Inoltre, questo problema rischia di diventare più grave man mano che le imprese diventano più digitalizzate e complesse.

La maggior parte delle aziende basa le proprie scelte su dati che non rappresentano la realtà, infatti sono obsoleti, polarizzati, derivanti da fonti non aggiornate, localizzati in database non comunicanti e non riescono a descrivere lo scenario che si sta analizzando. Una delle principali conseguenze è la sbagliata allocazione del budget sulle attività operative, basti pensare che secondo Forrester (leader mondiale nelle ricerche di mercato) il 20% della spesa dell’adv online è sprecata a causa della scarsa accuratezza dei dati, che si traduce in decine di miliardi di dollari.

Altri aspetti che dovrebbero far riflettere nella scelta di un approccio Data-Driven sono i veloci cambi di scenario dovuti a eventi globali come la pandemia di Covid-19, il cambiamento climatico e la geopolitica mondiale, che hanno reso obsoleti i dati storici su cui le aziende hanno sempre basato le proprie decisioni.

Ad esempio, se consideriamo la mobilità urbana, negli ultimi anni sono repentinamente cambiati i servizi, le dinamiche di utilizzo e le abitudini dei cittadini, rendendo necessaria la produzione di nuovi dati che descrivano la situazione attuale. Ciò ha messo in crisi molte aziende, poiché l’applicazione della Data Intelligence non può essere d’ausilio se il dato di partenza è anacronistico.

Inoltre, al fine di descrivere correttamente i fenomeni, è sempre più importante integrare i dati interni con altri di terze parti, come quelli provenienti dai social tramite la Sentiment Analysis (Clicca per leggere l’articolo dedicato). Il percorso è più complesso e necessita di azioni di Data Cleansing e Intelligenza artificiale per arrivare a una comprensione a 360°.

Criteri di Data Quality

Accertare la qualità dei dati è la base per tutte le azioni di Data Intelligence.

È fondamentale partire da una chiara definizione degli obiettivi di business, infatti nessun dato può definirsi “corretto” ma solo adeguato all’analisi da eseguire.

I principali criteri da tenere in considerazione per misurare la qualità sono le seguenti:

  • Comprensibilità: determina quanto i dati sono facili da comprendere
  • Accuratezza: si riferisce alla differenza tra una stima di come dovrebbe essere valorizzato un attributo e il valore effettivo riportato dal dato
  • Attendibilità: indica il grado di credibilità e affidabilità, strettamente collegato alla fonte d’origine
  • Completezza: è una misura di corrispondenza tra il mondo reale e il dataset specifico. indica quanti e quali dati mancano nel dataset per offrire una rappresentazione completa al 100% del contesto reale
  • Correttezza: il grado di esattezza
  • Interpretabilità: si riferisce alla disponibilità di una documentazione che indichi agli utenti che tipologie di dati sono contenute nel database e come analizzarli e interpretarli
  • Oggettività: indica l’imparzialità/obiettività
  • Quantità: indica quanto è appropriato il volume di dati posseduti in riferimento ad una determinata attività.
  • Rilevanza: si riferisce all’adeguatezza del database in relazione a un determinato contesto applicativo

A partire da approfondite considerazioni sui criteri citati, un’organizzazione deve definire metriche specifiche per determinare la Data Quality nel proprio contesto di business.

La Data Quality come base dell’innovazione

Noi di Drive2Data siamo convinti che la Data Quality è un elemento fondamentale per tutte le imprese e oggi, in un mercato sempre più competitivo e complicato, assume un ruolo strategico.

Riteniamo che esista una connessione diretta tra la qualità dei dati e la capacità innovativa di un’azienda, infatti la Data Quality non serve soltanto a prendere decisioni strategiche ma anche a comprendere problemi ed inefficienze nascoste, indirizzando verso nuove soluzioni.

Grazie ad algoritmi di Machine Learning, un buon database può evidenziare segnali che sono sintomo di qualcosa di importante da prendere in considerazione tempestivamente.

Il nostro approccio Data Driven permette di creare un metodo di raccolta dati di alta qualità su cui basare strategie efficaci e sostenibili in ambito economico, sociale, ambientale e digitale.

Vuoi maggiori informazioni sui nostri servizi di Data Cleansing online?

Share This