La scarsa qualità dei dati può ostacolare o danneggiare seriamente l’efficienza e l’efficacia di organizzazioni e imprese. La crescente consapevolezza di tali ripercussioni ha condotto a importanti iniziative pubbliche come la promulgazione del "Data Quality Act" negli Stati Uniti e della direttiva 2003/98 del Parlamento Europeo.
Gli autori presentano un’introduzione completa e sistematica all’ampio insieme di problemi legati alla qualità dei dati. Il libro parte con una descrizione dettagliata di diverse dimensioni della qualità dei dati, come l’accuratezza, la completezza e la consistenza, e ne discute l’importanza in relazione sia a diverse tipologie di dati, come i dati federati, i dati presenti sul web e i dati con dipendenze temporali, che alle diverse categorie in cui i dati si possono classificare. L’esauriente descrizione di tecniche e metodologie provenienti non solo dalla ricerca nell’area della qualità dei dati ma anche in aree correlate, quali data mining, teoria della probabilità, analisi statistica dei dati e apprendimento automatico, fornisce un’eccellente introduzione allo stato dell’arte attuale. La presentazione è completata da una breve descrizione e da un confronto critico di strumenti e metodologie pratiche, che aiuterà il lettore a risolvere i propri problemi di qualità.
Questo libro costituisce la combinazione ideale fra la correttezza dei fondamenti teorici e l’applicabilità degli approcci pratici. E’ ideale per tutti coloro – ricercatori, studenti o professionisti – che siano interessati a una panoramica completa sui problemi della qualità dei dati. Può essere inoltre impiegato come manuale in un corso introduttivo all’argomento, o dall’autodidatta.