Le Big Data se définit ainsi parfois autour de 3 V. Pour Volume (la masse de données sans cesse croissance), Vitesse (car la collecte, l'analyse et l'exploitation des données s'opèrent souvent en temps réel) et Variété (en référence à l'hétérogénéité des formats).
Un article issu de l'INIST (CNRS) qui résume les principales remarques formulées par un collectif de développeurs/informaticiens sur la qualité des données et sur les efforts à réaliser pour améliorer leurs conditions d'utilisation. Le livre a été publiépar O'Reilly Média
"There is, of course, a great deal of discussion about the opportunities big data gives companies for greater customer insight and operational efficiency. But many companies, if not most of them, work in relatively sparse data environments: in emerging markets, B-to-B industries, highly specialized or concentrated markets, and the like. These companies have to be content with what I would call "little data.""
L'obfuscation est une technique consistant à noyer les collecteurs d'informations sous de fausses données, afin de masquer les données pertinentes. C'est l'objet de cet ouvrage de Finn Brunton et Helen Nissenbaum : Obfuscation, Obfuscation
A User's Guide for Privacy and Protest, aux éditions MIT Press (09/2105). Ouvrage de réflection mais aussi véritable guide pratique, l'ouvrage fait la part belle à de très nombreux exemples pratiques, dont certains peuvent être mis en oeuvre par tout un chacun.