El Dirty Data consiste en datos que no representan la realidad. Más de la mitad de los usuarios facilitan datos falsos para las bases de datos de las empresas. Como consecuencia, éstas pierden eficacia en sus acciones.
¿Qué es el Dirty Data?
Los datos se han convertido en una herramienta de enorme potencial para la optimización de resultados, pero, ¿cómo distinguimos la información veraz de la fraudulenta?
Las plataformas de Big Data no tienen en cuenta el Dirty Data, es decir, bases de datos con información incorrecta, incompleta, inexacta, desactualizada o con datos duplicados.
Por eso Hocelot, una compañía deeptech española, especializada en la obtención de variables y analítica de nueva generación (IA, machine learning y deep learning) en tiempo real para resolver necesidades concretas a problemas de negocio, ayuda a las empresas a verificar esa información, corrigiendo, normalizando, organizando y descartando aquellos datos falsos que los usuarios introducen en las bases de datos de las empresas.
Y… ¿cómo combatirlo?
“Las empresas se enfrentan a un serio problema cuando se lanzan al Big Data, ya que no toda la información que recopilan es veraz. Según nuestros propios estudios más de la mitad de los usuarios aportan al menos un dato falso entre la información que facilitan a las empresas. Además, se calcula que el 25% de la información que poseen las empresas podrían ser datos falsos”, asegura Antonio Camacho , fundador y CEO de Hocelot.
“El Dirty Data es, por tanto, un nuevo reto que las empresas deben afrontar para reducir los riesgos por pérdidas relacionadas con el fraude de identidad”.
La veracidad del dato, aspecto diferencial
El Big Data, que consiste en la gestión y análisis de millones de datos, tiene como pilares fundamentales los conceptos de volumen, velocidad y variedad. Estas plataformas focalizaron su atención en analizar y gestionar un mayor volumen y variedad de datos a una velocidad cada vez más alta.
Sin embargo, el Dirty Data añade dos nuevas variables: veracidad y valor.
La veracidad de los datos se ha convertido en una cuestión de confianza para las propias empresas, que deben conocer los motivos que llevan a los usuarios a falsear sus datos.
Por ello, Hocelot ha desarrollado servicios que permiten analizar infinidad de datos, centrándose en tres grandes campos: aspectos personales (edad, nivel educativo, búsquedas de trabajo, etc.), económicos (sueldo, capacidad de ahorro, etc.) y lo relativo al hogar (renta de alquiler, precio estimado del inmueble, etc.).
“Gracias a nuestros servicios, somos capaces de realizar un análisis más exhaustivo de cada usuario, ya que analizamos infinidad de datos personales y profesionales. Entre ellos, la fecha de nacimiento, un factor importante si tenemos en cuenta que un 23% de los usuarios asegura que lo falsea de forma ocasional.”
Antonio Camacho, Fundador y CEO de Hocelot