La foto de la portada es una imagen de libre uso de Pixabay y editada por con GIMP, los emoji son creados con Bitmoji
El término explosión de datos, que es a lo que nos referimos en esta serie de publicaciones, hace referencia a las cantidades cada vez más ingentes de datos estructurados, no-estructurados y semiestructurados que se generan minuto a minuto; a continuación veremos algunas de las muchas fuentes diferentes que producen todos estos tipos de datos.
Según un reciente estudio mundial realizado por IBM, cada día se generan unos 2,5 exabytes (Eb) de datos.
Un Eb son 1018 bytes o un millón de terabytes (Tb).
Originalmente, el término Big Data se refería simplemente a las grandes cantidades de datos que se producen en la era digital.
Estas enormes cantidades de datos, tanto estructurados como no estructurados, incluyen todos los datos web generados por los correos electrónicos, los sitios web y las redes sociales.
El término Big Data se utiliza ahora para referirse no sólo a la cantidad total de datos generados y almacenados electrónicamente, sino también a conjuntos de datos específicos de gran tamaño y complejidad, con los que se requieren nuevas técnicas algorítmicas para extraer información útil de ellos. Estos grandes conjuntos de datos proceden de diferentes fuentes.
Imagen de Pixabay y editada por con GIMP.
En 2012, se realizaron más de 3.500 millones de búsquedas al día solo en Google.
Al introducir un término clave en un motor de búsqueda se genera una lista de los sitios web más relevantes, pero al mismo tiempo se recopila una cantidad considerable de datos.
Al utilizar un software de seguimiento básico, puede descubrir que se generaron alrededor de unas 100 conexiones a sitios de terceros sólo por hacer clic en este sitio web.
Así, para rastrear los intereses de las personas que acceden al sitio, la información se comparte de esta manera entre las empresas comerciales.
Estos registros contienen información útil como el propio término de la consulta, la dirección IP del dispositivo utilizado, la hora a la que se envió la consulta, cuánto tiempo permanecimos en cada sitio y en qué orden los visitamos, todo ello sin identificarnos por nuestro nombre.
Cuando navegamos por la web, cada clic que hacemos queda registrado en algún lugar para su uso futuro.
Existe un software que permite a las empresas recoger los datos de clickstream generados por su propio sitio web, una valiosa herramienta de marketing.
Los registros también se utilizan para medir la eficacia de la publicidad en línea, básicamente contando el número de veces que un visitante del sitio web hace clic en un anuncio.
Al permitir la identificación del cliente, las cookies se utilizan para personalizar su experiencia de navegación.
Cada vez que usted visita este sitio web, la cookie envía un mensaje al sitio web y, de esta manera, hace un seguimiento de sus visitas.
Las cookies se utilizan a menudo para registrar los datos de los clics, para mantener un registro de sus preferencias o para añadir su nombre a la publicidad dirigida.
Imagen de Pixabay y editada por con GIMP, e Inkscape.
Si te gusto este tema y quieres seguir profundizando acerca de Los datos: Explosión, no te pierdas la próxima publicación, pero si aún así deseas conocer otra perspectiva del mismo, te invito a investigar en las siguientes referencias que acá te comparto: