Desde la publicación del libro de Eli Pariser sobre el tema se ha hecho hasta cierto punto habitual, al menos en ámbitos especializados, hablar de filtro burbuja. Este concepto hace referencia a que debido a la personalización ya no existe un Internet común para todos, sino que la información y los contenidos a los que podemos acceder a través de la red de redes son diferenciados para cada persona. Cuando accedemos a un buscador, a una red social, a una plataforma de difusión de contenido audiovisual o a una página de comercio electrónico estamos mandando un montón de información sobre nosotros: el lugar desde el que nos conectamos, el tipo de dispositivo que usamos para ello, o la hora (Big Data). Esa información se almacena en lo que se suele llamar 'base de datos relacionales', y cuando transcurre el tiempo, si el sistema puede aprender (Inteligencia Artificial) permite hacer predicciones sobre el comportamiento que, en condiciones normales, tienden a acertar. Si, por ejemplo, me conecto a una tienda on-line para comprar zapatillas para correr me ofrecen también calcetines, pues las bases de datos muestran que muchas de las personas que compran zapatillas adquieren también calcetines. Si me conecto a una plataforma audiovisual para ver una determinada película o serie me ofrecerán también "productos similares", ya que las bases de datos relacionales muestran que suelen gustar a las personas que han visto lo mismo que yo. El extraordinario desarrollo de la Ciencia de Datos ha llevado a que algunos libros como Dataclismo planteen que en el futuro tendremos tantos datos que ya no necesitaremos de la Sociología. El enfoque tradicional de las Ciencias Sociales era ir de las teorías a los comportamientos individuales. El planteamiento del Big Data es epistemológicamente distinto, teóricamente agnóstico: no necesito de una teoría que explique el porqué de los comportamientos, si sé que quienes manifiestan un determinado comportamiento suelen presentar también otro podré predecir el último: quien entra en una tienda electrónica a comprar una bicicleta suele comprar también un casco, poco importa por qué.

La fascinación por la tecnología, el prestigio de las profesiones técnicas y su elevada 'eficacia' ha llevado a que en los últimos años se dé tanta importancia a los métodos y técnicas que se obvie por completo los conocimientos considerados habitualmente 'teóricos'. Esto me ha permitido, por ejemplo, asistir a 'fascinantes' presentaciones de investigaciones sobre el turismo en Canarias realizadas por expertos en Big Data que me han 'descubierto' obviedades como, por ejemplo, que en Gran Canaria tienen más peso los turistas nórdicos y alemanes y en Tenerife los británicos y españoles, que el reparto entre los distintos tipos de alojamiento es muy distinto a nivel de micro destinos y cosas por el estilo. Lo cual, si uno lo piensa bien, no es del todo sorprendente: los expertos en Big Data saben de eso, de datos, pero a menudo saben poco del campo al que pretenden aplicar sus técnicas.

La situación creada por la cuarentena asociada a la pandemia del coronavirus puede ser un interesante test para ver hasta qué punto estas técnicas nos permitirán construir un mundo mejor o nos pueden abocar a catástrofes que por contagio sistémico puedan ser cada vez mayores, si es que se aplica lo que Taleb denominaba la falacia del pavo. Imaginemos que el Consejo Nacional de Pavos Sabios de América decide que en vez de hacer teorías sobre el comportamiento de los humanos hay que limitarse a los datos, y empieza su investigación justo el día después de Acción de Gracias. Parece que los seres humanos son buenos con los pavos, los cuidan y alimentan. Y cada día que pasa aumenta la confianza en que eso es así. Hasta que llega el Día de Acción de Gracias y los humanos matan a los pavos para cenárselos. La cuarentena permite a las empresas de datos tener un ingente caudal de datos sobre cada uno de nosotros, pues siendo los dispositivos electrónicos la única conexión con el exterior nos pasamos el día enganchados a ellos. De mí pueden saber, por ejemplo, que, en días laborables, en horario de oficina, uso unas aplicaciones; que a las 11 de la mañana, en horario de la 'pausa café' consulto las redes; y que los fines de semana me conecto a plataformas para ver películas, a veces con palomitas y cerveza. Cada día que pase de la cuarentena les reforzará en la creencia de que mi comportamiento es predecible, y los fines de semana llenarán los supermercados de palomitas para microondas. El día en que se termine la cuarentena se pegarán un patinazo tremendo. Porque, por más que mi comportamiento anterior diga otra cosa, llegará un viernes en que saldré a la calle, no veré películas y las cervezas las tomaré fuera. En el mejor de los casos un mal uso de la 'Ciencia de Datos', basado en el supuesto de que se puede predecir el comportamiento con modelos con muchos datos, pero teóricamente endebles, producirá sobreacumulación de productos que ahora mismo consumo (bicis estáticas, palomitas para micro ondas) no porque "yo sea así", sino por la situación que vivo. En el peor de los casos, una mala comprensión del comportamiento humano unido a una confianza ciega en la planificación basada en la misma ("hay muchos datos que lo corroboran que me comporto así") puede generar males mayores. Lo bueno de la situación que vivimos es que, en el medio y largo plazo, vamos a tener tantos datos que podremos contrastar muchas afirmaciones, incluso esta que acabo de hacer. Ya veremos si los big data que vamos a acumular en los próximos tiempos demuestran que el Big Data es la solución para los problemas que viviremos en los tiempos no ya tan próximos o habrá que aceptar la hipótesis alternativa: que algunos de los problemas que nos toca vivir son consecuencia de un mal uso del enorme caudal de datos que existe en la actualidad.