Sabia la NSA que Trump guanyaria les eleccions americanes? Estic convençut que sí. I que, a més, no en tenien cap dubte. Després de tot el que va fer públic Edward Snowden sobre el funcionament d’aquesta agència governamental (i malgrat les tímides reformes d’Obama fruit de la pressió popular) és clar que podien preveure amb precisió quin seria el comportament de l’electorat americà. De fet, com escrivia en Josep Maria Ganyet a la Vanguàrdia (Una persona, un ‘bot’) el sistema d’intel·ligència artificial MogIA va predir la victòria de Trump a les presidencials americanes. MogIA va explorar i analitzar llocs web com Google, Facebook, Twitter o Youtube per emetre el seu veredicte. I va tornar a encertar: ja ho havia fet l’any 2008 i l’any 2012.
MogIA és un sistema limitat, que només beu de dades públiques i que té problemes per a determinar si una interacció a les xarxes socials amb un polític és positiva o negativa. Per moltes raons, estic convençut que altres sistemes d’Intel·ligència artificial menys publicitats (i més avançats tecnològicament) poden arribar a conclusions força més profundes.
Jo també creia que Hillary guanyaria. Havia consultat enquestes durant mesos i he seguit l’última setmana a nivell demoscòpic als Estats frontissa. Tant la mitjana de les enquestes a cada Estat, com les darreres enquestes (fins i tot les de peu d’urna) li donaven la victòria a Clinton. De manera prou clara, a més. Finalment, però, la candidata ha perdut Estats emblemàtics dels demòcrates, com Michigan, Wisconsin o Pennsylvania. Per exemple, a Michigan, Obama va treure més de 10 punts a McCain i Romney els anys 2008 i 2012. Aquest 2016 Clinton ha perdut per la mínima (1 punt).
Però les enquestes no ho preveien així. A Wisconsin, la mitjana de les enquestes recents donava un avantatge de 6,5 punts a Clinton i alguna arribava fins a un avantatge de 8 punts. Per aquest motiu, s’ha sobrevingut una pluja de crítiques a les empreses demoscòpiques i als politòlegs i analistes. Amb certa raó. Tanmateix, a continuació les xarxes i els mitjans s’omplien d’anàlisis d’urgència: ‘el vot blanc ha votat en massa com una minoria’, ‘les dones blanques han optat per Trump’ mentre ‘llatins, millenials i negres s’han quedat a casa’.
Curiosament, aquesta anàlisi del vot està basada en les mateixes enquestes que predeien la victòria de Clinton. Les enquestes a peu d’urna que es van equivocar, ara han servit per treure conclusions sobre la victòria de Trump. Un pèl agafat amb pinces, tot plegat.
El principal repte per a dissenyar una enquesta electoral és el disseny de la mostra. Amb una mostra aleatòria però alhora representativa et podràs acostar al posterior resultat a les urnes. Ara bé, la participació (i per tant, el grau de mobilització de cada bàndol) és molt difícil de predir. El pluripartidisme a Europa o la introducció de nous cleavages als EUA (establishment vs antiestablishment) compliquen l’equació. Com es podia preveure, per exemple, una major participació de l’electorat blanc dels EUA?
La resposta fa temps que existeix: el Big Data. L’anàlisi quantitativa a nivell massiu de dades es pot dedicar a trobar patrons de conducta electoral. Si MogIA va encertar, imagineu-vos què podrien dir Google (Gmail, Youtube) o Facebook (Instagram, Whatsapp) sobre l’hipotètic resultat a Wisconsin. És cert, però, que l’activitat a les xarxes pot predir amb major exactitud les intencions davant el vot de l’electoral menor de 35 anys, perquè són els usuaris més actius. S’haurà de trobar la manera d’incorporar aquesta anàlisi de dades per generar models de predicció més acurats. Les campanyes electorals ja comencen a utilitzar aquestes dades per demanar el vot i segur que a les war rooms dels partits es tracen estratègies a partir d’aquesta informació. I, segons diuen, és més barat que el mètode tradicional. El gran enigma és com acabar d’incloure el Big Data en el model d’anàlisi demoscòpica i electoral vigent. Segurament és el moment dels experts.
Tot i això, no s’han d’abandonar les enquestes perquè marquen tendències (i, grosso modo, no fallen). El millor exemple d’encert demoscòpic en aquestes eleccions presidencials ha estat la precisió amb la que han encertat el resultat global de Clinton. El seu quasi-48% a tots els Estats Units l’ha permès guanyar en vot popular (com afirmaven les enquestes) malgrat que no ha tingut un bon resultat als estats frontissa i, per tant, ha perdut les eleccions.
En conclusió, cal incorporar l’element Big Data a les prediccions electorals sense que impliqui una pèrdua de drets en l’àmbit de la privacitat. Les enquestes preelectorals són informació i, per tant, poden condicionar el vot. Si volem una democràcia avançada, cal anar més enllà per tal d’afinar més en els mètodes de predicció electoral.
El que no pot ser és que la NSA, MogIA i Google sabessin abans que nosaltres que Trump anava a esdevenir President dels Estats Units d’Amèrica.
Interessant article però, al meu parer, falta tenir presents alguns elements. Comencem per allò més bàsics, fins i tot abans de la mostra de l’enquesta: una enquesta (electoral, de consum, d’actituds sexuals o de ús de videojocs) és una fotografia del moment. Una enquesta diu tot allò que capta en el moment que es realitza. Considero molt important deixar de criticar les enquestes i els analistes quan aquestes no encerten quan, el problema, és una falta de comprensió del funcionament de la metodologia. Si volem imatges en moviment, anem al cinema no a la fotografia. El primer es basa en el segon, però no són el mateix.
Malgrat això l’ús de les enquestes sempre ha resultat interessant en tant que permeten anticipar esdeveniments. Quan Gallup va fer la seva primera enquesta (Crec que va ser l’any 1934) van ser capaços de predir el resultat. Ara bé, en aquella època la quantitat d’informació disponible per als ciutadans i la velocitat a la que s’intercanviava no és l’actual. Crec possible aventurar que les enquestes han anat perdent “fiabilitat predictiva” en la mesura que el món informatiu s’ha tornat més frenètic i més poblat (tant per mitjans, com per tots els individus que participen a les xarxes socials). Tampoc ajuda la voluntat dels mitjans de comunicació de vendre les seves enquestes amb titulars predictius que tiben fins a límits perillosos les capacitats de les enquestes.
Després hi ha un fet molt important del qual no es parla mai. Tal com una fotografia pot resultar borrosa si no adaptem l’obertura o la velocitat del diafragma, les enquestes tenen problemes per separar la “correcció política”. Una versió d’aquest fenomen, l’anomenada “espiral del silenci”, fa que la gent respongui allò socialment desitjat i no allò que realment desitgen o opinen. En el cas dels Estats Units m’ha semblat molt clara l’associació entre votant de Trump i baix nivell intel·lectual. Per tant, persones amb nivells educatius més alts hauran respost allò que s’esperava d’ells i no la seva preferència. (Això darrer és una hipòtesis meva).
Finalment, en quant a la capacitat del Big Data per predir resultats, no crec que solucioni cap tipus de problema. És cert que disposem de més informació i de forma més ràpida. Això ens pot permetre adaptar el discurs del nostre candidat durant la campanya i anar corregint aquells temes que no acabin de tenir bona acceptació entre els nostre grup de votants potencials. Tanmateix, malgrat aquesta utilitat gens menyspreable, les dades recopilades amb Big Data segueixen patint els mateixos problemes que dades recopilades per mostreig: no capturen els efectes psicològics i segueixen sent una representació estàtica del moment en que es registren.
La gran diferència, repeteixo, del Big Data és la velocitat en que anem rebent i processant aquesta informació a nivell individual i agregat. Gràcies a això, podem anar veient, gairebé al moment, els canvis en els patrons dels nostres votants; però segueixen sense tenir poder predictiu aquestes dades.