Vojna podatkov v politiki
Kit samorog je nenavaden morski sesalec, ki živi v poledenelih arktičnih morjih. Njegov edini naravni sovražnik je orka, znana tudi kot ubijalski kit. Hkrati sta orka (orca) in kit samorog (norwhal) tudi delovni imeni informacijskih sistemov, ki sta jih med nedavno ameriško predsedniško kampanjo uporabljala demokratski in republikanski tabor. V naravi bi ubijalec požrl samoroga, v politiki je tokrat zmagal rogatež.
Prva objava: Sobotna priloga Dela, 24. november 2012
Veliki podatkovni dvoboj republikanskih in demokratskih političnih strategov je potrdil lanske napovedi, da bo tokratna predsedniška tekma izjemno »informatizirana«. Že prva izvolitev Baracka Obame leta 2008 je imela močan pridih internetnosti. Novi predsednik je z internetnimi prispevki zbral več kot 600 milijonov dolarjev. Njegovo ime so širili viralni spletni videospoti, volivce je nagovarjal na družabnih omrežjih, njegov štab je prvič uporabljal podatkovne analize za ocenjevanje učinkov spletne kampanje in osebno nagovarjanje volivcev.
Poznejše analize so sicer pokazale, da so mediji in analitiki pripisovali internetu preveliko težo, saj so bili za zmago pomembnejši Obamova karizma, neuspehi republikanske politike in delo terenskih političnih aktivistov. Vendar je imela odmevna raba novih spletnih orodij velik vpliv na posnemovalce po svetu, večja dostopnost osebnih podatkov na spletnih družabnih omrežjih pa ni bila vabljiva samo za trgovce, oglaševalce in spletne podjetnike, ampak tudi za prodajalce političnih »izdelkov«. Zato so ameriški specializirani tehnološki mediji lani poročali, da demokrati po vseh ZDA snubijo vrhunske programerje, analitike in poznavalce internetnih skupnosti, ki bodo pomagali Obami pri drugi izvolitvi.
O demokratskem podatkovnem štabu je bilo le malo znanega. Štab so si uredili v neki poslovni stavbi v Chicagu. Analitski in programerski del je bil skrit v posebnem prostoru, kamor niso smeli vstopati niti sodelavci kampanje. Na seznamu domnevnih sodelavcev so bili nekdanji razvijalci Twitterja, Googla, Facebooka in drugih vročih tehnoloških podjetij iz silicijeve doline. Nekaterim velikim ameriškim medijem so Obamovi strategi dovolili nekaj vpogleda v podatkovni del kampanje, a so smeli prispevke objaviti šele tedaj, ko bo znan novi predsednik.
Pravo razsežnost podatkovne analitike so zato nakazali šele nedavni prispevki, ki so jih pripravili novinar Atlantica Alexis Madrigal, komentator New York Timesa Charles Duhigg, tehnološki komentator tednika Time Michael Scherer, poročevalci agencije Associated Press in številni spletni mediji, ki so analizirali glavne značilnosti podatkovne kampanje. Njihovi zapisi potrjujejo, da so republikanci in demokrati tokrat uporabili vse podatkovne metode, ki jih za nagovarjanje potrošnikov uporablja internetna industrija. Nekdanjo politično intuicijo pa so zamenjali računalniški modeli, izračuni in simulacije.
George Clooney ali Sarah Jessica Parker?
Republikanski in demokratski štab sta imela zelo podobne cilje. Njuni strategi so vedeli, da je politični prostor v ZDA tako močno polariziran, da lahko o (ne)izvolitvi odloča že nekaj sto glasov v »neopredeljenih« zveznih državah. Zato sta hoteli obe skupini izboljšati bero internetnih prispevkov, poiskati najbolj optimalne kanale za politične oglase ter izbrskati neopredeljene volivce tudi v demografskih skupinah ali soseskah, ki jih je tradicionalno nagovarjal politični nasprotnik.
Republikanci so stavili na zunanje izvajalce in so večino analitskega dela prepustili specializiranim agencijam, demokrati pa so celotno podatkovno infrastrukturo razvili in upravljali sami, ker so hoteli ohraniti popoln nadzor nad podatkovnimi zbirkami. Vodja podatkovne ekipe – znani razvijalec in heker Harper Reed – je moral postaviti enoten informacijski sistem (z delovnim imenom norwhal), ki bo znal v realnem času povezovati analitike, terenske aktiviste, stratege, podatke o gledalcih televizijskih soočenj, merilce javnega mnenja in velike komercialne zbirke podatkov o ameriških potrošnikih. Tako celovit informacijski sistem so potrebovali za učinkovito usklajevanje vseh delov kampanje, a tudi zato, ker so se računalniški programerji dokončno poslovili od tradicionalnih demografskih kategorij, ki jih še vedno uporabljajo merilci »množičnega« javnega mnenja.
Skupinska poimenovanja ciljnih občinstev (»gospodinje srednjih let«, »mladi temnopolti Američani« …) so bila med kampanjo prepovedana, saj so analize uporabniških in potrošniških navad pokazale, da še tako samoumevne družbene skupine sestavljajo zelo različni posamezniki, ki na volitvah ne glasujejo za enake kandidate. Zato so morala biti sporočila kar najbolj osebna in natančno merljiva – tako sporočila za javnost in medijski nastopi kot tudi tviti, osebna elektronska pisma in objave na facebooku –, saj so Obamovi operativci na velikih vzorcih zelo natančno izračunali, komu poslati elektronsko pismo v imenu predsednika in katere mora nagovoriti njegova soproga Michelle ali podpredsednik Joe Biden. Do zaključka kampanje so Obamovi aktivisti znali napovedati celo razlike med elektronskimi pismi, ki so jim pripeli fotografijo predsednika ali njegove družine – katero sporočilo bo imelo več odziva, prepričalo naslovnika, naj se vpiše v volilni imenik ali prispeva denar za kampanjo. Za spletne donacije so razvili celo poseben plačilni sistem, ki je po zgledu uspešnih spletnih trgovin omogočil prispevke z enim klikom in si je zapomnil številko kreditne kartice.
Podatkovni analitiki so za profiliranje volivcev uporabili tudi po več kot 60 različnih podatkov, da niso izgubljali časa z opredeljenimi republikanskimi volivci ali niso razjezili lastnih podpornikov – da brezposelnih niso prosili za prispevke, ampak so jim obljubljali pravičnejšo socialno politiko. Za profiliranje so uporabili zelo različne podatke o volivcih. Zelo pomembni so bili pretekla volilna zgodovina (katerih volitev se je v preteklosti udeležil volivec in njegovi družinski člani) in članstvo v najrazličnejših civilnodružbenih organizacijah pa tudi morebitne denarne težave, gledalske in pivske navade (republikanci so med drugim ugotovili, da njihovi volivci v velikem odstotku prisegajo na določeno znamko piva).
Mobilne aplikacije in spletni piškotki so sledili gibanju in klikanju uporabnikov (kdo obiskuje pornografske ali gejevske spletne strani, katere medije bere …), prostovoljci so v računalniške modele vnašali javno dostopne podatke z osebnih profilov na spletnih družabnih omrežjih. V predvolilni končnici so demokratski računalniki za kritične neopredeljene države izvedli tudi po 60.000 simulacij volilnega rezultata, v katerih so preračunavali vplive najrazličnejših zunanjih dejavnikov na volilno udeležbo (vremena, kulturnih dogodkov …) ter jih uteževali s poročili terenskih aktivistov o stanju volilnih imenikov in meritvami televizijskih soočenj.
Obe skupini sta potrdili, da je bila njuna kampanja zaradi samoroga in orke precej učinkovitejša. Republikanci so zbrali na desetine milijonov dolarjev prispevkov, ker so uspešno izbrskali podpornike Mitta Romneyja tudi v tradicionalnih demokratskih zveznih državah ali soseskah. Še večje uspehe so medijem našteli demokratski sogovorniki, saj so z merjenim nagovarjanjem donatorjev prvič zbrali za več kot milijardo dolarjev spletnih prispevkov. Natančna analiza gledalskih navad jim je pomagala umeščati politične oglase tudi v neobičajne in bistveno cenejše televizijske termine (nanizanke, dopoldanske družinske oddaje …). Pri organizaciji donatorskih sprejemov so izračunavali, katere obiskovalce bi pritegnil igralec George Clooney in na čigavo radodarnost bi bolje vplivala Sarah Jessica Parker (na družabnih omrežjih so ugotavljali priljubljenost različnih zvezdnikov v določeni zvezni državi ali celo mestu). Marsikaterega uporabnika facebooka z zahodne obale ZDA je v zadnjem tednu kampanje presenetilo sporočilo, naj prijatelja na vzhodni obali opomni, da se bližajo volitve, zelo živahna je bila tudi prikrita »vojna« za prijatelje in sledilce na družabnih omrežjih, ki so ji pridno sledili tradicionalni mediji.
Spremljanje družabnih omrežij
Ameriške televizijske mreže, časopisi in spletni mediji so bili tudi tokrat pomemben dejavnik političnega spopada, le strategije političnih taborov so se prilagodile novemu medijskemu okolju. Pretekle volitve, vzpon gibanja čajank in predvolilni spopadi demokratskih in republikanskih kandidatov so pokazali, da so postali tradicionalni mediji zelo pomembni ojačevalci dogajanja na družabnih omrežjih. Voditelji informativnih oddaj in političnih soočenj niso več prikazovali samo javnomnenjskih raziskav in analiz, temveč so oddaje pogosto popestrili tudi z internetnimi statistikami: koliko prijateljev ali sledilcev je pridobil določen kandidat, koliko tvitov je sprožilo posamezno soočenje in kateri politik se je »spletni javnosti« zdel prepričljivejši.
Takšno medijsko poročanje je pritegnilo številne kritike. Priljubljeni televizijski politični satirik Stephen Colbert se je v svojem šovu Colbert Report vztrajno norčeval iz medijske »tvitologije« in se spraševal, kakšen je smisel premetavanja nekakšnih internetnih številk, če jih ne znamo niti približno zanesljivo pretvoriti v realne ameriške državljane in njihova mnenja, kaj šele ugotavljati »zmago« določenega kandidata v »spletnem dvoboju«. Sploh zato ker so mediji v preteklosti večkrat opozorili, da se politiki radi hvalijo z umetnimi internetnimi privrženci, ki jih je mogoče kupiti od preprodajalcev internetnih prijateljev ali ustvariti z računalniškimi robotki, kar ustvarja umetni občutek njihove (ne)priljubljenosti. Odmevne zgodbe o skritih internetnih vojnah (»astroturfingu«) pa so pokazale, da se za navideznimi državljanskimi spletnimi javnostmi pogosto skrivajo dobro organizirani politični aktivisti, lobisti vplivnih gospodarskih panog (energetike, tobačne in farmacevtske industrije …) ali oglaševalci.
Kritike medijske tvitologije niso bile omejene samo na ameriško predsedniško tekmo, ampak so se ponovile tudi v prvem krogu slovenskih predsedniških volitev. Ko je največja komercialna televizija Pop TV v predvolilnih soočenjih uporabila posebno orodje za »merjenje sentimenta« na družabnih omrežjih, je internetni merilnik (domnevno) izmeril močno spletno zmago kandidata Boruta Pahorja pred obema tekmecema. Ta rezultat je zmotil politični štab Danila Türka in njegove podpornike; podvomili so o reprezentativnosti merjenega vzorca (orodje je v resnici merilo predvsem dogajanje na omrežju twitter, ki ima v Sloveniji le nekaj tisoč aktivnih uporabnikov in dobrih 20.000 odprtih računov). Opozorili so na možnost manipulacije z rezultati, na katere bi lahko vplivala že majhna, dobro organizirana skupina nasprotnih spletnih aktivistov, ter se pritožili, da je Pop TV z nekritično razlago spornih rezultatov močno vplival na poznejši volilni rezultat.
So njihovi očitki utemeljeni? Tehnični direktor podjetja Gama System, ki je skupaj z Inštitutom Jožefa Stefana razvilo orodje za merjenje spletnega razpoloženja, nam je zagotovil, da so pri zasnovi upoštevali najpogostejše možnosti merilne napake ali manipulacije (lažne račune, umetno generirana sporočila, dvoumen jezik …) in sproti odstranjevali uporabnike, ki so se »obnašali sumljivo«. Povedal je, da je njihovo orodje verodostojno zajemalo dejansko dogajanje na twitterju, in potrdil, da so bili določeni tviteraši – usklajeno ali ne – glasnejši in uspešnejši od drugih. Vendar je tudi dodal, da dogajanja na twitterju ni mogoče posploševati na celotno slovensko populacijo, zato je treba za celovitejše ugotavljanje javnega mnenja uporabljati tudi druge raziskovalne metode in omejitve upoštevati pri razlagi rezultatov. A tega opozorila gledalci soočenj na Pop TV med razlago »eksperimentalnih« družabnoomrežnih rezultatov niso slišali.
Ameriška in slovenska tvitološka praksa potrjujeta, da je Colbertova kritika upravičena, saj mediji zelo radi pretvarjajo vprašljive internetne številke v zelo suverene interpretacije političnih soočenj, priljubljenosti kandidatov in prepričljivosti njihovih argumentov. Takšno nekritično poročanje pa že pri zasnovi internetnih strategij upoštevajo izkušeni politični štabi (Obamovi programerji so razvili številna namenska orodja za »ojačevanje spletnih učinkov«), zato je postalo vplivanje na internetne številke pomembna sestavina prikritega političnega bojevanja, pred katerim javnost nima učinkovite varovalke.
Matematična politika
Če bi se uresničile stare napovedi zagovornikov internetne demokracije, bi moral internet odpraviti prevlado velikih političnih strank, znižati vstopni prag za vstop v politično tekmo in vrniti politično moč običajnim državljanom. Vendar končna analiza internetnega dela ameriške predsedniške tekme znova kaže, kako naivna je lahko vera v demokratične potenciale komunikacijskih tehnologij.
Skupni stroški letošnje kampanje so ocenjeni na več kot dve milijardi dolarjev – največ v zgodovini ameriških volitev. Obamov podatkovni oddelek je za razvoj informacijskega samoroga, plače sodelavcev in vzdrževanje tehnične infrastrukture porabil najmanj sto milijonov dolarjev. Republikanski in demokratski analitiki so samo za dostop do komercialnih podatkovnih zbirk o ameriških potrošnikih odšteli več kot 13 milijonov dolarjev. Te številke potrjujejo svarila avtorja knjige Numerati Stephena Bakerja, da si bodo napredno podatkovno analitiko privoščile samo velike politične stranke, države ali korporacije, ki imajo dovolj denarja za nakup ljudi, znanja, tehnologije in podatkov, kar bo še okrepilo dosedanje nesorazmerje moči med strankarsko politiko, kapitalom in državljani. Poleg tega je ameriška kampanja pokazala, da učinkovite podatkovne politične kampanje skoraj niso mogoče brez poseganja v uporabniško zasebnost, saj sta oba tabora prikrito pridobivala uporabniške podatke iz računalnikov in mobilnikov, uporabniške podatke pa sta kupovala od podjetij (Axicom, Infousa …), ki so se morala zaradi nezakonitega pridobivanja osebnih podatkov večkrat zagovarjati pred sodiščem.
Zaupanje v moč podatkov, ki sta ga pokazala oba nasprotna tabora, pa je mogoče razumeti tudi kot vse večjo zadrego sodobnih strankarskih demokracij. Republikanska orka in demokratski samorog sta v resnici le ohranjala in optimizirala zelo staro politično igro, v kateri je treba od donatorjev pridobiti čim več denarja ter političnega kandidata učinkovito prilagoditi ciljnemu političnemu potrošniku. Stomilijonski dolarski zneski, ki sta jih bila ameriška tekmeca pripravljena porabiti za nekaj tisoč obljubljenih glasov v najbolj kritičnih zveznih državah, zato ne dokazujejo nujno Obamove tehnološke prevlade ali učinkovitosti podatkovnih orodij. Prej nasprotno, saj je njuno zanašanje na politično podatkovljenje mogoče razumeti tudi kot nezaupanje v lastne politične programe, ki jih že čez prihodnjih nekaj kampanj ne bo več mogoče »rešiti« z novimi analitskimi modeli, izboljševanjem volilnega rezultata za nekaj desetink odstotka ali medijsko tvitologijo.