Aug 18

Dan Nguyen, glavni programer Pro publice

Leto 2010 je bilo prelomno za novinarske teoretike in praktike. Spomladi je ameriška alternativna medijska organizacija Pro publica prejela prvo Pulitzerjevo nagrado za prispevek, ki je bil objavljen samo na svetovnem spletu. Jeseni pa je spletna skupnost wikileaks skupaj z nekaterimi velikimi časopisi (španskim El Paisom, nemškim Spieglom, britanskim Guardianom, francoskim Le Mondom in ameriškim New York Timesom) objavila prva zaupna poročila ameriških diplomatov.

Prva objava: Sobotna priloga Dela, 18. avgust 2012, fotografija LJK

Podatkovno novinarstvo je postalo nova vroča besedna zveza v medijski panogi – prepričanje, da bodo preiskovalne novinarske ekipe skupaj z računalniškimi programerji in oblikovalci prečesavale osvobojene podatke in odkrivale pomembne zgodbe. Novinarske organizacije so razpisale štipendije za podatkovne novinarje, na nekaterih britanskih in ameriških fakultetah so odprli prve programe za novinarske podatkovne rudarje. Zgledom velikih svetovnih medijev so sledili lokalni in podatkovne infografike so se s svetovnega spleta selile v tiskane izdaje.

Po dveh letih se je navdušenje nad novostjo precej poleglo, je povedal glavni programer Pro publice Dan Nguyen. Številni uredniki in novinarji se danes sicer bolje zavedajo moči podatkovnih orodij, vendar jim več ne pripisujejo nekdanje vsemogočnosti. Podatkovne zgodbe namreč sledijo enakim pravilom kot drugo medijsko poročanje. Odločajo ekskluzivnost, udarna tema in občutek, kaj zanima bralce, zato bodo preživele samo tiste mlade medijske organizacije, ki bodo podatkovno znanje znale združiti s tradicionalnimi novinarskimi veščinami, je prepričan sogovornik.

Značilnost Pro publice je bilo sodelovanje z velikimi ameriškimi mediji. Vi ste predlagali velike preiskovalne zgodbe, ki se jih drugi zaradi pomanjkanja časa in denarja niso dotikali, vaši medijski partnerji pa so prispevali dodatne novinarje, prostor za objavo in publiciteto. Zadnji dve leti objavljate vse več prispevkov kar na vaši spletni strani. Zakaj?

Na začetku smo večino energije namenili iskanju partnerskih medijskih organizacij, s katerimi bomo skupaj pripravljali in objavljali zgodbe. Ko smo premagali njihove stare predsodke pred zunanjimi sodelavci, smo objavili nekaj zelo odmevnih zgodb, s katerimi smo dosegli precej več občinstva, kot če bi jih objavili samo na naši spletni strani. Tak je bil tudi raziskovalni novinarski članek o nenavadnih smrtnih žrtvah v neworleanski bolnišnici po orkanu Katrina, za katerega je naša novinarka Sheri Fink prejela Pulitzerjevo nagrado. Vendar smo spoznali, da ne moremo več vztrajati pri prvotnem modelu.

Kaj se je spremenilo?

Marsikaj. Ustanovljeni smo bili kot tvegano mlado podjetje (startup), ki je hotelo delovati kot alternativna, povsem internetna redakcija. Vendar smo kljub temu postajali vse bolj podobni tradicionalnim medijem. Tudi mi smo med iskanjem in pokrivanjem zgodb izoblikovali novinarske rutine, ki so nas pri prvih medijskih partnerjih kar malce motile. Zdaj vemo, zakaj so nas partnerski mediji pogosto videli kot vsiljivce – naš način dela pač ni bil združljiv s kulturo njihove redakcije. Danes se podobno počutijo naši avtorji, ki morajo sodelovati z drugimi novinarji (nasmešek). Zato smo začeli zgodbe delati čisto po svoje in jih objavljati na naši spletni strani, pri čemer nam zelo pomagajo izkušnje z družabnimi omrežji in poznavanje mehanizmov kako širiti novičarske vsebine po svetovnem spletu. Drugi mediji nas seveda še vedno lahko povzemajo in uporabljajo naše podatkovne aplikacije, če želijo, a partnerski model za nas ni več najpomembnejši.

Ali to pomeni, da postajate podobni starejšim tekmecem – kalifornijskemu centru za raziskovalno novinarstvo Center for Investigative Reporting in washingtonski nevladni organizaciji Center for Public Integrity?

Morda, vendar so med nami še vedno velike razlike. Veliki mediji in specializirane medijske organizacije so se v zadnjih letih naučili zbirati podatke. Pozorni so na javne podatkovne zbirke in na spletne skupnosti, kakršna je wikileaks, ki objavljajo zaupne dokumente. Vendar je objava zbranih podatkov le prvi korak, saj postanejo zares uporabni šele, če imate na voljo posebne programe, s katerimi jih je mogoče analizirati in urejati. Ti programi pa so trenutno naša največja konkurenčna prednost, kar kaže tudi obiskanost nekaterih naših nedavnih zgodb: spremljanje protipiratskega zakona Sopa, razkrivanje zdravnikov, ki jih plačujejo farmacevtska podjetja, plačila državne pomoči ameriškim bankam, prerazporejanje davkov in socialne pomoči … Vsi mediji so objavljali številke, koliko so prejele banke, in morda sestavili lestvico največjih prejemnic. Le redki pa so podatke uredili kot podatkovne zbirke in jim dodali analitske programe, ki jih je lahko uporabil vsak spletni obiskovalec.

Urednik podatkovnega bloga pri Guardianu Simon Rogers prav tako zagovarja objavljanje celotnih podatkovnih zbirk, v katerih lahko državljani in novinarji sami iščejo nove zgodbe. Vendar je priznal, da to možnost v resnici izrablja le malo obiskovalcev. Je vaša izkušnja drugačna?

Obnašanje naših obiskovalcev je zelo odvisno od oddaljenosti volitev, trenutnih notranjepolitičnih tem in pomembnih gospodarskih napovedi. Naš program za spremljanje državnih pomoči bankam je imel zelo zanimiv življenjski cikel. Prve tedne so naključni obiskovalci premetavali številke in ugotavljali, kdo vse je prejel denar, kako ga je odplačal in kaj je naredil z njim. Spletni promet je izboljševal njegovo vidnost na spletu in naša stran je kmalu pristala med prvimi zadetki na googlu, če ste se zanimali za poplačilo bančnih dolgov. Pri tem smo pomagali tudi sami, saj smo spodbujali obiskovalce, naj nas omenjajo na družabnih omrežjih, če jim je aplikacija všeč. Ko se je tematika poslovila z naslovnic, pa je zbirka zaživela drugo življenje – postala je referenčna.

Med strokovnjaki?

Da, saj danes naše podatke redno uporabljajo tako blogerji kot tudi najvidnejši ekonomski komentatorji, kadar pišejo o vladni ekonomski politiki in stanju bančnega sistema. To spoznanje je bilo zame izjemno zanimivo, saj kaže, kakšen vpliv imamo lahko podatkovni novinarji. Da ne gre samo za hekanje, osvobajanje podatkov, analizo, programiranje in oblikovanje lepih infografik, ampak za soustvarjanje podatkovnih zbirk, ki vplivajo na medijsko poročanje in politične odločevalce. Prav na tem vplivu bomo gradili svojo prihodnjo identiteto, saj želimo postati ponudniki referenčne zbirke podatkov, ki bo pomagala razumeti politične, gospodarske in družbene razmere v ZDA.

Kakšna mora biti dobra novičarska aplikacija? Poskusov je na spletu veliko, a le redke dosežejo širšo javnost.

Daleč najpomembnejša je tema, podobno kot pri naslovu članka na naslovnici. Če boste objavili seznam plač javnih uslužbencev v določeni zvezni državi, boste imeli zagotovljeno veliko klikov, naj bo aplikacija še tako nerodna in grdo oblikovana. Dovolj je, če lahko obiskovalec vpiše ime in izve, koliko ta oseba zasluži. Take preproste aplikacije so zelo koristne za lovljenje klikov, vendar z njimi ne morete doseči referenčnega statusa. Na podatkovno zbirko morate nujno navezati tudi zares dobro zgodbo, kar je pokazal naš verjetno najuspešnejši podatkovni projekt Dollars for Docs, čeprav je nastal čisto naključno.

Naključno?

Pred približno dvema letoma sem na svojem blogu objavljal krajše novinarske priročnike kako uporabljati prosto dostopna internetna orodja za zbiranje in analizo podatkov. Hotel sem predstaviti nekaj primerov kako s spleta zajeti podatke in jih oblikovati v urejeno podatkovno zbirko. Med iskanjem sem v New York Timesu zasledil članek, da je moralo farmacevtsko podjetje Pfizer javno objaviti seznam zdravnikov, ki so jim v zadnjih letih nakazali denar. Tega seveda niso storili prostovoljno, ampak so morali izpolniti zaveze iz neke sodne poravnave, ker so bili obtoženi nezakonitega oglaševanja novega zdravila proti bolečinam. Ko sem našel omenjeni seznam, sem videl, da je Pfizer sicer izpolnil zahtevo sodišča, a so bili podatki objavljeni v zapisu, ki ni omogočal iskanja, primerjave in drugih obdelav. Ko sem objavil zapis, mi je takoj pisal novinarski kolega Charles Ornstein, ki že dolgo spremlja zdravstveno politiko.

Kaj ga je zanimalo?

Povedal je, da je bilo v preteklosti že več podobnih poravnav, zaradi katerih so morala farmacevtska podjetja razkriti nakazila posameznim zdravnikom. Zanimalo ga je, ali bi lahko zbrali vse podatke in naredili enotno zbirko, saj je bil prepričan, da bi mu taka zbirka veliko povedala o prepletu zdravnikov in farmacevtske industrije. Izziv me je takoj pritegnil, zato smo se skupaj z novinarko Tracy Weber lotili zbiranja podatkov.

Kako ste se lotili projekta?

Zbiranje podatkov je trajalo pol leta. Ornstein in Webrova sta opravila novinarski del, jaz pa sem imena zdravnikov sproti povezoval z drugimi zbirkami podatkov: zdravniško zbornico, časopisnimi dokumentacijami, sodnimi spisi, seznami zdravstvenih odborov, seznami strokovnih člankov … Ornsteina je zanimalo, kakšno ozadje imajo najbolje plačani zdravniki – kje delajo, komu svetujejo, v katerih komisijah sedijo –, zato sem med izdelavo njihovih profilov s posebnimi programskimi robotki izvedel nekaj milijonov iskanj, ki so prinesla veliko zanimivih informacij.

Kaj ste ugotovili?

Da je večina najbolje plačanih zdravnikov po specializaciji endokrinologov – specialistov za hormonske težave, ki med drugim zdravijo diabetes (nasmešek). Vendar tega podatka še nismo uporabili, saj so oba novinarja bolj zanimale druge teme. Farmacevtske družbe so plačila posameznim zdravnikom vedno utemeljevale z argumentom, da je to priznanje njihovemu zglednemu, nesebičnemu in požrtvovalnemu delu za družbo. Naši podatki pa so pokazali, da med prejemniki najbolj bogatih prejemkov prevladujejo zdravniki, ki niso bili ravno zgledni. Nekateri so bili obtoženi malomarnosti, drugi so se podpisali pod sporne medicinske raziskave … Ornstein je zato ovrgel trditve farmacevtov, da podpirajo najbolj zaslužne zdravnike. Med pridobivanjem podatkov pa je naletel še na veliko sistemsko pomanjkljivost. Zanimalo ga je, ali lahko datume izplačil zdravnikom povežemo z datumi, ko so bila obravnavana posamezna zdravila na zvezni agenciji za zdravila (FDA), in ugotovimo, ali je začel zdravnik po prejemu denarja predpisovati več zdravil svojega sponzorja. Vendar zbirka izdanih receptov ni javno dostopna. Še več – do seznamov izdanih receptov lahko dostopajo agenti farmacevtskih podjetij in ugotavljajo učinkovitost marketinških dejavnosti, ker vedo, kdaj so obiskali posamezne zdravnike, javnost pa te možnosti nima.

Kakšni so bili odzivi?

Zgodba je bila izjemno odmevna, saj je bilo njeno sporočilo zelo jasno: nadzor nad financiranjem zdravnikov ni zadosten, pacienti pa ne morejo izvedeti, kdo plačuje njihovega zdravnika in kako to vpliva na njegovo predpisovanje zdravil. Škoda, saj bi lahko analiza teh podatkov potrdila očitke, da farmacevti podkupujejo zdravnike, ali pokazala, da plačevanje zdravnikov nima tako velikega vpliva, kot trdijo kritiki. Vendar je bila že postavitev zbirke velik uspeh, saj so obiskovalci množično preverjali svoje osebne zdravnike in jim zastavili kar precej neprijetnih vprašanj, če lahko verjamemo spletnim debatam. Za dostop do podatkov so se že zanimali tudi številni raziskovalci in akademiki, ki raziskujejo ameriško zdravstveno politiko in vpliv farmacevtov na medicinske raziskave.

Kako ste preprečili napake? Če bi se med prejemniki plačil znašel samo en napačen zdravnik, bi to omajalo verodostojnost celotne zbirke.

Zavedali smo se, da bodo zdravniška združenja in pravniški oddelki farmacevtskih družb prežali na še tako majhno napako, zato smo vsak podatek večkrat preverili. Najbolj previdni smo morali biti pri več osebah z istimi ali podobnimi priimki. Večkrat smo v uradnih zbirkah našli napake in je bil isti zdravnik enkrat John, drugič Jim. Te napake smo popravili, saj smo vedeli, da bi bili pred javnostjo mi krivi zanje. Pri iskanju so bile izjemno pomembne izkušnje novinarskega specialista, kakršna sta Ornstein in Webrova, saj računalniki spregledajo takšne nedoslednosti. Zato sem se od njiju zelo veliko naučil.

Katera znanja manjkajo podatkovnemu novinarju?

Če bi se sam lotil projekta, bi verjetno zgolj uredil in objavil prvotne podatke. Nikoli ne bi pomislil na toliko različnih vprašanj in primerjav kot Webrova in Ornstein, saj premalo poznam zdravstvo, farmacevtiko in zdravstveno politiko. Podobno kratkoviden sem bil tudi pri pripravi aplikacije za spremljanje lanskega glasovanja o protipiratskem zakonu Sopa. Kongresnike sem razdelil na podpornike in nasprotnike zakona, poiskal podatke o financiranju kampanj in iskal donacije velikih založnikov, saj sem hotel slediti denarnim tokovom in pokazati, kako glasbene založbe in hollywoodski studii vplivajo na našo zakonodajo. Danes se mi zdi, da je Sopa v resnici opozorila na čisto drugačen problem: na apatijo in nevednost zakonodajalcev. Naši kongresniki so bili preveč zaposleni z drugimi stvarmi – zdravstveno reformo, pridobivanjem denarja za kampanjo –, zato si preprosto niso vzeli časa in so Sopo potrdili čisto mimogrede, brez razmišljanja in ocene posledic.

Podobno se je zgodilo pri sprejemanju protipiratskega sporazuma Acta v EU.

Acta je opozorila na enak problem: zakonodajalci in politiki preprosto nimajo časa in znanja, da bi se poglobili v predlagane zakone. Zato imajo lobisti in dobro organizirane interesne skupine zelo veliko vpliva na zakone, ker poznajo postopke in vedo kako predlagati kak člen ali ga ustaviti. Tu ni nobene teorije zarote, le spretno izkoriščanje kompleksnega sistema odločanja, kakršnega smo ustvarili.

Ste na Propublici že našli idealno razmerje med novinarji in programerji, ki prinaša odmevne podatkovne zgodbe?

Programerji smo zelo dobri pri prepoznavanju statističnih vzorcev. Vidimo, kako se obnašajo podatki, kje nastajajo gruče in kaj so statistično zanemarljive izjeme. Vendar lahko ravno kakšna na videz nepomembna, statistično zanemarljiva izjema vzbudi pozornost specialista. Ta tudi laže opazi, ali v zbirki kakšen podatek manjka. Zato zelo rad sodelujem z novinarji, ki mi znajo zastaviti prava vprašanja, saj mi to zelo olajša izdelavo novičarskih podatkovnih orodij.

Vam novinarji znajo povedati, kaj hočejo od vas?

Moji sodelavci se večinoma kar dobro zavedajo vloge podatkov, zato z njimi nimam večjih težav. Saj od novinarjev ne pričakujem programerskih veščin ali mojstrskega premetavanja številk. Čudim pa se, če nimajo vsaj osnovnega občutka za delo s podatki – če najdejo kak seznam z imeni in ne pomislijo, kaj vse jim lahko pove tak dokument. Kaj povezuje imena ali številke na seznamu? Kaj manjka? Kaj se zgodi, če imena poguglamo? Jih je mogoče primerjati z zapisi v kaki drugi zbirki, razvrstiti ali dopolniti z novimi podatki? Se pojavi kak vzorec? Je med nakazili in datumi nakazil kaj nenavadnega? Kar koli!

Se je tega občutka za podatke mogoče naučiti?

Zagotovo, saj potrebujete samo nekaj znanja in radovednost, zaradi katere se sprašujete, kako deluje družba in kaj se dogaja pod površjem. Če te zvedavosti nimate, ste verjetno izbrali napačen poklic.

No Comments

Leave a comment

no