Rekapitulace nanečisto se Sarou Bareilles (KFF)
Můj červnový čánek vyšel na stránkách Kellner Family Foundation.
20 Aug, 2015 - 01 Min read
Výhra Baracka Obamy podtrhuje širší trend: sběr a analýza kvantitativních dat hrají stále větší roli nejen ve vyhodnocování voleb, nýbrž i ve vedení kampaní.
(Článek původně vyšel v blogu na iHNed.cz.)
Do středu pozornosti se obzvláště v týdnu před americkým volebním dnem dostal Nate Silver, statistik, jehož statistický model analyzující průzkumy veřejného mínění na úrovni jednotlivých států úspěšně předpověděl výsledky prezidentských voleb roku 2008 v 49 z 50 států. Pro tyto volby jeho model predikoval pravděpodobnost Obamova znovuzvolení konzistentně vyšší než 60%; v posledním týdnu podle něho pravděpodobnost vzrostla nad 75% a den před volbami se zastavila na 90.9%. Všimla si jej i některá česká média. Teď už víme, že úspěšně předpověděl výsledky ve všech padesáti státech. Více o Silverově metodologii si můžete přečíst zde.
Silverovy predikce se samozřejmě nezamlouvaly konzervativním komentátorům. Ti je kritizovali jako ideologicky předpojaté a pseudovědecké. Svou víru v to, že Romney zvítězí, zakládali zčásti na svérázné analýze výsledků jednotlivých volebních průzkumů bez ohledu na ostatní, zčásti na dojmech a konvenčních moudrostech, jako např. Romneyho říjnová „hybnost“. V posledních dnech se uchýlili k tvrzení, že volební průzkumy jsou zkreslené. Dnes už víme, že se mýlili ve svých předpovědích i v důvodech, pro něž Silvera odsuzovali.
Úspěch Silverova modelu má velký význam pro novináře i politology. Zaprvé znamená, že odhady na základě intuice – byť expertů – nejsou tak spolehlivé jako důsledná kvantitativní analýza. Pro ty, kteří sledují výzkum v oblasti lidské racionality, to není překvapením. Daniel Kahneman, laureát Nobelovy ceny za ekonomii z roku 2002, ve své loňské knize ukazuje, že lidské myšlení předvídatelně chybuje zčásti kvůli podvědomým předpojetím, zčásti kvůli neschopnosti správně vyhodnocovat pravděpodobnosti. Tendence takto chybovat existuje ve velké míře i mezi lidmi, kteří statistiku studují, natož mezi statistickými laiky. Není divu, že političtí komentátoři mají tentýž problém.
Obecně vzato, statistické modely v těchto volbách předpovídaly výsledek s větší přesností a menší vzájemnou variabilitou než volební komentátoři. (Slate má k tomuto pěknou infografiku.) To neznamená, že jsou dokonalé. Silverův model samozřejmě není stoprocentně spolehlivý – žádná předpověď není. Model by nemohl fungovat, pokud by volební průzkumy byly zavádějící. (To, že sběr dat se ukázal být velmi přesným, je samo o sobě velkým úspěchem.) Ne všechny modely měly tutéž úspěšnost (ostatně, selhání Romneyho Projektu ORCA je toho zářným příkladem). Oprávněnou kritikou je i poukázání na to, že zveřejňovat odhady pravděpodobností s přesností na jedno desetinné místo je zavádějící. Podstatné je to, že i kdyby se intuice některého z komentátorů nakrásně trefila, jedná se o náhodu; pocitové odhady “hlav v telce” už zkrátka nejsou systematicky lepším řešením.
Silver sám předpověděl, že pokud Obama volby vyhraje, dostane se jeho modelu přílišné chvály; pokud prohraje, přílišného odsouzení. Jeho přesnost neznamená, že můžeme budoucnost svěřit modelům a naplnit tím Asimovovu sci-fi vizi. Znamená ale, že bychom datové analýze měli věnovat mnohem víc pozornosti nejen jako novinoví čtenáři, ale především jako zpravodajci - a brát tvrzení komentátorů s mnohem větší rezervou.
Silverova přesná předpověď ale není jediným vítězstvím datové vědy. Magazín Time informuje o tom, jakým způsobem využívala analýzu plejády dostupných dat Obamova kampaň k tomu, aby optimalizovala své taktiky pro aktivizaci voličů a fundraising. (Situaci dlouhodobě sleduje Sasha Issenberg.) Vědecký přístup k vedení kampaně ke svému zvolení úspěšně využil už texaský guvernér Rick Perry: metody akademiků, s nimiž spolupracoval, popisuje Issenbergova krátká fascinující kniha “Rick Perry a jeho intouši”. Čím dál tím více platí, že místo toho, aby kampaně házely marketingové šipky na terč a doufaly, že se nějaká strefí, pečlivě testují, co funguje a co ne.
Přestože existují světlé výjimky, v ČR se stále často tváříme, že empirický přístup k vyhodnocování konkrétních opatření je nemožný. Akutní, analýzu znemožňující nedostatek dat o daňových příjmech či vzdělávacích reformách, na který poukazují Petr Janský a Jan Straka, jsou příklady neochoty data uvolnit nebo vůbec nasbírat. Velkolepé, plýtvavé volební kampaně jsou ukázkou toho, kam takový přístup vede. Americký úspěch datové vědy v tak obtížně zkoumatelné otázce, jako je vedení a vyhodnocení voleb, signalizuje, že změna je možná. Vzhledem k tomu, že efektivnější správa veřejných statků nabývá na důležitosti, je i nutná.
Můj červnový čánek vyšel na stránkách Kellner Family Foundation.
20 Aug, 2015 - 01 Min read
Pokud chcete činit dobro, stojí za to přemýšlet, jak jej můžete udělat co nejvíce. To je heslo efektivního altruismu.
28 Jan, 2015 - 03 Mins read
If you're looking for a skilled data engineer passionate about transforming data into actionable insights or simply want to have a chat.