Насловна  |  Актуелно  |  Вести  |  Лажи, проклете лажи и статистике
Povećaj veličinu slova Vrati na prvobitnu veličinu slova Smanji veličinu slova štampaj štampaj
 

Pošalji prijatelju

Вести

05. 08. 2020.

Аутор: Алексеј Кишјухас Извор: Цензоловка

Лажи, проклете лажи и статистике

Да бисмо адекватно конзумирали статистичке информације из медија, потребно је више знања и одговорности новинара, али и много више математичке, научне и статистичке писмености међу самим грађанима, који падају ничице пред бројевима и процентима као пред фараонима

Једна од нуспојава коронавируса је и пораст броја људи који – прате и читају статистике. Дакле, разне бројеве и проценте, односно графиконе, табеле и криве у вези са COVID-19. А највећи број грађана тада се о статистикама оболелих, преминулих, опорављених итд., пре свега информише – из медија.

Међутим, у медијима неретко постоје и многе варљиве и преварне статистике и дезинформације. Док искривљено или кварно баратање бројевима и графиконима може да искриви нашу перцепцију, допринесе погрешном закључивању, те ризичном понашању грађана усред кризе по јавно здравље.

А можда је све то и откривање топле воде. Наиме, једна од најпознатијих књига тим поводом била је Како лагати уз помоћ статистике још из давне 1954. године. У питању је популарно написан и илустрован приручник о најчешћим грешкама у прикупљању, интерпретацији и извештавању о бројевима, постоцима и пропорцијама у јавности. Продат је у пар милиона примерака, а служио је и као уџбеник за уводне часове статистике на многим факултетима. Занимљиво је да аутор ове књиге, Дарел Хаф, уопште није био академски статистичар, већ – новинар.

И сад, премотајмо 66 година унапред. Проблем остаје, или је чак инфодемијски акутнији и већи. Наравно, најпознатије лагање уз помоћ статистике јесте оно када се бројеви или проценти напросто – измисле. На пример, када надримедији који су склони власти и/или опозицији у предизборној кампањи пропагандно и неистинито пренесу да та-и-та политичка странка или тај-и-тај кандидат имају подршку од 18, 28 или 48 одсто бирачког тела. Па ће ова бирачка тела, конформирајућа каквим их је еволуција природном селекција дала, тада пожурити да на изборима гласају попут популарне већине. Или, када се статистички подаци, нпр. о оболелима и преминулима од коронавируса, из политичких разлога фризирају, прикривају и намерно умањују.

Али у овом тексту нас пре свега интересују оне нешто суптилније, дубинске и готово структурне методе дезинформисања статистиком. Споменути примери су, уосталом, само она уобичајена или проклета лаж, зар не? Суштина је у томе да је статистиком могуће обмањивати јавност чак и без експлицитне и задње намере.

По правилу, и новинари су и људи од крви и меса, и махом пристижу са друштвено-хуманистичких факултета. Где обично добијају веома мало или скоро нимало напредног математичког и статистичког знања. А тек је медијска јавност или публика статистички неписмена, и обично пада ничице пред бројевима и процентима као пред фараонима или мандаринима.

Из тих разлога, ово су четири основна проблема на које ваља обратити пажњу када се медијски извештава о статистичким подацима – како за новинаре, тако и за конзументе медија.

1. Проблем дефинисања

Кренимо од назад или од временске прогнозе са краја ТВ Дневника.

Вест гласи: „Време сутра: 74% шансе за кишу у Београду.“

Океј, али шта је тачно „Београд“? Да ли је то површина уже области града (око 360 квадратних километара) или чак десет пута већа административна област (око 3.222 километара квадратних)?

Или – шта је тачно „киша“? Да ли је неколико капи из облака које су пале на асфалт у Миријеву довољно да у питању буде – киша?

Проблем уопште није наиван. Колико тачно капи воде треба да падне, на колико велику област, и у трајању од колико тачно времена, да бисмо поуздано рекли просту реченицу да је – „у Београду пала киша“?

Проблем се додатно компликује када је реч о оним друштвеним или економским појмовима или темама са почетка или из средине ТВ Дневника.

Узмимо само „статистичку“ вест о томе да је у Србији, на пример, „у порасту број бескућника“. Али ко су тачно „бескућници“? Да ли су то само несрећни људи који спавају међу картонима на плочнику на улици? Неки од ових „бескућника“ у строго власничком смислу можда и поседују кућу или стан (па не улазе у „статистику“), али из неког разлога тамо не живе.

Шта је са женама које због насиља у породици живе у сигурним кућама? А са женама које уопште немају стамбену имовину, јер патријархат? Истеранима на улицу од стране судских извршитеља, јер капитализам?

Да ли су „бескућници“ и подстанари који су напустили дотадашњи стан, па спавају на каучу код пријатеља или сродника док не изнајме нови? А студенти из провинције нерешеног стамбеног питања у универзитетским градовима?

Зато што немамо јасне критеријуме или дефиниције, постаје могуће да нпр. Политика извести да у Србији живи 20.000 бескућника – а РТВ да у Србији живи чак 900.000 бескућника, и што је бројка која је чак 45 пута већа!

Исто или још више проблематично јесте када се у медијима статистички извештава о броју запослених, незапослених, сиромашних, абортуса, развода брака, зависника од алкохола и дрога, па и о броју оболелих, излечених и преминулих од неке болести попут COVID-19. Било је много критике на рачун рачунања преминулих од коронавируса, и сећамо се опаске „Ударио ме аутобус“ премијерке Ане Брнабић. Али у питању јесте реалан методолошки проблем дефинисања који може да искриви статистику.

Управо због тренирања строгоће у дефиницијама, они пажљиви медијски извештаји обично ће напоменути да је „стваран број много већи“. Јер ко су све или тачно сиромашни, незапослени, зависници или болесни у неком друштву? Све су то крајње флуидне категорије и дефиниције, чак и ако нам се чини да инстинктивно знамо или осећамо шта тачно представљају.

2. Проблем просека

Просек је омиљена статистичка техника у медијима. Редовно се извештава о просечним платама, просечној цени дизела, просечном животном веку, просечним температурама итд., јер нам фамозни просек омогућује да гомилетину података и хрпетину информација сведемо на један прост број. Ипак, сваки просек је и једна необично компликована или нимало проста ствар. Када професионални статистичари говоре о просеку, они обично мисле на најмање три вредности – (аритметичку) средину, модус и медијану. Које могу бити веома различите, те откривати (или сакривати) крајње различите ствари.

О томе сведоче и популарни вицеви о делу популације који једе искључиво месо и делу популације који једе искључиво купус, па због чега становништво „заправо“ ручава сарму. Али је стварност много мање комична од овако бајатих вицева. На пример, статистичку препону од 500 евра просечне плате у Србији могуће је досегнути и тако што ће број од само неколико десетина хиљада људи и Душана Бајатовића имати месечну плату од око 30.000 евра, док седам милиона осталих грађана тавори са 300 евра плате. А да ли је то плутократско друштво у којем желимо да „у просеку живимо“?

Просечни животни век у средњем (али и у осамнаестом и деветнаестом!) веку био је око 38 година. Међутим, то не значи да 1850. године није било педесетогодишњака и шездесетогодишњака на улици (Волтер је преминуо у 83, Кант у 79, Дарвин у 73, а Пастер у 72. години живота), као што бисмо погрешно претпоставили читајући ову статистику у новинама. Већ „само“ да је тада постојала изузетно висока смртност новорођенчади и деце, па је она била „спустила“ просечни животни век људи на око 40 година. Уосталом, људи у просеку имају по један тестис. Зато што једна половина људских бића (мушкарци) обично имају два, а једна половина (жене) имају нула, па људи у просеку заиста имају по један дотични орган међу ногама. А да ли то одговара реалности, иако је ово статистички тачно и чини згодну насловну страну?

3. Проблем узорка

Астрогеолози узоркују Месечево камење уместо да анализирају цео Месец. Лекари биопсијом узоркују комадиће ткива уместо да људима чупају и анализирају читаве органе. А друштвени научници и истраживачи јавног мњења анализирају само исечак друштва, ставова и мишљења популације. Зато никада не смемо заборавити или занемарити следећу чињеницу. Са изузетком пописа становништва (једном у десет година!), свака статистика о којој читамо у медијима заснива се на – узорку. Док у тим медијима много мање читамо о величини, садржају или уопште карактеру тог узорка. А управо они су кључни за сваку адекватну статистику, пошто исувише мали или пак нерепрезентативни узорак може бескрајно искривити и податке и закључке.

За сваку добру статистику о људском здрављу у узорак морамо да укључимо и људе који су високи, ниски, мршави, жгољави, витки, дебељуце, дебели, бодибилдери, пушачи, непушачи, трезвењаци, и оне који радо попију једно или два пива превише. За питања која се тичу нпр. политике, морамо укључити и мушкарце и жене (и оне између), и оне са села и оне из града (и центра и периферије), и младе и средовечне и старе, и геј и би и стрејт, и етничке већине и мањине, и богате и сиромашне, и раднике и сељаке и ситну и крупну буржоазију, и студенте и запослене и пензионере, и ожењене, удате, самце и удовце, и необразоване и оне са средњом стручном, и факултетлије и магистре и докторе, и рокере и репере и народњаке, и тако у дословно недоглед.

А да ли најчешћи узорци од око 1.000 испитаника заиста репрезентују све ове људске разлике? Ткиво модерног друштва је необично и крајње разноврсна ствар. Осмислити онај „прави“ исечак друштва зато јесте вештина, наука и патња за себе – која је већа и од биопсије простате.

Јер, ако истраживање вршимо телефоном, у узорку су нам они који уопште имају (или се јављају на) фиксни телефон (дакле, средовечни и пензионери). Уколико га обављамо интернетом, онда обухватамо само оне који имају и користе компјутере (дакле, млађи и образованији). А ако одлучимо да табанамо од врата до врата, у узорку су нам они који су баш тада код куће, а не на послу или другде (дакле, незапослени и докони).

Уз то, ваља знати и да је већина закључака из истраживања друштвених наука (а посебно људске психологије) о којима читамо у медијима заснована на крајње „необичном“ или тзв. WEIRD узорку (што је акроним за Western, Educated, Industrialized, Rich, Democratic). Другим речима, на „пригодном“ или згодном узорку студената психологије са Харварда, Станфорда, Принстона, Берклија, Колумбије, Јејла, Оксфорда, Кембриџа итд. И који су све само не репрезентативни узорак или комадић људске популације.

4. Проблем поређења баба и жаба

Статистике у медијима воле и да упоређују ствари. На пример, у црној хроници у вестима могли смо да чујемо да је 2014. била година са највише авионских несрећа у историји. Те године догодиле су се две чувене несреће Малезија ерлајнса, те падови авиона у Малију, Тајвану, Ирану итд., са укупно 1.183 људске жртве.

Да ли су то онда летови авионом постали опаснији? Не, нису. Зато што је немогуће просто упоредити 2014. и нпр. 1955. (560 жртава) или 1984. годину (676 жртава). Све то зато што, прво, данас има неупоредиво више комерцијалних летова него раније. И, друго, зато што су данас сами авиони по капацитету путника много већи (па броје и више погинулих ако им се догоди квар или руска ракета).

Прости бројеви жртава 1950-их и 2000-их зато су оне пословичне „бабе и жабе“ у компарацији. С тим у вези, уместо апсолутних бројева, много је сувислије упоређивати број смрти на милион путника (или на милион пређених миља). Ово је већ статистика која показује да су летови авионом и те како постали безбеднији него раније.

Присетимо се тога ако данас упоређујемо број оболелих или умрлих од шпанског грипа и од ЦОВИД-19. У питању су бабе и жабе зато што је свет изгледао сасвим другачије 1918. и 2020. године, по броју становника, стопама глобалне трговине, саобраћаја и осталог.

Исто је и када по медијима упоређујемо број преминулих од нпр. канцера или дијабетеса (1,6 милиона смрти 2016. године) са преминулима од коронавируса (700 хиљада 2020. године). Једно су хроничне, а друго је заразна болест, дакле, опет статистичке бабе и жабе.

Или, када у апсолутним бројевима упоређујемо преминуле од коронавируса у Кини, Белгији, Сједињеним Државама, Италији, Бразилу, Индији, Шведској, Словенији, Хрватској или Србији, са толико различитим бројем и густином становника. Ово нису „бабе и жабе“, већ „жирафе и стиропори“ по томе колико се међусобно разликују као државе и друштва.

* * *

Марк Твен је чувено изјавио следеће: „Постоје три врсте лажи: лажи, проклете лажи и статистика.“

Међутим, да ли је заиста тако? Зато што је, иронично, ова реченица такође – лаж. Марк Твен ово никада није заиста рекао, већ је ту изреку у својој аутобиографији (1907) приписао британском премијеру Бенџамину Дизраелију. А који је такође никада није изрекао, те је био „слагао“ и новинар Твен.

Коме онда веровати? Ако већ не можемо веровати секси цитатима са Фејсбука, да ли можемо веровати бројкама и процентима у медијима? Или је то статистика заиста попут бикинија – показује много, а не открива ништа?

Наравно да није. Уосталом, „статистика“ је само (сјајна) техника или средство, а не и чињеница или истина по себи. Као и увек, основни проблем је у људским умовима. Који, чим угледају некакав број или проценат, одмах помисле да су у питању хладне, тврде и чврсте чињенице, насупрот некаквим речима, причама и филозофијама. Уз то, прецизност није исто што и истинитост. Ако у медијима прочитамо да је раст БДП у Србији „5,23 одсто“, ова информација уопште не мора да буде истинита само зато што је прецизна и има неку децималу. Статистички подаци једноставно нису некакве богом или природом дате чињенице које тада само треба прикупити као трешње са дрвета.

Да бисмо адекватно конзумирали статистичке информације из медија, потребно је више знања и одговорности новинара, али и много више математичке, научне и статистичке писмености међу самим грађанима. Добра препорука, за почетак, јесте да ваља двапут размислити о споменутим проблематикама – дефинисања, просека, узорка и баба и жаба оне статистике коју нам сервирају.

И да никада не смемо сметнути с ума банално следеће: људи су ти који прикупљају статистику. Живи људи, који су такође саткани од крви, меса, коже, масти, те својих политичких и идеолошких пристрасности, они су који одабирају како ће тачно, непрецизно или кварно дефинисати, упросечити, узорковати и упоредити све оно што – броје, сабирају, одузимају, множе и (са нама) деле у медијима.

 

 

Коментари (0)

Остави коментар

Нема коментара.

Остави коментар

Молимо Вас да прочитате следећа правила пре коментарисања:

Коментари који садрже увреде, непристојан говор, претње, расистичке или шовинистичке поруке неће бити објављени.

Није дозвољено лажно представљање, остављање лажних података у пољима за слање коментара. Молимо Вас да се у писању коментара придржавате правописних правила. Коментаре писане искључиво великим словима нећемо објављивати. Задржавамо право избора или скраћивања коментара који ће бити објављени. Мишљења садржана у коментарима не представљају ставове УНС-а.

Коментаре које се односе на уређивачку политику можете послати на адресу unsinfo@uns.org.rs

Саопштења Акције Конкурси