Statystyka to sztuka wnioskowania

 

Statystyka jako metoda myślenia została zapoczątkowana w pracach Fishera, Pearsona czy polskiego statystyka Neymana w latach 30tych XX wieku. Mniemania o zjawiskach losowych albo takich, które nam się jako takie jawią formułowane są powszechnie, np. ,, miłość nie wybiera”, ,,większość mężczyzn to dranie’’. W naszym eseju rozważymy wyłącznie mniemania, które są zdaniami, czyli są albo prawdziwe albo fałszywe, w tym kontekście ,,miłość nie wybiera’’ stanowi co najwyżej koloryt językowy, podczas gdy drugie sformułowanie jest zdaniem.

Wiedza ogólna czy osobista zawiera również takie mniemania. To, że wiedza osobista może zawierać mniemania fałszywe jest zrozumiałe, gdyż polegamy w dużej mierze na sentymentalizmie poznawczym utrwalonym przez rodzinę czy najbliższe środowisko. I tak matematycy mają inne mniemania niż np. chemicy. Wyrażany powyżej osąd jest w istocie meta-mniemaniem i jako taki nie będzie rozważany dalej.

Wiedza ogólna zawierała (zawiera?) również fałszywe mniemania choćby w przypadku wrzodów żołądka. Cały świat wyśmiał kilka lat temu naukowca, który głosił, że winne są bakterie. Dlaczego tak się dzieje? Gdzie popełniono błąd, czyli dlaczego statystyka jest sztuką wnioskowania postaramy się poszukać odpowiedzi.

Rozważmy w tym celu ciąg kolejnych urodzeń notując płeć dziecka. Zjawisko jawi się jako losowe. Nawet gdyby rodzice dziecka mogliby pokierować doborem płci to i tak ich decyzje wydają się losowe. Przyroda generuje nam więc ciąg losowy. Załóżmy, że zaobserwowano kolejnych 10 urodzeń zaobserwowano: (d=dziewczynka, c=chłopiec), (d,c,d,d,d,c,c,d,d,d). Z drugiej strony dość powszechne mniemanie określa prawdopodobieństwo urodzenia dziewczynki jako 1/2. Mamy tu do czynienia z klasycznym zestawieniem mniemania hipotezy (a priori) a danymi empirycznymi. Aby dokonać analizy przekodujmy dane, niech c=0(porażka) d=1(sukces). Otrzymamy (1,0,1,1,1,0,0,1,1,1). Zatem w grze generowanej przez naturę jakie jest prawdopodobieństwo sukcesu (p)? Jak oszacować nieznany parametr (p)? Statystyka nie podaje jednego tylko kryterium szacowania nieznanego parametru. Co więcej różne kryteria często dają różne rezultaty. To może jest jakiś najlepszy estymator nieznanego parametru? Niestety określenie najlepszy też wymaga podania kryterium. Praktycy zazwyczaj nie zadają sobie trudu na odpowiedzenie dlaczego wybierają ten sposób a nie inny i dlatego w książkach mamy pełno niby-wiedzy.

Wracając do naszego przykładu biorąc za kryterium największą wiarogodność, czyli przy jakim p dane są najbardziej prawdopodobne otrzymamy, że p=7/10. No i teraz jeszcze jeden kłopot p=1/2 i p=7/10? Czy mamy zmienić zdanie czy wbrew rzeczywistości pozostawać przy swoim zdaniu? Znamy przecież ludzi którzy nigdy nie zmieniali swojego zdania. Student obeznany z testami odpowie: mamy tu do czynienia z statystyczną weryfikację hipotez ale wnioski któż właściwie zrozumie bo przecież nie dają one nam 100% pewności. Zawsze zdumiewa mnie 100% pewność. Nawiasem mówiąc nie jest to też 95% pewność choć w taki sposób uczę wnioskowania statystycznego studentów.

Z drugiej strony czy zgodność teorii i danych empirycznych stanowi o sukcesie teorii? Niestety, nie. Klasyczna nierówność Cramera-Rao nie pozostawia wątpliwości. I dlatego o oszustwo podejrzewa się Galileusza, Mendla czy Millikana (por. książka ,,Statystyka i prawda’’ Rao).

Jeszcze bardziej złożona jest sytuacja gdy mamy tylko wyniki doświadczeń a tak jest w przypadku badania efektywności leczenia. I nie dziwi tak naprawdę gdy w książce J.G. Bartletta ,, Leczenie zakażeń układu oddechowego’’ (1999) znajdziemy takie słowa

,, Medycyna zna niewiele chorób w których stosuje się tak wiele nieskutecznych metod leczenia, jak to ma miejsce w wirusowych zakażeniach górnych dróg oddechowych.’’

Jak widać z powyższego uprawianie statystyki jako sztuki wnioskowania jest dostępne tylko dla tych którzy potrafią zrozumieć całe bogactwo związków logicznych, matematycznych filozoficznych i poznawczych. I na jeszcze jedno pytanie kontrolne. Czy wobec tego wiedza jest względna czy prawdopodobna czy niemożliwa czy statystyczna? Może ktoś wie?