Glenn Begly, 10 jaar hoofd kankeronderzoek van het bio technologie bedrijf Amgen, besloot te proberen de belangrijkste studies over kankeronderzoek te reproduceren. Hij identificeerde 53 studies in de meest toonaangevende publicaties van de meest toonaangevende laboratoria. Van die 53 studies konden er slechts 6 gereproduceerd worden.
Vrijspreker: Dat is niet veel. Hoe kan dat?
Opperdienaar: Het is niet dat het fraudeurs zijn of zo, maar wetenschap is gewoon heel moeilijk en er komen vele variabelen bij kijken, zodat je een oorzaak gevolg verband niet zo maar bewezen hebt. Een gelijksoortige studie van Bayer liet een zelfde soort resultaat zien. Zowel het menselijk lichaam, het immuunsysteem, de economie en het klimaat, zijn hele ingewikkelde systemen. Een denkfout is gemakkelijk gemaakt.
Verder zijn wetenschappers niet alleen afhankelijk van publicaties en geld, het is ook erg vervelend als een theorie die in je brein ontsproot, na alle moeite die je er in stak, niet door de data bewezen wordt.
Vrijspreker: Wacht eens even, dat klinkt toch verdacht veel als fraude.
Opperdienaar: Het wordt ook wel ‘P hacking‘ genoemd. De P waarde is kans dat de nul hypothese waar is gegeven de test data. Dus de nul hypothese is dat het medicijn niet werkt en als de kans dat deze hypothese waar is, gegeven de test data, beneden de 0.05 is, dan wordt gesteld dat de nul hypothese verworpen kan worden en het medicijn werkt.
Maar stel nu dat je de 0.05 net niet haalt, dan is het verleidelijk nog even te kijken naar dat ene geval. Misschien moet je die er uitlaten, dat was een patiënt die eigenlijk een geval apart was met meerdere klachten. Hee, kijk, de P waarde is opeens onder de 0.05. De psycholoog Uri Simonsohn van de Universiteit van Pennsylvania heeft dit verschijnsel p-hacking genoemd.
Het wordt ook wel ‘het martelen van de data totdat deze bekent’ genoemd.
Vrijspreker: Is dat te bewijzen?
Opperdienaar: Jazeker, als je een heleboel studies bekijkt, variërend van politieke wetenschap tot economie en sociologie, dan zie je de P waardes opeens verdacht oplopen bij de 0.05. Dat is de handtekening van ‘P hacking’. Het is net als banktransacties die opeens een piek vertonen bij 9999 euro, omdat bij 10.000 speciale controles plaatsvinden. Wetenschappers porren de data en de onderzoeksmethode om de P waarde aan de goede kant van de 0.05 te krijgen.
Vrijspreker: Economen van de Oostenrijkse school hebben een grote weerzin tegen statistiek voor economische wetenschap, ze vertrouwen op a priori waarheden, logica en consistentie.
Opperdienaar: Dat is het grote methode geschil tussen de reguliere economen en de Oostenrijkse economen. De laatste geloven bijvoorbeeld dat als je een minimumloon instelt van 10 euro/uur, dat dit betekent dat alle mensen wiens productiviteit onder de 10 euro/uur zit, op termijn hun baan verliezen. Als je het minimumloon verhoogt tot 1000 euro/uur, is die termijn zelfs heel kort. Reguliere economen zeggen dan: “hoho, niet zo snel, het is heel ingewikkeld en dat kun je wel zo bedenken, maar je weet het pas zeker als je het meet”. Dan gaan ze met statistiek aan de gang om de werkeloosheid te vergelijken voor en na de invoering van het minimumloon en in regio’s waar het minimumloon wel en niet is in gevoerd.
Vrijspreker: Dan vinden ze zeker dat het niet klopt?
Opperdienaar: Inderdaad, wij van de staat vinden deze methode dan ook veel bruikbaarder, want er is veel meer mee te sjoemelen. Zelfs na al het gesjoemel heb je meestal alleen nog maar een correlatie en geen oorzaak gevolg verband, maar daar let niemand op.
Alleen met deze methode kun je werkgevers hebben die tegelijkertijd:
-Op winstbeluste graaiers en uitbuiters zijn
-Iemand in dienst houden waar ze gedwongen verlies op maken
Dat is met de logica van de Oostenrijkse methode niet mogelijk, maar de statistiek wijst het uit: kijk maar P=0.05. Er is gecorrigeerd voor van allerlei en nog wat verschillen, dat zou het minimumloon moeten isoleren.
Vrijspreker: Ik kan begrijpen dat de heersers en de economen liever met statistiek werken dan met logisch nadenken en consistentie.
Opperdienaar: Het geeft ons gewoon wat meer vrijheid om te bewijzen wat we toch al weten dat waar moet zijn.
John Joannides schreef in 2005 een paper getiteld “Why most published research papers are false”, waarin hij probeert aan te tonen aan de hand van het voorbeeld van schizofrenie, dat het aantal genen dat van invloed is op schizofrenie zo klein is tov het aantal genen dat niet van invloed is, dat het goed mogelijk is door puur toeval genen te testen die geen invloed hebben en toch door de P test heen te komen.
Neem ook dit onderzoek: Van getrouwde vrouwen in hun vruchtbare periode steunde 44.4% presidentskandidaat Mit Romney, terwijl van de vrouwen buiten hun ovulatie periode slechts 23.4% Mit Romney steunde. P=0.03
Vrijspreker: Waar! Feit!
Opperdienaar: De overheid martelt nu dus ook data via hun wetenschappers. Wetenschappers worden tenslotte geloofd.
Het hoofdprobleem met deze studies is dat men er van uitgaat dat men wetenschap bedrijft. Studies als economie zouden in de Theologische faculteit geplaatst moeten worden. Men heeft een bepaald geloof en in dat frame plaatst men gevonden resultaten. Men wil niet accepteren dat men iets gelooft dat niet bestaat of totaal fout is.
Een ander probleem s dat veel studies beginnen met een beeld van de waarheid die dan getoetst wordt of dat beeld juist is. Er worden metingen gedaan en men vint statistisch dat het beeld juist is maar het kan evengoed zijn dat iemand met een ander beeld precies het omgekeerde vindt met delfde test. Het probleem hierbij is dat men veel te veel variabelen buiten beschouwing laat.
Hub Jongen [3] reageerde op deze reactie.
@WijRos [2]:
Dat is inderdaad het geval. Maar als mer “variabelen” buiten beschouwing laat, dan is is het onderzoek verre van “wetenschappelijk””
Bij goed wetenschappelijk onderzoek kunnen wel vraagtekens over blijven, maar niet “contradicties”.
WijRos [4] reageerde op deze reactie.
@Hub Jongen [3]:
Bij veel wetenschappelijk onderzoek blijkt achteraf dat men variabelen over het hoofd gezien heeft of als niet van invloed werden beschouwd. Veel variabelen zijn vaak nog niet bekend als zodanig en daarom niet worden ze niet vermeld. Kortom het is wetenschappelijk om alle variabelen te noemen die meegenomen zijn en vooral er voor te waarschuwen dat er mogelijk veel belangrijke variabelen over het hoofd gezien zijn. Daarom zijn veel huidige wetenschappelijke onderzoeken niet waardevol om je gedrag op af te stemmen.
Alleen al de benadering van kankerverwekkendheid van stoffen wordt nog steeds bepaald aan de hand van mutageniteit terwijl inmiddels wel bekend is dat veel erg mutagene stoffen (bv. formaldehyde) zeer waarschijnlijk niet kankerverwekkend zijn.
Dit soort medische onderzoeken kunnen echter alleen statistisch gebeuren en zullen altijd verrassingen opleveren.
pcrs [5] reageerde op deze reactie.
@WijRos [4]: Dan zijn dit nog zaken waarvoor een gecontroleerd experiment mogelijk is waarbij je alle variabelen gelijk houdt in een laboratorium en het resulaat meet.
Bij economie/klimaat is dat gecontroleerde experiment al helemaal onmogelijk, dus daar kan nog veel meer mis gaan. Daar wordt alleen een model gemaakt (dat op de historische data wordt gefit) en aan de hand daar van voorspellingen gedaan.
Overigens is gecontroleerd experiment op mensen ook moreel gezien onmogelijk, dus daar wordt ook vaak met modellen gewerkt.
Overigens heb ik ook niets tegen statistisch onderzoek, mist je maar doorhebt wat voor fouten er in kunnen zitten en de gepaste voorzichtigheid in de conclusie in acht neemt.
Wetenschap wordt helaas zwaar misbruikt. Statistiek is de zuiverste vorm van misbruik.
Wetenschap is er niet om de waarheid te achterhalen.
Voorbeeld:
Wetenschappelijke stelling: Bomen groeien op dinsdag.
En verdomd, na uitvoerig onderzoek blijkt, bomen groeien inderdaad op dinsdag.
Dit blijft een wetenschappelijke waarheid totdat er iemand opstaat die een boomsoort, boomgaard, regio of planeet vindt waar, op dinsdagen, bomen niet groeien.
Heeft de wetenschap dan iets waar bewezen, of kan de wetenschap alleen iets onwaar bewijzen?
Je moet er als wetenschapper dus vanuit gaan dat wat jij bedenkt, later weer verbeterd wordt, ofwel, onwaar bewezen wordt. Keer op keer, altijd weer.
En als je het hier niet mee eens bent, verwijs ik je naar de statistieken.
pcrs [8] reageerde op deze reactie.
Net het originele stuk gelezen: conclusie…
Misschien beginnen met het proberen te reproduceren van het Pavlof-effect.
@Patrick [6]:
Wiskunde ook?
Nu is 2+3 =5 maar morgen niet meer ?
Comments are closed.