Arkiv för kategori ‘Statistik’

An ambitious project that set out nearly 5 years ago to replicate experiments from 50 high-impact cancer biology papers, but gradually shrank that number, now expects to complete just 18 studies. Källa: Science

Min tolkning: Ett ambitiöst projekt startade för nära 5 år sedan med avsikt att återupprepa experiment från 50 cancerstudier som fått starkt genomslag. Gradvis har antalet minskat, nu förväntar man att 18 fullföljs.

Den vetenskapliga metoden bygger samman hypoteser till teorier och vidgar på så sätt vårt vetande samtidigt som den eliminerar felaktigheter.

  • Hypoteser är avgränsade tankebyggstenar som utgår från någons ideer. En hypotes skall vara testbar och ge samma utfall givet att ingående parametrar, en eller flera, är samma.
  • Om utfallen varierar trots samma ingångsvärden kan det bero på att hypotesen är felaktig, den anses då falsifierad.
  • En falsifierad hypotes kan förkastas helt eller omarbetas inför ytterligare test.
  • En falsifierad hypotes uppfattas vanligen som ett nederlag, men representerar även det väsentlig kunskap; här finns inget att hämta.
  • En giltig teori består av (ännu!) ej falsifierade hypoteser som samverkar. Med hjälp av en sådan teori kan man förutsäga utfall inom en så snäv felmarginal att slumpen inte spelar någon roll.
  • Om och när en eller flera av de ingående hypoteserna i en teori falsifieras måste de förfinas eller ersättas. Lyckas inte det är hela teorin falsifierad.
  • Vare sig hypoteser eller teorier är slutgiltiga, nya rön kan utvidga eller helt ersätta gamla kunskaper.*

Detta är en kraftigt förenklad beskrivning av ”äkta” naturvetenskaplig forskning. Inom medicin och kostforskning är det långt vanligare att man istället söker stöd för sina hypoteser snarare än sortera ut de felande. Vid en första anblick kan skillnaden förefalla obetydlig, att söka stöd för det man vill visa eller stresstesta en hypotes till dess den eventuellt krackelerar kan väl kvitta?

Skillnaden är enorm! Förutom inom logik och matematik kan man inte bevisa att någonting entydigt är sant.** Att sortera ut osanningar, däremot, är betydligt enklare. Ju fler osanningar vi kan eliminera dess bättre.

  • Antag att hypotesen påstår att om A varierar så påverkas B efter ett förutbestämt mönster. Sker inte det fullt ut (inom försökets och mätningarnas felmarginaler) så är hypotesen osann (falsk) i sträng vetenskaplig anda.
  • Om vi däremot påstår att A orsakar B och mätningar visar en statistiskt säkerställd variation så kan man för den skull inte bortse från att det finns en mellanliggande parameter, C, som överför verkan.
  • Ett utfall anses statistiskt signifikant (säkerställt) om sannolikheten för att det beror på slump är tillräckligt låg. Tyvärr har det blivit vedertaget inom ”hälsosektorn” att acceptera att risken för slump är så hög som 1/20 (5%).
  • Ett självklart krav på vetenskapliga studier är att de ska kunna reproduceras (återupprepas) av andra och, inom felmarginaler, ge samma utfall.

As several scientists told Science last year when the initiative got off the ground, Elizabeth Iorns is tackling a significant problem in biomedical research: the fact that many published studies can’t be repeated, and that many researchers aren’t enthusiastic about simply replicating what someone else has already done. Källa: Science (annat nummer)

Min tolkning: Elisabeth Iorns tacklar ett allvarligt problem, många publicerade studier kan inte upprepas och många forskare är ovilliga att helt enkelt upprepa vad någon redan gjort.

Självklart drog projektet på sig kritik från de ursprungliga författarna samt andra som utgick från att de labb som kontrakterats saknade kompetens och därför skulle misslyckas att nå samma resultat som de ursprungliga.

Kan någon tänka sig andra skäl att inte vilja utsätta sina experiment för risken att vara undermåliga?


*) Ett välkänt exempel är när Einsteins teorier kunde komma tillrätta med Newtons tillkortakommanden vid höga hastigheter och i extremt kraftiga gravitationsfält. För vardagsbruk duger fortfarande Newton utmärkt, men ett lysande undantag är GPS-applikationer.

**) Inte ens matematik är ett perfekt exempel då det bygger på ett fåtal antaganden, axiom, som förefaller ytterst trovärdiga trots att bevis saknas för dem.

This study examined the associations of blood pressure measured in the clinic (clinic blood pressure) and 24-hour ambulatory blood pressure with all-cause and cardiovascular mortality in a large cohort of patients in primary care.

Källa: Relationship netween Clinic and Ambulatory Blood-Pressure Measurements and Mortality

Min tolkning: Studien skedde i primärvården och utforskade hur blodtryck som mäts i en vårdsituation respektive dygnsmätning kopplas till total dödlighet och hjärt- och kärlsjukdomar.

Vårt blodomlopp reagerar snabbt på både fysisk och psykisk påverkan. Många och långvariga kontakter med ”vården” har gjort mig positivt inställd och inte nervös, men säg det till mitt blodomlopp! Flertalet gånger jag får mitt blodtryck mätt på VC så sker det en stund in i mötet med min läkare, vanligen efter att vi avhandlat endera LCHF, ”kolesterol” eller båda.

Man analyserade data från 63910 vuxna i primärvård under 2004 – 2014 och följdes under 4,7 år (median). Blodtrycket mättes vid ”vanliga” besök men även med bärbar utrustning utspritt över 24 timmar. Avsikten var att urskilja personernas ”normala” blodtryck under ett helt dygn och eliminera effekterna av den stress som ofrånkomligen sker i en vårdsituation.

Av de 63910 studerade dog totalt 3808 personerna varav 1295 av hjärt- och kärlåkommor (CVD). Utan statiskt finlir innebär det att ungefär 1,27% dog varje år varav 0,43% specifikt av CVD.

När vi läser studier och rapporter av diverse slag imponeras vi både gärna och ofta av exaktheten i redovisade data, men hur välmotiverade är de? Antalet deltagare och döda oavsett orsak är inga problem att acceptera. Jag har rundat utfallen men av olika skäl. Den första (1,27%) till tre signifikanta siffror för att göra den lättare att överblicka, den andra (0,43%) till två siffror då jag misstänker att dödsorsaken inte alltid var rätt utredd. En annan uppgift jag reagerar på är medianuppföljningstiden, 4,7 år. Den påverkas naturligtvis av död men även om personen inte längre kan lokaliseras på grund av t.ex. flyttning.

  • Median är ett ”medelvärde”, men inte det som vi ”vanliga dödliga” avser (summera alla observationer och dela med antalet). Medianen är det ”mittersta” av alla observationer. Om fördelningen av observationer är helt symmetrisk kommer medianen och medelvärdet att överensstämma.
  • SCB: ”Medianen kan vara ett lämpligt mått om observa­tioner har en sned fördelning med många höga eller låga värden. I motsats till medel­värdet påverkas inte medianen av sådana extrem­värden.En variabel där median­värdet är att föredra är inkomsten i ett hushåll, som vanligen karakter­iseras av att många hushåll har låga eller medel­höga inkomster samt ett fåtal har höga eller mycket höga inkomster. Ett medel­värde kan i detta fall vara miss­visande.”

När statistiker beskriver fördelningen av mätdata använder man uttrycket standardavvikelse, i denna text betecknat med SD (Standard deviation).

  • SCB: Standardavvikelsen är den genomsnittliga avvikelsen från variabelns genomsnitt. Man bildar då differenserna för alla variabelvärde x1-M, x2-M, …, x10-M.I nästa steg kvadrerar man dessa avvikelser, summerar, dividerar med antal observationer och sist drar kvadratroten ur.
  • En standardavvikelse från medelvärdet i en normalfördelad datamängd (googla!) omfattar cirka 34,1% av alla utfall, 2 SD blir 48,7% och så vidare.

In a model that included both 24-hour and clinic measurements, 24-hour systolic pressure was more strongly associated with all-cause mortality (hazard ratio, 1.58 per 1-SD increase in pressure; 95% confidence interval [CI], 1.56 to 1.60, after adjustment for clinic blood pressure) than the clinic systolic pressure (hazard ratio, 1.02; 95% CI, 1.00 to 1.04, after adjustment for 24-hour blood pressure).

Min tolkning: Dygnsmätningen av blodtryck korrelerade bättre med död oavsett orsak än mätningar som gjorts vid besök på klinik.

Lägg märke till följande: ”hazard ratio, 1.58 per 1-SD increase in pressure”. Risken för död ökade med 58% för varje standardavvikelse (1 SD) som patientens blodtryck ökade över medianvärdet. Ingenstans i den korta texten i länken framgår hur stor blodtrycksökning 1 SD motsvarar! I texten finns ytterligare uppgifter om dag- och nattblodtryck samt korrelation till CVD-utfall.

För nördar: I en text från American College of Cardiology fann jag ytterligare information:

  • Mean clinic BP was 149/87 mm Hg, mean daytime 24-hour ABP was 132/80 mm Hg, and mean 24-hour ABP was 129/77 mm Hg.
  • 58% were male, and mean age was 57 years in those alive and 67 years in those who died during a median follow-up of 4.7 years.

Notera att blodtrycket vid dygnsregistrering (ABP) dagtid var 17/7 enheter lägre än de som mättes vid besök på klinik. Över hela dygnet var ABP 20/10 lägre!

Studien bekostades av ”Spanish Society of Hypertension and others”. Vilken inverkan det kan ha haft på metodik och tolkningar är okänt för mig. Mitt skäl att kommentera denna studie är inte främst dess slutsatser utan att tydliggöra att mätmetoder och situationer när det sker är oerhört betydelsefulla. Med stor sannolikhet gäller det alla sammanhang där mätobjektet är en människa.

Få om ens några sanningar utanför logik och renodlad matematik kan bevisas. Och de förutsätter ändå obevisade axiom i grunden.

När du ser påståenden om bevis när det gäller t.ex. kost och hälsa kan du utgå från att man i bästa fall menar att en studie visat något, givet vissa förutsättningar. Om detta skall ha mer värde än så måste det, givet samma förutsättningar, kunna visas i upprepade försök vilket inte alltid är fallet. Men det är fortfarande inte i närheten av att vara bevisat! En hypotes måste visa bärkraft även med varierande förutsättningar, naturligt inom de gränser där hypotesen antas gälla. Ett enda exempel som inte stöder hypotesen visar att den är felaktig, falsk.

  • Det enda vi kan bevisa är när hypoteser är falska.

Genom att steg för steg eliminera falska påståenden (hypoteser och teorier) avgränsar vi områden där sanningar kan finnas, däremot betyder det inte att sanningen finns där.

Alla studier med nämnvärd komplexitet förutsätter ett antal in- och utgående parametrar, mätvärden. I praktiken är alla behäftade med fel** av olika slag. I bästa fall tar de rent slumpmässigt ut varandra, men det är inget en seriös forskare eller kritiker kan förutsätta, däremot något lekmän och likvärdiga högaktningsfullt sk*ter i om det gynnar upplaga och egna förförståelser. Felmarginaler måste ingå i alla beräkningar och läggs till varandra i de statistiska beräkningarna.***

  • Epidemiologi är en metod som ofta förekommer. Man väljer ut ett stort antal personer som fyller ett antal kriterier, mäter ett antal utgångsvärden och frågar om t.ex. mat- och andra vanor****. Sedan väntar man rätt länge och ser hur livet far fram med dem. Förr eller senare insjuknar ett antal och några dör. Så anstränger man sig rejält för att koppla dessa händelser till den utgångshypotes man hade. Givet att man har tillgång till skickliga statistiker lyckas det för det mesta. Vanligen förstorar man utfallen med enkla medel; om en speciell händelse sker för 1% i en avgränsad del av den studerade gruppen och hos 1,2% i en annan delgrupp så antas det finnas en skillnad som är 20% bättre eller 17,7% sämre beroende på vilken man väljer som referensgrupp. Att skillnaden i absoluta tal är ynka 0,2% är inte tillräckligt säljande. Vanligen låter sig många imponeras av en lång studietid och ett stort antal deltagare. Vad man inte inser är att ”riktiga” samband och mätningar med små fel inte kräver många deltagare. Behov av lång tid, däremot, kan man inte göra så mycket åt.

Ordet bevis andas dags- och populärmedia i samarbete med måttligt kunniga journalister. Tyvärr gäller det även forskare och förmenta experter med begränsade kunskaper eller snabbare tunga/tangentbord än tanke. Den farligaste kombinationen uppstår när småkalibriga ”forskare” och ”experter” tillåts exponera sig i breda media utan att behöva redovisa sina källor.


*) En hypotes är en avgränsad tanke som kan testas. Två men vanligen långt fler hypoteser kan fogas samman till en teori. Inga hypoteser som bygger en teori får visas vara falska (osanna). Om det sker måste den enskilda hypotesen ersättas med en giltig och om det inte sker är teorin som helhet skakig eller rent ut sagt falsk.

**) Så snart mätvärden finns på en kontinuerlig skala, t.ex. temperatur, vikt eller matens diverse egenskaper, finns en ofrånkomlig felmarginal att ta hänsyn till.

***) Uppgift: Säg att du har tre ingående parametrar där felen är +-10%, hur stor maximal variation i utfall kan det bli?

****) Antag att en epidemiologisk studie pågår i 10 år och innefattar 3 tillfällen där man frågar om matvanorna under t.ex. den gångna veckan. Hur stor sannolikhet är att det man svarar är representativt för de övriga 517 veckorna?

The Guardian logo

Min hypotes är att ju mer ett forskningsområde bygger på inbillning snarare än bildning desto mer kan inflytelserika personer snedvrida dess utveckling. Särskilt farligt är det när resultaten kan påverka stora delar av hälsan hos Jordens befolkning. De kostråd vi får idag baseras på illa underbyggd ”vetenskap” där observationsstudier spelar en fullständigt orimlig roll, till stor del genom att okritiska massmedia blåser upp deras slutsatser till orimliga proportioner.

En observationsstudie inom kostområdet kan inledas genom att man frågar ett antal människor om vad man ätit under en viss period. Det kan röra sig om så lite som en enda dag! Så kompletterar man med en hälsoundersökning för att dels fastställa utgångsvärden och i förekommande fall sortera bort de som av olika skäl är orimliga att inkludera i studien. Så vidtar observationsperioden som, om inte annat så av statistiska skäl, pågår avsevärd tid. Man noterar om och när deltagarna råkar ut för hälsorelaterade händelser inklusive insjuknanden och död. De två senare kallas hårda ändpunkter.

Av statistiska skäl måste sådana studier innefatta mängder av deltagare samt pågå under många år för att utfallet skall ha ens den minsta statistiskt trovärdiga betydelse genom att man kan observera ett samband mellan ett eller flera utgångsdata och hälsoutfall. Det kan röra sig om i storleksordningen 10000 – 100000 deltagare under 10 – 40 år. Ett sådant samband behöver inte innebära orsak och verkan utan kan vara slumpartat eller bero på en eller flera bakomliggande parametrar. Observationsstudier kan ha ett berättigande genom att generera relevanta frågeställningar som resulterar i hypoteser att ta ställning till.

Observationsstudier brukar ibland kallas epidemiologiska, detta då den använda taktiken att iaktta ursprungligen utvecklades för att studera snabbt spridda sjukdomar, epidemier. Där är observationsstudier logiska och de enda rimliga då man etiska skäl vanligen inte aktivt vill smitta försöksdeltagare med sjukdomar. Dessutom utvecklas epidemier mycket snabbt och dess hårda ändpunkt är lätt att identifiera, endera är man smittad/sjuk/död eller inte.

Att överföra den metoden till koststudier är orimligt, dessutom använder man sig ofta av pseudoparametrar som ”blodfetter” och liknande. Deras roll är omdiskuterade och trots att de studerats från 30-talet (intensivt från 50-talet) har slutsatserna varit minst sagt motsägelsefulla och till stor del beroende på vem som bekostat en viss studie.

In a 2015 paper titled Does Science Advance One Funeral at a Time?, a team of scholars at the National Bureau of Economic Research sought an empirical basis for a remark made by the physicist Max Planck: “A new scientific truth does not triumph by convincing its opponents and making them see the light, but rather because its opponents eventually die, and a new generation grows up that is familiar with it.”

Min tolkning: Fysikern Max Planck hävdade att nya vetenskapliga upptäckter inte slår igenom genom att dess motståndare övertygas utan genom att dessa dör och lämnar rum för nya forskare att utvecklas. Med den hypotesen som grund publicerades 2015 studien ”Does Science Advance One Funeral at a Time?” (Utvecklas vetenskap en begravning i taget?)

The researchers identified more than 12,000 “elite” scientists from different fields. The criteria for elite status included funding, number of publications, and whether they were members of the National Academies of Science or the Institute of Medicine. Searching obituaries, the team found 452 who had died before retirement. They then looked to see what happened to the fields from which these celebrated scientists had unexpectedly departed, by analysing publishing patterns.

Min tolkning: Man identifierade mer än 12000 vetenskapsmän med rykte att tillhöra eliten inom sina områden och bland dessa fann man 452 som avlidit före sin pensionering. Så fortsatte man att analysera utvecklingen inom deras forskningsområden genom att studera publiceringsmönster.

What they found confirmed the truth of Planck’s maxim. Junior researchers who had worked closely with the elite scientists, authoring papers with them, published less. At the same time, there was a marked increase in papers by newcomers to the field, who were less likely to cite the work of the deceased eminence. The articles by these newcomers were substantive and influential, attracting a high number of citations. They moved the whole field along.

Min tolkning: Yngre forskare som nära samarbetat med elitforskarna blev mindre produktiva. I kontrast ökade bidragen från nya som inte var lika benägna att citera den avsuttne eminensens arbeten. Artiklarna av dessa nya forskare blev inflytelserika och resulterade i många citeringar. De förde hela sitt forskningsområde framåt.

Källa: Kort avsnitt av Artikel i The Guardian

Min slutsats av studien är att ett antal vetenskapsmäns positiva bestående bidrag till sina respektive forskningsfält var att de avgick med döden.

År 2014 avled 89 062 personer i Sverige, varav 45 622 kvinnor och 43 440 män. Detta är en minskning i absoluta tal med 1,6 procent jämfört med år 2013.

Nästan tre fjärdedelar, 71 procent, av samtliga dödsfall inträffade vid 75 års ålder eller däröver.

Totalt avled 940 per 100 000 kvinnor och 897 per 100 000 män. Jämfört med 2013 innebär detta en minskning med 3,3 procent för kvinnorna och med 1,7 procent för männen.

Sedan slutet av 1980-talet har dödligheten minskat för de flesta dödsorsaksgrupper, både för kvinnor och för män. Om hänsyn tas till ålder ligger dödstalen generellt lägre för kvinnor än för män.

Källa: Socialstyrelsen (pdf med omfattande statistik finns att ladda ner, 287 sidor)

Så snart LCHF-livsstilen återintroducerades i Sverige några år in på  2000-talet varnade dietister och läkare av den gamla stammen för en kommande hälsokatastrof. Detta för att ”vi” minskar andelen kolhydrater (”utesluter en hel näringsgrupp”) och ”frossar” i fett. Total dödlighet 1987 - 2014

Den totala dödligheten i Sverige har följt en nästan obruten trend neråt efter ett par bumpar i början av statistiken. Intressant nog sjunker dödligheten avsevärt snabbare hos ”problemkönet”, männen.

Allt hemskt skulle inträffa när ”kolesterolet” skulle stiga och blodkärlen gror igenDödlighet i kärlsjukdomar

Så snart vi lämnar totaldödligheten blir statistiken mer beroende av ändringar i diagnoskriterier som möjligen kan förklara varför dödligheten p.g.a. sjukdomar i hjärnans kärl (sista grafen) har en ”könssymmetrisk” uppbump runt 2008.

Det är svårt att upptäcka att LCHF-livsstilen har förorsakat någon hälsokatastrof. Alarmisterna hörs inte lika mycket längre och har dessutom blivit färre, åtminstone i media. Ska bli intressant att se hur traditionalisterna tolkar Socialstyrelsens nyaste statistik.