Fra data til evidens noter 09/11 2021

Undervisningen vil være delt op i 2 slags lektioner. Forlæsninger og hands-on (kodning).

Man må bruge R til kodning. Det er mest regression der anvendes. Eksempler og gennemgang vil være i sdata.

Vi skal lære at bruge de rigtige designs til de rigtige problemstillinger.

Det er nok i en rapport at definere en problemstilling og hvordan man vil håndtere den.

Det anbefales at man laver sig planer om sit speciale i løbet af faget.

Der vil kun blive anvendt godkendt data.

Health Data Science

I sundhedsvæsnet er der en tendens til at være dataskritiske, og der er ofte villighed til at bruge mange penge på at vurdere kvaliteten af data. Guldstandarden er tilfældige studer (med systematisk gennemgang af mange studier). Andre gange er det omvendt. Det afhænger af om det er kausalt eller ej. Er det kausalt, så skal vi checek for det, men hvis ikke, så sakl vi lade være. Mediatroer skal ikke kontroleres. Confounding factors skal.

Man må ikke betinge på en variabel som både colider og confounder er causal på.

Health data science opgaver er opdelt i 3 decipliner.

  • Data bskrivelse.
  • Prediktion.
  • Kasual analyse.

Oberservationstudier

Kausal analyse deles oftest op i:

  • Social science
  • Data science
  • Health science

Simpsons paradox behandling på total population og features kan give forskellige indtryk (f.eks. fra overrepræsentation af en bestemt kategori). Det viser at vi kan finde faktorere der påvirker data og resultater.

Misforståelser ved RCT

I mange år har det været forståelsen at kun randomiserede studier kan være valide. Det er korrekt i nogle sunhedsvæsner på en lovmæssig plan. Et fokus i faget vil være at efterligne strukturen uden at gøre det tilfældigt.

Al muligheder i kasual forståelse

Kontrolgruppen og behandlingsgruppen bør være sammenlignlige.