Dr. Stephen Evans, MD, en førende ekspert inden for klinisk forsøgsmetodologi og epidemiologi, forklarer centrale statistiske begreber på en patientvenlig måde. Han afklarer, hvad et underpoweret studie er, og hvorfor det ofte ikke formår at påvise reelle behandlingseffekter. Dr. Evans understreger vigtigheden af foruddefinerede primære endpoints for at undgå bias og gennemgår NNT-målet (Number Needed to Treat) med fokus på dets anvendelser og begrænsninger. Disse begreber er afgørende for at kunne fortolke medicinske nyheder og vurdere behandlingseffekt.
Forståelse af klinisk studieanalyse: Forklaring af styrke, endpoints og NNT
Spring til afsnit
- Underdimensionerede kliniske studier
- Primære vs. sekundære endpoints
- Texas Sharpshooter-fejlslutningen
- Number Needed to Treat (NNT)
- Tolkning af studieresultater
- Fuld transskription
Underdimensionerede kliniske studier
Et underdimensioneret klinisk studie har ikke nok deltagere til at kunne påvise en reel behandlingseffekt med sikkerhed. Dr. Stephen Evans, MD, forklarer, at studiestyrke handler om evnen til at opdage en faktisk forskel, hvis den findes. Han bruger COVID-19-behandlingsstudier som eksempel og påpeger, at dødelighedsstudier kræver store patientgrupper, fordi dødsrater ofte er lave.
For at opdage en reduktion i dødelighed fra fx 10 % til 7 % skal man have et stort antal patienter. Hvis et studie er for lille, bliver det underdimensioneret og risikerer at overse en klinisk signifikant fordel. Mange tidlige COVID-19-studier var netop underdimensionerede, når det kom til dødelighed. Dr. Stephen Evans, MD, understreger, at styrken altid afhænger af det specifikke outcome, der undersøges.
Primære vs. sekundære endpoints
Kliniske studier definerer primære og sekundære endpoints for at vurdere behandlingens effekt. Det primære endpoint er det hovedresultat, som studiet er designet til at måle. Dr. Stephen Evans, MD, påpeger, at dødelighed er et afgørende, men udfordrende, primært endpoint, fordi det kræver store patientgrupper.
Derfor vælger forskere ofte lettere at studere primære outcomes som fx tid til bedring eller viral load. Disse objektive mål kan kræve færre deltagere. Men Dr. Evans advarer om, at definitionerne skal være klare og fastlagt før studiestart. Ændringer af endpoints efter resultaterne kendes, introducerer bias og underminerer troværdigheden.
Texas Sharpshooter-fejlslutningen
Texas Sharpshooter-fejlslutningen er et centralt begreb i forbindelse med integriteten af kliniske studier. Dr. Stephen Evans, MD, beskriver det som at tegne et mål omkring skudhuller, efter at man har skudt. I forskningssammenhæng betyder det at ændre studiets primære outcome efter dataindsyn for at opnå et ønsket resultat.
Denne praksis skaber alvorlig bias og underminerer studiers validitet. Selvom der kan være legitime grunde til at ændre endpoints, skal det ske før resultaterne kendes. Dr. Evans understreger, at forhåndsdefinerede endpoints er afgørende for troværdig analyse. Det forhindrer, at forskere manipulerer med resultater for at opnå falske positive fund.
Number Needed to Treat (NNT)
Number Needed to Treat (NNT) er et nyttigt mål for patienters forståelse af en behandlings fordel. Dr. Stephen Evans, MD, definerer NNT som antallet af patienter, der skal behandles for at forhindre én uønsket begivenhed. Hvis et lægemiddel fx reducerer dødeligheden fra 10 % til 5 %, er NNT 20.
Det betyder, at 20 personer skal behandles for at forhindre én død. Men Dr. Stephen Evans, MD, påpeger vigtige begrænsninger: NNT er ikke et absolut tal; det afhænger af opfølgningsvarighed og outcomedefinition. Sammenligninger mellem behandlinger er kun gyldige, hvis NNT er beregnet ens. På trods af sin enkelhed kræver NNT omhyggelig tolkning.
Tolkning af studieresultater
Korrekt tolkning af kliniske studieresultater kræver forståelse af centrale statistiske begreber. Dr. Stephen Evans, MD, anbefaler at søge efter tilstrækkeligt store studier med foruddefinerede endpoints. Det sikrer, at resultaterne er pålidelige og ikke skyldes tilfældigheder eller bias.
Patienter bør overveje den kliniske relevans af outcomes. Et statistisk signifikant resultat kan være meningsløst, hvis NNT er meget høj. Dr. Anton Titov, MD, fremhæver vigtigheden af disse begreber for folkesundhedsforståelse. Forståelse af styrke, endpoints og NNT hjælper alle med at vurdere medicinske nyheder kritisk og træffe informerede beslutninger.
Fuld transskription
Dr. Anton Titov, MD: Professor Evans, der er flere grundlæggende begreber i kliniske studier. Hvad betyder det fx, at et studie er underdimensioneret? Klinisk studieterminologi er nu i centrum; den er i aviserne. Folk er nødt til at forstå disse basale begreber. Så hvad betyder det, hvis et studie er underdimensioneret? Hvad er NNT, number needed to treat? Der er fordele og ulemper og den slags grundkoncepter. Hvad er de primære og sekundære endpoints i kliniske studier? Klart, nogle studier har flyttet målstolperne, og det har været almindeligt kendt i det medicinske fællesskab.
Dr. Stephen Evans, MD: Vi vil forsøge at tage næsten alle vores eksempler fra den aktuelle COVID-19-situation. Hvis vi skal studere dødelighed, kræver det et ret stort antal mennesker. Heldigvis dør ikke alle, selv i en hospitalsituation. Hvis vi fx har 10 %, der dør, og vi vil finde en forskel, der sandsynligvis er signifikant—fx at reducere dødeligheden fra 10 % til 7 % inden for 30 dage efter behandlingsstart—så har vi brug for et stort antal patienter for at afgøre, om sådan en forskel rent faktisk forekommer.
Vi laver en statistisk analyse af det. Men hvis tallene er for små i studiet, er det, hvad vi kalder underdimensioneret. Studiestyrken til at opdage en reel forskel, hvis den findes, var for lav. Det var tilfældet for nogle af de tidlige studier af potentielle COVID-19-behandlinger.
Hvis vi derimod studerer tusindvis af patienter, er det usandsynligt, at studiet vil være underdimensioneret for dødelighed som outcome, forudsat at vi kigger på forskelle, der er rimelige. Hvis vi ville opdage en forskel mellem en dødelighedsrate på 10 % og 9,9 %, ville vi have brug for titusindvis af patienter. Det er selvfølgelig ikke en forskel, der ville være særlig nyttig for den enkelte patient.
Så underdimensionerede studier er et problem. Det er underdimensioneret i forhold til det outcome, man studerer. Hvis man gør dødelighed til sit primære outcome, har man brug for mange patienter. Ofte gør man i stedet dødelighed til et sekundært outcome og vælger et primært outcome, der er lettere at studere og kræver færre patienter.
I denne type situation er det ofte tiden til bedring fra sygdommen. Problemet er, at det kan være en smule subjektivt. Man kan definere, at nogen når et bedringsniveau baseret på en klinisk vurdering, men det kan også baseres på viral load eller lignende, hvilket er en objektiv vurdering.
Så vi kan muligvis have en objektiv vurdering for et primært outcome, der er lettere at studere end dødelighed. Problemet er, at når vi ser på bedring, har vi en definition for det. Men det kan være, at folk ikke opfylder disse definitioner. Det bliver tydeligt i studiet, at det outcome, man satte som primært, ikke vil give nogen brugbare data.
Der kan være legitime årsager til at ændre det. Men vanskeligheden er, at hvis folk ved, hvad resultaterne viser, kan de ændre spørgsmålet og derved få det svar, de ønsker. I epidemiologi kaldes dette Texas sharpshooter-syndromet, hvor den texanske skytte står ved siden af en lade og skyder mod den, og derefter går hen og tegner et mål.
Man har i et studie brug for at have et mål specificeret på forhånd, derefter udføre studiet og se, hvad resultaterne er, snarere end at ændre målet, mens studiet kører. Generelt kan der være legitime årsager til at ændre sit outcome. Men man skal være meget forsigtig og sikre sig, at man ikke gør det efter allerede at have skudt og set, hvor kuglerne lander.
Man skal gøre det, før man ved, hvor kuglerne lander.
Når vi kommer til at måle outcome, er en af de ting, vi kan gøre, at sige, hvad er dødelighedsraten? Lad os sige, at vi har en behandlingsforskel fra 10 % ned til 5 %. Det betyder, at for hver hundrede personer vil der være fem personer, der ikke dør som følge af behandlingen. For hver 20 personer vil der være én person, der ikke dør.
Når vi vender dette på hovedet, siger vi, at number needed to treat for at forhindre én død vil være 20, med vores forskel mellem 10 % og 5 %. Det ville også være tilfældet, hvis der var en forskel mellem 20 % og 15 % eller mellem 50 % og 45 %. Det er et mål for antallet af patienter, der skal behandles for at forhindre én død.
Nogle gange ser vi på en specifik begivenhed som myokardieinfarkt eller apopleksi i stedet for død. Problemet med dette tal er, at det ikke er et rent tal. Det afhænger af, hvor længe man har fulgt patienter op. Det har også nogle andre statistiske problemer.
Så det er ikke et, jeg er specielt glad for, selvom det lyder som en ret nice ting at sige: "Nå, dette lægemiddel kræver, at 20 patienter behandles for at opnå fordelene, hvorimod dette lægemiddel kræver 50." Hvis man har brugt de samme regler for begge, kan NNT være ret hjælpsomt. Men man skal være forsigtig med at sikre, at ens definition af NNT, som ikke er et rent tal, bruges nøjagtigt ens, når man sammenligner behandlinger.