Structurile studiilor clinice | Online Stream

2.5 Studii de noninferioritate

Raționamentul studiilor de noninferioritate este că, pentru a evalua în mod corespunzător o intervenție, este necesară o comparație cu un grup de control pentru a pune în context rezultatele unui braț de intervenție. Cu toate acestea, pentru indicația medicală vizată, randomizarea la un placebo nu este etică din cauza disponibilității unei terapii cu eficacitate dovedită. În studiile de noninferioritate, o terapie eficientă existentă este selectată pentru a fi grupul de control „activ”. Din acest motiv, studiile de noninferioritate se mai numesc și „studii controlate active”.

Obiectivul unui studiu de noninferioritate este diferit de cel al unui studiu controlat cu placebo. Nu mai este necesar să se demonstreze că intervenția este superioară controlului, ca în cazul studiilor controlate cu placebo, ci este de dorit să se demonstreze că intervenția este „cel puțin la fel de bună ca” sau „nu mai rea decât” (adică noninferioară) controlul activ. Să sperăm că intervenția este mai bună decât martorul activ din alte puncte de vedere (de exemplu, este mai puțin costisitoare, are un profil de siguranță mai bun, o calitate a vieții mai bună, un profil de rezistență diferit sau este mai comodă sau mai puțin invazivă de administrat, cum ar fi faptul că necesită mai puține pastile sau o durată mai scurtă a tratamentului, ceea ce duce la o mai bună aderență). De exemplu, în tratamentul HIV, cercetătorii caută regimuri antiretrovirale mai puțin complicate sau mai puțin toxice care pot prezenta o eficacitate similară cu regimurile existente.

Nonferioritatea nu poate fi demonstrată cu un test de superioritate nesemnificativ. Strategia tradițională a unui studiu de noninferioritate este de a selecta o marjă de noninferioritate (M) și dacă se poate demonstra că diferențele de tratament se încadrează în marja de noninferioritate (adică <M), atunci se poate afirma noninferioritatea. Ipotezele nulă și alternativă sunt H0: βT,control activ ≥M și HA: βT,control activ <M, unde βT,control activ este efectul terapiei de intervenție (T) în raport cu controlul activ. Analiza standard este de a construi un interval de încredere pentru diferența dintre brațe și de a observa dacă întregul interval de încredere se află în limitele marjei de noninferioritate. De exemplu, în cazul în care criteriul principal de evaluare este binar (de exemplu, răspuns vs. niciun răspuns), se poate construi un interval de încredere pentru diferența dintre ratele de răspuns (intervenție minus controlul activ). În cazul în care limita inferioară a intervalului de încredere este mai mare decât -M, atunci diferențele importante pot fi excluse cu o încredere rezonabilă și se poate afirma noninferioritatea. În figura 2, intervalele de încredere A-F reprezintă potențialele scenarii de rezultate ale studiului de noninferioritate. Intervalele au centre și lățimi diferite. Dacă studiul este conceput pentru a evalua superioritatea, atunci eșecul de a respinge ipoteza nulă rezultă din scenariile A și D (deoarece intervalul de încredere nu exclude zero). Inferioritatea este concluzionată din scenariile B, C și E, în timp ce superioritatea este concluzionată din scenariul F. Dacă studiul este conceput ca un studiu de noninferioritate, atunci eșecul respingerii ipotezei nule de inferioritate rezultă din scenariile A, B și C, dar noninferioritatea este susținută în scenariile D, E și F, deoarece limita inferioară a intervalului este >-M. O anumită confuzie rezultă adesea din scenariul E, în care se concluzionează inferioritatea în urma unui studiu de superioritate, dar se concluzionează noninferioritatea în urma unui studiu de noninferioritate. Acest caz evidențiază distincția dintre semnificația statistică (adică intervalul de încredere exclude 0) și relevanța clinică (adică diferențele sunt mai mici decât M). Scenariul A este un caz în care nu se poate afirma nici superioritatea, nici inferioritatea, nici noninferioritatea, deoarece intervalul de încredere este prea larg. Acest lucru se poate datora unei dimensiuni mici a eșantionului sau unei variații mari.

Un fișier extern care conține o imagine, o ilustrație etc. Numele obiectului este nihms275040f2.jpg

Design de nonferioritate. P1 este eficacitatea noii terapii. P2 este eficacitatea grupului de control. -M este marja de noninferioritate.

Studiile clinice de noninferioritate au devenit foarte frecvente în cercetarea clinică. Studiile de noninferioritate pot fi „pozitive”, rezultând în afirmații de noninferioritate, sau „negative”, rezultând în imposibilitatea de a face o afirmație de noninferioritate. Studiul PROFESS a fost un studiu de noninferioritate negativ, cu un criteriu de evaluare a timpului până la eveniment. Studiul a concluzionat că aspirina plus dipiridamolul cu eliberare prelungită nu a fost noninferior față de clopidogrel pentru prevenirea accidentului vascular cerebral. Criteriul principal de evaluare a fost accidentul vascular cerebral recurent, iar marja de noninferioritate a fost stabilită la o diferență de 7,5% în ceea ce privește riscul relativ. IC 95% pentru raportul de risc a fost (0,92, 1,11). Deoarece limita superioară a IC a fost mai mare de 1,075, nu s-a putut concluziona noninferioritatea. În schimb, într-un studiu clinic de evaluare a tratamentelor pentru epilepsia nou diagnosticată, Keppra s-a dovedit a fi noninferior față de Carbatrol. Criteriul principal de evaluare a fost absența crizelor la 6 luni, iar marja de noninferioritate a fost stabilită la o diferență de 15 %.

IC de 95 % pentru diferența de risc a fost (-7,8 %, 8,2 %) și, prin urmare, s-a concluzionat noninferioritatea. (Brodie et al 2007)

Două ipoteze importante asociate cu proiectarea studiilor de noninferioritate sunt constanța și sensibilitatea testului.

În studiile de noninferioritate, un control activ este selectat deoarece s-a demonstrat că este eficient (de exemplu, superior la placebo) într-un studiu istoric. Ipoteza de constanță afirmă că efectul controlului activ față de placebo în studiul istoric ar fi același cu cel din studiul actual dacă ar fi inclus un grup placebo. Acest lucru ar putea să nu fie valabil în cazul în care ar exista diferențe în desfășurarea studiului (de exemplu, diferențe în administrarea tratamentului, punctele finale sau populația) între studiul istoric și studiul actual. Această ipoteză nu poate fi testată în studiul actual fără un grup placebo. Dezvoltarea rezistenței este o amenințare la adresa ipotezei constanței.

Pentru a permite o evaluare a menținerii unei părți a efectului controlului activ față de placebo, participanții la studiu, punctele finale și alte caracteristici importante ale proiectului ar trebui să fie similare cu cele utilizate în studiile pentru demonstrarea eficacității controlului activ față de placebo. Se poate apoi evalua indirect ipoteza constanței prin compararea eficacității controlului activ în cadrul studiului de noninferioritate și al studiului istoric.

Studiile de noninferioritate sunt adecvate atunci când există dovezi adecvate ale unei mărimi definite a efectului pentru controlul activ, astfel încât să se poată justifica o marjă de noninferioritate. Ar trebui să se realizeze o sinteză cuprinzătoare a dovezilor care susțin mărimea efectului controlului activ și marja de noninferioritate. Din aceste motive, datele multe nu susțin un proiect de noninferioritate pentru unele indicații.

„Sensibilitatea testării” este o altă ipoteză importantă în proiectarea studiilor de noninferioritate. Ipoteza sensibilității analizei afirmă că studiul este conceput în așa fel încât să fie capabil să detecteze diferențele dintre terapii, dacă acestea există într-adevăr. În cazul în care instrumentul care măsoară răspunsul la tratament nu este suficient de sensibil pentru a detecta diferențele, atunci terapiile vor prezenta răspunsuri similare din cauza insensibilității instrumentului, ceea ce poate duce la concluzia eronată a noninferiorității. Punctele finale care sunt selectate, modul în care acestea sunt măsurate, precum și desfășurarea și integritatea studiului pot afecta sensibilitatea testului.

Controlul activ într-un studiu de noninferioritate trebuie selectat cu atenție. Aprobarea de reglementare nu implică în mod necesar faptul că o terapie poate fi utilizată ca și control activ. Controlul activ va avea, în mod ideal, o eficacitate clinică care este: (1) de amploare substanțială, (2) estimată cu precizie în cadrul relevant în care se desfășoară studiul de noninferioritate și (3) de preferință cuantificată în mai multe studii. Deoarece mărimea efectului controlului activ în raport cu placebo este utilizată pentru a ghida selectarea marjei de noninferioritate, superioritatea față de placebo trebuie să fie stabilită și măsurată în mod fiabil. Este necesară asigurarea că marja de control activ ar fi superioară la placebo dacă în cadrul studiului ar fi utilizat un placebo.

În ultima vreme a existat o preocupare cu privire la elaborarea de studii de noninferioritate care utilizează martori activi care încalcă ipoteza constanței (adică eficacitatea martorului activ s-a modificat în timp) sau care nu au o eficacitate dovedită față de placebo. Echipele de cercetare susțin adesea că studiile controlate cu placebo nu sunt fezabile deoarece: (1) placebo nu este etic din cauza existenței altor intervenții, (2) pacienții nu sunt dispuși să se înscrie în studii controlate cu placebo și (3) consiliile de evaluare instituțională pun la îndoială etica utilizării placebo în aceste situații.

Când se selectează controlul activ pentru un studiu de noninferioritate, trebuie să se ia în considerare modul în care a fost stabilită eficacitatea controlului activ (de exemplu, prin demonstrarea noninferiorității față de un alt control activ vs. prin demonstrarea superiorității față de placebo). În cazul în care controlul activ s-a dovedit a fi eficient prin intermediul unui studiu de noninferioritate, atunci trebuie să se ia în considerare preocuparea pentru biocreep. Biocreep este tendința ca o terapie ușor inferioară (dar în marja de noninferioritate), care s-a dovedit a fi eficientă printr-un studiu de noninferioritate, să devină controlul activ în următoarea generație de studii de noninferioritate. Mai multe generații de studii de noninferioritate care utilizează controale active care la rândul lor s-au dovedit a fi eficace prin intermediul unor studii de noninferioritate, ar putea duce în cele din urmă la demonstrarea noninferiorității unei terapii care nu este mai bună decât placebo. Din punct de vedere logic, noninferioritatea nu este tranzitivă: dacă A este noninferior față de B, iar B este noninferior față de C, atunci nu rezultă neapărat că A este noninferior față de C. Din aceste motive, studiile de noninferioritate ar trebui, în general, să aleagă cele mai bune controale active disponibile.

Selecția marjei de noninferioritate în studiile de noninferioritate este o problemă complexă și care a creat multe discuții. În general, selectarea marjei de noninferioritate se face în etapa de proiectare a studiului și este utilizată pentru a ajuta la determinarea dimensiunii eșantionului. Definirea marjei de noninferioritate în studiile de noninferioritate este dependentă de context și joacă un rol direct în interpretarea rezultatelor studiului. Selectarea marjei de noninferioritate este subiectivă, dar structurată, necesitând o combinație de raționament statistic și judecată clinică. Din punct de vedere conceptual, se poate considera marja de noninferioritate ca fiind „diferența maximă de tratament care este irelevantă din punct de vedere clinic” sau „cea mai mare diferență de eficacitate pe care este acceptabil să o sacrificăm pentru a obține avantajele intervenției”. Acest concept necesită adesea interacțiuni între statisticieni și clinicieni.

Din moment ce unul dintre obiectivele indirecte ale unui studiu de noninferioritate este acela de a demonstra că intervenția este superioară la placebo, o parte din efectul controlului activ față de placebo trebuie să fie păstrat (adesea denumit „păstrarea unei fracțiuni din efect”). Astfel, marja de noninferioritate ar trebui să fie selectată astfel încât să fie mai mică decât mărimea efectului controlului activ față de placebo. Cercetătorii ar trebui să revizuiască datele istorice care au demonstrat superioritatea controlului activ față de placebo pentru a ajuta la definirea marjei de noninferioritate. Cercetătorii trebuie să ia în considerare, de asemenea, variabilitatea estimărilor în cadrul și între încercări. În mod ideal, marja de noninferioritate ar trebui să fie aleasă independent de puterea studiului, dar pot apărea limitări practice, deoarece selectarea marjei de noninferioritate afectează dramatic puterea studiului.

O strategie pentru a păstra estimarea efectului este de a stabili marja de noninferioritate la un anumit procent (de exemplu, 50%) din efectul estimat al controlului activ față de placebo. Alternativ, se poate utiliza „metoda intervalului de încredere de 95%-95%”. În această strategie, marja de noninferioritate este stabilită la limita inferioară a intervalului de încredere de 95% pentru efectul controlului activ față de placebo. O alegere necorespunzătoare a marjei de noninferioritate poate duce la eșecul unui studiu de noninferioritate. În cadrul studiului SPORTIF V, ximelegatran a fost comparat cu war-farină (control activ) pentru prevenirea accidentului vascular cerebral la pacienții cu fibrilație atrială. Rata evenimentelor pentru warfarină a fost de 1,2%, iar marja de noninferioritate a fost stabilită la 2% (diferența absolută a ratelor evenimentelor) pe baza datelor istorice. Deoarece rata evenimentelor în brațul cu warfarină a fost scăzută, s-a putut concluziona asupra noninferiorității, chiar dacă studiul nu a putut exclude o dublare a ratei evenimentelor. Din aceste motive, selectarea marjei de noninferioritate ar trebui să încorporeze considerente statistice, precum și considerente de relevanță clinică.

O întrebare firească este dacă o marjă de noninferioritate poate fi modificată după inițierea studiului. În general, există puține preocupări cu privire la o scădere a marjei de noninferioritate. Cu toate acestea, creșterea marjei de noninferioritate poate fi percepută ca o manipulare, cu excepția cazului în care este justificată în mod corespunzător (de exemplu, pe baza unor date externe care sunt independente de studiu).

Dimensiunea eșantionului depinde de selectarea marjei de noninferioritate și de alți parametri. Dimensiunile eșantioanelor necesare cresc odată cu scăderea marjei de noninferioritate. Stratificarea poate ajuta, deoarece intervalele de încredere ajustate sunt în general mai înguste decât intervalele de încredere neajustate. Cercetătorii ar trebui să dea putere studiilor de noninferioritate pentru o analiză per protocol, precum și pentru o analiză de intenție de tratament (ITT), având în vedere importanța ambelor analize (descrisă ulterior). Cercetătorii trebuie, de asemenea, să cântărească costurile erorii de tip I (de exemplu, afirmarea incorectă a noninferiorității) și ale erorii de tip II (de exemplu, neafirmarea incorectă a noninferiorității). O abordare a dimensionării unui studiu de noninferioritate este aceea de a privi studiul din perspectiva estimării. Strategia este de a estima diferența dintre tratamente cu o precizie adecvată (măsurată prin lățimea unui interval de încredere). Apoi, dimensionați studiul pentru a vă asigura că lățimea intervalului de încredere pentru diferența dintre tratamente este acceptabilă.

Analizele intermediare ale studiilor de noninferioritate pot fi complicate. În general, este nevoie de dovezi copleșitoare pentru a sugera oprirea unui studiu de noninferioritate în timpul analizelor intermediare. De asemenea, este posibil să nu existe un imperativ etic pentru a opri un studiu care a demonstrat noninferioritatea (spre deosebire de studiile de superioritate cu care, dacă este demonstrată superioritatea, atunci pot exista imperative etice pentru a opri studiul, deoarece randomizarea la un braț inferior poate fi privită ca neetică). În plus, chiar dacă se demonstrează noninferioritatea la un moment intermediar, poate fi de dorit să se continue studiul pentru a evalua dacă superioritatea ar putea fi demonstrată prin continuarea studiului. Nu este neobișnuit să se întrerupă un studiu de noninferioritate din motive de inutilitate (de exemplu, imposibilitatea de a demonstra noninferioritatea). Utilizarea unor intervale de încredere repetate pentru a controla ratele de eroare cu diagrame de intervale previzionate (Evans et al. 2007a; Li et al 2009) poate ajuta comitetele de monitorizare a datelor în luarea deciziilor intermediare.

Abordările tradiționale de proiectare și analiză a studiilor de noninferioritate au fost recent criticate prin observarea unei eșecuri în a distinge între cele două subobiective distincte ale studiilor de noninferioritate: (1) demonstrarea faptului că intervenția nu este inferioară controlului activ și (2) demonstrarea faptului că intervenția este superioară la placebo, ținând cont de dovezile istorice. Proiectarea unui studiu de noninferioritate poate fi realizată prin planificarea testării a două ipoteze distincte. Un anumit studiu poate îndeplini doar unul dintre cele două subobiective. În cazul în care intervenția se dovedește a fi superioară la placebo, dar nu reușește să demonstreze noninferioritatea față de controlul activ, atunci utilizarea intervenției poate fi indicată pentru pacienții la care controlul activ este contraindicat sau nu este disponibil. În schimb, intervenția ar putea fi demonstrată ca fiind noninferioară față de controlul activ, dar nu superioară la placebo. Acest lucru se poate întâmpla atunci când eficacitatea controlului activ este modestă. Recent, au existat afirmații potrivit cărora cel de-al doilea dintre cele două subobiective (adică demonstrarea superiorității față de placebo) este obiectivul de interes în cadrul de reglementare. Grupurile din industrie au susținut că aprobarea reglementară a noilor terapii ar trebui să se bazeze pe dovezi de superioritate față de placebo (demonstrarea unui beneficiu semnificativ din punct de vedere clinic) și nu neapărat de non-inferioritate față de un control activ. Susținătorii acestei perspective (adesea denumită „metoda sintezei”) pun în sprijinul acestei poziții mai multe dileme și neconcordanțe cu abordările tradiționale ale studiilor de noninferioritate. În primul rând, intervenția ar putea să arate mai bine decât controlul activ, dar să nu îndeplinească condiția de păstrare a efectului. În al doilea rând, două studii cu controale active diferite au standarde de succes diferite. În al treilea rând, în cazul în care intervenția se dovedește a fi superioară unui control activ, atunci o întrebare firească care se pune este dacă controlul activ ar trebui să fie retras de pe piață? Argumentul de bază este că gradul necesar de eficacitate ar trebui să fie independent de proiect (superioritate vs. noninferioritate) și că superioritatea față de placebo este standardul pentru aprobarea de reglementare. Astfel, susținătorii metodei de sinteză susțin că terminologia „studiu de noninferioritate” este nepotrivită, deoarece superioritatea intervenției față de placebo este adevăratul obiectiv.

Un design alternativ atractiv din punct de vedere științific este acela de a avea un studiu cu 3 brațe care să cuprindă intervenția, controlul activ și un braț placebo. Acest design este deosebit de atractiv atunci când eficacitatea controlului activ s-a schimbat, este volatilă sau este pusă la îndoială. Acest model permite evaluarea directă a noninferiorității și a superiorității față de placebo și permite validarea în cadrul studiului a marjei de noninferioritate. Din nefericire, acest design nu este implementat frecvent din cauza unei preocupări legate de natura neetică a brațului placebo în unele medii.

Elegerea marjei de noninferioritate joacă un rol direct în interpretarea studiului de noninferioritate, spre deosebire de diferența minimă relevantă din punct de vedere clinic care este adesea definită în studiile de superioritate. Astfel, justificarea marjei de noninferioritate ar trebui să fie prezentată în analize. Analiza studiilor de noninferioritate utilizează, de asemenea, informații din afara studiului actual pentru a deduce efectul intervenției față de placebo în absența unei comparații directe. Astfel, se recomandă ca o comparație a ratei de răspuns, aderenței etc. a controlului activ în cadrul studiului de noninferioritate să fie comparată cu studiile istorice care au comparat controlul activ cu placebo și au furnizat dovezi ale eficacității controlului activ. În cazul în care controlul activ prezintă o eficacitate diferită față de cea din studiile anterioare, atunci validitatea marjei de noninferioritate predefinite poate fi suspectă, iar interpretarea rezultatelor va fi dificilă.

Abordarea generală a analizei este de a calcula un interval de încredere cu două fețe (o valoare p nu este în general adecvată). O întrebare frecventă este dacă un interval de încredere unilateral de 0,05 este acceptabil, având în vedere natura unilaterală a noninferiorității; cu toate acestea, intervalele de încredere bilaterale sunt, în general, adecvate pentru consecvența între testul de semnificație și estimarea ulterioară. Rețineți că un interval de încredere unilateral de 95% ar scădea nivelul dovezilor pentru formularea de concluzii în comparație cu practica acceptată în studiile de superioritate.

În studiile de superioritate, o analiză bazată pe intenția de a trata (ITT) tinde să fie conservatoare (adică există o tendință de subestimare a diferențelor reale de tratament). Ca urmare, analizele ITT sunt în general considerate analize primare în studiile de superioritate, deoarece acest lucru ajută la protejarea ratei de eroare de tip I. Având în vedere că scopul studiilor de noninferioritate este de a demonstra noninferioritatea sau similitudinea, o subestimare a diferenței reale de tratament poate influența în favoarea noninferiorității, umflând astfel rata de eroare „fals pozitivă” (și anume, afirmarea incorectă a noninferiorității). Astfel, ITT nu este neapărat conservator în studiile de noninferioritate. Din aceste motive, o analiză ITT și o analiză per protocol (adică o analiză bazată pe participanții la studiu care au respectat protocolul) sunt adesea considerate analize co-primare în studiile de noninferioritate. Este important să se efectueze ambele analize (și, eventual, analize de sensibilitate suplimentare) pentru a evalua soliditatea rezultatului studiului. Analizele per protocol determină adesea o dimensiune a efectului mai mare, deoarece ITT diluează adesea estimarea efectului, dar determină frecvent intervale de încredere mai largi, deoarece se bazează pe un număr mai mic de participanți la studiu decât ITT.

Dacă se efectuează un studiu de noninferioritate și se demonstrează noninferioritatea intervenției față de un control activ, atunci o întrebare firească este dacă se poate face o afirmație mai puternică de superioritate. Cu alte cuvinte, care sunt ramificațiile trecerii de la un studiu de noninferioritate la un studiu de superioritate? În schimb, dacă se efectuează un studiu de superioritate și nu se observă diferențe semnificative între grupuri, atunci o întrebare firească este dacă se poate concluziona o afirmație mai slabă de noninferioritate. Se poate trece de la un studiu de superioritate la un studiu de noninferioritate?

În general, se consideră acceptabilă efectuarea unei evaluări a superiorității după ce s-a demonstrat noninferioritatea. Datorită principiului de testare închisă, nu este necesară ajustarea multiplicității. Analizele de intenție de tratament și cele per protocol sunt ambele importante pentru analizele de noninferioritate, dar analizele de intenție de tratament sunt cele mai importante analize pentru evaluarea superiorității. Este mai dificil să se justifice o afirmație de noninferioritate după ce nu s-a reușit să se demonstreze superioritatea. Există mai multe aspecte care trebuie luate în considerare. În primul rând, dacă a fost pre-specificată o marjă de noninferioritate este un aspect important. Definirea marjei de noninferioritate post-hoc poate fi dificil de justificat și poate fi percepută ca o manipulare. Alegerea marjei de noninferioritate trebuie să fie independentă de datele studiului (adică să se bazeze pe informații externe), ceea ce este dificil de demonstrat după ce datele au fost colectate și desecretizate. În al doilea rând, este grupul de control un grup de control adecvat pentru un studiu de noninferioritate (de exemplu, a demonstrat și a măsurat cu precizie superioritatea față de placebo)? În al treilea rând, eficacitatea grupului de control a fost similară cu cea afișată în studiile istorice față de placebo (ipoteza constanței)? În al patrulea rând, analizele de intenție de tratament și pe protocol devin la fel de importante. În al cincilea rând, calitatea studiului trebuie să fie ridicată (aderență acceptabilă și puține abandonuri). În al șaselea rând, sensibilitatea analizei trebuie să fie acceptabilă.

Raportarea studiilor de noninferioritate a fost suboptimală în literatura medicală. Greene și coautorii din Annals of Internal Medicine au analizat 88 de studii care susțineau noninferioritatea, dar au observat că 67% dintre aceste studii au susținut noninferioritatea pe baza unor teste de superioritate nesemnificative. (Greene et al. 2000) În plus, doar 23% dintre studii au pre-specificat o marjă de non-inferioritate. Piaggio și coautorii au publicat o extindere a declarației CONSORT pentru a sublinia raportarea adecvată a studiilor de noninferioritate în Journal of the American Medical Association. (Piaggio et al. 2006) Un document orientativ al FDA privind studiile de noninferioritate este în prezent în curs de elaborare.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.