Indiskutabelt er der. For at risikere yderligere tortur af papirets skilsmissemetafor vil jeg foreslå, at PRCT bør rette sig, søge mægling og bede om yderligere støtte. Alle de ordninger, der er iværksat for at forbedre udnyttelsen af forskning, er utvivlsomt sociale interventioner, og i forbindelse med evalueringen af sådanne programmer er der ikke noget vedtaget “evidenshierarki”, men snarere en “bricolage af tilgange”. Implementeringsvidenskaben har, måske mere end noget andet sundhedsområde, stræbt efter og diskuteret den optimale tilgang til sådanne blandede metoder eller hybride designs. Jeg undgår ethvert forsøg på at vinde paradigmekrigene her. Del 2 tager fat på en mere enkel opgave, nemlig at foreslå at udnytte den mulighed, som PRCT’erne giver, på en anden, mere inkluderende måde. Den begynder med at skitsere en forskningsstrategi til at lære de generaliserbare erfaringer fra implementeringsvidenskaben (tabel 1) og slutter med et kort eksempel, der eksemplificerer tilgangen.
Sådan formuleret kan en sådan dagsorden virke forfærdelig abstrakt. Hertil svarer jeg på to måder. For det første har dette syn på akkumulering af viden en betydelig filosofisk baggrund . For det andet finder modellen praktisk anvendelse, hvis man undersøger den samlede forskning om en intervention snarere end de enkelte bidrag.
Den forskningsproces, der foreslås i tabel 1, svarer nøje til Poppers teori om den videnskabelige videns vækst, som i høj grad hviler på tanken om progressiv “fejleliminering” (fig. 2). Anvendt på gennemførelsesvidenskab udfolder strategien sig på følgende måde. Forskningen begynder med den indledende identifikation af et problem (P1), i dette tilfælde om manglende videnoverførsel. Der fremlægges en foreløbig programteori (TT1), som kan være en løsning, og som er indeholdt i en bestemt ordning, der skal forbedre overførslen af forskning til praksis. Ordningen er blevet undersøgt, og den har altid været en blandet succes. Denne konklusion betragtes som foreløbig og kan revideres i lyset af senere resultater. Yderligere fremskridt afhænger af, at man undersøger både programmets succeser og fiaskoer med særlig vægt på at eliminere fejlene (EE1). Denne undersøgelse fører til en mere nuanceret forståelse af problemet (P2), en mere raffineret løsning (TT2) og mere forskning, både positiv og negativ. Eliminering af yderligere fejl (EE2) er drivkraften til at udvikle viden. Processen gentager sig derefter i det uendelige.
Er der en proces af konjekturer og tilbagevisninger inden for implementeringsvidenskaben? Som nævnt er mange forfattere tilbøjelige til at formidle en unødig følelse af sikkerhed, endelighed og universalitet i deres forskningsresultater. Men hvis man samtidig undersøger fremskridtene på tværs af forskningen, kan der fortælles en mere forsigtig og sandfærdig historie. Vi vender os til litteraturen for at få et eksempel på tabel 1.
Strap et
Urgester, at PRCT’er udvider deres område og bliver casestudier, der omfatter flere metoder. Rådet om, at RCT’er bør inddrage et kvalitativt element, er helt almindeligt, selv om der er forskellige opfattelser af, om forbindelsen er bedst tjent gennem åbne interviews, procesevaluering, analyse af intervenerende variabler, teoribaseret evaluering, realistisk evaluering osv. I overensstemmelse med alle disse, om end sjældent udtrykt på denne måde, er forslaget om, at sådanne undersøgelser også bør betragtes som casestudier, der undersøger en af mange måder, hvorpå sådanne interventioner kan være konfigureret.
Vi behøver ikke at lede for langt efter et eksempel her, for PEMs undersøgelsen blev faktisk ledsaget af en “teoribaseret procesevaluering” . Sidstnævnte undersøgelse anvendte en blanding af standardiserede spørgeskemaer og åbne interviews for at undersøge lægernes holdninger til og erfaringer med interventionen, og på den måde begynder den at forklare PRCT’ens nulresultat. Kort sagt afslører den kvalitative undersøgelse positive holdninger til retinopatiscreening, et indgående kendskab til dens tilgængelighed og en stærk hensigt om at gennemføre henvisningerne, som eksisterer før og efter interventionen. Alligevel ved vi fra PRCT’en, at henvisningsgraden forbliver statisk (og skuffende). Den forklaring, der fremgår af de åbne interviews, er, at en række “post-intentionelle” faktorer sløver den erklærede vilje til at henvise. Disse faktorer præsenteres ved hjælp af illustrative citater fra modtagerne, som omhandler en række forskellige praktiske problemer – lægernes præference for deres egen vurdering, forskellige synspunkter om screeningens effektivitet, tidsbegrænsninger og pres, den administrative byrde ved henvisning, nogle patienters manglende interesse i screening, manglende dækning af screening under nogle forsikringsplaner, lange ventetider og utilgængeligheden af nogle screeningstilbud.
Vi har første øjekast til en god cirkel af forklaringer. Den stringente PRCT sikrer resultatet, men kan ikke sige, hvorfor interventionen er ineffektiv. Den kvalitative undersøgelse undersøger en række underliggende processer, der viser, hvordan lægernes erfaringer, patienternes præferencer og administrative begrænsninger kan have været kombineret for at skabe det uventede resultat. Dette udgør en meget plausibel redegørelse for programmets fiasko, men den kan endnu ikke generaliseres. Der er to hindringer.
For det første vedrører alle ovennævnte data (kvantitative og kvalitative) de særlige forhold i forbindelse med forvaltningen af sundhedsvæsenet og præferencerne hos forskellige interessegrupper på det pågældende sted og på det pågældende tidspunkt. Det er fortsat et unikt casestudie. Den anden og mere interessante mangel stammer fra en sædvanlig begrænsning af sådanne kvalitative analyser, nemlig at “analysen af variationen mellem informanttyperne ikke udtrykkeligt rapporteres” (, vores kursivering). Således producerer Grimshaw et al. ganske typisk og som i resuméet ovenfor en liste over diverse “temaer”, der beskriver de mange grunde til, at praktiserende læger overser eller modsætter sig den skræddersyede retningslinje . Det fremgår klart af deres indhold, men det rapporteres ikke, at disse divergerende reaktioner på PEM vil være særlige for specifikke undergrupper af praksis og praktiserende læger. Kun nogle vil foretrække at stole på deres egen vurdering; kun nogle vil mangle administrativ støtte; kun nogle af deres patienter vil have adgangsproblemer. Og uden at kende den nøjagtige identitet og den relative størrelse af disse forskellige grupper kan vi ikke vide, om det samme nettoresultat ville blive opnået i andre sammenhænge. Vi kan ikke generalisere.
Som opsummering kan man sige, at tilføjelse af kvalitativ beskrivelse til kvantitativ vurdering giver et mere omfattende evidensgrundlag til at forstå en interventions skæbne, men der er behov for yderligere forskningsstrategier for at vurdere, om denne skæbne sandsynligvis vil gentage sig.
Strin to
Markere begyndelsen på en strategi til bedre at organisere disse evidensfragmenter. Nøglen er indførelsen af teoretiske konstruktioner for at udvide det forklaringsmæssige omfang af sådanne lokale resultater. Denne tilgang undgår den statistiske opfattelse, at generalisering er baseret på typicitet – dvs. påstanden om, at den undersøgte intervention er “repræsentativ” for en større population af interventioner, hvorfra den er hentet. PEM-programmet er et komplekst system bestående af en adaptiv intervention, et sted, et administrativt system, en kommunikationsvej, en patientpopulation, flere lag af praktiserende læger, en form for finansiel regulering, en type sundhedsydelser osv. Ingen undersøgelse kan hævde at være repræsentativ for alle disse træk.
Det her foreslåede alternativ erstatter “programmet” med “programteorien” som den grundlæggende analyseenhed. Programteorier henviser til de grundlæggende ideer bag en intervention, den argumentation, der fremføres for, hvorfor den skulle virke. Sådanne teorier er generiske. De dukker op igen og igen i programplanlægning og politikudformning (for en oversigt over teorier om gennemførelsesvidenskab se Nilsen ). Kendetegnende for sådanne teorier er, at de opererer på et abstraktionsniveau, der ligger ud over de konkrete interventioner, som f.eks. den intervention, der undersøges her. Abstraktion, eller abduktion, som det nogle gange kaldes, er i sig selv en stærk allierede for generalisering . Vi forklarer en bestemt begivenhed som et genkendeligt tilfælde i en bredere klasse af tilfælde, som en variation over et tema, som vi allerede har en vis forhåndsviden om. Den eksisterende viden giver os foreløbige idéer om styrker og svagheder ved denne klasse af programmer, som giver os indsigt i, hvad vi kan forvente i en ny anvendelse, og denne indsigt bliver derefter yderligere forfinet ved en nærmere undersøgelse af hver enkelt inkarnation af programteorien.
Så i stedet for at betragte “2005-Onatario-printed-educational-messages-scheme-to-increase-practitioner-referrals-for-retinal-screening” som en engangsforeteelse (hvilket den er), opfatter vi den som endnu et eksempel på en velkendt idé (hvilket den også er). Hvad er PEMS så et tilfælde af? Hvad er den hævdvundne programteori? Jeg har naturligvis ikke adgang til den nøjagtige tankegang hos de ansvarlige for denne specifikke intervention. Men der er masser af ledetråde. PEM’er er en del af “kliniske retningslinjer for klinisk praksis” eller “standardiseret pleje”. Den generelle idé er at skabe orden og forudsigelighed i praktiserende lægers adfærd ved at give autoritative “påmindelser”, “opdateringer”, “protokoller”, “bulletiner” og “løbende faglig uddannelse”. I alle tilfælde er det budskabet, der er mediet. Den underliggende antagelse, den fælles interventionsteori, er ganske enkel, nemlig at – velinformerede, velkvalificerede sundhedspersonale vil reagere på og søge at følge fagligt godkendt, evidensbaseret information.
Det afgørende punkt er, at vi allerede ved en hel del om denne teori og dens dybe begrænsninger. Information kan have en ærefuld legitimation, men i sig selv er autoritet på papiret sjældent i stand til at modvirke dybt forankrede personlige præferencer, tidspres, eksisterende rutiner og institutionelle begrænsninger. Ironisk nok går resultaterne fra de utallige undersøgelser, som fortalte os om de mange grunde til, at praktikere ikke læser formelle forskningspublikationer, og som var ansvarlige for indførelsen af implementeringsvidenskaben, igen i en implementeringsordning, som forsøger at engagere praktikere med skræddersyede, direkte tilsendte bevisbulletiner. Vi burde ikke have været overraskede. Selv om der er en dybtgående accept af de tilbudte råd, vil nogle praktikere ikke tage hensyn til dem, fordi de daglige eksterne virkninger af deres arbejde fortsat er fremherskende.
Dette bringer os til det næste træk ved en programteoretisk tilgang. Disse teorier er ligesom de interventioner, de ligger til grund for, skrøbelige og fejlbarlige. Vi ved således en hel del om “retningslinjeteori”, fordi den i talrige anvendelser er blevet afprøvet og fundet mangelfuld. På samme måde som vi abstraherer de idéer, der ligger til grund for en intervention, er vi således også nødt til yderligere at opbygge programteorier, der giver abstrakte hypoteser om de betingelser, der er årsag til succes eller fiasko. De politiske beslutningstagere har et sæt idéer om et program, som ofte mødes med helt andre idéer hos praktikerne. Kendetegnende for programteoritilgangen er, at den forudsætter blandede resultater. I det foreliggende tilfælde er opgaven at konstruere teorier om, hvilken type praktikere i hvilken type praksis der sandsynligvis vil tage hensyn til (eller se bort fra) vejledningen.
Selv om formålet er at behandle dem som abstrakte, formelle hypoteser, er der intet esoterisk eller lærd ved sådanne teorier.Fodnote 1 Hvis man f.eks. henviser tilbage til Grimshaw et al’s kvalitative delundersøgelse om reaktioner på retinopati PEM , er der flere implicitte og uprøvede hypoteser, der antyder, hvilke behandlere og hvilke praksisser der kan have forskellige reaktioner. For eksempel er måske det enkleste af de mange temaer, der blev afdækket som årsag til, at de ikke overholder den skræddersyede vejledning, “tillid til deres egen kliniske vurdering”. Hvilken undergruppe af praktiserende læger kunne have denne begrundelse? En elementær hypotese er, at det er en reaktion, der vokser med praktiserende lægers erfaring, en påstand, som så kunne testes empirisk med en sammenligning af ændringer i henvisningsrater mellem “veteraner” og “nytilkomne”.
Den egentlige pointe med at behandle denne “erfaringshypotese” som en programteori er, at vi har forhåndsviden om den. Vi ved fra et utal af undersøgelser, at overholdelsen af retningslinjerne er suboptimal. Vi har derfor en solid forventning om, at en “oplevelsesforskel” kan dukke op som et problem i de tusindvis af andre retningslinjer, der findes for enhver tilstand, test og behandling. Men det, vi ikke ved, er den måde, hvorpå erfaring gør en forskel. Erfaring er mere end antallet af år, som en behandler tilbringer i seletøj. Erfaring er også forbundet med autonomi, anciennitet, ledelsesansvar, faglige forpligtelser, specialviden, stigende kendskab til sygdomme, til patienter og til “systemet” osv. Der vil altid være nogle subtile variationer i det, der udgør “erfaring”, og ved at følge ideen og dens eftervirkninger gennem en række casestudier kan vi opbygge en forståelse af dens forskellige virkninger. Teorier er til for at blive afprøvet og forfinet, genafprøvet og genforfinet – og det er ud fra denne proces, at generalisering finder sted.
Strin tre
Så hvordan skal programteorier afprøves? Et afgørende skridt her er at ændre fokus på, hvad der udgør explanandum i forsøgsforskning. Alle KT-interventioner har blandet held, og det bør være et centralt mål at forklare multiformiteten. Det analytiske fokus bør være på “resultatmønstre” snarere end på “resultater” eller på “heterogene virkninger” snarere end på “nettoeffekter” . Dette forslag har mødt betydelig modstand. Standardmodellen, selv efter pragmatismens indtog, er at sammenligne resultaterne i behandlede og ubehandlede grupper, idet PRCT’et skal have tilstrækkelig statistisk styrke til pålideligt at påvise en nettoeffekt som grundlag for at teste det, der stadig betragtes som det grundlæggende spørgsmål om resultaterne – har interventionen “virket”? Med stigende hyppighed tilføjes kvalitative undersøgelser for at opbygge et sammensat billede af de vigtigste modtageres ræsonnementer, som kan have bidraget til den observerede effekt.
Denne model har holdt sig fast på trods af en betydelig klinisk litteratur, der viser, at der næsten uden undtagelse er forsøgspersoner, der oplever større og mindre fordele inden for den “behandlede population” . Den sunde fornuftsopfattelse om, at behandlinger ikke virker for alle, er i kliniske termer beskrevet som heterogenitet af behandlingseffekter (HTE), og dens implikationer er betydelige, som i dette berømte citat fra Kravitz et al.:
‘When HTE is present, the modest benefit ascribed to many treatments can be misleading because modest average effects may reflect a mixture of substantial benefits for some, little benefit for many and harm to a few’ .
This proposition has even more currency if we refonder the construction of pragmatic trials. HTE er til stede selv i fase 3-forsøg om lægemidlers effektivitet, som har meget omhyggeligt afgrænsede inklusions- og eksklusionskriterier, og som anvender et væld af yderligere kontroller . Selve idéen med pragmatiske forsøg er at foretage undersøgelser i virkelige miljøer, hvor sådanne kontroller er lempet. På hver dimension af PRECIS-grafikken vil der være indbygget variation i input. Det følger heraf, at HTE er særlig fremtrædende i PRCTS på grund af selve deres udformning, en enormt dybtgående, men stort set ignoreret observation, som først blev fremsat af Segal et al. Betydningen af det sammenfattende resultat, nettobehandlingseffekten, mindskes derved. I tilfælde af sociale programmer som PEMS kan den gennemsnitlige og nul behandlingseffekt meget vel afspejle, for at parafrasere Kravitz, en informationskampagne, der har haft betydelig indflydelse på visse udøvere, som er gået ubemærket hen over for andre af mange, og som har virket som endnu et generende afskrækkende incitament for nogle få.
En sådan eventualitet har tendens til at blive overset i PRT’er i almindelighed og i vores særlige eksempel på PEMS-forsøget. Forsøgslederne prioriterer altid at beskytte den interne validitet ved gennem randomisering at sikre, at der er balance mellem forsøgs- og kontrolgrupperne med hensyn til karakteristika og potentielle prædispositioner. Ud fra dette perspektiv rapporterer Zwarenstein et al. om en tilfredsstillende tæt overensstemmelse mellem forsøgs- og kontrolpraksis med hensyn til “kønssammensætning”, “uddannelsessted”, “praksisstørrelse” og, i vores fremhævede eksempel, “praktiserende lægers års erfaring” . Den kendsgerning, at disse og andre karakteristika ved modtagerne er ligeligt fordelt på eksperimentelle og kontrolbetingelser, betyder ikke, at de forhold, som de afspejler, ikke har nogen betydning for, om de pædagogiske opdateringer bliver fulgt. Det efterlader stadig muligheden for, at der er væsentlige forskelle mellem undergrupper og underprocesser i responsen på vejledningen, som, ligesom i Kravitz’ scenarie, kan forblive uopdagelige i nettoeffekten.
Denne eventualitet kan undersøges ved at identificere og sammenligne resultater på tværs af forskelligt disponerede grupper. Kvalitativ analyse kan give vigtige ledetråde om disse sandsynlige dispositioner. Men igen lykkes det ofte ikke at forstå heterogene resultater på grund af en ret forskellig tradition inden for denne form for undersøgelse. Kvalitativ analyse har længe værdsat “tykke beskrivelser”. Som i Grimshaws delundersøgelse er målet at indfange, ofte gennem tematisk analyse, hele spektret af holdninger til programmet. Hensigten med mange kvalitative analyser er at være omfattende snarere end analytisk. Målet er at nå “mætning” i beskrivelsen af forsøgspersonernes dispositioner snarere end at følge op på de adfærdsmæssige konsekvenser af de forskellige dispositioner.
Den uundgåelige uregelmæssige virkning i interventioner, der undersøges inden for implementeringsvidenskab, ændrer forskningsspørgsmålet. Det endelige mål er ikke at afgøre, om interventioner virker. Det, der snarere skal undersøges, forstås, rådgives om og udnyttes, er deres differentielle virkning.
Strap fire
Når man har spekuleret over en revideret dagsorden for implementeringsvidenskaben, nemlig at undersøge de mangfoldige kontingenser, der bidrager til programteoriernes succeser og fiaskoer, er det tilbage at redegøre for de forskningsdesigns, der kan løse denne opgave. Jeg har allerede talt for behovet for en teoridrevet tilgang, der omfatter sekvenser eller serier af undersøgelser, og som anvender blandede metoder. Der findes tydeligvis en række prospektive og retrospektive designs, som ville passe til dette. Men jeg vil her fremhæve to enkle analysestrategier, som er centrale i jagten på generaliserbare beviser.
I casestudieforskningens sprogbrug kaldes disse strategier for “within-case”- og “cross-case”-analyse . Hvordan kan de anvendes i forbindelse med undersøgelsen af teori om retningslinjer? I førstnævnte metode identificeres forskellige undergrupper af modtagere af en retningslinje, der opstilles hypoteser om forskelle i deres forudsætninger for og resulterende adfærd i forhold til rådgivningen, og der genereres data til at teste disse formodninger. At opnå overholdelse af retningslinjerne afhænger imidlertid ikke kun af de involverede personer, men også af deres roller, deres netværk, deres organisationer og de bredere lovgivningsmæssige rammer, som de arbejder i . For at afdække disse påvirkninger er det nødvendigt med tværgående undersøgelser, hvor sammenligninger vælges for at afspejle de resultater, der kan opnås på forskellige institutionelle steder, der modtager retningslinjerne.
Læringen øges, efterhånden som disse analytiske snit anvendes i rækkefølge. Eksisterende viden om styrkerne og svaghederne, vinderne og taberne, i tidligere inkarnationer af programteorien er indbygget i valget af sammenligningsmodeller i undersøgelse 1. Nogle af disse hypoteser vil blive støttet, mens andre vil blive afkræftet. Dette giver anledning til undersøgelse 2, som reviderer programteorien og tilpasser sammenligningsgrupperne i et forsøg på at forklare den nye heterogenitet i resultaterne. Reviderede programteorier er stadig skrøbelige. De møder overensstemmelser og anomalier, og forskningen fortsætter gennem flere casestudier i et forsøg på at udjævne dem (mindes fig. 2).
Dette fuldender en plan for en strategi med blandede metoder til evaluering af generiske gennemførelsesstrategier. Lidt ligesom kliniske retningslinjer har metodologiske forskrifter kun betydning, hvis de finder praktisk anvendelse. Dette bringer mig til den sidste opfordring i et papir af opfordringer, nemlig at hilse den voksende brug af within-case- og cross-case-analyser inden for implementeringsvidenskab velkommen. Jeg har her kun plads til at skitsere fire korte eksempler, der illustrerer argumentet for multi-site, mixed-method- og teoridrevne casestudier. Disse illustrationer tager afsæt i det sted, hvor de foregående eksempler slap, nemlig med vores indledende og meget fejlbarlige programteori om, at sundhedspersonale vil reagere på professionelt godkendte, evidensbaserede retningslinjer, og vores første gæt, common-sense implementeringsteori om, at “praktiserende lægers erfaring” vil gøre en forskel i deres anvendelse.
Grove et al. undersøger ortopædkirurgers reaktioner på NICE-retningslinjer om total hofteudskiftning på tre NHS-hospitaler. Disse ledende klinikere reagerede på retningslinjerne på ganske forskellige måder alt efter indstilling. I tilfælde A, et akademisk center beliggende inden for en traume- og ortopædisk afdeling, havde kirurgerne et “positivt syn på formel, kodificeret viden”, var “vant til at besvare spørgsmål ved hjælp af en større befolkningsreferenceramme” og udfærdigede deres “egen protokoldokumentation knyttet til en klinisk vejledning”. Case C, en ortopædisk afdeling på et universitetshospital, udgjorde den ekstreme kontrast, idet kirurgerne rapporterede, at de “aldrig havde set deres organisations NICE-proces”, som “hørte til det ledelsesmæssige og administrative område”. Her foretrak kirurgerne “elastisk, erfaringsbaseret viden, der er opbygget over tid” baseret på “den medfødte fornemmelse af kirurgi”. Erfaring driver disse ledende klinikere i modsatrettede retninger – alt efter kontekst.
Rycroft-Malone et al. undersøgte reaktioner på ‘protokolbaseret pleje’ i en multi-case undersøgelse på tværs af sygepleje, jordemodervirksomhed og sundhedsbesøg mv. Redskaberne mødte ganske forskellige reaktioner. I overensstemmelse med vores primitive hypotese rapporterer forfatterne, at de praktiserende læger med mere erfaring “enten ikke henviste til dem eller brugte dem fleksibelt”. I overensstemmelse med tesen opfattede yngre praktiserende læger også protokollerne som “nyttige informationsressourcer”. Men der er et par væsentlige fordrejninger. I nogle sammenhænge opfattes den autoritet, som retningslinjerne har, som en styrkelse. Standardiseringen af, hvad der udgør god praksis, “gjorde det muligt at udvide de traditionelle roller og fremme selvstændig praksis, hvilket igen resulterede i mere sygepleje- og jordemoderledet pleje og tjenester”. Derimod blev vejledningen “i sammenhænge, hvor der er hyppige personaleudskiftninger, eller hvor man er afhængig af vikarer”, “inkluderet i introduktionsmaterialer og kompetencevurderinger”. I disse situationer følger relativt høje niveauer af overholdelse af retningslinjerne af, at de blev indkaldt og coachet.
Moule et al. evaluerede et kvalitetsforbedringsprogram, der indarbejdede NICE’s retningslinjer for anvendelse af antikoagulanter til at reducere slagtilfælde ved atrieflimren (AF) på tværs af seks almen praksis i Storbritannien. Midlerne blev anvendt forskelligt. Igen viste praktiserende lægers erfaring og forudfattede idéer sig at være vigtige – men med yderligere variationer over temaet. I dette tilfælde overtog nogle af de mest erfarne praktiserende læger med personlig ekspertise ledelsen af ordningen og hjalp med at føre vejledningen videre til en gennemgangs- og opfølgningsordning. Andre praksis, hvor den praktiserende læge ofte arbejdede isoleret, manglede “systemets “tankegang” … til at sætte dem i stand til at følge/overvåge patienterne”. I disse tilfælde skyldtes afhængigheden af erfaring og personlig vurdering i høj grad, at der manglede en formel infrastruktur til at servicere retningslinjerne.
Spyridonidis og Calnan anvendte en langsigtet sammenligning inden for og på tværs af sagerne til at evaluere, hvordan gennemførelsen af to NICE-retningslinjer om kronisk hjertesvigt (CHF) og fedme udviklede sig over tid. De lægger vægt på “hele systemets” tilpasning til retningslinjerne, og derfor undersøger de perspektiverne hos professionelle ledere, ledende og mellemledere, hospitalsklinikere, praktiserende læger, sygeplejersker og allierede sundhedspersoner. Retningslinjerne følges som altid “forskelligt”; gennemførelsen af dem svinger “frem og tilbage”, mens forskellige interessenter overvejer de konkurrerende konsekvenser. F.eks. var en af mulighederne i NICE-retningslinjerne om fedme bariatrisk kirurgi. Efter en stigning i antallet af henvisninger til bariatrisk behandling omskrev ledelsen hurtigt retningslinjen for at rationere en dyr procedure. Et andet eksempel er, at NICE-retningslinjen om hjerteinsufficiens anbefalede brug af betablokkere, som ikke var omfattet af en anden NHS-ordning, Quality and Outcomes Framework (QOF), som aflønner praktiserende læger for at opfylde en række præstationsindikatorer. Implementeringen af NICE-anbefalingen gik i stå i afventning af konvergens mellem de respektive politikker.
Mange, mange flere sådanne casestudier kunne naturligvis konsulteres for at uddybe forståelsen af den uregelmæssige udbredelse af retningslinjerne.Fodnote 2 Pointen er, at ved at starte med en relativt abstrakt programteori, snarere end en skov af separate initiativer, kan et forskningsprogram med undersøgelser inden for og mellem cases begynde at afdække de variationer i resultaterne, der rutinemæssigt følger af implementeringen af retningslinjerne. I det foreliggende tilfælde startede jeg således med den grove implementeringsteori, at yngre medarbejdere var mere tilbøjelige til at respektere fagligt godkendte retningslinjer, mens erfarne praktikere var mere tilbøjelige til at stole på deres egen dømmekraft. Denne teori er fuld af huller eller, som Popper måske foretrækker, har et presserende behov for “fejleliminering”. Vi kan således konstatere, at erfarne praktiserende læger kan være entusiastiske eksponenter for retningslinjer – hvis de arbejder i institutioner, der er orienteret mod bredere epidemiologiske perspektiver. Vi opdager, at nogle erfarne praktikeres præference for deres egen vurdering i virkeligheden skyldes, at de ikke har den nødvendige systeminfrastruktur til at gennemføre en ny retningslinje. Vi opdager, at nogle relativt yngre medarbejdere faktisk tager retningslinjer til sig – men at de gør det på baggrund af, at de giver autonomi og bemyndigelse snarere end at levere forskningsvisdom. Vi opdager, at andre underordnede grupper følger forskningsstøttede retningslinjer, simpelthen fordi de er indarbejdet i introduktion og uddannelse. Vi opdager, at praktikere, der er velvilligt indstillet over for nye retningslinjer, ofte forhindres i at anvende ordningerne, fordi andre interessenter (ofte med mere magt) opfatter, at ændringerne vil få skadelige konsekvenser i deres operationelle områder.