Det finns verkligen. För att riskera ytterligare tortyr av tidningens skilsmässometafor vill jag föreslå att PRCT bör bättra sig, söka medling och begära ytterligare stöd. Alla de system som inrättats för att förbättra forskningsutnyttjandet är otvivelaktigt sociala interventioner och vid utvärderingen av sådana program finns det ingen överenskommen ”bevishierarki” utan snarare ett ”bricolage av tillvägagångssätt”. Inom implementeringsvetenskapen har man, kanske mer än inom något annat hälsovårdsområde, strävat efter och argumenterat för det optimala tillvägagångssättet för sådana blandade metoder eller hybridkonstruktioner. Jag undviker varje försök att vinna paradigmkriget här. Del 2 tar sig an en enklare uppgift, nämligen att föreslå att man utnyttjar den möjlighet som PRCT:erna erbjuder på ett annat, mer inkluderande sätt. Den börjar med att skissera en forskningsstrategi för att lära sig de generaliserbara lärdomarna från implementeringsvetenskapen (tabell 1) och avslutas med ett kort exempel som exemplifierar tillvägagångssättet.
Som detta kan en sådan agenda verka fruktansvärt abstrakt. Jag svarar på detta på två sätt. För det första har denna syn på kumulation av kunskap en betydande filosofisk bakgrund . För det andra kan modellen användas praktiskt om man undersöker den samlade forskningen om ett ingrepp snarare än enskilda bidrag.
Den forskningsprocess som föreslås i tabell 1 motsvarar i hög grad Poppers teori om den vetenskapliga kunskapens tillväxt, som i hög grad vilar på idén om progressiv ”feleliminering” (fig. 2). Tillämpad på implementeringsvetenskapen utvecklas strategin på följande sätt. Forskningen inleds med en första identifiering av ett problem (P1), i det här fallet om bristande kunskapsöverföring. En preliminär programteori (TT1) läggs fram som skulle kunna erbjuda en lösning, i form av ett särskilt system för att förbättra överföringen av forskning till praktiken. Programmet genomförs i forskningen och har alltid en blandad framgång. Denna slutsats betraktas som provisorisk och kan revideras mot bakgrund av senare resultat. Ytterligare framsteg är beroende av att man granskar både programmets framgångar och misslyckanden med särskild tonvikt på att eliminera felen (EE1). Denna granskning leder till en mer nyanserad förståelse av problemet (P2), en förfinad lösning (TT2) och mer forskning, både positiv och negativ. Elimineringen av ytterligare fel (EE2) är en sporre för att öka kunskapen. Processen upprepas sedan i all oändlighet.
Innsisterar det en process av gissningar och vederläggningar inom implementeringsvetenskapen? Som nämnts är många författare benägna att förmedla en otillbörlig känsla av säkerhet, slutgiltighet och universalitet i sina forskningsresultat. Men samtidigt, om man undersöker framstegen i forskningen, kan man konstatera en mer försiktig och sanningsenlig berättelse. Vi vänder oss till litteraturen för att få en exemplifiering av tabell 1.
Steg ett
Urger att PRCT:s utvidgar sitt uppdrag och blir fallstudier med flera metoder. Rådet att RCT bör innehålla ett kvalitativt inslag är helt vanligt, även om det råder delade meningar om huruvida sambandet är bäst genom öppna intervjuer, processutvärdering, analys av intervenerande variabler, teoribaserad utvärdering, realistisk utvärdering och så vidare. I överensstämmelse med alla dessa, även om det sällan uttrycks på detta sätt, är förslaget att sådana undersökningar också bör betraktas som fallstudier, där man undersöker ett av många sätt på vilka sådana interventioner kan utformas.
Vi behöver inte leta alltför långt för att hitta ett exempel här, för PEMs-studien åtföljdes faktiskt av en ”teoribaserad processutvärdering” . I den senare studien användes en blandning av standardiserade frågeformulär och öppna intervjuer för att fastställa läkarnas attityder till och erfarenheter av interventionen, och på så sätt börjar man förklara PRCT:s nollresultat. Kortfattat kan man säga att den kvalitativa studien avslöjar positiva attityder till retinopatiscreening, djup kunskap om dess tillgänglighet och en stark avsikt att genomföra remisserna före och efter interventionen. Ändå vet vi från PRCT att remissfrekvensen förblir statisk (och en besvikelse). Den förklaring som framkommer i de öppna intervjuerna är att en rad olika faktorer ”efter avsiktliga” åtgärder försvagar den uttalade viljan att remittera. Dessa presenteras med hjälp av illustrativa citat från mottagarna, som tar upp en rad olika praktiska problem – läkarnas preferens för sin egen bedömning, kontrasterande åsikter om screeningens effektivitet, tidsbrist och press, den administrativa bördan av remittering, vissa patienters ointresse för screening, att screening inte täcks av vissa försäkringar, långa väntetider och otillgängligheten till vissa screeningar.
Vi har fått syn på en god cirkel av förklaringar. Den rigorösa PRCT:n säkerställer resultatet men kan inte säga varför interventionen är ineffektiv. Den kvalitativa undersökningen undersöker en rad underliggande processer som visar hur läkares erfarenhet, patienternas preferenser och administrativa begränsningar kan ha kombinerats för att skapa det oväntade resultatet. Detta utgör en mycket trovärdig förklaring till programmets misslyckande, men den kan ännu inte generaliseras. Det finns två hinder.
För det första är alla ovanstående uppgifter (kvantitativa och kvalitativa) relaterade till specifika förhållanden inom hälso- och sjukvårdsförvaltningen och preferenserna hos olika intressegrupper på den platsen och vid den tidpunkten. Det är fortfarande en unik fallstudie. Den andra och mer intressanta bristen härrör från en vanlig begränsning av sådana kvalitativa analyser, nämligen att ”analysen av variationen mellan olika typer av informanter inte uttryckligen rapporteras” (, vår kursivering). Det är alltså ganska typiskt, och som i sammanfattningen ovan, att Grimshaw et al. producerar en lista med olika ”teman” som beskriver de många skälen till varför yrkesutövare kan förbise eller motarbeta den skräddarsydda riktlinjen. Det som framgår tydligt av deras innehåll, men som inte rapporteras, är att dessa avvikande reaktioner på PEM kommer att vara specifika för specifika undergrupper av praktiker och yrkesutövare. Endast vissa kommer att föredra att lita på sitt eget omdöme, endast vissa kommer att sakna administrativt stöd och endast vissa av deras patienter kommer att ha problem med tillgången. Utan att känna till dessa olika gruppers exakta identitet och relativa storlek kan vi inte veta om samma nettoresultat skulle uppnås i andra miljöer. Vi kan inte generalisera.
Som sammanfattning kan man säga att om man lägger till en kvalitativ beskrivning till en kvantitativ bedömning får man en mer omfattande evidensbas för att förstå en interventions öde, men det krävs ytterligare forskningsstrategier för att bedöma om det är troligt att detta öde kommer att upprepas.
Steg två
Det är början på en strategi för att bättre organisera dessa bevisfragment. Nyckeln är införandet av teoretiska konstruktioner för att utvidga förklaringsområdet för sådana lokala resultat. Detta tillvägagångssätt undviker den statistiska uppfattningen att generalisering bygger på typicitet – dvs. påståendet att den studerade interventionen är ”representativ” för en större population av interventioner från vilken den är hämtad. PEM-programmet är ett komplext system som består av en adaptiv intervention, en plats, ett administrativt system, en kommunikationsväg, en patientpopulation, flera nivåer av utövare, en form av finansiell reglering, en typ av hälso- och sjukvårdstjänst och så vidare. Ingen studie kan göra anspråk på att vara representativ för alla dessa egenskaper.
Det alternativ som föreslås här ersätter ”programmet” med ”programteorin” som grundläggande analysenhet. Programteorier hänvisar till de grundläggande idéerna bakom en intervention, det resonemang som förs fram om varför den bör fungera. Sådana teorier är generiska. De dyker upp om och om igen i programplanering och beslutsfattande (för en översikt över teorier inom genomförandekunskap se Nilsen ). Kännetecknande för sådana teorier är att de verkar på en abstraktionsnivå som ligger bortom de konkreta insatserna, t.ex. den som undersöks här. Abstraktion, eller abduktion som det ibland kallas, är i sig en kraftfull allierad till generalisering . Vi förklarar en viss händelse som ett igenkännbart fall i en större klass av fall, som en variation på ett tema som vi redan har en viss förkunskap om. Den befintliga kunskapen ger oss preliminära idéer om styrkor och svagheter hos denna klass av program, vilket ger oss en insikt om vad vi kan förvänta oss i en ny tillämpning, en insikt som sedan förfinas ytterligare i en närmare granskning av varje inkarnation av programteorin.
Istället för att betrakta ”2005-Onatario-printed-educational-messages-scheme-to-increase-practitioner-referrals-for-retinal-screening” som en engångsföreteelse (vilket det är), uppfattar vi det som ytterligare ett exempel på en välanvänt idé (vilket det också är). Så vad är PEMS ett fall av? Vad är den gamla hederliga programteorin? Jag har naturligtvis ingen tillgång till det exakta tänkandet hos de ansvariga för denna specifika intervention. Men det finns gott om ledtrådar. PEM är en del av ”industrin för riktlinjer för klinisk praxis” eller ”rörelsen för standardiserad vård”. Den allmänna idén är att bringa ordning och förutsägbarhet i yrkesutövarnas beteende genom att tillhandahålla auktoritativa ”påminnelser”, ”uppdateringar”, ”protokoll”, ”bulletiner”, ”fortbildning”. I samtliga fall är det budskapet som är mediet. Det underliggande antagandet, den gemensamma interventionsteorin, är helt enkelt, nämligen att – välinformerade, välkvalificerade vårdpersonal kommer att reagera på, och försöka följa, professionellt godkänd, evidensbaserad information.
Den avgörande punkten, för att upprepa den, är att vi redan vet en hel del om denna teori och dess djupgående begränsningar. Information må ha en ärofylld legitimation, men i sig självt kan auktoritet sällan motverka djupt rotade personliga preferenser, tidspress, existerande rutiner och institutionella begränsningar. Ironiskt nog återkommer resultaten från de otaliga studier som berättade om de många skälen till att yrkesverksamma inte läser formella forskningspublikationer, och som var ansvariga för att införa genomförandekunskap, igen i ett genomförandeprogram som försöker engagera yrkesverksamma med skräddarsydda, direkt utskickade bevisbulletiner. Vi borde inte ha blivit förvånade. Även om det finns en djupgående acceptans för de råd som erbjuds kommer en del yrkesutövare inte att lyssna på dem eftersom de dagliga externa effekterna av deras arbete fortsätter att råda.
Detta för oss till nästa egenskap hos en programteoretisk strategi. Dessa teorier, liksom de insatser som de ligger till grund för, är bräckliga och felbara. Vi vet alltså en hel del om ”riktlinjeteorin” eftersom den har prövats i mängder av tillämpningar och visat sig vara otillräcklig. På samma sätt som vi abstraherar de idéer som ligger till grund för ett ingripande måste vi också bygga upp programteorier som ger abstrakta hypoteser om de villkor som är avgörande för framgång eller misslyckande. De politiska beslutsfattarna har en uppsättning idéer om ett program, som ofta möts av praktikernas helt andra idéer. Kännetecknande för programteorin är att den utgår från blandade resultat. I det aktuella fallet är uppgiften att konstruera teorier om vilken typ av utövare i vilken typ av praktik som sannolikt kommer att beakta (eller inte beakta) vägledningen.
Och även om målet är att behandla dem som abstrakta, formella hypoteser, finns det inget esoteriskt eller lärorikt med sådana teorier.Fotnot 1 Om man till exempel återknyter till Grimshaw et al:s kvalitativa delstudie om reaktioner på retinopati PEM finns det flera implicita och otestade hypoteser som tyder på vilka utövare och vilka metoder som kan ge olika reaktioner. Till exempel är kanske det enklaste av de många teman som avslöjades för att inte följa den skräddarsydda vägledningen ”förtroende för sin egen kliniska bedömning”. Vilken undergrupp av yrkesutövare skulle kunna ha detta resonemang? En elementär hypotes är att det är en reaktion som växer med yrkesutövarnas erfarenhet, ett förslag som sedan skulle kunna testas empiriskt med en jämförelse av förändringar i remissfrekvenserna mellan ”veteraner” och ”nykomlingar”.
Den verkliga poängen med att behandla denna ”erfarenhetshypotes” som en programteori är att vi har en förkunskap om den. Vi vet från en myriad av studier att följsamheten till riktlinjer inte är optimal. Vi har därför en solid förväntan på att en ”erfarenhetsskillnad” kan dyka upp som ett problem i de tusentals andra riktlinjer som finns för varje tillstånd, test och behandling. Men vad vi inte vet är på vilket sätt erfarenheten gör skillnad. Erfarenhet är mer än det antal år som en utövare tillbringar i en sele. Erfarenhet innebär också självständighet, senioritet, ledningsansvar, yrkesmässiga åtaganden, specialistkunskaper, ökad förtrogenhet med sjukdomstillstånd, med patienter och med ”systemet” och så vidare. Det kommer alltid att finnas vissa subtila variationer i vad som utgör ”erfarenhet” och genom att följa idén och dess efterföljd genom en rad fallstudier kan vi bygga upp en förståelse för dess olika effekter. Teorier är till för att testas och förfinas, testas på nytt och förfinas på nytt – och det är genom denna process som generalisering sker.
Steg tre
Hur ska programteorier testas? Ett avgörande steg här är att ändra betoningen på vad som utgör explanandum i försöksforskningen. Alla KT-interventioner har blandade framgångar och att förklara mångfalden bör vara det viktigaste målet. Det analytiska fokuset bör ligga på ”resultatmönster” snarare än ”resultat” eller på ”heterogena effekter” snarare än ”nettoeffekter”. Detta förslag har mött stort motstånd. Standardmodellen, även efter pragmatismens intåg, är att jämföra resultaten i behandlade och obehandlade grupper, där PRCT:n har tillräcklig statistisk styrka för att på ett tillförlitligt sätt upptäcka en nettoeffekt som grund för att testa det som fortfarande anses vara den grundläggande resultatfrågan – har interventionen ”fungerat”? Allt oftare läggs kvalitativa undersökningar till för att skapa en sammansatt bild av de viktigaste mottagarnas resonemang som kan ha bidragit till den observerade effekten.
Denna modell har bestått trots att det finns en omfattande klinisk litteratur som visar att det nästan utan undantag finns personer som upplever större och mindre fördelar inom den ”behandlade populationen”. Det sunda förnuftet att behandlingar inte fungerar för alla är kliniskt uttryckt heterogenitet av behandlingseffekter (HTE) och dess konsekvenser är betydande, som i detta berömda citat från Kravitz et al.:
”När HTE förekommer kan den blygsamma fördel som tillskrivs många behandlingar vara missvisande, eftersom blygsamma genomsnittliga effekter kan återspegla en blandning av betydande fördelar för vissa, liten fördel för många och skada för ett fåtal” .
Detta påstående är ännu mer aktuellt om vi funderar över hur pragmatiska prövningar är uppbyggda. HTE förekommer till och med i fas tre av prövningar av läkemedels effektivitet, som har mycket noggrant avgränsade inklusions- och exklusionskriterier och som använder sig av en mängd ytterligare kontroller . Själva idén med pragmatiska prövningar är att undersöka i verkliga miljöer där dessa kontroller är mindre omfattande. På varje dimension av PRECIS-grafiken kommer det att finnas inbyggda, ingående variationer. HTE är följaktligen särskilt framträdande i PRCTS på grund av deras utformning, vilket är en mycket djupgående men till stor del ignorerad iakttagelse som först gjordes av Segal et al. Betydelsen av det sammanfattande resultatet, nettobehandlingseffekten, minskar därmed. När det gäller sociala program som PEMS kan den genomsnittliga och nollbehandlande effekten mycket väl återspegla, för att parafrasera Kravitz, en informationskampanj som har haft ett betydande inflytande på vissa utövare, som har gått obemärkt förbi av andra, av många, och som har fungerat som ytterligare ett besvärande avskräckande incitament för ett fåtal.
En sådan eventualitet tenderar att förbises i PRT:er i allmänhet och i vårt särskilda exempel på PEMS-studien. Försökspersonalens prioritet är alltid att skydda den interna validiteten genom att genom randomisering se till att det finns en balans i fråga om egenskaper och potentiella anlag mellan försöks- och kontrollgrupperna. Ur detta perspektiv rapporterar Zwarenstein m.fl. en tillfredsställande nära överensstämmelse mellan försöks- och kontrollerade verksamheter när det gäller ”könssammansättning”, ”utbildningsort”, ”verksamhetens storlek”, och i vårt exempel ”år av erfarenhet hos behandlarna”. Det faktum att dessa och andra egenskaper hos mottagarna är jämnt fördelade mellan försöks- och kontrollförhållandena betyder inte att de omständigheter som de återspeglar inte har någon betydelse för om utbildningsuppdateringar följs. Det lämnar fortfarande öppet för möjligheten att det finns betydande skillnader mellan subgrupper och subprocessuella skillnader i responsen på vägledningen som, precis som i Kravitz’ scenario, kan förbli omätbara i nettoeffekten.
Denna eventualitet kan undersökas genom att identifiera och jämföra resultaten i olika grupper med olika förutsättningar. Kvalitativ analys kan ge viktiga ledtrådar om dessa sannolika dispositioner. Men återigen misslyckas ofta med att förstå heterogena resultat på grund av en ganska annorlunda tradition inom denna form av undersökning. Kvalitativ analys har länge värnat om ”tjock beskrivning”. Precis som i Grimshaws delstudie är syftet att fånga, ofta genom tematisk analys, hela spektrumet av attityder till programmet. Avsikten med många kvalitativa analyser är att vara heltäckande snarare än analytisk. Målet är att nå ”mättnad” i beskrivningen av försökspersonernas dispositioner snarare än att följa upp de beteendemässiga konsekvenserna av de olika dispositionerna.
Den oundvikliga effekten av oregelbundna effekter i interventioner som undersöks inom implementeringsvetenskapen förändrar forskningsfrågan. Det slutliga målet är inte att avgöra om interventioner fungerar. Det som snarare måste undersökas, förstås, rådfrågas och utnyttjas är deras olika effekter.
Steg fyra
När man har spekulerat i en reviderad dagordning för implementeringsvetenskapen, nämligen att undersöka de många olika omständigheter som bidrar till programteoriernas framgångar och misslyckanden, återstår det att redogöra för vilka forskningsmetoder som kan utföra denna uppgift. Jag har redan förespråkat behovet av ett teoridrivet tillvägagångssätt som inbegriper sekvenser eller serier av studier med hjälp av blandade metoder. Det finns uppenbarligen en rad olika prospektiva och retrospektiva metoder som skulle passa in i detta sammanhang. Men vad jag vill betona här är två enkla analysstrategier som är viktiga i sökandet efter generaliserbara bevis.
I fallstudieforskningens språkbruk kallas dessa strategier för ”within-case”- och ”cross-case”-analys. Hur kan dessa strategier användas i undersökningen av teorin om riktlinjer? I den förstnämnda metoden identifieras olika undergrupper av mottagare av en riktlinje, skillnader i deras förutsättningar för och resulterande beteende med avseende på råden antas och data genereras för att testa dessa antaganden. Att uppnå följsamhet till riktlinjer beror dock inte bara på de berörda personerna utan också på deras roller, deras nätverk, deras organisationer och de bredare lagstiftningsmiljöer som de arbetar i . För att få fram dessa influenser krävs fallöverskridande studier, där jämförelser väljs för att återspegla de resultat som kan genereras på olika institutionella platser där riktlinjen tillämpas.
Lärandet ökar när dessa analytiska snitt tillämpas i tur och ordning. Befintlig kunskap om styrkor och svagheter, vinnare och förlorare, i tidigare inkarnationer av programteorin byggs in i valet av jämförelseobjekt i undersökning 1. Några av dessa hypoteser kommer att stödjas och andra kommer att vederläggas. Detta är en sporre för undersökning 2, där programteorin revideras och jämförelsegrupperna anpassas i ett försök att förklara den framväxande heterogeniteten i resultaten. Reviderade programteorier är fortfarande bräckliga. De stöter på överensstämmelser och anomalier, och forskningen fortsätter genom fler fallstudier i ett försök att utjämna dem (se figur 2).
Detta kompletterar en plan för en strategi med blandade metoder för att utvärdera generiska genomförandestrategier. I likhet med kliniska riktlinjer har metodologiska föreskrifter endast betydelse om de finner praktisk användning. Detta för mig till den sista uppmaningen i ett dokument med uppmaningar, nämligen att välkomna den ökande användningen av analyser inom och mellan fall inom implementeringsvetenskapen. Jag har bara utrymme här för att skissera fyra korta exempel som exemplifierar argumenten för fallstudier med flera platser, blandade metoder och teoridrivna fallstudier. Dessa illustrationer tar vid där de tidigare exemplen slutade, nämligen med vår initiala och mycket felbara programteori om att sjukvårdspersonal kommer att reagera på professionellt godkända, evidensbaserade riktlinjer och vår första gissning, vår teori om genomförande med sunt förnuft om att ”erfarenhet av sjukvårdspersonal” kommer att göra skillnad i fråga om deras användning.
Grove m.fl. undersöker ortopedkirurgernas reaktioner på NICE-riktlinjerna om total höftledsoperation på tre sjukhus inom den nationella hälso- och sjukvårdsorganisationen (NHS). Dessa ledande kliniker reagerade på riktlinjerna på helt olika sätt beroende på miljö. I fall A, ett akademiskt centrum som ligger inom en trauma- och ortopedisk enhet, hade kirurgerna en ”positiv syn på formell, kodifierad kunskap”, var ”vana vid att besvara frågor med hjälp av en större befolknings referensram” och sammanställde sin ”egen protokolldokumentation kopplad till en klinisk vägledning”. Fall C, en ortopedisk avdelning på ett universitetssjukhus, gav en extrem kontrast, där kirurgerna rapporterade att de ”aldrig hade sett sin organisations NICE-process”, som ”hörde till det administrativa området”. Här föredrog kirurgerna ”motståndskraftig, erfarenhetsbaserad kunskap som byggts upp med tiden” och som byggde på ”den inneboende känslan av kirurgi”. Erfarenheten driver dessa ledande kliniker i motsatta riktningar – beroende på sammanhanget.
Rycroft-Malone et al. undersökte reaktioner på ”protokollbaserad vård” i en flerfallsstudie inom sjuksköterske-, barnmorske- och hälsobesöksverksamhet osv. Verktygen mötte ganska olika reaktioner. I linje med vår primitiva hypotes rapporterar författarna att de yrkesverksamma med mer erfarenhet ”antingen inte hänvisade till dem eller använde dem flexibelt”. I enlighet med tesen uppfattade även yngre praktiker protokollen som ”användbara informationsresurser”. Men det finns ett par viktiga förändringar. I vissa sammanhang uppfattas den auktoritet som riktlinjerna har som en förstärkande faktor. Standardiseringen av vad som utgör god praxis ”gjorde det möjligt att utvidga de traditionella rollerna och underlätta självständigt arbete, vilket i sin tur resulterade i mer sjuksköterske- och barnmorskeledd vård och tjänster”. I sammanhang där det ofta sker personalbyten eller där man är beroende av inhyrd personal” ingick vägledningen däremot ”i introduktionsmaterial och kompetensbedömningar”. I dessa situationer följer en relativt hög grad av följsamhet av att riktlinjen är inskriven och coachad.
Moule et al. utvärderade ett program för kvalitetsförbättring där NICE:s riktlinjer för användning av antikoagulantia för att minska antalet stroke orsakade av förmaksflimmer (AF) införlivades i sex allmänläkarmottagningar i Storbritannien. Resurserna användes på varierande sätt. Återigen visade sig allmänläkarens erfarenhet och förutfattade meningar vara viktiga – men med ytterligare variationer på temat. I det här fallet tog några av de mest erfarna läkarna med personlig expertis ledningen av systemet och bidrog till att få vägledning till ett gransknings- och uppföljningssystem. Andra mottagningar, ofta där den allmänläkaren arbetade isolerat, saknade ”systemtänkandet” … för att kunna spåra/övervaka patienterna”. I dessa fall berodde förlitandet på erfarenhet och personliga bedömningar till stor del på att det saknades en formell infrastruktur för att hantera riktlinjerna.
Spyridonidis och Calnan använde sig av en longitudinell jämförelse mellan olika fall för att utvärdera hur genomförandet av två NICE-riktlinjer, om kronisk hjärtsvikt (CHF) och fetma, utvecklades över tiden. De lägger tonvikten på anpassningen av hela systemet till riktlinjerna, och därför undersöker de perspektiven hos yrkesverksamma chefer, högre chefer och mellanchefer, sjukhuskliniker, allmänläkare, sjuksköterskor och andra yrkesgrupper inom hälso- och sjukvården. Riktlinjerna följs, som alltid, på olika sätt, och genomförandet av dem pendlar fram och tillbaka när olika intressenter funderar över de rivaliserande konsekvenserna. Ett alternativ i NICE:s riktlinjer för fetma var till exempel bariatrisk kirurgi. Efter en ökning av antalet remisser för bariatrisk kirurgi skrev ledningen snabbt om riktlinjen för att ransonera ett dyrt ingrepp. Ett annat exempel är att NICE:s riktlinjer för hjärtkärlsjukdom rekommenderade användning av betablockerare, som inte ingick i ett annat NHS-system, Quality and Outcomes Framework (QOF), som gav ersättning till allmänläkare för att de uppfyllde en rad resultatindikatorer. Genomförandet av NICE:s rekommendation stannade upp i väntan på konvergens mellan de olika politikområdena.
Många, många fler sådana fallstudier skulle naturligtvis kunna konsulteras för att fördjupa förståelsen av det oregelbundna införandet av riktlinjerna.Fotnot 2 Poängen är att genom att börja med en relativt abstrakt programteori, snarare än med en skog av separata initiativ, kan ett forskningsprogram med studier av enskilda fall och studier av olika fall börja avslöja de variationer i resultat som rutinmässigt följer på genomförandet av riktlinjer. I det aktuella fallet började jag alltså med den grova genomförandeteorin att yngre personal var mer benägen att respektera professionellt godkänd vägledning, medan erfarna yrkesutövare var mer benägna att lita på sitt eget omdöme. Denna teori är full av hål eller, som Popper kanske skulle föredra, är i akut behov av ”feleliminering”. Vi upptäcker alltså att erfarna läkare kan vara entusiastiska förespråkare av riktlinjer – om de arbetar på institutioner som är inriktade på bredare epidemiologiska perspektiv. Vi upptäcker att vissa erfarna yrkesutövares preferens för sitt eget omdöme i själva verket beror på att de saknar systeminfrastruktur för att genomföra en ny riktlinje. Vi upptäcker att en del relativt nyanställda verkligen tar till sig riktlinjer – men att de gör det på grundval av att de erbjuder autonomi och inflytande, snarare än att de levererar forskningsvisdomar. Vi upptäcker att andra underordnade grupper följer riktlinjer som stöds av forskning helt enkelt för att de är inbäddade i introduktion och utbildning. Vi upptäcker att yrkesverksamma som är välvilligt inställda till nya riktlinjer ofta hindras från att tillämpa systemen eftersom andra intressenter (ofta med mer makt) anser att förändringarna kommer att få skadliga konsekvenser inom deras verksamhetsområden.