Pragmatic trials and implementation science: grounds for divorce?

Daar is inderdaad sprake van. Om verdere marteling van de scheidingsmetafoor van de paper te riskeren, wil ik voorstellen dat de PRCT zijn wegen moet beteren, bemiddeling moet zoeken, en verdere steun moet vragen. Alle programma’s ter verbetering van de onderzoeksopname zijn ontegensprekelijk sociale interventies en bij de evaluatie van dergelijke programma’s bestaat er geen overeengekomen “hiërarchie van bewijsmateriaal” maar veeleer een “bricolage van benaderingen”. De uitvoeringswetenschap heeft, misschien meer dan enig ander domein van de gezondheidszorg, gestreefd naar en gediscussieerd over de optimale aanpak van dergelijke gemengde methoden of hybride ontwerpen. Ik vermijd hier een poging om de paradigmaoorlogen te winnen. Deel 2 neemt een eenvoudiger taak op zich, namelijk voorstellen om de mogelijkheid die PRCT’s bieden op een andere, meer inclusieve manier te gebruiken. Het begint met het schetsen van een onderzoeksstrategie voor het leren van de generaliseerbare lessen van implementatiewetenschap (tabel 1) en eindigt met een kort voorbeeld ter illustratie van de aanpak.

Tabel 1 Evaluatie van generieke implementatiestrategieën

Zo gesteld kan een dergelijke agenda vreselijk abstract overkomen. Daarop reageer ik op twee manieren. Ten eerste heeft deze opvatting over de cumulatie van kennis een aanzienlijke filosofische stamboom. Ten tweede vindt het model praktische toepassing als men het geheel van onderzoek over een interventie bekijkt in plaats van de individuele bijdragen.

Het onderzoeksproces dat in tabel 1 wordt gesuggereerd komt nauw overeen met Popper’s theorie over de groei van wetenschappelijke kennis, die zwaar leunt op het idee van progressieve ‘foutenverwijdering’ (Fig. 2). Toegepast op de implementatiewetenschap, ontvouwt de strategie zich als volgt. Het onderzoek begint met de initiële identificatie van een probleem (P1), in dit geval over het gebrek aan kennisoverdracht. Er wordt een voorlopige programmatheorie (TT1) naar voren gebracht die een oplossing zou kunnen bieden, zoals belichaamd in een bepaald schema om de opname van onderzoek in de praktijk te verbeteren. De regeling wordt aan onderzoek onderworpen en heeft steevast een gemengd succes. Deze bevinding wordt als voorlopig beschouwd en kan in het licht van latere bevindingen worden herzien. Verdere vooruitgang hangt af van de inspectie van zowel de successen als de mislukkingen van het programma, met speciale nadruk op het wegwerken van de fouten (EE1). Dit onderzoek leidt tot een genuanceerder inzicht in het probleem (P2), een verfijnde oplossing (TT2) en meer, al dan niet gunstig, onderzoek. De eliminatie van verdere fouten (EE2) is de aanzet tot voortschrijdende kennis. Het proces herhaalt zich vervolgens oneindig.

Fig. 2
figure2

Popper’s Theorie van de groei van kennis als ‘Conjectures and Refutations’. Bron (auteur)

Is er een proces van vermoedens en weerleggingen binnen de uitvoeringswetenschap? Zoals opgemerkt, zijn veel auteurs geneigd om hun onderzoeksresultaten een onbehoorlijk gevoel van zekerheid, finaliteit en universaliteit mee te geven. Maar tegelijkertijd, als men de voortgang van het onderzoek over de gehele linie bekijkt, valt er een meer voorzichtig en waarheidsgetrouw verhaal te vertellen. Wij wenden ons tot de literatuur voor een illustratie van tabel 1.

Stap één

Urschrijft dat PRCT’s hun opdracht verbreden en multi-method casestudies worden. Het advies om in RCT’s een kwalitatief element op te nemen is volkomen gangbaar, hoewel er meningsverschillen bestaan over de vraag of de verbinding het best tot stand komt door middel van interviews met open vragen, procesevaluatie, analyse van interveniërende variabelen, evaluatie op basis van theorie, realistische evaluatie, enzovoort. In overeenstemming met al deze, zij het zelden zo geformuleerd, is de suggestie dat dergelijke onderzoeken ook als casestudies moeten worden beschouwd, waarbij één van de vele manieren wordt onderzocht waarop dergelijke interventies kunnen worden geconfigureerd.

We hoeven hier niet ver te zoeken naar een voorbeeld, want de PEMs-studie werd inderdaad geflankeerd door een “op theorie gebaseerde procesevaluatie” . Bij deze laatste studie werd gebruik gemaakt van een mix van gestandaardiseerde vragenlijsten en open interviews om de houding van artsen ten opzichte van en hun ervaring met de interventie vast te stellen, en aldus werd een begin gemaakt met de verklaring van het nulresultaat van de PRCT. Kortom, de kwalitatieve studie ontdekt positieve attitudes ten opzichte van retinopathie screening, grondige kennis over de beschikbaarheid ervan, en een sterke intentie om de verwijzingen uit te voeren, die voor en na de interventie bestaat. En toch weten we uit de PRCT dat de doorverwijzingspercentages statisch (en teleurstellend) blijven. De verklaring die uit de open interviews naar voren komt is dat een reeks “post-intentionele” factoren de aangewende bereidheid om door te verwijzen afremt. Deze worden gepresenteerd in de vorm van illustratieve citaten van de ontvangers, die ingaan op een uiteenlopende reeks praktische bezwaren – de voorkeur van artsen voor hun eigen oordeel, uiteenlopende opvattingen over de doeltreffendheid van screening, tijdsdruk en -beperkingen, de administratieve last van doorverwijzing, de desinteresse van sommige patiënten in screening, het feit dat screening door sommige verzekeringen niet wordt gedekt, lange wachttijden en de ontoegankelijkheid van sommige screeningvoorzieningen.

We zien hier voor het eerst een opwaartse spiraal van verklaringen. De rigoureuze PRCT stelt de uitkomst vast, maar kan niet zeggen waarom de interventie ondoeltreffend is. De kwalitatieve ondervraging duikt in een reeks onderliggende processen die aan het werk zijn en laat zien hoe de ervaring van de arts, de voorkeuren van de patiënt en administratieve beperkingen kunnen hebben samengewerkt om de onverwachte uitkomst te genereren. Dit is een zeer plausibele verklaring voor het mislukken van het programma, die echter nog niet kan worden veralgemeend. Er zijn twee belemmeringen.

Ten eerste hebben alle bovengenoemde gegevens (kwantitatief en kwalitatief) betrekking op de specifieke kenmerken van het beheer van de gezondheidszorg en de voorkeuren van diverse groepen belanghebbenden op die plaats en in die tijd. Het blijft een unieke casestudy. Het tweede en interessantere tekort vloeit voort uit een gebruikelijke beperking van dergelijke kwalitatieve analyses, namelijk dat “de analyse van variatie tussen informanttypes niet expliciet wordt gerapporteerd” (, onze cursivering). Dus, heel typisch en zoals in de samenvatting hierboven, produceren Grimshaw et al. een lijst van geassorteerde ’thema’s’ die de vele redenen beschrijven waarom behandelaars de op maat gemaakte richtlijn over het hoofd zien of zich ertegen verzetten. Wat duidelijk is uit hun inhoud, maar wat niet wordt gerapporteerd, is dat deze uiteenlopende reacties op de PEM specifiek zullen zijn voor specifieke subgroepen van praktijken en beroepsbeoefenaren. Slechts sommigen zullen liever op hun eigen oordeel vertrouwen; slechts sommigen zullen administratieve ondersteuning ontberen; slechts sommigen van hun patiënten zullen toegangsproblemen hebben. En zonder de exacte identiteit en de relatieve omvang van deze verschillende groepen te kennen, kunnen we niet weten of hetzelfde nettoresultaat zou worden bereikt in andere settings. We kunnen niet generaliseren.

Samenvattend kan worden gesteld dat het toevoegen van een kwalitatieve beschrijving aan een kwantitatieve beoordeling een uitgebreidere bewijsbasis oplevert om het lot van een interventie te begrijpen, maar dat aanvullende onderzoeksstrategieën nodig zijn om te beoordelen of dat lot zich waarschijnlijk zal herhalen.

Stap twee

Markeert het begin van de strategie om deze bewijsfragmenten beter te ordenen. De sleutel is de invoering van theoretische constructen om de verklarende reikwijdte van dergelijke lokale bevindingen te verruimen. Deze benadering gaat voorbij aan de statistische notie dat generalisatie gebaseerd is op typicaliteit – d.w.z. de bewering dat de bestudeerde interventie “representatief” is voor een grotere populatie van interventies waaruit zij is geput. Het PEM-programma is een complex systeem dat bestaat uit een adaptieve interventie, een locatie, een administratief systeem, een communicatietraject, een patiëntenpopulatie, verschillende lagen van beroepsbeoefenaars, een vorm van financiële regulering, een type gezondheidszorgdienst, enzovoort. Geen enkele studie kan beweren representatief te zijn voor al deze kenmerken.

Het hier voorgestelde alternatief vervangt het ‘programma’ door de ‘programmatheorie’ als basiseenheid van analyse. Programmatheorieën verwijzen naar de basisideeën achter een interventie, de redenering die wordt aangevoerd waarom deze zou moeten werken. Dergelijke theorieën zijn generiek. Zij duiken steeds weer op bij programmaplanning en beleidsvorming (zie Nilsen voor een overzicht van theorieën uit de implementatiewetenschap). Het kenmerk van dergelijke theorieën is dat zij opereren op een abstractieniveau dat verder gaat dan dat van de concrete interventies zoals die welke hier worden onderzocht. Abstractie, of abductie zoals het soms wordt genoemd, is zelf een krachtige bondgenoot van generalisatie. Wij verklaren een bepaalde gebeurtenis als een herkenbaar geval van een bredere categorie gevallen, als een variatie op een thema, waarover wij reeds enige voorkennis hebben. Bestaande kennis levert voorlopige ideeën op over sterke en zwakke punten van die klasse van programma’s, die inzicht verschaffen in wat we kunnen verwachten bij een nieuwe toepassing, welk inzicht vervolgens verder wordt verfijnd bij een nadere inspectie van elke incarnatie van de programmatheorie.

Dus, in plaats van het “2005-Onatario-educational-messages-scheme-to-increase-practitioner-referrals-for-retinal-screening” als eenmalig te beschouwen (wat het is), zien wij het als een nieuw geval van een welbekend idee (wat het ook is). Dus waar is PEMS een geval van? Wat is de aloude programmatheorie? Ik heb natuurlijk geen toegang tot de exacte gedachtegang van degenen die verantwoordelijk zijn voor deze specifieke interventie. Maar er zijn aanwijzingen te over. PEM’s maken deel uit van de “sector van de richtsnoeren voor de klinische praktijk” of van de “gestandaardiseerde zorg”. Het algemene idee is orde en voorspelbaarheid te brengen in het gedrag van beroepsbeoefenaars door gezaghebbende “herinneringen”, “updates”, “protocollen”, “bulletins”, “voortgezette beroepsopleiding” te verstrekken. In alle gevallen is de boodschap het medium. De onderliggende veronderstelling, de gemeenschappelijke interventietheorie, is heel eenvoudig, namelijk dat – goed geïnformeerde, goed gekwalificeerde beroepsbeoefenaren in de gezondheidszorg zullen reageren op, en trachten zich te houden aan, professioneel bekrachtigde, evidence-based informatie.

Het cruciale punt is, nogmaals, dat we al heel veel weten over deze theorie en haar diepgaande beperkingen. Informatie mag dan wel de nodige geloofsbrieven hebben, maar op papier is autoriteit zelden in staat om diepgewortelde persoonlijke voorkeuren, tijdsdruk, bestaande routines en institutionele beperkingen tegen te gaan. Ironisch genoeg keren de bevindingen van de talloze studies die ons vertelden over de vele redenen waarom mensen uit de praktijk geen formele onderzoekspublicaties lezen, en die verantwoordelijk waren voor de invoering van de implementatiewetenschap, terug in een implementatieschema dat probeert mensen uit de praktijk aan zich te binden met op maat gesneden, rechtstreeks per e-mail verstuurde, bewijskrachtige bulletins. We hadden niet verbaasd moeten zijn. Zelfs als het aangeboden advies in ruime mate wordt aanvaard, zullen sommige beroepsbeoefenaars er geen acht op slaan omdat de dagelijkse externe aspecten van hun werk blijven overheersen.

Dit brengt ons bij het volgende kenmerk van een programmatheoretische benadering. Deze theorieën zijn, net als de interventies die zij onderbouwen, broos en feilbaar. Wij weten dus veel over de “richtlijntheorie” omdat zij, in tal van toepassingen, is uitgeprobeerd en tekortgeschoten. Op dezelfde manier als we de ideeën die aan een interventie ten grondslag liggen abstraheren, moeten we dus ook verder bouwen aan programmatheorieën die abstracte hypothesen verschaffen over de voorwaarden die verantwoordelijk zijn voor succes of mislukking. Beleidsmakers hebben één stel ideeën over een programma, die vaak worden geconfronteerd met de heel andere ideeën van de mensen uit de praktijk. Het kenmerk van de programmatheoretische benadering is dat deze uitgaat van gemengde uitkomsten. In het onderhavige geval is het de taak theorieën te construeren over welk type van beroepsbeoefenaars in welk type van praktijk, waarschijnlijk de begeleiding in acht zal nemen (of negeren).

Hoewel het de bedoeling is ze te behandelen als abstracte, formele hypothesen, is er niets esoterisch of erudiet aan dergelijke theorieën.Voetnoot 1 Als men bijvoorbeeld teruggrijpt op het kwalitatieve deelonderzoek van Grimshaw et al. naar de reacties op de retinopathie PEM , dan zijn er verschillende impliciete en niet geteste hypothesen die suggereren welke artsen en welke praktijken verschillende reacties zouden kunnen hebben. Bijvoorbeeld, het eenvoudigste van de vele thema’s die aan het licht kwamen voor het niet volgen van de op maat gemaakte richtlijnen is misschien “vertrouwen in hun eigen klinische beoordeling”. Welke subgroep van beroepsbeoefenaars zou zo redeneren? Een elementaire hypothese is dat het een reactie is die groeit met de ervaring van de beroepsbeoefenaar, een stelling die vervolgens empirisch zou kunnen worden getest met een vergelijking van de verandering in verwijzingspercentages tussen ‘veteranen’ en ‘nieuwkomers’.

Het echte punt van het behandelen van deze ‘ervaringshypothese’ als een programmatheorie is dat we er voorkennis van hebben. We weten uit een groot aantal studies dat de naleving van richtlijnen suboptimaal is. We hebben dus een solide verwachting dat een ‘ervaringsdifferentiatie’ zou kunnen opduiken als probleem in de duizenden andere richtlijnen die bestaan voor elke aandoening, test en behandeling. Maar wat we niet weten is de manier waarop ervaring een verschil maakt. Ervaring is meer dan het aantal jaren dat een behandelaar in het harnas zit. Ervaring brengt ook autonomie met zich mee, anciënniteit, managementverantwoordelijkheden, professionele verplichtingen, specialistische kennis, toenemende vertrouwdheid met aandoeningen, met patiënten en met “het systeem”, enzovoort. Er zullen altijd subtiele variaties zijn in wat “ervaring” is en door het idee en de nasleep ervan te volgen aan de hand van een reeks casestudies kunnen we een inzicht verwerven in de uiteenlopende gevolgen ervan. Theorieën zijn er om te worden getest en verfijnd, opnieuw getest en opnieuw verfijnd – en het is uit dit proces dat generalisatie ontstaat.

Stap drie

Dus hoe moeten programmatheorieën worden getest? Een cruciale stap hier is het veranderen van de nadruk op wat de verklarende factor is in proefonderzoek. Alle KT-interventies hebben gemengde resultaten en het verklaren van de veelvormigheid zou het hoofddoel moeten zijn. De analytische nadruk moet liggen op “uitkomstenpatronen” in plaats van “uitkomsten” of op “heterogene effecten” in plaats van “netto-effecten” . Dit voorstel heeft heel wat weerstand opgeroepen. Het standaardmodel, zelfs na de komst van het pragmatisme, is het vergelijken van uitkomsten in behandelde en onbehandelde groepen, waarbij de PRCT voldoende statistisch vermogen moet hebben om op betrouwbare wijze een netto-effect te detecteren als basis voor het testen van wat nog steeds wordt gezien als de fundamentele uitkomstvraag – heeft de interventie “gewerkt”? Steeds vaker wordt kwalitatief onderzoek toegevoegd om een samengesteld beeld te krijgen van de gedachtegang van de belangrijkste begunstigden, die mogelijk tot het waargenomen effect hebben bijgedragen.

Dit model is blijven bestaan ondanks een aanzienlijke klinische literatuur die aantoont dat er, bijna zonder uitzondering, binnen de ‘behandelde populatie’ proefpersonen zijn die meer en minder baat bij de interventie hebben. Het gezond verstand dat behandelingen niet bij iedereen werken wordt in klinische termen omschreven als heterogeniteit van behandelingseffecten (HTE) en de implicaties ervan zijn aanzienlijk, zoals in dit beroemde citaat van Kravitz et al.

‘Wanneer HTE aanwezig is, kan het bescheiden voordeel dat aan veel behandelingen wordt toegeschreven misleidend zijn, omdat bescheiden gemiddelde effecten een mengeling kunnen weerspiegelen van aanzienlijke voordelen voor sommigen, weinig voordeel voor velen en schade voor enkelen’.

Deze stelling heeft nog meer waarde als we kijken naar de opzet van pragmatische trials. Zelfs in de derde fase van het onderzoek naar de werkzaamheid van geneesmiddelen, waarbij de in- en exclusiecriteria zeer zorgvuldig zijn afgebakend en waarbij een groot aantal controles wordt uitgevoerd, is er sprake van VTE. Het idee zelf van pragmatische proeven is onderzoek in reële omgevingen waarin dergelijke controles worden versoepeld. Op elke dimensie van de PRECIS-grafiek zal er sprake zijn van ingebouwde, inputvariatie. Hieruit volgt dat HTE bijzonder prominent is in PRCTS, juist door hun opzet, een enorm diepgaande maar grotendeels genegeerde observatie die voor het eerst werd gedaan door Segal et al. De betekenis van het samenvattend resultaat, het netto behandelingseffect, wordt daardoor kleiner. In het geval van sociale programma’s zoals PEMS, kan het gemiddelde en nul-behandelingseffect wel eens, om Kravitz te parafraseren, een weerspiegeling zijn van een voorlichtingscampagne die op bepaalde beroepsbeoefenaars een aanzienlijke invloed heeft gehad, door anderen niet is opgemerkt en voor enkelen als een hinderlijke ontmoediging heeft gefungeerd.

Een dergelijke eventualiteit heeft de neiging over het hoofd te worden gezien bij PRT’s in het algemeen en in ons specifieke voorbeeld van de PEMS-proef. De prioriteit van de onderzoekers is altijd de interne validiteit te beschermen door er door middel van randomisatie voor te zorgen dat er een evenwicht is tussen de kenmerken en potentiële predisposities van de experimentele en de controlegroep. Vanuit dit oogpunt melden Zwarenstein e.a. een bevredigend nauwe overeenkomst tussen experimentele en gecontroleerde praktijken wat betreft “geslachtssamenstelling”, “opleidingsplaats”, “grootte van de praktijk”, en inderdaad in ons voorbeeld, “ervaringsjaren van de beroepsbeoefenaars”. Het feit dat deze en andere kenmerken van de begunstigden gelijk verdeeld zijn over de experimentele en de controlepraktijken betekent niet dat de omstandigheden die zij weerspiegelen geen invloed hebben op de vraag of onderwijsupdates worden opgevolgd. Het laat nog steeds de mogelijkheid open dat er aanzienlijke subgroep- en subprocesverschillen zijn in de respons op de begeleiding die, zoals in het scenario van Kravitz, in het netto-effect onopgemerkt kunnen blijven.

Deze eventualiteit kan worden onderzocht door de uitkomsten in verschillend samengestelde groepen te identificeren en te vergelijken. Kwalitatieve analyse kan belangrijke aanwijzingen geven over deze waarschijnlijke predisposities. Maar ook hier wordt de prijs van het begrijpen van heterogene uitkomsten vaak niet waargemaakt vanwege een nogal verschillende traditie in deze vorm van onderzoek. Kwalitatieve analyse heeft lange tijd een ‘dikke beschrijving’ gekoesterd. Net als in het deelonderzoek van Grimshaw wordt ernaar gestreefd, vaak via thematische analyse, het hele scala van attitudes ten aanzien van het programma vast te leggen. De bedoeling van veel kwalitatieve analyses is om veelomvattend te zijn in plaats van analytisch. Het doel is eerder “verzadiging” te bereiken in de beschrijving van de attitudes van de proefpersonen dan door te dringen tot de gedragsgevolgen van de diverse attitudes.

De onvermijdelijkheid van onregelmatige effecten bij interventies die in de implementatiewetenschap worden onderzocht, verandert de onderzoeksvraag. Het uiteindelijke doel is niet om uit te maken of interventies werken. Wat veeleer moet worden onderzocht, begrepen, geadviseerd en benut is hun differentiële impact.

Stap vier

Na te hebben gespeculeerd over een herziene agenda voor de implementatiewetenschap, namelijk het onderzoeken van de veelvoudige contingenties die bijdragen tot het succes en falen van programmatheorieën, rest ons nog een uiteenzetting te geven over de onderzoeksontwerpen die deze taak kunnen volbrengen. Ik heb reeds gepleit voor een theoriegedreven aanpak waarbij gebruik wordt gemaakt van opeenvolgende of reeksen studies en van een gemengde methodologie. Het is duidelijk dat er een reeks prospectieve en retrospectieve ontwerpen zijn die aan deze eisen voldoen. Maar wat ik hier wil benadrukken zijn twee eenvoudige analytische strategieën die de sleutel vormen in de zoektocht naar generaliseerbaar bewijs.

In de volkstaal van het case study onderzoek worden deze strategieën aangeduid als ‘within-case’ en ‘cross-case’ analyse. Hoe kunnen deze worden ingezet bij het onderzoek naar richtlijntheorie? In het eerste geval worden verschillende subgroepen van de ontvangers van een richtlijn geïdentificeerd, worden verschillen in hun predisposities ten opzichte van en resulterend gedrag ten aanzien van het advies verondersteld, en worden gegevens gegenereerd om deze vermoedens te toetsen. Het bereiken van richtlijnadherentie heeft echter niet alleen te maken met de betrokken mensen, maar ook met hun rollen, hun netwerken, hun organisaties en de bredere regelgevende omgeving waarin zij werken. Om deze invloeden te ontrafelen is cross-case onderzoek nodig, waarbij de vergelijkingen zo zijn gekozen dat ze de uitkomsten weerspiegelen die kunnen worden gegenereerd op verschillende institutionele locaties waar de richtlijn wordt toegepast.

Het leerproces neemt toe als deze analytische snedes achtereenvolgens worden toegepast. Bestaande kennis van de sterke en zwakke punten, de winnaars en de verliezers, van eerdere incarnaties van de programmatheorie worden ingebouwd in de keuze van comparatoren in onderzoek 1. Sommige van deze hypothesen zullen worden ondersteund en andere zullen worden weerlegd. Dit vormt de aanleiding voor onderzoek 2, waarin de programmatheorie wordt herzien en de vergelijkingsgroepen worden aangepast in een poging om de heterogeniteit van de uitkomsten te verklaren. Herziene programmatheorieën blijven kwetsbaar. Zij stuiten op conformiteiten en anomalieën, en het onderzoek wordt voortgezet met meer case studies in een poging deze glad te strijken (herinner aan Fig. 2).

Dit completeert een blauwdruk van een mixed-method strategie voor het evalueren van generieke implementatiestrategieën. Net als klinische richtlijnen hebben methodologische voorschriften alleen betekenis als ze in de praktijk worden toegepast. Dit brengt mij tot de laatste smeekbede in een paper vol smeekbedes, namelijk om het groeiende gebruik van within-case en cross-case analyse in de implementatiewetenschap te verwelkomen. Ik heb hier alleen de ruimte om vier korte voorbeelden te schetsen die het pleidooi voor multi-site, mixed-method, theory-driven case studies illustreren. Deze illustraties gaan verder waar de vorige voorbeelden ophielden, namelijk met onze aanvankelijke en zeer feilbare programmatheorie dat zorgverleners zullen reageren op professioneel onderschreven, evidence-based richtlijnen en onze first-guess, common-sense implementatietheorie dat ‘practitioner experience’ een verschil zal maken in de toepassing ervan.

Grove et al. onderzoeken reacties van orthopedische chirurgen op NICE richtlijnen voor totale heupprothese in drie NHS ziekenhuizen. Deze senior clinici reageerden op de richtlijnen op zeer verschillende manieren afhankelijk van de setting. In casus A, een academisch centrum in een trauma- en orthopedische afdeling, hadden de chirurgen een “positieve kijk op formele, gecodificeerde kennis”, waren ze “gewend om vragen te beantwoorden met gebruikmaking van een referentiekader voor een grotere populatie” en stelden ze hun “eigen protocoldocumentatie op, gekoppeld aan een stuk klinische begeleiding”. Casus C, een orthopedische afdeling in een academisch ziekenhuis, zorgde voor het extreme contrast, met chirurgen die meldden dat ze “nooit het NICE-proces van hun organisaties hadden gezien”, dat “behoorde tot het bestuurlijke en administratieve domein”. Hier gaven chirurgen de voorkeur aan “veerkrachtige, ervaringskennis die in de loop van de tijd is opgebouwd”, gebaseerd op “het aangeboren gevoel van chirurgie”. Ervaring drijft deze senior clinici in tegengestelde richtingen – afhankelijk van de context.

Rycroft-Malone et al. onderzochten de reacties op ‘geprotocolleerde zorg’ in een multi-case studie over verpleegkunde, vroedvrouwen en gezondheidsvisite, etc. De instrumenten stuitten op zeer uiteenlopende reacties. In overeenstemming met onze primitieve hypothese melden de auteurs dat de beroepsbeoefenaars met meer ervaring “er ofwel niet naar verwezen ofwel ze flexibel gebruikten”. Ook, zoals in de thesis wordt gesteld, beschouwden de beroepsbeoefenaars in opleiding de protocollen als “nuttige informatiebronnen”. Maar er zijn een paar belangrijke wendingen. In sommige contexten wordt de autoriteit die richtlijnen uitstralen als versterkend ervaren. De standaardisatie van wat een goede praktijk is, “maakte de uitbreiding van traditionele rollen mogelijk en vergemakkelijkte autonome praktijken, wat op zijn beurt resulteerde in meer door verpleegkundigen en vroedvrouwen geleide zorg en diensten”. In contexten waar het personeel vaak wisselde of gebruik maakte van uitzendkrachten werden de richtsnoeren daarentegen opgenomen in het introductiemateriaal en de competentiebeoordelingen. In deze situaties volgt een relatief hoge mate van adherentie uit het feit dat de richtlijn werd ingelijfd en gecoacht.

Moule et al. evalueerden een kwaliteitsverbeteringsprogramma waarin NICE-richtlijnen over het gebruik van anticoagulantia ter vermindering van beroertes door atriumfibrilleren (AF) in zes huisartsenpraktijken in het Verenigd Koninkrijk waren opgenomen. De middelen werden wisselend gebruikt. Opnieuw bleken de ervaring van de huisarts en vooringenomen ideeën belangrijk – maar met verdere variaties op het thema. In dit geval namen enkele van de meest ervaren praktijkhouders met persoonlijke expertise de leiding van het schema op zich en hielpen ze de begeleiding om te zetten in een schema voor evaluatie en follow-up. In andere praktijken, waar de huisarts vaak geïsoleerd werkte, ontbrak het aan de “systeem-mentaliteit” om patiënten te kunnen volgen en opvolgen. In deze gevallen was het vertrouwen op ervaring en persoonlijk oordeel voor een groot deel te wijten aan een gebrek aan formele infrastructuur om de richtlijnen te dienen.

Spyridonidis en Calnan gebruikten een longitudinale, within-case en cross-case vergelijking om te evalueren hoe de implementatie van twee NICE-richtlijnen, over chronisch hartfalen (CHF) en zwaarlijvigheid, zich in de loop van de tijd ontvouwde. De nadruk ligt op de aanpassing van het hele systeem aan de richtlijnen en daarom onderzochten zij de perspectieven van professionele leidinggevenden, senior en middle managers, ziekenhuisartsen, huisartsen, verpleegkundigen en professionals uit de overige gezondheidszorg. De richtsnoeren worden, zoals altijd, “verschillend” gevolgd; de tenuitvoerlegging ervan schommelt “heen en weer” naarmate verschillende belanghebbenden nadenken over de rivaliserende gevolgen. Een van de opties in de NICE-richtlijn over obesitas was bijvoorbeeld bariatrische chirurgie. Na een toename van het aantal verwijzingen naar bariatrische ingrepen, herschreef het management snel de richtlijn om een dure procedure te rantsoeneren. In een ander voorbeeld werd in de NICE-richtlijn over hartinsufficiëntie het gebruik van bètablokkers aanbevolen, die niet waren opgenomen in een andere NHS-regeling, het Quality and Outcomes Framework (QOF), dat huisartsen beloont voor het voldoen aan een reeks prestatie-indicatoren. De tenuitvoerlegging van de NICE-aanbeveling stagneerde in afwachting van convergentie tussen de respectieve beleidslijnen.

Veel, veel meer van dergelijke casestudies zouden natuurlijk kunnen worden geraadpleegd om een beter inzicht te krijgen in de grillige toepassing van de richtlijnen.Voetnoot 2 Het punt is dat door te beginnen met een relatief abstracte programmatheorie, in plaats van een woud van afzonderlijke initiatieven, een onderzoeksprogramma van within-case en between-case studies een begin kan maken met het ontsluiten van de variaties in uitkomsten die routinematig volgen op de implementatie van richtlijnen. In het onderhavige geval begon ik dus met de ruwe implementatietheorie dat junior personeel meer geneigd was professioneel goedgekeurde richtlijnen te respecteren, terwijl ervaren beroepsbeoefenaars meer geneigd waren op hun eigen oordeel te vertrouwen. Deze theorie zit vol gaten of heeft, zoals Popper zou verkiezen, dringend behoefte aan “fouteneliminatie”. Zo ontdekken we dat ervaren beroepsbeoefenaars enthousiaste exponenten van richtlijnen kunnen zijn – als ze werken in instellingen die gericht zijn op bredere epidemiologische perspectieven. We ontdekken dat de voorkeur van sommige veteranen voor hun eigen oordeel in werkelijkheid voortkomt uit hun gebrek aan systeeminfrastructuur om een nieuwe richtlijn te implementeren. We ontdekken dat sommige relatief junior medewerkers inderdaad richtlijnen omarmen – maar dit doen op basis van het feit dat ze autonomie en empowerment bieden, in plaats van het leveren van onderzoekswijsheid. We ontdekken dat andere ondergeschikte groepen door onderzoek ondersteunde richtlijnen volgen, simpelweg omdat ze zijn ingebed in inductie en training. We ontdekken dat praktijkmensen die positief staan tegenover nieuwe richtlijnen, vaak worden tegengewerkt bij het toepassen van de regelingen omdat andere belanghebbenden (vaak met meer macht) menen dat de veranderingen schadelijke gevolgen zullen hebben in hun operationele sferen.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.