Citeerwijze van dit artikel:
Tom Weijnen, ‘Effectmeting bij veldexperimenten; Lessen uit de gezondheidszorg’, 2012, april-juni, DOI: 10.5553/Beleidsonderzoek.000003

DOI: 10.5553/Beleidsonderzoek.000003

Beleidsonderzoek OnlineAccess_open

Article

Effectmeting bij veldexperimenten; Lessen uit de gezondheidszorg

Auteurs
DOI
Toon PDF Toon volledige grootte
Samenvatting Auteursinformatie Statistiek Citeerwijze
Dit artikel is keer geraadpleegd.
Dit artikel is 0 keer gedownload.
Aanbevolen citeerwijze bij dit artikel
Tom Weijnen, 'Effectmeting bij veldexperimenten; Lessen uit de gezondheidszorg', Beleidsonderzoek Online april 2012, DOI: 10.5553/Beleidsonderzoek.000003

  In een veldexperiment worden gegevens over de kosten en effecten van een bepaalde interventie verzameld bij personen die onderwerp zijn van de interventie. Kenmerkend is dat het onderzoek bestaat uit ten minste twee groepen van deelnemers.

Dit artikel wordt geciteerd in

  • Veldexperimenten

   In een veldexperiment worden gegevens over de kosten en effecten van een bepaalde interventie verzameld bij personen die onderwerp zijn van de interventie. Kenmerkend is dat het onderzoek bestaat uit ten minste twee groepen van deelnemers. Eén groep die de interventie ondergaat en één controlegroep van deelnemers die helemaal vergelijkbaar is met de interventiegroep en die de interventie niet ondergaat (Kooreman & Potters, 2011).1xZie bijvoorbeeld het werk van de MIT-econome Esther Duflo, die veldexperimenten toepast bij onderzoek naar de effectiviteit van ontwikkelingshulp. In beginsel worden deelnemers door toeval aan een van de twee groepen toegewezen. Deze randomisatie garandeert dar er vooraf geen systematisch verschil bestaat tussen de groepen. Dit maakt dat de gevonden verschillen kunnen worden toegeschreven aan de interventie. Een ander kenmerk van een veldexperiment is dat deelnemers aan het onderzoek worden geobserveerd in hun natuurlijke omgeving. Volgens Kooreman en Potters hebben de resultaten van veldexperimenten daardoor vaak een grote overtuigingskracht (Kooreman & Potters, 2011: 78) Een veldonderzoek, met het meest strenge onderzoeksdesign, is een gerandomiseerd, dubbelblind, placebogecontroleerd onderzoek naar de effecten van een bepaald medicijn. Gerandomiseerd wil zeggen dat personen die aan bepaalde voorwaarden voldoen, worden toegelaten tot het onderzoek en daarna per toeval worden toegewezen aan de interventiegroep of aan de controlegroep. Dubbelblind betekent vervolgens dat noch de verstrekker van het medicijn noch de patiënt weet in welke groep de patiënt zit. En placebogecontroleerd wil zeggen dat de controlegroep in plaats van het echte medicijn een placebo krijgt, maar de behandelaar en de patiënt weten dus niet of de patiënt een placebo krijgt of het werkelijke medicijn. De code van de toewijzing aan een van de twee groepen wordt pas verbroken aan het eind van het onderzoek.

   Deze als ‘gouden standaard’ aangemerkte onderzoeksopzet voor een veldexperiment is alleen goed mogelijk bij medicijnonderzoek. Placebocontrole en het dubbelblind uitvoeren zijn typische kenmerken van medicijnonderzoek. Heel veel veldexperimenteel onderzoek wijkt in meer of mindere mate af van dit ideaaltype, omdat het uit de aard van de te onderzoeken interventie niet mogelijk is deze opzet te volgen.

   Quasi-experimenteel onderzoek

   In een quasi-experimenteel onderzoek wordt niet gerandomiseerd en het onderzoek wordt niet dubbelblind uitgevoerd. Wel wordt een groep deelnemers die een specifieke interventie ondergaat, vergeleken met een controlegroep zonder interventie. De toewijzing van deelnemers aan de groepen is dus niet willekeurig. Toch moet gegarandeerd zijn dat de groepen op een aantal relevante kenmerken vergelijkbaar zijn. De vergelijkbaarheid heeft vaak betrekking op leeftijd, geslacht, opleiding en aard van de problematiek, bijvoorbeeld duur van de werkloosheid.

   Er zijn verschillende methoden om in een quasi-experimenteel onderzoek de experimentele en de controlegroep samen te stellen. Er kunnen bijvoorbeeld twee zogenoemde post-hoc groepen worden gevormd. Informatie uit een groot bestand met individuele gegevens over de interventies en achtergrondkenmerken wordt gebruikt om groepen te formeren die op relevante kenmerken vergelijkbaar zijn. Ook kan worden gekozen voor een gepaarde opzet. Voor iedere deelnemer aan het onderzoek die de interventie ondergaat, wordt een vergelijkbare deelnemer gezocht die geen interventie ondergaat. Een gepaarde opzet kan worden uitgevoerd op basis van reeds verzamelde data, maar beter is het om de data specifiek voor het onderzoek te verzamelen. Dan kan meestal worden volstaan met lagere aantallen deelnemers aan het onderzoek.

   Als illustratie van een quasi-experimenteel onderzoek wordt een studie besproken naar de kosten en effecten van hulphonden bij mensen met ernstige fysieke beperkingen (Diepenhorst, 2011). Dit hulphondenonderzoek betrof een gepaard onderzoek, waarbij de aanmeldingen voor de controlegroep werden gescreend. Hierdoor werd bereikt dat de aard en mate van de fysieke beperkingen in de experimentele en de controlegroep in hoge mate vergelijkbaar waren.

   Hulphonden assisteren mensen met ernstige fysieke beperkingen bij de zogenoemde activiteiten van het dagelijks leven. Ze kunnen bijvoorbeeld deuren open en dicht doen, kleding uit de kast halen, helpen bij het boodschappen doen, helpen bij aan- en uitkleden en bij de persoonlijke verzorging. Dit maakt mensen zelfstandiger en bevordert dat ze actiever kunnen participeren in het dagelijkse leven.

   Hulphonden worden voor een deel vergoed door de ziektekostenverzekering. In die zin kan de hulphond worden opgevat als een medische voorziening. De hulphond is geen ‘cure’-voorziening die gericht is op genezing; het is een ‘care’-voorziening, gericht op verzorging. Veldexperimenten met ‘care’-voorzieningen worden nog maar in beperkte mate uitgevoerd, terwijl het vaak kostbare voorzieningen betreffen die een substantieel deel van de totale zorgkosten veroorzaken. Juist omdat het om chronische aandoeningen gaat.

   In dit artikel wordt getoond dat de methodiek van een kosten-utiliteitsanalyse uit de ‘cure’-sector ook kan worden toegepast op ‘care’-voorzieningen. Het gaat hierbij om de toepasbaarheid van de algemene effectmaat: de kwaliteit-van-levenmeting. Daarna wordt betoogd dat de ervaringen met het gebruik van deze effectmaat ook betekenis hebben voor veldexperimenten buiten de gezondheidszorg. Tot slot worden enige voorbeelden besproken van toepassingen van algemene effectmaten die worden samengevat onder de termen geluksmeting of meting van subjectief welbevinden.

  • Economische evaluaties

   Hoofdeffecten van interventies in de gezondheidszorg zijn niet of moeilijk in geld uit te drukken. Dat maakt kosten-batenanalyses niet geschikt voor de evaluatie van deze interventies. Daarom worden kosten-effectiviteitsanalyses (KEA) en kosten-utiliteitsanalyses (KUA) toegepast. Deze soorten van evaluatieonderzoeken hebben met elkaar gemeen dat ze de kosten van een voorziening in ogenschouw nemen in relatie tot de baten of de effecten van een voorziening. De opbrengstenkant van de interventie wordt daarbij op verschillende wijzen in kaart gebracht. Bij een KEA worden de opbrengsten beschreven door een effectmaat die specifiek is voor de interventie. Bij de KEA van een nieuwe spoorweg bijvoorbeeld kan de effectmaat het toegenomen aantal treinreizigerkilometers zijn. Kosten-effectiviteitsanalyses met de voorzieningspecifieke treinreizigerskilometers als effectmaat kunnen onderling worden vergeleken. In een KUA wordt als opbrengstmaat de meer algemene kwaliteit-van-levenindex gebruikt, die geldigheid heeft voor verschillende soorten van interventies. Via deze gezondheidgerelateerde kwaliteit-van-levenindex kan de effectiviteit van een gezondheidszorgvoorziening die pijn bestrijdt, worden vergeleken met een voorziening die als hoofdeffecten niet alleen pijn bestrijdt, maar ook de mobiliteit bevordert.

   Kwaliteit van leven als effectmaat

   In kosten-utiliteitsstudies in de gezondheidzorg wordt een effectmaat gebruikt die bestaat uit twee delen:2xBaanbrekend hier is het artikel van de Engelse econoom Alan Williams: ‘Economics of coronary artery bypass grafting’ uit 1985. Alan Williams stond ook aan de wieg van de ontwikkeling van het QALY-begrip en de ontwikkeling van een van de belangrijke kwaliteit-van-leveninstrumenten. Bij zijn overlijden in 2005 schreef de BMJ: ‘economist who transformed the delivery of health care to patients’. het aantal levensjaren dat met een interventie wordt gewonnen en de gezondheidgerelateerde kwaliteit van leven van deze gewonnen levensjaren. Combinatie van deze twee delen levert de voor kwaliteit gecorrigeerde gewonnen levensjaren op (QALY: Quality Adjusted Life Years). De gezondheidgerelateerde kwaliteit van leven is een index van de bijdragen van een aantal relevante dimensies aan deze kwaliteit van leven.

   De instrumenten om de kwaliteit van leven te meten maken een onderscheid tussen een beschrijving van de situatie en de waardering van deze situatie. Op het beschrijvend gedeelte van het meetinstrument geven respondenten een gestandaardiseerde score op een bepaalde dimensie van de kwaliteit van leven. Om de algemene kwaliteit-van-levenmeting in een index uit te drukken worden de scores op de dimensies vermenigvuldigd met waarderingen.

   Dit zijn dimensieloze getallen die in apart onderzoek worden vastgesteld bij het algemene publiek (Dolan,1997) Meestal wordt de index uitgedrukt op een schaal van 0 tot 100.

   Er zijn maar enkele kwaliteit-van-leveninstrumenten waarvan de gezondheidsindex voldoet aan de eisen die vanuit de economische theorie worden gesteld voor gebruik in een KUA. Een van de meest toegepaste instrumenten is de Europese EQ5D (The Euroqol Group, 1990; Brooks, 1996). In de kosten-utiliteitsanalyse van de hulphonden is de EQ5D ook toegepast.

   De kracht van dit instrument is dat het een eenvoudig instrument is. Hierdoor komt het echter nogal eens voor dat kleine gezondheidsveranderingen niet worden opgepikt door het instrument. Dat was ook het geval in het hulphondenonderzoek. Er werden geen significante verschillen gevonden op de gezondheidsindex tussen de hulphonden- en de controlegroep.

   In het onderzoek was dit probleem voorzien en werd naast de EQ5D het meer ziektespecifieke instrument van de Dutch London Handicap Scale (DLHS) toegepast. Zoals de naam al aangeeft, is deze vragenlijst specifiek bedoeld voor mensen met een fysieke handicap. De Nederlandse versie van de DLHS is een gevalideerde vertaling van het oorspronkelijke Engelse instrument (Groothuis-Oudshoorn et al., 2006). Het mooie is dat het onderzoek van Groothuis-Oudshoorn een waarderingsset heeft opgeleverd waarmee voor de DLHS een gezondheidsindex kan worden berekend.

  • Resultaten kwaliteit-van-levenmeting

   De EQ5D heeft vijf dimensies waarop gescoord kan worden dat men 1: geen problemen heeft; 2: enige problemen heeft; of 3: veel problemen heeft. In figuur 1 worden de scores op de vijf dimensies van de EQ5D uit het hulphondenonderzoek getoond. Van deze scores is het gemiddelde weer te geven. Hoe lager de gemiddelde score hoe beter.3xDe interpretatie van deze gemiddelden is overigens beperkt tot een samenvatting van de scores. De gemiddelden zijn opgebouwd uit ordinale variabelen en kunnen dus niet worden gezien als een waarderingsmaat voor scores op de dimensies. De scores laten zien dat de hulphondengroep slechter scoort op de dimensies ’mobiliteit’ en ’pijn/klachten’, ongeveer gelijk scoort op de dimensie ‘zelfzorg’ en beter scoort op ‘dagelijkse activiteiten’ en ‘stemming’. De verschillen op de dimensies zijn echter niet significant.

   /xml/public/xml/alfresco/Periodieken/Beleidsonderzoek/BELEIDSONDERZOEK-D-12-00004_4_2012

   1 De gemiddelde scores op de EQ-5D dimensies; scoringsmogelijkheden van 1: geen problemen tot 3: ernstige problemen

   De DLHS kent zes dimensies van kwaliteit van leven. Op deze dimensies kan worden gescoord van 1 tot en met 6, waarbij 1 betekent dat helemaal geen beperkingen worden ondervonden en 6 betekent dat de respondent helemaal beperkt is. Dus hoe hoger de score, hoe hoger de beperking.

   /xml/public/xml/alfresco/Periodieken/Beleidsonderzoek/BELEIDSONDERZOEK-D-12-00004_4_2012

   2 DLHS; gemiddelde scores per dimensie; scoremogelijkheden van 1: helemaal geen beperkingen tot 6: helemaal beperkt
   * Significant verschil op 5% niveau.

   Op bijna alle dimensies van de DLHS ondervindt de hulphondengroep minder beperkingen dan de controlegroep, zoals blijkt uit figuur 2. De verschillen tussen de hulphondengroep en de controlegroep zijn voor alle dimensies behalve ‘geld’ significant. Anders dan bij de EQ5D geeft de mobiliteitsdimensie hier wel een significant verschil ten gunste van de hulphondengroep. Zeer waarschijnlijk wordt dit veroorzaakt door de vraagstelling van de EQ5D op dit onderdeel, die erg gericht is op de ‘cure’-sector’.4xIn een nieuwe versie van de EQ5D is de vraagstelling op dit punt aangepast. Dit komt de toepas-baarheid van de EQ5D in de ‘care’-sector ten goede.

   De figuren 1 en 2 leveren profielen op van kwaliteit-van-levenverschillen tussen de interventie- en controlegroep. Op basis van zo’n profiel is het lastig om te bepalen of de interventie bijdraagt aan een betere kwaliteit-van-leven. Bij tegengestelde resultaten op de dimensies is dit zelfs onmogelijk. Om tot een algemeen oordeel te komen moeten de scores op de dimensies worden geaggregeerd tot één index. Bij de EQ5D en de DLHS is het mogelijk deze aggregatie uit te voeren door toepassing van een set van waarderingsgetallen, die in apart waarderingsonderzoek zijn vastgesteld bij het algemene publiek.

   Een belangrijk voordeel van zo’n index is dat deze kan worden gebruikt om de kosten van een voorziening tegen de effecten af te zetten door middel van de berekening van de kosten-effectiviteitsratio. Dit wordt in de volgende paragraaf en in tabel 1 getoond met behulp van cijfers uit het hulphondenonderzoek. Omdat alleen voor de index van de DLHS een significant verschil is gevonden tussen de hulphondengroep en de controlegroep, is hiervoor de index van de DLHS gebruikt.

  • Kosten gerelateerd aan effecten

   Kostenverschillen

   De kostenstudie in het hulphondenonderzoek werd uitgevoerd vanuit een breed maatschappelijk perspectief. Naast de investeringskosten voor de hulphond en de dagelijkse kosten van de hond in de hulphondengroep zijn de relevante zorgkosten waargenomen bij de hulphondengroep en de controlegroep. Ook de kosten van mantelzorg werden in het onderzoek betrokken. Deze kosten werden berekend op basis van wetenschappelijk onderzoek naar de monetaire waarde van mantelzorg (Van den Berg & Ferrer-I-Carbonell, 2007). Met deze waarnemingen werden verschillen in zorgkosten bepaald tussen de hulphondengroep en de controlegroep.

   De hulphondengroep heeft per jaar in totaal ruim € 10.000 lagere zorgkosten dan de controlegroep. Hiervan valt ruim € 4.500 binnen de gezondheidszorg en € 5.800 heeft betrekking op de mantelzorg. Het voordeel in de mantelzorgkosten is significant verschillend van nul. Daarom is in de onderstaande afweging van kosten en effecten alleen rekening gehouden met deze kosten buiten de gezondheidszorg.

   De hulphond kost ruim € 1.800 per jaar aan dagelijkse kosten. De jaarlijkse kosten zijn in de hulphondengroep dus € 4.000 lager dan in de controlegroep. Dit jaarlijkse kostenverschil is gedisconteerd over een effectieve gebruiksduur van de hond van acht jaar. Het resulterende totale voordeel van € 26.628 wordt afgetrokken van de investeringskosten voor de hulphond. Gerekend over de hele gebruiksduur van de hond zijn de gemiddelde totale kosten in de hulphondengroep € 4.576 hoger dan in de controlegroep.

   1Onderzoeksthema’s in rekenkamerrapporten 2008 en 2009
   Kosten ( €)HulphondControlegroep
   Totale investeringskosten voor de hulphond31.204
   Verschil in jaarlijkse kosten, gedisconteerd over acht jaar-26.628
   Totaal kostenverschil hulphond over acht jaar 4.576
   Effecten
   Index DLHS0,710,62
   Over acht jaar gedisconteerd5,314,64
   Gewonnen kwaliteit van leven gedisconteerd over acht jaar0,67
   Kosten-effectiviteitsratio (kosten per QALY)* 6.792
   * Quality Adjusted Life Years. De hulphond leidt niet tot winst in levensjaren. Daarom is het aantal gewonnen QALY’s gelijk aan het gedisconteerde verschil in waarden van de DLHS-index.

   Kosten-effectiviteitsratio

   Door middel van de berekening van de kosten-effectiviteitsratio (KE-ratio) worden kosten tegen de effecten afgewogen. Deze ratio brengt alle informatie over de kosten en over de effecten van de hulphond samen in een getal. De berekening van de KE-ratio uit het hulphondenonderzoek is gepresenteerd in tabel 1.

   In de hulphondengroep wordt een significant hogere gemiddelde waarde van de index van de DLHS bereikt: 0,71 tegenover 0,62 in de controlegroep. Jaarlijks wordt dus een kwaliteit-van-levenwinst gerealiseerd van 0,09 op een schaal van 0 tot 1. Dit levert een totale gedisconteerde kwaliteit-van-levenwinst op over acht jaar van 0,67. Omdat de hulphond niet tot gewonnen levens leidt, is dit ook direct het aantal voor kwaliteit gecorrigeerde gewonnen levensjaren over de gebruiksduur van de hulphond. De kosten-effectiviteitsratio is nu het kostenverschil gedeeld door de kwaliteit-van-levenwinst: dus € 4.567/0,67 = € 6.792. Bij een algemeen aanvaarde grenswaarde van € 40.000 per QALY voor kosteneffectiviteit is de hulphond te beschouwen als een kosteneffectieve voorziening. De hulphond leidt echter niet tot besparingen binnen de gezondheidszorg. Het voordelige verschil in jaarlijkse kosten wordt helemaal gerealiseerd door minder mantelzorg.

   Een beperking van de studie is dat de index van de EQ5D niet kon worden gebruikt. De KE-ratio is berekend op basis van de index van de DLHS. Hierdoor kunnen de KE-ratio’s niet worden vergeleken met ratio’s van andere gezondheidszorgvoorzieningen buiten de gehandicaptenzorg waarvoor de DLHS niet geldig is. Dus een algemeen kwaliteit-van-leveninstrument levert een KE-ratio op met een bredere relevantie.

  • Een bredere toepassing van de methodologie: geluksmeting

   Een kwaliteit-van-levenindex als effectmaat is binnen de gezondheidszorg een algemeen geldende en geaccepteerde effectmaat, die ook de meer zachte elementen van de kwaliteit van leven in een economische evaluatie meeweegt. Hoe algemener de effectmaat hoe groter de vergelijkbaarheid van de uitkomsten tussen verschillende soorten gezondheidsinterventies. Kenmerkend is ook dat het gaat om subjectieve oordelen van personen die de voorziening ondergaan. Daarnaast is het door toepassing van kwaliteit-van-levenmeting niet meer nodig dat een monetaire waarde wordt verbonden aan gewonnen levens. Dit zou wel moeten in een kosten-batenanalyse.

   Het zou dus heel mooi zijn als voor andere sectoren, bijvoorbeeld de sociale zekerheid, een vergelijkbaar algemeen concept voor een effectmaat zou kunnen worden gevonden. Dit schept de mogelijkheid om in economische evaluaties ook systematisch rekening te houden met immateriële effecten van beleid die moeilijk op geld te waarderen zijn.

   Nu is er een sterker wordende beweging om voor zo’n effectmaat de zogenoemde geluksmeting te gebruiken. Een van de pioniers op dit gebied is de Engelse arbeidseconoom Richard Layard, die in zijn boek Happiness: Lessons from a new science (2005) een pleidooi houdt om de mate van geluk als maatstaf te nemen voor sociaal en economisch beleid.6xIn zijn nieuwste boek: The price of civilization houdt Jeffrey D. Sachs een vergelijkbaar pleidooi. Als basis gaat Layard ervan uit dat geluk of het subjectieve welzijn op een consistente manier kwantitatief kan worden gemeten. De methodologie is nog volop in beweging. Alhoewel er al verschillende soorten van toepassingen zijn te melden (bijv. Devoto et al., 2011; Frey et al., 2009; Van Praag & Ferrer-I-Carbonell, 2004; Van Praag & Baarsma, 2005) is het nog geen uitgemaakte zaak hoe geluksmeting moet worden vormgegeven. Dolan, Layard en Metcalfe (2011) onderscheiden drie kenmerken waaraan geluksmeting moet voldoen om te worden gebruikt in beleidsevaluaties: theoretisch gefundeerd, beleidsrelevant en empirisch robuust. Met dit laatste wordt bedoeld dat geluk kwantitatief kan worden gemeten en dat de meeting betrouwbaar en valide is. De gangbare kwaliteit-van-leveninstrumenten die worden gebruikt in economische evaluaties in de gezondheidszorg, voldoen aan deze criteria, vooral door de opbouw van de instrumenten, die relevant is binnen de gezondheidszorg, en door methoden waarmee de waarderingssets worden vastgesteld. In het hulphondenonderzoek zijn de EQ5D en de DLHS gebruikt. Dit zijn alle twee methodologisch gevalideerde instrumenten, waarbij de waarderingsset van de EQ5D tot stand gekomen is op een wijze die meer gefundeerd is in de economische theorie. Dit heeft zeker bijgedragen aan de algemene acceptatie van de EQ5D.

   Voor verschillende toepassingen van geluksmeting moeten waarschijnlijk verschillende soorten instrumenten worden toegepast. Dolan et al. (2011) menen dat voor beleidsevaluatie het beste een maat voor subjectief welbevinden (‘subjective well-being’, SWB) kan worden gebruikt. Kenmerkend voor SWB is dat respondenten wordt gevraagd een algemene waardering te geven van hun leven (‘life satisfaction’) in de vorm van vragen over tevredenheid met het leven. Tegelijkertijd wordt gevraagd naar de tevredenheid binnen bepaalde domeinen. Hierbij komt een structuur naar voren die overeenkomt met die van kwaliteit-van-leveninstrumenten, namelijk het algemene oordeel vertegenwoordigd door de index, aangevuld met de scores op de dimensies van kwaliteit van leven.

   SWB is gefundeerd in de Benthamiaanse nutstheorie en spreekt beleidsmakers aan, vooral vanwege de conceptuele begrijpelijkheid (Dolan, 2011: 6).

   Er blijven nog genoeg methodologische kwesties over die onderzocht zouden moeten worden en die verband houden met de betrouwbaarheid en de validiteit van SWB-metingen. Zo kan bijvoorbeeld de vraagstelling en bijvoorbeeld de volgorde daarin het oordeel beïnvloeden. Dit betekent dat de opbouw van het meetinstrument invloed heeft op de resultaten die ermee worden verkregen. Dit is overigens ook zo bij kwaliteit-van-levenmeting. Dit maakt dat de indexwaarden van de EQ5D niet zonder meer vergeleken kunnen worden met de indexwaarden van de DLHS. Belangrijk is ook het probleem van het schaalgebruik: is de ene 7 op een schaal van 0 tot 10 te vergelijken met een andere 7 nadat belangrijke veranderingen zich hebben voorgedaan in de levenssituatie? Ook moet worden uitgezocht of bepaalde groepen respondenten de antwoordschaal systematisch anders gebruiken dan andere groepen. Daarbij moet in het oog worden gehouden dat een beleidsevaluatie kan leiden tot een specifieke selectie van respondenten met bepaalde kenmerken. Dit kan het causale verband tussen het beleid en het gemeten SWB-effect vertroebelen (Dolan et al., 2011: 11-12).

   Het is echter mogelijk dat in veldexperimenten een deel van de bovengenoemde problemen een veel mindere rol spelen. Zeker als het veldexperiment gebruik maakt van een gerandomiseerde opzet. Eventuele vertekeningen in de antwoorden zouden zich dan in beide onderzoeksgroepen in dezelfde mate kunnen voordoen. Selectieproblemen worden door de randomisatie tegengegaan. En voor de gemeten effecten is het relatieve verschil belangrijker dan het absolute niveau op de meetschaal. Dit maakt eventuele schaalproblemen wellicht ook minder belangrijk. Zoals in de berekening van de KE-ratio voor de hulphond wordt getoond, is het verschil tussen de twee groepen op de index van de DLHS bepalend voor de kosteneffectiviteit. De waarden van de index en het niveau waarop deze waarden zich bevinden op de meetschaal, spelen hierbij geen rol.

   Toekomst

   Voor de toekomst kan men veronderstellen dat gemeenten zich geplaatst zien worden voor de afweging om extra geld te steken in reïntegratietrajecten of WMO-ondersteuning. Dit is een sectoroverstijgende afweging, waarbij kosten-batenanalyses moeilijk in te zetten zijn, omdat belangrijke immateriële effecten moeten worden meegewogen. Naar mijn idee kan deze afweging alleen economisch worden onderbouwd met kostenutiliteitsstudies die een algemeen te gebruiken SWB-effectmaat hanteren. Natuurlijk zou het al een vooruitgang zijn als een enkelvoudige effectmaat in deze studies wordt gebruikt, waardoor kosten-effectiviteitsanalyses mogelijk worden. Te denken valt dan aan het hebben van een baan en de zekerheid van het hebben van een baan. Er zijn veel empirische studies die aantonen dat dit een van de bepalende factoren is voor de mate van welzijn (Frey & Stutzer, 2010).

   Er zijn dus nog geen kant-en-klare instrumenten beschikbaar die in het sociale domein gebruikt kunnen worden voor de economische evaluatie van beleid waarbij alle effecten worden meegewogen. De toepassing van kwaliteit van leven als effectmaat in de gezondheidszorg laat echter zien dat er veel mogelijk is op dit terrein en dat immateriële effecten van beleid op een zinvolle manier kunnen worden gemeten. Aan de hand van deze meting kunnen met veldexperimenten de kosten van een interventie in het sociale domein worden gerelateerd aan de materiële en immateriële effecten van de interventie.

  • Literatuurlijst
  • Brooks, R. (1996). EuroQol: The current state of play. Health Policy, 37, 53-72.

  • Diepenhorst, M., Weijnen, T., & Van Vree, F. (2010). Kosten en effectiviteit van hulphonden. Eindrapport. Een onderzoek in opdracht van het College voor Zorgverzekeringen. Zoetermeer: Research voor Beleid.

  • Devoto, F., Duflo, E., Dupas, P., et al. (2011). Happiness on tap: Piped water adoption in urban Morocco. September 28. Retrieved January 30, 2012, from http://econ-www.mit.edu/files/7016.

  • Dolan, P. (1997). Modeling valuations for EuroQol health states. Medical Care, 35, 1095-1108.

  • Dolan, P., Layard, R., & Metcalfe, R. (2011). Measuring subjective well-being for public policy. Office for National Statistics.

  • Frey, B., Luechinger, S., & Stutzer, A. (2009). The Life Satisfaction Approach to the value of public goods: The case of terrorism. Public Choice, 138, 317-345.

  • Frey, B. & Stutzer, A. (2010). Happiness and economic policy. CESifo DICE report 4/2010. Retrieved October 1, 2011, from http://www.cesifo-group.de/portal/pls/portal/docs/1/1201329.PDF.

  • Greiner, W., Weijnen, T., Nieuwenhuizen, M., et al. (2003). A single European currency for EQ-5D health states: Results from a six-country study. European Journal of Health Economics, 4(3), 222-231.

  • Groothuis-Oudshoorn, C., Chorus, A., Van Beekum, T., et al. (2006). Modelling and estimation of valuations for the Dutch London Handicap Scale. Journal of Health Economics, 25(6), 1119-1138.

  • Kooreman, P., & Potters, J. (2011). De gouden standaard: veldexperimenten in de voorbereiding en evaluatie van beleid. TPEdigitaal, 5(3), 76-90.

  • Lamers, L., Stalmeier, P., McDonnell, J., Krabbe, P., & Van Busschbach, J. (2005). Kwaliteit van leven meten in economische evaluaties: het Nederlandse EQ-5D-tarief. Nederlands Tijdschrift voor de Geneeskunde, 149, 1574-1578.

  • Layard, R. (2005). Happiness: Lessons from a new science. London: Penguin Books.

  • The Euroqol Group. (1990). Euroqol – a new facility for the measurement of health-related quality of life.Health Policy, 16(3), 199-208.

  • Van den Berg, B., & Ferrer-I-Carbonell, A. (2007). Monetary valuation of informal care: The well-being valuation method. Health Economics, 16(11), 1227-1244.

  • Van Praag, B., & Ferrer-I-Carbonell, A. (2004). Happiness Quatified: A satisfaction calculus approach. Oxford: Oxford University Press.

  • Van Praag, B., & Baarsma, B. (2005). Using happiness surveys to value intangibles: The case of airport noise. The Economic Journal, 115, 224-246.

  • Williams, A. (1985). Economics of coronary artery bypass grafting. British Medical Journal, 291, 326-329.

  Noten

  • 1 Zie bijvoorbeeld het werk van de MIT-econome Esther Duflo, die veldexperimenten toepast bij onderzoek naar de effectiviteit van ontwikkelingshulp.

  • 2 Baanbrekend hier is het artikel van de Engelse econoom Alan Williams: ‘Economics of coronary artery bypass grafting’ uit 1985. Alan Williams stond ook aan de wieg van de ontwikkeling van het QALY-begrip en de ontwikkeling van een van de belangrijke kwaliteit-van-leveninstrumenten. Bij zijn overlijden in 2005 schreef de BMJ: ‘economist who transformed the delivery of health care to patients’.

  • 3 De interpretatie van deze gemiddelden is overigens beperkt tot een samenvatting van de scores. De gemiddelden zijn opgebouwd uit ordinale variabelen en kunnen dus niet worden gezien als een waarderingsmaat voor scores op de dimensies.

  • 4 In een nieuwe versie van de EQ5D is de vraagstelling op dit punt aangepast. Dit komt de toepas-baarheid van de EQ5D in de ‘care’-sector ten goede.

  • 5 * Quality Adjusted Life Years. De hulphond leidt niet tot winst in levensjaren. Daarom is het aantal gewonnen QALY’s gelijk aan het gedisconteerde verschil in waarden van de DLHS-index.

  • 6 In zijn nieuwste boek: The price of civilization houdt Jeffrey D. Sachs een vergelijkbaar pleidooi.

Reageer

Tekst


Print dit artikel