Detecteren behoefte psychosociale zorg - Psychometrische eigenschappen
Uitgangsvraag
Revisie 2015: Literatuursearch vanaf 1 jan 1998; update vanaf 1 jan 2008
Wat zijn de psychometrische eigenschappen van de geselecteerde instrumenten?
Aanbeveling
De werkgroep formuleert de aanbevelingen op basis van de eisen (welke instrumenten zijn er?), de psychometrische eigenschappen (Psychometrische eigenschappen meest geschikte instrument) en het niveau van bewijs (welke instrumenten; meest geschikte instrument; meest geschikte afkappunt) als volgt:
Er wordt geadviseerd voor het screenen en signaleren van distress bij mensen met kanker gebruik te maken van de Lastmeter. Deze bestaat uit de thermometer, probleemlijst en de vraag ‘zou u met een deskundige willen praten over uw problemen?'
De werkgroep is van mening dat voor het monitoren van distress bij mensen met kanker gebruik gemaakt kan worden van de Lastmeter (met gebruik van de versie waarop voor elk probleem een score tussen de 1-10 gegeven kan worden) of de EORTC QLQ-C30.
De werkgroep is van mening dat er op dit moment onvoldoende bewijs is voor en klinische ervaring met de SIPP als instrument voor screenen, signaleren en/of monitoren van distress.
De werkgroep is van mening dat met alle patiënten de antwoorden op het instrument besproken moeten worden, of het nu om screening, signalering of monitoring gaat, en dat niet alleen afgegaan moet worden op een afkappunt.
Overwegingen
Klinische relevantie
In de klinische praktijk wordt, wat de items van de probleemlijst van de Lastmeter betreft, voornamelijk de ja/nee antwoord optie gebruikt. Dit was in de vorige versie van de richtlijn aangeraden om te voorkomen dat alleen dié problemen worden besproken waaraan door de patiënt een hoog cijfer is gegeven. Tijdens het gesprek wordt echter met regelmaat aan een patiënt gevraagd om met een cijfer tussen 1-10 de ernst van een probleem aan te geven om zo sneller inzicht te krijgen in welke problemen het urgentst zijn. Deze methode wordt ook wel tijdens het gesprek met de patiënt gebruikt om na te gaan of er verandering in de loop van de tijd heeft plaatsgevonden. Het heeft de voorkeur om voor ernst van het probleem en verandering over tijd de Lastmeter versie te gebruiken, waarop de patiënt per probleem in de probleemlijst, waarop hij/zij met ‘ja’ antwoordt, de ernst van het probleem met een cijfer van 1-10 kan aangeven.
Als de Lastmeter op papier of digitaal in het EPD wordt ingevoerd, inclusief de door de patiënt gegeven cijfers in de probleemlijst, wordt in de dagelijkse praktijk van de mogelijkheid gebruik gemaakt om op individueel niveau en/of op groepsniveau veranderingen over tijd te monitoren. In de literatuur is over het gebruik van de Lastmeter voor monitoring weinig onderzoek te vinden.
Onderzoek beveelt aan dat, wat betreft een single-item Visual Analogue Scale (VAS), 50% van de schaal’s standaard deviatie (SD) of een verandering van een punt op een 11-punt’s numerieke schaal beschouwd kan worden als een klinisch relevante verandering [Hauser 2008] (44). Anderen bevelen aan om 0.2 SD te beschouwen als een kleine verandering, 0.5 SD als een middelmatig grote verandering en 0.8 SD als een grote verandering [Sloan 2006] (45). Dit kan ook gelden voor de Lastmeter thermometer of probleemitems. Om dit voor de Lastmeter thermometer of probleemitems te bevestigen is onderzoek nodig.
Voor de EORTC QLQ-C30 er is sinds kort, naast het multidimensionele profiel van functionele en symptoom uitkomsten, ook een totale somscore beschikbaar. Deze somscore is gebaseerd op bevestigende factor analyses en validiteittoetsen en bevat 27 van de dertig items van de vragenlijst. Echter, de somscore wordt berekend op basis van een opsomming van schaalscores (ipv item scores) om te voorkomen dat bepaalde domeinen meer gewicht krijgen dan andere. Deze somscore is de officiële scoring procedure van de EORTC Quality of Life Group. [Gundy 2012 (46), Giesinger 2016 (47)].
Professioneel perspectief
Het niveau van bewijs van de SIPP is in vergelijking met de Lastmeter en de EORTC QLQ-C30 het laagst, evenal de klinische ervaring. Wat de EORTC QLQ-C30 betreft, deze is niet bedoeld als signalerings- of screeningsinstrument, maar is wel geschikt voor het monitoren van problemen over tijd.
Patiëntenperspectief
De sensitiviteit, specificiteit, negatief voorspellende waarde (NPV) en positief voorspellende waarde (PPV) gevonden in studies zijn niet 100%. Dat betekent dat sommige patiënten met klinisch verhoogde distress of met een zorgbehoefte onterecht gemist kunnen worden. Om dit uit te sluiten wordt in deze richtlijn geadviseerd met alle patiënten de antwoorden op het instrument te bespreken en niet alleen af te gaan op een afkappunt.
Onderbouwing
Conclusies
Lastmeter
Het is aangetoond dat de Lastmeter een valide en betrouwbaar instrument is om ernst en aard van distress en problemen bij mensen met kanker te meten en dat de DT een diagnostische accuraat instrument is om klinisch verhoogde en relevante distress te signaleren bij mensen met kanker. Een afkappunt van 4 (internationaal) en 5 (in Nederlandse patiënten) op de thermometer van de Lastmeter levert de meest ideale sensitiviteit en specificiteit voor het signaleren van distress bij volwassen mensen met kanker
Niveau 1 A2 Mitchell 2007 (1); A2 Tuinman 2008 (8); A2 Bauwens 2009 (41); A2 Ransom 2006 (5); A2 Gil 2005 (42); A2 Jacobsen 2005 (6); A2 Butt 2008 (3); A2 Ma 2014 (12); A2 Mitchell 2010 (11). B Gessler 2008 (26); B Hoffman 2004 (4), B Shim 2008 (7); B Akizuki 2005 (2); B Özalp 2007 (43); B Lambert 2014 (24), B Lazenby 2014 (25), B Admiraal 2013 (13).
Er zijn aanwijzingen dat de DT in dezelfde richting verandert als criterium maten. Er zijn echter geen waardes bekend voor klinisch relevante verschillen. Er zal meer onderzoek gedaan moeten worden om de geschiktheid van de DT voor het monitoren van veranderingen in distress over tijd te bepalen.
Niveau 3 B Gessler 2008 (26); B Thalen-Lindstrom 2013 (27)
EORTC QLQ-C30
Het is aannemelijk dat de EORTC QLQ-C30 een betrouwbaar en valide instrument is voor het screenen en signaleren van distress bij mensen met kanker.
Niveau 2 C Aaronson 1993(27), C Guzelant 2004(28), B Yun 2004(29), B McLachlan 1998(30), B Kuenstner 2002(31), C Gotay 2002(32), C Velikova 2001(33), C Ringdal 1999(34), B Snyder 2010(38), C King 2014(37), C Luckett 2011(35)
Er zijn aanwijzingen dat tien punten verschil op zes (fysiek, emotioneel en rol functioneren, globale kwaliteit van leven, pijn en vermoeidheid) van de veertien EORTC QLQ-C30 uitkomstmaten een klinisch relevant verschil in zorgbehoeften weergeven.
Niveau 3 B Snyder 2015(39)
SIPP
Er zijn aanwijzingen dat de SIPP een betrouwbaar en valide instrument is om distress vast te stellen bij mensen met kanker.
Niveau 3 B Braeken 2011(40)
Samenvatting literatuur
Lastmeter (thermometer (DT), probleemlijst (PL) en verwijswens vraag)
Distress Thermometer (DT)
Dit instrument meet met één item de ernst van distress met behulp van een thermometer (0-10). In tabel 1 staan de sensitiviteit en specificiteit genoemd voor de DT in het opsporen van distress ten opzichte van andere instrumenten. Deze andere instrumenten werden als gouden standaard beschouwd.
In de artikelen genoemd in tabel 1 wordt gepleit voor een kort signalerings- en screeningsinstrument waarop de behandelend arts in één oogopslag kan zien of iemand mogelijk moet worden verwezen in verband met distress. In deze artikelen werd benadrukt dat er in de praktijk vaak weinig tijd is om uitgebreidere vragenlijsten in te vullen. De DT werd in de artikelen afgezet tegen bestaande vragenlijsten die als gouden standaard kunnen worden beschouwd, zoals de HADS. Op basis hiervan is onderzocht welk afkappunt op de DT de beste sensitiviteit en specificiteit opleverde.
Mitchell voerde gepoolde analyses uit voor de DT. Hieruit kwam naar voren dat de gepoolde sensitiviteit 0.77 was en de gepoolde specificiteit 0.66. De positief voorspellende waarde was 55.6% en de negatief voorspellende waarde was 84.0% [Mitchel 2007] (1).
Probleemlijst (PL)
De DT is aangevuld met de Probleem List (PL). De originele lijst bevat oorspronkelijk 35 specifieke problemen/symptomen verdeeld in vijf verschillende subschalen (lichamelijke problemen, praktische problemen, problemen met naasten, emotionele problemen en levensbeschouwelijke problemen), waarop met ja of nee moet worden geantwoord of de patiënt deze problemen/symptomen heeft. Op die manier kan bij een score boven het afkappunt van de DT ook gezien worden op welk gebied zich met name problemen voordoen. In de literatuur worden de psychometrische eigenschappen van de probleemlijst met verschillende aantallen items en met verschillende score mogelijkheden (ja versus nee of tussen 0-10) beschreven.
In één studie in Japan wordt de DT aangevuld met een Impact Thermometer aangezien het begrip distress zich niet eenduidig liet vertalen. Deze meet behalve distress ook de impact van kanker op het dagelijks leven. De resultaten werden afgezet tegen een diagnose die een psychiater stelde aan de hand van DSM-IV criteria. De scores op de twee thermometers moeten worden gecombineerd. Voor het opsporen van aanpassingsproblemen en ‘major' depressie is zowel de sensitiviteit als de specificiteit 0.82 bij een afkappunt van 3/4 op distress en 2/3 op impact. Voor alleen het opsporen van ‘major' depressie (ernstige klinische depressie) is de sensitiviteit 0.89 en de specificiteit 0.70 bij een afkappunt van 4/5 op distress en 3/4 op impact. Voor het opsporen van ‘major' depressie met gedachtes over zelfmoord is de sensitiviteit 0.94 en de specificiteit 0.67 bij een afkappunt van 4/5 op distress en 4/5 op impact [Akizuki 2005] (2).
In de studie van Butt et al [Butt 2008] (3), uitgevoerd in de VS bij mensen met een solide tumor, worden vier screeningsvragen gesteld over vermoeidheid, pijn, distress en gebrek aan eetlust. Deze worden alle vier op een thermometer zoals de distress thermometer gesteld. De patiënten die op één van de vier vragen ≥ 4 scoorden, kregen een uitgebreidere vragenlijst. De resultaten op de screeningsvragen werden afgezet tegen de vragen op gouden standaarden als de HADS en de FACT-G. In tabel 2 staan de sensitiviteit en specificiteit voor de vier screeningsvragen op basis van de distress thermometer.
Het onderzoek van Hoffman et al. heeft de psychometrische eigenschappen van de NCCN Distress Management Screening Measure (DMSM) onderzocht [Hoffman 2004] (4). De DMSM is een combinatie van de DT met de PL. De interne consistentie was goed voor het instrument in zijn geheel en de subschalen lichamelijke problemen en emotionele problemen (Cronbach's α >0.70), zie tabel 3. De alpha was laag voor de subschaal praktische problemen (0.42), maar zou tot gemiddeld kunnen toenemen (0.61) als er één item uit deze schaal zou worden verwijderd ("work/school"). Ook de alpha voor levensbeschouwelijke problemen was laag (0.31), maar zou slechts marginaal verbeteren (0.44) als er één item zou worden verwijderd ("loss of Faith"). De DMSM algemene distress score correleerde matig met de schalen depressie (r= 0.54), angst (r= 0.68) en hostiliteit (r= 0.50) van de BSI (= convergente validiteit). De DSMS algemene distress score correleerde laag of niet significant (r ≤ 0.43) met BSI schalen die psychopathologie suggereren die niet door algemene distress wordt gekenmerkt (divergente validiteit). Het gebied onder de Receiver Operating Characteristic (ROC) curve (0.74) laat zien dat de algemene distress score goed in staat is om patiënten met distress te onderscheiden van patiënten die dat niet hebben, waarbij de DSMS algemene distress score wordt afgezet tegen de BSI. Er kon in deze studie echter geen afkappunt worden gevonden die de sensitiviteit en specificiteit maximaliseert [Hoffman 2004] (4). Zie tabel 3. (5)
Twee Amerikaanse onderzoeken hebben de psychometrische kenmerken van de DT onderzocht en daarbij ook gekeken naar de relatie tussen de DT score en het aantal items dat met ‘ja' was beantwoord in de PL. Het onderzoek van Ransom et al. is uitgevoerd in een groep van 491 patiënten die een beenmerg transplantatie zouden ondergaan [Ransom 2006] en het onderzoek van Jacobsen et al. in 380 ambulante kanker patiënten [Jacobsen 2005] (6). Beide onderzoeken hebben een iets andere format van de PL gebruikt. Ransom et al. vonden een significante correlatie tussen de aanwezigheid van 32 van de in totaal 33 problemen op de PL (97%) en een afkapwaarde van vier op de DT. In het onderzoek van Jacobsen et al. waren 22 van de 34 problemen (65%) gecorreleerd met een afkapwaarde van vier. Uit een Koreaanse studie bleek dat patiënten die boven het afkappunt van 4 scoorden, significant meer problemen rapporteerden op de PL van 35 items (significant voor 23 van de 35 items) [Shim 2008] (7).
De DT in combinatie met de PL en de verwijswensvraag is gevalideerd in Nederland bij mensen met verschillende typen kanker, in verschillende ziektestadia en met verschillende behandelingen. De PL in deze studie bestaat uit 47 items in plaats van de oorspronkelijke 35 items. Patiënten kunnen aan de PL-items een waarde van tussen de 0 (nee, is geen probleem), 1 (ja maar is nauwelijks een probleem) tot 10 (ja, is uitermate groot probleem) geven. De mogelijke range van de praktische subschaal is 0-70, van de sociale subschaal 0-30, emotionele subschaal 0-100, levensbeschouwelijke/spirituele subschaal 0-20, en van de fysieke subschaal 0-250. Van de totale PL is de range 0-470. In tabel 4 staan de Cronbach's alphas beschreven. De DT was sterk gecorreleerd met de totaal score op de PL (r= 0.68), emotionele problemen (r= 0.61) en lichamelijke problemen (r= 0.64), middelmatig sterk gecorreleerd met de praktische (r=0.39) en familie/sociale subschaal (r=0.31) en zwak met de spirituele/ levensbeschouwelijk subschaal (r=0.26) (alle p-waardes <.001). De DT was sterk gecorreleerd met de HADS totaal score (r= 0.57). Een afkappunt van vijf op de DT was het meest ideale afkappunt. De sensitiviteit was 0.85, de specificiteit 0.67, de positief voorspellende waarde 0.39 en de negatief voorspellende waarde was 0.95. Van de patiënten wilde 10% verwezen worden, 19% misschien en 71% had geen verwijswens. Het percentage patiënten met een score van 5 of hoger op de DT dat verwezen wilde worden (14%) of misschien verwezen wilde worden (29%) was significant hoger dan het percentage patiënten met een score lager dan vijf op de DT. Van hen wilde 5% verwezen worden en 13% misschien verwezen worden [Tuinman 2008] (8).
Zie tabel 4. (9).
In België is bij ruim 500 mensen met diverse typen kanker de DT in combinatie met de Colored Complaint Scale (CCS) geëvalueerd. De combinatie van deze twee instrumenten wordt de Distress Barometer genoemd. De DT was aangepast door kleuren aan de thermometer toe te voegen, rood bij extreme distress en groen bij geen distress. De CCS bestaat uit negen items (de items waren gekozen op basis van pilotstudy's) die op een gekleurde thermometer werden geplaatst. De kleuren liepen van lichtgroen (geen last) tot donkerrood (veel last). De items betroffen pijn, andere lichamelijke problemen, nervositeit, concentratie, angst, zorgen over partner/familie, verdriet, boosheid en spirituele zorgen. De HADS werd gebruikt als Gouden Standaard. Ten opzichte van de HADS bleek een afkappunt ≥ 5 op de DT de meest ideale ratio tussen sensitiviteit (0.75) en specificiteit (0.70) op te leveren [Bauwens 2009](9).
In Turkije is de DT in combinatie met de PL (34 items) gevalideerd bij ruim 180 mensen met diverse typen kanker. De score van de DT werd afgezet tegen de HADS. Uit deze studie bleek dat het optimale afkappunt voor de DT ≥ 4 was, waarbij de sensitiviteit 0.73 was en de specificiteit 0.49. Patiënten die een score hadden van ≥ 4 scoorden significant vaker problemen op de PL met betrekking tot fysieke, familie en emotionele problemen dan patiënten die < 4 scoorden op de DT [Özalp 2008] (10).
Na 2008 verschenen er twee meta analyses [Mitchell 2010 (11), Ma 2014 (12)] en veertien originele studies met betrekking tot de onderzoeksvraag. Voor twaalf van de originele studies [Mitchell 2010 (11), Admiraal 2013 (13), Baken 2011 (14), Boyes 2013 (15), Bulli 2009 (16), Chambers 2014 (17), Clover 2009 (18), Craike 2011 (19), Merport 2012 (20), Patel 2011 (21), Ryan 2012 (22) en Thalén-Lindström 2013 (23)] werden gepoolde accuratessegegevens berekend in de meta analyse van Ma 2014 [Ma 2014] (12). Deze studies worden daarom hier niet meer apart vermeld. Buiten de meta-analyse van Ma op zijn er nog twee studies gevonden, één Amerikaanse en één Australische. Zij berekenden de diagnostische accuratesse van de DT met respectievelijk de HADS [Lambert 2014] (24) en de PHQ-9 [Lazenby 2014] (25). Gessler 2008 [Gessler 2008] (26) en Thalen-Lindstrom [Thalen-Lindstrom 2013] (23) zijn studies uit de review van Ma et al. die door de werkgroepleden expliciet zijn aangehaald, omdat deze informatie bevatten over de psychometrische eigenschappen van de DT als het gaat om het meten van verandering over tijd. De studie van Admiraal 2013 [Admiraal 2013] (13), ook opgenomen in de meta-analyse van Ma [Ma 2014] (12), is hier expliciet door de richtlijnwerkgroep uitgelicht, omdat deze gericht is op de Nederlandse situatie.
Mitchell et al berekende uit vier studies een gewogen sensitiviteit van 78.5% en een gewogen specificiteit van 67.4% voor de detectie van distress met de DT, met de single verbal question als referentie standaard [Mitchell 2010] (11). Verder leek een tweede domein (twee thermometers) de diagnostische accuratesse van de DT te bevorderen. Bij twee thermometers waren de “case finding ability” (AUC 0,831) en screening ability (AUC 0,673) groter dan bij 1 thermometer (DT) “case finding ability” (AUC 0,643) en screening ability (AUC 0,682).
Ma et al bepaalde op basis van 42 studies uit twintig landen dat de DT een goede balans heeft tussen gepoolde sensitiviteit 81% (95% BI 0.79–0.82) en de gepoolde specificiteit 72% (95% BI 0.71–0.72). Dit bij een optimale cut-off waarde van vier voor de DT voor de detectie van distress, met een verscheidenheid aan gevalideerde instrumenten als referentie standaard [Ma 2014] (12). De AUC is 0.8321.
Lambert et al berekende de sensitiviteit en specificiteit van verschillende cut off waarden van de DT in een dwarsdoorsnede populatie van 377 mensen met kanker, met de HADS-Total als referentiestandaard [Lambert 2014] (24). Een optimale balans tussen sensitiviteit (72% en 74.4%) en specificiteit (76.5% en 76.6%) werd gevonden bij een cut off waarde van vijf voor depressie en angst respectievelijk.
Lazenby et al onderzocht de optimale cut off waarde voor de detectie van depressie met de DT binnen de periode van dertig dagen na diagnose, in een populatie van 123 mensen met kanker, met de PHQ-9 als referentiestandaard [Lazenby 2014] (25). Zij legden de optimale cut off waarde bij 2 (sensitiviteit 96% (95% BI 88–99) en specificiteit 36% (95% BI 25–46)). Zij concluderen dat de DT goed discrimineert voor depressieve klachten in mensen met gemetastaseerde kanker.
Gessler [2008] (26) en Thalen-Lindstrom [2013] (23) zijn studies uit de review van Ma et al. die door de werkgroepleden expliciet zijn aangehaald, omdat deze informatie bevatten over de psychometrische eigenschappen van de DT als het gaat om het meten van verandering over tijd. Uit de eerste studie onder 111 patiënten die de DT, HADS, GHQ-12 en de BSI-18 invulden op baseline en vier en achtweken later, bleek dat de DT na vier en acht weken significant in dezelfde richting veranderde als de criteriummaten waarmee hij vergeleken werd. De tweede studie onder 321 patiënten die de DT en de HADS invulden op baseline en een, drie en zes maanden later, toonde dat de DT na een, drie en zes maanden significant in dezelfde richting veranderde als de HADS waarmee hij vergeleken werd. De auteurs concludeerden dat het vermogen van de DT om verandering over tijd te meten vergelijkbaar is met die van de HADS. Er werden echter geen waardes voor klinische relevante verschillen gepresenteerd.
Admiraal et al. [2013] (13) onderzocht de distress levels en de thermometer cut off scores bij 1350 patiënten met verschillende types kanker in Nederland. Een cut off score van 5 leidde in het algemeen tot een optimale accuratesse met een juiste classificatie van 85% van de HADS cases (sensitiviteit) en 66% van de HADS non cases (specificiteit). Bij sommige kanker diagnosegroepen (prostaat, sarcomen/bot, long (alleen bij vrouwen)) bleek het optimale afkappunt op vier te liggen.
Kwaliteit van de studies
De resultaten van een van de recente studies wordt mogelijk vertekend door de lage response rate [Lambert 2014: 23%] (24). Als vooral patiënten met een hoge mate van distress deelname weigerden, kan dat geleid hebben tot onderschatting van de diagnostische accuratesse van de DT.
EORTC QLQ-C30 update
European Organization for Research and Treatment of Cancer, Quality of Life Questionnaire-C 30 (EORTC QLQ-C30)
De EORTC QLQ-C30 is ontwikkeld door de European Organization for Research and Treatment of Cancer. Aaronson et al. hebben een internationale studie uitgevoerd naar de toepasbaarheid, betrouwbaarheid en validiteit van de EORTC QLQ-C30. De deelnemers aan deze studie waren mensen met longkanker die chemo- of radiotherapie kregen. De patiënten kwamen uit West Europa, Noord Amerika, Australië (n= 305 die de vragenlijsten voor en tijdens behandeling invulden). Item-schaal correlaties waren voor zeven van de negen schalen > 0.40 (item- convergente validiteit). De Cronbach's α waren tussen de 0.54 en 0.86 voor behandeling en 0.52 en 0.89 tijdens behandeling. De Cronbach's α waren nagenoeg gelijk voor de verschillende landen. De inter-schaal correlaties waren over het algemeen matig, dat wil zeggen dat de schalen wel gerelateerd zijn aan elkaar, maar iets anders meten. Het merendeel van de functionele en symptoommetingen maakten onderscheid tussen patiënten die verschilden in klinische status, gewichtsverlies en sterkte van behandeling. De schalen lichamelijk en rol functioneren, algemeen kwaliteit van leven, vermoeidheid en misselijkheid en braken lieten significante veranderingen zien over tijd bij patiënten van wie de performance status was verbeterd dan wel verslechterd [Aaronson 1993] (27).
De EORTC QLQ-C30 is in veel landen en verschillende culturen gevalideerd.
In Turkije bijvoorbeeld is de betrouwbaarheid en validiteit getest van de Turkse versie bij mensen met longkanker. De interne consistentie was goed (Cronbach's α: alle schalen > 0.70). De correlaties tussen items en hun eigen subschaal waren significant hoger dan de correlaties tussen items en de andere subschalen. Alleen de schaal rol-functioneren kon onderscheid maken tussen patiënten met verschillende vormen van behandeling en ziektestadium; op de rest van de schalen werd hier geen onderscheid in gevonden. Met behulp van de EORTC QLQ-C30 kon geen onderscheid gemaakt worden naar therapiesoort. Performance status van de patiënten werd bepaald door de onderzoekers met de KPS (Karnofsky Performance Scale). De sterkste correlaties tussen de EORTC QLQ-C30 en de KPS waren op de schaal lichamelijk functioneren (r= 0.62), vermoeidheid (r= -0.47) en rol functioneren (r= 0.41) [Guzelant 2004] (28).
In Korea is een studie uitgevoerd naar de psychometrische eigenschappen van de EORTC QLQ-C30. De Cronbach's α was voor de schaal cognitief functioneren 0.60, voor de overige schalen tussen de 0.78 en 0.87. De correlaties tussen de EORTC QLQ-C30 en de Beck Depression Inventory (BDI) en Brief Pain Inventory (BPI) waren significant en tussen de 0.21 en 0.72 (al dan niet negatief). Patiënten met een betere performance status rapporteerden betere scores op de vijf functionele schalen en hadden minder symptomen [Yun 2004] (29).
In de studie van McLachlan [1998] (30) in Canada werden de subschalen sociaal, cognitief, emotioneel en rol functioneren en globale gezondheid onderzocht bij een groep vrouwen met borstkanker met metastasen. Van de 19 a-priori voorspelde verschillen tussen groepen werden er 17 gevonden (= discriminant validiteit), zie tabel 5.
Voor het bepalen van de convergente validiteit werden de bovengenoemde schalen vergeleken met de PAIS (Psychosocial Adjustment to Illness Scale), de POMS (Profile of Moods States), de MAC (Mental Adjustment to Cancer Scale) en de IES (Impact of Event Scale). A priori werd geschat welke correlaties tussen de schalen sterk en substantieel zouden zijn. In tabel 6 wordt de range van de sterke en substantiële correlaties weergegeven. De correlaties met de PAIS en POMS zijn sterker dan met de MAC en IES. Bij de MAC bleken in eerdere studies problemen te bestaan met de psychometrische eigenschappen, dus deze vergelijkingen moeten als tentatief worden beschouwd [McLachlan 1998] (30).
Zie tabel 6.
In Duitsland is onderzocht of de schalen van de EORTC QLQ-C30, Medical Outcomes Study 36-Item Short Form Health Suvey (SF-36) en de Functional Living Index Cancer (FLIC) die ongeveer hetzelfde heten ook hetzelfde meten. De Cronbach's α waren voor alle subschalen > 0.70, behalve voor de FLIC pijnschaal. De subschalen in deze drie lijsten die lichamelijk functioneren, emotioneel functioneren, pijn, vermoeidheid en misselijkheid/braken meten, vertonen een grote mate van overeenkomst. Het domein sociaal functioneren wordt in deze drie lijsten echter anders geoperationaliseerd. De mate van overeenkomst op deze vragenlijsten voor dit domein is minder groot. Ook de vraag over algemene gezondheid wordt op de drie verschillende lijsten anders gemeten. Deze scores kunnen dus ook niet zomaar met elkaar vergeleken worden. De meeste subschalen geven wel valide vergelijkingen [Kuenstner 2002] (31). In een studie naar crossculturele validiteit van de EORTC QLQ-C30 onder kaukasische en API (Azië en Pacific Island bewoners) Amerikanen bracht naar boven dat een aantal items in deze vragenlijst wordt gemist, onder andere seksualiteit en sociale steun. Er werd een gelijke structuur gevonden tussen de etnische groepen, wat betekent dat deze vragenlijst in beide groepen gelijk werkt [Gotay 2002] (32).
In Engeland is men bij mensen met diverse typen kanker nagegaan of scores op de EORTC QLQ-C30 overeenkwamen met gegevens die in het medisch dossier werden gevonden. De kwaliteit van leven scores en de verandering over tijd in deze scores komen overeen met de ernst van de ziekte en de behandeling in de individuele patiënt. Zo hebben patiënten met een slechtere score vaker metastasen of krijgen chemotherapie dan patiënten met een betere score. Deze studie laat zien dat kwaliteit van leven meting valide is ten opzichte van het medisch dossier. Op groepsniveau was de overeenkomst tussen de kwaliteit van leven lijst en het dossier teleurstellend. Er werden meer problemen en klachten genoemd op de EORTC QLQ-C30 dan in het dossier vermeld stond [Velikova 2001] (33).
In een Noorse studie is onderzocht of bepaalde analyse methoden geschikt zijn voor het bepalen van psychometrische eigenschappen van de kwaliteit van leven vragenlijsten. Hiervoor werden EORTC QLQ-C30 data gebruikt van verschillende Noorse studies. De Cronbach's α's waren tussen 0.63 en 0.89. Alle gecorrigeerde item-schaal correlaties waren groter dan 0.40, het merendeel zelfs groter dan 0.50 (convergent validiteit) [Ringdal 1999] (34).
Na 2008 verschenen er voor de EORTC QLQ-C30 één Australische review [Luckett 2011] (35) en vier later verschenen originele studies (Duits, Amerikaans en Australisch) [Hinz 2012 (36), King 2014 (37), Snyder 2010 (38), Snyder 2015 (39)] met betrekking tot de onderzoeksvraag.
Het review van Luckett et al. vatte 14 validatiestudies samen voor de EORTC QLQ-C30 en/of de FACT-G [Luckett 2011] (35). Het psychometrische bewijs laat geen voorkeur zien voor één van beide instrumenten.
Hinz et al onderzochten de psychometrische eigenschappen van drie somscores voor de EORTC QLQ-C30 gebaseerd op de vijftien items van de functioneren subschalen, op de dertien items van de symptoom subschalen en op alle dertig items van de QLQ-C30 bij 1529 mensen met kanker en een selectie van 1185 personen uit de algemene populatie. Cronbach’s alpha coëfficiënten waren bij de eerste groep: 0.89 (functioneren somscore), 0.87 (symptoom somscore) en 0.94 (totale somscore) en bij de tweede groep: 0.91 (functioneren somscore), 0.87 (symptoom somscore) en 0.95 (totale somscore) [Hinz 2012] (36). Het discriminerend vermogen van de “functioneren” somscore, de “symptoom” somscore en de “totale” somscore, berekend met de HADS-D en de Multidimensional Fatique Questionnaire (MFI) als referentie standaarden, waren respectievelijk 0,87, 0,74 en 0,83). Het is belangrijk om hierbij op te merken dat de somscores voorgesteld door Hinz et al. niet tot stand gekomen zijn door middel van factor analyse of andere statistische methoden die gangbaar zijn bij het ontwikkelen van zogenaamde ‘higher order’ factoren voor een vragenlijst. Tevens worden de somscores van Hinz et al. gecreëerd middels een simpele opsomming van de individuele item scores van de vragenlijst in plaats van de schaal scores. Hierdoor wordt de facto meer ‘gewicht’ (dwz belang) gegeven aan sommige domeinen (bv emotionele functioneren en vermoeidheid) dan aan andere domeinen (bv. rol functioneren of pijn), simpelweg omdat er meer vragen (items) worden gesteld over de eerstgenoemde dan over de laatstgenoemde domeinen (zie ook “Overwegingen”).
De studie van King et al berekende met een secundaire analyse van eerder gepubliceerde RCT data de klinisch relevante effect sizes van de EORTC QLQ-C30 en FACT-G, zonder referentie standaard [King 2014] (37) bij 162 mensen met verschillende vormen van kanker. De FACT-G totaal score kon efficiënter verandering in kwaliteit van leven opmerken in de interventie arm van de RCT (relative efficiency, RE =0,31 (0,083; 0,69)) en tussen de armen (RE = 0,17 (0,009; 0,58)) dan de EORTC QLQ-C30 “global scale”. Het sociale domein van de EORTC QLQ-C30 was responsiever (difference in responsiveness, DR = 0,28 (0,024; 0,54)) en efficiënter (RE = 5,25 (1,21; 232,26)) dan het sociale domein van de FACT-G. Voor het fysieke, rol functioneren en het emotionele domein waren beide instrumenten vergelijkbaar responsief en efficiënt.
De EORTC QLQ-C30 werd door Snyder et al. [2010] (38) op zijn psychometrische eigenschappen onderzocht in een groep van 117 mensen met borst-, prostaat- of longkanker die op dat moment behandeld werden met chemotherapie, radiotherapie, hormonale behandeling, biologische therapie of therapie als onderdeel van een klinische trial met de Supportive Care Needs Survey-Short Form als referentie. Voor zes van de viertien EORTC QLQ-C30 domeinen is een AUC ≥ 0.70 gevonden (fysiek, emotioneel en rol functioneren, globale KvL, pijn en vermoeidheid). Voor alle zes domeinen werd een sensitiviteit gevonden van ≥ 0.84 en een specificiteit van ≥ 0.50.
De studie van Snyder et al. [2015] (39) berekende welke veranderingen op de EORTC QLQ-C30 relevant zijn voor het detecteren van verandering in zorgbehoeften zoals gemeten met de Supportive Care Needs Survey-Short Form bij 179 mensen met borst en colorectaal kanker [Snyder 2015] (39) De resultaten laten zien dat 10 punten verschil op zes van de veertien EORTC QLQ-C30 maten (fysiek, emotioneel en rol functioneren, globale KvL, pijn en vermoeidheid) een klinisch relevant verschil in zorgbehoeften weergeven.
Kwaliteit van de studies
De resultaten van bovengenoemde recente studies worden mogelijk vertekend door de lage response rate (King 2014: 18%) en het feit dat patiënten met een “major medical or psychiatric disorder” geëxcludeerd werden [King 2014] (37). Als vooral patiënten met een hoge mate van distress deelname weigerden, kan dat geleid hebben tot onderschatting van de diagnostische accuratesse van de instrumenten.
SIPP
Screening Inventory of Psychosocial Problems (SIPP)
De SIPP heeft 24 items die de mate van distress (ja, soms, nee) in mensen met kanker meet op de volgende dimensies: fysieke klachten (zeven items, score range 0–14), psychologische klachten (10 items, score range 0–20), sociale problemen (vier items, score range 0–8) en seksuele problematiek (3 items, score range 0-6 met optie ‘not applicable’ [Braeken 2011] (40).
De SIPP werd door Braeken et al getest bij 289 volwassen mensen met verschillende typen kanker die radiotherapie ontvingen in een Nederlands ziekenhuis. Het instrument werd als zeer betrouwbaar getest voor de detectie van distress: de interne consistentie (Cronbach’s α) voor het totale instrument was 0,91 (n = 174). Drie van de vier subschalen werden als betrouwbaar getest op groepsniveau: de interne consistentie (Cronbach’s α) was groter of gelijk aan 0,79. Alleen voor de sociale problemen subschaal werd een Cronbach’s α van 0,51 berekend. De fysieke klachten, psychologische klachten en sociale problemen subschalen gaven stabiele uitkomsten in de loop van de tijd: de intraclass correlation coëfficiënt (ICC) van de antwoorden over drie dagen bedroeg respectievelijk 0.86 (n = 214), 0.88 (n = 206) en 0.74 (n = 213). Wegens teveel ontbrekende gegevens werden de resultaten van de seksuele problemen schaal niet gepubliceerd.
Kwaliteit van de studie
De resultaten van de studie zijn mogelijk wat vertekend, doordat het respons percentage laag was (32,5%). Als vooral patiënten met een hoge mate van distress informed consent weigerden, kan dat geleid hebben tot onderschatting van de diagnostische accuratesse van de SIPP. Bovendien vulden niet alle patiënten de referentie vragenlijsten (HADS, Mental Adjustment to Cancer scale) in en werden niet alle patiënten geïnterviewd (diepte interview met de structured clinical interview for DSM IV).
Referenties
- 17 - Chambers SK, Zajdlewicz L, Youlden DR, Holland JC, Dunn J. The validity of the distress thermometer in prostate cancer populations. Psychooncology. 2014;23(2):195-203
- 18 - Clover K, Leigh Carter G, Adams C, Hickie I, Davenport T. Concurrent validity of the PSYCH-6, a very short scale for detecting anxiety and depression, among oncology outpatients. Aust N Z J Psychiatry. 2009;43(7):682-8
- 20 - Merport A, Bober SL, Grose A, Recklitis CJ. Can the distress thermometer (DT) identify significant psychological distress in long-term cancer survivors? A comparison with the Brief Symptom Inventory-18 (BSI-18). Support Care Cancer. 2012;20(1):195-8
- 22 - Ryan D, Gallagher P, Wright S, Cassidy E. Sensitivity and specificity of the Distress Thermometer and a two-item depression screen (Patient Health Questionnaire-2) with a 'help' question for psychological distress and psychiatric morbidity in patients with advanced cancer. Psychooncology. 2012;21(12):1275-84. [link]
- 26 - Gessler S, Low J, Daniells E, al. e. Signalering for distress in cancer patients: Is the Distress Thermometer a valid measure in the UK and does it measure change over time? A prospective validation study. Psycho-oncology. 2008
Verantwoording
Autorisatiedatum en geldigheid
Laatst beoordeeld :
Laatst geautoriseerd : 01-05-2017
Geplande herbeoordeling :
Algemene gegevens
Voor deze richtlijn is bekeken welk instrument het meest geschikt is bij het signaleren van distress en zorgbehoefte en hoe dit instrument dient te worden ingezet. Het instrument kan, naast de signalerende functie, gezien worden als hulpmiddel bij het gesprek, het biedt structuur en handvatten om gezamenlijk met de patiënt de problemen te bespreken, de behoefte aan extra zorg na te gaan en te bepalen wie deze zorg het beste zou kunnen verlenen. Het instrument vervangt niet de essentie van het in gesprek blijven met de patiënt over ervaringen en behoeften, integendeel, zij kan daarvan juist een goede basis vormen.
De behoefte aan een gesprek hoeft overigens niet per definitie vanuit een probleemstelling of last onderkend te worden. Het kan ook belangrijk zijn voor de patiënt om gelukkige momenten en positieve ervaringen te delen.
De richtlijn behelst het traject van signalering van distress en zorgbehoefte tot en met verwijzing naar een relevante gespecialiseerde psychosociale/(para)medische zorgverlener. De richtlijn bevat naast aanbevelingen over het instrument dat het meest geschikt is om distress en zorgbehoefte vast te stellen, ook aanbevelingen over de meetmomenten, het gesprek met de patiënt, verwijzing en organisatorische randvoorwaarden. De aanbevelingen zijn gebaseerd op een zo hoog mogelijke graad van wetenschappelijk bewijs en de richtlijn biedt de gebruikers inzicht hierin.
Doel en doelgroep
Doelstelling
De richtlijnwerkgroep wil met de richtlijn ‘Detecteren behoefte psychosociale zorg' bewerkstelligen dat bij alle volwassenen met kanker in de gehele oncologische zorgketen (klinisch, poliklinisch en in de thuissituatie) op systematische wijze gesignaleerd wordt of er sprake is van (verhoogde) distress en/of zorgbehoefte en bevorderen dat indien gewenst passende psychosociale en/of (para)medische zorg wordt aangeboden. Het tijdig signaleren van distress en zorgbehoefte en indien nodig tijdig verlenen van (extra) zorg draagt bij aan het voorkómen van ernstigere problematiek en kan resulteren in een betere kwaliteit van leven voor de patiënt.
Doelgroep
Deze richtlijn is bestemd voor alle professionals die betrokken zijn bij de diagnostiek, behandeling en begeleiding van volwassen mensen met kanker in de 1e, 2e en 3e lijn. In het bijzonder betreft dit de basisbehandelaars en de gespecialiseerde psychosociale/(para)medische zorgverleners. Tot deze professionals behoren:
- Basisbehandelaars (artsen -zoals medisch-oncoloog, hematoloog, chirurg-oncoloog, radiotherapeut-oncoloog, gynaecoloog-oncoloog, uroloog-oncoloog, MDL-arts, longarts-oncoloog, neurochirurg, dermatoloog, revalidatiearts, huisarts en bedrijfsarts), verpleegkundigen/verpleegkundig specialisten (in het ziekenhuis en in de thuissituatie) en de POH-GGZ);
- Gespecialiseerde psychosociale zorgverleners (maatschappelijk werkers, psychologen, psychiaters en geestelijk verzorgers, gespecialiseerd in de oncologie);
- (Para)medische zorgverleners (zoals (in de oncologie gespecialiseerde) fysiotherapeuten, ergotherapeuten, diëtisten, logopedisten, seksuologen, huid/oedeemtherapeuten, e.d.)
Samenstelling werkgroep
Deze werkgroepleden zijn afgevaardigd namens wetenschappelijke en beroepsverenigingen en hebben daarmee het mandaat voor hun inbreng.
Leden voorbereidingsgroep
dr. J. Hoekstra-Weebers, Medisch socioloog, namens de NVPO (co-voorzitter)
dr. M.H.M. van der Linden, Klinisch psycholoog, namens de NVPO (co-Voorzitter)
dr. M. Bannink, Psychiater, namens de NVvP
A.J. Berendsen, Huisarts, namens de NHG
drs. T. Brouwer, Ervaringsdeskundige, namens de Nederlandse Federatie van Kankerpatiëntenorganisaties
de Jong, Ervaringsdeskundige, namens de Nederlandse Federatie van Kankerpatiëntenorganisaties
J. Krol-Veraar, Verpleegkundig specialist, namens de V&VN verpleegkundig specialisten
prof.dr. J.A. Roukema, Oncologisch chirurg, namens de NVvH
mw.dr. L. Veerbeek, Adviseur richtlijnen, IKNL
mw.dr. M.J. Velthuis, Adviseur en procesbegeleider, IKNL
H. Hamelers-Paulus, Secretaresse, IKNL
Leden richtlijnwerkgroep
dr. J. Hoekstra-Weebers, Medisch socioloog, namens de NVPO (voorzitter)
prof.dr. N.K. Aaronson, Medisch socioloog, namens de NVPO
dr. M. Bannink, Psychiater, namens de NVvP
drs. T. Brouwer, Ervaringsdeskundige, namens de Nederlandse Federatie van Kankerpatiëntenorganisaties
dr. W.V. Dolsma, Radiotherapeut-oncoloog n.p., namens de NVRO
F.J.M. Eskens, Maatschappelijk werker, namens de NVMW (tot 15/04/2015)
N. Golsteijn, Verpleegkundig specialist, namens de V&VN Oncologie
C. Janssen, verpleegkundige in de thuissituatie, namens de V&VN Maatschappij & Gezondheid
K. de Jong, Ervaringsdeskundige, namens de Nederlandse Federatie van Kankerpatiëntenorganisaties (tot 18/08/2015)
J. Koopman, POH-GGZ, namens de LVPOHGGZ
J. Krol-Veraar, Verpleegkundig specialist, namens de V&VN verpleegkundig specialisten
dr. A. Kuin, Geestelijk verzorger, namens de VGVZ
drs. A.M. Mathot, Huisarts en Hospice-arts, UMC Utrecht, namens de NHG
prof.dr. J. Prins, Medisch psycholoog, namens de NVPO
prof.dr. J.A. Roukema, Oncologisch chirurg, namens de NVvH
M.H. van der Veldt, Medisch maatschappelijk werker, namens de NVMW (vanaf 15/04/2015)
drs. Y. Smit, Onafhankelijk onderzoeker/epidemioloog
dr. M.J. Velthuis, Adviseur en procesbegeleider, IKNL
mw. H. Hamelers-Paulus, Secretaresse, IKNL
Belangenverklaringen
Om de beïnvloeding van de richtlijnontwikkeling of formulering van de aanbevelingen door conflicterende belangen te minimaliseren zijn de leden van de werkgroep gemandateerd door de wetenschappelijke verenigingen.
Alle werkgroepleden hebben bij aanvang en bij de afronding van het richtlijn traject een belangenverklaring ingevuld. Hiermee geven de werkgroepleden aan onafhankelijk gehandeld te hebben bij het opstellen van de richtlijn.
Inbreng patiëntenperspectief
De richtlijnwerkgroep bestaat uit zorgverleners van verschillende psychosociale en (para)medische disciplines en patiëntvertegenwoordigers van de Nederlandse Federatie van Kankerpatientenorganisaties.
Methode ontwikkeling
Evidence based
Werkwijze
De voorbereidingsgroep heeft zich van juni 2014 t/m maart 2015 bezig gehouden met het schrijven van een plan van aanpak, ontwikkelen van een enquête voor de knelpunteninventarisatie, het op basis van de knelpunten-analyse bepalen van de belangrijkste knelpunten, formuleren van uitgangsvragen en formeren van de richtlijnwerkgroep. De voorbereidingsgroep is driemaal bijeen geweest.
In juli 2014 is een online enquête uitgezet onder professionals en patiënten(vertegenwoordigers) voor de knelpunteninventarisatie. Informatie over de enquête, verzendlijst en analyse van de knelpunteninventarisatie is weergegeven in de bijlagen 12 en 13. Op basis van de knelpunteninventarisatie heeft de voorbereidingsgroep zeven uitgangsvragen geformuleerd. Deze uitgangsvragen vormen de basis voor de evidence based modules van deze richtlijn die door de richtlijnwerkgroep zijn uitgewerkt.
De richtlijnwerkgroep bestaat uit zorgverleners van verschillende psychosociale en (para)medische disciplines en patiëntvertegenwoordigers van de Nederlandse Federatie van Kankerpatientenorganisaties.
Elke uitgangsvraag is toebedeeld aan meerdere werkgroepleden.
Werkgroepleden hebben input geleverd aan de methodologisch expert voor het uitvoeren van systematische zoekacties naar relevante literatuur met betrekking tot zijn of haar uitgangsvraag. De literatuur is geselecteerd door de methodologisch expert in samenwerking met de werkgroepleden. De geselecteerde literatuur is samengevat en voorzien van niveau van bewijs door de methodologisch expert, de werkgroepleden hebben daaraan bijgedragen. De werkgroepleden hebben vervolgens de overwegingen en aanbevelingen geformuleerd. De werkgroep heeft gedurende een periode van ongeveer tien maanden gewerkt aan de tekst voor de conceptrichtlijn. De teksten zijn tijdens meerdere telefonische en vier plenaire vergaderingen besproken en na verwerking van de commentaren geaccordeerd. De afzonderlijke teksten zijn samengevoegd en op elkaar afgestemd tot één document: de conceptrichtlijn. Deze is ter commentaar aangeboden aan de relevante wetenschappelijke verenigingen en landelijke en regionale (tumor)werkgroepen.
Zoekverantwoording
Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.