Delier bij volwassenen en ouderen

Initiatief: NVKG Aantal modules: 10

Meetinstrumenten voor screening en diagnostiek van delier

Uitgangsvraag

Met welke meetinstrumenten kan een delier het best worden opgespoord en gediagnosticeerd? Meer specifiek wordt hierbij tevens gekeken naar het subsyndromaal delier, hypo- of hyperactief delier, delier bij dementie en bij het hypokinetisch rigide syndroom?

 

Deze uitvraag omvat de volgende deelvragen:

  1. Met welke meetinstrumenten kan gescreend worden op een delier?
  2. Met welke meetinstrumenten kan een delier worden vastgesteld?
  3. Met welke meetinstrumenten kan het beloop (ernst, duur, subtype) van een delier gevolgd worden?

Aanbeveling

Screeningsinstrumenten

Gebruik als verpleegkundige de DOSS voor screenen op delier.

 

Overweeg het instrument AMT-4 als de voorkeur uitgaat naar een zeer eenvoudig instrument waarvoor geen scholing nodig is.

 

Diagnostische meetinstrumenten

Bevestig als arts de diagnose delier met de geldende DSM criteria, eventueel door gebruik te maken van de CAM of 3-D-CAM. Betrek hierbij naasten om beeld te krijgen van pre-morbide functioneren.

 

Subtypering

Gebruik als arts de DMSS als motorische subtypering van het delier gewenst is.

 

Beloop vervolgen met ernstmeetinstrumenten

Vervolg als verpleegkundige of arts het beloop van een delier met de DOSS.

 

Naasten en mantelzorgers

Betrek naasten en patiënt (inclusief verpleging en verzorging) in diagnosesetlling en beloop.

Overwegingen

Voor- en nadelen van de interventie en kwaliteit van bewijs

De in de studies gemeten sensitiviteit en specificiteit zijn eigenlijk altijd hoger dan in de klinische praktijk. Dat komt doordat er extra aandacht wordt besteed aan scholing en de meetinstrumenten vaak ook worden afgenomen door specifiek hierin-opgeleid personeel. Ook worden complexere patiënten soms geëxcludeerd in de studies.

 

Een andere beperking is dat gebruik gemaakt wordt van informatie die verkregen is uit observatie en een psychiatrisch onderzoek. In de hier besproken studies werd het klinisch oordeel van een arts, gebaseerd op de DSM criteria of CAM, als gouden standaard voor de diagnose delier gebruikt. Dit klinisch oordeel is feilbaar. Uit onderzoek blijkt ook dat de interobserver variabiliteit in de diagnose delier groot is (Numan, 2017). De hierna gepresenteerde data uit de literatuur zijn daardoor minder absoluut dan de getallen doen geloven.

 

Screening delier

Sinds de vorige richtlijn zijn een aantal nieuwe screeningsinstrumenten (4AT en Nu-De-SC) voor het delier ontwikkeld. Ten opzichte van de in Nederland veel gebruikte DOSS hebben deze nieuwkomers geen betere sensitiviteit of specificiteit. Wel is een voordeel van de 4-AT en de Nu-Desc dat deze minder tijd kosten om af te nemen. Daarnaast werd ook een aantal cognitieve screeningstesten beschreven dat aan het bed gebruikt kan worden, maar niet specifiek was ontworpen voor screening van een delier. Een voorbeeld hiervan is de OSLA. Mogelijk dat de OSLA beter een delier detecteert dan de DOSS bij patiënten met een dementie. Hier is echter meer onderzoek naar nodig.

 

Subtypering delier

Voor de subtypering van een delier lijkt de DMSS een goede sensitiviteit en specificiteit te hebben. Bij verdenking op een hypoactief delier kan de DMSS hierdoor steunend zijn. De bewijskracht voor deze bevindingen wordt echter als laag beoordeeld.

 

Tenslotte vragen verschillende omgevingen andere screeningsinstrumenten. Dit geldt onder andere op de spoedeisende hulp (SEH) (Tamune 2017). De focus voor deze richlijn ligt niet op screening naar een delier in verschillende omgevingen, zoals de spoedeisende hulp; meer onderzoek naar de juiste screeningsinstrumenten per (ziekenhuis) omgeving is nodig.

 

Kosten

Een delier zorgt voor een langere ligduur en daardoor hogere zorgkosten. Het is zeer aannemelijk dat screening leidt tot eerdere detectie en daardoor waarschijnlijk kosteneffectief is door verkorting van de ligduur. Screenen op een delier zorgt voor een belasting bij de stafleden, maar is wel kosteneffectief (SteelFisher 2011).

 

Aanvaardbaarheid, haalbaarheid en implementatie

De Inspectie voor de Gezondheidszorg heeft screenen op een delier bij risicopatiënten verplicht gesteld. Screenen op een delier vindt in de hedendaagse klinische praktijk in de regel plaats met behulp van de DOSS.

 

Verschillende behoeften

Veel meetinstrumenten worden afgenomen door verpleegkundigen die eerst worden opgeleid in het gebruik van dit meetinstrument. De vraag welk instrument het meest geschikt is voor screenen op het voorkomen van een delier hangt daarmee samen. Ook het optreden van risicofactoren, het wel of niet kunnen communiceren met de patiënt (beperkt bij CVA en dementie), als ook organisatie gerelateerde factoren (beschikbaar zijn van voldoende gekwalificeerd en getraind personeel) bepalen welk instrument het meest geschikt is. Ook kan het belastend zijn voor stafleden om iedere keer weer een nieuw screeningsinstrument te leren beheersen. Informatie van mantelzorgers kan ook behulpzaam zijn bij het diagnosticeren van een delier (Rosgen, 2018).

 

Behoefte aan meer zekerheid over diagnose delier

De gouden standaard bij delier diagnostiek is op dit moment nog het feilbare klinisch oordeel. Er bestaat behoefte aan biomarkers, die de diagnose delier met meer zekerheid ondersteunen. In kleine tot middelgrote studies met een hoog risico op bias zijn een 50-tal biomarkers onderzocht. Het is echter nog te vroeg om biomarkers in bloed en liquor te gebruiken in de klinische praktijk (Androvosa, 2015; Hall, 2017; Toft, 2019).

 

Een mogelijke alternatief is het EEG. In een overzichtsartikel wordt de 60 jarige relatie tussen EEG en delier beschreven (Neufeld, 2013).

Er vindt nog volop onderzoek plaats naar de plaats van het EEG in de diagnostiek van delier. Waarschijnlijk kan wel worden gesteld dat er reeds nu een indicatie bestaat voor een EEG registratie in situaties waarin de klinische diagnose wordt bemoeilijkt, zoals bij ernstige communicatieproblemen bijvoorbeeld bij een afasie of sedatie op de IC.

 

Waarden en voorkeuren van patiënten (en eventueel hun verzorgers)

Het lijkt aannemelijk dat patiënten de voorkeur geven aan een korte test in plaats van een heel uitgebreide vragenlijst en dat deze met een bekende zorgverlener kan worden ingevuld in plaats van alleen door een getrainde arts die de patiënt nog nooit gezien heeft. Verder werd om meer inzichten te krijgen in de waarden en voorkeuren van patiënten, heeft de Patiëntenfederatie het onderzoek ‘ervaringen rondom een delier’ uitgevoerd via hun patiëntenpanel. Deze vragenlijsten werd ingevuld door 91 mantelzorgers van patiënten die een delier hadden doorgemaakt in het afgelopen jaar. Hier volgt de belangrijkste informatie op het gebied van de diagnose van het delier. De diagnose werd in 29% van de gevallen vastgesteld door de huisarts. In 19% van de gevallen werd een andere specialist genoemd die betrokken was bij de diagnose van het delier zoals een oncoloog, internist, cardioloog, hematoloog, neuroloog en orthopeed. Daarna volgden diagnoses door se verpleegkundige (19%), Geriater (18%), Intensivist (16%), wijkverpleegkundige (3%), psychiater (3%), anders (20%) of weet niet (4%).

In 74% van de gevallen werd het delier snel herkend door de ‘zorgverlening’, maar in 26% van de gevallen duurde het even. De Patiëntenfederatie geeft daarom de volgende aanbevelingen op het gebied van de diagnostiek:

  • Wees alert op een mogelijk delier ondanks eventuele comorbiditeit of een andere hoofddiagnose.
  • Breng een patiënt in een veilige omgeving.
  • Betrek de naaste(n) in de diagnosestelling en bespreek dit.
  • Geef informatie over het delier, het verloop, de ernst, de recidiefkans en de duur ervan (eventueel schriftelijk) met name voor de naaste(n).

 

Rationale/ balans tussen de argumenten voor en tegen de interventie

Ten opzichte van de reeds langer bestaande screeningsinstrumenten voor een delier, hebben de nieuwe screeningsinstrumenten mogelijk een klein voordeel doordat ze iets minder tijdsintensief zijn. Anderzijds is de DOSS in Nederland goed ingevoerd en zijn verpleegkundigen gewend hiermee te werken.

 

Ten opzichte van de reeds langer bestaande diagnostische meetinstrumenten voor een delier kan mogelijk de 3D CAM een aanvulling zijn, echter onderzoek hiernaar is nog beperkt.

Onderbouwing

Er zijn verschillende meetinstrumenten beschikbaar waarmee gescreend kan worden op delier. Ook zijn er meetinstrumenten beschikbaar om de diagnose delier te stellen. Het beloop (ernst, duur, subtype) van een delier kan ook gevolgd worden met een meetinstrument. In de vorige versie van de richtlijn werd het gebruik van de Delirium Observation Screening Scale (DOSS), als screeningsinstrument en de Confusion Assessment Method (CAM), als diagnostisch instrument aangeraden. Ondanks de inzet van deze instrumenten, is het echter nog steeds een probleem dat een delier vaak veel te laat wordt ontdekt. Daarom is er naast de DOSS en CAM blijvend behoefte aan eenvoudige meetinstrumenten die laagdrempelig kunnen worden afgenomen.

Na beoordeling van de literatuur blijkt een differentiatie naar motorische subtypes delier zelden te zijn meegenomen in de beschreven studies. Er was wel één instrument specififek ontwikkeld voor deze subtypes; dat wordt als laatste hieronder besproken.

 

PICO 1 Korte screeningsinstrumenten specifiek ontworpen voor screening van een delier

DOSS

DOSS, setting ziekenhuis

Redelijk

GRADE

De DOSS had een goede sensitiviteit (89-100%) en specificiteit (87-97%) voor het screenen op een delier door verpleegkundigen.

 

Bronnen: (Schuurman,, 2003; Van Gemert, 2007; Koster, 2009)

 

Verpleeghuis

DOSS, setting verpleeghuis

Laag

GRADE

De DOSS had een matige sensitiviteit (61%) en specificiteit (71%) voor het screenen op een delier in het verpleeghuis.

 

Bronnen: (Teale 2018)

 

NU-DeSC

Redelijk

GRADE

De Nu-DeSC had een matig tot goede sensitiviteit (42 tot 80%) en een goede specificiteit (81 tot 98%) voor het screenen op een delier door verpleegkundigen.

 

Bronnen: (Claessen Lingehall, 2013; Hargrave, 2017; Neufeld, 2013)

 

4AT

Hoog

GRADE

De 4AT had een goede sensitiviteit 87-90% en een redelijke specificiteit 70 tot 80%

 

Bronnen: (Bellelli, 2014; De, 2017; Hendry, 2016)

 

Korte cognitieve screeningstesten, niet specifiek ontworpen voor screening van een delier

AMT4

4AT

Redelijk

GRADE

De AMT4 had een sensitiviteit van 83 tot 92% en specificiteit van 61 tot 82%.

 

Bronnen: (Dyer, 2017; Hendry, 2016; Lees, 2015)

 

MOTYB

Redelijk GRADE

De MOTYB had een sensitiviteit van 75 tot 95% en specificiteit van 50 tot 90%.

 

Bronnen: (Adamis, 2016; Fick, 2015; Grossman, 2017; Hendry, 2016; Leonard, 2016; O’Regan, 2014; O’Regan, 2017; Voyer, 2016)

 

OSLA

Redelijk GRADE

De OSLA had een sensitiviteit van tot 85 tot 90%, en een specificiteit van 82 tot 90%.

 

Bronnen: (Tieges, 2013; Richardson, 2017)

 

OSLA bij patiënten met dementie

Laag

GRADE

Bij patiënten met dementie werd een sensitiviteit van 74% gezien en een specificiteit van 96%.

 

Bronnen: (Richardson, 2017)

 

Diagnostische meetinstrumenten

CAM

Redelijk

GRADE

De CAM en de verkorte versie van de CAM hadden een matig tot goede sensitiviteit (46 tot 90%) en redelijke tot goede specificiteit (63 tot 100%) voor het diagnosticeren van een delier.

 

Bronnen: (Fabbri, 2001; Gonzalez, 2004; Hestermann, 2009; Laurila, 2002; Martins, 2015; Monette, 2001; Pompei, 2015; Ryan, 2009; Thomas, 2012; Wongpakaran, 2011)

 

3D CAM

Laag

GRADE

De 3D CAM lijkt een goede sensitiviteit (92 tot 95%) en goede specificiteit (94 tot 100%) te hebben.

 

Bronnen: (Marcantonio, 2014; Vasulinashorn, 2016)

 

Beloop vervolgen met ernstmeetinstrumenten

Beloop vervolgen (Ernst, duur, subtype)

DOSS

Redelijk

GRADE

De DOS lijkt geschikt om beloop (ernst en duur) te vervolgen.

 

Bronnen: (Andrew, 2009; De Negreiros, 2008; De Rooij, 2006)

)

 

DRS-R-98

Redelijk

GRADE

De DRS-R-98 lijkt een matig tot goede sensitiviteit (56 tot 93%) en een goede specificiteit (82 tot 95%) te hebben voor vervolgen beloop(ernst) van een delier.

 

Bronnen: (Andrew, 2009; De Negreiros, 2008; De Rooij, 2006)

)

 

Subtypering delier

DMSS

Laag

GRADE

De DMSS lijkt een matige tot goede sensitiviteit (56 tot 100%) en goede specificiteit (88 tot 97%) te hebben voor beloop (de subtypering) van een delier.

 

Bronnen: (Adamis, 2016; Fitzgerald, 2016; Slor, 2014)

Beschrijving studies

De literatuursearch leverde drie geschikte systematische reviews op (De, 2017; Van Velthuijsen, 2016) en Quispel-Aggenbach, 2018) die aan de diverse PICO’s voldeden. De belangrijkste resultaten uit de afzonderlijke studies die in deze reviews geïncludeerd waren, werden beschreven in de evidence tabellen.

 

Er werden bijna geen studies gevonden die gekeken hadden naar het subsyndromaal delier, hypo- of hyperactief delier, delier bij dementie en/of bij het hypokinetisch rigide syndroom, maar de Delirium Motor Subtypes Scale (DMSS) was specifiek ontwikkeld om motorische subtypes van een delier te herkennen en wordt daarom hier ook beschreven (Meagher, 2008).

 

De systematische review van Quispel Aggenbach (2018) was een review specifiek gericht op snelle screeningsinstrumenten die binnen drie minuten aan het bed konden worden gebruikt bij ouderen. Dit review includeerde 31 publicaties hierover tot en met december 2017. De systematische review van Van Velthuijsen (2016) beschreef de psychometrische eigenschappen van delier gemeten met meetinstrumenten gericht op de screening en diagnostiek van delier bij ouderen. Deze systematische literatuurreview includeerde tot en met 14 september 2015 43 artikelen die 28 verschillende meetinstrumenten beschreven.

De systematische review door De (2017) includeerde tot en met juli 2014 31 studies die 21 screenings- en diagnostische meetinstrumenten beschreven, gericht op ziekenhuispatiënten.

 

In de reviews van Van Velthuijsen (2016) en ‘De (2017)’ werd geen aandacht besteed aan motorische subtypes van delier of subsyndromaal delier.

 

De review van Van Velthuijsen (2016) beschreef vijf meetinstrumenten die in drie of meer kwalitatief goede studies waren beschreven (Van Velthuijsen, 2016). Dit betrof de DOSS, Nursing Delirium Screening Scale (Nu-DESC), CAM, CAM-ICU en Delirium Rating Scale Revised 98 (DRS-R-98). Voor de CAM werden de resultaten van de volledige versie en van de verkorte versie toegepast buiten de IC hier beschreven en studies uitgevoerd op de IC geëxcludeerd, aangezien deze richtlijn zich niet richt op de IC.

 

De diverse screeningsinstrumenten werden ook uitgelicht in de review van De; bovendien werden daar de Memorial Delirium Assessment Scale (MDAS), Single Question in Delirium (SQiD) en 4A’s Test (Alertness, Abbreviated mental test, Attention, Acute change or fluctuation in mental status: (4AT)) uitgebreid besproken. De 4AT was ondertussen ook in drie overige studies gevalideerd, dus wordt hieronder ook besproken.

 

Resultaten

Er werd voor de beschrijving van deze resultaten uitgegaan van de hierboven genoemde drie systematische reviews (De, 2017; Van Velthuijsen, 2016; Quispel-Aggenbach, 2018).

 

De review van Quispel-Aggenbach (2018) ging grotendeels in op korte cognitieve tests veelal gericht op aandacht en opwinding. Deze tests werden beschouwd als potentiele screeningsinstrumenten. Dit review excludeerde alle meetinstrumenten waarvoor extra informatie nodig was (medisch dossier, mantelzorger et cetera). Veel van de geïncludeerde tests zijn heel kort en geven aan dat er mogelijk sprake zou kunnen zijn van een aandachtsstoornis, het centrale kenmerk van een delier, zonder dat een andere cognitieve stoornis wordt uitgesloten. Verder onderzoek moet dan uitwijzen of het hier daadwerkelijk om een delier gaat, bijvoorbeeld door de inzet van meer specifieke diagnostische meetinstrumenten. De volgende testen voldeden aan de eerder beschreven sensitiviteits- en specificiteitscriteria (sensitiviteit van 90% of hoger in combinatie met specificiteit van 80% of hoger). Het gaat dan om de volgende tests: Abbreviated Mental Test (AMT-4), Digit cancellation test (DCT-2), Global Attentiveness Rating GAR, the months of the year backwards “(MOTYB, en Richmond Agitation and Sedation Scale (RASS) en Observational Level of Aurosal (OSLA). De DCT-2 en Global Attentiveness Rating (GAR) werden allebei slechts in één studie gevalideerd (O’Keefe 1997) en worden daarom verder niet besproken.

 

Niet beschreven meetinstrumenten

De MDAS wordt in deze richtlijntekst buiten beschouwing gelaten aangezien deze was gevalideerd bij patiënten met kanker en aids (Breitbart, 1997), wat de toepassing beperkt. De SQiD (Single Question in Delirium) nodigt de patiënt uit om een reis gedetailleerd te beschrijven (Lin, 2015), en werd verder buiten beschouwing gelaten. De Delirium Diagnostic Tool Provisional (DDT Pro) werd buiten beschouwing gelaten aangezien deze alleen was gevalideerd in een kleine groep patiënten met hersenletsel (Kean, 2010). De Kloktekentest en Mini Mental State Examination (MMSE) werden buiten beschouwing gelaten aangezien deze niet geschikt zijn als screeningsinstrument voor delier (Adamis, 2016; Mitchell, 2014).

 

PICO 1 Korte screeningstesten specifiek ontworpen voor screening van een delier

DOSS

Er werden drie studies gevonden die de DOSS (Delirium Observation Screening Scale ) hadden gevalideerd in een ziekenhuis (Van Gemert, 2007; Koster, 2009; Schuurman, 2003). Eén studie bestudeerde het gebruik van de DOSS in een verpleeghuis (Teale, 2018). De DOSS is een screeningsinstrument dat door de verpleegkundige gebruikt kan worden. De DOSS is gebaseerd op de DSM-IV diagnostische criteria voor delier. De originele versie van de schaal bevatte 25 gedragsitems die acht diagnostische en gerelateerde symptomen omvatten: verstoringen van het bewustzijn, aandacht en concentratie, stemming en perceptie, denken, geheugen, oriëntatie, psychomotore activiteit, slaap-waak patroon. Een gemiddelde score van > 3 over 3 diensten gemeten maakte een delier waarschijnlijk. Deze gedragsitems zijn waar te nemen door een getrainde verpleegkundige met basiskennis van geriatrie. De DOSS kan in minder dan vijf minuten worden ingevuld. In de studie van Schuurman (2003) werd de DOSS gevalideerd: van de 82 patiënten opgenomen op een geriatrische afdeling ontwikkelden vier een delier en van de 92 patiënten opgenomen met een heupfractuur ontwikkelden 18 een delier. Deze patiënten waren gemiddeld 83 jaar (SD=6) oud. In 2007 werd een ingekorte versie van de DOSS gevalideerd. De ingekorte DOSS bevat 13 items die de volgende diagnostische en gerelateerde symptomen omvatten: aandacht en concentratie, denken, geheugen, alertheid, emotie, traagheid, oriëntatie, psychomotore activiteit, slaap waak patroon, stemming en perceptie. Onderzoek werd uitgevoerd bij patiënten van 70 jaar of ouder met minstens drie andere aandoeningen (Van Gemert, 2007).

 

Een sensitiviteit van (89 en 100%) en specificiteit (87% en 97%) werd berekend in twee studies in vergelijking met DSM-IV diagnose door een geriater (Van Gemert, 2007; Schuurman, 2003).

 

In 2009 werd de ingekorte DOSS geëvalueerd bij 112 patiënten die een electieve hartoperatie hadden ondergaan (Koster). Vierentwintig patiënten (21,4%) werden delirant. De sensitiviteit en specificiteit van de DOSS voor het herkennen van het delier bedroeg respectievelijk 100% en 97%.

 

In 2018 werd de 25-item DOSS gevalideerd in negen verpleeghuizen in het Verenigd Koninkrijk (Teale, 2018). De DOSS werd afgenomen bij 216 bewoners met een gemiddelde leeftijd van 84,9 jaar en vergeleken met de CAM als gouden standaard. De CAM werd tweemaal per week bij de deelnemers afgenomen. Gedurende 15 maanden was de CAM 78 maal positief voor een delier. De sensitiviteit van de DOSS, afgenomen door getrainde verzorgenden bedroeg 0,61 en de specificiteit 0,71. Een positieve DOSS heeft beperkte waarde in het verpleeghuis; een negatieve DOSS sluit een delier vrijwel uit.

 

NU-DeSC

De Nursing Delirium Screening Scale (NU-DeSC) is een observationeel instrument dat werd ontwikkeld speciaal voor verpleegkundigen. Het werd gevalideerd in vier studies. De schaal heeft vijf items: oriëntatie, gedrag, communicatie, illusies/hallucinaties en psychomotore retardatie. Deze items werden allemaal gescoord op een twee-punts schaal; het totale score bereik lag daarmee tussen 0 en 10. 0 stond hierbij voor geen symptomen en score van > 2 maakte een delier waarschijnlijk. De schaal is observationeel en wordt idealiter driemaal daags gescoord tijdens iedere verpleegkundige shift en kan in minder dan twee minuten worden uitgevoerd. Het instrument is gratis toegankelijk, maar training is wel noodzakelijk.

 

Sensitiviteit (range 32% tot 96%, met één score onder 72%) en specificiteit (range 69% tot 92%, met één score onder 79%) werd beschreven in vier validatiestudies (Claessen Lingehall, 2013; Leung, 2008; Neufeld, 2013). Echter de hoogste sensitiviteit (96%) werd gezien in de studie van Leung, waarin een afwijkende afkapwaarde van >0 werd gehanteerd.

 

4AT

De 4A’s Test (4AT) bestaat uit vier items, het eerste item test alertheid, vervolgens twee korte cognitieve screeningstests: de Abbreviated Mental Test (AMT4) en het opnoemen van maanden in omgekeerde volgorde en tot slot een inschatting van acute veranderingen of fluctueringen in de mentale status (MacLullich, 2011).

 

In een validatiestudie werd de 4AT bij 70-plussers op een acute geriatrische afdeling en revalidatieafdeling afgezet tegen de DSM-IV-TR diagnose gesteld door een geriater. Deze beschreef een goede sensitiviteit (90%) en specificiteit (84%) (Bellelli, 2014). Een andere validatiestudie uitgevoerd bij 65-plussers op een geriatrische of orthogeriatrische afdeling valideerde de 4AT tegen de DSM5 en de CAM. Deze vond een sensitiviteit van 87% en 80% voor het detecteren van delier, 86% en 71% bij patiënten met mogelijke dementie (De, 2017), daarbij werd een oppervlak onder de ROC-curve van 0,92 en 0,89 gezien bij patiënten met mogelijke dementie. Een andere validatiestudie valideerde 4AT met DSM 5 en ook andere screeningsinstrumenten: Abbreviated Mental Test (AMT) bij 500 patiënten gemiddeld 83 jaar (Hendry, 2016) op een geriatrie afdeling met DSM 5 diagnose als referentie. Deze studie liet een sensitiviteit van 87% en een specificiteit van 70% zien.

 

Korte cognitieve screeningstesten, niet specifiek ontworpen voor screening van een delier

AMT4

De abbreviated mental test (AMT-4), is een onderdeel van de 4AT die hierboven besproken wordt. Hij is ontworpen om een snelle inschatting te maken van een mogelijke dementie maar kan ook in het kader van een screening van delier worden ingezet. Deze test werd gevalideerd in drie studies en de referentiestandaard was dan een CAM-ICU (Dyer 2017), DSM-IV (Hendry, 2016) of een CAM (Lees, 2013). Een sensitiviteit van 83% tot 92% werd gezien en een specificiteit van 61% tot 82% in deze studies.

 

MOTYB

Months of the year backwards (MOTYB), bestaat uit het achterstevoren opnoemen van de maanden van het jaar. Dit is ook een onderdeel van de 4AT die verderop in de tekst besproken wordt. Deze test werd het vaakst onderzocht (Adamis, 2016; Fick, 2015. Grossman, 2017; Hendry, 2016; Leonard, 2016; O’Regan, 2014; O’Regan, 2017; Voyer, 2016) tegen een DSM IV of DSM 5 diagnose of een DRS-R-98. Een sensitiviteit van 75 tot 95% werd gezien en een specificiteit van 50 tot 90%.

 

RASS

De Richmond Agitation Sedation Scale (RASS) is een schaal die veelal op de IC wordt gebruikt om de diepte van de sedatie te meten, maar hij wordt nu ook gebruikt om het niveau van bewustzijn te meten om delier status in te schatten.

 

Het item sedatie werd dan vervangen door sufheid. De RASS is niet gevalideerd om een delier te meten en dus niet bruikbaar bij de screening op een delier en wordt daarom hier verder niet besproken.

 

OSLA

De Observational Scale of Level of Arousal (OSLA) is een kort meetinstrument dat niveau van opwinding meet. Hij wordt gescoord na een korte interactie met de patiënt. De onderdelen van het meetinstrument zijn: ogen openen, oogcontact, houding en beweging. Ieder onderdeel wordt gescoord en de score kan van 0 tot 15 variëren. Bij een score boven de 3 werd een delier waarschijnlijk. Dit meetinstrument werd onderzocht bij 30 mensen met een heupfractuur (Tieges, 2013) en bij 114 mensen van 70 jaar en ouder die deels ook dementie hadden. De OSLA had een sensitiviteit van tot 85 tot 90%, en een specificiteit van 82 tot 90% (Tieges, 2013; Richardson, 2017). Bij patiënten met dementie werd een sensitiviteit van 74% gezien en een specificiteit van 96% (Richardson, 2017).

 

PICO 2 Diagnostische meetinstrumenten

CAM

De CAM (Confusion Assessment Method) is een semigestructureerd interview, gebaseerd op de DSM criteria. Het bestaat uit negen items acuut begin, onoplettendheid, onlogisch denken, verminderd bewustzijnsniveau, desoriëntatie, slecht geheugen, verstoorde waarneming, psychomotore retardatie en een verstoord slaap-waakritme. De volgende vier zijn cruciaal: acuut begin en fluctuerend verloop, onoplettendheid, onlogisch denken en een verminderd bewustzijnsniveau. Het afnemen van de volledige CAM kost 7 tot 15 minuten. Er werd ook een verkorte versie ontwikkeld bestaande uit de volgende drie criteria: acuut begin en fluctuerend beloop, aandachtstoornis en onlogisch denken of verminderd bewustzijnsniveau. De verkorte versie van de CAM werd gebruikt in de studies van Laurila (2002), Monette (2001) en Pompei (1995). Het instrument was ontwikkeld voor gebruik door clinici, niet-psychiaters, maar werd in twee studies ook door verpleegkundigen afgenomen.

 

Sensitiviteit varieerde van 46% tot 94% (Pompei, 1995; Monette, 2001). De specificiteit had een range van 63% tot 100%, hoewel alle studies behalve die van Laurilla, 2002 een specificiteit van 90% of hoger rapporteerden. De interrater reliability werd gerapporteerd en de kappa varieerde van 0,65 tot 1,00.

 

De sensitiviteit van de korte versie van de CAM varieerde van 53 tot 90% en de specificiteit van 84 tot 100%.

 

3D CAM

Het drie minuten durende diagnostische interview voor CAM-gedefinieerd delier (3D-CAM) is een korte 20-item beoordeling (10 cognitieve items en 10 interviewer observaties) gebaseerd op het CAM algoritme. Het werd afgeleid van de 160-item gestructureerde beoordeling met de item respons theorie en modeleringstechnieken. Deze items werden specifiek geselecteerd om het CAM algoritme te operationaliseren.

 

De 3D CAM werd gevalideerd bij 201 patiënten boven de 75 jaar op een algemene ziekenhuisafdeling tegen de DSM-IV. Er werd een sensitiviteit van 95% en een specificiteit van 94% gezien (Marcantonio, 2014). Een andere studie vond dat de interne consistentie goed scoorde met een kappa van 0,93 en 0,84 bij vergelijking van twee populaties met in totaal 566 patiënten (Vasulinashorn, 2016).

 

PICO 3 Beloop vervolgen (ernst, duur subtype)

DOSS

Als instrument om de ernst van het delier te meten werd de ingekorte DOSS (Delirium Observation Screening Scale) in één studie onderzocht (Scheffer, 2011). De mate van overeenkomst tussen de scores op de DOSS en de DRS-R-98 werd onderzocht bij 97 patiënten met delier gediagnosticeerd met de CAM-lijst. Er werd een correlatie van 0,67 gevonden tussen beide instrumenten. De mate van overeenkomst was groter bij patiënten zonder cognitieve beperkingen (0,67) dan bij patiënten met cognitieve beperkingen (0,61), zoals vastgesteld met de IQCODE. Bij patiënten met een hypoactief delier was de correlatie 0,40; bij een hyperactief delier 0,44 en bij de gemengde vorm 0,69.

 

DRS-R-98

De herziene versie van de DRS (Delirium Rating Scale) dient om delier te diagnosticeren en de ernst van het delier te kwantificeren. Deze 16-item schaal bevat een aantal diagnostische items: acuut begin, fluctuerend beloop en lichamelijke stoornissen en items die de ernst bepalen: aandacht, oriëntatie, geheugen (korte en lange termijn), slaap-waakcyclus stoornissen, verstoorde waarneming en hallucinaties, waanbeelden, betrouwbaarheid gevoelsleven (‘liability of affect’), taal, verstoord denken, rusteloze activiteit gepaard gaande met angst en opwinding of motorische traagheid. Drie items zijn gericht op het detecteren van delier en 13 op het meten van de ernst van het delier. Scores variëren van 0 tot 44 en patiënten met een score hoger dan 18 worden als delier-positief beoordeeld. Dit meetinstrument werd ontwikkeld voor gebruik door clinici en niet door verpleegkundigen, en een korte training voor niet-psychiaters werd aanbevolen. De tijdsduur van afname of kosten werden niet beschreven.

 

De DRS-R-98 werd gevalideerd in vier verschillende studies (Andrew, 2009; De Negreiros, 2008; De Rooij, 2006 en Whittamore 2014). De sensitiviteit was 56%, 57%, 75% en 93%; en de specificiteit was 71%, 82%, 95% en 98%. In de diverse studies is niet gekeken naar de waarde van de DRS-R-98 als ernstinstrument. Dit is ook lastig omdat er immers geen gouden standaard bestaat om de ernst aan af te meten. Deze gouden standaard bestaat wel voor het vaststellen of er al of niet een delier aanwezig is.

 

Subtypering delier

Delirium motor subtyping scale (DMSS)

De originele DMSS (Delirium Motor Subtyping Scale) (Meagher, 2008) bestaat uit 11 motorische symptomen van delier (4 hyperactieve en 7 hypoactieve) geselecteerd vanwege hun fenomenologie. Ook waren ze specifiek voor delier ten opzichte van controles. De DMSS kan ingevuld worden door een professional die de DSM 5 criteria voor delier kent. Elk item werd gescoord als aanwezig of afwezig door observatie en bespreking met de verantwoordelijke verpleegkundige voor de afgelopen 24 uur. Er moesten minstens twee symptomen van een subtype aanwezig zijn om te voldoen aan een subtype. Patiënten die aan beide types voldeden werden als ‘gemengd’ type geclassificeerd en patiënten die aan geen type voldeden werd als ‘geen subtype’ geclassificeerd.

 

Eén studie valideerde de DMSS in Nederland en vond een sensitiviteit van 56% (gemengd) tot 100% (hyperactief of geen subtype) en specificiteit van 88% (hypoactief) tot 97% (gemengd subtype) (Slor, 2014). Adamis (2016) vond een hoge interne consistentie voor de DMSS (Ω = 0,90).

 

Bewijskracht van de literatuur (per instrument)

Korte screeningsinstrumenten ontworpen voor screening delier

DOSS, setting ziekenhuis

Gebaseerd op diagnostische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. Bewijskracht werd verlaagd wegens inconsistentie aangezien de gemeten sensitiviteit en specificiteit sterk varieerde tussen de studies; bewijskracht werd als redelijk gegradeerd.

 

DOSS, setting verpleeghuis

Gebaseerd op diagnostische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. Bewijskracht werd verlaagd wegens indirectheid aangezien de situatie in de UK niet goed vergelijkbaar is met de Nederlandse situatie en ook wegens imprecisie aangezien er maar 1 studie beschikbaar was; bewijskracht werd als laag gegradeerd

 

NU-DeSC

Gebaseerd op diagnostische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. Bewijskracht werd niet verlaagd voor beperkingen in studies; risk of bias was laag voor de vier studies. Inconsistentie: één studie zag een veel lagere sensitiviteit dan gemeten in de andere studies hiervoor werd de bewijskracht verlaagd; indirectheid was niet van toepassing; bewijskracht werd als redelijk gegradeerd.

 

4AT

Gebaseerd op diagnostische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. Bewijskracht werd niet verlaagd voor beperkingen in studies; risk of bias was laag voor de drie studies. Inconsistentie en indirectheid was niet van toepassing, bewijskracht werd als hoog gegradeerd.

 

Korte cognitieve screeningstesten niet specifiek ontworpen voor screening van een delier

AMT4

Gebaseerd op diagnostische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. In de studie van Dyer was het niet duidelijk of indextest en referentietest onafhankelijk van elkaar waren beoordeeld, daarom werd de bewijskracht verlaagd naar redelijk.

 

MOTYB

Gebaseerd op diagnostische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. In de studie van Adamis (2016) en O’Reagan (2014) was het onduidelijk of sprake was van blindering van de beoordelaars, daarom werd de bewijskracht verlaagd naar redelijk.

 

RASS

De RASS werd niet ontwikkeld om een delier te meten en daarom werd hier geen bewijskracht toegekend of een conclusie over getrokken.

 

OSLA

Gebaseerd op diagnostische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. De bewijskracht werd verlaagd wegens beperkingen in de studie van Tieges en Richardson (onduidelijk of de beoordelaars van de beide meetinstrumenten geblindeerd waren voor de andere meting), daarom werd de bewijskracht verlaagd naar redelijk. Voor patiënten met dementie werd slechts één studie gevonden, daarom werd de bewijskracht hier verlaagd naar laag wegens imprecisie.

 

Diagnostische meetinstrumenten delier

CAM

Gebaseerd op diagnostische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. Bewijskracht werd niet verlaagd voor beperkingen in studies; risk of bias was laag voor de meeste studies. Inconsistentie: twee studies zagen een veel lagere sensitiviteit en één studie zag een veel lagere specificiteit dan gemeten in de andere studies; hiervoor werd de bewijskracht verlaagd; indirectheid was niet van toepassing; bewijskracht werd als redelijk gegradeerd.

 

3D CAM

Gebaseerd op diagnostische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. Bewijskracht werd verlaagd voor beperkingen in studies; risk of bias was laag voor één studie en onbekend voor de andere. Inconsistentie: niet van toepassing want dit werd slechts in één studie ingeschat; daarom werd de bewijskracht wel verlaagd wegens imprecisie; indirectheid was niet van toepassing; bewijskracht werd als laag gegradeerd.

 

Beloop vervolgen

DRS-R-98

Gebaseerd op klinimetrische studies, daarvan start de bewijskracht als hoog. Bewijskracht werd niet verlaagd voor beperkingen in studies; risk of bias was laag voor de vier studies. De resultaten tussen de studies varieerden sterk, daarom werd de bewijskracht met één niveau verlaagd; indirectheid was niet van toepassing; bewijskracht werd als redelijk gegradeerd.

 

Subtypering delier

DMSS

Gebaseerd op klinimetrische studies, daarvan start de bewijskracht als hoog. De diagnostische accuratesse werd gemeten in de vorm van sensitiviteit en specificiteit. De bewijskracht werd verlaagd voor imprecisie omdat de DMSS maar in één studie was gebruikt; indirectheid werd ook voor verlaagd want de DSM werd hier niet gebruikt als gouden standaard; bewijskracht werd als laag gegradeerd.

Om de uitgangsvraag te kunnen beantwoorden is er een systematische literatuuranalyse verricht naar de volgende zoekvraag (vragen):

 

PICO 1

P: patiënten met een verhoogd risico op een delier;

I: meetinstrument voor de screening van een delier zoals DOSS, Nu-DESC of 4 A’s Test;

C: DOSS of CAM;

R: klinische diagnose delier door een arts conform DSM;

O: diagnostische accuratesse.

 

PICO 2

P: patiënten met waarschijnlijk een delier;

I: Meetinstrumenten om een delier vast te stellen zoals de 3D-CAM

C: CAM;

R: klinische diagnose delier door een arts conform DSM;

O: diagnostische accuratesse.

 

PICO 3

P: patiënten met een delier;

I: meetinstrument om beloop (ernst, duur subtype) van het delier te volgen zoals de DRS of DOSS of DRS-R-98;

C: klinische diagnose delier door een arts conform DSM of DRS-R-98;

O: validiteit, betrouwbaarheid en meetfouten.

 

De meetinstrumenten worden ingedeeld in categorieën: screeningsinstrumenten, diagnostische meetinstrumenten en ernstmeetinstrumenten. In de literatuur worden deze termen regelmatig door elkaar gebruikt hetgeen de conclusies bemoeilijkt. Het is van fundamenteel belang een onderscheid te maken. Screeningsinstrumenten zijn bedoeld om zoveel mogelijk patiënten te vinden bij wie verschijnselen aanwezig zijn die zouden kunnen passen bij een delier. Deze meetinstrumenten dienen dus met name sensitief te zijn. Bij diagnostische meetinstrumenten is het doel het stellen van de diagnose. Deze meetinstrumenten dienen dus vooral specifiek te zijn. Bij meetinstrumenten die de ernst van het delier vaststellen is reeds vastgesteld dat er daadwerkelijk sprake is van een delier. Hiermee kan het delier in de tijd worden vervolgd.

 

Relevante uitkomstmaten

De werkgroep achtte de diagnostische accuratesse voor de besluitvorming cruciaal.

 

Grenzen voor klinische relevantie

Sensitiviteit van 90% of hoger in combinatie met specificiteit van 80% of hoger.

 

Zoeken en selecteren (Methode)

In de database Medline (via OVID) is op 10 april 2019 met relevante zoektermen gezocht naar literatuur over diagnostische meetinstrumenten voor delier. De zoekverantwoording is weergegeven onder het tabblad Verantwoording. De literatuurzoekactie leverde 682 treffers op. Studies werden geselecteerd op grond van de volgende selectiecriteria: in het ziekenhuis (polikliniek/afdeling), de algemene populatie, de huisartsenpraktijk en de langdurige zorg en uitgevoerd bij minstens 20 patiënten en tenminste drie studies moesten hetzelfde meetinstrument hebben onderzocht. Op basis van titel en abstract werden in eerste instantie 28 studies voorgeselecteerd. Na raadpleging van de volledige tekst, werd uitgegaan van drie systematische reviews (zie exclusietabel voor overzicht geëxcludeerde studies). En daarnaast nog één artikel over een vragenlijst voor subtypes delier de Delirium Motor Subtypes Scale (DMSS) (Meagher, 2008). Tevens werd nog één studie toegevoegd waarin de DOSS werd gebruikt in verpleeghuizen (Teale, 2018).

 

Resultaten

Drie systematische reviews zijn opgenomen in de literatuuranalyse en twee aanvullende studies. De belangrijkste studiekarakteristieken en resultaten zijn opgenomen in de evidencetabellen. De beoordeling van de individuele studieopzet (risk of bias) is opgenomen in de risk-of-biastabellen.

  1. Adamis D, Meagher D, O'Neill D, McCarthy G. The utility of the clock drawing test in detection of delirium in elderly hospitalised patients. Aging Ment Health. 2016 Sep;20(9):981-6.
  2. Adamis D, Scholtens RM, de Jonghe A, van Munster BC, de Rooij SE, Meagher DJ. Psychometric evaluation of the DMSS-4 in a cohort of elderly post-operative hip fracture patients with delirium. Int Psychogeriatr. 2016;28(7):1221-1228.
  3. Andrew, M.K., Bhat, R., Clarke, B., Freter, S.H., Rockwood, M.R., & Rockwood, K. (2009) Inter-Rater Reliability of the DRS-R-98 in Detecting Delirium in Frail Elderly Patients. Age and Ageing, 38, 241- 244.
  4. Bellelli G, Morandi A, Davis DH, Mazzola P, Turco R, Gentile S, Ryan T, Cash H, Guerini F, Torpilliesi T, Del Santo F, Trabucchi M, Annoni G, MacLullich AM. Validation of the 4AT, a new instrument for rapid delirium screening: a study in 234 hospitalised older people. Age Ageing. 2014 Jul;43(4):496-502.
  5. Breitbart W, Rosenfeld B, Roth A, Smith MJ, Cohen K, Passik S. The Memorial Delirium Assessment Scale. J Pain Symptom Manage. 1997 Mar;13(3):128-37.
  6. Claessen Lingehal H, Smulter N, Engström KG, Gustafson Y, Oloffson B.( 2013) Validation of the Swedish version of the Nursing Delirium Screening Scale used in patients 70 years and older undergoing cardiac surgery. J Clin Nurs, 22, 2858-2866.
  7. Chester JG, Beth Harrington M, Rudolph JL; VA Delirium Working Group. Serial administration of a modified Richmond Agitation and Sedation Scale for delirium screening. J Hosp Med. 2012 May-Jun;7(5):450-3.
  8. de Negreiros DP, da Silva Meleiro AM, Furlanetto LM, Trzepacz PT. Portuguese version of the Delirium Rating Scale-Revised-98: reliability and validity. Int J Geriatr Psychiatry. 2008 May;23(5):472-7.
  9. de Rooij SE, van Munster BC, Korevaar JC, Casteelen G, Schuurmans MJ, van der Mast RC, Levi M. Delirium subtype identification and the validation of the Delirium Rating Scale--Revised-98 (Dutch version) in hospitalized elderly patients. Int J Geriatr Psychiatry. 2006 Sep;21(9):876-82.
  10. De J, Wand APF, Smerdely PI, Hunt GE. Validating the 4A's test in screening for delirium in a culturally diverse geriatric inpatient population. Int J Geriatr Psychiatry. 2017 Dec;32(12):1322-1329.
  11. De J, Wand AP. Delirium Screening: A Systematic Review of Delirium Screening Tools in Hospitalized Patients. Gerontologist. 2015 Dec;55(6):1079-99. doi: 10.1093/geront/gnv100. Epub 2015 Nov 5.
  12. Dyer AH, Briggs R, Nabeel S, O'Neill D, Kennelly SP. The Abbreviated Mental Test 4 for cognitive screening of older adults presenting to the Emergency Department. Eur J Emerg Med. 2017 Dec;24(6):417-422.
  13. Engel GL, Romano J. Delirium, a syndrome of cerebral insufficiency. 1959. J Neuropsychiatry Clin Neurosci. 2004;16(4):526–538.
  14. Fabbri, R.M., Moreira, M.A., Garrido, R., & Almeida, O.P. (2001). Validity and Reliability of the Portuguese Version of the Confusion Assessment Method (CAM) for the Detection of Delirium in the Elderly. Arquivos De Neuro-Psiquiatria, 59, 175- 179.
  15. Fick DM, Inouye SK, Guess J, Ngo LH, Jones RN, Saczynski JS, Marcantonio ER. Preliminary development of an ultrabrief two-item bedside test for delirium. Hosp Med. 2015 Oct;10(10):645-50.
  16. Gemert, L.A. van, & Schuurmans, M.J. (2007). The Neecham confusion scale and the delirium observation screening scale: capacity to discriminate and ease of use in clinical practice. BMC Nursing, 6, 3.
  17. Gonzalez, M., Pablo, J. de, Fuente, E., Valdes, M., Peri, J.M., Nomdedeu, M., & Matrai, S. (2004). Instrument for Detection of Delirium in General Hospitals: Adaptation of the Confusion Assessment Method. Psychosomatics, 45, 426- 431.
  18. Grossmann FF, Hasemann W, Kressig RW, Bingisser R, Nickel CH. Performance of the modified Richmond Agitation Sedation Scale in identifying delirium in older ED patients. Am J Emerg Med. 2017 Sep;35(9):1324-1326.
  19. Han JH, Wilson A, Vasilevskis EE, Shintani A, Schnelle JF, Dittus RS, Graves AJ, Storrow AB, Shuster J, Ely EW. Diagnosing delirium in older emergency department patients: validity and reliability of the delirium triage screen and the brief confusion assessment method. Ann Emerg Med. 2013 Nov;62(5):457-465.
  20. Han JH, Vasilevskis EE, Schnelle JF, Shintani A, Dittus RS, Wilson A, Ely EW. The Diagnostic Performance of the Richmond Agitation Sedation Scale for Detecting Delirium in Older Emergency Department Patients. Acad Emerg Med. 2015 Jul;22(7):878-82.
  21. Hendry K, Quinn TJ, Evans J, Scortichini V, Miller H, Burns J, Cunnington A, Stott DJ. Evaluation of delirium screening tools in geriatric medical inpatients: a diagnostic test accuracy study. Age Ageing. 2016 Nov;45(6):832-837.
  22. Hestermann, U., Backenstrass, M., Gekle, I., Hack, M., Mundt, C., Oster, P., & Thomas, C. (2009). Validation of a German Version of the Confusion Assessment Method for Delirium Detection in a Sample of Acute Geriatric Patients With a High Prevalence of Dementia. Psychopathology, 42, 270- 276.
  23. Kimchi EY, Neelagiri A, Whitt W, Sagi AR, Ryan SL, Gadbois G, Groothuysen D, Westover MB. Clinical EEG slowing correlates with delirium severity and predicts poor clinical outcomes. Neurology. 2019 Sep 24;93(13):e1260-e1271.
  24. Koster, S., Hensens, A.G., Oosterveld, F.G., Wijma, A., & Palen, J. van der (2009).The delirium observation screening scale recognizes delirium early after cardiac surgery. Eur J Cardiovasc Nurs., 8, 309-314. Epub 2009 Mar 12.
  25. Laurila, J.V., Pitkala, K.H., Strandberg, T.E., & Tilvis, R.S. (2002). Confusion Assessment Method in the Diagnostics of Delirium Among Aged Hospital Patients: Would It Serve Better in Screening Than As a Diagnostic Instrument? International Journal of Geriatric Psychiatry, 17, 1112- 1119.
  26. Lees R, Corbet S, Johnston C, Moffitt E, Shaw G, Quinn TJ. Test accuracy of short screening tests for diagnosis of delirium or cognitive impairment in an acute stroke unit setting. Stroke. 2013 Nov;44(11):3078-83.
  27. Leonard M, O'Connell H, Williams O, Awan F, Exton C, O'Connor M, Adamis D, Dunne C, Cullen W, Meagher DJ. Attention, vigilance and visuospatial function in hospitalized elderly medical patients: Relationship to neurocognitive diagnosis. J Psychosom Res. 2016 Nov;90:84-90.
  28. Leung Jl, Leung Vc, Leung CM, Pan PC. Clinical utility and validation of two instruments (the Confusion Assessment Method Algorithm and the Chinese version of Nursing Delirium Screening Scale) to detect delirium in geriatric inpatients. Gen Hosp Psychiatry. 2008 Mar-Apr;30(2):171-6.
  29. Leung JL, Lee GT, Lam YH, Chan RC, Wu JY. The use of the Digit Span Test in screening for cognitive impairment in acute medical inpatients. Int Psychogeriatr. 2011 Dec;23(10):1569-74
  30. Lin HS, Eeles E, Pandy S, Pinsker D, Brasch C, Yerkovich S. Screening in delirium: A pilot study of two screening tools, the Simple Query for Easy Evaluation of Consciousness and Simple Question in Delirium. Australas J Ageing. 2015 Dec;34(4):259-64.
  31. Marcantonio ER, Ngo LH, O'Connor M, Jones RN, Crane PK, Metzger ED, Inouye SK. 3D-CAM: derivation and validation of a 3-minute diagnostic interview for CAM-defined delirium: a cross-sectional diagnostic test study. Ann Intern Med. 2014 Oct 21;161(8):554-61.
  32. Martins S, Lourenço C, Pinto-de-Sousa J, Conceição F, Paiva JA, Simões MR, Fernandes L. Validation study of the European Portuguese version of the Confusion Assessment Method (CAM). Int Psychogeriatr. 2015 May;27(5):777-84.
  33. Mitchell AJ, Shukla D, Ajumal HA, Stubbs B, Tahir TA. The Mini-Mental State Examination as a diagnostic and screening test for delirium: systematic review and meta-analysis. Gen Hosp Psychiatry. 2014 Nov-Dec;36(6):627-33.
  34. Monette, J.G., Fung, S.H., Massoud, F., Moride, Y., Arsenault, L., & Afilalo, M. (2001) Evaluation of the Confusion Assessment Method (CAM) As a Screening Tool for Delirium in the Emergency Room. General Hospital Psychiatry, 23, 20- 25.
  35. Neefjes ECW, van der Vorst MJDL, Boddaert MSA, et al. Accuracy of the Delirium Observational Screening Scale (DOSS) as a screening tool for delirium in patients with advanced cancer. BMC Cancer. 2019;19(1):160.
  36. Neufeld KJ, Leoutsakos JS, Sieber FE, Joshi D, Wanamaker BL, Rios-Robles J, Needham DM. Evaluation of two delirium screening tools for detecting post-operative delirium in the elderly. Br J Anaesth. 2013 Oct;111(4):612-8.
  37. Numan T, van den Boogaard M, Kamper AM, Rood PJT, Peelen LM, Slooter AJC; Dutch Delirium Detection Study Group. Delirium detection using relative delta power based on 1-minute single-channel EEG: a multicentre study. Br J Anaesth. 2019 Jan;122(1):60-68.NVvP (2004). in samenwerking met de NVKG. Richtlijn delirium.
  38. Numan T, van den Boogaard M, Kamper AM, Rood PJT, Peelen LM, Slooter AJC; Dutch Delirium Detection Study Group. Recognition of Delirium in Postoperative Elderly Patients: A Multicenter Study. J Am Geriatr Soc. 2017 Sep;65(9):1932-1938.
  39. O'Regan NA, Ryan DJ, Boland E, Connolly W, McGlade C, Leonard M, Clare J, Eustace JA, Meagher D, Timmons S. Attention! A good bedside test for delirium? J Neurol Neurosurg Psychiatry. 2014 Oct;85(10):1122-31.
  40. O'Regan NA, Maughan K, Liddy N, Fitzgerald J, Adamis D, Molloy DW, Meagher D, Timmons S. Five short screening tests in the detection of prevalent delirium: diagnostic accuracy and performance in different neurocognitive subgroups. Int J Geriatr Psychiatry. 2017 Dec;32(12):1440-1449.
  41. Pompei, P., Foreman, M., Cassel, C.K., Alessi, C., & Cox, D. (1995). Detecting Delirium Among Hospitalized Older Patients. Archives of Internal Medicine, 155, 301- 307.
  42. Quispel-Aggenbach DWP, Holtman GA, Zwartjes HAHT, Zuidema SU, Luijendijk HJ. Attention, arousal and other rapid bedside screening instruments for delirium in older patients: a systematic review of test accuracy studies. Age Ageing. 2018;47(5):644–653.
  43. Richardson SJ, Davis DHJ, Bellelli G, Hasemann W, Meagher D, Kreisel SH, MacLullich AMJ, Cerejeira J, Morandi A. Detecting delirium superimposed on dementia: diagnostic accuracy of a simple combined arousal and attention testing procedure. Int Psychogeriatr. 2017 Oct;29(10):1585-1593.
  44. Ryan K, Leonard M, Guerin S, Donnelly S, Conroy M, Meagher D. Validation of the confusion assessment method in the palliative care setting. Palliat Med. 2009 Jan;23(1):40-5.
  45. Scheffer, A.C., Munster, B.C. van, Schuurmans, & M.J., Rooij, S.E. de (2011). Assessing severity of delirium by the Delirium Observation Screening Scale. Int J Geriatr Psychiatry, 26, 284-91.
  46. Schuurman, M.J., Shortridge-Baggett, L.M., & Duursma, S.A. (2003). The delirium observation screening scale: a screening instrument for delirium. Research and theory for nursing practice: an international journal, 17, 31- 50.
  47. Slor CJ, Adamis D, Jansen RW, Meagher DJ, Witlox J, Houdijk AP, de Jonghe JF. Validation and psychometric properties of the Delirium Motor Subtype Scale in elderly hip fracture patients (Dutch version). Arch Gerontol Geriatr. 2014 Jan-Feb;58(1):140-4.
  48. SteelFisher GK, Martin LA, Dowal SL, Inouye SK. Sustaining clinical programs during difficult economic times: a case series from the Hospital Elder Life Program. J Am Geriatr Soc. 2011;59(10):1873-1882.
  49. Teale EA, Munyombwe T, Schuurmans M, Siddiqi N, Young J. A prospective observational study to investigate utility of the Delirium Observational Screening Scale (DOSS) to detect delirium in care home residents. Age Ageing. 2018;47(1):56–61.
  50. Tieges Z, McGrath A, Hall RJ, Maclullich AM. Abnormal level of arousal as a predictor of delirium and inattention: an exploratory study. Am J Geriatr Psychiatry. 2013 Dec;21(12):1244-53.
  51. Van Velthuijsen EL, Zwakhalen SM, Warnier RM, Mulder WJ, Verhey FR, Kempen GI.Psychometric properties and feasibility of instruments for the detection of delirium in older hospitalized patients: a systematic review. Int J Geriatr Psychiatry. 2016 Sep;31(9):974-89.
  52. Vasunilashorn SM, Guess J, Ngo L, Fick D, Jones RN, Schmitt EM, Kosar CM, Saczynski JS, Travison TG, Inouye SK, Marcantonio ER. Derivation and Validation of a Severity Scoring Method for the 3-Minute Diagnostic Interview for Confusion Assessment Method--Defined Delirium. J Am Geriatr Soc. 2016 Aug;64(8):1684-9.
  53. Voyer P, Champoux N, Desrosiers J, Landreville P, Monette J, Savoie M, Carmichael PH, Richard S, Bédard A. Assessment of inattention in the context of delirium screening: one size does not fit all! Int Psychogeriatr. 2016 Aug;28(8):1293-301.
  54. Whittamore KH, Goldberg SE, Gladman JR, Bradshaw LE, Jones RG, Harwood RH. The diagnosis, prevalence and outcome of delirium in a cohort of older people with mental health problems on general hospital wards. Int J Geriatr Psychiatry. 2014 Jan;29(1):32-40.
  55. Wongpakaran N, Wongpakaran T, Bookamana P, Pinyopornpanish M, Maneeton B, Lerttrakarnnon P, Uttawichai K, Jiraniramai S. Diagnosing delirium in elderly Thai patients: utilization of the CAM algorithm. BMC Fam Pract. 2011 Jul 1;12:65. doi: 10.1186/1471-2296-12-65.

Overzichtstabel meetinstrumenten

Instru-ment

Referentie

N

Geslacht

(%F)

Leeftijd (gemm.)

(bereik)

Delier (%)

Afdeling

Afgenomen door

Referentie-standaard

Cut-off

Sensitiviteit

Specificiteit

Inter

rater

Interne consis-tentie

Korte screeningsinstrumenten voor screening delier

DRS-R-98

Andrew 2009

145

66

81

38

Algemeen

Clinicus

DSM-IV

17,75

56

82

 

 

DRS-R-98

De Negreiros 2008

64

61

71 (19-100)

42

Algemeen

Onderzoeker

DSM-IV

20

93

95

 

α = 0,91

DRS-R-98

De Rooij 2006

65

43

81 (65<)

35

Algemeen

Onderzoeksarts

DSM-IV

-

57

98

ICC = 0,97

α = 0,94

DRS-R-98

Whittamore 2014

249

 

84 (

43

Algemeen

Onderzoeks-assistent (arts of verpleegkundige)

DSM-IV

17,75

75

71

 

Cronbach’s α = 0,88

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DOSS

Koster 2009

112

37

70 (45<)

21

Hartchirurgie

Verpleegkundige

DSM-IV

≥2

100

97

 

 

DOSS

Schuurmans

174

71

83 (70-98)

13

Algemeen

Verpleegkundige

DSM-IV

 

 

 

rs = 0,54

α 0,93 – 0,96

DOSS

Teale 2018

216

66

84.9

33

Verpleeghuis

Verpleegkundige

CAM

≥5

61 (39-80)

71 (70-73)

κ =0,80

-

DOSS

Van Gemert 2007

87

52

79 (70-96)

10

Algemeen

Verpleegkundige

DSM-IV

3

89

87

 

 

Nu-DESC

Claessen Lingehall 2013

142

35

77 (70<)

55

Hartchirurgie

Verpleegkundige

DSM-IV-TR

≥2

72

81

 

 

Nu-DESC

Hargrave 2017

405

50

64

46

Neurologie, algemeen en orthopedische chirurgie en neurochirurgie

Verpleegkundige

DSM 5

≥2

42

98

 

 

Nu-DESC

Neufeld 2013

91

8

79 (70<)

45

Postoperatief

Verpleegkundige

DSM-IV

≥2 en ≥1

32-80

92-69

 

 

4AT

Bellilli 2014

236

64

85

12

Geriatrie en Revalidatie

Klinisch geriater

DSM-IV-TR

4

90

84

 

α 0,80

4AT

De 2017

257

57

86

62

Geriatrie en orthogeriatrie

Verpleegkundige

DSM 5

 

87

80

 

 

4AT

Hendry 2016

500

87

83

19

Geriatrie

Onderzoeker

DSM 5

≥4

87

70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Korte cognitieve screeningstesten niet specifiek ontworpen voor de screening van een delier

AMT-4

Dyer 2017

220

 

 

13

SEH

Onderzoeks- assistent

CAM-ICU

<4

92 (75-99)

82 (75-87)

 

 

AMT-4

Hendry 2016

500

87

83

19

Geriatrie

Onderzoeker

DSM-IV

<4

93 (85-97)

54 (48-59)

 

 

AMT-4

Lees 2013

111

 

 

11

Acute beroerte

Onderzoeker

CAM

<4

83 (52-98) (

61 (51-71)

 

 

MOTYB

Adamis 2016

200

68

87 (65-102)

17

Geriatrie afdeling

Klinisch geriater en getrainde onderzoeks-verpleegkundigen

CAM

t/m juli >0 fout

82 (65-93)

66 (58-73)

-

-

MOTYB

Fick 2015

201

62

84 (SD 5.4)

21

Interne en geriatrie

Onderzoeks- assistent

DSM-IV

1 fout

83 (69-93)

69 (61-76)

-

-

MOTYB

Hendry 2016

500

87

83

19

Geriatrie afdeling

Onderzoeker

DSM-IV

(<6)

91 (83-96)

50 (44-55)

-

-

MOTYB

Leonard 2016

193

52

80,5

57

Consultation-liaison psychiatry service

Onderzoeksteam

DSM-IV of DRS-R-98

>1 error up to july

75 (67-83)

70 (59-80)

 

 

MOTYB

O’Regan 2014

133

50

81 (median)

(70-99)

NR

Afdeling in ziekenhuis

Getraind junior medisch staflid

DSM-IV

1 error up tu July

84 (68-94)

 

90 (82-95)

-

-

MOTYB

O’Regan 2017

470

49

69 (median)

39

SEH

Onderzoeker

DRS-R-98

>0 error up to July

85 (78-90)

58 (52-64)

 

 

MOTYB

Voyer 2016

51

 

 

15

Verpleeghuis

Niet-psychiatrische clinicus

DSM5 met CAM

failure

83 (61-95)

63 (55-70)

-

-

MRASS

Grossman 2017

298

59

79.9 (median)

7

SEH

Getrainde verpleegkundigen

DSM-IV-TR

In 30s >2 fouten of >1 fouten >30s

70 (48-85)

93 (90-96)

-

-

OSLA

Tieges 2013

30

70

80

33

Heupfractuur

Psycholoog

CAM

>3

90 (56-100)

90 (68-99)

NA

NT

OSLA

Richardson 2017

114

54

82 (SD 7)

46

Acuut en revalidatie-ziekenhuis

Arts

DSM-IV

>3

85(72-93)

82 (71-91)

NT

NT

Diagnostische meetinstrumenten delier

CAM

Fabbri 2001

100

48

74 (60<)

17

Algemeen

Klinisch geriater

DSM-IV

 

94

96

 

 

CAM

Gonzalez 2004

30

62

78 (65-94)

24

Algemeen

Clinicus

DSM-IV

 

90

100

 

 

CAM

Hestermann 2009

39

72

83 (71-95)

33

Acute geriatrie

Medisch en niet-medisch beoordelaar

DSM-IV

 

77

96-100

 

 

CAM

Laurila 2002

81

75

(70<)

40

Algemeen

Onderzoeker

DSM-III, DSM-III-R, DSM IV en ICD 10

 

80-85

63-84

 

 

CAM

Martins 2015

208

54

78 (65-98)

25

IMCU

Getrainde onderzoeker

DSM-IV-TR

 

76

99

 

 

CAM

Monette 2001

906

-

(66<)

20

spoedeisende hulp (SEH)

‘lay interviewer’ en klinisch geriater

DSM-III-R

 

64

93

 

 

CAM

Pompei 1995

432

56

74 (65<)

15

Postoperatief

Onderzoeks-assistent

DSM-III-R

 

46

92

 

 

CAM

Ryan 2009

52

54

70 (36-93)

31

Palliatief

Niet-consulterende ziekenhuis dokters

DSM-IV

 

88

100

 

 

CAM

Thomas 2012

102

72

84 (80-100)

24

Geriatrie

Arts in opleiding of gerontoloog

DSM-IV, ICD-10

 

74-82

100-91

 

 

CAM

Wongpakaran 2011

66

42

75 (60-93)

56

Algemeen

Huisarts

DSM-IV-TR

 

92

100

 

 

3D-CAM

Marcantonio 2014

201

62

84 (>75)

21

Algemeen

Verpleegkundige en onderzoeker

DSM IV

 

95

94

 

 

3D-CAM

Vasulinashorn, 2016

566

58

77 (>70)

-

?

Clinici en onderzoekers

?

 

 

 

κ = 0,94

κ = 0,93

Subtypering delier

DMSS4

Adamis 2016

113

68

87 (65-102)

100

Heupchirurgie

Klinisch geriater en getrainde onderzoeks-verpleegkundigen

DSM-IV

 

-

-

 

Ω = 0.90

DMSS en DMSS4

Fitzgerald 2016

145

66

(>70)

 

Algemeen

Dokter, student en verpleegkundige

DRS-R-98

 

- (voor DMSS en MNSS4)

- (voor DMSS en MNSS4)

ICC = 0,70 DMSS en 0,59 DMSS4

 

DMSS

Slor 2014

146

63

86 (73-97)

32

Heupfractuur, postoperatief

Onderzoeksteam

DRS-R-98

 

56% (gemengd) tot 100% (hyperactief of geen subtype)

88% (hypoactief) tot 97% (gemengd subtype)

-

Cronbach’s α = 0,72 for delirious patients

 

Risk of bias assessment diagnostic accuracy studies (QUADAS II, 2011)

Research question:

Study reference

Patient selection

 

Index test

Reference standard

Flow and timing

Comments with respect to applicability

Adamis 2016

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

No

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Andrew 2009

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Bellelli 2014

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Claessen Lingehall 2013

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Chester 2012

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

De 2017

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

De Negreiros 2008

Was a consecutive or random sample of patients enrolled?

No

 

Was a case-control design avoided?

Unclear

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

De Rooij 2006

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Dyer 2017

Was a consecutive or random sample of patients enrolled?

No

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: Low

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: Unclear

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: Low

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: Low

 

Fabbri 2001

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Fick 2015

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Fitzgerald 2016

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

 

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Gonzalez 2004

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Grossman 2017

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Han 2013, 2015

Was a consecutive or random sample of patients enrolled?

No

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Unclear

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Hargrave 2017

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Hendry 2016

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

 

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Hestermann 2009

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Koster 2009

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

No

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

No

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK:UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: UNCLEAR

 

Laurilla 2002

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Lees 2013

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Leonard 2016

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Leung 2011

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Marcantonio 2014

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Martins 2015)

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

 

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Monette 2001

Was a consecutive or random sample of patients enrolled?

Unclear

 

Was a case-control design avoided?

No

 

Did the study avoid inappropriate exclusions?

Unclear

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

O’Reagan 2014

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: Unclear

 

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

O’Reagan, 2017

Was a consecutive or random sample of patients enrolled?

No

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Neefjes, 2017

Was a consecutive or random sample of patients enrolled?

No

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

 

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Neufeld 2013

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Numan 2019

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

No

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Pompei 2015

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

No

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

No

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

 

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: HIGH

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: HIGH

 

Richardson 2017

Was a consecutive or random sample of patients enrolled?

Convenience sample

 

Was a case-control design avoided?

yes

 

Did the study avoid inappropriate exclusions?

unclear

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

unclear

 

If a threshold was used, was it pre-specified?

yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOWr

 

Ryan 2009

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Schuurmans 2003

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Slor 2014

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Teale 2018

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Thomas 2012

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Tieges 2013

Was a consecutive or random sample of patients enrolled?

yes

 

Was a case-control design avoided?

yes

 

Did the study avoid inappropriate exclusions?

Unclear (30 out of 120 included)

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

unclear

 

If a threshold was used, was it pre-specified?

unclear

 

 

 

Is the reference standard likely to correctly classify the target condition?

yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

yes

 

Did all patients receive a reference standard?

yes

 

Did patients receive the same reference standard?

yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

no

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

no

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

no

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: HIGH

CONCLUSION

Could the patient flow have introduced bias?

no

 

RISK: UNCLEAR

 

Van Gemert 20007

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Vasulinashorn 2016

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes/No/Unclear

 

Did all patients receive a reference standard?

Yesr

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Voyer 2016

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes/No/Unclear

 

Did all patients receive a reference standard?

Yesr

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Whittamore 2014

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

No

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Wongpakaran 2011

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Unclear

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

 

Auteur en jaartal

Redenen van exclusie

Adamis, 2016

Kloktekentest: niet specifiek voor delier

Mitchell 2014

MMSE: niet specifiek voor delier

Rosgen, 2018

Caregiver centered meetsintrumenten, andere PICO

Autorisatiedatum en geldigheid

Laatst beoordeeld  : 17-09-2021

Laatst geautoriseerd  : 14-08-2020

Geplande herbeoordeling  : 01-10-2026

Uiterlijk in 2025 bepaalt het bestuur van de NVKG of de modules van deze richtlijn nog actueel zijn. Op modulair niveau is een onderhoudsplan beschreven. Bij het opstellen van de richtlijn heeft de werkgroep per module een inschatting gemaakt over de maximale termijn waarop herbeoordeling moet plaatsvinden en eventuele aandachtspunten geformuleerd die van belang zijn bij een toekomstige herziening (update). De geldigheid van de richtlijn komt eerder te vervallen indien nieuwe ontwikkelingen aanleiding zijn een herzieningstraject te starten.

 

De NVKG is regiehouder van deze richtlijn en eerstverantwoordelijke op het gebied van de actualiteitsbeoordeling van de richtlijn. De andere aan deze richtlijn deelnemende wetenschappelijke verenigingen of gebruikers van de richtlijn delen de verantwoordelijkheid en informeren de regiehouder over relevante ontwikkelingen binnen hun vakgebied.

 

Module[1]

Regiehouder(s)[2]

Jaar van autorisatie

Eerstvolgende beoordeling actualiteit richtlijn[3]

Frequentie van beoordeling op actualiteit[4]

Wie houdt er toezicht op actualiteit[5]

Relevante factoren voor wijzigingen in aanbeveling[6]

Meetinstrumenten delier

NVKG

2020

2025

Eens in de vijf jaar

NVKG

Nieuwe meetin-strumenten


[1] Naam van de module

[2] Regiehouder van de module (deze kan verschillen per module en kan ook verdeeld zijn over meerdere regiehouders)

[3] Maximaal na vijf jaar

[4] (half)Jaarlijks, eens in twee jaar, eens in vijf jaar

[5] regievoerende vereniging, gedeelde regievoerende verenigingen, of (multidisciplinaire) werkgroep die in stand blijft

[6] Lopend onderzoek, wijzigingen in vergoeding/organisatie, beschikbaarheid nieuwe middelen

Initiatief en autorisatie

Initiatief:
  • Nederlandse Vereniging voor Klinische Geriatrie
Geautoriseerd door:
  • Nederlandse Internisten Vereniging
  • Nederlandse Vereniging voor Klinische Geriatrie
  • Nederlandse Vereniging voor Neurologie
  • Nederlandse Vereniging voor Psychiatrie
  • Vereniging van Specialisten Ouderengeneeskunde
  • Verpleegkundigen en Verzorgenden Nederland
  • Nederlandse Vereniging van Ziekenhuisapothekers
  • Nederlandse Vereniging voor Intensive Care
  • Patiëntenfederatie Nederland

Algemene gegevens

De richtlijnontwikkeling werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten en werd gefinancierd uit de Stichting Kwaliteitsgelden Medisch Specialisten (SKMS). De Patiëntenvragenlijst, die werd afgenomen bij deze richtlijn, werd medegefinancierd uit de Stichting Kwaliteitsgelden Patiënten Consumenten (SKPC) binnen het programma Kwaliteit, Inzicht en Doelmatigheid in de medisch specialistische Zorg (KIDZ).

 

De financier heeft geen enkele invloed gehad op de inhoud van de richtlijn.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijn is in 2018 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen die betrokken zijn bij de zorg voor patiënten met een delier.

 

De werkgroepleden zijn door hun beroepsverenigingen gemandateerd voor deelname. De werkgroep is verantwoordelijk voor de integrale tekst van deze richtlijn.

 

Werkgroep

  • Dr. P.L.J. Dautzenberg, klinisch geriater, JBZ, Den Bosch, NVKG (voorzitter)
  • Dr. A. De Jonghe, klinisch geriater, Tergooi, NVKG
  • Dr. R.J. Osse, psychiater, Erasmus MC, Rotterdam, NVvP
  • Drs. M.R. Altena, internist-ouderengeneeskunde, Haaglanden Medisch Centrum, Den Haag, NIV
  • Dr. P.L.M. de Kort, Neuroloog, Elisabeth-Twee Stedenziekenhuis, NVN
  • Dr. A. Egberts, apotheker, Franciscus Gasthuis & Vlietland, Rotterdam & Schiedam, NVZA
  • W.M. Meijer, verpleegkundig specialist geriatrie, OLVG Amsterdam, V&VN Geriatrie & Gerontologie
  • J.C. Martinot MsC, verpleegkundig specialist, GC Stichting Zonboog Zuiderkroon en CHPR (Centrale Huisartsenpost Rotterdam), Rotterdam, V&VN VS-netwerk VS 1e lijn
  • Drs. S. van de Kamp, specialist ouderengeneeskunde, Zinzia Zorggroep, Wageningen, Verenso
  • Drs. E.G.M. Smit, internist-intensivist, Spaarne Gasthuis, NVIC
  • Drs. N.A.J. Fennema, anesthesioloog-intensivist, Spaarne Gasthuis, NVIC
  • Drs. K. Spijkers, Patientenfederatie Nederland (agendalid)

 

Samenstelling klankbordgroep

  • Patiëntfederatie Nederland
  • KBO-PCOB
  • Mezzo
  • Mind
  • Alzheimer Nederland

 

Met ondersteuning van

  • Dr. M. L. Molag, projectleider, Kennisinstituut van de Federatie Medisch Specialisten
  • Drs. D. Nieboer, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Dr. J. Prins, adviseur, Kennisinstituut van de Federatie van Medisch Specialisten (tot juli 2019)
  • Drs. M. Wessels, informatiespecialist, Kennisinstituut van de Federatie van Medisch Specialisten

Belangenverklaringen

De KNMG-code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement, kennisvalorisatie) hebben gehad. Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Werkgroeplid

Functie

Nevenfuncties

Gemelde belangen

Ondernomen actie

Dautzenberg

Klinisch geriater (0.8 fte) en directeur ‘brain research center’ (0.2 fte) en voorzitter deze richtlijncommissie

Lid RvT verpleeghuis Jozefoord, Nuland, betaald

geen

Het Brain Research Center is een commerciële instelling die trials voor de industrie doet, Dautzenberg echter richt zich hier op de behandeling van dementie en niet op delier. Dit staat het voorzitterschap en medewerking aan de RL Delier niet in de weg

De Jonghe

Klinisch geriater

geen

Tergooi neemt deel aan multicenterstudie naar deltascan, een delier-monitor.

Deltascan is een soort diagnostisch EEG voor delier, andere onderzoekers zijn daarvoor primair verantwoor-delijk, dus geen actie

Osse

psychiater

Docent en opleider

Lid van de Euridice trial stuurgroep en betrokken bij Deltascan

Deltascan is een soort diagnostische EEG, andere werkgroepleden zijn daarvoor primair verantwoor-delijk, dus geen actie

Altena

Internist-ouderengeneeskunde

geen

Geen

geen

De Kort

Neuroloog

Bestuurslid stichting Postacademische Opleiding Klinische Neuropsychologie

Geen

geen

Egberts

Apotheker

geen

Geen

geen

Meijer

Verpleegkundig specialist geriatrie

 

Geen

geen

Martinot

Verpleegkundig specialist

geen

Geen

geen

Van de Kamp

Specialist ouderengeneeskunde

geen

Geen

geen

Smit

Intensivist

NKIC Kwaliteitsvisitatie

IC Spaarne gaat mogelijk meedoen aan multicenter studie Deltascan

Deltascan is een soort diagnostisch EEG voor delier, andere onderzoekers zijn daarvoor primair verantwoordelijk, dus geen actie

Fennema

Intensivist

Docent cursus NVIC Luchtwegmanagement

Als Principal Investigator betrokken bij MIDEX studie

MIDEX studie heeft betrekking op de IC en dat is uitgesloten in de huidige richtlijn

Spijkers

Vertegenwoordiger Patiëntenfederatie

geen

geen

geen

Inbreng patiëntenperspectief

Om meer inzichten te krijgen in de waarden en voorkeuren van patiënten, heeft de Patiëntenfederatie het onderzoek ‘ervaringen rondom een delier’ uitgevoerd via hun patiëntenpanel. Deze vragenlijsten werd ingevuld door 91 mantelzorgers van patiënten die een delier hadden doorgemaakt in het afgelopen jaar. Daarvan had 42% van de patiënten thuis een delier doorgemaakt, bij 16% in het ziekenhuis op een niet-geriatrische afdeling, bij 13% in het verpleeghuis, bij 9% op de intensive care en bij 7% op de geriatrische afdeling van een ziekenhuis of anders (13%). Een verslag hiervan (zie aanverwante producten) is besproken in de werkgroep en de belangrijkste knelpunten zijn verwerkt in de richtlijn. Aan het begin werden knelpunten uitgevraagd en aan het einde werd de conceptrichtlijn tevens voor commentaar voorgelegd aan Alzheimer Nederland, KBO-PCOB, Mantelzorg-NL, MIND en de Patiëntenfederatie Nederland.

Methode ontwikkeling

Evidence based

Implementatie

In de verschillende fasen van de richtlijnontwikkeling is rekening gehouden met de implementatie van de richtlijn (module) en de praktische uitvoerbaarheid van de aanbevelingen. Daarbij is uitdrukkelijk gelet op factoren die de invoering van de richtlijn in de praktijk kunnen bevorderen of belemmeren. Het implementatieplan wordt vastgesteld in overleg met de NVKG na autorisatie van de richtlijn.

Werkwijze

AGREE

Deze richtlijn is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010), dat een internationaal breed geaccepteerd instrument is. Voor een stap-voor-stap beschrijving hoe een evidence-based richtlijn tot stand komt wordt verwezen naar het stappenplan Ontwikkeling van Medisch Specialistische Richtlijnen van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Knelpuntenanalyse

Tijdens de voorbereidende fase inventariseerden de voorzitter van de werkgroep en de adviseur de knelpunten. De werkgroep beoordeelde de aanbevelingen uit de eerdere richtlijn Delier volwassenen (NVKG, 2013)) op noodzaak tot revisie. Tevens zijn er knelpunten aangedragen door de wetenschappelijke verenigingen, de partijen genoemd onder het kopje inbreng patiëntenperspectief, Actiz en IGJ via een invitational conference. Een verslag hiervan is opgenomen onder aanverwante producten.

 

Uitgangsvragen en uitkomstmaten

Op basis van de uitkomsten van de knelpuntenanalyse zijn door de voorzitter en de adviseur concept-uitgangsvragen opgesteld. Deze zijn met de werkgroep besproken waarna de werkgroep de definitieve uitgangsvragen heeft vastgesteld. Vervolgens inventariseerde de werkgroep per uitgangsvraag welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

 

Strategie voor zoeken en selecteren van literatuur

Voor de afzonderlijke uitgangsvragen werd aan de hand van specifieke zoektermen gezocht naar gepubliceerde wetenschappelijke studies in (verschillende) elektronische databases. Tevens werd aanvullend gezocht naar studies aan de hand van de literatuurlijsten van de geselecteerde artikelen. In eerste instantie werd gezocht naar studies met de hoogste mate van bewijs. De werkgroepleden selecteerden de via de zoekactie gevonden artikelen op basis van vooraf opgestelde selectiecriteria. De geselecteerde artikelen werden gebruikt om de uitgangsvraag te beantwoorden. De databases waarin is gezocht, de zoekstrategie en de gehanteerde selectiecriteria zijn te vinden in de module met desbetreffende uitgangsvraag. De zoekstrategie voor de oriënterende zoekactie en patiëntenperspectief zijn opgenomen onder aanverwante producten.

 

Kwaliteitsbeoordeling individuele studies

Individuele studies werden systematisch beoordeeld, op basis van op voorhand opgestelde methodologische kwaliteitscriteria, om zo het risico op vertekende studieresultaten (risk of bias) te kunnen inschatten. Deze beoordelingen kunt u vinden in de Risk of Bias (RoB) tabellen. De gebruikte RoB instrumenten zijn gevalideerde instrumenten die worden aanbevolen door de Cochrane Collaboration: AMSTAR - voor systematische reviews; Cochrane - voor gerandomiseerd gecontroleerd onderzoek; Newcastle-Ottowa - voor observationeel onderzoek; QUADAS II – voor diagnostisch onderzoek.

 

Samenvatten van de literatuur

De relevante onderzoeksgegevens van alle geselecteerde artikelen werden overzichtelijk weergegeven in evidencetabellen. De belangrijkste bevindingen uit de literatuur werden beschreven in de samenvatting van de literatuur. Bij een voldoende aantal studies en overeenkomstigheid (homogeniteit) tussen de studies werden de gegevens ook kwantitatief samengevat (meta-analyse) met behulp van Review Manager 5.

 

Beoordelen van de kracht van het wetenschappelijke bewijs

A) Voor interventievragen (vragen over therapie of screening)

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/).

 

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie (Schünemann, 2013).

 

GRADE

Definitie

Hoog

  • er is hoge zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie;
  • het is zeer onwaarschijnlijk dat de literatuurconclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Redelijk*

  • er is redelijke zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie;
  • het is mogelijk dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Laag

  • er is lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie;
  • er is een reële kans dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Zeer laag

  • er is zeer lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie;
  • de literatuurconclusie is zeer onzeker.

*in 2017 heeft het Dutch GRADE Network bepaald dat de voorkeursformulering voor de op een na hoogste gradering ‘redelijk’ is in plaats van ‘matig’

 

B) Voor vragen over diagnostische tests, schade of bijwerkingen, etiologie en prognose

De kracht van het wetenschappelijke bewijs werd eveneens bepaald volgens de GRADE-methode: GRADE-diagnostiek voor diagnostische vragen (Schünemann, 2008) en een generieke GRADE-methode voor vragen over schade of bijwerkingen, etiologie en prognose. In de gehanteerde generieke GRADE-methode werden de basisprincipes van de GRADE methodiek toegepast: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van bewijskracht op basis van de vijf GRADE-criteria (startpunt hoog; downgraden voor risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias).

 

C) Voor vragen over de waarde van meet- of classificatie-instrumenten (klinimetrie)

Deze instrumenten werden beoordeeld op validiteit, intra- (test-hertest) en inter-beoordelaarsbetrouwbaarheid, responsiviteit (alleen bij meetinstrumenten) en bruikbaarheid in de praktijk. (naar keuze: optie-1 ‘Bij ontbreken van een gouden standaard, werd een beoordeling van de bewijskracht van literatuurconclusies achterwege gelaten.’ Of optie-2 ‘De kracht van het wetenschappelijk bewijs werd bepaald met de generieke GRADE-methode’).

 

Formuleren van de conclusies

Voor elke relevante uitkomstmaat werd het wetenschappelijk bewijs samengevat in een of meerdere literatuurconclusies waarbij het niveau van bewijs werd bepaald volgens de GRADE-methodiek. De werkgroepleden maakten de balans op van elke interventie (overall conclusie). Bij het opmaken van de balans werden de gunstige en ongunstige effecten voor de patiënt afgewogen. De overall bewijskracht wordt bepaald door de laagste bewijskracht gevonden bij een van de cruciale uitkomstmaten. Bij complexe besluitvorming waarin naast de conclusies uit de systematische literatuuranalyse vele aanvullende argumenten (overwegingen) een rol spelen, werd afgezien van een overall conclusie. In dat geval werden de gunstige en ongunstige effecten van de interventies samen met alle aanvullende argumenten gewogen onder het kopje 'Overwegingen'.

 

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals de expertise van de werkgroepleden, de waarden en voorkeuren van de patiënt (patient values and preferences), kosten, beschikbaarheid van voorzieningen en organisatorische zaken. Deze aspecten worden, voor zover geen onderdeel van de literatuursamenvatting, vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’.

 

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk. De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen.

 

Randvoorwaarden (Organisatie van zorg)

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijn is expliciet rekening gehouden met de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, menskracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van een specifieke uitgangsvraag maken onderdeel uit van de overwegingen bij de bewuste uitgangsvraag. Meer algemene, overkoepelende, of bijkomende aspecten van de organisatie van zorg worden behandeld in de module Organisatie van zorg

 

Indicatorontwikkeling

Er werden geen indicatoren ontwikkeld voor deze richtlijn, gekozen werd om aan te sluiten bij de indicatoren van IGJ en VMS. Een andere werkgroep heeft nieuwe indicatoren opgesteld binnen het project van de NVKG ‘Update IGZ indicator Delier’.

 

Commentaar- en autorisatiefase

De conceptrichtlijn werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijn aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijn werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

 

Literatuur

Brouwers, M. C., Kho, M. E., Browman, G. P., Burgers, J. S., Cluzeau, F., Feder, G.,.. & Littlejohns, P. (2010). AGREE II: advancing guideline development, reporting and evaluation in health care. Canadian Medical Association Journal, 182(18), E839-E842.

Kennisinstituut van de Federatie Medisch Specialisten. Ontwikkeling van Medisch Specialistische Richtlijnen: stappenplan. Utrecht, 2015

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwaliteit. https://www.demedischspecialist.nl/publicaties/medisch-specialistische-richtlijnen-20-rapport

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

Schünemann, H. J., Oxman, A. D., Brozek, J., Glasziou, P., Jaeschke, R., Vist, G. E.,... & Bossuyt, P. (2008). Rating Quality of Evidence and Strength of Recommendations: GRADE: Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ: British Medical Journal, 336(7653), 1106.

Wessels, M., Hielkema, L., & van der Weijden, T. (2016). How to identify existing literature on patients' knowledge, views, and values: the development of a validated search filter. Journal of the Medical Library Association: JMLA, 104(4), 320.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Volgende:
Risicofactoren