Sepsis

Initiatief: NIV Aantal modules: 24

Vroege herkenning van (dreigende) sepsis

Uitgangsvraag

Hoe kan vroegtijdige herkenning van (dreigende) sepsis (aan de poort van het ziekenhuis en op alle ziekenhuisafdelingen) worden bevorderd in Nederlandse ziekenhuizen?

  • Welke instrumenten zijn daarbij behulpzaam?

Aanbeveling

Maak in de vroegtijdige herkenning van sepsis gebruik van een combinatie van twee methoden.

  • Is er verdenking op een infectie?
  • Screen op vitale bedreiging met behulp van de MEWS/NEWS.

Gebruik hierbij de signaalvraag: Kan dit een sepsis zijn?

 

  • Maak bij de patiënt met verdenking op een infectie gebruik van de MEWS/NEWS om een indruk te krijgen of de patiënt vitaal bedreigd is.
  • Zorg voor een lokaal protocol met minimaal afspraken over de frequentie van afname van de score en de afkapwaarde.
  • Maak bij een patiënt die vitaal bedreigd is volgens de MEWS/NEWS de afweging of er een verdenking op een infectie is.

 

Maak in de vroegtijdige herkenning van sepsis geen gebruik van de qSOFA-score.

Overwegingen

Voor- en nadelen van de interventie en de kwaliteit van het bewijs

Er is onvoldoende bewijs voor het gebruik van specifieke criteria in het vroeg herkennen van sepsis. Uit een recente retrospectieve Nederlandse studie kwam naar voren dat met de SIRS-criteria de meeste patiënten geclassificeerd konden worden als hebbende sepsis en met de qSOFA-score de minste. De MEWS zat hier tussenin, maar zat meer richting SIRS-criteria dan qSOFA-score (van der Woude, 2018).

 

Er is met name literatuur gevonden over het gebruik van instrumenten om de mortaliteit dan wel IC-opname te voorspellen bij septische patiënten. Gezien dit belangrijke parameters zijn, ook voor de patiënt, is ervoor gekozen dit verder uit te werken. Om de mortaliteit zo laag mogelijk te houden is het belangrijk zo min mogelijk septische patiënten te missen. Hierin speelt sensitiviteit een belangrijkere rol dan specificiteit. Hier is rekening mee gehouden in de formulering van de aanbeveling.

 

Uit genoemde studies lijkt de sensitiviteit het hoogst te zijn voor de SIRS-criteria. De MEWS en NEWS behalen ongeveer dezelfde sensitiviteit en de qSOFA-score zit hieronder. De bewijskracht voor bovenstaande bevindingen is laag in alle studies. Ook de PIRO is onderzocht. Echter, de bewijskracht is zeer laag en kunnen er geen conclusies getrokken worden over deze tool.

 

Waarden en voorkeuren van patiënten (en eventueel hun verzorgers)

Het is in het voordeel van de patiënt dat sepsis vroegtijdig wordt herkend. Met de aanbeveling die we nu doen, zal er van de zorgverleners mogelijk een kleine extra inzet gevraagd worden wat betreft het meten van de vitale parameters. Dit zal echter de behandeling en de uitkomst overleving ten goede komen.

 

Kosten (middelenbeslag)

Niet van toepassing, niet geheel duidelijk wat de extra kosten zullen zijn en of deze er überhaupt zullen zijn.

 

Haalbaarheid en implementatie

Een belemmering voor de implementatie van zowel de SOFA-score als de PIRO is het feit dat hier laboratoriumbepalingen voor zijn vereist. Bij de andere scores gaat het veelal om vitale parameters, welke bij elke patiënt worden gemeten. Er zullen dus geen bijkomende kosten zijn.

 

De MEWS/NEWS is al geïmplementeerd in het kader van het VMS-veiligheidsprogramma “Vitaal bedreigde patiënt” in het monitoren van patiënten op verpleegafdelingen in de ziekenhuizen in Nederland. Daarom is ervoor gekozen deze score aan te bevelen in de vroegtijdige herkenning van sepsis. De SIRS-criteria lijken niet significant beter dan de MEWS/NEWS in studies tot nu toe. De SIRS-criteria zijn recentelijk verworpen en het zou voor verwarring kunnen zorgen bij zorgverleners over de vroege herkenning van sepsis als dit opnieuw aanbevolen wordt.

 

De MEWS/NEWS is een score die gebruikt wordt om verandering in de trend van vitale parameters te objectiveren. Daarom is tevens gezocht naar literatuur om een eventuele frequentie van MEWS/NEWS aan te bevelen. In de literatuur werd geen wetenschappelijk bewijs voor een bepaalde frequentie gevonden. Wel werd een studie gevonden waaruit mogelijk blijkt dat een gestandaardiseerde meting tot meer compliantie leidt dan meting op indicatie (Ludikhuijze, 2014).

 

Aanbeveling-1

Rationale/ balans tussen de argumenten voor en tegen de interventie

Voor een goede behandeling en een betere prognose is het essentieel sepsis vroegtijdig te herkennen. Hierbij is gekeken naar een score met een hoge sensitiviteit en een haalbare implementatie. Gezien de SIRS-criteria recentelijk zijn verworpen, zou dit tot verwarring kunnen leiden. De MEWS/NEWS zijn al op verpleegafdelingen in de ziekenhuizen geïmplementeerd. Bovendien zijn MEWS/NEWS-criteria ook te gebruiken op ieder afdeling in een ziekenhuis. Deze kennis in acht nemend is de volgende aanbeveling opgesteld door de werkgroep. Het gebruik van de SIRS-criteria wordt dus niet per se afgeraden, maar vormt geen onderdeel van de screening op en diagnose van sepsis.

 

Aanbeveling-2

Rationale/ balans tussen de argumenten voor en tegen de interventie

De werkgroep gaat uit van twee verschillende presentaties van sepsis. De eerste is de patiënt met een verdenking op een infectie, waarbij de vitale parameters bedreigd zijn. De tweede is de patiënt met vitaal bedreigde parameters, waarbij sprake zou kunnen zijn van een infectie. Hiervoor is een aparte aanbeveling opgesteld.

 

Omdat het gaat om een score die verandering in vitale parameters objectiveert wordt ook een aanbeveling gedaan omtrent frequentie van meting. Er is geen literatuur gevonden voor één gestandaardiseerde meting, vandaar dat de werkgroep komt tot de volgende aanbeveling.

 

Aanbeveling-3

Rationale/ balans tussen de argumenten voor en tegen de interventie

Met de komst van de sepsis-3 richtlijn is er tevens een nieuwe definitie van sepsis. In de SSC-richtlijn (Rhodes, 2017) wordt de qSOFA-score aanbevolen als instrument in de vroege herkenning van sepsis. Uit de literatuur blijkt echter dat de qSOFA-score een lagere sensitiviteit heeft dan de MEWS/NEWS, waardoor patiënten met sepsis gemist kunnen worden als men de qSOFA gebruikt in de vroege herkenning van sepsis. De werkgroep heeft daarom de volgende negatieve aanbeveling opgesteld.

Onderbouwing

Om op tijd met de juiste behandeling te starten is het van belang dat sepsis vroeg herkend wordt, zowel op de SEH als op de verpleegafdelingen in het ziekenhuis. De patiënt die al op de IC ligt, valt hierbuiten.

 

Met de komst van de Sepsis-3 richtlijn vervallen de huidige SIRS-criteria en wordt er gezocht naar een nieuwe screeningsmethode (Singer, 2016). In deze module wordt getracht een aanbeveling te geven welk instrument het best gebruikt kan worden in de screening voor de herkenning van sepsis.

Accuratesse voorspelling mortaliteit: qSOFA-score versus SIRS-criteria

Laag

GRADE

Er lijkt geen verschil te zijn tussen het discriminerend vermogen van de qSOFA-score (afkappunt ≥ 2) en SIRS-criteria (afkappunt ≥ 2) voor de voorspelling van mortaliteit bij patiënten met een infectie buiten de IC.

 

De sensitiviteit lijkt beter voor de SIRS-criteria (afkappunt ≥ 2) vergeleken met de qSOFA-score (afkappunt ≥ 2) en de specificiteit lijkt beter bij gebruik van de qSOFA ≥ 2 vergeleken met de SIRS-criteria (afkappunt ≥ 2).

 

De positive likelihood ratio lijkt iets beter voor de qSOFA-score (afkappunt ≥ 2) vergeleken met de SIRS-criteria (afkappunt ≥ 2), er lijkt geen verschil in de negative likelihood ratio tussen de qSOFA-score (afkappunt ≥ 2) en de SIRS-criteria (afkappunt ≥ 2).

 

Bronnen: (Song, 2008)

 

Accuratesse voorspelling IC-opname: qSOFA-score versus SIRS-criteria

Laag

GRADE

Het discriminerend vermogen van de SIRS-criteria (afkappunt ≥ 2) zou enigszins beter kunnen zijn dan van de qSOFA-score (afkappunt ≥ 2) voor de voorspelling van IC-opname bij patiënten met een infectie buiten de IC.

 

De sensitiviteit van de SIRS-criteria lijkt beter vergeleken met de qSOFA-score (afkappunt ≥ 2) en de specificiteit lijkt beter bij gebruik van de qSOFA-score (afkappunt ≥ 2) vergeleken met de SIRS-criteria (afkappunt ≥ 2).

 

Er lijkt geen verschil in de positive likelihood ratio tussen de qSOFA-score (afkappunt ≥ 2) en de SIRS-criteria (afkappunt ≥ 2). De negative likelihood ratio lijkt iets beter voor de SIRS-criteria (afkappunt ≥ 2) vergeleken met de qSOFA-score (afkappunt ≥ 2)

 

Bronnen: (Song, 2008)

 

Accuratesse voorspelling acute orgaandisfunctie: qSOFA-score versus SIRS-criteria

Laag GRADE

Het discriminerend vermogen van de SIRS-criteria (afkappunt ≥ 2) lijkt beter dan van de qSOFA-score (afkappunt ≥ 2) voor de voorspelling van acute orgaandisfunctie bij patiënten met een infectie buiten de IC.

 

De sensitiviteit lijkt beter voor de SIRS-criteria (afkappunt ≥ 2) vergeleken met de qSOFA-score (afkappunt ≥ 2) en de specificiteit lijkt beter bij gebruik van de qSOFA-score (afkappunt ≥ 2) vergeleken met de SIRS-criteria (afkappunt ≥ 2).

 

De positive likelihood ratio lijkt iets beter van de qSOFA-score (afkappunt ≥ 2) vergeleken met de SIRS-criteria (afkappunt ≥ 2). De negative likelihood ratio lijkt iets beter voor de SIRS ≥ 2 criteria vergeleken met de qSOFA-score (afkappunt ≥ 2).

 

Bronnen: (Song, 2008)

 

Accuratesse voorspelling mortaliteit: PIRO versus qSOFA-score, SOFA-score, MEWS of NEWS

Zeer laag GRADE

Het is onzeker of het discriminerend vermogen en voorspellende waarde van de PIRO-score beter is dan van de qSOFA-score, SOFA-score, MEWS of NEWS voor de voorspelling van mortaliteit bij patiënten met een infectie buiten de IC.

 

Bronnen: (Quinten, 2017; de Groot, 2017; Yu, 2014; MacDonald, 2014)

 

Accuratesse voorspelling IC-opname: PIRO versus qSOFA-score, SOFA-score, MEWS of NEWS

Zeer laag GRADE

Het is onzeker of de voorspellende waarde van de PIRO-score beter is dan de qSOFA-score van de voorspelling van IC-opname bij patiënten met een infectie buiten de IC.

 

Het is onzeker of het discriminerend vermogen van de PIRO-score beter is dan de qSOFA-score, SOFA-score, NEWS of MEWS voor de voorspelling van IC-opname of klinische verslechtering bij patiënten met een infectie buiten de IC.

 

Bronnen: (Quinten, 2017; De Groot, 2017; Yu, 2014)

 

Accuratesse voorspelling mortaliteit: NEWS versus qSOFA-score of SIRS-criteria

Laag GRADE

Er lijkt geen verschil in discriminerend vermogen van de NEWS vergeleken met de qSOFA-score of SIRS-criteria voor de voorspelling van mortaliteit bij patiënten met een infectie op de SEH.

 

De sensitiviteit lijkt hoger van de NEWS vergeleken met de qSOFA-score en gelijk aan de SIRS-criteria.

 

De specificiteit lijkt hoger van de NEWS vergeleken met de SIRS-criteria en lager dan de qSOFA-score.

 

Er lijkt geen verschil in de positief en negatief voorspellende waarde tussen de NEWS, qSOFA-score en SIRS-criteria.

 

De positive likelihood ratio lijkt iets beter van de qSOFA-score vergeleken met de SIRS-criteria en de NEWS. De negative likelihood ratio lijkt iets beter van de NEWS vergeleken met de qSOFA-score en de SIRS-criteria.

 

Bronnen: (Goulden, 2018)

 

Accuratesse voorspelling mortaliteit: NEWS/MEWS versus qSOFA-score, SOFA-score of SIRS-criteria

Laag GRADE

Het discriminerend vermogen van de NEWS/MEWS-score lijkt mogelijk beter dan van de qSOFA-score, SOFA-score of SIRS-criteria voor de voorspelling van mortaliteit en/of IC-opname bij patiënten met een infectie buiten de IC.

 

De sensitiviteit lijkt hoger van de NEWS/MEWS vergeleken met de qSOFA-score en vergelijkbaar met de SIRS-criteria en SOFA-score.

 

De specificiteit lijkt lager bij gebruik van de NEWS/MEWS vergeleken met de qSOFA-score, vergelijkbaar met de SOFA-score en hoger dan de SIRS-criteria.

 

Er lijken geen verschillen te zijn in positief of negatief voorspellende waarde tussen de NEWS en MEWS vergeleken met de qSOFA-score, SOFA-score en SIRS-criteria.

 

Bronnen: (Churpek, 2017; Goulden, 2018)

Beschrijving studies

In de review van Song (2018) is de qSOFA-score vergeleken met de SIRS-criteria (≥ 2 punten verhoging) in het vroeg voorspellen van mortaliteit, IC-opname, acute orgaandisfunctie in de niet-IC-setting bij patiënten met een verdenking op een infectie of vastgestelde infectie. Er werden 23 studies geïncludeerd met in totaal 146.551 patiënten; dit varieerde van 151 tot 66.522 patiënten per studie. De prevalentie van mortaliteit varieerde van 2,8% tot 33,0%. De meerderheid van de studies was uitgevoerd in patiënten op de SEH (n=17). De meerderheid van de studies includeerde patiënten met verdenking op infectie (n=17).

 

Twintig studies gebruikten een qSOFA-score van ≥ 2 als afkappunt, drie studies hanteerden een ander afkappunt, en wel ≥ 1 of ≥ 3, deze resultaten zijn niet beschreven in de resultaten van deze literatuuranalyse (Song, 2018).

 

Na het verschijnen van de review van Song (2018) zijn er nog 12 studies gepubliceerd die ook de accuratesse van de qSOFA-score presenteren voor de voorspelling van mortaliteit en/of IC-opname (Goulden, 2018; Boulos, 2017; Sterling, 2017; LeGuen, 2018; Williams, 2017; Umemura, 2017; Shetty, 2017; Moskowitz, 2017; Muller, 2017; Haydar, 2017; Guirgis, 2017; de Groot, 2017). De sensitiviteit en specificiteit van deze studies viel binnen de range van de studies die in Song (2018) zijn opgenomen en zijn niet apart uitgewerkt voor deze literatuuranalyse. Dit staat gerapporteerd in de exclusietabel onder het tabblad Verantwoording.

 

Churpek (2017) includeerde in een prospectief cohort met retrospectieve data verzameling 53.849 patiënten bij verschillende groepen met verdenking op infectie (ten minste voldoen aan één infectie criterium: 1) positieve kweek, 2) positieve bloedkweek, 3) een positieve kweek + intraveneuze (IV) antibiotica, 4) bloedkweek + IV antibiotica 5) een kweek + IV antibiotica tenminste 4 tot 7 dagen 6) Bloedkweek + IV antibiotica 4 tot 7 dagen). Het mortaliteitspercentage varieerde van 3% tot 9% in de verschillende categorieën met een verdenking op een infectie. De qSOFA-score, SIRS-criteria, NEWS, MEWS en SOFA-score werden vergeleken op accuratessematen voor de voorspelling van een gecombineerde maat voor mortaliteit en/of IC-opname. De hoogste scores per patiënt tijdens verblijf in het ziekenhuis (niet IC) tot aan verdenking van infectie werden meegenomen in de analyses (Churpek, 2017).

 

Goulden (2018) includeerde 1818 patiënten in een retrospectieve cohortstudie op de spoedeisende hulp met verdenking op sepsis. De qSOFA-score (afkappunt ≥ 2) werd vergeleken met de SIRS-criteria (afkappunt ≥ 2) en de NEWS (afkappunt ≥ 5) op accuratessematen voor de voorspelling van mortaliteit en IC-opname. De prevalentie van mortaliteit in het ziekenhuis was 15% (n=265) en 3% (n=53) werd opgenomen op de IC.

 

Quinten (2017) vergeleek de PIRO-score (afkappunt ≥ 12) met de qSOFA-score (afkappunt ≥ 2) op de voorspellende waarde en discriminerend vermogen voor mortaliteit en IC-opname bij patiënten op de SEH met een verdenking of bevestigde infectie en SIRS-criteria ≥ 2 in een prospectieve studie met 193 patiënten. De prevalentie van mortaliteit in het ziekenhuis was 4,1% (n=8) en 10,9% (n=21) werd opgenomen op de IC. De initiële scores tijdens de SEH-opname werden meegenomen in de analyse.

 

De Groot (2017) vergeleek de PIRO-score (afkappunt ≥ 14) met de qSOFA-score (afkappunt ≥ 2), de MEWS (afkappunt ≥ 7) en de NEWS (afkappunt ≥ 8) op de voorspellende waarde en discriminerend vermogen voor mortaliteit en IC-opname bij patiënten op de SEH die werden opgenomen met verdenking op een infectie in een prospectieve studie met 783 oudere patiënten (≥ 70 jaar) en 1497 jongere patiënten (< 70 jaar). Er werd ook een vergelijking gemaakt van de voorspellende waarde en discriminerend vermogen tussen deze beide leeftijdscategorieën.

 

Yu (2014) vergeleek de PIRO-score met de SOFA-score en de MEWS op de voorspellende waarde en discriminerend vermogen voor mortaliteit bij patiënten met een bevestigde infectie op niet-IC-verpleegafdelingen in een retrospectieve nested case-control studie met 328 cases en 328 gematchte controle cases. Verschillende afkappunten werden onderzocht.

 

MacDonald (2014) vergeleek de PIRO-score (verschillende afkappunten) met de SOFA-score op de voorspellende waarde en discriminerend vermogen voor mortaliteit bij patiënten met sepsis op de SEH in een prospectieve studie met 240 patiënten. De slechtste scores tijdens de SEH-opname werden meegenomen in de analyse.

 

Zie de aanverwant producten voor een overzicht van alle opgenomen scoringssystemen.

 

Resultaten

qSOFA-score vergeleken met SIRS-criteria: voorspellende waarde en discriminerend vermogen voor mortaliteit

20 studies in de review van Song (2018) rapporteerden over deze uitkomst voor de qSOFA-score (afkappunt ≥ 2). In de gepoolde schattingen hadden patiënten met een positieve qSOFA-score en SIRS-criteria een prevalentie van overlijden binnen het ziekenhuis van respectievelijk 12,9% (3.847/29.709) en 5,8% (3.906/67.225) bij patiënten met een verdenking op een infectie of vastgestelde infectie.

 

In figuur 1 zijn de resultaten voor sensitiviteit en specificiteit gepresenteerd in een forest plot. De gepoolde sensitiviteit voor de qSOFA-score (afkappunt ≥ 2) was laag met 0,51 (95% Betrouwbaarheidsinterval (BI) 0,39 tot 0,62), met een hoge heterogeniteit van I2=97,6%. De oorzaken van heterogeniteit zijn onderzocht en konden deels verklaard worden door het tijdstip waarop de qSOFA-score is afgenomen. De sensitiviteit was statistisch significant (p<0.01) hoger wanneer de slechtste qSOFA-scores werden gebruikt vergeleken met afname van de score tijdens het eerste moment van verdenking van infectie (Song, 2018).

 

De gepoolde specificiteit voor de qSOFA-score (afkappunt ≥ 2) was redelijk goed met 0,83 (95% BI 0,75 tot 0,89), met een hoge heterogeniteit van I2=99,8%. De oorzaken van heterogeniteit zijn onderzocht en konden deels verklaard worden door studie locatie, mortaliteit percentage en ernst van de ziekte. De specificiteit was statistisch significant hoger in Amerikaanse studies vergeleken met Europese studies (p<0,01). In studies met een mortaliteit van ≥ 10% was de specificiteit statistisch significant lager dan in studies met een lager percentage van de mortaliteit (p=0,01). De specificiteit was statistisch significant lager in studies waar enkel patiënten met bevestigde sepsis werden geïncludeerd vergeleken met patiënten met een vermoeden van of een bevestigde infectie (p<0,01). De positive en negative likelihood ratio (LR+ en LR-) voor de qSOFA-score was respectievelijk 3,00 (95% BI 2,39 tot 3,77) en 0,60 (95% BI 0,50 tot 0,7). De LR+ en LR- voor de SIRS-criteria was respectievelijk 1,22 (95% BI 1,06 tot 1,39) en 0,46 (95% BI 0,39-0,56) (Song, 2018).

 

In 11 studies in de review van Song (2018) werd de qSOFA-score (afkappunt ≥ 2) met de SIRS-criteria ≥ 2 vergeleken voor deze uitkomstmaat. In figuur 2 zijn de resultaten gepresenteerd in een forest plot. De gepoolde sensitiviteit voor de SIRS-criteria was redelijk hoog met 0,86 (95% BI 0,79 tot 0,92) , met een hoge heterogeniteit van I2=98,3%. De oorzaken van heterogeniteit voor de SIRS-criteria zijn niet onderzocht of niet gepresenteerd.

 

De gepoolde specificiteit voor de SIRS-criteria was laag met 0,29 (95% BI 0,17 tot 0,45), met een hoge heterogeniteit van I2=99,9%. De oorzaken van heterogeniteit voor de SIRS-criteria zijn niet onderzocht of niet gepresenteerd (Song, 2018).

 

In figuur 3 zijn de gepoolde resultaten gepresenteerd in een summary receiver operating characteristic (SROC) curve voor beide instrumenten. Dit is een gecombineerde maat, waarbij sensitiviteit wordt afgezet tegen 1-specificiteit en zegt iets over het discriminerend vermogen van een test. De area under the curve (AUC) was 0,74 (95% BI 0,70 tot 0,78) voor positieve qSOFA scores en 0,71 (95% BI 0,67 tot 0,75) voor positieve SIRS-criteria. Het verschil tussen beide testen was niet significant voor het discriminerend vermogen (p=0,82) (Song, 2018).

 

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaat voorspellende waarde en discriminerend vermogen mortaliteit voor de qSOFA-score vergeleken met de SIRS-criteria is met twee niveaus verlaagd gezien beperkingen in de onderzoeksopzet (risk of bias: meerderheid retrospectieve studie-opzet, onduidelijke blindering tijdens interpretatie van resultaten en uitval van patiënten is onduidelijk gerapporteerd); tegenstrijdige resultaten (inconsistentie; hoge heterogeniteit en niet alle oorzaken hiervan zijn onderzocht of gepresenteerd). Het niveau van de bewijskracht komt uit op GRADE ‘laag’.

 

Figuur 1 Sensitiviteit en specificiteit van de qSOFA voor het voorspellen van mortaliteit bij patiënten met een infectie buiten de IC

F1

Bron: Song, 2018. Z: p-waarde van het gepoolde effect; df: vrijheidsgraden; I2: statistische heterogeniteit; CI: betrouwbaarheidsinterval

 

Figuur 2 Sensitiviteit en specificiteit van de SIRS-criteria (afkappunt ≥ 2) voor het voorspellen van mortaliteit bij patiënten met een infectie buiten de IC

F2

Bron: Song, 2018. Z: p-waarde van het gepoolde effect; df: vrijheidsgraden; I2: statistische heterogeniteit; CI: betrouwbaarheidsinterval

 

Figuur 3 Hiërarchische SROC-curves voor a) qSOFA-score (afkappunt ≥ 2) en b) SIRS-criteria (≥ 2 punten verhoging) voor het voorspellen van mortaliteit bij patiënten met een infectie buiten de IC

F3

Bron: Song, 2018

 

qSOFA-score vergeleken met SIRS-criteria: voorspellende waarde en discriminerend vermogen voor IC-opname

10 studies in de review van Song (2018) rapporteerden over deze uitkomst voor de qSOFA-score (afkappunt ≥ 2). In de gepoolde schattingen hadden patiënten met een positieve score qSOFA en SIRS-criteria (≥2 punten verhoging) een prevalentie van IC-opname van respectievelijk 37,0% (5.325/14.384) en 24,3% (6.741/27.759).

 

In figuur 4 zijn de resultaten voor sensitiviteit en specificiteit gepresenteerd in een forest plot. De gepoolde sensitiviteit voor de qSOFA-score was laag met 0,53 (95% BI 0,52 tot 0,54), met een hoge heterogeniteit van I2=98,6%. De gepoolde specificiteit voor de qSOFA-score was redelijk met 0,75 (95% BI 0,75 tot 0,76), met een hoge heterogeniteit van I2=99,8%. De oorzaken van heterogeniteit zijn niet onderzocht of niet gepresenteerd.

 

De LR+ en LR- voor de qSOFA-score was respectievelijk 2,24 (95% BI 1,91 tot 2,77) en 0,74 (95% BI 0,67 tot 0,83). De LR+ en LR- voor de SIRS-criteria was respectievelijk 1,11 (95% BI 0,96 tot 2,26) en 0,14 (95% BI 0,13 tot 0,14).

 

In drie studies in de review van Song (2018) werd de qSOFA-score (afkappunt ≥ 2) met de SIRS-criteria (≥ 2 punten verhoging) vergeleken voor deze uitkomstmaat. In figuur 5 zijn de resultaten voor sensitiviteit en specificiteit gepresenteerd in een forest plot. De gepoolde sensitiviteit voor de SIRS was redelijk hoog met 0,91 (95% BI 0,90 tot 0,92), met een matige heterogeniteit van I2=42,7%.

 

De gepoolde specificiteit voor de SIRS was laag met 0,14 (95% BI 0,13 tot 0,14) , met een hoge heterogeniteit van I2=98,4%. De oorzaken van heterogeniteit voor de SIRS-criteria zijn niet onderzocht of niet gepresenteerd.

 

In figuur 6 zijn de gepoolde resultaten gepresenteerd in een SROC-curve voor beide instrumenten. De AUC was 0,63 (95% BI 0,62 tot 0,64) voor positieve qSOFA-scores en 0,78 (95% BI 0,58 tot 0,98) voor positieve SIRS-criteria. De qSOFA-scores lijken een slechter discriminerend vermogen te hebben vergeleken met SIRS-criteria, maar dit verschil was niet significant (p=0,12) (Song, 2018).

 

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaat voorspellende waarde en discriminerend vermogen voor IC-opname voor de qSOFA-score vergeleken met de SIRS-criteria is met twee niveaus verlaagd gezien beperkingen in de onderzoeksopzet (risk of bias: meerderheid retrospectieve studie-opzet, onduidelijke blindering tijdens interpretatie van resultaten en uitval van patiënten is onduidelijk gerapporteerd); tegenstrijdige resultaten (inconsistentie; hoge heterogeniteit en niet alle oorzaken hiervan zijn onderzocht of gepresenteerd). Het niveau van de bewijskracht komt uit op GRADE ‘laag’.

 

Figuur 4 Sensitiviteit en specificiteit van de qSOFA-score (afkappunt ≥ 2) voor het voorspellen van IC-opname bij patiënten met een infectie buiten de IC

F4

Bron: Song, 2018

 

Figuur 5 Sensitiviteit en specificiteit van de SIRS-criteria (≥ 2 punten verhoging) criteria voor het voorspellen van IC-opname bij patiënten met een infectie buiten de IC

F5

Bron: Song, 2018

 

Figuur 6 SROC-curves voor a) qSOFA-score (afkappunt ≥ 2) en b) SIRS-criteria (afkappunt≥ 2) voor het voorspellen van IC-opname bij patiënten met een infectie buiten de IC

F6

Bron: Song, 2018

 

qSOFA vergeleken met SIRS-criteria: voorspellende waarde en discriminerend vermogen voor acute orgaandisfunctie

9 studies met 10 datasets in de review van Song (2018) rapporteerden over deze uitkomst voor de qSOFA-score (afkappunt ≥ 2). In de gepoolde schattingen hadden patiënten met een positieve qSOFA-score en SIRS-criteria een prevalentie van acute orgaandisfunctie van respectievelijk 82,8% (2.433/2.936) en 36,2%% (1.830/5.047).

 

In figuur 7 zijn de resultaten voor sensitiviteit en specificiteit gepresenteerd in een forest plot. De gepoolde sensitiviteit voor de qSOFA-score was laag met 0,47 (95% BI 0,28 tot 0,66), met een hoge heterogeniteit van I2=98,6%. De gepoolde specificiteit voor de qSOFA-score was hoog met 0,93 (95% BI 0,88 tot 0,97), met een hoge heterogeniteit van I2=99,0%. De oorzaken van heterogeniteit zijn niet onderzocht of niet gepresenteerd.

 

De LR+ en LR- voor de qSOFA-score was respectievelijk 7,13 (95% BI 4,42 tot 11,49) en 0,57 (95% BI 0,40 tot 0,81). De LR+ en LR- voor de SIRS-criteria was respectievelijk 1,64 (95% BI 1,19 tot 2,26) en 0,34 (95% BI 0,24 tot 0,47).

 

In vier studies in de review van Song (2018) werd de qSOFA-score met de SIRS-criteria vergeleken voor deze uitkomstmaat. In figuur 8 zijn de resultaten voor sensitiviteit en specificiteit gepresenteerd in een forest plot. De gepoolde sensitiviteit voor de SIRS-criteria was redelijk hoog met 0,83 (95% BI 0,71 tot 0,91), met een hoge heterogeniteit van I2=92%.

 

De gepoolde specificiteit voor de SIRS-criteria was redelijk laag met 0,49 (95% BI 0,29 tot 0,69), met een hoge heterogeniteit van I2=99,0%. De oorzaken van heterogeniteit voor de SIRS-criteria zijn niet onderzocht of niet gepresenteerd.

 

In figuur 9 zijn de gepoolde resultaten gepresenteerd in een SROC-curve voor beide instrumenten. De AUC was 0,86 (95% BI 0,83 tot 0,89) voor positieve qSOFA-scores en 0,76 (95% BI 0,73 tot 0,80) voor positieve SIRS-criteria. De qSOFA-scores hebben een statistisch significant beter discriminerend vermogen vergeleken met de SIRS-criteria (p<0,001). (Song, 2018).

 

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaat voorspellende waarde en discriminerend vermogen van acute orgaandisfunctie voor de qSOFA-score vergeleken met de SIRS-criteria is met twee niveaus verlaagd gezien beperkingen in de onderzoeksopzet (risk of bias: meerderheid retrospectieve studie-opzet, onduidelijke blindering tijdens interpretatie van resultaten en uitval van patiënten is onduidelijk gerapporteerd); tegenstrijdige resultaten (inconsistentie; hoge heterogeniteit en niet alle oorzaken hiervan zijn onderzocht of gepresenteerd). Het niveau van de bewijskracht komt uit op GRADE ‘laag’.

 

Figuur 7 Sensitiviteit en specificiteit van de qSOFA-score (afkappunt ≥ 2) voor het voorspellen van acute orgaandisfunctie bij patiënten met een infectie buiten de IC

F7

Bron: Song, 2018

 

Figuur 8 Sensitiviteit en specificiteit van de SIRS-criteria (afkappunt ≥ 2) criteria voor het voorspellen van acute orgaandisfunctie bij patiënten met een infectie buiten de IC

F8

Bron: Song, 2018

 

Figuur 9 Hiërarchische SROC-curves voor c) qSOFA-score (afkappunt ≥ 2) en d) SIRS-criteria (afkappunt ≥ 2) voor het voorspellen van acute orgaandisfunctie bij patiënten met een infectie buiten de IC

F9

Bron: Song, 2018

 

PIRO vergeleken met andere relevante criteria: voorspellende waarde en discriminerend vermogen voor mortaliteit

Vier studies rapporteerden over de accuratesse van de PIRO-score vergeleken met een andere relevante score voor de voorspellende waarde voor mortaliteit (Quinten, 2017; de Groot, 2017; Yu, 2014; MacDonald, 2014).

 

De sensitiviteit voor de voorspelling van mortaliteit in het ziekenhuis voor de PIRO (≥ 12 of ≥ 14) varieerde tussen de 55% tot 75% (Quinten, 2017; de Groot, 2017). In de studie van de Groot (2017) was de sensitiviteit statistisch significant hoger in de subgroep onder de 70 jaar (PIRO ≥ 9) vergeleken met de groep gelijk of boven de 70 jaar (PIRO ≥ 16).

 

De specificiteit voor de voorspelling van mortaliteit in het ziekenhuis voor de PIRO (≥ 12 of ≥ 14) varieerde tussen de 76,8% tot 77%. In de studie van de Groot (2017) was de specificiteit statistisch significant lager in de subgroep onder de 70 jaar (PIRO ≥ 9) vergeleken met de groep gelijk of boven de 70 jaar (PIRO ≥ 16) (Quinten, 2017; de Groot, 2017).

In de studie van de Groot was de positief voorspellende waarde (PVW) voor de PIRO-score 0,12 (0,11 tot 0,14) en de negatief voorspellende waarde (NVW) 0,96 (0,95 tot 0,97), dit was niet verschillend voor de verschillende leeftijdscategorieën (de Groot, 2017). In de studie van Quinten (2017) was de LR+ en LR- 4,0 en 0,4 respectievelijk.

 

De AUC voor het discriminerend vermogen van de PIRO voor mortaliteit in het ziekenhuis varieerde tussen de 0.73 en 0.87. In de studie van de Groot, 2017 was de AUC statistisch significant hoger in de subgroep onder de 70 jaar (PIRO ≥ 9) vergeleken met de groep gelijk of boven de 70 jaar (PIRO ≥ 16) (Quinten, 2017; de Groot, 2017; Yu, 2014; MacDonald, 2014).

 

PIRO versus qSOFA-score

In de studies van Quinten (2017) en de Groot (2017) werd de PIRO-score vergeleken met de qSOFA-score. De sensitiviteit was statistisch significant lager voor de qSOFA-score vergeleken met de PIRO, en de specificiteit was statistisch significant hoger. Dit verschil is kleiner in een subgroep boven de 70 jaar.

 

In de studie van de Groot (2017), verschilde de PVW en NVW niet significant van de PIRO-score (de Groot, 2017). In de studie van Quinten (2017), was de LR+ hoger voor de qSOFA-score vergeleken met de PIRO, en de LR- was nagenoeg gelijk, er werden geen spreidingsmaten gepresenteerd.

 

Het verschil in AUC is in de studie van Quinten (2017) niet statistisch significant en in de studie van de Groot (2017) is de AUC significant groter voor de PIRO vergeleken met de qSOFA-score.

 

PIRO versus MEWS

In de studies van de Groot (2017) en Yu (2014) werd de PIRO-score vergeleken met de MEWS (afkappunt ≥ 7). De sensitiviteit was statistisch significant lager voor de MEWS vergeleken met de PIRO, en de specificiteit was gelijk. Dit verschil is kleiner in een subgroep boven de 70 jaar. In de groep < 70 werd een ander afkappunt gehanteerd voor de MEWS, namelijk ≥ 5.

 

In de studie van de Groot (2017) verschilden de PVW en NVW niet significant van de PIRO-score.

 

Het verschil in AUC is in de studie van Yu (2014) niet statistisch significant en in de studie van de Groot (2017) is de AUC, het discriminerend vermogen significant groter voor de PIRO vergeleken met de MEWS (de Groot, 2017; Yu, 2014).

 

PIRO versus NEWS

In de studie van de Groot (2017) werd de PIRO-score vergeleken met de NEWS (afkappunt ≥ 8). De sensitiviteit was statistisch significant hoger voor de NEWS vergeleken met de PIRO, en de specificiteit was statistisch significant lager. Dit verschil is kleiner in een subgroep boven de 70 jaar.

 

De positief en negatief voorspellende waarde verschilde statistisch niet significant van de PIRO-score. Het discriminerend vermogen was significant groter voor de PIRO vergeleken met de NEWS (de Groot, 2017).

 

PIRO versus SOFA-score

In de studie van MacDonald (2014) en Yu (2014) werd de PIRO-score vergeleken met de SOFA-score. De AUC, het discriminerend vermogen was significant groter voor de PIRO vergeleken met de SOFA-score in de studie van MacDonald (2014), dit verschil was niet aanwezig in de studie van Yu (2014).

 

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaat voorspellende waarde en discriminerend vermogen voor mortaliteit voor de PIRO-score vergeleken met andere relevante scores is met drie niveaus verlaagd gezien beperkingen in de onderzoeksopzet (risk of bias: patiënt selectie, onduidelijke blindering tijdens interpretatie van resultaten en uitval van patiënten is onduidelijk gerapporteerd) en het geringe aantal events (imprecisie). Het niveau van de bewijskracht komt uit op GRADE ‘zeer laag’.

 

PIRO vergeleken met andere relevante criteria: voorspellende waarde en discriminerend vermogen voor IC-opname of andere vorm van klinische verslechtering

In de studie van Quinten (2017) was de sensitiviteit voor de voorspelling van IC-opname redelijk laag met 57,1% voor de PIRO (≥ 14) en 57,1% voor de qSOFA-score (afkappunt ≥ 2). De specificiteit was beter met 89,0% voor de PIRO (≥ 12) en 87,2% voor de qSOFA-score (afkappunt ≥b2). Er werden geen spreidingsmaten of p-waarden gepresenteerd.

 

De LR+ was hoger voor de PIRO-score vergeleken met de qSOFA-score, en de LR- was gelijk, er werden geen spreidingsmaten gepresenteerd.

 

De AUC was voor het discriminerend vermogen voor IC-opname 0.75 (0.63 tot 0.88) voor de PIRO, en 0,81 (0,72 tot 0,90) voor de qSOFA-score (Quinten, 2017).

 

In de studie van de Groot (2017) was er geen verschil tussen de AUC voor het discriminerend vermogen voor IC-opname, beide 0.72 tussen de PIRO en qSOFA-score. De AUC voor de MEWS en NEWS was niet significant anders, namelijk 0,71 en 0,75.

 

Yu (2014) definieerde ook als eindpunt van klinisch verslechtering IC-opname, IC-transfer, kritische zorg consult voor IC-transfer, SIT-team evaluatie, of mortaliteit binnen het ziekenhuis. De AUC voor het discriminerend vermogen voor een dergelijke klinische verslechtering was in de eerste 0 tot 12 uur het hoogst voor de SOFA-score met 0,78, daarna de PIRO met 0,78 en dan de MEWS met 0,73, ze verschilden niet significant van elkaar.

 

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaat voorspellende waarde en discriminerend vermogen voor IC-opname voor de PIRO-score vergeleken met andere relevante criteria is met drie niveaus verlaagd gezien beperkingen in de onderzoeksopzet (risk of bias: patiënt selectie, onduidelijke blindering tijdens interpretatie van resultaten en uitval van patiënten is onduidelijk gerapporteerd) en het geringe aantal events (imprecisie). Het niveau van de bewijskracht komt uit op GRADE ‘zeer laag’.

 

NEWS vergeleken met andere relevante criteria: voorspellende waarde en discriminerend vermogen voor mortaliteit en IC opname

Eén studie rapporteerde over de accuratesse van de NEWS-score vergeleken met andere relevante score voor de voorspellende waarde en discriminerend vermogen voor mortaliteit (Goulden, 2018).

 

In de studie van Goulden (2018) was de sensitiviteit voor de NEWS (afkappunt ≥ 5) 74% (95% BI 68 tot 79), dit was vergelijkbaar met de SIRS-criteria en significant hoger dan de qSOFA-score. De specificiteit was voor de NEWS (afkappunt ≥ 5) 43% (95% BI 41 tot 46), dit was significant hoger dan voor de SIRS-criteria, maar significant lager dan voor de qSOFA-score. De negatief voorspellende waarde verschilde niet tussen qSOFA-score, SIRS-criteria en NEWS, deze varieerde tussen de 86% tot 91%. De AUC, het discriminerend vermogen voor mortaliteit was voor de NEWS 0,65 (95% BI 0,61 tot 0,68), vergelijkbaar met de qSOFA-score en significant beter dan de SIRS-criteria. Resultaten waren vergelijkbaar voor de voorspelling van IC-opname (Goulden, 2018).

 

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaat voorspellende waarde en discriminerend vermogen voor mortaliteit of IC-opname voor de NEWS vergeleken met qSOFA-score en SIRS-criteria is met twee niveaus verlaagd gezien beperkingen in de onderzoeksopzet (risk-of-bias: patiëntenselectie, onduidelijke blindering tijdens interpretatie van resultaten) en het geringe aantal events (imprecisie). Het niveau van de bewijskracht komt uit op GRADE ‘laag’.

 

MEWS/NEWS vergeleken met andere relevante criteria: voorspellende waarde en discriminerend vermogen voor de gecombineerde maat mortaliteit en/of IC-opname

Drie studies rapporteerden over de accuratesse van de MEWS- of NEWS-score vergeleken met andere relevante score voor de voorspellende waarde en discriminerend vermogen voor de gecombineerde maat mortaliteit en/of IC-opname (Churpek, 2017; Yu, 2017; Goulden, 2018). De vergelijking van de PIRO met de MEWS is hierboven al beschreven. (Yu, 2014) De resultaten van Goulden (2018) waren vergelijkbaar voor de samengestelde maat zoals hierboven beschreven.

 

In de studie van Churpek (2017) was de sensitiviteit het laagst voor de qSOFA-score (afkappunt ≥ 2) met 8%, gevolgd door de NEWS (afkappunt ≥ 5) met 63%, de SIRS-criteria (afkappunt ≥ 2) met 66%, de SOFA-score (afkappunt ≥ 1) met 68% en de MEWS(afkappunt ≥ 3) met 69%.

 

De specificiteit was het laagst voor de SOFA-score (afkappunt ≥ 1) met 45%, gevolgd door de SIRS-criteria (≥ 2) criteria met 50%, de MEWS (afkappunt ≥ 3) met 57%, de NEWS afkappunt (≥ 5) met 64% en de qSOFA-score (afkappunt ≥ 2) met 92%.

 

De positief voorspellende waarde was het laagst voor de SOFA-score (afkappunt ≥ 1) en SIRS-criteria (afkappunt ≥ 2) met 15%, gevolgd door de MEWS (afkappunt ≥ 3) met 18%, de NEWS (afkappunt ≥ 5) met 19% en de qSOFA-score met 25%.

 

De negatief voorspellende waarde was het laagst voor de qSOFA-score (afkappunt ≥ 2) met 89%, gevolgd door de SIRS-criteria (afkappunt ≥ 2) en SOFA-score (afkappunt ≥ 1) met 91%, en de MEWS (afkappunt ≥ 3) en NEWS (afkappunt ≥ 5) met 91%.

 

De mediane AUC, het discriminerend vermogen was het laagst voor de SIRS met 0,60, gevolgd door de SOFA-score met 0,62, de qSOFA-score met 0,65, MEWS met 0,67 en NEWS met 0,71.

 

Er werden geen spreidingsmaten of p-waardes gepresenteerd (Churpek, 2017).

 

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaat voorspellende waarde en discriminerend vermogen voor de gecombineerde maat mortaliteit en/of IC-opname voor de NEWS/MEWS-score vergeleken met andere relevante scores is met twee niveaus verlaagd gezien beperkingen in de onderzoeksopzet (risk-of-bias: patiëntenselectie, onduidelijke blindering tijdens interpretatie van resultaten). Het niveau van de bewijskracht komt uit op GRADE ‘laag’.

Om de uitgangsvraag te kunnen beantwoorden is er een systematische literatuuranalyse verricht naar de volgende zoekvraag:

Is er een instrument waarmee (verslechtering van patiënten met) sepsis beter herkend of voorspeld kan worden dan met de SIRS-criteria op de SEH en de verpleegafdelingen?

 

P: patiënten van 18 jaar en ouder met verdenking sepsis zowel op de SEH als op de verpleegafdelingen in het ziekenhuis;

I: quick sepsis related organ failure assessment (qSOFA) score, early warning score (EWS), national early warning score (NEWS), modified early warning score (MEWS), predisposition, infection (or insult), response and organ dysfunction (PIRO);

C: systemic inflammatory response syndrome (SIRS) criteria, sepsis related organ failure assessment (SOFA) score of vergelijking met andere bovengenoemde test;

O: Voorspellende waarde en discriminerend vermogen mortaliteit, IC-opname, acute orgaandisfunctie; tijd tot behandeling; door-to-needle time; functionele uitkomst.

 

Relevante uitkomstmaten

De werkgroep achtte de voorspellende waarde (met name sensitiviteit) en discriminerend vermogen voor mortaliteit en/of IC-opname een voor de besluitvorming kritieke uitkomstmaat.

 

De werkgroep definieerde niet a priori de genoemde uitkomstmaten, maar hanteerde de in de studies gebruikte definities.

 

Zoeken en selecteren (Methode)

In de databases Medline (via OVID) en Embase (via Embase.com) is op 19 april 2018 met relevante zoektermen gezocht naar de verschillende instrumenten voor de herkenning van sepsis bij volwassen patiënten. De zoekverantwoording is weergegeven onder het tabblad Verantwoording. De literatuurzoekactie leverde 731 treffers op. Studies werden geselecteerd op grond van de volgende selectiecriteria: systematische reviews, gerandomiseerde trials of vergelijkend observationele studies waar twee of meerdere relevante instrumenten (qSOFA-score, SOFA-score, SIRS-criteria, NEWS, MEWS, PIRO) met elkaar werden vergeleken op de hierboven genoemde uitkomstmaten bij patiënten met verdenking van een infectie in een niet-IC-setting. Op basis van titel en abstract werden in eerste instantie 65 studies voorgeselecteerd. Na raadpleging van de volledige tekst, werden vervolgens 58 studies geëxcludeerd (zie exclusietabel onder het tabblad Verantwoording), en 7 studies definitief geselecteerd (Song, 2018; Churpek, 2017; Goulden, 2018; Quinten, 2017; de Groot, 2017; Yu, 2014; MacDonald, 2014).

 

Zeven studies zijn opgenomen in de literatuuranalyse. De belangrijkste studiekarakteristieken en resultaten zijn opgenomen in de evidencetabellen. De beoordeling van de individuele studieopzet (risk-of-bias) is opgenomen in de risk-of-biastabellen.

  1. Churpek MM, Snyder A, Sokol S, Pettit NN, Edelson DP. Investigating the Impact of Different Suspicion of Infection Criteria on the Accuracy of Quick Sepsis-Related Organ Failure Assessment, Systemic Inflammatory Response Syndrome, and Early Warning Scores. Crit Care Med. 2017 Nov;45(11):1805-1812. doi: 10.1097/CCM.0000000000002648.
  2. Goulden R, Hoyle MC, Monis J, Railton D, Riley V, Martin P, Martina R, Nsutebu E. qSOFA, SIRS and NEWS for predicting inhospital mortality and ICU admission in emergency admissions treated as sepsis. Emerg Med J. 2018 Feb 21. pii:emermed-2017-207120. doi: 10.1136/emermed-2017-207120. (Epub ahead of print)
  3. de Groot B, Stolwijk F, Warmerdam M, Lucke JA, Singh GK, Abbas M, Mooijaart SP, Ansems A, Esteve Cuevas L, Rijpsma D. The most commonly used disease severity scores are inappropriate for risk stratification of older emergency department sepsis patients: an observational multi-centre study. Scand J Trauma Resusc Emerg Med. 2017 Sep 11;25(1):91. doi: 10.1186/s13049-017-0436-3.
  4. Macdonald SP, Arendts G, Fatovich DM, Brown SG. Comparison of PIRO, SOFA, and MEDS scores for predicting mortality in emergency department patients with severe sepsis and septic shock. Acad Emerg Med. 2014 Nov;21(11):1257-63. doi: 10.1111/acem.12515.
  5. Quinten VM, van Meurs M, Wolffensperger AE, Ter Maaten JC, Ligtenberg JJM. Sepsis patients in the emergency department: stratification using the Clinical Impression Score, Predisposition, Infection, Response and Organ dysfunction score or quick Sequential Organ Failure Assessment score? Eur J Emerg Med. 2017 May 8. doi: 10.1097/MEJ.0000000000000460. (Epub ahead of print)
  6. Rhodes, A., Evans, L. E., Alhazzani, W., Levy, M. M., Antonelli, M., Ferrer, R., . . . Dellinger, R. P. (2017). Surviving Sepsis Campaign: International Guidelines for Management of Sepsis and Septic Shock: 2016. Intensive Care Med, 43(3), 304-377. doi:10.1007/s00134-017-4683-6
  7. Singer M, Deutschman CS, Seymour CW, Shankar-Hari M, Annane D, Bauer M, Bellomo R, Bernard GR, Chiche JD, Coopersmith CM, Hotchkiss RS, Levy MM, Marshall JC, Martin GS, Opal SM, Rubenfeld GD, van der Poll T, Vincent JL, Angus DC. The Third International Consensus Definitions for Sepsis and Septic Shock (Sepsis-3). JAMA. 2016 Feb 23;315(8):801-10. doi: 10.1001/jama.2016.0287.
  8. Song JU, Sin CK, Park HK, Shim SR, Lee J. Performance of the quick Sequential (sepsis-related) Organ Failure Assessment score as a prognostic tool in infected patients outside the intensive care unit: a systematic review and meta-analysis. Crit Care. 2018 Feb 6;22(1):28. doi: 10.1186/s13054-018-1952-x.

Evidence table for diagnostic test prognostic accuracy systematic review studies

Research question: Is er een instrument waarmee (verslechtering van) sepsis beter herkend of voorspeld kan worden dan met de SIRS criteria op de verpleegafdelingen en de spoedeisende hulp?

Study reference

Study characteristics

Patient characteristics

Test of interest

Outcome measures and effect size

Comments

Song, 2018

study characteristics and results are extracted from the SR (unless stated otherwise)

SR and meta-analysis)

 

Literature search up to July 2017

 

A: April, 2017

B: Askim, 2017

C: Chen, 2016

D: Churpek, 2017

E: Donnelly, 2017

F: Dorsett, 2017

G: Finkelszstein, 2017

H: Forward, 2017

I: Freund, 2017

J: Giamarellos-Bourboulis, 2017

K: Henning, 2017

L: Huson, 2017

M: Hwang, 2017

N: Kim, 2017

O: Kolditz, 2017

P: Mellhamar, 2017

Q: Park, 2017

R: Peake, 2017

S: Quinten, 2017

T: Ranzani, 2017

U: Seymour, 2016

V: Wang, 2016

W: Williams, 2017

 

Study design: All retrospective and prospective observational or cohort studies

 

Setting:

All single or multi center

A: ED

B: ED

C: ED

D: ED, ward

E: NA

F: ED

G: ED, ward

H: Non-ICU

I: ED

J: ED, ward

K: ED

L: non-ICU

M: ED

N: non-ICU

O: non-ICU

P: non-ICU

Q: ED

R: ED

S: ED

T: ED

U: ED, ward

V: ED

W: ED

 

Source of funding and conflicts of interest:

research grant from the Jeju National

University Hospital Development Fund.

No competing interests declared by the authors of the SR.

Inclusion criteria SR:

1. The study targeted patients with suspected or confirmed infection outside the ICU.

2. The study evaluated the qSOFA score as a predictive tool for predicting in-hospital mortality, acute organ

dysfunction, or ICU admission.

3. The study provided sufficient data to calculate

absolute numbers of true-positive, false-positive, false-negative, and true-negative results.

- English and published in full length.

 

Exclusion criteria SR:

qSOFA and SIRS were evaluated, other tools such as PIRO, MEWS, NEWS etc. are not presented in this SR.

 

23 studies included

 

Important patient characteristics:

 

N, mean age

A: 214, 68 yrs

B: 1535, 62 yrs

C: 1631, 73 yrs

D: 30,677, 58 yrs

E: 2593, 67 yrs

F: 152, Not available (NA)

G: 151, 64 yrs

H: 162, NA

I: 879, 67 yrs

J: 3436, NA

K: 7637, 58 yrs

L: 328, 34 yrs

M: 1395, 65 yrs

N: 615, 54 yrs

O: 9327, 64 yrs

P: 339, NA

Q: 1109, 67 yrs

R: 1591, 63 yrs

S: 193, 60 yrs

T: 6874, 66 yrs

U: 66,522, 61 yrs

V: 477, 73 yrs

W: 8871, 49 yrs

 

Sex: (% male)

A: 59%

B: 53%

C: 59%

D: 47%

E: 40%

F: NA

G: 55%

H: NA

I: 53%

J: NA

K: 50%

L: 38%

M: 56%

N: 33%

O: 56%

P: NA

Q: 45%

R: 60%

S: 56%

T: 62%

U: 43%

V: 62%

W: 51%

 

Participant selection:

A: suspected infection, admitted to ICU

B: suspected infection

C: Community Acquired Pneumonia (CAP)

D: suspected infection

E: suspected infection

F: suspected infection

G: suspected infection, admitted to ICU

H: suspected infection

I: suspected infection

J: suspected or confirmed infection

K: suspected infection

L: suspected infection

M: severe sepsis or septic shock

N: neutropenic fever

O: CAP

P: suspected infection

Q: suspected infection

R: early septic shock

S: suspected or confirmed infection

T: CAP

U: suspected infection

V: suspected infection

W: suspected infection

Describe index test and

cut-off point(s):

 

A1: qSOFA

A2: SIRS

B1: qSOFA

B2: SIRS

C: qSOFA

D1: qSOFA

D2: SIRS

E1: qSOFA

E2: SIRS

F: qSOFA

G1: qSOFA

G2: SIRS

H1: qSOFA

H2: SIRS

I1: qSOFA

I2: SIRS

J: qSOFA

K1: qSOFA

K2: SIRS

L: qSOFA

M: qSOFA

N: qSOFA

O: qSOFA

P: qSOFA

Q: qSOFA

R: qSOFA

S: qSOFA

T1: qSOFA

T2: SIRS

U1: qSOFA

U2: SIRS

V: qSOFA

W1: qSOFA

W2: SIRS

 

Overall mortality rate:

A: 18.2%

B: 4.4%

C: 33%

D: 5.4%

E: 11.3%

F: NA

G: 19%

H: 15.5%

I: 8.4%

J: 25.2%

K: 14.2%

L: 4.5%

M: 15%

N: 3.2%

O: 3.0%

P: NA

Q: 15.8%

R: 18.7%

S: 4.1%

T: 6.4%

U: 2.8%

V: 27.4%

W: 8.7%

 

Outcome measures and effect size (include 95%CI and p-value if available):

 

Outcome measure-1: Diagnostic accuracy for in-hospital mortality using positive qSOFA scores and SIRS criteria (N=20 studies; A; B; C; D; E; G; H; I; J; K; M; N; O; Q; S; T; U; V; W):

(sensitivity (%))

Pooled characteristic (bivariate analysis) per test and cut-off point:

qSOFA (cut-off= ≥2)

0.51 (95% CI 0.39 to 0.62)

Heterogeneity (reasons): 97.6% (timing of the qSOFA score measurement)

At time of initial suspicion of infection:

0.39 (95% CI 0.28 to 0.51)

Worst values: 0.71 (95% CI 0.57 to 0.85), p=0.01)

SIRS (cut-off= ’positive’)

0.86 (95% CI 0.79 to 0.92)

Heterogeneity (reasons): 98.3% (reasons not explored)

 

(specificity (%))

Pooled characteristic (bivariate analysis) per test and cut-off point:

qSOFA (cut-off= ≥2)

0.83 (95% CI 0.74 to 0.89)

Heterogeneity (reasons): 99.8% (study location, overall mortality rate, disease severity)

 

SIRS (cut-off= ’positive’)

0.29 (95% CI 0.17 to 0.45)

Heterogeneity (reasons): 99.9% (reasons not explored)

 

(AUC curves)

Pooled characteristic (HSROC curves) per test and cut-off point:

qSOFA (cut-off= ≥2)

0.74 (95% CI 0.70 to 0.78)

SIRS (cut-off= ’positive’)

0.71 (95% CI 0.67 to 0.75)

P=0.82

Meta-regression: mortality and timing of qSOFA measurement were inversely associated with between-study heterogeneity.

 

Overall mortality ≥10%: 0.73 (95% CI 0.67-0.79)

Overall mortality <10%: 0.78 (95% CI 0.76-0.83)

 

Initial suspicion of infection: 0.73 (95% CI 0.69-0.77)

Worst values: 0.76 (95% CI 0.72-0.80)

 

Outcome measure-2: Diagnostic accuracy for acute organ dysfunction using qSOFA scores and SIRS criteria (n=9 studies; B; F; H; M; N; P; Q; R; W)

 

Pooled characteristic (bivariate random effects model) per test and cut-off point:

qSOFA (cut-off= ≥2)

0.47 (95% CI 0.28 to 0.66)

Heterogeneity (reasons): 99.4% (reasons not explored)

SIRS (cut-off= ’positive’)

0.83 (95% CI 0.71 to 0.91)

Heterogeneity (reasons): 92.0% (reasons not explored)

 

(specificity (%))

Pooled characteristic (bivariate random effects model) per test and cut-off point:

qSOFA (cut-off= ≥2)

0.93 (95% CI 0.88 to 0.97)

Heterogeneity (reasons): 98.9% (reasons not explored)

SIRS (cut-off= ’positive’)

0.49 (95% CI 0.29 to 0.69)

Heterogeneity (reasons): 99.0% (reasons not explored)

 

(AUC curves)

Pooled characteristic (HSROC curves) per test and cut-off point:

qSOFA (cut-off= ≥2)

0.86 (95% CI 0.83 to 0.89)

SIRS (cut-off= ’positive’)

0.76 (95% CI 0.73 to 0.80)

P<0.001 in favour of qSOFA

 

Outcome measure-2: Diagnostic accuracy for ICU admission using qSOFA scores and SIRS criteria (n=10 studies; C; D; H; I; M; N; O; R; S; V)

 

Pooled characteristic (bivariate random effects model) per test and cut-off point:

qSOFA (cut-off= ≥2)

0.53 (95% CI 0.52 to 0.54)

Heterogeneity (reasons): 98.6% (reasons not explored)

SIRS (cut-off= ’positive’)

0.91 (95% CI 0.90 to 0.92)

Heterogeneity (reasons): 42.7% (reasons not explored)

 

(specificity (%))

Pooled characteristic (bivariate random effects model) per test and cut-off point:

qSOFA (cut-off= ≥2)

0.75 (95% CI 0.75 to 0.76)

Heterogeneity (reasons): 99.8% (reasons not explored)

SIRS (cut-off= ’positive’)

0.14 (95% CI 0.13 to 0.14)

Heterogeneity (reasons): 98.4% (reasons not explored)

 

(AUC curves)

Pooled characteristic (HSROC curves) per test and cut-off point:

qSOFA (cut-off= ≥2)

0.63 (95% CI 0.62 to 0.64)

SIRS (cut-off= ’positive’)

0.78 (95% CI 0.58 to 0.98)

P=0.12

Study quality (ROB): QUADAS-2 tool used. Risk of Bias in patient selection and flow and timing. Overall: low bias

 

Brief description of author’s conclusion

A positive qSOFA-score had high specificity outside the ICU in early detection of in-hospital mortality,acute organ dysfunction, and ICU admission, but low sensitivity may have limitations as a predictive tool for

adverse outcomes. Because between-study heterogeneity was highly represented among the studies, our results should be interpreted with caution.

 

Heterogeneity: assessment of the reasons for heterogeneity via meta-regression. As explained in results. Study design, no. of patients, location of enrolment (ED/non-ICU), source of infection) were not significant in explaining heterogeneity.

 

 


Evidence table for diagnostic test prognostic accuracy studies

Research question: Is er een instrument waarmee (verslechtering van) sepsis beter herkend of voorspeld kan worden dan met de SIRS-criteria op de verpleegafdelingen en de spoedeisende hulp?

Study reference

Study characteristics

Patient characteristics

Index test

(test of interest)

Reference test

 

Follow-up

Outcome measures and effect size

Comments

Churpek, 2017

Type of study[1]: Prospective Observational cohort study (data collection mainly retrospective)

 

Setting: Hospitalized patients outside the ICU. Single academic centre

 

Country: US

 

Conflicts of interest:

Drs. Chupek and Edelson disclosed having a patent pending

for risk-stratification algorithms for hospitalized

patients. Dr. Edelson’s institution received funding in the form of research

support from Philips Healthcare (Andover, MA) and EarlySense (Tel Aviv,

Israel), and she received funding from QuantHC (Chicago, IL) (ownership

interest). The remaining authors have disclosed that they do not have any potential conflicts of interest.

Inclusion criteria:

- all adult patients admitted to the University of Chicago Medicine

- varying levels of suspicion of infection were created using EHR data based on culture orders and antibiotic administration: 1) any culture, 2) blood culture, 3)

any culture plus IV antibiotics, 4) blood culture plus IV antibiotics,

5) any culture plus IV antibiotics for at least 4 out of

7 days, and 6) blood culture plus IV antibiotics for at least 5 out of 7 days.

 

Exclusion criteria: prophylactic dose antibiotics

 

N=53,849

 

Prevalence: In-hospital mortality=3%

IC-transfer=17%

 

Mean age ± SD: 57 (18)

 

Sex:54% F

Describe index test: SIRS

Cut-off point(s): different used

 

Comparator test[2]: SOFA

Cut-off point(s): different used

 

Comparator test[3]: qSOFA

Cut-off point(s): different used

 

Comparator test[4]: MEWS

Cut-off point(s): different used

 

Comparator test[5]: NEWS

Cut-off point(s): different used

 

Only scores calculated in the ED and wards were included in the analyses. In addition, non-physiologic values were changed to missing.

Describe reference test[6]:

In-hospital mortality

 

Time between the index test and reference test: not relevant

 

For how many participants were no complete outcome data available?

Unclear

 

 

Outcome measures and effect size (include 95%CI and p-value if available)4:

 

Sensitivity/Specificity for any culture

SOFA≥1: 68%/45%

SIRS≥1: 66%/50%

qSOFA≥2: 18%/92%

MEWS≥3: 69%/93%

NEWS≥5: 63%/64%

 

PPV/NPV for any culture

SOFA≥1: 15%/91%

SIRS≥1: 15%/91%

qSOFA≥2: 24%/89%

MEWS≥3: 18%/93%

NEWS≥5: 19%/93%

 

Median AUC

SOFA: 0.62

SIRS: 0.60

qSOFA: 0.65

MEWS: 0.67

NEWS: 0.71

 

 

 

Quinten, 2017

Type of study: Prospective observational cohort study

 

Setting: ED

 

Country: The Netherlands

 

Conflicts of interest: There are no conflicts of interest.

 

Inclusion criteria:

-adults visiting the ED between 8am and 6pm

- patients

of 18 years and older age, suspected or confirmed infection

and two or more Systemic Inflammatory Response

Syndrome criteria as defined by the International Sepsis

Definitions Conference

 

Exclusion criteria:-

 

N=193

 

Prevalence:10.9% for ICU admission; 4,1% in-hospital mortality

 

Mean age (IQR): 60 (48–71)

 

Sex: 56% M

Describe index test: PIRO

Comparator test: qSOFA

 

Assessed by ED staff upon arrival

 

Different cut-off points were used based on optimum derived from ROC curves

Describe reference test:

Mortality

Admission to ICU

 

 

Time between the index test en reference test: NA

 

For how many participants were no complete outcome data available?

N=0

 

 

Outcome measures and effect size (include 95%CI and p-value if available):

 

Sensitivity/Specificity for in-hospital mortality:

PIRO≥12: 75%/76.8%

qSOFA≥2: 62.5%/84.3%

 

LR+/LR- for in-hospital mortality:

PIRO≥12: 3.2/0.3

qSOFA≥2:4.0/0.4

 

AUC for in-hospital mortality:

PIRO: 0.76 (0.65-0.88)

qSOFA: 0.75 (0.63-0.88)

 

Sensitivity/Specificity for ICU admission

PIRO≥14: 57.1%/89.0%

qSOFA≥2: 57.1%/87.2%

 

LR+/LR- for ICU admission:

PIRO≥14:5.2/0.5

qSOFA≥2:4.5/0.5

 

AUC for ICU admission:

PIRO: 0.75 (0.63-0.88)

qSOFA: 0.81 (0.72-0.90)

In this study also comparison with Clinical Impression Scores (CIS), appraised by a nurse and the attending physician.

Goulden, 2017

Type of study: retrospective cohort study

 

Setting: ED or medical admissions unit

 

Country: UK

 

Conflicts of interest: None declared

 

Inclusion criteria:

all adult patients

presenting to the ED or medical admissions unit, in whom sepsis was suspected and treated by the clinical team.

 

Exclusion criteria:

-

 

N=1942 unique patients of which 1818 with complete scores

 

Prevalence of mortality (in hospital): 265 (15%)

 

Prevalence of ICU admission: 53 (3%)

 

Mean age: 68 yr

 

Sex: 49% Female

 

Other important characteristics:

 

Describe index test:

qSOFA≥2

Comparator test 1:

SIRS≥2

Comparator test 2:

NEWS≥5

 

Describe reference test:

In hospital mortality

Admission to ICU

 

Time between the index test en reference test: NA

 

For how many participants were no complete outcome data available?

N =124 (6%)

 

Reasons for incomplete outcome data described?

After manual review of paper charts for missing scores, the value of all three scoring systems on arrival was available

for 1818 of these patients (94%), forming our study population.

We found no evidence that missingness was predicted by

other variables; thus, a complete case analysis was performed.

Outcome measures and effect size (include 95%CI and p-value if available):

 

All analyses except AUROC used thresholds of qSOFA ≥2, SIRS≥2 and NEWS≥5.

 

Sens/ Spec for predicting inhospital death, % (95% CI):

qSOFA: 37 (31 to 43) / 79 (77 to 81)

SIRS: 80 (74 to 84)/ 21 (19 to 23)

NEWS: 74 (68 to 79) / 43 (41 to 46)

 

Sens: SIRS versus qSOFA: P<0.001

Sens: NEWS versus qSOFA: P<0.001

Sens: NEWS versus SIRS: P: 0.02 (not significant when using bonferroni correction)

Spec: qSOFA versus NEWS: P<0.001

Spec: qSOFA versus SIRS: P<0.001 NEWS versus SIRS: P<0.001

 

PPV/NPV for predicting inhospital death, % (95% CI):

qSOFA: 23 (19 to 28) / 88 (86 to 90)

SIRS: 15 (13 to 17) / 86 (82 to 89)

NEWS: 18 (16 to 21)/ 91 (88 to 93)

 

LR+/LR- for predicting inhospital death (95% CI):

qSOFA: 1.78 (1.48 to 2.14) / 0.80 (0.72 to 0.88)

SIRS: 1.01 (0.94 to 1.08) / 0.96 (0.75 to 1.25)

NEWS: 1.30 (1.19 to 1.41) / 0.61 (0.55 to 0.61)

 

AUROC for predicting inhospital death (95% CI):

qSOFA: 0.62 (0.59 to 0.66)

SIRS: 0.49 (0.45 to 0.52)

NEWS: 0.65 (0.61 to 0.68)

 

NEWS versus qSOFA: NS

SIRS versus NEWS: p<0.001

qSOFA versus SIRS: p<0.001

 

Sens/ Spec for predicting ICU admission, % (95% CI):

qSOFA: 36 (23 to 50) / 77 (75 to 79)

SIRS: 85 (72 to 93) / 21 (19 to 23)

NEWS: 77 (64 to 88) / 41 (39 to 44)

 

PPV/NPV for predicting ICU admission, % (95% CI):

qSOFA: 5 (3 to 7) / 98 (97 to 98)

SIRS: 3 (2 to 4) / 98 (96 to99)

NEWS: 4 (3 to 5) / 99 (97 to 99)

 

LR+/LR- for predicting ICU admission (95% CI):

qSOFA: 1.57 (1.09 to 2.28) / 0.83 (0.68 to 1.02)

SIRS: 1.08 (0.96 to 1.21) / 0.71 (0.37 to 1.36)

NEWS: 1.32 (1.13 to 1.53) / 0.55 (0.33 to 0.90)

 

AUROC for predicting ICU admission (95% CI):

qSOFA: 0.59 (0.52 to 0.67)

SIRS: 0.54 (0.47 to 0.61)

NEWS: 0.64 (0.57 to 0.71)

Results were similar for the composite of inhospital death or ICU admission (online supplementary table 1).

De Groot, 2017

Type of study:

Observational prospective cohort study

 

Setting: ED

 

Country: The Netherlands

 

Conflicts of interest: None declared

 

Inclusion criteria:

17 years and older with a suspected infection and Manchester triage category yellow,

orange or red who received intravenous antibiotics in the ED and were subsequently admitted to the

hospital

 

Exclusion criteria:

Triage categories

blue and green were excluded

 because most of these patients were expected

to be at very low risk for mortality or admission.

Patients who appeared to have no infection according to

the final hospital discharge letter were excluded.

 

N=2280

 

Prevalence of mortality (in hospital): N=143, 6.3%

 

Prevalence of ICU/MCU admission: N=220, 9.6%

 

Mean age (SD):

61.1 (17.0)

 

Sex: 57.7 male

Describe index test: PIRSO

Comparator test 1: qSOFA

Comparator test 2: NEWS

Comparator test 3: MEWS

 

Describe reference test:

1. In-hospital mortality

2. ICU/MCU admission

 

Time between the index test en reference test: NA

 

For how many participants were no complete outcome data available?

N =0

 

Reasons for incomplete outcome data described?

NA

Outcome measures and effect size (include 95%CI and p-value if available):

 

Sens/spec to predict in-hospital mortality, %, 95% CI:

PIRO≥14: 0.55 (0.53–0.57) / 0.77 (0.75–0.79)

qSOFA≥2: 0.32 (0.30–0.33) / 0.87 (0.85–0.88)

MEWS≥7: 0.42 (0.40–0.44) / 0.77 (0.76–0.79)

NEWS≥8: 0.63 (0.61–0.65) / 0.63 (0.61–0.65)

 

PPV/NPV to predict in-hospital mortality, %, 95% CI:

PIRO≥14: 0.12 (0.11–0.14) / 0.96 (0.95–0.97)

qSOFA≥2: 0.11 (0.10–0.12) / 0.95 (0.94–0.96)

MEWS≥7: 0.11 (0.10–0.13) / 0.95 (0.94–0.96)

NEWS≥8: 0.10 (0.08–0.11) / 0.96 (0.95–0.97)

 

 

AUC (95% CI) for mortality:

PIRO: 0.73 (0.69–0.77)

qSOFA: 0.68 (0.63–0.72)

MEWS: 0.63 (0.58–0.67)

NEWS: 0.67 (0.62–0.72)

 

AUC (95% CI) for ICU/MCU admission

PIRO: 0.72 (0.69-0.75)

qSOFA: 0.72 (0.68-0.75)

MEWS: 0.71 (0.68-0.75)

NEWS: 0.75 (0.72-0.79)

 

Yu, 2014

Type of study: retrospective nested case-control study

 

Setting: ED

 

Country: USA

 

Conflicts of interest: None to declare

 

Inclusion criteria:

an infection

ICD-9 code present on admission

 

Exclusion criteria:

Patients admitted directly to the ICU from

the ER were excluded

 

N=328 cases and 328 matched controls

 

Prevalence of mortality (in hospital):

 

Prevalence of ICU admission:

 

Median age (IQR):

Controls: 64 (49-78) Cases: 67 (55-79)

 

Sex:

Controls: 63% F

Cases: 53% F

Describe index test: PIRO

Comparator test 1: MEWS

Comparator test 2: SOFA

 

Describe reference test:

- clinical deterioration defined as in-hospital mortality

- clinical deterioration, defined

as ICU transfer, critical care consult for ICU transfer,

rapid response evaluation, or in-hospital mortality

 

 

Time between the index test and reference test: NA

 

For how many participants were no complete outcome data available?

N =0

 

Reasons for incomplete outcome data described?

NA

Outcome measures and effect size (include 95%CI and p-value if available):

 

0-12hr interval before clinical detoriation; AUC (95% CI) for discriminating power for predicting mortality:

SOFA : 0.83 (0.77-0.88)

PIRO: 0.87 (0.82-0.92)

MEWS: 0.82 (0.77-0.88)

 

0-12hr interval before clinical detoriation; AUC (95% CI) for discriminating power for predicting clinical detoriation:

SOFA : 0.78 (0.74-0.81)

PIRO: 0.76 (0.72-0.79))

MEWS: 0.73 (0.69-0.77)

 

 

 

Mac-Donald, 2014

Type of study:

Subgroup analysis of prospective observational cohort

 

Setting: ED

 

Country: Australia

 

Conflicts of interest: None to declare

 

Inclusion criteria:

patients presenting to the ED with a range of critical

illnesses and meeting physiologic criteria suggesting

shock or organ failure undergo real-time clinical

data collection and repeated blood sampling by trained

research nurses over the initial 24 hours of their hospital

stays. Patients are recruited during research nurse

hours (07:00 to 22:00), 7 days per week.

Exclusion criteria:

- excluding CISS patients with clear nonsepsis

diagnoses (e.g., trauma, myocardial infarction, pulmonary

embolism)

 

N=240

 

Prevalence of 30 day mortality: 20%

 

Prevalence of ICU admission: 44%

 

Mean age: 67 (51–78)

 

Sex: 64% male

Describe index test: PIRO

Comparator test 1: SOFA

 

 

Describe reference test:

30-day mortality

 

 

 

Time between the index test and reference test: NA

 

For how many participants were no complete outcome data available?

N =0

 

Reasons for incomplete outcome data described?

NA

Outcome measures and effect size (include 95%CI and p-value if available):

 

AUROC for predicting 30-day mortality (95% CI):

PIRO: 0.86 (0.80-0.92)

SOFA: 0.78 (0.71-0.85)

 

 

 

Table of quality assessment for systematic reviews of diagnostic studies

Based on AMSTAR checklist (Shea,2007; BMC Methodol 7: 10; doi:10.1186/1471-2288-7-10) and PRISMA checklist (Moher, 2009; PLoS Med 6: e1000097; doi:10.1371/journal.pmed1000097)

Research question: Is er een instrument waarmee (verslechtering van) sepsis beter herkend of voorspeld kan worden dan met de SIRS criteria op de verpleegafdelingen en de spoedeisende hulp?

Study

 

 

First author, year

Appropriate and clearly focused question?1

 

 

Yes/no/unclear

Comprehensive and systematic literature search?2

 

 

Yes/no/unclear

Description of included and excluded studies?3

 

 

Yes/no/unclear

Description of relevant characteristics of included studies?4

 

Yes/no/unclear

Assessment of scientific quality of included studies?5

 

 

Yes/no/unclear

Enough similarities between studies to make combining them reasonable?6

 

Yes/no/unclear

Potential risk of publication bias taken into account?7

 

Yes/no/unclear

Potential conflicts of interest reported?8

 

 

Yes/no/unclear

Song, 2018

Yes

Yes

Yes

Yes

Yes

Yes

Yes

Yes

  1. Research question (PICO) and inclusion criteria should be appropriate (in relation to the research question to be answered in the clinical guideline) and predefined.
  2. Search period and strategy should be described; at least Medline searched.
  3. Potentially relevant studies that are excluded at final selection (after reading the full text) should be referenced with reasons.
  4. Characteristics of individual studies relevant to the research question (PICO) should be reported.
  5. Quality of individual studies should be assessed using a quality scoring tool or checklist (preferably QUADAS-2; COSMIN checklist for measuring instruments) and taken into account in the evidence synthesis.
  6. Clinical and statistical heterogeneity should be assessed; clinical: enough similarities in patient characteristics, diagnostic tests (strategy) to allow pooling? For pooled data: at least 5 studies available for pooling; assessment of statistical heterogeneity and, more importantly (see Note), assessment of the reasons for heterogeneity (if present)? Note: sensitivity and specificity depend on the situation in which the test is being used and the thresholds that have been set, and sensitivity and specificity are correlated; therefore, the use of heterogeneity statistics (p-values; I2) is problematic, and rather than testing whether heterogeneity is present, heterogeneity should be assessed by eye-balling (degree of overlap of confidence intervals in Forest plot), and the reasons for heterogeneity should be examined.
  7. There is no clear evidence for publication bias in diagnostic studies, and an ongoing discussion on which statistical method should be used. Tests to identify publication bias are likely to give false-positive results, among available tests, Deeks’ test is most valid. Irrespective of the use of statistical methods, you may score “Yes” if the authors discuss the potential risk of publication bias.
  8. Sources of support (including commercial co-authorship) should be reported in both the systematic review and the included studies. Note: To get a “yes,” source of funding or support must be indicated for the systematic review AND for each of the included studies.

Risk of bias assessment diagnostic accuracy studies (QUADAS II, 2011)

Research question: Is er een instrument waarmee (verslechtering van) sepsis beter herkend of voorspeld kan worden dan met de SIRS-criteria op de verpleegafdelingen en de spoedeisende hulp?

Study reference

Patient selection

 

Index test

Reference standard

Flow and timing

Comments with respect to applicability

Churpek, 2017

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes (different levels of infection suspicion)

However, it is unknown which of the patients in the large data set truly were infected.

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

NA

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

Was there an appropriate interval between index test(s) and reference standard?

NA

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Unclear

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: UNCLEAR

 

Quinten, 2017

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

No

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

NA

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

Was there an appropriate interval between index test(s) and reference standard?

NA

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

Yes (only ED patients)

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Goulden, 2017

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

No

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

NA

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

Was there an appropriate interval between index test(s) and reference standard?

NA

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

No, complete case analysis (however 6% missing and investigated and deemed random)

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

De Groot, 2017

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

No

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

NA

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

Was there an appropriate interval between index test(s) and reference standard?

NA

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Yu, 2014

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

No

 

Did the study avoid inappropriate exclusions?

No

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

NA

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

Was there an appropriate interval between index test(s) and reference standard?

NA

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

MacDonald 2014

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

No

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

NA

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

Was there an appropriate interval between index test(s) and reference standard?

NA

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Judgments on risk of bias are dependent on the research question: some items are more likely to introduce bias than others, and may be given more weight in the final conclusion on the overall risk of bias per domain:

Patient selection:

  • Consecutive or random sample has a low risk to introduce bias.
  • A case control design is very likely to overestimate accuracy and thus introduce bias.
  • Inappropriate exclusion is likely to introduce bias.

Index test:

  • This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.
  •  Selecting the test threshold to optimise sensitivity and/or specificity may lead to overoptimistic estimates of test performance and introduce bias.

Reference standard:

  • When the reference standard is not 100% sensitive and 100% specific, disagreements between the index test and reference standard may be incorrect, which increases the risk of bias.
  • This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.

Flow and timing:

  • If there is a delay or if treatment is started between index test and reference standard, misclassification may occur due to recovery or deterioration of the condition, which increases the risk of bias.
  • If the results of the index test influence the decision on whether to perform the reference standard or which reference standard is used, estimated diagnostic accuracy may be biased.
  • All patients who were recruited into the study should be included in the analysis, if not, the risk of bias is increased.

 

Judgement on applicability:

Patient selection: there may be concerns regarding applicability if patients included in the study differ from those targeted by the review question, in terms of severity of the target condition, demographic features, presence of differential diagnosis or co-morbidity, setting of the study and previous testing protocols.

Index test: if index tests methods differ from those specified in the review question there may be concerns regarding applicability.

Reference standard: the reference standard may be free of bias but the target condition that it defines may differ from the target condition specified in the review question.

 

Tabel Exclusie na het lezen van het volledige artikel

Auteur en jaartal

Redenen van exclusie

Hamilton 2018

Voldoet niet aan PICO: Geen comparator

Williams 2016

Voldoet niet aan PICO: Geen relevante tests meegenomen

Corfield 2014

Voldoet niet aan PICO: Geen comparator

Geier 2013

Voldoet niet aan PICO: Geen relevante comparator

Cildir 2013

Voldoet niet aan PICO: Geen relevante comparator

Gabem Zoubi 2011

Voldoet niet aan PICO: Geen relevante comparator

Camm 2018

Voldoet niet aan PICO: ambulatory care

Tusgul 2017

Vergelijkbare resultaten met song review

Fukushima 2017

Vergelijkbare resultaten met song review

Rathour 2015

Voldoet niet aan PICO: Geen comparator

Boulos 2017

Vergelijkbare resultaten met song review

Sterling 2017

Vergelijkbare resultaten met song review

LeGuen 2018

Vergelijkbare resultaten met song review

Williams 2017

Vergelijkbare resultaten met song review

Umemura 2017

Vergelijkbare resultaten met song review

Shetty 2017

Vergelijkbare resultaten met song review

Muller 2017

Vergelijkbare resultaten met song review

Moskowitz 2017

Vergelijkbare resultaten met song review

Haydar 2017

Vergelijkbare resultaten met song review

Guirgis 2017

Vergelijkbare resultaten met song review

de Groot 2014

Voldoet niet aan PICO: Geen relevante comparator

Chen 2014b

Voldoet niet aan PICO: Geen relevante comparator

De Groot 2012

Voldoet niet aan PICO: Geen relevante comparator

Seymour 2016

In Song review 2018

Szakmany 2018

In Song review 2018

Donnelly 2017

In Song review 2018

Wang 2016

In Song review 2018

Henning 2017

In Song review 2018

Freund 2017

In Song review 2018

Barnaby 2018

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Zhang 2017

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Gunes 2017

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Williams 2016

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Junhasavasdikul 2016

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Lee 2016

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Sasko 2015

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Ryoo 2015

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Innocenti 2014

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Chen 2014a

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Chen 2014c

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Oltean 2012

Voldoet niet aan PICO: SOFA +andere niet relevante instrumenten

Ryoo

Voldoet niet aan PICO: Geen relevante comparator

Jones 2009

Voldoet niet aan PICO: Geen relevante comparator

Kim 2017

In Song review 2018

Jouffroy 2017

Voldoet niet aan PICO: Pre-hospital triage patiënten

Serafim 2017

Overlap met Song review

Desautels 2016

Voldoet niet aan PICO: IC-patiënten

Dorsett 2017

In Song review 2018

Chen 2016

In Song review 2018

Peake 2017

In Song review 2018

Hwang 2018

In Song review 2018

Ranzani 2017

In Song review 2018

Park 2017

In Song review 2018

Finkelsztein 2017

In Song review 2018

April MD 2017

In Song review 2018

Martin-Martin 2016

Spaanstalig artikel

Wang 2013

Chinees artikel

Roney 2015

Voldoet niet aan PICO


[1] In geval van een case-control design moeten de patiëntkarakteristieken per groep (cases en controls) worden uitgewerkt. NB; case control studies zullen de accuratesse overschatten (Lijmer et al., 1999)

[2] Comparator test is vergelijkbaar met de C uit de PICO van een interventievraag. Er kunnen ook meerdere tests worden vergeleken. Voeg die toe als comparator test 2 etc. Let op: de comparator test kan nooit de referentiestandaard zijn.

[3] Comparator test is vergelijkbaar met de C uit de PICO van een interventievraag. Er kunnen ook meerdere tests worden vergeleken. Voeg die toe als comparator test 2 etc. Let op: de comparator test kan nooit de referentiestandaard zijn.

[4] Comparator test is vergelijkbaar met de C uit de PICO van een interventievraag. Er kunnen ook meerdere tests worden vergeleken. Voeg die toe als comparator test 2 etc. Let op: de comparator test kan nooit de referentiestandaard zijn.

[5] Comparator test is vergelijkbaar met de C uit de PICO van een interventievraag. Er kunnen ook meerdere tests worden vergeleken. Voeg die toe als comparator test 2 etc. Let op: de comparator test kan nooit de referentiestandaard zijn.

[6] De referentiestandaard is de test waarmee definitief wordt aangetoond of iemand al dan niet ziek is. Idealiter is de referentiestandaard de Gouden standaard (100% sensitief en 100% specifiek). Let op! dit is niet de “comparison test/index 2”.

4 Beschrijf de statistische parameters voor de vergelijking van de indextest(en) met de referentietest, en voor de vergelijking tussen de indextesten onderling (als er twee of meer indextesten worden vergeleken).

Autorisatiedatum en geldigheid

Laatst beoordeeld  : 26-03-2020

Laatst geautoriseerd  : 26-03-2020

Geplande herbeoordeling  : 01-01-2025

Module

Regiehouder(s)

Jaar van autorisatie

Eerstvolgende beoordeling actualiteit richtlijn

Frequentie van beoordeling op actualiteit

Wie houdt er toezicht op actualiteit

Relevante factoren voor wijzigingen in aanbeveling

Vroege herkenning van (dreigende) sepsis

NIV

2020

2025

Eens in de vijf jaar

NIV

-

 

Voor het beoordelen van de actualiteit van deze richtlijn is de werkgroep niet in stand gehouden. Uiterlijk in 2024 bepaalt het bestuur van de Nederlandse Internisten Vereniging of de modules van deze richtlijn nog actueel zijn. Op modulair niveau is een onderhoudsplan beschreven. Bij het opstellen van de richtlijn heeft de werkgroep per module een inschatting gemaakt over de maximale termijn waarop herbeoordeling moet plaatsvinden en eventuele aandachtspunten geformuleerd die van belang zijn bij een toekomstige herziening (update). De geldigheid van de richtlijn komt eerder te vervallen indien nieuwe ontwikkelingen aanleiding zijn een herzieningstraject te starten.

 

De NIV is regiehouder van deze richtlijn en eerstverantwoordelijke op het gebied van de actualiteitsbeoordeling van de richtlijn. De andere aan deze richtlijn deelnemende wetenschappelijke verenigingen of gebruikers van de richtlijn delen de verantwoordelijkheid en informeren de regiehouder over relevante ontwikkelingen binnen hun vakgebied.

 

De ontwikkeling van deze richtlijn wordt gefaseerd doorlopen en opgeleverd. Op dit moment wordt alleen Sepsis fase 1 opgeleverd. Later wordt het ontwikkeltraject voor Sepsis fase 1 uitgebreid met fase 2 en 3. Er wordt naar gestreefd om de gehele richtlijn in 2021 af te ronden.

 

In fase 1 zijn de thema’s vroege herkenning, diagnostiek en eerste behandeling (vloeistofrecusatie en zuurstoftoediening) reeds behandeld.

 

In het vervolgtraject komen fase 2 en 3 aan bod en worden samengevoegd tot één richtlijn. Deze omvatten de volgende thema’s:

  • Fase 2 (behandeling): vasopressoren en/of inotropica, nierfunctievervangende therapie, transfusiebeleid, sedatiemethode en delier.
  • Fase 3 (nazorg en aandacht voor langetermijngevolgen voor de patiënt): (vroeg)mobilisatie, voeding, aandacht voor langetermijneffecten, revalidatie, voorlichting en begeleiding van patiënt en/of naasten.

 

Aan het einde van het gehele traject wordt er een overkoepelende gezamenlijke module over de organisatie van zorg/randvoorwaarden opgeleverd.

Initiatief en autorisatie

Initiatief:
  • Nederlandse Internisten Vereniging
Geautoriseerd door:
  • Nederlandse Internisten Vereniging
  • Nederlandse Vereniging van Artsen voor Longziekten en Tuberculose
  • Nederlandse Vereniging van Spoedeisende Hulp Artsen
  • Nederlandse Vereniging voor Anesthesiologie
  • Nederlandse Vereniging voor Heelkunde
  • Nederlandse Vereniging voor Klinische Geriatrie
  • Nederlandse Vereniging voor Medische Microbiologie
  • Nederlandse Vereniging voor Neurologie
  • Nederlandse Vereniging voor Urologie
  • Nederlandse Vereniging voor Intensive Care

Algemene gegevens

De richtlijnontwikkeling werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten en werd gefinancierd uit de Stichting Kwaliteitsgelden Medisch Specialisten (SKMS). Patiëntenparticipatie bij deze richtlijn werd medegefinancierd uit de Stichting Kwaliteitsgelden Patiënten Consumenten (SKPC) binnen het programma KIDZ. De financier heeft geen enkele invloed gehad op de inhoud van de richtlijn.

Doel en doelgroep

Doel

Het doel van de richtlijn is om een discipline overstijgende evidence-based richtlijn te ontwikkelen, gericht op de vroegtijdige herkenning, diagnose, (initiële) behandeling, monitoring, nazorg en revalidatie van patiënten met (dreigende) sepsis.

 

Met deze richtlijn kan de kwaliteit van de sepsiszorg worden verbeterd en gewaarborgd, met als doel minder sepsis gerelateerde morbiditeit en mortaliteit.

 

Doelgroep

Deze richtlijn wordt geschreven voor alle leden van de beroepsgroepen die betrokken zijn bij de zorg voor volwassen patiënten met (dreigende) sepsis in de ziekenhuiszorg.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijn is in 2017 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen die betrokken zijn bij de zorg voor patiënten met sepsis te maken hebben.

 

De werkgroepleden zijn door hun beroepsverenigingen gemandateerd voor deelname. De werkgroep is verantwoordelijk voor de integrale tekst van deze richtlijn.

  • Dr. A.R.H. van Zanten, internist-intensivist, Ziekenhuis Gelderse Vallei te Ede, NIV (voorzitter)
  • Dr. S.U.C. Sankatsing, internist-infectioloog/ internist-acute geneeskunde, Diakonessenhuis te Utrecht, NIV
  • Dr. M.J.A. de Regt, internist-infectioloog/ internist-acute geneeskunde, Onze Lieve Vrouwe Gasthuis te Amsterdam, NIV
  • Dr. L.P.G Derde, internist-intensivist, Universitair Medisch Centrum Utrecht te Utrecht NVIC
  • Drs. A. Klijn, AIOS Spoedeisende geneeskunde, Westfriesgasthuis te Hoorn, NVSHA
  • Drs. R. Schellaars, intensivist, Ziekenhuis Gelderse Vallei te Ede, NVA
  • Drs. R.M. Wilting, chirurg-intensivist, Elisabeth-TweeSteden ziekenhuis te Tilburg, NVvH
  • Dr. D. Snijders, longarts, Spaarne Gasthuis te Haarlem en te Hoofddorp, NVALT
  • Dr. A.K. van der Bij, arts-microbioloog, Diakonessenhuis te Utrecht, NVMM
  • I. Nutma, patiëntenvertegenwoordiger (Stichting Family and Patient Centered Intensive Care (FCIC))/ IC connect
  • V. Bon, verpleegkundig Specialist spoedeisende hulp, Onze Lieve Vrouwe Gasthuis te Amsterdam en Ambulanceverpleegkundige bij Ambulance Amsterdam, V&VN-SEH
  • M. Hoogendoorn, kwaliteitsmedewerker Vakgroep Anesthesiologie & Intensive Care, Isala, beleidsmedewerker Raad van Bestuur, Isala te Zwolle, V&VN-IC
  • Dr. W.G. Ista, senior onderzoeker Sector Verplegingswetenschap afdeling Interne Geneeskunde en senior onderzoeker Kinder IC, Erasmus MC te Rotterdam, V&VN-IC
  • Dr. R.W.M.M. Jansen, klinisch geriater, Noordwest ziekenhuisgroep te Alkmaar, NVKG
  • Prof. dr. D. van de Beek, neuroloog, Amsterdam UMC locatie AMC te Amsterdam, NVN
  • Drs. O.J.D. Snieders, uroloog, Diakonessenhuis, te Utrecht/Zeist/Doorn en St. Antonius ziekenhuis, te Utrecht/Nieuwegein, NVU

 

Met ondersteuning van

  • Dr. F. Willeboordse, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Dr. M.S. Ruiter, adviseur, Kennisinstituut van de Federatie Medisch Specialisten

Belangenverklaringen

De KNMG-code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement, kennisvalorisatie) hebben gehad. Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Werkgroeplid

Functie

Nevenfuncties

Gemelde belangen

Ondernomen actie

A. van Zanten (voorzitter)

lnternist-intensivist, afdeling lntensive Care Ziekenhuis Gelderse Vallei, Ede, Medisch Hoofd IC, Ziekenhuis Gelderse Vallei, Ede

Onbetaald:
Lid Sectie lC NIV/Vz.
Lid ESPEN richtlijn commissie Voeding volwassen lC patiënten
Lid diverse congrescommissies (Nationale Voedingscongres, lnternational Sepsis
Symposium Netherlands, Mythen Missers en Maatwerk lnfectieuze bedreigingen,
Masterclass lC Schiermonnikoog)


Betaald:
Spreker voor voedingsfirma's (niet sepsis gerelateerd): Danone-Nutricia, Abbott, BBraun,
Baxter, Fresenius-Kabi, Nestle-Novartis.
lnitiator Masterclass Voeding en lC

Participatie als onderzoeker in lC sepsis trials (b.v. AKPA-ART 123 trombomoduline trial), opbrengsten vloeien naar Stichting lC research en worden niet uitgekeerd aan onderzoekers.

 

Echtgenote heeft een Congres- en Organisatiebureau lnteractie dat voor vele wetenschappelijke verenigingen congressen organiseert. Bestaande activiteiten rond sepsis lopen al meer dan 10 jaar en door de richtlijn zullen deze niet wijzigen.

 

Geen actie

S. Sankatsing

internist-infectioloog/internist-acute geneeskunde in het Diakonessenhuis Utrecht

Bestuurslid Nederlandse Vereniging van Internist Infectiologen (NVII)


Lid Beroeps Belangen Commissie Nederlandse Vereniging Internisten Acute Geneeskunde (NVIAG)

 

Lid Commissie Richtlijnen Nederlandse Internisten Vereniging (NIV)

Geen

Geen actie

M. de Regt

Internist Acute Geneekunde/infectioloog Onze Lieve Vrouwe Gasthuis, Amsterdam (sinds april 2019, daarvoor in UMCU)

Geen

Geen

Geen actie

L. Derde

Intensivist UMC Utrecht

Co-lead WP5 PREPARE

Lid NVVM influenza richtlijn

Lid ESICM (European Society of Intensive Care Medicine) commissie voor ernstige CAP (community acquired pneumonia) Voorzitter van de Clinical Training Committee (CTC) van ESICM.

Faculty ESICM masterclass sepsis and severe infections.

Betrokken bij onderzoek dat door EU wordt gefinancierd:

1. Co-lead van WP5 PREPARE project (EU FP7 funded): doel is zoeken naar optimale behandeling voor patiënten met community acquired pneumonie op de IC

2. Lid International Trial Steering Committee, European Regional Management Committee en diverse domein-specifieke werkgroepen van REMAP-CAP. REMAP-CAP is de internationale overkoepelende studie waarvan PREPARE-WP5 het Europese deel is. REMAP-CAP wordt in andere regio's van de wereld ondersteund door andere funding (investigator driven). Op moment van tekenen is er geen industrie-betrokkenheid.

Geen actie

A. Klijn

AIOS SEG in het Dijklander Ziekenhuis te Hoorn

Buitengewoon lid richtlijnen commissie van de NVSHA, onbetaald.

Geen

Geen actie

R. Schellaars

intensivist, Ziekenhuis Gelderse Vallei, Ede

bestuurslid SIC-NVA

Geen

Geen actie

R. Wilting

chirurg-intensivist, afdeling IC Elisabeth-TweeSteden ziekenhuis Tilburg

Lid GIC (NVvH)

Geen

Geen actie

D. Snijders

longarts, medisch manager vakgroep longziekten Spaarne Gasthuis

Docent Inholland, opleiding EHLH verpleegkundige, vergoeding.

Lid richtlijn bronchiëctasieën NVALT, vergoeding.

Geen

Geen actie

A. van der Bij

Arts-microbioloog, werkzaam bij het Diakonessenhuis/Medisch Specialistisch Bedrijf Domstad (MSBD) Utrecht

voorzitter van de Commissie Kwaliteitsbevordering van de NVMM.

Geen

Geen actie

I. Nutma

- Ex-patiënt, voormalig verpleegkundige, auteur van Septische shock en Sepsis en daarna.

- Ervarings-professional. Eigenaar van Sepsis en daarna.

- Mede-initiatiefnemer van de website www.opeenicliggen.nl; overgegaan in icconnect.nl

 

- Werkzaamheden op het gebied van voorlichting (Lezingen, lessen, workshops),

begeleiding (huisbezoek, telefonische consulten) en advisering (bij onderzoek, richtlijnen,

etc.) geschieden, betaald.

- Mede-initiatiefnemer van de website opeenicliggen.nl, inmiddels overgegaan in de website icconnect.nl, onbetaald

-Lid werkgroep ervaringsdeskundigen FCIC/IC-connect tot jan. 2019, onbetaald

- beheerder (sinds ’17) online sepsis- lotgenotenplatform, onbetaald

- organisator Sepsis Lotgenoten Dag, (vanaf 2018), onbetaald

Geen

Geen actie

V. Bon

Verpleegkundig Specialist SEH (18 uur/week) OLVG

Ambulanceverpleegkundige bij Ambulance Amsterdam (12uur/week)

instructeur bij opleidingsinstituut spoedeisende geneeskunde in Houten (betaald).

Meegewerkt aan de Phantasi trial, het prehospitaal toedienen van AB bij sepsis (https://clinicaltrials.gov/ct2/show/NCT01988428).

Geen actie

M. Hoogendoorn

Kwaliteitsmedewerker Vakgroep Anesthsesiologie & Intensive Care, Isala, Zwolle (0,5 FTE)

Beleidsmedewerker Raad van Bestuur, Isala, Zwolle (0,5 FTE)

Managing Director Athena Care B.V. - Research organisatie Vakgroep Anesthesiologie & Intensive Care (betaald)

Bestuurslid V&VN-IC (onbetaald)

Bestuurslid NICE (onbetaald)"

Geen

Geen actie

E. Ista

universitair docent/senior onderzoeker, IC Kinderen, Erasmus MC-Sophia Kinderziekenhuis, Rotterdam

universitair Docent/Senior onderzoeker, Verplegingswetenschap, Interne Geneeskunde, Erasmus MC, Rotterdam

 

Lid Bestuurscommissie Richtlijne V&VN, Utrecht (onbetaald)

 

Geen actie

R. Jansen

100% dienstverband als klinisch geriater Noordwest ziekenhuisgroep, locatie Alkmaar

Onderwijs aan Amsteracademie voor verschillende verpleegkundigen opleidingen (betaald).

Honoraria van Bayer, Boehringer en BMS voor houden lezingen, webTV, etc over atriumfibrilleren en gebruik NOAC's en schrijven van bijdrage aan zakboekjes.

Geen actie

D. van de Beek

Neuroloog, Amsterdam UMC, locatie AMC

Consultancy GSK malaria vaccin (betaald aan werkgever, AMC)

Geen

Geen actie

O. Snieders

functioneel uroloog maatschap Urologen voor U (diakonessenhuis utrecht/zeist/doorn en st. antonius ziekenhuis utrecht/nieuwegein)

lid calamiteiten onderzoeksgroep (COG) diakonessenhuis (betaald) penningmeester regiomaatschap (onbetaald)

Geen

Geen actie

F. Willeboordse

Adviseur Kennisinstituut

Geen

Geen

Geen actie

M. Ruiter

Adviseur Kennisinstituut

Geen

Geen

Geen actie

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door een patiëntenfocusgroep en afgevaardigde patiëntvertegenwoordiger in de werkgroep. Een verslag hiervan (zie aanverwante producten) is besproken in de werkgroep en de belangrijkste knelpunten zijn verwerkt in de richtlijn. De conceptrichtlijn is voor commentaar voorgelegd aan Stichting Family and patient Centered Intensive Care (Stichting FCIC), aan IC Connect, de patiëntenorganisatie voor (voormalig) IC-patiënten en naasten en aan de Patiëntenfederatie Nederland.

 

Patiëntenparticipatie bij deze richtlijn werd medegefinancierd uit de Kwaliteitsgelden Patiënten Consumenten (SKPC) binnen het programma KIDZ.

Methode ontwikkeling

Evidence based

Implementatie

In de verschillende fasen van de richtlijnontwikkeling is rekening gehouden met de implementatie van de richtlijn (module) en de praktische uitvoerbaarheid van de aanbevelingen. Daarbij is uitdrukkelijk gelet op factoren die de invoering van de richtlijn in de praktijk kunnen bevorderen of belemmeren. Het implementatieplan is te vinden bij de aanverwante producten.

Werkwijze

AGREE

Deze richtlijn is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010), dat een internationaal breed geaccepteerd instrument is. Voor een stap-voor-stapbeschrijving hoe een evidence-based richtlijn tot stand komt wordt verwezen naar het stappenplan Ontwikkeling van Medisch Specialistische Richtlijnen van het Kennisinstituut van Medisch Specialisten.

 

Knelpuntenanalyse

Tijdens de voorbereidende fase inventariseerden de voorzitter van de werkgroep en de adviseur de knelpunten. Tevens zijn er knelpunten aangedragen door vertegenwoordigers van Ambulancezorg Nederland, Inspectie Gezondheidszorg en Jeugd, Nederlandse Internisten Vereniging, Nederlandse Vereniging van Artsen voor Longziekten en Tuberculose, Nederlandse Vereniging voor Klinische Chemie en Laboratoriumgeneeskunde, Nederlandse Vereniging van Ziekenhuizen, Nederlandse Vereniging van Ziekenhuisapothekers, Family and Paitent Centered Intensive Care/ IC connect, Sepsis en daarna, Stichting Werkgroep Antibiotica Beleid, Vereniging Innovatieve Geneesmiddelen, Dutch Acute Medicine via een invitational conference. Een verslag hiervan is opgenomen onder aanverwante producten.

 

Uitgangsvragen en uitkomstmaten

Op basis van de uitkomsten van de knelpuntenanalyse zijn door de voorzitter en de adviseur conceptuitgangsvragen opgesteld. Deze zijn met de werkgroep besproken waarna de werkgroep de definitieve uitgangsvragen heeft vastgesteld. Vervolgens inventariseerde de werkgroep per uitgangsvraag welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vond.

 

Strategie voor zoeken en selecteren van literatuur

Voor de afzonderlijke uitgangsvragen werd aan de hand van specifieke zoektermen gezocht naar gepubliceerde wetenschappelijke studies in (verschillende) elektronische databases. Tevens werd aanvullend gezocht naar studies aan de hand van de literatuurlijsten van de geselecteerde artikelen. In eerste instantie werd gezocht naar studies met de hoogste mate van bewijs. De werkgroepleden selecteerden de via de zoekactie gevonden artikelen op basis van vooraf opgestelde selectiecriteria. De geselecteerde artikelen werden gebruikt om de uitgangsvraag te beantwoorden. De databases waarin is gezocht, de zoekstrategie en de gehanteerde selectiecriteria zijn te vinden in de module met desbetreffende uitgangsvraag. De zoekstrategie voor de oriënterende zoekactie en patiëntenperspectief zijn opgenomen onder aanverwante producten.

 

Kwaliteitsbeoordeling individuele studies

Individuele studies werden systematisch beoordeeld, op basis van op voorhand opgestelde methodologische kwaliteitscriteria, om zo het risico op vertekende studieresultaten (risk-of-bias) te kunnen inschatten. Deze beoordelingen kunt u vinden in de risk-of-biastabellen. De gebruikte risk-of-biasinstrumenten zijn gevalideerde instrumenten die worden aanbevolen door de Cochrane Collaboration: AMSTAR - voor systematische reviews; Cochrane - voor gerandomiseerd gecontroleerd onderzoek; Newcastle-Ottowa - voor observationeel onderzoek; QUADAS II - voor diagnostisch onderzoek.

 

Samenvatten van de literatuur

De relevante onderzoeksgegevens van alle geselecteerde artikelen werden overzichtelijk weergegeven in evidencetabellen. De belangrijkste bevindingen uit de literatuur werden beschreven in de samenvatting van de literatuur. Bij een voldoende aantal studies en overeenkomstigheid (homogeniteit) tussen de studies werden de gegevens ook kwantitatief samengevat (meta-analyse) met behulp van Review Manager 5.

 

Beoordelen van de kracht van het wetenschappelijke bewijs

A) Voor interventievragen (vragen over therapie of screening)

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/).

 

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie (Schünemann, 2013).

 

GRADE

Definitie

Hoog

  • er is hoge zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie;
  • het is zeer onwaarschijnlijk dat de literatuurconclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Redelijk*

  • er is redelijke zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie;
  • het is mogelijk dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Laag

  • er is lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie;
  • er is een reële kans dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Zeer laag

  • er is zeer lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie;
  • de literatuurconclusie is zeer onzeker.

*in 2017 heeft het Dutch GRADE Network bepaald dat de voorkeursformulering voor de op een na hoogste gradering ‘redelijk’ is in plaats van ‘matig’

 

B) Voor vragen over diagnostische tests, schade of bijwerkingen, etiologie en prognose

De kracht van het wetenschappelijke bewijs werd eveneens bepaald volgens de GRADE-methode: GRADE-diagnostiek voor diagnostische vragen (Schünemann, 2008), en een generieke GRADE-methode voor vragen over schade of bijwerkingen, etiologie en prognose. In de gehanteerde generieke GRADE-methode werden de basisprincipes van de GRADE-methodiek toegepast: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van bewijskracht op basis van de vijf GRADE-criteria (startpunt hoog; downgraden voor risk-of-bias, inconsistentie, indirectheid, imprecisie, en publicatiebias).

 

Formuleren van de conclusies

Voor elke relevante uitkomstmaat werd het wetenschappelijk bewijs samengevat in een of meerdere literatuurconclusies waarbij het niveau van bewijs werd bepaald volgens de GRADE-methodiek. De werkgroepleden maakten de balans op van elke interventie (overall conclusie). Bij het opmaken van de balans werden de gunstige en ongunstige effecten voor de patiënt afgewogen. De overall bewijskracht wordt bepaald door de laagste bewijskracht gevonden bij een van de cruciale uitkomstmaten. Bij complexe besluitvorming waarin naast de conclusies uit de systematische literatuuranalyse vele aanvullende argumenten (overwegingen) een rol spelen, werd afgezien van een overall conclusie. In dat geval werden de gunstige en ongunstige effecten van de interventies samen met alle aanvullende argumenten gewogen onder het kopje 'Overwegingen'.

 

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals de expertise van de werkgroepleden, de waarden en voorkeuren van de patiënt (patient values and preferences), kosten, beschikbaarheid van voorzieningen en organisatorische zaken. Deze aspecten worden, voor zover geen onderdeel van de literatuursamenvatting, vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’.

 

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk. De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen.

 

Randvoorwaarden (Organisatie van zorg)

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijn is expliciet rekening gehouden met de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, menskracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van een specifieke uitgangsvraag maken onderdeel uit van de overwegingen bij de bewuste uitgangsvraag. Meer algemene, overkoepelende, of bijkomende aspecten van de organisatie van zorg worden behandeld in de module toekomstige module Randvoorwaarden. Die wordt ontwikkeld bij de richtlijn Sepsis fase 2 en 3.

 

Indicatorontwikkeling

De werkgroep heeft besloten geen indicatoren te ontwikkelen bij de huidige richtlijn, omdat er of geen substantiële barrières konden worden geïdentificeerd die implementatie van de aanbeveling zouden kunnen bemoeilijken en er zijn al voldoende ondersteunende maatregelen actief zijn in de zorgpraktijk zoals de huidige indicator vroege herkenning sepsis in de basisset 2019.

 

Kennislacunes

Tijdens de ontwikkeling van deze richtlijn is systematisch gezocht naar onderzoek waarvan de resultaten bijdragen aan een antwoord op de uitgangsvragen. Bij elke uitgangsvraag is door de werkgroep nagegaan of er (aanvullend) wetenschappelijk onderzoek gewenst is om de uitgangsvraag te kunnen beantwoorden. Een overzicht van de onderwerpen waarvoor (aanvullend) wetenschappelijk van belang wordt geacht, is als aanbeveling in de Kennislacunes beschreven (onder aanverwante producten).

 

Commentaar- en autorisatiefase

De conceptrichtlijn werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijn aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijn werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

 

Literatuur

Brouwers, M. C., Kho, M. E., Browman, G. P., Burgers, J. S., Cluzeau, F., Feder, G., ... & Littlejohns, P. (2010). AGREE II: advancing guideline development, reporting and evaluation in health care. Canadian Medical Association Journal, 182(18), E839-E842.

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. https://richtlijnendatabase.nl/over_deze_site/richtlijnontwikkeling.html

Ontwikkeling van Medisch Specialistische Richtlijnen: stappenplan. Kennisinstituut van Medisch Specialisten.

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

Schünemann, H. J., Oxman, A. D., Brozek, J., Glasziou, P., Jaeschke, R., Vist, G. E., ... & Bossuyt, P. (2008). Rating Quality of Evidence and Strength of Recommendations: GRADE: Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ: British Medical Journal, 336(7653), 1106.

Wessels, M., Hielkema, L., & van der Weijden, T. (2016). How to identify existing literature on patients' knowledge, views, and values: the development of a validated search filter. Journal of the Medical Library Association: JMLA, 104(4), 320.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Volgende:
Rol van biomarkers bij verdenking sepsis