Behandeling influenza

Initiatief: NVMM Aantal modules: 6

Testen voor diagnose influenza

Uitgangsvraag

Welke diagnostische methode moet worden toegepast om de diagnose influenza te stellen?

 

Met patiënten wordt bedoeld:

  • Niet-opgenomen patiënt: poliklinische patiënten, patiënten op de SEH, patiënten in het verpleegtehuis. De patiëntenpopulatie in de huisartsenpraktijk valt vooralsnog buiten deze richtlijn.
  • Opgenomen patiënt: patiënt opgenomen in een ziekenhuis.

Aanbeveling

Verricht een moleculaire influenza (snel)test om, in geval van verdenking op influenza, de diagnose te kunnen stellen. Antigeen-sneltesten zijn onvoldoende betrouwbaar voor dit doeleinde.

Overwegingen

Voor- en nadelen van de interventie en de kwaliteit van het bewijs

Uit de literatuuranalyse van de cruciale uitkomstmaat diagnostische waarde komt naar voren dat influenza Ag-sneltesten een beperkte sensitiviteit hebben in vergelijking met een moleculaire gouden standaard, variërend van 53 tot 54% voor respectievelijk influenza A en B voor RIDT en van 77 tot 80% voor DIA. Moleculaire influenza sneltesten laten een vergelijkbare sensitiviteit zien als de moleculaire gouden standaard. De sensitiviteit van moleculaire sneltesten is aanzienlijk hoger dan de sensitiviteit van influenza Ag-sneltesten, zowel voor RIDT en DIA, in vergelijking met een moleculaire referentiestandaard. De specificiteit van de verschillende laboratorium technieken verschilt niet significant. De sensitiviteit en specificiteit van individuele of gecombineerde klinische symptomen en tekenen zijn beduidend lager dan influenza laboratorium testen.

 

De bewijskracht van de diagnostische waarden werd als redelijk beoordeeld. Er werd geoordeeld door de werkgroep dat de aanwezige beperkingen in onderzoeksopzet en inconsistentie in de grootteorde van sensitiviteit en specificiteit slechts een minimale invloed hebben op de uiteindelijke zekerheid van bovenstaande resultaten.

 

Uit deze resultaten kan geconcludeerd worden dat een negatieve influenza Ag-sneltest de diagnose van influenza niet betrouwbaar uitsluit in geval van een verdenking op influenza. Om deze reden is de werkgroep van oordeel dat in Nederland, waar moleculaire diagnostiek breed beschikbaar is, huidig beschikbare Ag-sneltesten geen plaats hebben in de routine laboratoriumdiagnostiek voor influenza. Gezien de beperkte diagnostische sensitiviteit en specificiteit van klinische symptomen en tekenen voor influenza kan niet vertrouwd worden op een klinische diagnose. Het maken van een klinische diagnose heeft vooral een plaats in het verhogen van de vooraf kans op een positief resultaat.

 

Waarden en voorkeuren van patiënten (en eventueel hun verzorgers)

De belasting voor de patiënt verschilt niet tussen de verschillende laboratorium methoden aangezien dezelfde soort luchtwegmonsters worden gebruikt. De snellere TAT van sneltesten is in vergelijking met andere laboratorium technieken van mogelijke toegevoegde waarde voor patiënten vanwege snellere klinische besluitvorming en instelling van infectiepreventie maatregelen.

 

Kosten (middelenbeslag)

De kosten van moleculaire testen, met name commerciële moleculaire sneltesten, zijn hoger dan van Ag-testen maar resulteren in betrouwbaardere diagnostiek met uiteindelijk mogelijke effecten op de klinische uitkomst en zorgkosten. Recente studies hebben gekeken naar de mogelijke impact van het gebruik van moleculaire sneltesten als POCT op verschillende klinische uitkomstmaten (bijvoorbeeld het gebruik van antivirale middelen, antibioticagebruik, verblijfsduur op de Spoedeisende hulp, isolatieduur en aanvullende onderzoeken) en de mogelijke gevolgen hiervan op de gezondheidszorguitgaven. Huidig beschikbare studies hierover rapporteren echter heterogene resultaten en de werkgroep is van oordeel dat meer onderzoek hierover nodig is.

 

Aanvaardbaarheid, haalbaarheid en implementatie

Moleculaire testen voor influenza zijn al breed beschikbaar in Nederlandse microbiologische laboratoria en worden ook al sinds geruime tijd toegepast voor de diagnostiek van influenza, met name in ziekenhuizen. De aanvaardbaarheid en haalbaarheid van (duurdere) moleculaire sneltesten en POCT gebruik van deze testen zal deels afhankelijk zijn van de invloed van een snellere uitslag op het klinisch handelen door de arts, de klinische uitkomst van de patiënten en het effect op de zorgkosten. Aanvullend onderzoek in diverse settings (verpleeghuizen, ziekenhuizen) is hiervoor nodig.

 

Rationale van de aanbeveling: weging van argumenten voor en tegen de interventies

Op basis van klinische symptomen en tekenen kan een diagnose influenza niet betrouwbaar gemaakt worden, terwijl een betrouwbare diagnose belangrijk is voor klinische besluitvorming en instellen van eventuele infectiepreventiemaatregelen. Om deze reden is laboratoriumbevestiging essentieel wanneer u de diagnose influenza wilt stellen. De meest gevoelige methode hiervoor is een moleculaire test. De waarde van antigeen-sneltesten is beperkt vanwege relatief lage sensitiviteit waardoor diagnoses gemist kunnen worden. Moleculaire sneltesten, zeker indien gebruikt als POCT, resulteren in een snellere uitslag en de mogelijkheid van snellere klinische besluitvorming. De effecten hiervan op klinische uitkomsten van de patiënt en op zorgkosten verdienen nader onderzoek.

Onderbouwing

Een accurate en snelle diagnose van Influenza is van belang voor de verdere klinische besluitvorming, onder meer het starten en staken van antivirale therapie, en voor het nemen van eventuele isolatiemaatregelingen in ziekenhuizen en zorginstellingen. Verschillende diagnostische technieken kunnen worden toegepast: moleculaire technieken, antigeen detectie, viruskweek en serologie. Omdat klinische besluitvorming een snel diagnostisch resultaat vergt kennen viruskweek (lange doorlooptijd) en serologie (noodzaak vaan gepaarde monsters) geen plaats meer in de routinediagnostiek. Moleculaire diagnostiek wordt op dit moment beschouwd als de gouden standaard. De laatste jaren is er steeds meer aandacht voor point of care testen (POCT) en zijn er verschillende commerciële moleculaire sneltesten voor influenza ontwikkeld. De vraag stelt zich welke diagnostische methode moet worden toegepast voor het stellen van de diagnose influenza en wat de diagnostische waarde is van POCT.

Redelijk

GRADE

Moleculaire influenza sneltesten lijken een hogere sensitiviteit te hebben dan influenza Ag sneltesten (zowel in vergelijking met Rapid influenza diagnostic testen (RIDT) als met Digital immunoassays (DIA’s)). De specificiteit tussen moleculaire en Ag sneltesten lijkt niet te verschillen.

 

Bronnen: (Merckx, 2017)

 

Redelijk

GRADE

De sensitiviteit van moleculaire- en Ag-sneltesten voor influenza lijkt hoger te zijn in kinderen dan in volwassenen. De specificiteit lijkt hoger te zijn in volwassenen dan in kinderen.

 

Bronnen: (Merckx, 2017)

 

Redelijk

GRADE

De specificiteit van moleculaire sneltesten die een panel van virussen bevatten lijkt lager te zijn dan de specificiteit van testen voor alleen influenza of influenza en RSV.

 

Bronnen: (Vos, 2019)

 

Redelijk

GRADE

De sensitiviteit en specificiteit van individuele of gecombineerde klinische symptomen en tekenen lijken lager te zijn dan influenza laboratorium testen.

 

Bronnen: (Call, 2005)

 

Redelijk

GRADE

De TAT van moleculaire POCT lijkt korter te zijn dan standaard influenza referentie testen (in-house RT-PCR of routine laboratorium influenza test).

 

Bronnen: (Vos, 2019)

Beschrijving studies

Twee systematische reviews rapporteerden over de diagnostische waarde van sneltesten voor influenza. Daarnaast werden zeven prospectieve vergelijkende studies meegenomen die na de zoekdatum van deze systematische reviews werden gepubliceerd. Er werden twee systematische reviews meegenomen naar de diagnostische waarde van een klinische diagnose voor influenza.

 

Vos (2018) verrichtte een systematische review met meta-analyse naar de diagnostische waarde en klinische impact van moleculaire sneltesten voor respiratoire virussen, met minimaal influenza en/of RSV in het panel, bij patiënten met een verdenking op een luchtweginfectie. Snelle diagnostiek werd gedefinieerd als ≤ 3 uur voor het verkrijgen van een resultaat. Als referentiestandaard werden moleculaire technieken aanvaard of, in het geval van klinische impact studies, de standaard gebruikte virologische test. Peer-reviewed studies in het Engels en Nederlands, welke originele data verstrekten, werden geïncludeerd. Editorials, brieven aan de editor, congres abstracten, case reports en veterinaire studies werden geëxcludeerd. Studies waarbij de index test deel uitmaakte van de referentiestandaard werden ook geëxcludeerd (incorporatie bias). De search werd verricht op 31 augustus 2017. 56 studies (63 rapporten) met als uitkomstmaat diagnostische waarde, werden geïncludeerd: 28 cohort, 28 case-control en 7 gedeeltelijk cohort en gedeeltelijk case-control studies (figuur 1). In deze studies werd er naar 13 verschillende moleculaire sneltesten gekeken. De mediane sample size was 95 patiënten. Acht studies (12,7%) includeerden volwassenen, zeven studies (11,1%) kinderen en 26 studies (41,3%) volwassenen en kinderen. Bij de overige studies werd de leeftijdscategorie niet gespecifieerd. Voor het poolen van de resultaten werd een bivariate random-effect meta-analyse verricht. Daarnaast werden 13 studies met als uitkomstmaat klinische impact geïncludeerd: 5 RCT’s, 6 cohortstudies met voor-na design en 4 cohort studies met controle groep. 3 studies gebruikten de moleculaire sneltest als POCT. De overige studies voerden de moleculaire sneltest op het laboratorium uit. Deze geïncludeerde studies werden niet kwantitatief gepoold, maar beschreven per klinische uitkomstmaat: gebruik van antibiotica en oseltamivir, ziekenhuisopname, duur van ziekenhuisverblijf, opname intensieve zorg en mortaliteit, aanvullende onderzoeken inclusief X-thorax, isolatie maatregelen en turnaround time. Zeven van de dertien klinische impactstudies werden gesponsord door de producent van de index test uit de studie. Voor de geïncludeerde studies met diagnostische waarde als uitkomstmaat werd dit niet expliciet vermeld.

 

Zes additionele prospectieve vergelijkende studies naar de diagnostische waarde van moleculaire sneltesten voor influenza in vergelijking met een moleculaire referentiestandaard, gepubliceerd na de uiterste zoekdatum van Vos (2018), werden opgenomen in de literatuuranalyse (figuur 2). Verschillende patiënt inclusiecriteria werden gebruikt voor een klinische verdenking op influenza. Zowel in-house als commerciële RT-PCR’s werden gebruikt als referentiestandaard. Bij vijf van de zes studies was er financiële of administratieve ondersteuning door de producent van de index sneltest. Valentin (2019) vergeleek 3 commerciële moleculaire sneltesten met RT-PCR bij 305 klinische samples. Maignan (2019), Gosert (2018), Schmidt (2018) en Gibson (2017) vergeleken eenzelfde index moleculaire sneltest met verschillende RT-PCR referentiestandaarden, bij respectievelijk 187, 194, 351 en 1656 klinische samples. Hassan (2018) vergeleek een moleculaire sneltest met een RT-PCR referentiestandaard in een multicenter studie bij 1243 samples, na exclusie van 27 samples wegens een ongeldig test resultaat. Verschillende studies gebruikten een tweede referentiestandaard in geval van discordante resultaten tussen de index test en de eerste referentiestandaard. Behoudens de studie van Maignan (2019), waarin de sensitiviteit en specificiteit werd berekend op basis van de consensus tussen de 2 referentiestandaarden, werden de sensitiviteit en specificiteit bij de overige studies berekend op basis van het resultaat van de eerste referentiestandaard.

 

Merckx (2017) verrichte een systematische review met meta-analyse naar de diagnostische waarde van commerciële Ag-sneltesten (Rapid influenza diagnostic test of RIDT), automatische immunochromatografische Ag-sneltesten (Digital immunoassays of DIA) en moleculaire sneltesten (Nucleic acid amplification test of NAAT) voor influenza bij kinderen en volwassenen met klinische verdenking op influenza tijdens periodes van influenza transmissie. Snelle diagnostiek werd gedefinieerd als 30 minuten voor het verkrijgen van een resultaat. De moleculaire techniek RT-PCR werd als referentiestandaard gekozen. Peer-reviewed studies in het Engels, Frans of Spaans die originele data verschaften werden geïncludeerd. Editorials, brieven aan de editor, congres abstracten en case-control studies werden geëxcludeerd. Daarnaast werden studies geëxcludeerd wanneer de referentiestandaard afhankelijk van het resultaat van de index test werd uitgevoerd (partiële verificatie bias). De search werd verricht op 18 augustus 2015 met een update op 21 mei 2017. In totaal werden 162 studies (116 rapporten) geïncludeerd. 130 studies onderzochten de diagnostische waarde van RIDT’s (80,2%), 19 van DIA’s (11,7%) en 13 van NAAT’s (8,0%). In deze studies werden er naar 35 verschillende RIDT’s, 2 verschillende DIA’s en 2 verschillende NAAT’s gekeken. De studie designs werden niet beschreven. 22 studies (14%) includeerden volwassenen, 36 studies (22%) kinderen en 104 studies (64%) kinderen en volwassenen of het werd het niet gerapporteerd. Voor het poolen van de resultaten werd een bivariate random-effect meta-analyse verricht.

 

Eén additionele prospectieve vergelijkende studies (Yang, 2018) naar de diagnostische waarde van een DIA, gepubliceerd na de uiterste zoekdatum van Merckx (2017), werd opgenomen in de literatuuranalyse. Yang (2018) vergeleek een DIA met RT-PCR en viruskweek bij 109 klinische samples van patiënten met ILI, gedefinieerd als koorts (> 38°C), hoesten en/of keelpijn. Een positief RT-PCR of viruskweek resultaat werd als referentiestandaard beschouwd.

 

Call (2005) verrichte een systematische review naar de diagnostische waarde van individuele symptomen en klinische tekenen van influenza. Studies die aan de volgende criteria voldeden werden geïncludeerd: (1) prospectief cohort, RCT of meta-analyse als studie design; (2) diagnose influenza op basis van viruskweek, viervoudige titer stijging van influenza-specifieke antilichamen, PCR, immunofluorescentie; (3) voldoende hoge studie kwaliteit (geblindeerde vergelijking bij consecutief geïncludeerde patiënten met mogelijk influenza). De zoekperiode bevatte artikels tussen januari 1966 en september 2004. Zes studies met in het totaal 7105 patiënten werden geïncludeerd: 2 RCT’s (clinical trials naar de behandeling en vaccinatie van influenza) en 4 prospectieve cohortstudies. Slechts één studie gebruikte PCR als referentiestandaard. Er was sprake van een heterogene studie populatie uit verschillende landen. Twee van de zes studies includeerden specifiek ouderen (≥ 60 jaar). De prevalentie voor influenza varieerde van 7 tot 67%.

 

Ebell (2011) verrichtte een systematische review naar de diagnostische waarde van klinische beslisbomen (punten score systemen of algoritmes ontwikkeld aan de hand van multivariate modellen). Volgende inclusiecriteria werden gebruikt: (1) beschikbaarheid van data over de diagnostische waarde van een combinatie van symptomen of klinische beslissingsboom op basis van anamnese en klinisch onderzoek bij patiënten met een luchtweginfectie; (2) prospectief cohort studiedesign; (3) gebruik van een adequate referentiestandaard (referentie laboratorium test voor influenza). Case control studies en studies die een POCT als referentiestandaard gebruikten werden geëxcludeerd. De search werd verricht op 8 juli 2010 en 12 studies gepubliceerd tussen 1962 en 2010 werden geïncludeerd. Het aantal geïncludeerde patiënten was gemiddeld 754. De studies hanteerden uiteenlopende inclusiecriteria. Eén studie includeerde alleen kinderen en twee studies alleen oudere volwassenen. De prevalentie voor influenza varieerde van 6,6 tot 79%

 

Resultaten

1. Diagnostische waarde: sensitiviteit en specificiteit (cruciaal)

De diagnostische waarde wordt door de werkgroep als een cruciale uitkomstmaat beschouwd. 2 systematische reviews en 7 prospectieve vergelijkende klinische studies rapporteerden over de diagnostische waarden van sneltesten voor influenza. PPV en NPV werden niet als uitkomstmaten meegenomen en gepooled in de 2 systematische reviews. Deze uitkomstmaten worden wel in verschillende individuele vergelijkende studies beschreven. De waardes van PPV en NPV zijn echter sterk afhankelijk van de populatie waarin getest wordt (patiënt inclusiecriteria) en het influenza seizoen (incidentie). Twee systematische reviews rapporteerden over de diagnostische waarde van symptomen en klinische tekenen.

 

Vos (2019) rapporteerde een gepoolde sensitiviteit van alle moleculaire sneltesten van 90,9% (95 % CI 88,7% tot 93,1%) en een gepoolde specificiteit van 96,1% (95% CI, 94,2% tot 97,9%) (Figuur 1). 1 van de 56 studies werd geëxcludeerd uit de meta-analyse wegens de afwezigheid van negatieve samples. Verschillende subgroep analyses (op basis van leeftijdscategorie, symptomen, virusspecies, producent van de index test en studie design) werden uitgevoerd om de heterogeniteit in sensitiviteit en specificiteit te onderzoeken. De gepoolde sensitiviteit van studies waarin alleen kinderen werden geïncludeerd (n=8) vertoonden een hogere sensitiviteit (93%, 95% CI 91,5% tot 94,5%) dan studies waarin alleen volwassenen (n=7) werden geïncludeerd (79,8%, 95% CI 70,7% tot 88,9%; P=0,01). Daarentegen was de gepoolde specificiteit hoger in studies bij volwassenen (98,6%, 95% CI 95,5% tot 100%) in vergelijking met studies bij kinderen (80,8%, 95% CI 73,1% tot 88,4%; P=0,001). De specificiteit van testen die een panel van verschillende respiratoire virussen bevatten, die afzonderlijk kunnen aangetoond worden, was lager 88,8% (95% CI 82,7% tot 95%) dan de specificiteit van testen voor alleen influenza 97,4% (95% CI 94,2% tot 100%) of voor influenza en RSV 96,4% (95% CI 93,6% tot 99,2%; P=0,009). De sensitiviteit verschilde tussen de verschillende index testen.

 

Figuur 1 Forest plot voor sensitiviteit en specificiteit van influenza moleculaire sneltesten uit studies opgenomen in de systematische review van Vos (2019)

F1

 

In de studie van Merckx (2017) werden 38 van de 152 studies geëxcludeerd uit de meta-analyse wegens het niet rapporteren van afzonderlijke gegevens voor influenza A en B. Voor RIDT’s rapporteerde Merckx een gepoolde sensitiviteit van 54,4% (95% CI 48,9% tot 59,8%) voor influenza A en een gepoolde sensitiviteit van 53,2% (95% CI 41,7% tot 64,4%) voor influenza B. De resultaten voor specificiteit waren respectievelijk 99,4% (95% CI 99,1% tot 99,7%) en 99,8% (95% CI 99,7% tot 99,9%). Voor DIA’s rapporteerden ze een gepoolde sensitiviteit van 80,0% (95% CI 73,4% tot 85,6%) voor influenza A en een gepoolde sensitiviteit van 76,8% (95% CI 65,4% tot 85,4%) voor influenza B. De resultaten voor specificiteit waren respectievelijk 98,3% (95% CI 97,4% tot 98,9%) en 98,7% (95% CI 97,5% tot 99,4%). Voor NAAT’s rapporteerden ze een gepoolde sensitiviteit van 91,6% (95% CI 84,9% tot 95,9%) voor influenza A en een gepoolde sensitiviteit van 95,4% (95% CI 87,3% tot 98,7%) voor influenza B. De resultaten voor specificiteit waren respectievelijk 99,2% (95% CI 98,6% tot 99,7%) en 99,4% (95% CI 98,9% tot 99,8%). De sensitiviteit voor DIA’s was hoger dan voor RIDT’s met een absoluut verschil van 25,5 percentage eenheden voor influenza A (95% CI -33,4 tot -17,0) en 23,5 voor influenza B (95% CI -37,9 tot -7,7). De sensitiviteit voor NAAT’s was hoger dan voor RIDT’s, met een absoluut verschil van 37,1 percentage eenheden (95% CI -44,2 tot -28,6) voor influenza A en 41,7 (95% CI -54,0 tot -28,5) voor influenza B. De sensitiviteit was ook hoger voor NAAT’s dan voor DIA’s met een absoluut sensitiviteit verschil van 11,5 percentage eenheden (-19,5 tot -2,9) voor influenza A en 18,2 (-30,6 tot -6,9) voor influenza B. De 13 studies die de diagnostische waarden van NAAT’s onderzochten werden ook allemaal geïncludeerd door Vos (2018). Verschillende subgroep analyses (op basis van leeftijdscategorie, testlocatie, sponsoring door industrie, producent van de index test) werden uitgevoerd om de heterogeniteit in sensitiviteit en specificiteit te onderzoeken. De gepoolde sensitiviteit van studies waarin alleen kinderen werden geïncludeerd vertoonden een hogere sensitiviteit dan studies waarin alleen volwassenen werden geïncludeerd, zowel voor RIDT’s (absoluut sensitiviteitsverschil 18,5 (8,4 tot 28,3) voor influenza A en 31,8 (6,1 tot 52,6) voor influenza B) en DIA’s (absoluut sensitiviteitsverschil 12,1 (3,1 tot 22,1) voor influenza A en 25,3 (6,9 tot 44,7) voor influenza B) als, alleen in het geval voor influenza A, voor NAAT (absoluut sensitiviteitsverschil 19,5 (1 tot 43,7)). De locatie van de index test had geen invloed op de diagnostische waarde van RIDT’s en DIA’s. Er waren geen studies die ‘point of care’ moleculaire sneltesten evalueerden. De sensitiviteit verschilde significant tussen de verschillende NAAT-index testen. De sensitiviteit was over het algemeen hoger in industrie gesponsorde studies dan in studies die niet werden gesponsord door de industrie.

 

Zes aanvullende prospectieve vergelijkende studies rapporteerden over de diagnostische waarde van verschillende moleculaire sneltesten (figuur 2 en 3). De resultaten voor sensitiviteit en specificiteit zijn te vergelijken met de studies geïncludeerd door Vos (2019). Valentin (2019) rapporteerde voor 3 commerciële index moleculaire sneltesten een sensitiviteit die varieerde tussen 79,1% en 100% en een specificiteit die varieerde tussen 98,7% en 99,6% voor influenza A, en een sensitiviteit die varieerde tussen 93,1% en 96,8% en een specificiteit die varieerde tussen 99,1% en 100% voor influenza B. De sample size bevatte 205 klinische monsters. De absolute aantallen positieve en negatieve resultaten werden niet vermeld, waardoor de resultaten niet konden worden opgenomen in de forest plot (figuur 2 en 3). Maignan (2019), Gosert (2018), Schmidt (2018) en Gibson (2017) vergeleken eenzelfde index moleculaire sneltest met verschillende RT-PCR referentiestandaarden, bij respectievelijk 187, 194, 351 en 1656 klinische samples. Sensitiviteit en specificiteit waren respectievelijk 100% (95% CI 84% tot100%) en 99% (95% CI 96% tot 100%) voor influenza A en 98% (95% CI 87% tot 100%) en 100% (95% CI 97% tot 100%) voor influenza B bij Maignan (2019). De PPV en NPV waren respectievelijk 96% (95% CI 79% tot 100%) en 100% (95% CI 97% tot 100%) voor influenza A en 100% (95% CI 90% tot 100%) en 99% (95% CI 96% tot 100%) voor influenza B. Gosert (2018) rapporteerde een sensitiviteit en specificiteit van respectievelijk 100% (95% CI 81,5% tot 100%) en 100% (95% CI 97,9% tot100%) voor influenza A en 100% (95% CI 73,5% tot 100%) en 99,5% voor influenza B (95% CI 97,0% tot 100%). De PPV en NPV waren respectievelijk 100% (95% CI 81,5% tot 100%) en 100% (95% CI 97% tot 100%) voor influenza A en 92,3% (95% CI 64% tot 99,8%) en 100% (95% CI 96,6% tot 100%) voor influenza B. Schmidt (2018) beschreef een sensitiviteit en specificiteit in vergelijking met 2 verschillende commerciële moleculaire sneltesten als referentiestandaard. In vergelijking met de eerste referentiestandaard werd een sensitiviteit en specificiteit van respectievelijk 98,80% (95% CI 93,47% tot 99,97%) en 99,12% (95% CI 97,96% tot 99,71%) voor influenza A en 98,76% (95% CI 95,58% tot 99,85%) en 96,33% (95% CI 94,26% tot 97,81%) voor influenza B gerapporteerd. De sensitiviteit en specificiteit in vergelijking met de tweede referentiestandaard waren respectievelijk 96,83% (95% CI 89,00% tot 99,61%) en 99,13% (95% CI 97,98% tot 99,99%) voor influenza A en 98,78% (95% CI 93,39% tot 99,97%) en 100% (95% CI 98,42% tot 100%) voor influenza B. Daarnaast werd gerapporteerd dat de diagnostische waarde van de index moleculaire sneltest vergelijkbaar was indien uitgevoerd als POCT op de SEH in vergelijking met uitvoering in het laboratorium. Gibson (2017) beschreef een sensitiviteit en specificiteit van respectievelijk 99,6% (95% CI 97,9% tot 99,9%) en 97,5% (95% CI 96,6% tot 98,3%) voor influenza A en een sensitiviteit en specificiteit van respectievelijk 99,3% (95% CI 96,2% tot 99,9%) en 99,7% (95% CI 99,3% tot 99,9%) voor influenza B. Hassan (2018) vergeleek een andere commerciële moleculaire sneltest dan Maignan (2019), Gosert 2018), Schmidt (2018) en Gibson (2017) en rapporteerde een sensitiviteit en specificiteit van respectievelijk 97,8% (95% CI 94,6% tot 99,2%) en 96,6% (95% CI 95,2% tot 97,5%) voor influenza A en 92,9% (95% CI 85,5% tot 96,9%) en 98,3% (95% CI 97,4% tot 98,0%) voor influenza B. De PPV en NPV waren respectievelijk 86,3% (95% CI 81,4% tot 90,1%) en 99,5% (95% CI 98,7% tot 99,8%) voor influenza A en 82,9% (95% CI 74,3% tot 89,1%) en 99,4% (95% CI 98,7% tot 99,7%) voor influenza B.

 

Figuur 2 Forest plot sensitiviteit en specificiteit voor influenza A van moleculaire sneltesten uit additionele prospectieve vergelijkende studies

F2

 

Figuur 3 Forest plot sensitiviteit en specificiteit voor influenza B van moleculaire sneltesten uit additionele prospectieve vergelijkende studies

F3

 

Eén bijkomende prospectieve vergelijkende studie van Yang (2019) rapporteerde over de diagnostische waarde van een DIA in vergelijking met RT-PCR en viruskweek bij 109 klinische samples. Sensitiviteit en specificiteit voor het detecteren van influenza A waren respectievelijk 82% (95% CI 65% tot 93%) en 89% (95% CI 80% tot 95%) in vergelijking met RT-PCR. Sensitiviteit en specificiteit voor het detecteren van influenza B waren respectievelijk 71% (95% CI 29% tot 96%) en 88% (95% CI 80% tot 93%). Voor de PPV en NPV werden respectievelijk 77% (95% CI 60% tot 90%) en 89% (95% CI 80% tot 95%) voor influenza A en 29% (95% CI 10% tot 56%) en 98% (95% CI 92% tot 100%) voor influenza B gerapporteerd.

 

Call (2005) rapporteerde de sensitiviteit, specificiteit, positieve likelihood ratio (LR), negatieve LR en diagnostische odds ratio (OR) van individuele en gecombineerde klinische variabelen die in tenminste twee van de zes studies werden gerapporteerd, namelijk koorts, koortsig gevoel, hoesten, myalgie, malaise, hoofdpijn, keelpijn, niezen, neusverstopping, rillingen, vaccinatie status, koorts en hoesten, koorts en hoesten en acuut begin. Koorts werd gedefinieerd als aan- of afwezig op basis van de definities gehanteerd in de verschillende studies (37,8°C tot 38,5°C). De variabele koortsig gevoel werd gerapporteerd door de patiënt. Ondanks een heterogeniteit tussen de verschillende studies (behalve voor koortsig gevoel en vaccinatie status) werden per klinische variabele samenvattende waardes voor de LR gerapporteerd. De aanwezigheid van geen van de individuele variabelen verhoogde de kans op influenza afdoende (LR ≥ 2). De afwezigheid van de individuele variabelen koorts (LR 0,40 CI 0,25 tot 0,66), hoesten (LR 0,42 CI 0,31 tot 0,57) en neusverstopping (LR 0,49 CI 0,42 tot 0,59) verminderden de kans op influenza. Bij een subgroep analyse van studies die patiënten van 60 jaar of ouder includeerden verhoogde de individuele variabelen koorts (LR 3,8 CI 2,8 tot 5,0; sensitiviteit 34%; specificiteit 91%), malaise (LR 2,6 CI 2,2 tot 3,1; sensitiviteit 57%; specificiteit 78%) en rillingen (LR 2,6 CI 2,0 tot 3,2; sensitiviteit 46%; specificiteit 82%) de kans op influenza en verminderde de aanwezigheid van niezen (LR 0,47 CI 0,24 tot 0,92; sensitiviteit 32%; specificiteit 33%) de kans op influenza. Twee studies rapporteerde de diagnostische waarde van een combinatie van symptomen koorts en hoesten. De studie zonder leeftijdsrestrictie vond een LR van 1,9 (CI 1,8 tot 2,1). De sensitiviteit van koorts en hoesten was 64% en de specificiteit 67% in vergelijking met een referentie laboratorium test voor influenza (viruskweek, viervoudige antilichaam titerstijging, PCR of immunofluorescentie). De studie die patiënten ≥ 60 jaar includeerde rapporteerde een LR van 5,0 (CI 3,5 tot 6,9) voor de combinatie koorts en hoesten. De sensitiviteit was 30% en specificiteit 94% in vergelijking met een viervoudige antilichaam titerstijging als referentie test. De toevoeging van een derde variabele namelijk acuut begin, was van weinig toegevoegde waarde voor het onderscheidend vermogen.

 

Ebell (2011) rapporteerde de sensitiviteit, specificiteit, PPV, NPV, positieve likelihood ratio (LR), negatieve LR en receiver operating characteristic (ROC) curve van een combinatie van klinische variabelen uit verschillende studies, namelijk ‘koorts en hoesten’ (vijf studies), ‘koorts, hoesten en acuut begin’ (vier studies) en ‘koorts, hoofdpijn en faryngitis’ (één studie). De positieve LR voor de combinatie ‘koorts en hoesten’ en ‘koorts, hoesten en acuut begin’ varieerde respectievelijk tussen 1,94 tot 5,1 en 1,95 tot 6,5. Voor de combinatie ‘koorts, hoofdpijn en faryngitis’ was de positieve LR 3,7. De negatieve LR’s voor de verschillende combinaties van klinische variabelen waren respectievelijk ‘0,4 tot 0,74’, ‘0,3 tot 0,76’ en 0,26. Studies die patiënten includeerden met ILI hadden een hogere sensitiviteit en lagere specificiteit dan surveillance studies en studies met bredere inclusie criteria. Er werden geen samenvattende waarden gerapporteerd wegens de te hoge heterogeniteit tussen de verschillende studies.

 

2. Turnaround time (TAT) (belangrijk)

TAT werd door de werkgroep als een belangrijke uitkomstmaat beschouwd. Eén systematische review en 1 additionele prospectieve vergelijkende studie rapporteerden over de TAT van moleculaire sneltesten voor influenza.

 

Vos (2019) includeerde in hun systematische review 10 studies die de TAT rapporteerden. Drie van de tien studies gebruikten de moleculaire sneltest als POCT. De overige studies voerden de moleculaire sneltest uit in het laboratorium. De TAT van moleculaire sneltesten in vergelijking met de moleculaire referentiestandaarden was significant korter in alle studies die deze uitkomstmaat rapporteerden. De totale sample size was 6907. Het type referentiestandaard in de verschillende studies werd niet gespecifieerd.

 

In de prospectieve vergelijkende studie van Schmidt (2018) werd voor een totaal van 338 patiënten een significant kortere TAT gerapporteerd voor de moleculaire POC-index sneltest in vergelijking met de referentiestandaard, een commerciële sneltest uitgevoerd op het laboratorium. Het resultaat van de POC indextest werd 59 minuten eerder verkregen (mediaan, geen range gerapporteerd) in vergelijking met de in het laboratorium uitgevoerde sneltest (p<0,01).

 

Bewijskracht van de literatuur

De bewijskracht van vergelijkend onderzoek naar diagnostische waarde start volgens de GRADE-methode hoog. De bewijskracht werd met 1 niveau verlaagd tot redelijk wegens beperkingen in de onderzoeksopzet (patient selection bias – verschillende inclusie-criteria per studie) en inconsistentie van de resultaten (zie figuur 1).

 

De bewijskracht voor de uitkomstmaat TAT start hoog en is met 1 niveau verlaagd naar redelijk vanwege beperkingen in de onderzoeksopzet (allocation concealment bias).

Om de uitgangsvraag te kunnen beantwoorden is er een systematische literatuuranalyse verricht naar de volgende zoekvraag:

Wat is de effectiviteit van point-of-care testen, home-based testen en klinische diagnostiek op basis van symptomen en klinische tekenen voor het stellen van de diagnose influenza?

 

P: mensen met influenza-like-illness;

I: point of care antigeentest (RIDT), point of care moleculaire testen, klinische diagnose;

C: Real time-PCR (RT-PCR);

O: Diagnostische waarde (sensitiviteit, specificiteit, PPW, NPW), turnaround time;

 

Relevante uitkomstmaten

De werkgroep achtte de diagnostische waarde een voor de besluitvorming cruciale uitkomstmaat en turn-around-time een voor de besluitvorming belangrijke uitkomstmaat.

 

De werkgroep definieerde de genoemde uitkomstmaten niet a priori, maar hanteerde de in de studies gebruikte definities. Ook werd door de werkgroep niet a priori een klinisch relevant verschil gedefinieerd.

 

Zoeken en selecteren (Methode)

In de databases Medline (via OVID), Embase (via Embase.com) en de Cochrane Library (via Wiley) is op 6 augustus 2019 met relevante zoektermen gezocht vanaf het jaar 2000 naar studies die de diagnostische waarde van point of care antigeentesten (RIDT), point of care moleculaire testen of klinische diagnose beschrijven bij mensen met influenza-like-illness. De zoekverantwoording is weergegeven onder het tabblad Verantwoording. De literatuurzoekactie leverde 411 treffers op. Studies werden geselecteerd op grond van de volgende selectiecriteria: systematische reviews of vergelijkend onderzoek (observationeel en gerandomiseerd) naar influenza diagnostiek middels POCT, RT-PCR of klinische diagnose bij personen met ILI. Op basis van titel en abstract werden in eerste instantie 20 studies voorgeselecteerd. Alleen de meeste recente systematische reviews en RCT’s gepubliceerd na de zoekdatums van de systematische reviews werden voorgeselecteerd. Na raadpleging van de volledige tekst, werden vervolgens 9 studies geëxcludeerd (zie exclusietabel onder het tabblad Verantwoording) en 11 studies definitief geselecteerd.

 

Resultaten

Vier systematische reviews en zeven vergelijkende studies zijn opgenomen in de literatuuranalyse. De belangrijkste studiekarakteristieken en resultaten zijn opgenomen in de evidencetabellen. De beoordeling van de individuele studieopzet (risk of bias) is opgenomen in de risk-of-biastabellen.

  1. Call, S. A., Vollenweider, M. A., Hornung, C. A., Simel, D. L., & McKinney, W. P. (2005). Does this patient have influenza?. Jama, 293(8), 987-997.
  2. Ebell, M. H., & Afonso, A. (2011). A systematic review of clinical decision rules for the diagnosis of influenza. The Annals of Family Medicine, 9(1), 69-77.
  3. Gibson, J., Schechter-Perkins, E. M., Mitchell, P., Mace, S., Tian, Y., Williams, K.,... & Yen-Lieberman, B. (2017). Multi-center evaluation of the cobas® Liat® Influenza A/B & RSV assay for rapid point of care diagnosis. Journal of Clinical Virology, 95, 5-9.
  4. Gosert, R., Naegele, K., & Hirsch, H. H. (2019). Comparing the Cobas Liat Influenza A/B and respiratory syncytial virus assay with multiplex nucleic acid testing. Journal of medical virology, 91(4), 582-587.
  5. Hassan, F., Crawford, J., Bonner, A. B., Ledeboer, N. A., & Selvarangan, R. (2018). Multicenter evaluation of the Alere™ i influenza A&B assay using respiratory specimens collected in viral transport media. Diagnostic microbiology and infectious disease, 92(4), 294-298.
  6. Maignan, M., Viglino, D., Hablot, M., Termoz Masson, N., Lebeugle, A., Collomb Muret, R.,... & Forget, V. (2019). Diagnostic accuracy of a rapid RT-PCR assay for point-of-care detection of influenza A/B virus at emergency department admission: A prospective evaluation during the 2017/2018 influenza season. PloS one, 14(5), e0216308.
  7. Merckx, J., Wali, R., Schiller, I., Caya, C., Gore, G. C., Chartrand, C.,... & Papenburg, J. (2017). Diagnostic accuracy of novel and traditional rapid tests for influenza infection compared with reverse transcriptase polymerase chain reaction: a systematic review and meta-analysis. Annals of internal medicine, 167(6), 394-409.
  8. Schmidt, R. L. J., Simon, A., Popow-Kraupp, T., Laggner, A., Haslacher, H., Fritzer-Szekeres, M.,... & Mayer, F. J. (2019). A novel PCR-based point-of-care method facilitates rapid, efficient, and sensitive diagnosis of influenza virus infection. Clinical Microbiology and Infection, 25(8), 1032-1037.
  9. Vos, L. M., Bruning, A. H., Reitsma, J. B., Schuurman, R., Riezebos-Brilman, A., Hoepelman, A. I., & Oosterheert, J. J. (2019). Rapid molecular tests for influenza, respiratory syncytial virus, and other respiratory viruses: a systematic review of diagnostic accuracy and clinical impact studies. Clinical Infectious Diseases, 69(7), 1243-1253.
  10. Yang, J. H., Huang, P. Y., Shie, S. S., Yang, S., Tsao, K. C., Wu, T. L.,... & Huang, C. T. (2018). Diagnostic performance of the Sofia® influenza A+ B fluorescent immunoassay in adult outpatients in Northern Taiwan. Journal of medical virology, 90(6), 1010-1018.

Evidence table for systematic reviews of diagnostic test accuracy studies

Study reference Study characteristics Patient characteristics Index test Reference test  Follow-up Outcome measures and effect size Comments
(test of interest) 
Vos, 2019 SR and meta-analysis  Inclusion criteria SR: peer-reviewed studies (English or Dutch), original data on the diagnostic accuracy or clinical impact of a molecular rapid test for respiratory viruses, among which at least influenza virus and/or RSV, as compared to (non-rapid) molecular techniques. Rapid was defined as having a turnaround time ≤ 3 hours. For the clinical impact studies the reference standard was in-house or laboratory-developed RT-PCR and/or other routine viral pathogen test. The domain included patients of all ages with suspected (viral) RTI presenting in a hospital setting. Describe index test and  DTA STUDIES: Endpoint of follow-up: Pooled characteristic per index test (13 commercial molecular rapid diagnostic tests) Study quality (ROB): 
      cut-off point(s): Describe reference test and cut-off point(s): Not reported 1.        Alere i Influenza A&B (14 reports) (cut-off= not reported) ·         QUADAS-2 for DTA studies
Rapid molecular test for Influenza, RSV and other respiratory viruses: a systematic review of diagnostic accuracy and Clinical impact studies. Literature search up to August 31th 2017 Exclusion criteria SR: Studies did not meet the inclusion criteria. Commercial molecular rapid tests: ·         22 (34,9%) in-house or laboratory developed RT-PCR    Sensitivity 81,6% (95% CI 75,4 to 87,9) Supplementary figure 1
    If the index test itself was part of a composite reference standard. ·         Alere i Influenza A&B ·         41 (65,1%) commercial RT-PCR   Specificity 94% (95% CI 86 to 100)  
Study characteristics and results are extracted from Vos 2019 (unless stated otherwise) DTA STUDIES (n=56) Veterinary studies. ·         Cepheid Xpert Flu Assay CLINICAL IMPACT STUDIES   Heterogeneity (reasons): Pooled results for all included studies: Minority of included study gave a clear description of their selection criteria and/or used cohort design.
  Supplementary Text 2. References of included DTA studies in alphabetical order Conference abstracts.  ·         Cobas Liat Influenza A/B Reference standard =    2.        Cepheid Xpert Flu Assay (9 reports) (cut-off= not reported) 17% studies used samples that were frozen between index and reference testing and/or excluded invalid results.
      ·         Film Array in-house or laboratory-developed RT-PCR and/or other routine viral pathogen test   Sensitivity 94,9% (95% CI 91,1 to 98,6) For index test for majority of studies unclear whether results interpreted without knowledge of result of reference test.
    63 reports of 56 individual DTA studies included (Salez 2012 excluded from pooled analysis because no specificity) ·         Simplexa Flu A/B & RSV kit 3 studies placed the rapid test at the point of care, others located the diagnostic test at the microbiology laboratory.    Specificity 100% (95% CI 97,8 to 100)  
  Alere Influenza A&B   ·         Verigene Respiratory Virus Plus     Heterogeneity (reasons): ·         Cochrane Risk of Bias tool for randomized clinical impact studies
  a)        Beckmann 2015 15 clinical impact studies  ·         AdvanSure Cut-off points not reported   3.        Cobas Liat Influenza A/B (5 reports) (cut-off= not reported) Supplementary figure 2
  b)       Bell 2014   ·         Enigma MiniLab     Sensitivity 98,1% (95% CI 90,8 to 100) ·         ROBINS-I tool for nonrandomized clinical impact studies
  c)        Chapin 2015 N, mean age ·         RIDAGENE     Specificity 99,7% (95% CI 88,5 to 100) Supplementary figure 2
  d)       Chiarella 2016   ·         Aries Flu A/B & RSV assay     Heterogeneity (reasons):  
  e)       Davis 2017 DTA STUDIES (n=63) ·         ePlex RP panel     4.        Film Array (10 reports) (cut-off= not reported) All nonrandomized studies suffered from potential confounding bias and bias in outcome measurements. 
  f)         Hazelton 2015 8 (12,7%) reports Children ·         PLEX-ID Flu assay     Sensitivity 89,2% (95% CI 86,4 to 92)  
  g)        Hurtado 2015 7 (11,1%) reports Adults ·         Roch RealTime     Specificity 96,1% (95% CI 90,5 to 100) Place of the index test in the clinical pathway: Replacement
  h)       Jokela 2015 26 (41,3%) reports Children and Adults       Heterogeneity (reasons):  
  i)         Nguyen 2016 22 (34,9%) reports not reported  Cut-off points not reported     5.        Simplexa Flu A/B & RSV kit (9 reports) (cut-off= not reported)  
  j)         Nie 2014         Sensitivity 99% (95% CI 98,3 to 99,6) Choice of cut-off point: 
  k)        Nolte 2016 CLINICAL IMPACT STUDIES       Specificity 98,2% (95% CI 93,3 to 100) Not reported
  l)         Peters 2017 (n=15)       Heterogeneity (reasons):  
  m)      Riazzo 2015 2 (13,3%) studies Children       6.        Verigene Respiratory Virus Plus (5 reports) (cut-off= not reported) Facultative:
  n)       Young 2017 9 (60%) studies Adults       Sensitivity 96,2% (95% CI 88 to 100) DTA studies
  Cepheid Xpert Flu Assay 2 (13,3%) studies Children and Adults       Specificity 97,1% (95% CI 87,6 to 100) ·         4 studies had an outstandingly low specificity due to case-control design with very low number of virus negative patients
  o)       DiMaio 2012 2 (13,3%) studies not reported       Heterogeneity (reasons): ·         The specificity of assays detecting a panel of viruses (FilmArray, AdvanSure, ePlex RP panel) was significantly lower than the specificity of assays detecting only influenza virus and/or RSV.
  p)       Dugas 2014           ·         The pooled sensitivity of studies that only included childres was 93% as compared to 79,8% in adults. The pooled specificity was higher in adults 98,6% as compared to 80,8% in children. 
  q)       Li 2012 Sex:        Significant results between Alere i and Cobas Liat (p=0,001), Cepheid Xpert (p=0,002), Simplexa (p=0,000) and Verigene (p=0,007).  
  r)        Novak-Weekley 2012 A: % Male          Clinical impact studies:
  s)        Popowitch B:        Significant result between influenza and panel of viruses (p=0,008) and between influenza + RSV and panel of viruses (p=0,036). No significant result between influenza and influenza + RSV.  ·         The results of the impact studies were very heterogeneous.
  2015 C:           
  t)        Salez 2012 (excluded) ….       7.        AdvanSure (3 reports), Enigma MiniLab (1 report), RIDAGENE (1 report), Aries Flu A/B & RSV assay (2 reports), ePlex RP panel (1 report), PLEX-ID Flu assay (1 report), Roch RealTime (2 reports)  
  u)       Salez 2013            
  v)        Salez 2015         Pooled sensitivity 90,9% (95% CI 88,7 to 93,1), specificity 96,1% (95% CI 94,2 to 97,7) of all rapid molecular tests  
  w)      Wahrenbrock 2016            
  Cobias Liat Influenza A/B         Clinical outcomes:  
  x)        Binnicker 2015         1.        Antibiotic prescriptions (8 reports): intervention versus. control  
  y)        Chen 2015         ·         Brendish 2017 RCT 85% versus. 83%  
  z)        Melchers 2017         ·         Andrews 2017 RCT 75% versus. 77%  
  aa)     Nolte 2016         ·         Chu 2015 before-after multivariate 63% versus. 76% (p<0,001)  
  bb)    Young 2017         ·         Rogers 2014 before-after univariate 72% versus. 73%  
  Film Array         ·         Rappo 2016 before-after univariate 66% versus. 61%  
  cc)     Andersson 2014         ·         Linehan 2017 before-after univariate 33% versus. 76% (p<0,001)  
  dd)    Babady 2012         ·         Busson 2017 cohort 36,2% antibiotic precriptions avoided  
  ee)    Butt 2014         ·         Keske 2017 cohort 45% positive patients received antibiotics  
  ff)       Hammond 2012            
  gg)     Hayden 2012         2.        Duration of antibiotic therapy (8 reports): days intervention versus. control  
  hh)    Pierce 2012         ·         Branche 2015 RCT 3 versus. 4  
  ii)        Piralla 2014         ·         Brendish 2017 RCT 7,2 versus. 7,7  
  jj)        Popowitch 2013         ·         Andrews 2017 6 versus. 6  
  kk)     Renaud 2012         ·         Gilbert 2016 quasi RCT 1053/1000 versus. 472/1000 patient days (p=0,07)  
  ll)        Van Wesenbeeck 2013         ·         Gelfer 2015 quasi RCT 683/1000 versus. 917/1000 (p=0,052)  
  Simplexa Flu A/B & RSV kit         ·         Rogers 2014 before-after univariate 2,8 versus. 3,2 (p=0,003)  
  mm) Alby 2013         ·         Rappo 2016 before-after univariate 1 versus. 2  
  nn)    Hindiyeh 2013         ·         Keske 2017 Cohort 6,5 in positive patients  
  oo)    Ko 2013            
  pp)    Landry 2014         à Rapid molecular test did not decrease the number of antibiotic prescriptions or the duration of antibiotic treatment.  
  qq)    Riazzo 2015            
  rr)      Selvaraju 2014         3.        Oseltamivir prescriptions (5 reports): intervention versus. control  
  ss)      Steensels 2017         ·         Brendish 2017 RCT 18% versus. 14% (influenza positive patients 91% versus. 65%) (p=0,003)  
  tt)      Svensson 2014         ·         Chu 2015 before-after univariate 55% versus 45% (influenza positive patients 100% versus. 100%, influenza negative patients 45% versus. 43%)  
  uu)    Woodberry 2013         ·         Rappo 2016 before-after univariate 61% versus. 61%  
  Verigene Respiratory Virus plus test         ·         Linehan 2017 before-after univariate 95% versus. 72% (p<0,01)  
  vv)     Alby 2013         ·         Xu 2013 cohort 81% influenza positive patients received oseltamivir   
  ww)  Butt 2014            
  xx)     Cho 2015         à More appropriate oseltamivir use in influenza positive patients  
  yy)     Hwang 2014            
  zz)      Van Wesenbeeck 2013         4.        Hospital admissions (4 reports)  
  Other assays         ·         Brendish 2017 RCT 92% versus. 92%   
  aaa)  Cho (AdvanSure) 2014         ·         Rappo 2016 before-after univariate 76% versus. 74%   
  bbb) Douthwaite (Enigma Minilab) 2016         ·         Linehan 2017 before-after univariate 45% versus. 88% (p<0,001)  
  ccc)   Esposito (RIDAGENE) 2015         ·         Busson 2017 cohort 5,8% hospitalisations avoided  
  ddd) Jung (AdvanSure) 2015            
  eee) Juretschko (Aries FluA/B & RSV assay) 2017         à No reduction in hospital admissions  
  fff)     Nijhuis (ePlex RP panel) 2017            
  ggg)  Rheem (AdvanSure) 2012         5.        Length of hospital stay (days) (7 reports)  
  hhh) Tang (PLEX-ID Flu assay) 2013         ·         Branche 2015 RCT median 4 versus. 4  
  iii)      Tham (Roche RealTIme) 2012         ·         Brendish 2017 RCT mean 5.7 versus. 6.8 (p=0,44)  
  jjj)       Tham (Roche RealTIme) 2012         ·         Andrews 2017 quasi RCT median 4,1 versus. 3,3  
  kkk)   Voermans (Aries Flu A/B & RSV assay) 2016         ·         Rappo 2016 before-after, multivariate median 1,6 versus. 2,1 (p=0,040)  
            ·         Rogers 2014 before-after, univariate mean 3,2 versus. 3,4  
  Study design:          ·         Chu 2015 before-after, univariate median 4 versus. 5  
  ·         28 Cohort         ·         Timbrook 2015 cohort median 1 day in virus positive patients  
  ·         28 Case-control             
  ·         7 Partially cohort and partially case-control         à Reduction in length of hospital stay  
               
  CLINICAL IMPACT STUDIES         6.        Safety outcomes (6 reports)  
  (n=15)         ·         Branche 2015 RCT no difference in-hospital deaths, SAE, new pneumonia cases or 90-day post-hospitalizations visits  
            ·         Brendish 2017 RCT 30-day readmission 13% versus. 16%  
  a)        Brendish 2017         ·         Andrews 2017 quasi RCT 30-day mortality 3% versus 5%  
  b)       Andrews 2017         ·         Rogers 2014 before-after univariate mortality 0% versus. 0%, ICU admissions 0% versus. 0%  
  c)        Busson 2017         ·         Chu 2015 before-after univariate mortality 2% versus. 4%, ICU admissions 31% versus. 25%   
  d)       Chu 2015         ·         Timbrook 2015 cohort ICU admissions 8,8% of virus positive patients  
  e)       Gilbert 2016            
  f)         Gelfer 2015         à Safety is not affected  
  g)        Linehan 2018            
  h)       Pettit 2015         7.        Costs, no. of radiographs and use of/time in isolation facilities (6 reports)  
  i)         Rappo 2016         ·         Gilbert 2016 quasi RCT $8308/1000 patient-days versus. $11890/1000 patient-days  
  j)         Rogers 2015         ·         Rappo 2016 before-after multivariate median 1 (IQR 1-1) versus. 1 (1-2) additional chest x-rays (p=0,005)  
  k)        Timbrook 2015         ·         Busson 2017 cohort 25% reduction of x-rays in influenza positive patients  
  l)         Xu 2013         ·         Brendish 2017 RCT 33% versus. 25% use of isolation facilities, 74% versus. 57% in influenza positive patients  
  m)      Muller 2016         ·         Rogers 2014 before-after univariate 2,9 days versus. 3 days in isolation facilities   
  n)       Keske 2018         ·         Muller 2016 before-after univariate 3,5 versus. 6 days in droplet isolation (p<0,001)  
               
  Study design:          à Potential reduction in costs and additional X-rays  
  ·         5 RCT            
  ·         6 cohort studies with before-after design         8.        Turnaround time (10 reports)  
  ·         4 cohort studies without control group            
            à Significantly faster  
  Setting and Country:         Tests evaluated: Alere i influenza A&B, Cepheid Xpert Flu, Cobas Liat Influenza A/B, FilmArray (11/15 studies), Simplexa Flu A/B & RSV, Verigene RV Plus test  
  Not reported            
               
  Source of funding and conflicts of interest:            
  Vos 2019: no conflicts of interest            
               
  CLINICAL IMPACT STUDIES            
  7/15 studies sponsored by the manufacturer of the diagnostic test             
               
               
Merckx, 2017 SR and meta-analysis  Inclusion criteria SR:  Describe index test and  Describe reference test and cut-off point(s): Endpoint of follow-up: Pooled characteristic (‘type of statistical analysis’ e.g. bivariate analysis) per index RIDT test and cut-off point: Study quality (ROB): 
Diagnostic accuracy of Novel and Traditional Rapid Tests for Influenza Infection Compared with Reverse Transcriptase Polymerase Chain Reaction   Peer reviewed studies in English, French or Spanish providing original data on the diagnostic accuracy of rapid influenza tests (commercially developed assays that detect influenza A, B or A/B within 30 minutes by identifying influenza viral antigen or RNA directly from an unprocessed specimen include nasopharyngeal aspirates/swabs/washes, nasal aspirates/ swabs/washes and throat swabs. The index test and comparator testing the same clinical specimen or 2 specimens taken concurrently) against an RT-PCR reference standard (commercial and laboratory-developed). Eligible participants: children and adults with clinically suspected influenza during periods of influenza activity.  cut-off point(s): Not reported Not reported   ·         QUADAS-2 criteria 
  Literature search up to May 21th 2017    Among RIDTs 35 commercial tests were evaluated (Supplement table 4.)      Pooled sensitivity 54,4% (95% CI 48,9 to 59,8), specificity 99,4 % (95% CI 99,1 to 99,7) for influenza A and for influenza B sensitivity 53,2% (95% CI 41,7 to 64,4), specificity 99,8 % (95% CI 99,7 to 99,9) of all RIDTs. Supplementary figure 1
Study characteristics and results are extracted from Merckx. 2017 (unless stated otherwise)   Exclusion criteria SR:    Prevalence (%)      
  See supplementary table 3 for authors and year Editorials, letters to the editor and conference abstracts. Studies using case-control design (spectrum bias) and those performing the reference standard depending on index test results (partial verification bias). Studies in which the rapid test itself was part of a composite reference standard (incorporation bias).  2 DIAs (BD Veritor System for Flu A + B (BD Diagnostic systems) and the Sofia Influenza A + B Fluorescent Immunoassay (Quidel)) and 2 rapid NAATs (Alere I Influenza A & B (Alere) and the cobas Liat Infuenza A/B assay (Roche Diagnostics)) were evaluated.  (based on refence test at specified cut-off point)   Pooled characteristic (‘type of statistical analysis’ e.g. bivariate analysis) per index DIA test and cut-off point: Most RIDT (53.8%) and rapid NAAT
    162 studies included of which 130 investigated the accuracy of traditional RIDTs, 19 of DIAs, and 13 of rapid NAATs.   Not reported   1.        Sofia (12 reports) (cut-off= not reported) (69.2%) studies did not present clear patient or specimen selection criteria and processes or were at high
  Study design:  N, mean age       Influenza A risk of bias; risk of selection bias was less common in
  Not reported RIDTs   For how many participants were no complete outcome data available?    Sensitivity 77,8% (95% CI 68,8 to 85,4) DIA studies (42.1%). Limited reporting of blinding to
    -          29 (22,3%) reports Children   N (%)   Specificity 98,5% (95% CI 97,4 to 99,2) reference standard results during interpretation of the
  Setting and Country: -          17 (13,1%) reports Adults   Not reported   Heterogeneity (reasons): index test resulted in a risk of bias in 15.8% to 63.2% of
  Not reported -          84 (64,6%) reports Children and Adults/not reported          studies across index test types. Because DIAs and
    DIAs       Sofia (11 reports) (cut-off= not reported) rapid NAATs have machine-based, objective readers, a lack of blinding when evaluating these test results represents a smaller risk of bias than for nonautomated
  Source of funding and conflicts of interest: -          6 (31,6%) reports Children       Influenza B colorimetric assays, such as RIDTs.
    -          4 (21,1%) reports Adults       Sensitivity 73,5% (95% CI 55,8 to 86,1)  
  Industry sponsorship -          9 (47,4%) reports Children and Adults/not reported        Specificity 98% (95% CI 95,4 to 99,1) Place of the index test in the clinical pathway: replacement
  was more frequent in DIA (68.4%) and rapid NAAT (61.5%) studies than RIDT studies (20.0%) NAATs       Heterogeneity (reasons):  
    -          1 (7,7%) reports Children         Choice of cut-off point: 
    -          1 (7,7%) reports Adults       2.        Veritor (6 reports) (cut-off= not reported) Not reported
    -          11 (84,6%) reports Children and Adults/not reported        Influenza A  
            Sensitivity 83,0% (95% CI 73,4 to 90,1) Facultative:
            Specificity 97,5% (95% CI 95,5 to 98,7) ·         Rapid NAATs not included in results because of more recent meta-analyses by Vos et al. 
            Heterogeneity (reasons):  
               
            Veritor (6 reports) (cut-off= not reported)  
            Influenza B  
            Sensitivity 80% (95% CI 68,8 to 88,2)  
            Specificity 99,5% (95% CI 98,8 to 99,8)  
            Heterogeneity (reasons):  
               
            Difference in DIA sensitivity Sofie versus. Veritor for influenza A sensitivity -5,1 (-16,4 to 6,9)  
            Influenza B sensitivity -6,4 (-25,8 to 10,4)  
               
            had the best overall performance.  
               
            Pooled sensitivity 80% (95% CI 73,4 to 85,6), specificity 98,3% (95% CI 97,1 to 98,9) for influenza A and for influenza B sensitivity 76,8% (95% CI 65,4 to 85,4), specificity 98,7% (95% CI 97,5 to 99,4) of all DIAs.  
               
            è  Differences in sensitivities overall:  
            RIDT versus. DIA  
            influenza A sensitivity -25,5 (-33,4,4 to -17)  
            Influenza B sensitivity -23,5 (-37,9 to 7,7)  
               
            RIDT versus. NAAT  
            influenza A sensitivity -37,1 (-44,2 to -28,6)  
            Influenza B sensitivity -41,7 (-54,0 to -28,5)  
               
            DIA versus. NAAT  
            influenza A sensitivity -11,5 (-19,5 to -2,9)  
            Influenza B sensitivity -18,2 (-30,6 to -6,9)  
Call, 2005 SR Inclusion criteria SR:  Describe index test and  Describe reference test and cut-off point(s): Endpoint of follow-up: Outcome measures and effect size (include 95%CI and p-value if available): Study quality (ROB): 
Does this patient have influenza?   Articles describing primary studies dealing with the diagnosis of influenza based on clinical signs and symptoms cut-off point(s): A.       4-fold increase in hemagglutination inhibition titer (influenza A) Not reported   Studies were graded using the scheme previously appearing in the Rational Clinical Examination series adapted from Holleman and Simel and were excluded if study quality was not graded A (independent blinded comparison of signs of symptoms with criterion standard among a large number of consecutive patients (>= 300) who might have influenza) or B (independent blinded comparison of signs of symptoms with criterion standard among a small number of consecutive patients (<300) who might have influenza 
Study characteristics and results are extracted from Call 2005 (unless stated otherwise) Literature search up to September 2004 Exclusion criteria SR: Individual history and physical examination findings  B.       4-fold increase in titer (influenza A)   Outcome measure-1/2  
    excluded from analysis if they did not A-1 feverishness C.        ELISA, immunofluorescence (influenza A)   Sensitivity/specificity (%) Place of the index test in the clinical pathway: 
  a)        Nicholson 1997 meet the following criteria: (1) study A-2 cough D.       Positive culture for influenza A or B or 4-fold increase in titer of PCR or immunofluoresence   A-1 feverishness sens 47%/spec 78% Replacement
  b)       Govaert 1998 design qualifying as prospective cohort, A-3 myalgia E.        Positive culture for infleunza A or B   A-2 cough sens 53%/spec 56%  
  c)        Carrat 1999 randomized controlled trial, or metaanalysis; A-4 headache F.        PCR (influenza A)   A-3 myalgia sens 47%/spec 83% Choice of cut-off point: 
  d)       Monto 2000 (2) inclusion of primary assessment A-5 sore throat Prevalence (%)   A-4 headache sens 68%/spec 57% Not reported
  e)       Hulson 2001 of individual clinical signs and A-6 sneezing (based on refence test at specified cut-off point)   A-5 sore throat sens 58%/spec 36%  
  f)         van Elden 2001 symptoms as predictors of diagnosis; (3) A-7 nasal congestion A.       0,08%   A-6 sneezing sens 32%/spec 33%  
    definition of at least 1 of the outcomes cut-off: present or absent B.       0,07%   A-7 nasal congestion sens 47%/spec 50%  
  Study design:  as influenza type A or B infection that B-1 fever C.        0,28%   cut-off: present or absent  
  A.       Prospective cohort was proven by either (a) culture; (b) B-2 cough D.       0,66%   B-1 fever sens 34%/spec 91%  
  B.       RCT 4-fold increase in diagnostic antibody B-3 myalgia E.        0,67%   B-2 cough sens 66%/spec 77%  
  C.        Prospective cohort titer, eg, hemagglutination inhibition, B-4 malaise F.        0,5%   B-3 myalgia sens 45%/spec 81%  
  D.       Retrospective pooled analysis of clinical trials complement fixation, or enzyme immunoassay B-5 headache     B-4 malaise sens 57%/spec 78%  
  E.        Prospective cohort from acute to convalescent B-6 sore throat For how many participants were no complete outcome data available?    B-5 headache sens 44%/spec 79%  
  F.        Prospective cohort serum; (c) polymerase chain reaction; B-7 chills N (%)   B-6 sore throat sens 40%/spec 81%  
    or (d) immunofluorescent antibody; and B-8 fever and cough Not reported   B-7 chills sens 46%/spec 82%  
  Setting and Country: (4) study quality gradedAor B using the B-9 fever and cough and acute onset     B-8 fever and cough sens 30%/spec 94%  
  A.       England scheme appearing previously in the cut-off: present or absent     B-9 fever and cough and acute onset sens 27%/spec 95%  
  B.       The Netherlands Rational Clinical Examination series, C-1 fever     cut-off: present or absent  
  C.        France adapted from Holleman and Simel C-2 cough     C-1 fever sens 84%/spec 73%  
  D.       North-America, Europe, southern hemisphere   C-3 headache     C-2 cough sens 84%/spec 29%  
  E.        Oklahoma 6 studies included C-4 chills     C-3 headache sens 84%/spec 26%  
  F.        The Netherlands   cut-off: present or absent     C-4 chills sens 83%/spec 25%  
    Important patient characteristics: D-1 fever     cut-off: present or absent  
  Source of funding and conflicts of interest: 7105 patients D-2 feverishness     D-1 fever sens 68%/spec 60%  
  Not reported   D-3 cough     D-2 feverishness not reported  
    N, mean age D-4 myalgia     D-3 cough sens 93%/spec 20%  
    A.       533 patients, 60-90 yrs D-5 headache     D-4 myalgia sens 94%/spec 6%  
    B.       1838 patients, >=60 yrs D-6 sore throat     D-5 headache sens 91%/spec 11%  
    C.        610 patients, >=1yr D-7 nasal congestion     D-6 sore throat sens 84%/spec 16%  
    D.       3744 patients, >=12 yrs D-8 fever and cough     D-7 nasal congestion sens 91%/spec 19%  
    E.        358 patients, 10 months-73yrs D-9 fever and cough and acute onset     D-8 fever and cough sens 64%/spec 67%  
    F.        81 patients, all ages cut-off: present or absent     D-9 fever and cough and acute onset sens 63%/spec 68%  
    Mean age not reported E-1 fever     cut-off: present or absent  
      E-2 cough     E-1 fever sens 86%/spec 25%  
    Sex:  E-3 myalgia     E-2 cough sens 96%/spec 7%  
    Not reported  E-4 headache     E-3 myalgia sens 64%/spec 21%  
      E-5 sore throat     E-4 headache sens 88%/spec 16%  
      E-7 vaccine history     E-5 sore throat sens 75%/spec 28%  
      cut-off: present or absen     E-6 vaccine history sens 12%/spec 83%  
      F-1 feverishness     cut-off: present or absent  
      F-2 cough     F-1 feverishness sens 88%/spec 15%  
      F-3 myalgia     F-2 cough sens 98%/spec 23%  
      F-4 malaise     F-3 myalgia sens 60%/spec 38%  
      F-5 headache     F-4 malaise sens 73%/spec 26%  
      F-6 sore throat     F-5 headache sens 70%/spec 43%  
      F-7 sneezing     F-6 sore throat sens 80%/spec 33%  
      F-8 nasal congestion     F-7 sneezing sens 33%/spec 69%  
      F-9 vaccine history     F-8 nasal congestion sens 68%/spec 41%  
      cut-off: present or absent      F-9 vaccine history sens 2%/spec 82%  
            cut-off: present or absent   
Ebell, 2011 SR and meta-analysis Inclusion criteria SR:  Describe index test and  Describe reference test and cut-off point(s): Endpoint of follow-up: Outcome measures and effect size (include 95%CI and p-value if available): Study quality (ROB): 
A systematic Review of clinical decision rules for the diagnosis of inlfuenza   (1) provide data on the accuracy of a combination of symptoms or CDR using elements of the history and physical examination in patients with respiratory tract infection, (2) enroll patients prospectively using a cohort design, and (3) use an adequate reference standard. We defined an adequate reference standard as any reference laboratory test for the diagnosis of influenza. cut-off point(s): A.       Increase in antibody titer Not reported   QUADAS tool for studies of diagnostic accuracy 
Study characteristics and results are extracted from Ebell 2011 (unless stated otherwise) Literature search up to July 8 2010   If cut-off not mentioned then not reported B.       DIF and ELISA; if disagreement further testing with PCR and culture   Outcome measure-1: Accuracy (sensitivity/specificity, PPV/NPV, LR+/LR-) Table 4
    Exclusion criteria SR:    C.        Culture or increase in antibody titer, PCR, immunofluorescence   Not all studies reported accuracy The studies were generaly of good qualitiy
  A.       Govaert 1998 (1) Point of care test as reference test (2) Case control design A-1 Fever (>38°C) and cough D.       PCR and culture      
  B.       Carrat 1999   A-2 Fever (>38°C), cough and acute onset E.        PCR and culture   A-1 sens 30%/spec 94%, PPV 26%/NPV 95%, LR+ 5/LR- 0,74  
  C.        Monto 2000 13 studies included B-1 temperature>38,9°C, respiratory signs, and stiffness or myalgia F.        PCR, culture, or increase in antibody titer   A-2 sens 27%/spec 95%, PPV 30%/NPV 95%, LR+ 5,9/LR- 0,76 Place of the index test in the clinical pathway: replacement
  D.       Boivin 2000   B-2 temperature >37,7°C and cough or sore throat G.       Culture, rapid antigen test, increase in antibody titer, or PCR   B-1 PPV 40%/NPV 80%  
  E.        Van Elden 2001 Important patient characteristics: B-3 Any 3 of temperature >37.7°C, H.       Culture   B-2 PPV 30%/NPV 86% Choice of cut-off point: Not reported
  F.        Zambon 2001   cough, chills, moderate/severe  I.         Culture   B-3 PPV 27%/NPV 91%  
  G.       Walsh 2001 N, mean age C-1 Fever (>=37,8°C) and cough J.         PCR   C-1 sens 64%/spec 67%, PPV 79%/NPV 49%, LR+ 1,94/LR- 0,54  
  H.       Friedman and Attia 2004 A.       1838, >60y C-2 Fever (>=37,8°C), cough, and acute onset K.        Culture and/or 4-fold increase in antibody titer, or PCR   C-2 sens 63%/spec 68%, PPV 77%/NPV 51%, LR+ 1,95/LR- 0,54  
  I.         Senn 2005 B.       600, >1y D Fever (>=37,8°C) and cough L.        Culture and/or 4-fold increase in antibody titer   D sens 78%/spec 55%, PPV 87%/NPV 39%, LR+ 1,7/LR- 0,4  
  J.         Stein 2005 C.        3744, adolescent or older E-1 Period of increased influenza activity, cough, headache at onset, feverishness at onset, and not vaccinated M.      PCR   E-1 PPV 75%/NPV 80%  
  K.        Ohmit and Monto 2006 D.       100, age not reported E-2 During an outbreak, abrupt onset (<5 days), temperature >38°C, and at least 1 of cough, coryza, headache, retrosternal pain, or myalgia     E-2 PPV 52%  
  L.        Ohmit and Monto 2006 E.        81, age not reported E-3 At least 4 of sudden onset, contact with influenza, fever, cough, chills, malaise, myalgia, or hyperemic mucous membranes of the nose and throat (≥6 required if not in outbreak) Cut-off not mentioned   E-3 PPV 54%/NPV 85%  
  M.      van den Dool 2008 F.        1033, >= 12y F not reported     F not reported  
    G.       332, >65y G Fever (>=38°C), cough and duration <7 days Prevalence (%)   G sens 78%/spec 73%, PPV 47%/NPV 91%, LR+ 2,9/LR- 0,3  
  Study design:  H.       128, 0-17y H Cough, headache, and pharyngitis A.       6,6%   H sens 80%/spec 78%, PPV 77%/NPV 81%, LR+ 3,7/LR- 0,26  
  Not reported I.         201, age not reported I Week of consultation (49–50 versus ≥51), duration of symptoms (≤48 hr versus >48 hr), temperature >37.8°C, and cough B.       26%   I sens80%/spec 59%, PPV 67%/NPV 73%, LR+ 1,95/LR- 0,34  
    J.         258, adults J-1 Fever (>=37,8°C) and cough C.        66%   J-1 sens 40%/spec 92%, PPV 58%/NPV 84%, LR+ 5,1/LR- 0,7  
  Setting and Country: K.        468, 5-12y J-2 Fever (>=37,8°C), cough and duration <=48hr D.       79%   J-2 sens 75%/spec 89%, PPV 65%/NPV 93%, LR+ 6,5/LR- 0,3  
  A.       Netherlands L.        476, 1-12y K-1 Age E.        51%   K not reported   
  B.       France M.      264, adults K-2 Fever F.        77%   L not reported  
  C.        North-America, Europe, southern hemisphere   K-3 Cough G.       18%   M sens 40%/spec 92%, PPV 58%/NPV 84%, LR+ 5,1/LR- 0,7  
  D.       Canada Mean age not reported K-4 Myalgia H.       35%      
  E.        Netherlands Sex:  K-5 Sore throat I.         52%      
  F.        Europe, North America Not reported L-1 Myalgia J.         21%      
  G.       United States   L-2 Cough  K.        74%      
  H.       United States   L-3 Headache L.        67%      
  I.         Switzerland   M Fever (>38,3 °C) and cough M.      8,7%      
  J.         United States            
  K.        United States     For how many participants were no complete outcome data available?       
  L.        United States     N (%)      
  M.      Netherlands     Not reported      
               
               
  Source of funding and conflicts of interest:            
  Not reported            

 

Evidence table for diagnostic test accuracy studies

Study reference

Study characteristics

Patient characteristics

 

Index test

(test of interest)

Reference test

 

Follow-up

Outcome measures and effect size

Comments

Valentin, 2019

Type of study: Prospective comparison

 

Setting and country: Medical emergency department, Graz University Hospital, Austria

2017/2018 season

 

Funding and conflicts of interest: Reagents used for the tests were partly supplied by Roche and Cepheid

Inclusion criteria:

Adult patients presenting at emergency department of medical department during influenza season 2017/2018 suffering from acute febrile respiratory tract infection and at least one risk factor for complications of seasonal influenza (defined by IDSA)

 

Exclusion criteria: negative cellular control by CELL control R-GENE kit

 

N= 305 specimens

 

Prevalence: 14% Influenza A, 31% influenza B

 

Mean age ± SD: Not reported (adults)

 

Sex: % M / % F Not reported

Describe index test:

  • Alere I A&B (Abbott)

 

Cut-off point(s): not reported

 

 

Comparator test:

  • Cobas Influenza A/B on cobas Liat system (Roche)



Cut-off point(s): not reported

 

Comparator test 2:

  • Xpert Xpress Flu/RSV on GeneXpert System (Cepheid)

Cut-off point(s): not reported

 

Describe reference test:

Influenza A/B R-GENE (specimens extracted on NucliSENS easyMAG, amplification and detection on LC 480 II)

 

 

Cut-off point(s): not reported

 

 

Time between the index test en reference test: Stored at 4°C and processed within 72h

 

For how many participants were no complete outcome data available?

N (%) 37/305 samples gave invalid result for cobas Liat and were excluded from analysis (all of these tests were positive with the reference assay)

 

Reasons for incomplete outcome data described? yes

Outcome measures and effect size:

  • Alere I A&B (Abbott)

Sensitivity %

Inf A 79,1

Inf B 95,7

Overall 90,5

Specificity %

Inf A 99,6

Inf B 100

Overall 99,4

  • Cobas Influenza A/B (Roche)

Sensitivity %

Inf A 100

Inf B 93,1

Overall 96

Specificity %

Inf A 98,7

Inf B 99,5

Overall 97,6

  • Xpert Xpress Flu/RSV (Cepheid)

Sensitivity %
Inf A 97,7

Inf B 96,8

Overall 97

Specificity %
Inf A 99,6

Inf B 99,1

Overall 98,2

Abbott sign lower overall sensitivity compared to Roche and Cepheid tests (mainly due to low sensitivity to Influenza A)

Deep Nasopharyngeal swab (Copan UTM collection system)

Index test: clinical institute of Medical Laboratory Diagnostics

Reference test: Molecular Diagnostics Laboratory

 

Other outcome measures: TAT

Maignan, 2019

Type of study:

Prospective comparison

 

Setting and country: Emergency department of University Hospital Grenoble France

January 2018

 

Funding and conflicts of interest: Work partly funded by Roche, Roche had no access to data and not involved in interpretation or writing

Inclusion criteria:

>18y

Febrile (≥38°) and at least 1 of following symptoms cough, rhinorrhea, dyspnea or a sore throat

OR Acute exacerbation of a chronic pulmonary disease

Exclusion criteria:

Clearly identified non-respiratory infection at triage, previous identification of a virus by other means, currently taking oseltamivir, contraindication for nasopharyngeal swab sampling

 

N= 187 patients

 

Prevalence: 15% Influenza A, 24% Influenza B

 

Mean age ± SD: 70

 

Sex: 51% M / 49% F

 

Describe index test:

Cobas Liat Influenza/RSV (Roche)

 

Cut-off point(s): not reported

 

Describe reference test:

RT-PCR assay Human Influenza A/B PCR kit-R-DiaFlu (Diagenode Diagnostics)

 

Discordance?

Xpert Xpress Flu/RSV assay (Cepheid) and National Influenza virus Reference Center

 

Cut-off point(s): not reported

 

 

Time between the index test en reference test: not reported

 

For how many participants were no complete outcome data available?

N (%)

Not reported

 

 

Outcome measures and effect size (include 95%CI and p-value if available):

 

In comparison with consensus from 3 reference tests

 

Sensitivity (95% CI)

Inf A 1,00 (0,84-1,00)

Inf B 0,98 (0,87-1,00)

Overall 0,98 (0,91-1,00)

 

Specificity (95% CI)

Inf A 0,99 (0,96-1,00)

Inf B 1,00 (0,97-1,00)

Overall 0,99 (0,94-1,00)

 

PPV (95% CI)

Inf A 0,96 (0,79-1,00)

Inf B 1,00 (0,90-1,00)

Overall 0,98 (0,91-1,00)

 

NPV (95% CI)

Inf A 1,00 (0,97-1,00)

Inf B 0,99 (0,96-1,00)

Overall 0,99 (0,91-1,00)

Nasopharyngeal swabs

Cobas Liat: triage nurses emergency department

RT-PCR: department of virology

Secondary outcome measures: number of failures, number of tests during night-shifts and at weekend, TAT

Gosert, 2018

Type of study:

 

Setting and country:

2017/2018 season

 

 

Funding and conflicts of interest: No conflicts of interest

Inclusion criteria: consecutive nasopharyngeal swabs submitted for routine testing between November and January 2018 from patients with ILI

 

Exclusion criteria:

 

N= 194 swabs

 

Prevalence:

9,3% Influenza A, 6,2% Influenza B

 

Mean age ± SD: not reported

Median age 1y

 

Sex: 53,1% M / 46,9% F

 

Describe index test:

Cobas Liat Influenza/RSV (Roche)

 

Cut-off point(s): not reported

Describe reference test:

MultiplexNAT-1 (xTAG Respiratory Pathogen Panel; Luminex) (77,3%)

MultiplexNAT-2 (e-Plex-RPP; GenMark Diagnostics) (22,7%)

 

Discordance?

In-house Quantitative NAT

 

 

Cut-off point(s): not reported

 

 

Time between the index test en reference test: not reported

 

For how many participants were no complete outcome data available?

N (%)

Not reported

 

 

Outcome measures and effect size (include 95%CI and p-value if available):

1 false negative Influenza B à 0 false negative after QNAT

 

In comparison with MultiplexNAT

 

Sensitivity % (95% CI)

Inf A 100 (81,5-100)

Inf B 100 (73,5-100)

 

Specificity % (95% CI)

Inf A 100 (97,9-100)

Inf B 99,5 (97,0-100)

 

PPV % (95% CI)

Inf A 100 (81,5-100)

Inf B 92,3 (64,0-99,8)

 

NPV % (95% CI)

Inf A 100 (0,97-1,00)

Inf B 100 (96,6-100)

Nasopharyngeal swabs

Additional pathogens

 

Hassan, 2018

Type of study:

Multi-center clinical trial, prospective comperative

 

Setting and country: 3 different sites across US

2014/2015 season

 

Funding and conflicts of interest: Clinical trial supported by Alere

Inclusion criteria:

Fresh (stored 4°) leftover de-identified clinical respiratory specimens, from symptomatic patients from all ages, tested with index test within 24h of sample collection

Exclusion criteria: invalid result after repeat testing

N= 1243 samples

Prevalence: not reported

Mean age ± SD: 87% <18y, mean age not reported

Sex: not reported

Describe index test:

Alere i Influenza A&B (Abbott)

 

Cut-off point(s): not reported

Describe reference test:

Prodesse ProFlu+ (after freezing -80°) (Hologic)

 

Discordance?

CDCInfAB assay

 

 

Cut-off point(s): not reported

 

 

Time between the index test en reference test: not reported

 

For how many participants were no complete outcome data available?

N (%) Reasons for incomplete outcome data described?

 

Exclusion of 30 samples (invalid index test result (n=27) and samples not tested within 24h after sample collection (n=3))

Outcome measures and effect size (include 95%CI and p-value if available):

 

In comparison with Prodesse ProFlu+

Sensitivity % (95% CI)

Inf A 97,8 (94,6-99,2)

Inf B 92,9 (85,5-96,9)

 

Specificity % (95% CI)

Inf A 96,6 (95,2-97,5)

Inf B 98,3 (97,4-98,0)

 

PPV % (95% CI)

Inf A 86,3 (81,4-90,1)

Inf B 82,9 (74,3-89,1)

 

NPV % (95% CI)

Inf A 99,5 (98,7-99,8)

Inf B 99,4 (98,7-99,7)

Nasopharyngeal (88%) and nasal swabs (12%)

Gibson, 2017

Type of study:

Multi-center, comparative, prospective clinical trial and additional retrospective analysis of frozen samples

 

Setting and country: 8 primary care clinics and 4 emergency departments at USA, index test performed by CLIA-waived nurses and medical assistants

2013-2014 and 2014-2015 flu season

 

Funding and conflicts of interest: 3 of the authors are employees of Roche

Inclusion criteria: ILI in the previous 48 hours during the 2013-2014 and 2014-2015 flu season, additional 295 frozen NP swabs, at -80°C in universal transport media, obtained from major reference laboratories, thawed at testing site, during 2013-2014 season

 

Exclusion criteria:

 

N= 1656

 

Prevalence: not reported

 

Mean age ± SD:

≤5y 23,5%

6-21y 30,0%

22-59y 37,1%

≥60y 9,4%

 

Sex: 48,7% M / 51,3% F

Describe index test:

Cobas Liat Influenza/RSV (Roche)

 

 

Cut-off point(s): not reported

 

Describe reference test:

Prodesse ProFlu+ (Hologic)

 

Cut-off point(s): not reported

 

Discordance?

PCR and bidirectional sequencing

Time between the index test en reference test: not reported

 

For how many participants were no complete outcome data available?

N (%) Reasons for incomplete outcome data described?

 

Exclusion of 2 samples (invalid reference test result) for influenza B sensitivity and specificity calculations

Outcome measures and effect size (include 95%CI and p-value if available):

 

In comparison with Prodesse ProFlu+

 

Sensitivity % (95% CI)

Inf A 99,6 (97,9-99,9)

Inf B 99,3 (96,2-99,9)

 

Specificity % (95% CI)

Inf A 97,5 (96,6-98,3)

Inf B 99,7 (99,3-99,9)

 

 

Schmidt, 2018

Type of study:

Single-center, comparative, prospective clinical trial

 

Setting and country:

Emergency department of Medical University of Vienna, Austria

1 November 2017-30 April 2018

 

Funding and conflicts of interest: Roche provided assays as well as administrative study support.

Inclusion criteria:

Throat and nasal swabs from patients with ILI or acute RTI at Medical University of Vienna between 1 November 2017 and 30 April 2018

 

Exclusion criteria:

Inadequate sample material and a time span of more than 24h between sample collection and analysis.

 

N= 338 patients tested at emergency department (reference test Xpert Flu)

313 patients tested at laboratory (reference test Xpert Flu and Xpert Xpress Flu/RSV)

 

Prevalence: not reported

 

Median age ± SD: 52 (IQR 31-70) (91 ≤18y and 264 ≥60y)

 

Sex: 51% M / 49% F

Describe index test:

Cobas Liat Influenza/RSV (Roche)

 

 

Cut-off point(s): not reported

 

 

Describe reference test:

Xpert Flu assay (Cepheid)

Xpert Xpress Flu/RSV assay (Cepheid)

 

 

Cut-off point(s): not reported

 

 

Time between the index test en reference test:

Within 24h after sample collection

 

For how many participants were no complete outcome data available?

Not reported

Outcome measures and effect size (include 95%CI and p-value if available):

 

In comparison with Xpert Flu (N=651)

Sensitivity % (95% CI)

Inf A 98,80 (93,47-99,7)

Inf B 98,76 (95,58-99,85)

 

Specificity % (95% CI)

Inf A 99,12 (97,96-99,71)

Inf B 96,33 (94,26-97,81)

 

In comparison with Xpert Xpress Flu/RSV (N=313)

Sensitivity % (95% CI)

Inf A 96,83 (89,00-99,61)

Inf B 98,78 (93,39-99,97)

 

Specificity % (95% CI)

Inf A 99,13 (97,98-99,99)

Inf B 100 (98,42-100)

 

Yang, 2018

Type of study:

Single-center, comparative, prospective, clinical trial

 

Setting and country:

Emergency department and outpatient clinics at a Tertiary care

Hospital, northern Taiwan
January 2012 to

December 2013

 

Funding and conflicts of interest: None

Inclusion criteria:

Patients were included in the study if they presented with influenza-like illness (ILI) and consented to sampling. ILI was defined as a fever (tympanic temperature >38°C), persistent cough, and/or a sore throat. None of the patients received anti-viral treatments before enrollment.

Exclusion criteria: Patients who did not consent to the study, or tests that were uninterpretable, were excluded.

 

N= 109 patients (140 samples)

 

Prevalence: not reported

 

Mean age ± SD:

Influenza positive: 35 (30-46)

Influenza negative: 41 (32-53)

 

Sex: % M / % F

Influenza positive 57.5% M/42,5% F

Influenza negative 56.5% M/43,5% F

Describe index test:

Sofia influenza A+B fluorescent

Immunoassay (Quidel)

 

Cut-off point(s): not reported

 

Describe reference test:

In-house RT-PCR and virus culture

 

Cut-off point(s): not reported

 

 

Time between the index test en reference test:

Within 24h after sample collection

 

For how many participants were no complete outcome data available?

N (%)

Reasons for incomplete outcome data described?

 

27% invalid reference test result

(3/112 patients uninterpretable RT-PCR results due to failed subtyping and were excluded from further analysis)

 

 

Outcome measures and effect size (include 95%CI and p-value if available):

 

In comparison with RT-PCR and viral culture

 

Sensitivity % (95% CI)

Inf A 82 (65-93)

Inf B 71 (29-96)

 

Specificity % (95% CI)

Inf A 89 (80-95)

Inf B 88 (80-93)

 

PPV % (95% CI)

Inf A 77 (60-90)

Inf B 29 (10-56)

 

NPV % (95% CI)

Inf A 89 (80-95)

Inf B 98 (92-100)

 

102 oropharynx and 38 nasopharynx samples (31 patients double sampled)

 

Table of quality assessment for systematic reviews of diagnostic studies

Based on AMSTAR checklist (Shea, 2007; BMC Methodol 7: 10; doi:10.1186/1471-2288-7-10) and PRISMA checklist (Moher, 2009, PLoS Med 6: e1000097; doi:10.1371/journal.pmed1000097)

Study

 

 

First author, year

Appropriate and clearly focused question?1

 

 

Yes/no/unclear

Comprehensive and systematic literature search?2

 

Yes/no/unclear

Description of included and excluded studies?3

 

Yes/no/unclear

Description of relevant characteristics of included studies?4

 

Yes/no/unclear

Assessment of scientific quality of included studies?5

 

 

Yes/no/unclear

Enough similarities between studies to make combining them reasonable?6

 

Yes/no/unclear

Potential risk of publication bias taken into account?7

 

Yes/no/unclear

Potential conflicts of interest reported?8

 

 

 

Yes/no/unclear

Vos 2018

Yes

Yes

Yes

Yes

Yes, asssesed using QUADAS2 and Cochrane Risk of Bias and ROBINS-1 tool. Results discussed but not taken into account when making recommendations.

Yes

No

No, reported for systematic review but not for individual DTA (diagnostic test accuracy) studies.

Merckx 2018

Yes

Yes

Yes

Yes

Yes, asssesed using QUADAS2. Results discussed and taken into account when making recommendations.

Yes

No

Yes

  • Research question (PICO) and inclusion criteria should be appropriate (in relation to the research question to be answered in the clinical guideline) and predefined.
  • Search period and strategy should be described; at least Medline searched.
  • Potentially relevant studies that are excluded at final selection (after reading the full text) should be referenced with reasons.
  • Characteristics of individual studies relevant to the research question (PICO) should be reported.
  • Quality of individual studies should be assessed using a quality scoring tool or checklist (preferably QUADAS-2; COSMIN checklist for measuring instruments) and taken into account in the evidence synthesis.
  • Clinical and statistical heterogeneity should be assessed; clinical: enough similarities in patient characteristics, diagnostic tests (strategy) to allow pooling? For pooled data: at least 5 studies available for pooling; assessment of statistical heterogeneity and, more importantly (see Note), assessment of the reasons for heterogeneity (if present)? Note: sensitivity and specificity depend on the situation in which the test is being used and the thresholds that have been set, and sensitivity and specificity are correlated; therefore, the use of heterogeneity statistics (p-values; I2) is problematic, and rather than testing whether heterogeneity is present, heterogeneity should be assessed by eye-balling (degree of overlap of confidence intervals in Forest plot), and the reasons for heterogeneity should be examined.
  • There is no clear evidence for publication bias in diagnostic studies, and an ongoing discussion on which statistical method should be used. Tests to identify publication bias are likely to give false-positive results, among available tests, Deeks’ test is most valid. Irrespective of the use of statistical methods, you may score “Yes” if the authors discuss the potential risk of publication bias.
  • Sources of support (including commercial co-authorship) should be reported in both the systematic review and the included studies. Note: To get a “yes,” source of funding or support must be indicated for the systematic review AND for each of the included studies.

 

Risk of bias assessment diagnostic accuracy studies (QUADAS II, 2011)

Study reference

Patient selection

 

Index test

Reference standard

Flow and timing

Comments with respect to applicability

Valentin 2019

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

No, excluded in case of negative cellular control

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

N.A.

 

 

 

Is the reference standard likely to correctly classify the target condition?

Unclear

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes, 72h

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

No

Are there concerns that the included patients do not match the review question?

Yes/No/Unclear

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes/No/Unclear

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes/No/Unclear

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Maignan 2019

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

N.A.

 

 

 

Is the reference standard likely to correctly classify the target condition?

Unclear

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

No, sensitivity and specificity were calculated using a second reference standard in case of discrepant results between the index test and first reference standard

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

Yes/No/Unclear

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes/No/Unclear

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes/No/Unclear

 

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW /HIGH/UNCLEAR

 

Gosert 2018

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

N.A.

 

 

 

Is the reference standard likely to correctly classify the target condition?

Unclear

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

No

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

Yes/No/Unclear

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes/No/Unclear

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes/No/Unclear

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: HIGH

 

Hassan 2018

Was a consecutive or random sample of patients enrolled?

No

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

No, excluded when invalid index or reference assay

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

N.A.

 

 

 

Is the reference standard likely to correctly classify the target condition?

Unclear

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

No, samples frozen before reference standard

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

No, excluded when invalid index assay

Are there concerns that the included patients do not match the review question?

Yes/No/Unclear

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes/No/Unclear

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes/No/Unclear

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: HIGH

 

Gibson 2017

Was a consecutive or random sample of patients enrolled?

Unclear

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

No, excluded when invalid index or reference assay

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

N.A.

 

 

 

Is the reference standard likely to correctly classify the target condition?

Unclear

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

No, excluded when invalid index or reference assay

Are there concerns that the included patients do not match the review question?

Yes/No/Unclear

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes/No/Unclear

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes/No/Unclear

 

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: HIGH

 

Schmidt 2018

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

N.A.

 

 

 

Is the reference standard likely to correctly classify the target condition?

Unclear

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

No, but sensitivity and specificity calculated separately for 2 different reference standards

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

Yes/No/Unclear

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes/No/Unclear

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes/No/Unclear

 

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Yang 2018

Was a consecutive or random sample of patients enrolled?

Unclear

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

No, excluded when uninterpretable reference standard result (RT-PCR)

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

N.A.

 

 

 

Is the reference standard likely to correctly classify the target condition?

Unclear

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

Were all patients included in the analysis?

No, excluded when uninterpretable reference standard result (RT-PCR)

Are there concerns that the included patients do not match the review question?

Yes/No/Unclear

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes/No/Unclear

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes/No/Unclear

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

 

Judgments on risk of bias are dependent on the research question: some items are more likely to introduce bias than others, and may be given more weight in the final conclusion on the overall risk of bias per domain.

 

Patient selection:

  • Consecutive or random sample has a low risk to introduce bias.
  • A case control design is very likely to overestimate accuracy and thus introduce bias.
  • Inappropriate exclusion is likely to introduce bias.

 

Index test:

  • This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.
  • Selecting the test threshold to optimise sensitivity and/or specificity may lead to overoptimistic estimates of test performance and introduce bias.

 

Reference standard:

  • When the reference standard is not 100% sensitive and 100% specific, disagreements between the index test and reference standard may be incorrect, which increases the risk of bias.
  • This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.

 

Flow and timing:

  • If there is a delay or if treatment is started between index test and reference standard, misclassification may occur due to recovery or deterioration of the condition, which increases the risk of bias.
  • If the results of the index test influence the decision on whether to perform the reference standard or which reference standard is used, estimated diagnostic accuracy may be biased.
  • All patients who were recruited into the study should be included in the analysis, if not, the risk of bias is increased.

 

Judgement on applicability

Patient selection: there may be concerns regarding applicability if patients included in the study differ from those targeted by the review question, in terms of severity of the target condition, demographic features, presence of differential diagnosis or co-morbidity, setting of the study and previous testing protocols.

 

Index test: if index tests methods differ from those specified in the review question there may be concerns regarding applicability.

 

Reference standard: the reference standard may be free of bias but the target condition that it defines may differ from the target condition specified in the review question.

 

Tabel Exclusie na het lezen van het volledige artikel

Auteur en jaartal

Redenen van exclusie

Akashi 2019

Vergelijking met RIDT

Dale 2019

Geen vergelijking

Pederson 2018

Slechts gedeeltelijk vergelijking

Cohen 2018

Geen zicht op discordante resultaten met vergelijking

Antoniol 2018

Vergelijking: klinische classificatie

Ebell 2012

Vergelijking met virus cultuur; uitkomstmaat geen sens, spec, PPW, NPW

Chen 2012

Vergelijking met RIDT

Peltola 2005

Vergelijking met virus cultuur

Zambon 2001

Uitkomstmaat geen sens, spec, PPW, NPW

Autorisatiedatum en geldigheid

Laatst beoordeeld  : 01-07-2021

Laatst geautoriseerd  : 01-07-2021

Module[1]

Regie-houder(s)[2]

Jaar van autorisatie

Eerstvolgende beoordeling actualiteit richtlijn[3]

Frequentie van beoordeling op actualiteit[4]

Wie houdt er toezicht op actualiteit[5]

Relevante factoren voor wijzigingen in aanbeveling[6]

Testen voor diagnose

NVMM

2021

2026

Elke 5 jaar

NVMM

Niet van toepassing


[1] Naam van de module

[2] Regiehouder van de module (deze kan verschillen per module en kan ook verdeeld zijn over meerdere regiehouders)

[3] Maximaal na vijf jaar

[4] (half)Jaarlijks, eens in twee jaar, eens in vijf jaar

[5] regievoerende vereniging, gedeelde regievoerende verenigingen, of (multidisciplinaire) kerngroep die in stand blijft

[6] Lopend onderzoek, wijzigingen in vergoeding/organisatie, beschikbaarheid nieuwe middelen

Initiatief en autorisatie

Initiatief:
  • Nederlandse Vereniging voor Medische Microbiologie
Geautoriseerd door:
  • Nederlandse Internisten Vereniging
  • Nederlandse Vereniging van Artsen voor Longziekten en Tuberculose
  • Nederlandse Vereniging voor Kindergeneeskunde
  • Nederlandse Vereniging voor Klinische Geriatrie
  • Nederlandse Vereniging voor Medische Microbiologie
  • Nederlandse Vereniging voor Obstetrie en Gynaecologie
  • Vereniging van Specialisten Ouderengeneeskunde
  • Nederlandse Vereniging voor Intensive Care
  • Patiëntenfederatie Nederland

Algemene gegevens

De ontwikkeling/herziening van deze richtlijnmodule werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten en werd gefinancierd uit de Stichting Kwaliteitsgelden Medisch Specialisten (SKMS).

 

De financier heeft geen enkele invloed gehad op de inhoud van de richtlijnmodule.

 

De richtlijn is ontwikkeld in samenwerking met:

  • Nederlandse Internisten Vereniging
  • Nederlandse Vereniging van Artsen voor Longziekten en Tuberculose
  • Nederlandse Vereniging voor Kindergeneeskunde
  • Nederlandse Vereniging voor Klinische Geriatrie
  • Nederlandse Vereniging voor Obstetrie en Gynaecologie
  • Nederlandse Vereniging voor Intensive Care
  • Vereniging van specialisten ouderengeneeskunde
  • Nederlands Huisartsen Genootschap
  • Rijksinstituut voor Volksgezondheid en Milieu
  • Patiëntenfederatie Nederland

Doel en doelgroep

Doel

Het project was het herzien en uitbreiden van de richtlijn klinische behandeling met antivirale therapie van opgenomen patiënt met influenza. Bij de oorspronkelijke richtlijn waren niet alle betrokken wetenschappelijke verenigingen en patiënten meegenomen in het opstellen hiervan en misten aanbevelingen voor specifieke patiëntengroepen. Verder is bij de herziening de inhoud uitgebreid met de behandeling van niet-opgenomen patiënten, de nieuwste ontwikkelingen in diagnostiek en wijzigingen. Hierdoor zal de patiëntenzorg in overeenstemming gebracht worden met de laatste stand van zaken.

 

Doelgroep

Deze richtlijn is geschreven voor alle leden van de beroepsgroepen die betrokken zijn bij de zorg voor patiënten met Influenza.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijn is in 2018 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen die betrokken zijn bij de zorg voor de behandeling van patiënten met (verdenking) op influenza.

 

De werkgroepleden zijn door hun beroepsverenigingen gemandateerd voor deelname.

 

Werkgroep

  • Dr. A. (Annelies) Riezebos-Brilman, arts-microbioloog, werkzaam in het UMC Utrecht (NVMM), t/m april 2021 werkzaam in het UMC Utrecht, sinds mei 2021 werkzaam in LabMicta, Hengelo (NVMM) (voorzitter) 
  • Prof. dr. Menno de Jong, hoogleraar/afdelingshoofd Medische Microbiologie & Infectiepreventie, werkzaam in het Amsterdam UMC te Amsterdam (NVMM)
  • Drs. K.A.S. (Karen) Couderé, AIOS Medische microbiologie, werkzaam in Elisabeth TweeSteden ziekenhuis Tilburg (NVMM)
  • Dr. F.L. (Frank) van de Veerdonk, internist-infectioloog, werkzaam in het Radboudumc te Nijmegen (NIV)
  • Dr. A.W.J. (Aik) Bossink, longarts, werkzaam in het Diakonessenhuis te Utrecht (NVALT)
  • Dr. P.L.A. (Pieter) Fraaij, kinderarts-infectioloog/immunoloog, werkzaam in het Erasmus MC-Sophia te Rotterdam (NVK)
  • Drs. M. (Marieke) Zeeman, internist-ouderengeneeskunde en klinisch farmacoloog, werkzaam in Deventer ziekenhuis te Deventer (NVKG)
  • Dr. W.J. (Wouter) Meijer, gynaecoloog, werkzaam in Gelre Ziekenhuizen te Zutphen (NVOG)
  • Dr. L.P.G. (Lennie) Derde, infectioloog-intensivist, werkzaam in het UMC Utrecht (NVIC)
  • Dr. P. (Paul) van Houten, specialist ouderengeneeskunde, werkzaam bij Zonnehuisgroep Amstelland te Amstelveen (Verenso)
  • Mevr. K. (Klaartje) Spijkers (Patiëntenfederatie Nederland)
  • Dr. G.A. (Ted) van Essen, huisarts, niet praktiserend (NHG)
  • Dr. A.M. (Albert) Vollaard, infectioloog, werkzaam bij het RIVM te Bilthoven (RIVM)

 

Meelezer

  • Stichting Kind en Ziekenhuis

 

Met ondersteuning van

  • Dr. J. (Janneke) Hoogervorst-Schilp, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • E.A (Ester) Rake, adviseur, Kennisinstituut van de Federatie Medisch Specialisten

Belangenverklaringen

De Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement) hebben gehad. Gedurende de ontwikkeling of herziening van een module worden wijzigingen in belangen aan de voorzitter doorgegeven. De belangenverklaring wordt opnieuw bevestigd tijdens de commentaarfase.

 

Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Werkgroeplid

Functie

Nevenfuncties

Gemelde belangen

Actie

Riezebos-Brilman (voorzitter)

Arts-microbioloog met aandachtsgebied virologie, UMCU

Counsilmember ESCV (European Society of Clinical Virology)

geen

Geen actie

Meijer

Gynaecoloog, Coöperatie medische Specialisten Gelre u.a. werkzaam in Gelre ziekenhuis locatie Zutphen

geen

geen

Geen actie

Bossink

Longarts, vrijgevestigd medisch specialist Diakonessenhuis Utrecht

geen

Patent crossspot

Geen actie

Van Essen

Huisarts, gepensioneerd

Onbezoldigd voorzitter Nederlandse Influenza Stichting (https://influenzastichting.nl/)
Lid van de executive committee van de European Scientific Working Group on Influenza (http://www.ESWI.org); de ESWI-leden zetten zich onbezoldigd in voor het vergroten van de kennis over influenza; de bureaukosten worden gefinancierd uit bijdragen van alle vaccinproducenten en van de Europese Commissie.

Een paar keer een vergoeding als spreker, van Sanofi Pasteur en van MSD.

Geen actie

Van de Veerdonk

Internist-infectioloog werkzaam Radboudumc

Onderzoeker betaald vanuit subsidies.

Ik heb een VIDI subsidie gekregen waarbij uitgezocht wordt of neuraminidase remmers de kans op dodelijke schimmelinfecties kunnen verhogen. Ik heb geen baat bij welke uitkomst dan ook van de richtlijn.

Geen actie

De Jong

Hoogleraar/afdelingshoofd Medische Microbiologie & Infectiepreventie, Amsterdam UMC,
locaties AMC & Vumc

geen

In afgelopen 5 jaar lid (ad-hoc) geweest van Scientific Advisory Boards voor Janssen, Crucell, Shionogi, MedImmune, Celltrion; allen op gebied van preklinisch en klinisch onderzoek van nieuwe antivirale middelen tegen influenza. Momenteel geen actief adviseurschap.
Tevens lid van independent Data & Safety Monitoring Boards voor GSK, Janssen en Vertex t.b.v. fase 2/3 studies van nieuwe antivirale middelen voor influenza.
Reis- en vacatiegelden voor bovenstaande bezigheden werden/worden uitgekeerd aan m'n instituut (AMC) en niet aan mij persoonlijk.

Geen actie, want momenteel geen actief adviseurschap, en onafhankelijke beoordelen van nieuwe middelen (dus geen belangenverstrengeling)

Derde

Intensivist UMC Utrecht (0.45 FTE)
Coördinerend intensivist REMAP-CAP study UMC Utrecht (0.45 FTE)

Voorzitter taskforce NVIC: Draaiboek (influenza-) pandemie (onbetaald)
Lid werkgroep Nederlandse Sepsis Richtlijn (onbetaald)
Section Editor (infectieziekten) Journal of Critical Care (onbetaald)
Advisory Board REACT study (onbetaald)
Lid ESICM diversity taskforce (onbetaald)
Lid ESICM DPD working group for developing Infectious Diseases Pathway (onbetaald)

Coördinerend onderzoeker Europa voor REMAP-CAP studie. Deze studie is een internationale 'adaptive platform trial' naar de beste behandeling van CAP op de IC, waarbij in het seizoen of tijdens een pandemie de behandeling van influenza daar deel van zou kunnen uitmaken.
Site investigator bASILICUm studie, die prospectief observationeel kijkt naar frequentie en uitkomst van invasieve aspergillose, met als controlegroep patiënten met ernstige CAP.

Coördinerend onderzoeker Europa voor REMAP-CAP studie.
Deze studie is een internationale 'adaptive platform trial' naar de beste behandeling van CAP op de IC, waarbij in het seizoen of tijdens een pandemie de behandeling van influenza daar deel van zou kunnen uitmaken.
Site investigator bASILICUm studie, die prospectief observationeel kijkt naar frequentie en uitkomst van invasieve aspergillose, met als controlegroep patiënten met ernstige CAP.

Geen actie, want de uitkomst van het genoemde onderzoek en de richtlijn hebben geen invloed op elkaar

Zeeman

Internist ouderengeneeskunde Deventer Ziekenhuis

Klinisch Farmacoloog Deventer Ziekenhuis (binnen functie internist-og)
Docent PAO Farmacie (betaald)
lid wetenschappelijke adviesraad geneesmiddelen Bulletik (betaald)

geen

Geen actie

Vollaard

Internist-infectioloog, Landelijke Coördinatie Infectieziektebestrijding (LCI)
Rijksinstituut voor Volksgezondheid en Milieu (RIVM)

Arts-vrijwilliger bij Dokters van de Wereld: consultatie van ongedocumenteerde migranten
voor triage en geleiding binnen het Nederlandse zorgsysteem (onbetaald).

geen

Geen actie

Fraaij

Kinderarts Infectioloog en immunoloog, hoofd subspecialisme Kinderimmunologie en infectieziekten, ErasmusMC-Sophie, Rotterdam
Wetenschappelijk medewerker afd. Viroscience ErasmusMC, Rotterdam

geen

PREPARE Europe (EU FP? grant no. 602525)
Ik participeer in de door Roche gesponsorde IRIS study, naar het ontstaan van antivirale resistentie bij gebruik oseltamivir.
Ik geef presentaties als expert voor Shire en heb presentaties voor GSK gegeven over immuundeficiënties en/of vaccinaties. Betalingen hiervoor zijn niet naar mij persoonlijk maar naar het Erasmus MC gedaan.

Ik ben bestuurslid bij Stichting Infecties bij Kinderen (INKI) Ik organiseer de cursus 'Antibiotica bij kinderen'

Geen actie, want de uitkomst van het genoemde onderzoek en de richtlijn hebben geen invloed op elkaar

Spijkers

Senior adviseur patiëntenbelang

Voorzitter Stichting Samen voor Duchenne (onbetaald)
lid Community Advisory Board Duchenne (adviesgevend orgaan voor industrie (onbetaald)

geen

Geen actie

Coudere

AIOS Medische microbiologie, LMMI, ETZ, Tilburg

Consulent dienst Gastro-enterologie en Hepatologie, UZA, Antwerpen: medewerker onderzoeksproject Hepatitis B en C screening bij sub-Saharaans Afrikaanse Migranten (funding Gilead) - betaald - einde 31 me 2019

geen

 Geen actie

Van Houten

Specialist ouderengeneeskunde, hoofd medische dienst Zonnehuisgroep Amstelland

Lid Goed gebruik Hulpmiddelen bij ZonMw

Voorzitter werkgroep Handreiking hygiëne en infectiepreventie voor specialisten ouderengeneeskunde bij Verenso.

Adviseur Behandeladvies COVID-19 acute fase en nazorg bij Verenso

Geen actie

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door een werkgroeplid af te vaardigen namens de Patiëntenfederatie Nederland. De conceptrichtlijn is tevens voor commentaar voorgelegd aan de Patiëntenfederatie Nederland.

Methode ontwikkeling

Evidence based

Implementatie

In de verschillende fasen van de richtlijnontwikkeling is rekening gehouden met de implementatie van de richtlijn (module) en de praktische uitvoerbaarheid van de aanbevelingen. Daarbij is uitdrukkelijk gelet op factoren die de invoering van de richtlijn in de praktijk kunnen bevorderen of belemmeren. Het implementatieplan is te vinden in de bijlagen. In het licht van de bevindingen van de Kwaliteits- & Doelmatigheidsagenda over aantallen beschikbare indicatoren en de moeilijkheid van het ontwikkelen van toepasselijke indicatoren, is er besloten (vooralsnog) geen indicatoren te ontwikkelen.

Werkwijze

AGREE

Deze richtlijn is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010), dat een internationaal breed geaccepteerd instrument is. Voor een stap-voor-stap beschrijving hoe een evidence-based richtlijn tot stand komt wordt verwezen naar het stappenplan Ontwikkeling van Medisch Specialistische Richtlijnen van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Knelpuntenanalyse en uitgangsvragen

Tijdens de voorbereidende fase inventariseerden de voorzitter van de werkgroep en de adviseur de knelpunten. Tevens zijn er knelpunten aangedragen door afgevaardigden van de Nederlandse Vereniging voor Medische Microbiologie, Inspectie Gezondheidszorg & Jeugd, de Nederlandse Associatie Physician Assistants, het Nederlands Huisartsen Genootschap, de Nederlandse Vereniging voor Klinische Geriatrie, Rijksinstituut van Volksgezondheid en Milieu, Verpleegkundigen en Verzorgenden Nederland, Verenso, Vereniging Innovatieve Geneesmiddelen, Zorginstituut Nederland, en de Nederlandse Vereniging Artsen voor Longziekten en Tuberculose tijdens de invitational conference. Een verslag hiervan is opgenomen in de bijlagen.

Op basis van de uitkomsten van de knelpuntenanalyse zijn door de werkgroep concept-uitgangsvragen opgesteld en definitief vastgesteld.

 

Uitkomstmaten

Na het opstellen van de zoekvraag behorende bij de uitgangsvraag inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. Hierbij werd een maximum van acht uitkomstmaten gehanteerd. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

 

Methode literatuursamenvatting

Voor de afzonderlijke uitgangsvragen werd aan de hand van specifieke zoektermen gezocht naar gepubliceerde wetenschappelijke studies in (verschillende) elektronische databases. Tevens werd aanvullend gezocht naar studies aan de hand van de literatuurlijsten van de geselecteerde artikelen. In eerste instantie werd gezocht naar studies met de hoogste mate van bewijs. De werkgroepleden selecteerden de via de zoekactie gevonden artikelen op basis van vooraf opgestelde selectiecriteria. De geselecteerde artikelen werden gebruikt om de uitgangsvraag te beantwoorden. De databases waarin is gezocht, de zoekstrategie en de gehanteerde selectiecriteria zijn te vinden in de module met desbetreffende uitgangsvraag. De zoekstrategie voor de oriënterende zoekactie en patiëntenperspectief zijn opgenomen in de zoekverantwoording.

 

Gedurende het zoekproces, heeft de werkgroep de internationale richtlijn van de Infectious Diseases Society of America (IDSA) beoordeeld op geschiktheid (Uyeki, 2019). Daarbij werd het adviesrapport ‘Adapteren van internationale richtlijnen naar de Nederlandse praktijk’ gevolgd van de Federatie Medisch Specialisten, welke is vastgesteld in de Raad Kwaliteit in 2017 (NVALT, NVU 2016). Er werd besloten om de IDSA Guideline niet als uitgangspunt te nemen om de richtlijn te updaten. Enerzijds zijn er geen transparante zoekstrategie en selectiecriteria in de IDSA Guideline beschikbaar; anderzijds is er geen duidelijke scheiding weergegeven tussen literatuuranalyse en Overwegingen in de IDSA Guideline. Daarmee voldoet de IDSA Guideline niet aan afspraken die wv-en onderling hebben afgesproken met betrekking tot het gebruiken en adapteren van internationale richtlijnen.

 

Beoordelen van de kracht van het wetenschappelijke bewijs

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/). De basisprincipes van de GRADE-methodiek zijn: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van de bewijskracht per uitkomstmaat op basis van de acht GRADE-domeinen (domeinen voor downgraden: risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias; domeinen voor upgraden: dosis-effect relatie, groot effect, en residuele plausibele confounding).

 

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie, in het bijzonder de mate van zekerheid dat de literatuurconclusie de aanbeveling adequaat ondersteunt (Schünemann, 2013; Hultcrantz, 2017).

 

GRADE

Definitie

Hoog

  • er is hoge zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • het is zeer onwaarschijnlijk dat de literatuurconclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Redelijk

  • er is redelijke zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • het is mogelijk dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Laag

  • er is lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • er is een reële kans dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Zeer laag

  • er is zeer lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • de literatuurconclusie is zeer onzeker.

 

Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz, 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz, 2017).

 

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals aanvullende argumenten uit bijvoorbeeld de biomechanica of fysiologie, waarden en voorkeuren van patiënten, kosten (middelenbeslag), aanvaardbaarheid, haalbaarheid en implementatie. Deze aspecten zijn systematisch vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’ en kunnen (mede) gebaseerd zijn op expert opinion. Hierbij is gebruik gemaakt van een gestructureerd format gebaseerd op het evidence-to-decision framework van de internationale GRADE Working Group (Alonso-Coello, 2016a; Alonso-Coello 2016b). Dit evidence-to-decision framework is een integraal onderdeel van de GRADE methodiek.

 

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk (Agoritsas, 2017; Neumann, 2016). De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen. De werkgroep heeft bij elke aanbeveling opgenomen hoe zij tot de richting en sterkte van de aanbeveling zijn gekomen.

 

In de GRADE-methodiek wordt onderscheid gemaakt tussen sterke en zwakke (of conditionele) aanbevelingen. De sterkte van een aanbeveling verwijst naar de mate van zekerheid dat de voordelen van de interventie opwegen tegen de nadelen (of vice versa), gezien over het hele spectrum van patiënten waarvoor de aanbeveling is bedoeld. De sterkte van een aanbeveling heeft duidelijke implicaties voor patiënten, behandelaars en beleidsmakers (zie onderstaande tabel). Een aanbeveling is geen dictaat, zelfs een sterke aanbeveling gebaseerd op bewijs van hoge kwaliteit (GRADE gradering HOOG) zal niet altijd van toepassing zijn, onder alle mogelijke omstandigheden en voor elke individuele patiënt.

 

Implicaties van sterke en zwakke aanbevelingen voor verschillende richtlijngebruikers

 

Sterke aanbeveling

Zwakke (conditionele) aanbeveling

Voor patiënten

De meeste patiënten zouden de aanbevolen interventie of aanpak kiezen en slechts een klein aantal niet.

Een aanzienlijk deel van de patiënten zouden de aanbevolen interventie of aanpak kiezen, maar veel patiënten ook niet.

Voor behandelaars

De meeste patiënten zouden de aanbevolen interventie of aanpak moeten ontvangen.

Er zijn meerdere geschikte interventies of aanpakken. De patiënt moet worden ondersteund bij de keuze voor de interventie of aanpak die het beste aansluit bij zijn of haar waarden en voorkeuren.

Voor beleidsmakers

De aanbevolen interventie of aanpak kan worden gezien als standaardbeleid.

Beleidsbepaling vereist uitvoerige discussie met betrokkenheid van veel stakeholders. Er is een grotere kans op lokale beleidsverschillen.

 

Organisatie van zorg

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijn is expliciet rekening gehouden met de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, menskracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van een specifieke uitgangsvraag maken onderdeel uit van de overwegingen bij de bewuste uitgangsvraag.

 

Commentaar- en autorisatiefase [na autorisatiefase definitief maken]

De conceptrichtlijnmodule werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijnmodule aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijnmodule werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

 

Literatuur

  • Agoritsas T, Merglen A, Heen AF, Kristiansen A, Neumann I, Brito JP, Brignardello-Petersen R, Alexander PE, Rind DM, Vandvik PO, Guyatt GH. UpToDate adherence to GRADE criteria for strong recommendations: an analytical survey. BMJ Open. 2017 Nov 16;7(11):e018593. doi: 10.1136/bmjopen-2017-018593. PubMed PMID: 29150475; PubMed Central PMCID: PMC5701989.
  • Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ. 2016 Jun 28;353:i2016. doi: 10.1136/bmj.i2016. PubMed PMID: 27353417.
  • Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ. 2016 Jun 30;353:i2089. doi: 10.1136/bmj.i2089. PubMed PMID: 27365494.
  • Brouwers MC, Kho ME, Browman GP, Burgers JS, Cluzeau F, Feder G, Fervers B, Graham ID, Grimshaw J, Hanna SE, Littlejohns P, Makarski J, Zitzelsberger L; AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010 Dec 14;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348; PubMed Central PMCID: PMC3001530.
  • Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017 Jul;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006. Epub 2017 May 18. PubMed PMID: 28529184; PubMed Central PMCID: PMC6542664.
  • Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. https://richtlijnendatabase.nl/over_deze_site/richtlijnontwikkeling.html
  • Nederlandse Vereniging voor Urologie en de Nederlandse Vereniging van Artsen voor Longziekten en Tuberculose. Adapteren van internationale richtlijnen naar de Nederlandse praktijk. Utrecht, 2016
  • Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016 Apr;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017. Epub 2016 Jan 6. Review. PubMed PMID: 26772609.
  • Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.
  • Schünemann HJ, Oxman AD, Brozek J, Glasziou P, Jaeschke R, Vist GE, Williams JW Jr, Kunz R, Craig J, Montori VM, Bossuyt P, Guyatt GH; GRADE Working Group. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ. 2008 May 17;336(7653):1106-10. doi: 10.1136/bmj.39500.677199.AE. Erratum in: BMJ. 2008 May 24;336(7654). doi: 10.1136/bmj.a139.
  • Schünemann, A Holger J (corrected to Schünemann, Holger J). PubMed PMID: 18483053; PubMed Central PMCID: PMC2386626.
  • Wessels M, Hielkema L, van der Weijden T. How to identify existing literature on patients' knowledge, views, and values: the development of a validated search filter. J Med Libr Assoc. 2016 Oct;104(4):320-324. PubMed PMID: 27822157; PubMed Central PMCID: PMC5079497.
  • Uyeki, T. M., Bernstein, H. H., Bradley, J. S., Englund, J. A., File Jr, T. M., Fry, A. M.,... & Ison, M. G. (2019). Clinical practice guidelines by the Infectious Diseases Society of America: 2018 update on diagnosis, treatment, chemoprophylaxis, and institutional outbreak management of seasonal influenza. Clinical Infectious Diseases, 68(6), e1-e47.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Volgende:
Behandeling influenza - geen opname