Diagnostische strategie bij kinderen met acute appendictis

Beoordeeld: 01-07-2019

Uitgangsvraag

Wat is de optimale diagnostische strategie bij kinderen met verdenking op acute appendicitis?

Aanbeveling

Aanbeveling 1

Verricht echografie bij ieder kind met verdenking op acute appendicitis.

Aanbeveling 2

Verricht een MRI bij een inconclusieve echografie en een hoge klinische verdenking op acute appendicitis zonder eenduidige alternatieve diagnose.

Overweeg een herbeoordeling met eventueel herhalen van de echografie wanneer klachten persisteren of verergeren bij:

een negatieve echografie zonder eenduidige alternatieve diagnose of;
een inconclusieve echografie met een lage(re) klinische verdenking op acute appendicitis.

Verricht bij voorkeur geen CT scan bij kinderen met verdenking op acute appendicitis.

Aanbeveling 3

Verricht een diagnostische laparoscopie bij een inconclusieve MRI en een hoge klinische verdenking op acute appendicitis of wanneer een MRI zonder narcose niet mogelijk is, eventueel na overleg met een kinderchirurgisch centrum.

Overleg met een kinderchirurgisch centrum bij een inconclusieve echografie en een hoge klinische verdenking op acute appendicitis wanneer een MRI logistiek niet mogelijk is.

Zie ook het Stroomschema ‘Diagnostiek bij kinderen’ bij de aanverwante producten onder 'toepassen'.

Overwegingen

Voor- en nadelen van de interventie en de kwaliteit van het bewijs

Beeldvorming:

De werkgroep is van mening dat de diagnostische accuratesse van anamnese, lichamelijk onderzoek en laboratorium onderzoek onvoldoende is om de definitieve diagnose acute appendicitis vast te stellen. Aanvullend beeldvormend onderzoek is daarom geïndiceerd voor het stellen van de definitieve diagnose. De accuratesse van beeldvormend onderzoek gaat omhoog naarmate de vooraf kans hoger wordt. Een goede voorselectie op basis van anamnese, lichamelijk onderzoek en laboratorium onderzoek verhoogd de accuratesse van beeldvorming is daarom essentieel.

Het gebruik van beeldvorming bij iedere patiënt met verdenking op een appendicitis zorgt voor lagere kosten per patiënt, minder complicaties en minder negatieve appendectomieën (Lahaye, 2015). Bij kinderen lijkt de diagnostische accuratesse van echografie hoger dan bij volwassenen en is er geen verschil aantoonbaar tussen echografie, CT of MRI.

Herbeoordeling:

Onur (2008) vergeleek in een RCT onder patiënten met acute buikpijn, die na beoordeling op de spoedeisende hulp een niet-definitieve diagnose hebben gekregen, of er een verschil is in morbiditeit tussen opname ter observatie (n=50) en herbeoordeling de volgende drie dagen met een tijdsinterval van 8 tot 12 uur (n=55). De totale morbiditeit was 10% in de opname groep en 7,2% in de herbeoordeling groep.

Toorenvliet (2010) keek in een prospectieve studie onder 500 patiënten met acute buikpijn, die na beoordeling op de spoedeisende hulp niet werden opgenomen en binnen 24 uur werden her beoordeeld. Zes patiënten (1,2%) kregen bij herbeoordeling een diagnose, waarvan je zou willen dat deze bij initiële beoordeling zou zijn gesteld. Drie van deze patiënten hadden een geperforeerde acute appendicitis. De zes patiënten werden geopereerd en na herstel van de operatie uit het ziekenhuis ontslagen zonder complicaties.

De studie van Toorenvliet (2010) was opgezet als een prospectieve studie waarbij het dagelijkse management niet werd beïnvloed door de studie. Gezien slechts bij zes patiënten (1,2%) een snellere diagnose gewenst was, kan gesteld worden dat op basis van klinische evaluatie een goede inschatting gemaakt kan worden of een patiënt in aanmerking komt voor herbeoordeling.

De werkgroep is daarom van mening dat de diagnostische accuratesse van anamnese, lichamelijk onderzoek en laboratoriumonderzoek voldoende is om een goede inschatting te kunnen maken of een patiënt met acute buikpijn voor aanvullende diagnostiek, opname of herbeoordeling in aanmerking komt.

Bewijskracht

Beeldvorming:

De bewijskracht van de literatuur is laag tot zeer laag. Voor sommige vergelijkingen waren er geen studies beschikbaar die in dezelfde studiepopulatie verschillende testen met elkaar vergeleken. De diagnostische accuratesse is daardoor geëxtraheerd uit verschillende studiepopulaties, waardoor er geen directe vergelijking kan worden gemaakt en er sprake is van indirectheid.

De studies en uitkomsten van de beschikbare literatuur zijn erg heterogeen, wat de bewijskracht van de uitkomstmaten verlaagd. De prevalentie binnen studies varieert en het is vaak onduidelijk hoe patiënten in een studie geselecteerd zijn en welke diagnostiek voorafgaand aan de beeldvorming heeft plaatsgevonden. Daarnaast is het in veel studies onduidelijk hoe lang de follow-up tijd van de referentie test was, met name bij de patiënten die geen operatie ondergingen en welke informatie beschikbaar was bij de beoordeling van een diagnostische test.

Herbeoordeling:

De bewijskracht van de literatuur is niet beoordeeld. Er is geen systematisch literatuuronderzoek verricht, omdat er verwacht werd geen vergelijkende studies te vinden die kunnen beantwoorden bij welke patiënten er na klinische evaluatie een indicatie is voor herbeoordeling, dan wel aanvullende diagnostiek, de volgende dag. Er worden dan ook geen conclusies vermeld. De aanbevelingen zijn daarom uitsluitend gebaseerd op overwegingen die zijn opgesteld door de werkgroepleden op basis van kennis uit de praktijk en waar mogelijk onderbouwd door niet systematisch literatuuronderzoek.

Waarden en voorkeuren van patiënten (en eventueel hun verzorgers)

Beeldvorming:

Het belangrijkste doel voor de patiënt is een correcte en snelle diagnose, waarbij onnodige diagnostiek beperkt dient te worden. Geen negatieve appendectomie, maar ook geen onterecht uitgestelde behandeling.

Echografie heeft geen stralingsbelasting en wordt goed verdragen door patiënten. Groot voordeel is dat echografie overal beschikbaar is, ook buiten kantoortijden. Het nadeel is echter de lagere sensitiviteit.

Een nadeel van het gebruik van MRI bij appendicitis is dat deze techniek nog niet wijd verspreid is over alle ziekenhuizen en voornamelijk in nachten en weekenden vooralsnog minder beschikbaar is. Daarnaast vergt het beoordelen van een MRI specifieke training en zijn er veel minder radiologen bekwaam in het beoordelen van een MRI (Leeuwenburgh, 2012). Voor een goede kwaliteit MRI is het noodzakelijk dat de patiënt stil kan liggen. Als een kind niet te instrueren is kan dit problemen opleveren (leeftijd, mentale ontwikkeling). Ook claustrofobie is een potentieel nadeel van MRI.

CT bij kinderen wordt door de werkgroep afgeraden, gezien de hoge stralingsbelasting en de gelijkwaardige resultaten van MRI.

Herbeoordeling:

Door herbeoordeling te gebruiken in het diagnostisch proces worden meer correcte diagnoses gesteld. 30% van de patiënten krijgt na herbeoordeling binnen 24 uur een andere diagnose dan de initiële diagnose die gesteld was na eerste beoordeling op de spoedeisende hulp. De herbeoordeling leidt in 17% van de gevallen tot verandering van beleid en bij 4% tot operatieve behandeling (Toorenvliet, 2010).

Bij 1,2% van de patiënten die voor herbeoordeling binnen 24 uur komen wordt een diagnose gevonden, waarbij snelle diagnostiek gewenst was geweest. Deze patiënten werden geopereerd en na herstel van de operatie uit het ziekenhuis ontslagen zonder complicaties.

Door herbeoordeling te gebruiken in het diagnostisch proces wordt het onnodig gebruik van aanvullende diagnostiek tegen gegaan. Door de factor tijd te benutten kan het natuurlijk beloop van de ziekte worden gevolgd. Milde, zelflimiterende, ziekte zal geen aanvullende diagnostiek behoeven.

Kosten (middelenbeslag)

Beeldvorming:

Het gebruik van beeldvorming bij iedere patiënt met de verdenking op appendicitis zorgt voor lagere kosten per patiënt (Lahaye, 2015). Echografie is goedkoper en beter beschikbaar dan CT en MRI. Omdat bij een aantal patiënten volstaan kan worden met echografie alleen wordt hiermee een kostenreductie bereikt vergeleken met een diagnostisch traject waarbij echografie overgeslagen wordt.

Herbeoordeling:

Het gebruik van herbeoordeling in het diagnostisch proces zorgt voor minder aanvullende diagnostiek en beperkt het aantal opnames. Herbeoordeling is goedkoper dan opname. Bij herbeoordeling is bij een aantal patiënten geen aanvullende diagnostiek nodig, omdat het natuurlijk beloop uitwijst dat het om milde, zelflimiterende aandoening gaat.

Aanvaardbaarheid voor de overige relevante stakeholders

Het gebruik van beeldvorming en herbeoordeling in het diagnostisch proces van een patiënt met een verdenking acute appendicitis is standaard zorg en breed geaccepteerd.

Bijkomende beslissende factor voor herbeoordeling kan zijn dat het niet in ieder ziekenhuis mogelijk is om buiten kantoortijden en in het weekend te beschikken over directe beschikbaarheid van echografie, CT of MRI.

Haalbaarheid en implementatie

Beeldvorming:

Het gebruik van echografie bij verdenking op acute appendicitis is standaard zorg en breed geaccepteerd. De expertise met MRI voor appendicitis is wisselend. Ook zal het niet in ieder ziekenhuis mogelijk zijn om buiten kantoortijden en in het weekend te beschikken over personeel dat bekwaam is in het maken en beoordelen van een MRI.

Herbeoordeling:

De diagnostische accuratesse van anamnese, lichamelijk onderzoek en laboratoriumonderzoek is voldoende om een goede inschatting te kunnen maken of een patiënt voor aanvullende diagnostiek, opname of herbeoordeling in aanmerking komt.

Rationale/ balans tussen de argumenten voor en tegen de interventie

De lagere kosten, brede beschikbaarheid en de afwezigheid van stralenbelasting maken echografie het onderzoek van eerste keus bij kinderen met een verdenking op appendicitis.

Wanneer een echografie inconclusief is en er een hoge klinische verdenking op acute appendicitis is, is vervolg onderzoek nodig. De accuratesse van echografie gevolgd door MRI is gelijk aan die van echografie gevolgd door CT. MRI geeft net als echografie geen stralingsbelasting, maar is minder goed beschikbaar (expertise, beschikbare middelen). Een CT scan geeft een hoge stralingsbelasting en wordt daarom door de werkgroep afgeraden bij kinderen. “

In principe wordt geadviseerd om bij een inconclusieve echo altijd een MRI te vervaardigen met als doel een onnodige operatie (en dus narcose) te voorkomen. Hiervan kan in bepaalde omstandigheden worden afgezien. Bijvoorbeeld wanneer het kind onder narcose moet voor de MRI is het te overwegen om dit over te slaan en over te gaan tot een diagnostische laparoscopie. Er kan tevens worden overwogen te overleggen met een kinderchirurgischcentrum en het kind over te plaatsen voor verdere diagnostiek.

Onderbouwing

Achtergrond

De diagnostiek bij appendicitis bestaat uit klinische evaluatie, laboratorium onderzoek en beeldvorming (echografie, CT-scan, MRI-scan). Bij lage verdenking op acute appendicitis kan na klinische evaluatie gekozen worden om de patiënt de volgende dag te her beoordelen in plaats van aanvullende diagnostiek te doen. Patiënten met acute appendicitis zijn over het algemeen goed te identificeren, maar patiënten die zich in het beginstadium van de ziekte presenteren zijn moeilijker te onderscheiden van patiënten met andere (self-limiting) oorzaken van de buikklachten. De betrouwbaarheid van beeldvorming is in het beginstadium van ziekte ook lager. Of een patiënt in aanmerking komt voor herbeoordeling, dan wel directe aanvullende diagnostiek hangt af van klinische evaluatie.

Conclusies / Summary of Findings

Zeer laag GRADE

Het is niet duidelijk of er verschil is tussen de sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van echografie vergeleken met MRI of contrast CT voor het diagnosticeren van acute appendicitis bij kinderen met verdenking op acute appendicitis.

Bronnen: (Aspelund, 2014; Dibble, 2018; Epifanio, 2016; Kim, 2018; Krishnamoorthi, 2011; Löfvenberg, 2016; Petkovska, 2016; Thirumoorthi, 2012; Zhang, 2017)

Zeer laag

GRADE

Het is niet duidelijk of er verschil is tussen de sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van MRI vergeleken met contrast CT voor het diagnosticeren van acute appendicitis bij kinderen (tussen de 12 en 20 jaar) met verdenking op acute appendicitis

Bronnen: (Kinner, 2017)

Zeer laag GRADE

Het is niet duidelijk of er verschil is tussen de sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van een work-up (echografie plus contrast CT of echografie plus MRI) vergeleken met MRI of CT voor het diagnosticeren van acute appendicitis bij kinderen met verdenking op acute appendicitis.

Bronnen: (Dibble, 2018; Epifanio, 2016; Krishnamoorthi, 2011; Thirumoorthi, 2012)

Zeer laag GRADE

Het is niet duidelijk of er verschil is tussen de sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van een work-up echografie plus contrast CT vergeleken work-up echografie plus MRI voor het diagnosticeren van acute appendicitis bij kinderen met verdenking op acute appendicitis.

Bronnen: (Dibble, 2018; Epifanio, 2016; Krishnamoorthi, 2011; Thirumoorthi, 2012)

GRADE

Er zijn geen studies gevonden die de uitkomstmaat inconclusieve resultaten rapporteerden voor MRI of contrast CT.

Bronnen: (-)

Samenvatting literatuur

Beschrijving studies

Er werden in totaal twee systematische reviews (Kim, 2018; Zhang, 2018) en 8 aanvullende studies (Aspelund, 2014; Dibble, 2018; Epifanio, 2016; Kinner, 2017; Krishnamoorthi, 2011; Löfvenberg, 2016; Petkovska, 2016; Thirumoorthi, 2012) geïncludeerd voor de subgroep kinderen.

Echografie versus contrast CT of MRI

De review van Zhang (2017) includeerde 19 cohort studies met 9168 patiënten die een echografie kregen en 4 studies met 756 patiënten die een CT met contrastmiddel kregen. De overal prevalentie was 46,8% bij de echografie studies en 26,6% bij de CT studies. Aanvullend beschreef Löfvenberg (2016) de accuratesse van echografie bij 438 patiënten, de prevalentie van acute appendicitis was 29%. De referentietest werd niet beschreven.

De review van Kim (2018) includeerde 13 cohort studies met totaal 1948 patiënten die de accuratesse van MRI rapporteerden. Hiervan beschreven 9 studies het gebruik van MRI als eerste beeldvormende diagnostiek, 3 studies onderzochten de accuratesse van MRI voor inconclusieve echo’s en 1 studie includeerde patiënten die een MRI, ongeacht of dit voor eerste diagnostiek als voor inconclusieve echo’s was. De prevalentie van de studiepopulatie werd niet beschreven. Petkovska (2016) rapporteerde de resultaten van MRI bij 403 patiënten, waarvan 150 kinderen met een prevalentie van 17%. Het verloop van de klachten of de (pathologische) uitkomsten na een operatie werden bij de meeste studies als referentietest beschouwd. Bij enkele studies werden patiënten nog nagebeld.

MRI versus contrast CT

De studie van Kinner (2017) vergeleek de accuratesse van MRI versus CT bij dezelfde 48 patiënten tussen de 12 en 20 jaar, los van elkaar beoordeeld door radiologen. De prevalentie binnen de studiepopulatie was 47%. De (pathologische) uitkomsten na een appendectomie werden als referentietest gebruikt. Indien een kind niet geopereerd werd, werd het patiëntendossier bekeken en werden patiënten na 1 maand telefonisch geïnterviewd.

Work-up (echografie plus contrast CT of echografie plus MRI) versus MRI, CT of

Work-up echografie plus contrast CT versus echografie plus MRI

Dibble (2018) (n=1982 kinderen, prevalentie acute appendicitis 20,5%) en Epifanio (2016) (n=166 kinderen, prevalentie acute appendicitis 47%) rapporteerde de accuratesse van een work-up, waarbij patiënten een echografie kregen en een MRI gedaan werd bij een inconclusieve echografie. Dibble (2017) gebruikte (pathologische) uitkomsten na een operatie of klinische informatie als referentie test. Epifanio (2016) gebruikte (pathologische) uitkomsten na een operatie of klinische follow-up van 30 dagen als referentietest bij kinderen die niet geopereerd werden.

Thirumoorthi (2012) (n=275 kinderen, prevalentie 45,8%) en Krishnamoorthi (2011) (n=631 kinderen, prevalentie 45,8%) rapporteerde de accuratesse van een work-up approach, waarbij patiënten een echografie kregen en aanvullend een CT met contrastmiddel bij een inconclusieve echo. De operatie werd gebruikt als referentietest, patiënten die niet geopereerd waren werden telefonisch geïnterviewd in de studie van Thirumoorthi (2012). Krishnamoorthi (2011) gebruikte pathologische uitkomsten na de operatie en klinische uitkomsten van patiënten zonder operatie als referentietest.

Resultaten

Echografie versus contrast CT of MRI

Door afwezigheid van studies bij kinderen die echografie direct vergeleken met CT of MRI zijn accuratesse studies geïncludeerd en worden de testeigenschappen van echografie, CT en MRI als indirect bewijs beschreven.

Echografie

De meta-analyse van Zhang (2017) poolde 19 studies met een echografie bij 9168 kinderen en vond een gepoolde sensitiviteit (het percentage terecht positieve uitslagen onder kinderen met acute appendicitis) was 89% (95% BI 87% tot 100%). De gepoolde specificiteit (het percentage terecht negatieve testuitslagen onder kinderen zonder acute appendicitis) van 97% (95% BI 96% tot 97%) voor echografie. De gepoolde en de positief voorspellende waarde (percentage onderzochte personen met een positieve testuitslag die daadwerkelijk acute appendicitis heeft) 98%. De negatief voorspellende waarde (percentage onderzochte personen met een negatieve testuitslag die geen acute appendicitis heeft) was 98,7%. In de populatie van Zhang (2017) was de prevalentie van acute appendicitis 46,8%. Met deze vooraf kans werden er per 1000 kinderen 16 onterecht geclassificeerd met acute appendicitis (fout positief) en 51 kinderen onterecht geclassificeerd als geen acute appendicitis (fout negatief). Resultaten van de studies waren heterogeen (I²83,9%).

Löfvenberg (2016) rapporteerde de accuratesse van echografie bij 438 patiënten met een studieprevalentie van 29% en vond een sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van respectievelijk 82%, 97%, 92% en 93%.

Bovenstaande studies rapporteerden niet het aantal inconclusieve resultaten na een echo. Het aantal inconclusieve echo’s werd wel gerapporteerd in de studies die een work-up approach beschreven met echografie en eventueel een MRI of een CT bij inconclusieve echo’s. In de studie van Dibble (2018) (n=1982) kregen 77 (3,4%) kinderen een MRI na een inconclusieve echo. In de studie van Epifanio (2016) kregen 102 kinderen kregen een echo, van wie er 8 (7,8%) een MRI kregen vanwege een inconclusieve echo. In de studie van Thirumoorthi (2012) kregen 172 van de 275 (62,5%) kinderen een echografie plus een CT na een inconclusieve echo. In de studie van Krishnamoorthi (2011) (n=631 kinderen) kregen 298 (47,2%) kinderen een echografie plus een CT na een inconclusieve echo. Het percentage inconclusieve echo’s varieerde in deze studies tussen de 1,4 tot 62,5%.

MRI

De review van Kim (2018) poolde 10 studies met MRI bij 1736 kinderen waarbij de MRI als eerste diagnostiek werd gebruik (9 studies) of MRI zowel met als zonder inconclusieve echografie werd gebruikt (1 studie). De sensitiviteit was 97% (95% BI 95% tot 99%) en de specificiteit was 96% (95% BI 92% tot 99%). De positief en negatief voorspellende waarden en werden niet gerapporteerd, net als de prevalentie, waardoor deze waarden niet berekend konden worden. Wel werd het gepoolde percentage van negatieve appendectomieën uit 9 studies gerapporteerd, dit was 4,5% (95% BI 1,9% tot 7,1%). In de studie van Petkovska (2016) kregen 150 kinderen een MRI. De sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van de MRI was respectievelijk 96,9% (95% BI 83,8% tot 99,9%), 99,2% (95% BI 95,4% tot 100%), 96,9% (95% BI 83,3% tot 99,9%) en 99,2% (95% BI 95,4% tot 100%) met een studieprevalentie van 16,6%.

Contrast CT

De review van Zhang (2017) includeerde 4 studies met 756 patiënten die een CT met contrastmiddel kregen en vond een gepoolde sensitiviteit was 96% (95% BI 94% tot 98%) en een gepoolde specificiteit van 94% (95% BI 92% tot 96%) voor CT. De positief voorspellende waarde was 90,7% en de negatief voorspellende waarde was 98,6%. In de populatie van Zhang (2017) was de prevalentie van acute appendicitis 26,6% in de CT groep. Met deze vooraf kans werden er per 1000 kinderen 11 onterecht geclassificeerd met acute appendicitis (fout positief) en 44 kinderen onterecht geclassificeerd als geen acute appendicitis (fout negatief). Resultaten van de studies waren heterogeen (I²61,7%).

Aspelund (2014) vergeleek de accuratesse in de jaren waarin de CT scan als eerste beeldvorming in het protocol stond (n=265) versus jaren waarin het protocol aangepast was naar echografie eventueel gevolgd door MRI bij inconclusieve echo’s (n=397 kinderen). De sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van de CT was respectievelijk 100% (95% BI 97% tot 100%), 98% (95% BI 93% tot 99%), 98% (95% BI 96% tot 100%) en 100% (95% BI 96% tot 100%) met een studieprevalentie van 51%.

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaten sensitiviteit, specificiteit, positief voorspellende waarde, negatief voorspellende waarde en inconclusieve resultaten voor echografie versus MRI of CT is met drie niveaus verlaagd naar zeer laag vanwege risico op bias (onduidelijke selectie van patiënten, onduidelijke follow-up tijd van de referentie test), indirectheid (diagnostische accuratesse als tussenstap voor patiënt relevante consequenties) en inconsistentie (heterogeniteit tussen studies).

MRI versus contrast CT

Eén studie (Kinner, 2017) vergeleek de accuratesse van MRI versus CT bij dezelfde 48 patiënten tussen de 12 en 20 jaar. De MRI en CT werden los van elkaar beoordeeld door radiologen. De sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van MRI zonder contrast, MRI met contrast en CT met contraststaan in tabel 2. Inconclusieve resultaten werden niet gerapporteerd.

Tabel 2 sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van MRI versus contrast

Beeldvorming	Sensitiviteit,% (95% CI)	Specificiteit, % (95% CI)	Positief voorspellende waarde, % (95% CI)	Negatief voorspellende waarde, % (95% CI)
MRI zonder contrast	94,7 (90,7 tot 97,3)	93 (89,7 tot 96,7)	83,8 (73,8 tot 91,1)	85,9 (76,2 tot 92,7)
MRI met contrast	94,4 (94,4 tot 99,2)	94,3 (90,2 tot 97)	85,9 (76,6 tot 92,5)	93,6 (85,6 tot 97,9)
CT met contrast	93,6 (85,6 tot 97,9)	94,3 (90,2 tot 97)	85,9 (76,6 tot 92,5)	97,5 (94,4 tot 99,2)

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaten sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde voor MRI versus CT is met drie niveaus verlaagd naar zeer laag, één niveau vanwege risico op bias (onduidelijke selectie van patiënten, onduidelijke follow-up tijd van de referentie test) en twee niveaus vanwege imprecisie (gering aantal patiënten met brede betrouwbaarheidsintervallen). Vanwege de afwezigheid van studies die inconclusieve resultaten beschrijven is de bewijskracht voor inconclusieve resultaten is niet beoordeeld.

Work-up (echografie plus contrast CT of echografie plus MRI) versus MRI, CT of

Work-up echografie plus contrast CT versus echografie plus MRI

Door afwezigheid van studies bij kinderen die een MRI of een CT direct vergeleken met een work-up (echografie plus CT of echografie plus MRI) zijn accuratesse studies geïncludeerd en worden de testeigenschappen van de work-up echografie plus MRI en echografie plus CT als indirect bewijs beschreven.

Work-up: echografie met MRI na inconclusieve echo

De review van Kim (2018) poolde 3 studies die de accuratesse van MRI voor inconclusieve echo’s bij 211 kinderen rapporteerden. De sensitiviteit was 98% (95% CI 94% tot 100%) en de specificiteit was 99% (95% BI 96% tot 100%). De positief en negatief voorspellende waarden en werden niet gerapporteerd, net als de prevalentie, waardoor deze waarden niet berekend konden worden.

Dibble (2018) (n=1982 kinderen) rapporteerde de accuratesse van de complete work-up, waarbij patiënten een echografie kregen en een MRI gedaan werd bij een inconclusieve echografie. In de studie van Dibble (2018) kregen 77 (3,4%) kinderen een MRI na een inconclusieve echo. De sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van de work-up was respectievelijk 98,3% (95% BI 96,4% tot 99,2%), 97,1% (95% BI 96,2% tot 97,9%), 89,9% (95% BI 86,7% tot 92,4%) en 99,5% (95% BI 99,1% tot 99,8%). In de populatie van Dibble (2018) was de prevalentie van acute appendicitis 20,5%. Met deze voorafkans werden er per 1000 kinderen 4 onterecht geclassificeerd met acute appendicitis (fout negatief) en 24 kinderen onterecht geclassificeerd als geen acute appendicitis (fout positief).

Epifanio (2016) rapporteerde de accuratesse van een work-up met klinische evaluatie, echo, MRI bij inconclusieve echografie en klinische observatie van 24 uur. 102 kinderen kregen een echo, van wie er 8 ook een MRI kregen. De sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van deze work-up was respectievelijk 96,1% (95% BI 89,9% tot 99,0%), 100% (95% BI 96,7% tot 100%), 100% (95% BI 96,1% tot 100%) en 96,7% (95% BI 91,3% tot 99,2%). Van de 8 kinderen die een echografie plus een MRI kregen waren bij 5 kinderen de resultaten inconclusief. Na 24 uur klinische observatie waren er geen kinderen meer met inconclusieve resultaten.

Work-up: echografie met CT na inconclusieve echo

Thirumoorthi (2012) (n=275 kinderen) en Krishnamoorthi (2011) (n=631 kinderen) rapporteerden de accuratesse van een step-up approach, waarbij patiënten een echografie kregen en bij een inconclusieve echografie aanvullend een CT met contrastmiddel.

In de studie van Thirumoorthi (2012) kregen 197 (71,6%) kinderen een echografie en 78 (28,4%) kinderen een echografie plus een CT. De sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van deze work-up was respectievelijk 94,5%, 97,5%, 95,2% en 97%. De negatieve appendectomie rate was 1,8% en de gemiste appendicitis rate was 0%.

In de studie van Krishnamoorthi (2011) (n=631 kinderen) kregen 333 (52,8%) kinderen een echografie en 298 (47,2%) kinderen een echografie plus een CT. De sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde van deze work-up was respectievelijk 98,6% (95% BI 96% tot 100%), 90,6% (95% BI 87% tot 93%), 99,2% en 99,2%. De negatieve appendectomie rate was 8,1% (19 of 235 patiënten) en de gemiste appendicitis rate was minder dan 0,5% (1 van de 631 patiënten).

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaten sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde voor de work-up (echografie plus CT of echografie plus MRI) versus echografie, MRI of CT is met twee niveaus verlaagd naar laag vanwege risico op bias (onduidelijke selectie van patiënten, onduidelijke follow-up tijd van de referentie test) en indirectheid (diagnostische accuratesse als tussenstap voor patiënt relevante consequenties). Vanwege de afwezigheid van studies die inconclusieve resultaten beschrijven is de bewijskracht voor inconclusieve resultaten is niet beoordeeld.

Zoeken en selecteren

Om de uitgangsvraag te kunnen beantwoorden is er een systematische literatuuranalyse verricht naar de volgende zoekvragen:

PICO 1

Wat is de diagnostische accuratesse van de echografie vergeleken met MRI of een contrast CT voor het diagnosticeren van acute appendicitis bij kinderen met verdenking van acute appendicitis?

P (Patiënten): patiënten (kinderen) met een acute appendicitis;

I (Interventie): echografie;

C (Comparison): MRI of contrast CT;

Referentie test: verloop van de klachten of de (pathologische) uitkomsten na een operatie;

O (Outcomes): sensitiviteit, specificiteit, positief voorspellende waarde, negatief voorspellende waarde, inconclusieve uitkomsten.

PICO 2

Wat is de diagnostische accuratesse van MRI vergeleken met CT voor het diagnosticeren van acute appendicitis bij kinderen met verdenking van acute appendicitis?

P (Patiënten): patiënten (kinderen) met een acute appendicitis;

I (Interventie): MRI;

C (Comparison): contrast CT;

Referentie test: verloop van de klachten of de (pathologische) uitkomsten na een operatie;

O (Outcomes): sensitiviteit, specificiteit, positief voorspellende waarde, negatief voorspellende waarde, inconclusieve uitkomsten.

PICO 3

Wat is de diagnostische accuratesse van een work-up (echografie plus CT of echografie plus MRI) vergeleken met MRI of contrast CT of een work-up echografie plus CT vergeleken met work-up echografie plus MRI voor het diagnosticeren van acute appendicitis bij kinderen met verdenking van acute appendicitis?

P (Patiënten): patiënten (kinderen) met een acute appendicitis

I (Interventie): work-up (echografie plus contrast CT of echografie plus MRI);

C (Comparison): MRI, contrast CT of work-up (anders dan bij I);

Referentie test: verloop van de klachten of de (pathologische) uitkomsten na een operatie;

O (Outcomes): sensitiviteit, specificiteit, positief voorspellende waarde, negatief voorspellende waarde, inconclusieve uitkomsten.

Relevante uitkomstmaten

De werkgroep achtte sensitiviteit en negatief voorspellende waarde (een) voor de besluitvorming cruciale uitkomstmaten; en specificiteit, positief voorspellende waarde, inconclusieve uitkomsten (een) voor de besluitvorming belangrijke uitkomstmaten.

Tabel 1 Gevolgen en consequenties van diagnostische testeigenschappen

Uitkomsten	Gevolgen	Relevantie
Terecht positieven (TP)	Patiënt wordt terecht gediagnostiseerd met acute appendicitis en krijgt behandeling.	Cruciaal
Terecht negatieven (TN)	Patiënt wordt terecht niet gediagnostiseerd met acute appendicitis en krijgt terecht geen behandeling.	Belangrijk
Fout positieven (FP)	Patiënt wordt onterecht gediagnostiseerd met acute appendicitis en krijgt een onnodige behandeling. De klachten persisteren.	Belangrijk
Fout negatieven	Patiënt wordt onterecht niet gediagnostiseerd met acute appendicitis en krijgt onterecht geen behandeling. Er vindt vervolgonderzoek plaats naar de oorzaak van de symptomen.	Cruciaal
Inconclusieve uitkomsten	Vervolgonderzoek (MRI of CT) met vertraging van de uiteindelijke diagnose.	Belangrijk

De werkgroep definieerde 10% verschil in sensitiviteit, specificiteit, positief voorspellende waarde, negatief voorspellende waarde of inconclusieve uitkomsten als een klinisch (patiënt) relevant verschil.

Zoeken en selecteren (Methode)

In de databases Medline (via OVID) en Embase (via Embase.com) is op 6 juni 2018 met relevante zoektermen gezocht naar systematische reviews (SR), randomized controlled trials (RCTs), observationele vergelijkende studies en cohort studies die rapporteerden over diagnostische accuratesse van echografie, MRI, CT of een step-up approach, waarbij een MRI of CT scan werd gedaan na een inconclusieve echografie voor de diagnostiek van acute appendicitis gepubliceerd vanaf 2008. De zoekverantwoording is weergegeven onder het tabblad Verantwoording. De literatuurzoekactie leverde 479 treffers op. Studies werden geselecteerd op grond van de volgende selectiecriteria: systematische reviews (SR), randomized controlled trials (RCTs), observationele vergelijkende studies die ten minste één van de volgende uitkomstmaten rapporteerden: de sensitiviteit, specificiteit, positief voorspellende waarde, negatief voorspellende waarde of inconclusieve uitkomsten. Wanneer deze studies niet beschikbaar waren werden ook niet-vergelijkende studies geïncludeerd.

Op basis van titel en abstract werden in eerste instantie 107 studies voorgeselecteerd. Na raadpleging van de volledige tekst, werden vervolgens 72 studies geëxcludeerd (zie exclusietabel onder het tabblad Verantwoording), en 35 studies definitief geselecteerd. 35 onderzoeken zijn opgenomen in de literatuuranalyse, waarvan 2 systematische reviews en 8 aanvullende studies resultaten voor de subgroep kinderen rapporteerden. De belangrijkste studiekarakteristieken en resultaten zijn opgenomen in de evidencetabellen. De beoordeling van de individuele studieopzet (risk-of-bias) is opgenomen in de risk-of-bias tabellen.

Referenties

Aspelund G, Fingeret A, Gross E, Kessler D, Keung C, Thirumoorthi A, Oh PS,Behr G, Chen S, Lampl B, Middlesworth W, Kandel J, Ruzal-Shapiro C.Ultrasonography/MRI versus CT for diagnosing appendicitis. Pediatrics. 2014 Apr;133(4):586-93. doi: 10.1542/peds.2013-2128. Epub 2014 Mar 3. PubMed PMID: 24590746.
Dibble EH, Swenson DW, Cartagena C, Baird GL, Herliczek TW. Effectiveness of a Staged US and Unenhanced MR Imaging Algorithm in the Diagnosis of Pediatric Appendicitis. Radiology. 2018 Mar;286(3):1022-1029. doi: 10.1148/radiol.2017162755. Epub 2017 Nov 20. PubMed PMID: 29156146.
Epifanio M, Antonio de Medeiros Lima M, Corrêa P, Baldisserotto M. An Imaging Diagnostic Protocol in Children with Clinically Suspected Acute Appendicitis. Am Surg. 2016 May;82(5):390-6. PubMed PMID: 27215717.
Kim JR, Suh CH, Yoon HM, Jung AY, Lee JS, Kim JH, Lee JY, Cho YA. Performance of MRI for suspected appendicitis in pediatric patients and negative appendectomy rate: A systematic review and meta-analysis. J Magn Reson Imaging. 2018 Mar;47(3):767-778. doi: 10.1002/jmri.25825. Epub 2017 Aug 17. PubMed PMID: 28815859.
Kinner S, Pickhardt PJ, Riedesel EL, Gill KG, Robbins JB, Kitchin DR, Ziemlewicz TJ, Harringa JB, Reeder SB, Repplinger MD. Diagnostic Accuracy of MRI Versus CT for the Evaluation of Acute Appendicitis in Children and Young Adults. AJR Am J Roentgenol. 2017 Oct;209(4):911-919. doi: 10.2214/AJR.16.17413. Epub 2017 Aug 10. PubMed PMID: 28796552; PubMed Central PMCID: PMC5639901.
Krishnamoorthi R, Ramarajan N, Wang NE, Newman B, Rubesova E, Mueller CM, Barth RA. Effectiveness of a staged US and CT protocol for the diagnosis of pediatric appendicitis: reducing radiation exposure in the age of ALARA.Radiology. 2011 Apr;259(1):231-9. doi: 10.1148/radiol.10100984. Epub 2011 Jan 28.PubMed PMID: 21324843.
Lahaye MJ, Lambregts DM, Mutsaers E, Essers BA, Breukink S, Cappendijk VC, Beets GL, Beets-Tan RG. Mandatory imaging cuts costs and reduces the rate of unnecessary surgeries in the diagnostic work-up of patients suspected of having appendicitis. Eur Radiol. 2015 May;25(5):1464-70. doi: 10.1007/s00330-014-3531-0. Epub 2015 Jan 16. PubMed PMID: 25591748.
Leeuwenburgh MM, Wiarda BM, Bipat S, Nio CY, Bollen TL, Kardux JJ, Jensch S, Bossuyt PM, Boermeester MA, Stoker J. Acute appendicitis on abdominal MR images: training readers to improve diagnostic accuracy. Radiology. 2012 Aug;264(2):455-63. doi: 10.1148/radiol.12111896. Epub 2012 Jun 14. PubMed PMID: 22700556.
Löfvenberg F, Salö M. Ultrasound for Appendicitis: Performance and Integration with Clinical Parameters. Biomed Res Int. 2016;2016:5697692. doi: 10.1155/2016/5697692. Epub 2016 Dec 1. PubMed PMID: 28044133; PubMed Central PMCID: PMC5156797.
Onur OE, Guneysel O, Unluer EE et al (2008) Outpatient follow-up or active clinical observation in patients with nonspecific abdominal pain in the emergency department. A randomized clinical trial. Minerva Chir 63:915
Petkovska I, Martin DR, Covington MF, Urbina S, Duke E, Daye ZJ, Stolz LA, Keim SM, Costello JR, Chundru S, Arif-Tiwari H, Gilbertson-Dahdal D, Gries L, Kalb B. Accuracy of Unenhanced MR Imaging in the Detection of Acute Appendicitis: Single-Institution Clinical Performance Review. Radiology. 2016 May;279(2):451-60. doi: 10.1148/radiol.2015150468. Epub 2016 Jan 25. PubMed PMID: 26807893.
Reuvers JR, Rijbroek A. Acute appendicitis: liever tweede echo dan CT of MRI. Ned Tijdschr Geneeskd. 2016;160:A9603 en D64.
Thirumoorthi AS, Fefferman NR, Ginsburg HB, Kuenzler KA, Tomita SS. Managingradiation exposure in children--reexamining the role of ultrasound in thediagnosis of appendicitis. J Pediatr Surg. 2012 Dec;47(12):2268-72. doi:10.1016/j.jpedsurg.2012.09.018. PubMed PMID: 23217887.
Zhang H, Liao M, Chen J, Zhu D, Byanju S. Ultrasound, computed tomography or magnetic resonance imaging - which is preferred for acute appendicitis in children? A Meta-analysis. Pediatr Radiol. 2017;47: 186. https://doi.org/10.1007/s00247-016-3727-3

Evidence tabellen

Table of quality assessment for systematic reviews of diagnostic studies

Study

First author, year

Appropriate and clearly focused question?

Yes/no/unclear

Comprehensive and systematic literature search?

Yes/no/unclear

Description of included and excluded studies?

Yes/no/unclear

Description of relevant characteristics of included studies?

Yes/no/unclear

Assessment of scientific quality of included studies?

Yes/no/unclear

Enough similarities between studies to make combining them reasonable?

Yes/no/unclear

Potential risk of publication bias taken into account?⁷

Yes/no/unclear

Potential conflicts of interest reported?

Yes/no/unclear

Zhang, 2017

Yes

Included studies: yes, excluded studies: no

Yes

SR: yes, individual studies: unclear

Kim, 2018

Yes

SR: yes, individual studies: unclear

Evidence table for systematic reviews of diagnostic test accuracy studies

Study reference

Study characteristics

Patient characteristics

Index test

(test of interest)

Reference test

Follow-up

Outcome measures and effect size

Comments

Zhang 2017

PS., study characteristics and results are extracted from the SR (unless stated otherwise)

SR and meta-analysis

Literature search up to January 2017

Ultrasound

A: Baldisserotto, 2000

B: Baldisserotto, 2007

C: Binkovitz, 2015

D: Burford, 2011

E: Chang, 2007

F: Hahn, 1998

G: Kaiser, 2002

H: Limchareon, 2014

I: Lowe, 2001

J: Nosaka, 1997

K: Peña, 2000

L: Scammell, 2011

M: Schulte, 1998

N: Teo, 2000

O: Thieme, 2014

P: Tiu, 2004

Q: Toprak, 2014

R: Van Atta, 2015

S: Wiersma, 2009

Computed tomography (with contrast)

T: Didier 2015

U: Fefferman, 2011

V: Kaiser, 2002

W: Sivit, 2000

Study design: cohort

US: 9 prospective / 10 retrospective

CT: 2 prospective/ 2 retrospective

Setting and Country: Hospital of Wuhan University, China

Source of funding and conflicts of interest:

SR: Funding not reported / no potential conflicts of interest

Individual studies: unclear

Inclusion criteria SR:

1. The patients' ages were ≤18 years old. If this criterion was

not fully met, the proportion of patients with outlying ages

could not exceed 5% of the total sample size and the max

age could not exceed 20.

2. The patients who underwent US or CT or MRI were those

with clinical findings suggestive of equivocal acute

appendicitis.

3. Diagnosis of acute appendicitis was confirmed by surgery

or clinic follow-up.

4. Sufficient data existed to create a 2× 2 table.

5. Imaging criteria for positive appendicitis included an appendix with a diameter of 6 mm or more with or without the presence of an appendicolith. Non- compressible appendix in US. Secondary signs of positive appendicitis

were inflammation of mesenteric fat or local fluid collection

suggesting an appendicular abscess. And local dilatation

of the thin bowel without peristalsis indicating focal

peritonitis in US.

6. Full-text articles were available. If more than one study covered

the same population, only the article containing the most

comprehensive information on that population was included

Exclusion criteria SR: The studies that analyzed the diagnostic value of CT/MRI for appendicitis, but only included patients with inconclusive

US suspected appendicitis, were excluded.

The studies that just included patients who underwent surgery were also excluded.

It was expected that not all patients had acute appendicitis or

would undergo laparotomy. Case reports and series, reviews,

pictorial essays, conference papers and letters to the editor were also not included.

19 studies with US and 4 studies with CT included. The review also included 2 non-contrast CT, these were excluded for this analysis.

Important patient characteristics:

Age range (mean)

Ultrasound

A: 7 (0.5-12)

B: 7.6 (2-12)

C: <18

D: 8.8 (3-16)

E: 0.5-3

F: 9.9 (1-17)

G: 10.4 (2-15)

H: 9 (1-16)

I: 0.5-18

J: 10 (2-15)

K: 11.1 (3-20)

L: 1-18

M: 10.4 (1-15)

N: 2-15

O: 4-18

P: 0.5-16

Q: 2-15

R: <18

S: 2-15

Computed tomography (with contrast)

T: 9.3 (pediatric)

U: 13 (0-18)

V: 2-15

W: 12 (1-20)

N, male/ female

Ultrasound

A: 259/166

B: 31/19

C: 452/338

D: 28/26

E: 43/28

F: 1990/1869

G: 288/312

H: 220/208

I: 35/43

J: 100/106

K: 70/69

L: 311

M: 514/771

N: 68/61

O: 47/57

P: 80/71

Q: 63/59

R: 512

S: 129/83

Computed tomography (with contrast)

T: 86/106

U: 39/54

V: 317

W: 68/86

Describe index test:

Ultrasound

A: US (4-7 MHz)

B: US (4-7 MHz)

C: US (unclear)

D: US (6-13 MHz)

E: US (7 MHz)

F: US (5-7 MHz)

G: US (7 MHz)

H: US (5-12 MHz)

I: US (unclear)

J: US (7-7.5 MHz)

K: US (7-7.5 MHz)

L: US (unclear)

M: US (5 MHz)

N: US (5-10 MHz)

O: US (3-9 MHz)

P: US (5-10 MHz)

Q: US (4-10 MHz)

R: US (unclear)

S: US (7-12 MHz)

T: MDCT with IV contrast

U: Helical/non-helical

CT with oral/ IV contrast

V: Helical CT with IV contrast

W: Helical CT with oral/ rectal/IV contrast

Describe reference test:

Surgery and clinic

follow-up results

Prevalence (%)

US overall: 46.8%

CT overall: 26.6%

For how many participants were no complete outcome data available?

Not reported

Reasons for incomplete outcome data described?

Not reported

Endpoint of follow-up:

Some studies did not clearly show the follow-up time. In the rest of the studies, the follow-up time was no less than 2 weeks.

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1

Sensitivity

US: 0.89 (95% CI 0.87–1.00)

CT: 0.96 (95% CI 0.94–0.98)

Outcome measure-2

Specificity

US: 0.97 (95% CI 0.96–0.97)

CT: 0.94 (95% CI 0.92–0.96)

Outcome measure-3

PPV

US: 0.9800

CT: 0.9074

Outcome measure-4

NPV

US: 0.9867

CT: 0.9855

Outcome measure-5

Inconclusive results

Not reported

Heterogeneity:

For the studies in the US group, the I² was 83.9%, P<0.001,

which indicates a significant heterogeneity exists. For the CT group heterogeneity was I² is 61.7%*, P=0.0228.

*Analysis includes non-contrast CT

Study quality (ROB):

QUADAS-2 tool

Three of the studies were regarded as high risk in patient selection because of inappropriate exclusion. All studies used surgery and clinic

follow-up results as the reference standards. In one study, the clinic follow-up time was at least 24 h and another three were during the hospital stay but not specified.

For these studies, the risk-of-bias regarding reference standard

was high. Some studies did not

clearly show the follow-up time; for these studies, the risk-of-bias regarding reference standard was unclear. In the rest of

the studies, the follow-up time was no less than 2 weeks and

the risk-of-bias regarding reference standard was low. In one of the studies in the CT group, the risk regard to index test was unclear because researchers used both helical and nonhelical CT. In two of the studies, in the MRI group,

the risk regard to index test was unclear because both 1.5-T

and 3.0-T MRI systems were used. Risk bias of flow and

timing were high in one study because it excluded the

indeterminate results. The application concerns of patient selection were high in one study because of the small age

range of the included patients and unclear in two studies because patients older than 18 years were included.

Place of the index test in the clinical pathway: patients underwent US or CT if they had clinical findings suggestive of equivocal acute appendicitis.

Choice of cut-off point: Sensititvity and negative predictive value (NVP)

Author’s conclusion

US, CT and MRI have high diagnostic accuracies

of clinically suspected acute appendicitis in children overall

with no significant difference.

Kim, 2018

PS., study characteristics and results are extracted from the SR (unless stated otherwise)

SR and meta-analysis

Literature search up to January 2017

MRI (with or without inclusive ultrasound)

A: Bayraktutan, 2015

MRI

B: Cobben 2009

C: Johnson, 2012

D: Kearl, 2016

E: Koning, 2014

F: Kulaylat, 2015

G: Moore, 2012

H: Orth, 2014

I: Petkovska

J: Thieme, 2014

MRI after inconclusive ultrasound

K: Dillman, 2016

L: Herliczek, 2013

M: Rosines, 2014

Study design: cohort

5 prospective / 8 retrospective

Setting and Country: Asan Medical Center, Korea

Source of funding and conflicts of interest:

SR: Funding not reported / no potential conflicts of interest

Individual studies: unclear

Inclusion criteria SR: 1) pediatric patients (mean age ≤15 years) who underwent MRI for suspected appendicitis;

2) reference standard based on histopathology and/or clinical follow-up;

3) results

including sufficient detail for reconstruction of 2X2 tables for

determination of the diagnostic performance of MRI in the detection

of acute appendicitis.

Exclusion criteria SR:

1) case

reports or case series involving less than 10 patients;

2) conference

abstracts, letters, editorials, reviews, meta-analyses, consensus statements,

and guidelines;

3) studies focusing on topics other than diagnosis of acute appendicitis;

4) studies including partially

overlapping patient populations.

13 studies included

Important patient characteristics:

Mean age

Both

A: 7

MRI

B: NR

C: 11.5

D: 14.4

E: 11.3

F: 11.3

G: 11.2

H: 12.3

I: 12

J: 12

MRI after inconclusive ultrasound

K: 11.5

L: 13.4

M: 12.9

N, male/ female

Both

A: 19/28

MRI

B: 38

C: 12/30

D: 192

E: 141/223

F: 227/283

G: 89/119

H: 34/47

I: 150

J: 47/57

MRI after inconclusive ultrasound

K: 47/56

L: 28/32

M: 25/24

Describe index test:

Vendor, model, Magnet strength (Tesla), contrast

MRI (with or without inclusive ultrasound)

A: Siemens, Magnetom

Avanto, 1.5, no

MRI

B: Siemens, NR, 1, no

C: Philips, Achieva, 3, no

D: NR, NR, 1.5, no

E: GE, NR, 1.5, IV contrast

F: Siemens, Magnetom

Aera and Skyra, 1.5 or 3, no

G: Philips, Intera Achieva, 1.5, no

H: Philips, Achieva and

Ingenia, 1.5, no

I: Siemens, Magnetom

Aera and Skyra, 1.5 or 3, no

J: Siemens, Avanto, 1.5, no

MRI after inconclusive ultrasound

K: Philips, Ingenia, 1.5 or 3, no

L: Siemens, Espree and

Symphony or Verio,

1.5 or 3, no

M: GE, Signa, 1.5, IV contrast

Describe reference test and cut-off point(s):

Pathology and

clinical follow-up

Prevalence (%)

Not reported

For how many participants were no complete outcome data available?

Not reported

Reasons for incomplete outcome data described?

Endpoint of follow-up:

Six studies had an unclear risk-of-bias because the clinical follow-up period in cases of negative MRI findings was not mentioned.

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1

Sensitivity

MRI: 0.97 (95% CI 0.95–0.99)

MRI after inconclusive US: 0.98 (95% CI 0.94–1.00)

Outcome measure-1/2

Specificity

MRI: 0.96 (95% CI 0.92–0.99)

MRI after inconclusive US: 0.99 (95% CI 0.96–0.100)

Outcome measure-3

PPV

Not reported

Outcome measure-4

NPV

Not reported.

Outcome measure-5

Inconclusive results

Not reported

Additional outcome

The SR did report the pooled proportion of the negative appendectomy rate:

4.5% (95% CI 1.9–7.1%; I² = 74.10% (including 9 studies with MRI and 1 study with MRI after inconclusive US.

Study quality (ROB): In terms of the quality of the included studies according to

QUADAS-2, 10 of the 13 studies satisfied ≥4 of the 7

items. Regarding the patient selection domain, there

was an unclear risk-of-bias, as two studies showed nonconsecutive

patient enrolment. When it comes to the index test domain, there was a high risk-of-bias in one study that did not report positive MR findings of appendicitis and

an unclear risk-of-bias in four studies, as it was unclear whether or not reviewers were aware of the final diagnosis. In

terms of the reference standard domain, there was generally an

unclear risk-of-bias because the blinding procedure used for

the pathologist who determined the final diagnosis was not

mentioned in any of the studies. Regarding the flow and timing

domain, six studies had an unclear risk-of-bias because the

clinical follow-up period in cases of negative MRI findings

was not mentioned

Place of the index test in the clinical pathway: MRI for suspected appendicitis of MRI for suspected appendicitis after inconclusive US.

Choice of cut-off point: Sensititvity and negative predictive value (NVP)

Author’s conclusion:

MRI shows excellent diagnostic performance for appendicitis in pediatric patients regardless of the use of intravenous contrast media. Therefore, nonenhanced-only MRI protocols might be appropriate for pediatric patients with suspected appendicitis.

Heterogeneity:

To explore the possible causes of the heterogeneity, a meta-regression was performed . Among the various potential

covariates, use of diffusion-weighted imaging (DWI) (P<0.01) and age (P<0.01) significantly affected the study heterogeneity. Otherwise, no

clinically meaningful differences were seen.

CI: confidence interval; CT: computed tomography; MRI: magnetic resonance imaging; NPV: negative predictive value; NR: not reported; PPV: positive predictive value; SD: standard deviation; SR: systematic review; US: ultrasound

Risk-of-bias assessment diagnostic accuracy studies (QUADAS II, 2011)

Study reference

Patient selection

Index test

Reference standard

Flow and timing

Comments with respect to applicability

Löfvenberg, 2016

Was a consecutive or random sample of patients enrolled?

Yes, all patients who underwent abdominal ultrasound for

suspicion of appendicitis from 2012 to 2015 were included.

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

If a threshold was used, was it pre-specified?

Not applicable

Is the reference standard likely to correctly classify the target condition?

Unclear, reference standard was not described.

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear, reference standard was not described.

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Unclear

Did patients receive the same reference standard?

Unclear

Were all patients included in the analysis?

Unclear

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

RISK: UNCLEAR

Dibble, 2017

Was a consecutive or random sample of patients enrolled?

Yes all patients aged 18 years or younger who underwent diagnostic imaging for suspected appendicitis from January 1, 2011, to December 31, 2012 were included.

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

If a threshold was used, was it pre-specified?

Not applicable

Is the reference standard likely to correctly classify the target condition?

Unclear, patients who did not undergo an appendectomy

at the institution within 4 weeks

of initial presentation and imaging or who had a normal appendix documented on the surgical pathology report were considered

to have true-negative results.

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Did patients receive the same reference standard?

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

RISK: UNCLEAR

Epifanio, 2016

Was a consecutive or random sample of patients enrolled?

Unclear

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Unclear, prevalence is high.

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

If a threshold was used, was it pre-specified?

Not applicable

Is the reference standard likely to correctly classify the target condition?

Unclear, 30-day clinical follow-up in patients who did not need to undergo surgery.

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Yes

Did patients receive the same reference standard?

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

RISK: UNCLEAR

Thirumoorthi, 2012

Was a consecutive or random sample of patients enrolled?

Unclear

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Unclear, prevalence is high.

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

If a threshold was used, was it pre-specified?

Not applicable

Is the reference standard likely to correctly classify the target condition?

Surgery: yes, phone calls: unclear

Were the reference standard results interpreted without knowledge of the results of the index test?

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Yes

Did patients receive the same reference standard?

Were all patients included in the analysis?

Unclear

Are there concerns that the included patients do not match the review question?

Yes, partly

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes, partly

Are there concerns that the target condition as defined by the reference standard does not match the review question?

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

RISK: UNCLEAR

Krishnamoorthi, 2011

Was a consecutive or random sample of patients enrolled?

Unclear

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Unclear, prevalence is high.

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

If a threshold was used, was it pre-specified?

Not applicable

Is the reference standard likely to correctly classify the target condition?

Yes

Were the reference standard results interpreted without knowledge of the results of the index test?

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Yes

Did patients receive the same reference standard?

Were all patients included in the analysis?

Unclear

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

RISK: UNCLEAR

Kinner, 2017

Was a consecutive or random sample of patients enrolled?

Unclear

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

If a threshold was used, was it pre-specified?

Yes

Is the reference standard likely to correctly classify the target condition?

Yes

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Unclear

Did patients receive the same reference standard?

Were all patients included in the analysis?

Unclear

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes, contrast-enhanced MRI and unenhanced MRI were read at the same time.

Are there concerns that the target condition as defined by the reference standard does not match the review question?

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

RISK: UNCLEAR

Aspelund, 2014

Was a consecutive or random sample of patients enrolled?

Was a case-control design avoided?

Did the study avoid inappropriate exclusions?

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

If a threshold was used, was it pre-specified?

Yes

Is the reference standard likely to correctly classify the target condition?

Unclear

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Unclear

Did patients receive the same reference standard?

Were all patients included in the analysis?

Unclear

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Unclear

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: HIGH

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

RISK: UNCLEAR

Evidence table for diagnostic test accuracy studies

Study reference

Study characteristics

Patient characteristics

Index test

(test of interest)

Reference test

Follow-up

Outcome measures and effect size

Comments

Löfvenberg, 2016

Type of study:

retrospective cohort study

Setting: University

Hospital that covers an area of 340.000 inhabitants

with care for children with acute abdominal pain.

Country: Sweden

Conflicts of interest: The authors have no conflict of interests relevant to this article to disclose.

Inclusion criteria: <15

years of age, seeking the pediatric ED with acute abdomen,

and abdominal US for suspected appendicitis. Suspicion of appendicitis had to be documented on the imaging request of

the patient, for inclusion in the study.

Exclusion criteria: Patients already hospitalized

and with acute abdomen presenting during treatment

for other conditions

N=438

Prevalence: 29% in study population

Mean age ± SD: 8.5 years (4.3)

Sex: 54% M / 46% F

Describe index test:

Ultrasound

Comparator test: not applicable

Describe reference test:

Not described

Time between the index test and reference test:

Not described

For how many participants were no complete outcome data available?

Not applicable, retrospective cohort study

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1

Sensitivity

82% (95% CI 75-89)

Outcome measure-2

Specificity

97% (95% CI 94-99)

Outcome measure-3

PPV

92% (95% CI 85-96)

Outcome measure-4

NPV

93% (95% CI 90-96)

Outcome measure-5

Inconclusive results

N=93 (21%)

Author’s conclusion

US may be a useful tool for

evaluating children with suspected appendicitis, regardless of age or gender, and should be the first choice of imaging modalities.

Dibble, 2017

Type of study: retrospective cohort study

Setting: tertiary referral center that includes the state’s only pediatric

hospital.

Country: USA

Conflicts of interest: The authors have no conflict of interests relevant to this article to disclose.

Inclusion criteria: all patients

aged 18 years or younger who underwent

diagnostic imaging for suspected

appendicitis from January 1, 2011, to

December 31, 2012.

Exclusion criteria: patients, who had undergone

imaging outside of the algorithm

by undergoing either MR imaging or CT

before US, by undergoing US followed

by CT, or by having equivocal US results

but no subsequent MR examination.

N=1982

Prevalence: 20.5% in study population

Mean age: 11.2 years (range 1.2-18)

Sex: 47% M / 53% F

Describe index test: A staged imaging algorithm with US and unenhanced MRI

1905 patients received US only, 77 received US + MRI.

Comparator test: not applicable

Describe reference test:

Available surgical notes, pathology reports, and

clinical information.

Time between the index test and reference test:

Max. 4 weeks

For how many participants were no complete outcome data available?

Not applicable, retrospective cohort study

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1

Sensitivity

98.3% (95% CI 96.44-99.18)

Outcome measure-2

Specificity

97.1% (95% CI 96.19-97.86)

Outcome measure-3

PPV

89.9% (95% CI 86.72-92.37)

Outcome measure-4

NPV

99.5% (95% CI 99.05-99.78)

Outcome measure-5

Inconclusive results

US only

N=77 (3.4%)

Author’s conclusion

A staged algorithm of US and unenhanced MR imaging for

pediatric appendicitis appears to be effective.

Epifanio, 2016

Type of study: prospective cohort study

Setting: general university hospital

Country: Brazil

Conflicts of interest: not reported

Inclusion criteria: patients admitted to the pediatric emergency department of the hospital for suspected

appendicitis.

Exclusion criteria: patients who had previously undergone appendectomy.

N=166

Prevalence: 47% in study population

Mean age ± SD: 9.15 (2.78)

Sex: 57% M / 43% F

Describe index test:

A staged imaging algorithm with clinical evaluation + US + MRI + clinical observation for 24 hours

166 received clinical evaluation

102 US of whom 8 received a MRI

Comparator test: not applicable

Describe reference test:

Pathological findings in patients who underwent surgery or 30-day clinical follow-up in patients who did not need to undergo surgery.

Time between the index test and reference test: max. 30-days

For how many participants were no complete outcome data available?

Not described

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1

Sensitivity

96.1% (95% CI 89.9-99.0)

Outcome measure-2

Specificity

100% (95% CI 96.7-100)

Outcome measure-3

PPV

100% (95% CI 96.1-100)

Outcome measure-4

NPV

96.7% (95% CI 91.3-99.2)

Outcome measure-5

Inconclusive results

N=8 (4.8%) after US

N= 5 (3%) after US+MRI

N=0 after clinical observation

Author’s conclusion

In the vast majority of cases the correct diagnosis was reached by clinical and US examinations. When clinical assessment and US findings were inconclusive, MRI was useful to detect normal and abnormal appendixes and valuable to rule out other abdominal pathologies that mimic appendicitis.

Thirumoorthi, 2012

Type of study: retrospective cohort study

Setting: a university and a city medical center

Country: USA

Conflicts of interest: not reported

Inclusion criteria:

age less than 18 years, US evaluation during study time period, and all studies performed at two urban pediatric centers.

Exclusion criteria: -

N=802 of whom N=275 are diagnosed by protocol and included for this research question.

Prevalence: 45.8%

Mean age ± SD: 10.9 (4.1)*

Sex: 54% M / 46% F*

* Of the 802 patients

Describe index test:

US as the initial imaging modality followed by CT for non-diagnostic US studies in patients with an equivocal clinical presentation

197 received US only

78 received US + CT

CT scans were performed

with oral and intravenous contrast.

Comparator test: not applicable

Describe reference test:

Surgery or

patients discharged without the diagnosis of appendicitis: short telephone interview of the study participant's parent/guardian

was conducted to determine post-discharge outcomes.

Time between the index test and reference test:

Not described

For how many participants were no complete outcome data available?

250 (39.7%)*

Reasons for incomplete outcome data described?

Not reached.

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1

Sensitivity

94.2%

Outcome measure-2

Specificity

97.5%

Outcome measure-3

PPV

95.2%

Outcome measure-4

NPV

97%

Author’s conclusion

US followed by selective CT for the diagnosis of acute appendicitis is useful and accurate. This has important implications in the reduction of childhood radiation exposure.

Krishnamoorthi, 2011

Type of study: retrospective cohort study

Setting: suburban pediatric emergency

department

Country: USA

Conflicts of interest: 1 author received money for expert testimony in a case involving a neonate, no other conflicts of interest.

Inclusion criteria:

all patients 18 years of age and younger who presented to the

pediatric emergency department during

the 6-year study period (January 2003

to December 2008) and for whom US

and/or CT were ordered to rule out acute

appendicitis.

Exclusion criteria: (a) surgical intervention was performed

on the basis of clinical criteria

alone,

(b) patients were referred to our

site after CT had been performed at an outside institution,

records were not available, or

(d) CT could not be performed (eg, owing to pregnancy or patient and/or parent refusal).

N= 1228 patients of whom 631 (51.3%) underwent imaging according to the pathway guidelines

and were considered to be compliant

with the staged imaging pathway.

Prevalence: 45.8%

Mean age: 10.44 years (range 2 months to 18 years)

Sex: 45.5% M / 54.5% F

Describe index test:

Staged US and CT, CT is not performed

if the US scan is definitively positive or negative for appendicitis.

CT was performed with intravenous contrast material. No rectal contrast material

was used. Oral contrast material was used in a minority of patients.

Comparator test: not applicable

US without CT: n=333

US (equivocal) + CT: n=298

Describe reference test:

Outcome was based on surgical

pathology results for patients who

underwent surgery and on clinical outcome for those who did not. The latter category included cases of missed appendicitis indicated by re-admission and subsequent appendicitis diagnosis.

Time between the index test and reference test:

Not reported

For how many participants were no complete outcome data available?

Not reported

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1

Sensitivity

98.6% (95% CI 96-100)

Outcome measure-2

Specificity

90.6% (95% CI 87-93)

Outcome measure-3

PPV

99.2%

Outcome measure-4

NPV

84.6%

Author’s conclusion

A staged US and CT imaging protocol in which US is performed first in children suspected of having acute appendicitis is highly accurate and offers the opportunity to

substantially reduce radiation.

Kinner, 2017

Type of study: prospective cohort study

Setting:.

Country:

Conflicts of interest:

Inclusion criteria:

12–20 years old and had a CT ordered by the emergency department treatment team because of clinical concern for possible appendicitis

Exclusion criteria: standard contraindications

to MRI (metallic implants, claustrophobia) or gadolinium-based contrast agents or the inability to

provide informed consent or assent.

N=48

Prevalence: 27%

Mean age ± SD: 17.1 ± 2.46 years

Sex: 41.7% M / 58.3% F

Describe index test: CT

All patients received IV iodinated contrast material (Omnipaque 300, GE Healthcare); CT images were then acquired in the portal venous phase.

Comparator test: MRI (contrast-enhanced and unenhanced MRI)

Within 2 hours of completing CT, patients underwent research MRI

Cut-off point(s): Radiologists rated

the likelihood of acute appendicitis on a 5-point Likert scale (1, definitely no appendicitis; 2, probably

no appendicitis; 3, possible appendicitis or unsure; 4, probably appendicitis; 5, definitely appendicitis). A score of 4 (probably

appendicitis) or 5 (definitely appendicitis) was considered a positive test result, whereas a score of less than 4 (1, definitely no appendicitis; 2, probably no appendicitis; 3, possible appendicitis or unsure) was considered a negative test result for the presence of appendicitis.

CT and MR images were interpreted by each radiologist at different times to ensure that interpretation of one

imaging type (MRI vs CT) was not influenced by the appearance of the other. Though MRI sequences

(contrast-enhanced and unenhanced MRI) were read at the same time, radiologists were asked to first interpret unenhanced MRI using the data reporting form and then to complete another data reporting

form for contrast-enhanced MRI to ascertain whether contrast enhancement was useful for

rendering an interpretation. DWI was included in the unenhanced MRI sequences.

Describe reference test:

To determine the ground truth with regard to the presence of appendicitis, a trained data abstracter reviewed the electronic medical record of all patients enrolled. In patients who underwent

appendectomy, findings from all surgical and pathologic reports were abstracted. For those who did not undergo appendectomy, data from all follow-up visits were abstracted to determine whether the patient subsequently received a diagnosis of

appendicitis or another cause for their symptoms. Additionally, these patients underwent a follow-up

telephone interview 1 month after their index emergency department encounter using a standard

script. The purpose of the telephone interview was to assess whether patients were evaluated for the

same symptoms subsequent to the index encounter, underwent interval appendectomy, or received a diagnosis of another cause for their abdominal pain. In addition, three of the nonreader authors (two radiologists and an emergency physician) served as an expert panel to review all abstracted data and render a determination regarding the

ground truth (appendicitis or not) for each patient, which served as the reference standard.

Time between the index test and reference test:

1 month

For how many participants were no complete outcome data available?

Not reported

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1

Sensitivity

CT 93.6 (95% CI 85.6-97.9)

Unenhanced MRI 85.9 (95% CI 76.2–92.7)

Contrast-enhanced MRI 93.6 (95% CI 85.6–97.9)

Outcome measure-2

Specificity

CT 94.3 (95% CI 90.2-97)

Unenhanced MRI 93 (95% CI 89.7–96.7)

Contrast-enhanced MRI 94.3 (95% CI 90.2–97)

Outcome measure-3

PPV

CT 85.9 (95% CI 76.6-92.5)

Unenhanced MRI 83.8 (95% CI 73.8–91.1)

Contrast-enhanced MRI 85.9 (95% CI 76.6–92.5)

Outcome measure-4

NPV

CT 97.5 (95% CI 94.4–99.2)

Unenhanced MRI 94.7 (95% CI 90.7–97.3)

Contrast-enhanced MRI 94.4 (95% CI 94.4–99.2)

Author’s conclusion

The diagnostic accuracy of MRI to diagnose appendicitis was very

similar to CT. No statistically significant difference in accuracy was observed between imaging

modality or radiologist subspecialty.

Aspelund, 2014

Type of study: retrospective cohort study

Setting: Gudrun Aspelund, MD, Division of Pediatric Surgery, Morgan Stanley Children’s Hospital

Country: USA

Conflicts of interest: The authors have indicated they have no potential conflicts of interest to disclose.

Inclusion criteria: pediatric patients (aged,18 years), who presented to our emergency department (ED) from November 1, 2008 until October 31, 2012. All patients who had a CT, ultrasonography, or MRI ordered in the ED for abdominal pain were identified using a query of the

electronic medical record and a Radiology Department database. All charts

of patients undergoing appendectomy

during the same period were obtained

from operating room case logs.

Exclusion criteria: patients who were aged ≥18 years; who had imaging performed for

specific questions, based on chart review, that did not include appendicitis;

or who had initial diagnostic imaging

performed elsewhere.

Mainly CT (November 2008 through October 2010), n=265;

Mainly US+MRI (November 2010 through

October 2012) n=397

Prevalence: CT 51%; US+MRI 41%

Mean age ± SD: CT 12 (4.5); US+MRI 12.3 (4.7)

Sex:

CT 37.7% M; US+MRI 40.1% M

Describe index test: CT

CT scans were performed after the administration of oral and intravenous contrast material on a 16-slice General Electric Lightspeed scanner (General Electric, Fairfield, CT) using a weight-based technique. Each patient

drank a weight-based amount of a 2% diatrizoate meglumine solution 1

hour before the scan. Standard dose of 2 mL/kg Omnipaque 200 was administered intravenously. Imaging parameters included 25-cm field of view, slice thickness of 2.5 mm, interval of 1.5 mm, and pitch of 1.3 with a rotation time of 0.5 seconds.

Comparator test: US+MRI

Ultrasounds of the right lower quadrant were performed on a GE LOGIQ E9 scanner using graded compression technique with a linear transducer (ML6-15 for smaller children and 9L for larger children) by

both pediatric and general sonographers. The sonographers’ experience varied from newly hired generalists with minimal experience to those with many years of dedicated pediatric experience. All MRI was carried out on nonsedated patients on a 1.5-T MRI system using an 8-channel array torso coil (Signa HDxt, GE Healthcare, Milwaukee, WI). T2-weighted singleshot fast spin echo in the axial, sagittal, and coronal planes, axial and coronal balanced steady-state free precession, axial T1-weighted fatsuppressed

precontrast, and axial and coronal T1-weighted fat-suppressed

postcontrast sequences were obtained. Post contrast images were

acquired using intravenous gadobenate dimeglumine with a weight-based dose of 0.2 mL/kg. All imaging was carried out in supine positioning without the use

of oral contrast or bowel motility stasis agent. All patients received intravenous contrast as per protocol.

Cut-off point(s): CT and MRI were read as negative if there were no signs of appendicitis (visualization of

normal appendix or no secondary signs of inflammation in region of cecum and terminal ileum). Ultrasonography was read as negative only if a normal appendix was seen. Ultrasonography studies were defined as equivocal if the appendix was not visualized or the study showed a phlegmon or abscess indicating complicated appendicitis.

Describe reference test:

Negative appendectomy

rate, delineated by appendiceal pathologic evaluation without signs of appendicitis, and perforation rate, defined as complicated appendicitis by pathology among those who underwent appendectomy, were primary outcomes.

Time between the index test and reference test:

Unclear

For how many participants were no complete outcome data available?

Unclear

CT group:

CT: n=224

US: n=40, followed by CT n=21 or MRI =3

MRI: n=1

US/MRI group:

US: n=365, followed by MRI n= 142 or CT n=34

CT: n=20

MRI: n=12

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1

Sensitivity

CT: 100% (95% CI 97–100)

US+MRI: 100% (95% CI 97–100)

Outcome measure-2

Specificity

CT: 98% (95% CI 93–99)

US+MRI: 99% (95% 97–100)

Outcome measure-3

PPV

CT: 98 (95% CI 93–99)

US+MRI: 99 (95% 95–100)

Outcome measure-4

NPV

CT: 100 (95% CI 96–100)

US+MRI: 100 (95% CI 98–100)

Author’s conclusion

In children with suspected acute appendicitis, a radiation free

diagnostic imaging of ultrasonography selectively followed by MRI is feasible and comparable to CT, with no difference in time to antibiotic administration, time to appendectomy, negative appendectomy rate, perforation rate, or length of stay.

Verantwoording

Beoordelingsdatum en geldigheid

Laatst beoordeeld : 01-07-2019

Module	Regiehouder(s)	Jaar van autorisatie	Eerstvolgende beoordeling actualiteit richtlijn	Frequentie van beoordeling op actualiteit	Wie houdt er toezicht op actualiteit	Relevante factoren voor wijzigingen in aanbeveling
Diagnostiek bij kinderen	NVvH en NVvR	2019	2024	Eens in de 5 jaar	NVvH en NVvR	-

Voor het beoordelen van de actualiteit van deze richtlijn is de werkgroep niet in stand gehouden. Uiterlijk in 2024 bepaalt het bestuur van de Nederlandse Vereniging voor Heelkunde of de modules van deze richtlijn nog actueel zijn. Op modulair niveau is een onderhoudsplan beschreven. Bij het opstellen van de richtlijn heeft de werkgroep per module een inschatting gemaakt over de maximale termijn waarop herbeoordeling moet plaatsvinden en eventuele aandachtspunten geformuleerd die van belang zijn bij een toekomstige herziening (update). De geldigheid van de richtlijn komt eerder te vervallen indien nieuwe ontwikkelingen aanleiding zijn een herzieningstraject te starten.

De Nederlandse Vereniging voor Heelkunde is regiehouder van deze richtlijn en eerstverantwoordelijke op het gebied van de actualiteitsbeoordeling van de richtlijn. De andere aan deze richtlijn deelnemende wetenschappelijke verenigingen of gebruikers van de richtlijn delen de verantwoordelijkheid en informeren de regiehouder over relevante ontwikkelingen binnen hun vakgebied.

Initiatief en autorisatie

Initiatief:

Nederlandse Vereniging voor Heelkunde

Geautoriseerd door:

Nederlandse Vereniging van Spoedeisende Hulp Artsen
Nederlandse Vereniging voor Heelkunde
Nederlandse Vereniging voor Kindergeneeskunde
Nederlandse Vereniging voor Medische Microbiologie
Nederlandse Vereniging voor Obstetrie en Gynaecologie
Nederlandse Vereniging voor Pathologie
Nederlandse Vereniging voor Radiologie
Patiëntenfederatie Nederland

Algemene gegevens

De richtlijnontwikkeling werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten (https://www.demedischspecialist.nl/kennisinstituut) en werd gefinancierd uit de Kwaliteitsgelden Medisch Specialisten (SKMS). De financier heeft geen enkele invloed gehad op de inhoud van de richtlijn.

Doel en doelgroep

Doel

Deze richtlijn is bedoeld om een evidence-based beleid voor de zorg voor patiënten met acute appendicitis in de tweede op te stellen.

Doelgroep

Deze richtlijn is geschreven voor alle leden van de beroepsgroepen die betrokken zijn bij de zorg voor patiënten met acute appendicitis, zowel bij kinderen als bij volwassenen. Dit zijn onder andere chirurgen, kinderchirurgen, radiologen, kinderartsen, gynaecologen en SEH-artsen. Een secundaire doelgroep zijn zorgverleners uit de eerste lijn die betrokken zijn bij de zorg rondom patiënten met acute appendicitis, waaronder de huisarts, verpleegkundig specialist en physician assistants.

Samenstelling werkgroep

Voor de herziening van de richtlijn is in 2017 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen die betrokken zijn bij de zorg voor patiënten met acute appendicitis te maken hebben.

Werkgroep:

Dr. C.C. van Rossem, gastro-intestinaal chirurg, werkzaam in Maasstad Ziekenhuis, namens NVvH (voorzitter)
Drs. A.L. van den Boom, fellow gastro-intestinale chirurgie, werkzaam in het UMCG, namens NVvH
Drs. W.J. Bom, arts-onderzoeker chirurgie, werkzaam in Amsterdam UMC locatie AMC, namens NVvH
Drs. M.E. Bos, arts in opleiding, werkzaam in Spoedeisende Geneeskunde regio VUmc, locatie Westfriesgasthuis, namens NVSHA
Dr. A.A.W. van Geloven, gastro-intestinaal chirurg, werkzaam in Tergooi, namens NVvH
Dr. R.R. Gorter, fellow kinderchirurgie, werkzaam in Amsterdam UMC, namens NVvH
Dr. B.C. Jacod, gynaecoloog-perinatoloog, werkzaam in OLVG, namens NVOG
Drs. M. Knaapen, arts-onderzoeker kinderchirurgie, werkzaam in Amsterdam UMC, namens NVvH
R. Lammers, MSc, beleidsadviseur, werkzaam voor de Patiëntenfederatie Nederland
Drs. A.H.J. van Meurs, algemeen kinderarts, werkzaam in HagaZiekenhuis, namens NVK
Dr. J. Nederend, radioloog, werkzaam in Catharina Ziekenhuis Eindhoven, namens NVvR
Dr. J.B.C.M. Puylaert, radioloog, werkzaam in Haaglanden Medisch Centrum, namens NVvR

Samenstelling klankbordgroep:

Dr. A.K. van der Bij, arts-microbioloog, werkzaam in Diakonessenhuis, NVMM
Dr. R. Bakx, kinderchirurg, werkzaam in Amsterdam UMC, namens NVvH

Met ondersteuning van:

Dr. S.N. Hofstede, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
L. Boerboom MSc, literatuurspecialist, Kennisinstituut van de Federatie Medisch Specialisten
D.M.J. Tennekes, directiesecretaresse, Kennisinstituut van de Federatie Medisch Specialisten

Belangenverklaringen

De KNMG-code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoek financiering) of indirecte belangen (persoonlijke relaties, reputatiemanagement, kennisvalorisatie) hebben gehad. Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

Werkgroeplid	Functie	Nevenfuncties	Gemelde belangen	Ondernomen actie
Van Rossem	Gastro-intestinaal chirurg, Maasstad Ziekenhuis	Geen	Geen	Geen actie
Van Geloven	Gastro-intestinaal chirurg, Tergooi	Geen	Geen	Geen actie
Gorter	Fellow Kinderchirurgie Amsterdam UMC	Onderzoeker kinderchirurgie Vumc & AMC	Projectleider APAC-studie Non-operatieve behandeling van appendicitis bij kinderen. ZonMw Dossiernummer: 843002708	Geen actie
Van Meurs	Algemeen kinderarts, Juliana Kinderziekenhuis (HagaZiekenhuis)	Onderwijs aan studenten geneeskunde LUMC	Geen	Geen actie
Jacod	Gynaecoloog, Radboud UMC	Secretaris werkgroep Samenwerking Obstetrie-Anesthesiologie, NVOG-NVA, onbetaald	Geen	Geen actie
Puylaert	Radioloog HMC	Geen	Geen	Geen actie
Nederend	Radioloog Catharina Ziekenhuis Eindhoven	Screeningsradioloog Bevolkingsonderzoek, betaald Secretaris Sectie Abdominale Radiologie, NVvR, onbetaald	Onderzoek naar de waarden van MRI bij PIPAC-behandeling, deels gefinancieerd (unresticted grant) door Bracco Imaging Europe B.V.	Geen actie
Bos	AIOS Spoedeisende Geneeskunde regio Vumc, locatie Westfriesgasthuis	Algemeen lid congrescommissie NVSHA - onbetaald	Geen	Geen actie
Van den Boom	fellow gastro-intestinale chirurgie	Geen	Principal investigator van APPIC trial (short versus long antibiotic treatment after appendectomy for complex appendicitis), gefinancierd door ZonMw ontvangen (Goed Gebruik Geneesmiddelen)	Geen actie
Bom	Arts-onderzoeker chirurgie, AMC	Geen	Ik word betaald vanuit de EPOCH studie, gefinancieerd door ZonMw. Dit is een RCT naar het voorkomen van wondinfecties. Dit is op geen enkele wijze gelieerd aan de richtlijn appendicitis. Derhalve heb ik geen belangen bij extern gefinancierd onderzoek.	Geen actie
Knaapen	Arts-onderzoeker kinderchirurgie Amsterdam UMC	Geen	Coördinerend onderzoeker APAC-studie Non-operatieve behandeling van appendicitis bij kinderen. ZonMw Dossiernummer: 843002708	Geen actie
Lammers	Beleidsadviseur, Patiëntenfederatie	Geen	Geen	Geen actie
Hofstede	Adviseur, Kennisinstituut van de Federatie Medisch Specialisten	Geen	Geen	Geen actie
Van Enst	Senior adviseur, Kennisinstituut van de Federatie Medisch Specialisten	Lid van de GRADE working group/ Dutch GRADE Network	Geen	Geen actie

Klankbordgroeplid	Functie	Nevenfuncties	Gemelde belangen	Ondernomen actie
Van der Bij	Arts-microbioloog Diakonessenhuis Utrecht/MSBD	Voorzitter commissie kwaliteitsbeheersing NVMM, onbetaald	Geen	Geen actie
Bakx	Kinderchirurg, Kinderchirurgisch centrum Amsterdam	Voorzitter richtlijnencommissie NVvH, onbetaald, bestuurslid Stichting spoedeisende hulp bij kinderen, onbetaald, APLS instructeur, onbetaald	Principal investigator APAC-studie Non-operatieve behandeling van appendicitis bij kinderen. ZonMw Dossiernummer: 843002708	Geen actie

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door een afgevaardigde patiëntenvereniging in de werkgroep op te nemen. De conceptrichtlijn is tevens voor commentaar voorgelegd aan de Patiëntenfederatie.

Methode ontwikkeling

Evidence based

Implementatie

In de verschillende fasen van de richtlijnontwikkeling is rekening gehouden met de implementatie van de richtlijn (module) en de praktische uitvoerbaarheid van de aanbevelingen. Daarbij is uitdrukkelijk gelet op factoren die de invoering van de richtlijn in de praktijk kunnen bevorderen of belemmeren. Het implementatieplan is te vinden bij de aanverwante producten. De werkgroep heeft tevens interne kwaliteitsindicatoren ontwikkeld om het toepassen van de richtlijn in de praktijk te volgen en te versterken (zie Indicatorontwikkeling).

Werkwijze

AGREE

Deze richtlijn is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010), dat een internationaal breed geaccepteerd instrument is. Voor een stap-voor-stap beschrijving hoe een evidence-based richtlijn tot stand komt wordt verwezen naar het stappenplan Ontwikkeling van Medisch Specialistische Richtlijnen van het Kennisinstituut van de Federatie Medisch Specialisten.

Knelpuntenanalyse

Tijdens de voorbereidende fase inventariseerden de voorzitter van de werkgroep en de adviseur de knelpunten. De werkgroep beoordeelde de aanbevelingen uit de eerdere richtlijn (NVvH, 2010) op noodzaak tot revisie. Tevens werden stakeholders uitgenodigd voor een knelpuntenbijeenkomst (Invitational conference). Vanwege het lage aantal aanmeldingen (drie, IGZ, NVA en de Patiëntenfederatie) is de bijeenkomst geannuleerd. Gevraagd is schriftelijk op het raamwerk te reageren. Er zijn schriftelijk knelpunten aangedragen door NVKC, NVSHA, NVvH, NVZ en V&VN. Een verslag hiervan is opgenomen onder aanverwante producten. De werkgroep stelde vervolgens een long list met knelpunten op en prioriteerde de knelpunten op basis van: (1) klinische relevantie, (2) de beschikbaarheid van (nieuwe) evidence van hoge kwaliteit, (3) en de te verwachten impact op de kwaliteit van zorg, patiëntveiligheid en (macro)kosten.

Uitgangsvragen en uitkomstmaten

Op basis van de uitkomsten van de knelpuntenanalyse zijn door de voorzitter en de adviseur concept-uitgangsvragen opgesteld. Deze zijn met de werkgroep besproken waarna de werkgroep de definitieve uitgangsvragen heeft vastgesteld. Vervolgens inventariseerde de werkgroep per uitgangsvraag welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

Strategie voor zoeken en selecteren van literatuur

Er werd eerst oriënterend gezocht naar bestaande buitenlandse richtlijnen, systematische reviews (Medline (OVID)), en literatuur over patiëntvoorkeuren (patiëntenperspectief; Medline (OVID)). Vervolgens werd voor de afzonderlijke uitgangsvragen werd aan de hand van specifieke zoektermen gezocht naar gepubliceerde wetenschappelijke studies in (verschillende) elektronische databases. Tevens werd aanvullend gezocht naar studies aan de hand van de literatuurlijsten van de geselecteerde artikelen. In eerste instantie werd gezocht naar studies met de hoogste mate van bewijs. De werkgroepleden selecteerden de via de zoekactie gevonden artikelen op basis van vooraf opgestelde selectiecriteria. De geselecteerde artikelen werden gebruikt om de uitgangsvraag te beantwoorden. De databases waarin is gezocht, de zoekstrategie en de gehanteerde selectiecriteria zijn te vinden in de module met desbetreffende uitgangsvraag. De zoekstrategie voor de oriënterende zoekactie en patiëntenperspectief zijn opgenomen onder aanverwante producten.

Kwaliteitsbeoordeling individuele studies

Individuele studies werden systematisch beoordeeld, op basis van op voorhand opgestelde methodologische kwaliteitscriteria, om zo het risico op vertekende studieresultaten (risk-of-bias) te kunnen inschatten. Deze beoordelingen kunt u vinden in de Risk-of-Bias (RoB) tabellen. De gebruikte RoB instrumenten zijn gevalideerde instrumenten die worden aanbevolen door de Cochrane Collaboration: AMSTAR – voor systematische reviews; Cochrane – voor gerandomiseerd gecontroleerd onderzoek; ACROBAT-NRS – voor observationeel onderzoek; QUADAS II – voor diagnostisch onderzoek.

Samenvatten van de literatuur

De relevante onderzoeksgegevens van alle geselecteerde artikelen werden overzichtelijk weergegeven in evidencetabellen. De belangrijkste bevindingen uit de literatuur werden beschreven in de samenvatting van de literatuur. Bij een voldoende aantal studies en overeenkomstigheid (homogeniteit) tussen de studies werden de gegevens ook kwantitatief samengevat (meta-analyse) met behulp van Review Manager 5.

Beoordelen van de kracht van het wetenschappelijke bewijs

A) Voor interventievragen (vragen over therapie of screening)

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/).

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie (Schünemann, 2013).

GRADE	Definitie
Hoog	Er is hoge zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; het is zeer onwaarschijnlijk dat de literatuurconclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Redelijk*	Er is redelijke zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; het is mogelijk dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Laag	Er is lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; er is een reële kans dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Zeer laag	Er is zeer lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; De literatuurconclusie is zeer onzeker.

*in 2017 heeft het Dutch GRADE Network bepaalt dat de voorkeursformulering voor de op een na hoogste gradering ‘redelijk’ is in plaats van ‘matig’

B) Voor vragen over diagnostische tests, schade of bijwerkingen, etiologie en prognose

De kracht van het wetenschappelijke bewijs werd eveneens bepaald volgens de GRADE-methode: GRADE-diagnostiek voor diagnostische vragen (Schünemann, 2008), en een generieke GRADE-methode voor vragen over schade of bijwerkingen, etiologie en prognose. In de gehanteerde generieke GRADE-methode werden de basisprincipes van de GRADE-methodiek toegepast: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van bewijskracht op basis van de vijf GRADE-criteria (startpunt hoog; downgraden voor risk-of-bias, inconsistentie, indirectheid, imprecisie, en publicatiebias).

Formuleren van de conclusies

Voor elke relevante uitkomstmaat werd het wetenschappelijk bewijs samengevat in een of meerdere literatuurconclusies waarbij het niveau van bewijs werd bepaald volgens de GRADE-methodiek. De werkgroepleden maakten de balans op van elke interventie (overall conclusie). Bij het opmaken van de balans werden de gunstige en ongunstige effecten voor de patiënt afgewogen. De overall bewijskracht wordt bepaald door de laagste bewijskracht gevonden bij een van de cruciale uitkomstmaten. Bij complexe besluitvorming waarin naast de conclusies uit de systematische literatuuranalyse vele aanvullende argumenten (overwegingen) een rol spelen, werd afgezien van een overall conclusie. In dat geval werden de gunstige en ongunstige effecten van de interventies samen met alle aanvullende argumenten gewogen onder het kopje 'Overwegingen'.

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals de expertise van de werkgroepleden, de waarden en voorkeuren van de patiënt (patient values and preferences), kosten, beschikbaarheid van voorzieningen en organisatorische zaken. Deze aspecten worden, voor zover geen onderdeel van de literatuursamenvatting, vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’.

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk. De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen.

Randvoorwaarden (Organisatie van zorg)

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijn is expliciet rekening gehouden met de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, menskracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van een specifieke uitgangsvraag maken onderdeel uit van de overwegingen bij de bewuste uitgangsvraag.

Indicatorontwikkeling

Gelijktijdig met het ontwikkelen van de conceptrichtlijn werden er interne kwaliteitsindicatoren ontwikkeld om het toepassen van de richtlijn in de praktijk te volgen en te versterken. Meer informatie over de methode van indicatorontwikkeling is op te vragen bij het Kennisinstituut van de Federatie Medisch Specialisten (secretariaat@kennisinstituut.nl).

Kennislacunes

Tijdens de ontwikkeling van deze richtlijn is systematisch gezocht naar onderzoek waarvan de resultaten bijdragen aan een antwoord op de uitgangsvragen. Bij elke uitgangsvraag is door de werkgroep nagegaan of er (aanvullend) wetenschappelijk onderzoek gewenst is om de uitgangsvraag te kunnen beantwoorden. Een overzicht van de onderwerpen waarvoor (aanvullend) wetenschappelijk van belang wordt geacht, is als aanbeveling in de Kennislacunes beschreven (onder aanverwante producten).

Commentaar- en autorisatiefase

De conceptrichtlijn werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijn aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijn werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

Literatuur

Brouwers MC, Kho ME, Browman GP, et al. AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348.

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. Link: https://richtlijnendatabase.nl/over_deze_site/richtlijnontwikkeling.html

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

Schünemann HJ, Oxman AD, Brozek J, et al. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ. 2008;336(7653):1106-10. doi: 10.1136/bmj.39500.677199.AE. Erratum in: BMJ. 2008;336(7654). doi: 10.1136/bmj.a139. PubMed PMID: 18483053.

Wessels M, Hielkema L, van der Weijden T. How to identify existing literature on patients' knowledge, views, and values: the development of a validated search filter. J Med Libr Assoc. 2016 Oct;104(4):320-324. PubMed PMID: 27822157; PubMed Central PMCID: PMC5079497.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Acute appendicitis

Acute appendicitis

Uitgangsvraag

Aanbeveling

Overwegingen

Onderbouwing

Achtergrond

Conclusies / Summary of Findings

Samenvatting literatuur

Zoeken en selecteren

Referenties

Evidence tabellen

Verantwoording

Beoordelingsdatum en geldigheid

Initiatief en autorisatie

Algemene gegevens

Doel en doelgroep

Samenstelling werkgroep

Belangenverklaringen

Inbreng patiëntenperspectief

Methode ontwikkeling

Implementatie

Werkwijze

Zoekverantwoording

Bijlagen

De Federatie Medisch Specialisten maakt gebruik van cookies