Tumormarkers bij een vergroot ovarium

Beoordeeld: 11-03-2021

Uitgangsvraag

Wat is de diagnostische waarde van human epididymis protein 4 (HE4) vergeleken met carbohydrate antigen 125 (CA 125) voor differentiatie tussen benigne en maligne adnex pathologie?

Aanbeveling

Aanbeveling 1

Verkies CA 125 boven HE4 of ROMA bij de differentiatie tussen benigne en maligne adnexpathologie bij vrouwen met een vergroot ovarium en een indicatie om serum biomarkers te bepalen.

Aanbeveling 2

Aanbeveling-subgroep vrouwen waarbij CA 125 onbetrouwbaar is

Overweeg om HE4 te bepalen voor het differentiëren tussen benigne en maligne adnexpathologie bij vrouwen met een vergroot ovarium en waarbij CA 125 onbetrouwbaar is, zoals zwangere vrouwen, vrouwen met endometriose, ascites of bij peritoneale prikkeling.

Overwegingen

De onderstaande overwegingen gelden in principe voor het overgrote deel van de patiëntenpopulatie waarop de uitgangsvraag betrekking heeft. Voor de subgroep ‘vrouwen waarbij CA 125 onbetrouwbaar is’ zijn echter aanvullende overwegingen van belang. Deze afwijkende en/of aanvullende overwegingen worden bij de betreffende aspecten expliciet benoemd. Voor deze subgroep is een afzonderlijke aanbeveling geformuleerd.

Voor- en nadelen van de interventie en de kwaliteit van het bewijs

Over het algemeen werd er geen verschil gevonden tussen de diagnostische accuratesse van HE4 of ROMA vergeleken met CA 125. Dit kwam doordat de gerapporteerde ranges van de uitkomsten elkaar overlapten. Het was niet mogelijk in deze literatuuranalyse de data te poolen en vervolgens statistisch te toetsen op verschillen, wegens gebrek aan originele data uit de geïncludeerde studies. Het is goed hierbij op te merken dat in de meta-analyse van Ferraro (2013) er wordt geconcludeerd op basis van de meta-analyse dat HE4 een significant hogere specificiteit (gepoold: 93% (95%BI 92 tot 94%)) heeft dan CA 125 (gepoold: 79% (95%BI 77 tot 82%)). Echter, overeenkomstig met onze onderstaande overwegingen, concludeert Ferraro (2013) ook dat door het ontbreken van studies naar HE4 in de beoogde setting (evaluatie in een algemeen ziekenhuis) en de zeer grote diversiteit van de beschikbare literatuur de werkelijke toegevoegde waarde van HE4 niet duidelijk is.

In de literatuuranalyse werden alle uitkomsten zowel voor alle vrouwen (bij wie de menopauzale status niet gespecificeerd was) als apart voor pre- en postmenopauzale vrouwen beschreven. Echter, in vier situaties werd een mogelijk verschil gevonden in de diagnostische accuratesse van de tumormarkers. Bij premenopauzale vrouwen lijkt CA 125 (range 91 tot 95%) een hogere sensitiviteit te hebben, vergeleken met HE4 (range 62 tot 84%) of ROMA (range 67 tot 84%). Daarnaast lijkt bij premenopauzale vrouwen CA 125 (range 99 tot 100%) een vergelijkbare negatief voorspellende waarde te hebben met HE4 (range 97,7 tot 98%) of ROMA (range 94 tot 98%).

Verder lijkt bij vrouwen bij wie de menopauzale status niet gespecificeerd was HE4 (range 59 tot 79%) een betere positief voorspellende waarde te hebben vergeleken met CA 125 (range 30 tot 58%). Tot slot is er mogelijk bij vrouwen bij wie de menopauzale status niet gespecificeerd was ook een betere positieve likelihoodratio van HE4 (gepoolde positieve likelihoodratio: 13,01 (95%BI 8,2 tot 20,65)) vergeleken met CA 125 (gepoolde positieve likelihoodratio: 4,15 (95%BI 3,06 tot 5,62)).

De overall bewijskracht is gegradeerd als laag. De reden voor de lage bewijskracht is dat de geselecteerde literatuur een zeer grote diversiteit laat zien. Dit uit zich in het type ziekenhuis waar het onderzoek is uitgevoerd (in veel gevallen oncologische centra waar de primaire selectie niet plaatsvindt), de gebruikte afkapwaardes en het doel van de studie (diagnostische accuratesse, vaststellen optimale afkapwaardes) en de patiëntenpopulatie. Ook was het niet altijd duidelijk welke cystes werden geïncludeerd in de studies, waardoor de mogelijke inclusie van endometriose cystes, uniloculaire cystes en dermoïdcystes de resultaten kunnen vertroebelen. Dit leidt tot een situatie waarin er een kans is op selectie van patiënten voor de evaluatie en het gebruik van de marker en het tijdstip van evaluatie niet gelijk is aan het gebruik van tumormarkers in Nederland. Op dit ogenblik zijn er geen studies beschikbaar die de tumormakers evalueren in een algemeen ziekenhuis. Dit maakt dat de bewijskracht voor de diagnostische accuratesse van CA 125, HE4 of ROMA voor het differentiëren tussen benigne en maligne adnex pathologie laag is.

Een maximale sensitiviteit zal het aantal patiënten dat onterecht in een algemeen ziekenhuis wordt behandeld beperken. Echter, dit leidt ook tot meer vals positieve resultaten, wat voor extra zorgen en onrust zorgt bij de patiënte. De consequenties van het onterecht doorsturen van patiënten naar een oncologisch centrum heeft potentieel ook negatieve consequenties ten aanzien van de kosten en de capaciteit van oncologische centra. Dit wil zeggen dat naast de sensitiviteit de specificiteit een belangrijke uitkomstmaat is. Met een hoge specificiteit zijn onterechte verwijzingen te beperken. De resultaten uit de literatuuranalyse bieden geen handvatten voor het maken van deze afweging, er is geen duidelijk verschil te zien in de diagnostische accuratesse van de ene tumormarker ten opzichte van de andere.

In sommige situaties kan er echter een voorkeur zijn voor het bepalen van bepaalde tumormarkers. Bij nierfunctiestoornissen gaat het HE4 omhoog en kan beter CA 125 worden bepaald. In de zwangerschap gaat CA 125 meer omhoog dan HE4 en geldt het omgekeerde (Han, 2012). Hierbij dient te worden opgemerkt dat bij zwangere vrouwen er met name voor de 13^e week en vanaf de bevalling tot enkele dagen hierna verhoogde CA 125 waardes kunnen worden gevonden (Han, 2012; Szecsi, 2014). Ook bij endometriose, ascites of peritoneale prikkeling kan HE4 ten opzichte van CA 125 uitkomst bieden bij twijfel over de aard van een cyste (Hallamaa, 2012). In situaties waar het CA 125 onbetrouwbaar is, kan overwogen worden om HE4 te bepalen wanneer dit een klinische consequentie heeft.

Op indicatie kunnen ook andere tumormarkers worden geprikt (zie tabel 1 in de Inleiding van deze module). Dit hoeft niet standaard bij iedereen te worden gedaan. Indien er twijfel is over de mogelijkheid van een kiemcel- of granulosaceltumor en het lokale laboratorium biedt de mogelijkheid, dan kan het afnemen van spijtserum worden overwogen. Hiermee kan achteraf nog een uitgangswaarde van een tumormarker worden bepaald.

Het is nog onduidelijk of moleculaire biomarkers, zoals circulerend tumor DNA, iets kunnen toevoegen aan de differentiatie tussen benigne en maligne cystes. Deze nieuwe markers worden nog niet in de reguliere patiëntenzorg toegepast, maar kunnen mogelijk in de toekomst leiden tot een verbetering van de diagnostiek. Op dit moment zijn er nog geen resultaten beschikbaar over de klinische toepasbaarheid en waarde van dit soort biomarkers bij diagnostiek naar een vergroot ovarium.

Een belangrijke kennislacune die naar voren komt uit de literatuuranalyse heeft betrekking tot de gehanteerde afkapwaardes. De bewijskracht van de resultaten uit de literatuuranalyse worden onder andere beperkt doordat de gehanteerde afkapwaardes verschillen ten opzichte van de Nederlandse situatie. In Nederland wordt voor de CA 125, onafhankelijk van de menopauzale status van de vrouw, 35kU/l aangehouden. Voor de HE4 wordt in Nederland aangehouden: < 41 jaar: < 60 pmol/L; 41 tot 60 jaar: < 75 pmol/L; en > 60 jaar: < 90 pmol/L. In de literatuuranalyse werd echter in alle studies voor HE4 één afkapwaarde aangehouden voor postmenopauzale vrouwen, terwijl in Nederland hier juist onderscheid wordt gemaakt op basis van leeftijd. Op dit moment wordt in Nederland voor het differentiëren tussen benigne en maligne adnexpathologie gebruik gemaakt van de standaard afkapwaardes, terwijl verschillende studies uit de literatuuranalyse suggereren dat bij een geoptimaliseerde afkapwaarde de diagnostische accuratesse verbetert. Het is dus een kennislacune wat de optimale afkapwaardes zijn voor de tumormarkers CA 125, HE4 en ROMA voor het differentiëren tussen benigne en maligne afwijkingen bij een vergroot ovarium.

Waarden en voorkeuren van patiënten (en eventueel hun verzorgers)

Voor het bepalen van HE4 of CA 125 is in beide gevallen een venapunctie nodig. Het meten van tumormarkers kan bijdragen aan het onderscheiden van benigne en maligne adnexpathologie en het kan helpen in de overweging om een patiënt in een algemeen ziekenhuis te behandelen of deze door te sturen naar een oncologisch centrum. Indien een patiënt ten onrechte verwezen wordt naar een oncologisch centrum wegens verdenking op een maligniteit (fout-positieve bevinding) kan dit extra zorgen en onrust bij patiënt veroorzaken. Anderzijds is er kans dat een patiënte tweemaal geopereerd moet worden indien zij ten onrechte niet verwezen wordt naar een oncologisch centrum (fout-negatieve bevinding). Tegen deze achtergrond kan het meten van een tumormarker meerwaarde hebben in de afweging waar een patiënt de meest optimale behandeling kan ontvangen.

Kosten (middelenbeslag)

De kosten voor het bepalen van CA 125 of HE4 verschillen niet, ook de tarieven die staan voor deze bepalingen zijn gelijk. Bij vervanging van de marker zal er geen significante impact zijn op de kosten voor maatschappij of ziekenhuis. Echter, veel laboratoria meten wel CA 125 routinematig maar niet HE4. De keuze om HE4 wel of niet op te nemen in de routine zal meestal op basis van aantallen worden genomen en de daarmee samenhangende kosten. HE4 wordt door enkele laboratoria in Nederland bepaald en aangeboden aan derden. Voor incidentele aanvragen kunnen laboratoria onderling deze dienstverlening bieden. Gezien er op basis van de geselecteerde literatuur geen aanpassing van de huidige praktijk kan worden aanbevolen, is er geen effect te verwachten op kosten.

Aanvaardbaarheid voor de overige relevante stakeholders

Er worden geen bezwaren van overige stakeholders verwacht.

Haalbaarheid en implementatie

Routinematige meting van HE4 beperkt zich op dit ogenblik in Nederland tot enkele centra. Indien er voor een patiënt een HE4 bepaald moet worden dan zal na afname in een lokaal laboratorium het materiaal moeten worden verstuurd. Gezien de testen die beschikbaar zijn op reguliere routine apparatuur zal deze monsterstroom naar verwachting geen negatieve consequenties hebben voor de laboratoria die HE4 bepalen. Er zijn in dit geval wel consequenties voor de logistiek (verzending, registratie, terugrapportage) en doorlooptijden van de diagnostiek. De totale kosten voor het bepalen van HE4 zullen hierdoor hoger liggen dan een lokaal uitgevoerde bepaling. Echter, gezien vanuit de literatuur de meting van HE4 alleen wordt aangeraden in situaties waarbij CA 125 onbetrouwbaar is zal dit naar verwachting nauwelijks effect hebben op de totale kosten van de diagnostiek.

Rationale/ balans tussen de argumenten voor en tegen de interventie

Aanbeveling-1

Op basis van de literatuur is er geen duidelijk voordeel van HE4 of ROMA ten opzichte van CA 125 voor het differentiëren tussen benigne en maligne adnexpathologie. Ook ten aanzien van de interventie zijn er geen voor- of nadelen voor de patiënt bij het bepalen van HE4 of ROMA ten opzichte van CA 125. Doordat meting van HE4 op dit ogenblik beperkt is tot enkele centra, met als gevolg dat doorlooptijden, logistiek en kosten bij uitbesteding van de diagnostiek hoger kunnen uitvallen ten opzichte van lokaal bepaalde CA 125, wordt aanbevolen om CA 125 te bepalen ter differentiatie tussen een benigne en maligne cyste bij vrouwen met een vergroot ovarium. Uitzondering voor het bepalen van HE4 worden hieronder in een aparte subgroep aanbeveling benoemd.

Aanbeveling-2

Aanbeveling-subgroep vrouwen waarbij CA 125 onbetrouwbaar is.

Op basis van de literatuur is het bekend dat bijvoorbeeld bij zwangere vrouwen, vrouwen met endometriose, ascites of peritoneale prikkeling CA 125 onbetrouwbaar kan zijn. Hierbij dient te worden opgemerkt dat bij zwangere vrouwen er met name voor de 13^e week en vanaf de bevalling tot enkele dagen hierna verhoogde CA 125 waardes kunnen worden gevonden. In deze situaties wordt verwacht dat HE4 een hogere specificiteit heeft dan CA 125. In deze situaties kan bepalen van HE4 een toegevoegde waarde hebben.

Onderbouwing

Achtergrond

Bij de diagnostiek van een vergroot adnex wordt onder andere gebruik gemaakt van de anamnese, gynaecologisch onderzoek, beeldvorming zoals (transvaginale) echoscopie en CT/MRI-scan en bepaling van tumormarkers. Deze gegevens geven een inschatting van het risico op maligniteit. Vaak worden de gegevens samengevoegd in diagnostische modellen. Op dit moment is CA 125 de meest gebruikte tumormarker, deze heeft echter een beperkte specificiteit voor het aantonen van een maligniteit en kan door bijvoorbeeld ascites, endometriose, peritoneale prikkeling of een infectie ook verhoogd zijn. Naast CA 125 zijn meerdere tumormarkers routinematig beschikbaar (tabel 1). In het kader van de diagnostiek bij ovarium pathologie is met name HE4 onderzocht als mogelijk alternatief voor CA 125. Risk of Ovarian Malignancy Algorithm (ROMA) is een algoritme waarmee op basis van HE4, CA 125 en de menopauzale status van de vrouw het risico op ovarium maligniteit kan worden voorspeld. Een verbetering van de sensitiviteit en specificiteit van tumormarkers kan een significante verbetering opleveren van de inschatting van het risico op maligniteit. Daarom wordt in deze module de diagnostische waarde van HE4 of ROMA (HE4 + CA 125) en CA 125 beschreven voor de differentiatie tussen benigne en maligne adnex pathologie.

Tabel 1 Overzicht meest gebruikte tumormarkers in Nederland bij diagnostiek vergroot ovarium

Tumormaker	Toepassing
CA 125*	Onder andere bij diagnostiek vergroot ovarium
CEA*	Bij sterke verdenking ovariumcarcinoom, om GE maligniteit minder waarschijnlijk te maken
CA19.9	Bij mucineuze tumoren, verdenking pancreas of colorectale maligniteit
AFP**	Bij verdenking op kiemceltumor
hCG**	Bij verdenking op kiemceltumor
Inhibine-b**	Bij verdenking op granulosaceltumor
CA15.3***	Bij verdenking op metastasen van mammacarcinoom
LDH**	Bij verdenking dysgerminoom

* Oncoline richtlijn ‘Epitheliaal Ovariumcarcinoom (2.2)’, 2018

** Oncoline richtlijn ‘Niet epitheliale maligniteiten van het ovarium (2.0)’, 2016

*** Oncoline richtlijn ‘Borstkanker (1.0)’, 2018

Conclusies / Summary of Findings

1. Sensitiviteit

Laag

GRADE

Bij vrouwen bij wie de menopauzale status niet gespecificeerd was lijkt er geen verschil te zijn in sensitiviteit tussen HE4 (range 50 tot 99%) of ROMA (range 56,7 tot 80%) vergeleken met CA 125 (range 65 tot 94%).

Bronnen: (Ferraro, 2013; Huy, 2018; Oranratanphan, 2018; Pitta, 2013)

Bij premenopauzale vrouwen lijkt CA 125 (range 91 tot 95%) een hogere sensitiviteit te hebben, vergeleken met HE4 (range 62 tot 84%) of ROMA (range 67 tot 84%).

Bij postmenopauzale vrouwen lijkt er geen verschil te zijn in sensitiviteit tussen HE4 (range 41 tot 91%) of ROMA (range 82 tot 91%) vergeleken met CA 125 (range 77 tot 91%).

Bronnen: (Huy, 2018; Liest, 2018; Oranratanphan, 2018; Stiekema, 2014)

2. Specificiteit

Laag

GRADE

Bij vrouwen bij wie de menopauzale status niet gespecificeerd was lijkt er geen verschil te zijn in specificiteit tussen HE4 (range 83 tot 99%) of ROMA (range 85 tot 87,9%) vergeleken met CA 125 (range 46 tot 94%).

Bronnen: (Ferraro, 2013; Huy, 2018; Oranratanphan, 2018; Pitta, 2013)

Bij premenopauzale vrouwen lijkt er geen verschil te zijn in specificiteit tussen HE4 (range 75 tot 100%) of ROMA (range 75 tot 100%) vergeleken met CA 125 (range 62 tot 77%).

Bij postmenopauzale vrouwen lijkt er geen verschil te zijn in specificiteit tussen HE4 (range 75 tot 97%) of ROMA (range 70 tot 97%) vergeleken met CA 125 (range 65 tot 90%).

Bronnen: (Huy, 2018; Liest, 2018; Oranratanphan, 2018; Stiekema, 2014)

3. Positief voorspellende waarde

Laag

GRADE

Bij vrouwen bij wie de menopauzale status niet gespecificeerd was lijkt HE4 (range 59 tot 79%) een betere positief voorspellende waarde te hebben vergeleken met CA 125 (range 30 tot 58%).

Bronnen: (Huy, 2018; Oranratanphan, 2018; Pitta, 2013)

Bij vrouwen bij wie de menopauzale status niet gespecificeerd was lijkt er geen verschil in positief voorspellende waarde te zijn tussen ROMA (range 39 tot 71%) vergeleken met CA 125 (range 30 tot 58%).

Bronnen: (Huy, 2018; Pitta, 2013)

Bij premenopauzale vrouwen lijkt er geen verschil te zijn in positief voorspellende waarde tussen HE4 (range 16 tot 67%) of ROMA (range 17 tot 49%) vergeleken met CA 125 (range 19 tot 20%).

Bij postmenopauzale vrouwen lijkt er geen verschil te zijn in positief voorspellende waarde tussen HE4 (range 46 tot 100%) of ROMA (range 47 tot 93%) vergeleken met CA 125 (range 46 tot 81%).

Bronnen: (Huy, 2018; Liest, 2018; Oranratanphan, 2018)

4. Negatief voorspellende waarde

Laag

GRADE

Bij vrouwen bij wie de menopauzale status niet gespecificeerd was lijkt er geen verschil te zijn in negatief voorspellende waarde tussen HE4 (range 80 tot 94%) of ROMA (range 80 tot 97%) vergeleken met CA 125 (range 81 tot 98%).

Bronnen: (Huy, 2018; Oranratanphan, 2018; Pitta, 2013)

Bij premenopauzale vrouwen lijkt CA 125 (range 99 tot 100%) een vergelijkbare negatief voorspellende waarde te hebben met HE4 (range 97,7 tot 98%) of ROMA (range 94 tot 98%).

Bij postmenopauzale vrouwen lijkt er geen verschil te zijn in de negatief voorspellende waarde tussen HE4 (range 75 tot 94%) of ROMA (range 91 tot 95%) vergeleken met CA 125 (range 87 tot 93%).

Bronnen: (Huy, 2018; Liest, 2018; Oranratanphan, 2018)

5. Likelihood ratio

Laag

GRADE

Mogelijk is er bij vrouwen bij wie de menopauzale status niet gespecificeerd was een betere positieve likelihoodratio van HE4 (gepoolde positieve likelihoodratio: 13,01 (95%BI 8,2 tot 20,65)) vergeleken met CA 125 (gepoolde positieve likelihoodratio: 4,15 (95%BI 3,06 tot 5,62)).

Bij vrouwen bij wie de menopauzale status niet gespecificeerd was lijkt er geen verschil te zijn in negatieve likelihoodratio tussen HE4 (gepoolde negatieve likelihoodratio: 0,23 (95%BI 0,19 tot 0,28)) vergeleken met CA 125 (0,27 (95%BI 0,23 tot 0,31)).

Bronnen: (Ferraro, 2013)

Samenvatting literatuur

Beschrijving studies

Ferraro (2013) verrichtte een systematische review en meta-analyse naar de diagnostische accuratesse van HE4 vergeleken met CA 125 bij vrouwen met een vergroot adnex. De search werd verricht in januari 2012 in de databases Medline en Embase. Daarnaast werden ook de referentielijsten van geïdentificeerde studies in de meta-analyse van Shuang (2012) gecontroleerd. Ferraro (2013) includeerde 16 studies (Abdel-Azeez, 2010; Anastasi, 2010; Bandiera, 2011; Chang, 2011; Escudero, 2011; Holcomb, 2011; Jacob, 2011; Huhtinen, 2009; Modarres-Gilani, 2011; Molina, 2011; Montagnana, 2011; Nolen, 2010; Park, 2012; Ruggeri, 2011; Van Gorp, 2011; Yip, 2011). De studie van Huhtinen (2009) wordt in de literatuuranalyse van deze module buiten beschouwing gelaten omdat er louter patiënten met ovariële endometriose werden geïncludeerd.

In totaal beschreven de 15 geïncludeerde studies 3775 vrouwen met een vergroot adnex waarin werd gekeken naar de diagnostische accuratesse van HE4 vergeleken met CA 125. Dit waren acht cross-sectionele cohortstudies (Anastasi, 2011; Bandiera, 2011; Chang, 2011; Molina, 2011; Nolen, 2010; Park, 2012; Ruggeri, 2011; Yip, 2011), 4 case-control studies (Abdel-Azeez, 2010; Escudero, 2011; Modarres-Gilani, 2011; Van Gorp, 2011) en 3 prospectieve klinische trials (Holcomb, 2011; Jacob, 2011; Montagnana, 2011). De prevalentie van ovariumcarcinoom varieerde van 15 tot 63% in de studies. Geen van de studies beschreef exact het type cyste dat was geïncludeerd.

Huy (2018) verrichte een cross-sectionele cohortstudie onder vrouwen met een klinisch gediagnosticeerde benigne of maligne ovariële tumor. Alle vrouwen waren opgenomen in een (vermoedelijk) oncologisch centrum voor de chirurgische behandeling van de ovariële tumor. Zwangere vrouwen, vrouwen met ovariële tumor in de voorgeschiedenis, primaire peritoneale of andere maligniteit werden geëxcludeerd. In totaal werden 277 vrouwen geïncludeerd, waarvan 247 met benigne tumoren (gemiddelde leeftijd onbekend; 15% was ≥ 50 jaar; 12% postmenopauzaal) en 30 vrouwen met epitheliaal ovariumcarcinoom (gemiddelde leeftijd onbekend; 63.3% was ≥ 50 jaar; 57% postmenopauzaal). De prevalentie van ovariumcarcinoom was daarmee 10,8% in de studie. Het type cyste werd niet beschreven in de studie.

Liest (2018) verrichte een prospectieve cohortstudie onder alle vrouwen met een massa in het kleine bekken van vermoedelijk ovariële oorsprong in een (vermoedelijk) oncologisch centrum en acht verwijzende (vermoedelijk) algemene ziekenhuizen. In totaal werden 784 vrouwen geïncludeerd, waarvan 611 vrouwen met benigne tumoren (50% postmenopauzaal), 144 vrouwen met epitheliaal ovarium carcinoom (81% postmenopauzaal) en 29 vrouwen met een andere maligniteit dan epitheliaal ovarium carcinoom. De prevalentie van ovariumcarcinoom was daarmee 18% in de studie. De gemiddelde leeftijd en het type tumor werd niet beschreven in de studie.

Oranratanphan (2018) verrichtte een prospectieve cohortstudie bij vrouwen met niet-functionele cystes > 3 cm die geopereerd werden. Het was onduidelijk of dit in een algemeen ziekenhuis of oncologisch centrum plaatsvond. Zwangere vrouwen, vrouwen met een eerdere ovariële tumor, primaire peritoneale maligniteit of andere maligniteit, vrouwen met een eerdere bilaterale oöforectomie of functionele cystes werden geëxcludeerd. In totaal werden 281 vrouwen geïncludeerd, waarvan 225 vrouwen met benigne tumoren en 56 vrouwen met maligne tumoren, bestaande uit 26 (9.2%) laag-stadium ovariumkanker, 25 hoog-stadium ovariumkanker en 5 met andere maligniteiten. De prevalentie van ovariumcarcinoom was daarmee 18% in de studie. De gemiddelde leeftijd was 44 jaar (SD 13) en 68 vrouwen waren postmenopauzaal (24%), deze gegevens werden niet per tumortype gerapporteerd. Het type cyste werd niet beschreven.

Pitta (2013) verrichte een cross-sectionele cohortstudie onder alle vrouwen met een vergroot adnex in een (vermoedelijk) oncologisch centrum. Zwangere vrouwen en vrouwen met eerdere operatie voor vergroot ovarium werden geëxcludeerd. In totaal werden 176 vrouwen geïncludeerd, waarvan 116 vrouwen met benigne tumoren (gemiddelde leeftijd 47,9 jaar (SD 17); 42% postmenopauzaal) en 60 vrouwen met ovariumcarcinoom (gemiddelde leeftijd 50,8 jaar (SD 21); 62% postmenopauzaal). De prevalentie van ovariumcarcinoom was daarmee 34% in de studie. Op basis van histologische typering werden de volgende tumoren beschreven:

benigne tumoren bestonden uit epitheliale ovariële tumoren (n=40 (35%)), kiemcel tumoren (n=28 (24%)), sex cord and stroma cell tumoren (n=20 (17%)) en benigne tumoren (n=28 (24%)). Maligne tumoren bestonden uit epitheliale tumoren (n=47 (78%), waarvan n=10 (21%) borderline; n=37 invasieve tumor (79%)), kiemcel tumoren (n=6 (10%)) en sex cord and stroma cell tumoren (n=7 (13%)). Borderline epitheliale tumoren werden door Pitta (2013) geclassificeerd als maligniteiten.

Stiekema (2014) verrichte een retrospectieve cohortstudie onder alle vrouwen met een histologisch bevestigd epitheliaal ovariumcarcinoom of benigne ovariële aandoening die waren doorverwezen naar het Nederlands Kanker Instituut. Vrouwen met borderline tumoren en/of vrouwen met onvoldoende klinische data werden geëxcludeerd. In totaal werden 181 vrouwen geïncludeerd, waarvan 34 vrouwen met benigne tumoren (gemiddelde leeftijd 57 jaar (SD onbekend); 77% postmenopauzaal) en 147 vrouwen met maligne tumoren (gemiddelde leeftijd 58 jaar (SD onbekend); 75% postmenopauzaal). Op basis van histologische typering werden de volgende tumoren beschreven: benigne tumoren waren cysteadenomen (n=25 (74%)) of onduidelijke typering door missende data (n=6 (18%)). Maligne tumoren bestonden uit: papillaire sereuze tumoren (n=72 (46%)), mucineuze tumoren (n=4 (3%)), clearcell tumoren (n=7 (5%)), endometrioïde tumoren (n=25 (16%)), adenocarcinomen NOS (n=30 (29%)) en andere maligniteiten dan epitheliale ovariumcarcinomen (n=9 (6%)).

Resultaten

Het was niet mogelijk om de onderstaande resultaten te poolen in een meta-analyse wegens het gebrek aan originele data en heterogeniteit tussen de studies. De resultaten worden daarom beschrijvend gepresenteerd. Geen van de studies rapporteerde een statistische toets voor verschillen in de diagnostische accuratesse tussen de tumormarkers. Aangenomen wordt dat er geen statistische verschillen waren bij een overlappend 95% betrouwbaarheidsinterval (BI).

1. Sensitiviteit

De sensitiviteit voor het differentiëren tussen benigne en maligne adnex pathologie op basis van HE4, ROMA en/of CA 125 werd beschreven door één systematische review (Ferraro, 2013) en vijf observationele studies (Huy, 2018; Liest, 2018; Oranratanphan, 2018; Pitta, 2013; Stiekema, 2014). Ferraro (2013) rapporteerde niet de sensitiviteit van ROMA. De resultaten worden weergegeven in tabel 2.

1.1. Sensitiviteit: CA 125

De sensitiviteit van CA 125 varieerde van 65 tot 94% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Ferraro, 2013; Huy, 2018; Oranratanphan, 2018; Pitta, 2013). De sensitiviteit van CA 125 varieerde van 91% tot 95% onder premenopauzale vrouwen en 76,5% tot 91% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018; Stiekema, 2014).

1.2. Sensitiviteit: HE4

De sensitiviteit van HE4 varieerde van 50 tot 99% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Ferraro, 2013; Huy, 2018; Oranratanphan, 2018; Pitta, 2013). De sensitiviteit van HE4 varieerde van 61,5% tot 84% onder premenopauzale vrouwen en 41,2% tot 91% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018; Stiekema, 2014).

1.3. Sensitiviteit: ROMA

De sensitiviteit van ROMA varieerde van 56,7 tot 80% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Huy, 2018; Pitta, 2013). De sensitiviteit van ROMA varieerde van 66,7% tot 84% onder premenopauzale vrouwen en 82,4% tot 91% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018; Oranratanphan, 2018; Stiekema, 2014).

Tabel 2 Gerapporteerde sensitiviteit voor het differentiëren tussen benigne en maligne adnex pathologie per tumormarker

			Sensitiviteit (cut-off; %)
Auteur (jaartal)	Setting	N Prevalentie OC	CA 125	HE4	ROMA
*Systematische review*
Ferraro (2013)	Systematische review met 15 studies	N totaal = 3775 Prevalentie: range 15 - 63%	Cut-off: per studie verschillend Range: 69 tot 94%	Cut-off: per studie verschillend Range: 65 tot 99%	-
*Individuele studies*
Huy (2018)	3^e lijns (?) ziekenhuizen	N totaal= 277 Prevalentie: 10,8%	35 U/mL 83,3%	Pre-M: >70 pmol/L ;Post-M: >140 pmol/L: 50%	Pre-M: ≥7.4%; Post-M: ≥25.3% 80%
		N Pre-M= 230	35 U/mL 92,3%	>70 pmol/L 61,5%	≥7.4% 76,9%
		N Post-M= 47	35 U/mL 76,5%	>140 pmol/L 41,2%	≥25.3% 82,4%
Liest (2018)	2^e en 3^e lijns (?) ziekenhuizen	N totaal=784 Prevalentie: 18,4%	-	-	-
		N Pre-M= 361*	41 kU/l 95%	59 pmol/L 75%	11% 80%
		N Post-M= 423*	28 kU/L 80%	82 pmol/L 82%	25% 84%
Oranratanphan (2018 )	2^e of 3^elijns (?) ziekenhuis	N totaal= 281 Prevalentie: 18,1%	>35 IU/mL 87,9%	>70 pmol/L 74,1%	-
		N Pre-M= 213	-		Cut-off: NR 66,7%
		N Post-M= 68	-		Cut-off: NR 88,9%
Pitta (2013)	3^e lijns (?) ziekenhuis	N totaal= 176 Prevalentie: 34.1%	Pre-M: 69,8 U/L Post-M: 21,7 U/L 65,0% (95%BI 56,3 tot 73,7%)	Pre-M: 41,6 pmol/L Post-M: 96,6 pmol/L 58,3% (95%BI 49,4 tot 67,3%)	Pre-M: 5,01% Post-M: 8,2% 56,7% (95%BI 47,6 tot 65,7%)
Stiekema (2014)	3e lijns ziekenhuis	N totaal= 181 Prevalentie: 73,5%	-	-	-
		N Pre-M= 38	35 kU/L 91% (95%BI 75 tot 98%)	>70 pmol/L 84% (95%BI 67 tot 95%)	0,129 84% (95%BI 67 tot 95%)
		N Post-M= 143	35 kU/L 91% (95%BI 84 tot 96%)	>70 pmol/L 91% (95%BI 84 tot 96%)	0,278 91% (95% BI 84 tot 96%)

TOTAAL		RANGE TOTAAL	65,0 tot 94%	50 tot 99%	56,7 tot 80%
		RANGE PRE-M	91 tot 95%	61,5% tot 84%	66,7% tot 84%
		RANGE POST-M	76,5% tot 91%	41,2% tot 91%	82,4% tot 91%

Afkortingen: 95%BI: 95% betrouwbaarheidsinterval; NKI: Nederlands Kanker Instituut; NR: niet gerapporteerd; OC: ovariumcarcinoom; Pre-M: premenopauzale vrouwen; Post-M: postmenopauzale vrouwen

2. Specificiteit

De specificiteit voor het differentiëren tussen benigne en maligne adnex pathologie op basis van HE4, ROMA en/of CA 125 werd beschreven door één systematische review (Ferraro, 2013) en vijf observationele studies (Huy, 2018; Liest, 2018; Oranratanphan, 2018; Pitta, 2013; Stiekema, 2014). Ferraro (2013) rapporteerde niet de specificiteit van ROMA. De resultaten worden weergegeven in tabel 3.

2.1. Specificiteit: CA 125

De specificiteit van CA 125 varieerde van 46,2 tot 94% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Ferraro, 2013; Huy, 2018; Oranratanphan, 2018; Pitta, 2013). De specificiteit van CA 125 varieerde van 62 tot 77% onder premenopauzale vrouwen en 65 tot 90% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018; Stiekema, 2014).

2.2. Specificiteit: HE4

De specificiteit van HE4 varieerde van 83 tot 99% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Ferraro, 2013; Huy, 2018; Oranratanphan, 2018; Pitta, 2013). De specificiteit van HE4 varieerde van 75 tot 100% onder premenopauzale vrouwen en 75 tot 96,7% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018; Stiekema, 2014).

2.3. Specificiteit: ROMA

De specificiteit van ROMA varieerde van 84,6 tot 87,9% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Huy, 2018; Pitta, 2013). De specificiteit van ROMA varieerde van 75 tot 100% onder premenopauzale vrouwen en 70 tot 96,7% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018; Oranratanphan, 2018; Stiekema, 2014).

Tabel 3 Gerapporteerde specificiteit voor het differentiëren tussen benigne en maligne adnex pathologie per tumormarker

			Specificiteit (cut-off; %)
Auteur (jaartal)	Setting	N Prevalentie OC	CA 125	HE4	ROMA
*Systematische review*
Ferraro (2013)	Systematische review met 15 studies	N totaal = 3775 Prevalentie: range 15 - 63%	Cut-off: per studie verschillend Range: 58 tot 94%	Cut-off: per studie verschillend Range: 83 tot 99%	-
*Individuele studies*
Huy (2018)	3^e lijns (?) ziekenhuizen	N totaal= 277 Prevalentie: 10,8%	78,5%	98,4%	84,6%
		N Pre-M= 230	35 U/mL 77,0%	>70 pmol/L 98,2%	≥7.4% 82,9%
		N Post-M= 47	35 U/mL 90,0%	>140 pmol/L 96,7%	≥25.3% 96,7%
Liest (2018)	2^e en 3^e lijns (?) ziekenhuizen	N totaal=784 Prevalentie: 18,4%	-	-	-
		N Pre-M= 361*	41 kU/l 75%	59 pmol/L 75%	11% 75%
		N Post-M= 423*	28 kU/L 75%	82 pmol/L 75%	25% 75%
Oranratanphan (2018 )	2^e of 3^elijns (?) ziekenhuis	N totaal= 281 Prevalentie: 18,1%	>35 IU/mL 46,2%	>70 pmol/L 86,5%	-
		N Pre-M= 213	-	-	Cut-off: NR 88,5%
		N Post-M= 68	-	-	Cut-off: NR 70%
Pitta (2013)	3^e lijns (?) ziekenhuis	N totaal= 176 Prevalentie: 34.1%	Pre-M: 69,8 U/L Post-M: 21,7 U/L 75,9% (95%BI 65,6 tot 86,1%)	Pre-M: 41,6 pmol/L Post-M: 96,6 pmol/L 84,5% (95%BI 74,7 tot 94,2%)	Pre-M: 5,01% Post-M: 8,2% 87,9% (95%BI 78,7 tot 97,1%)
Stiekema (2014)	Vrouwen doorverwezen naar NKI	N totaal= 181 Prevalentie: 73,5%	-	-	-
		N Pre-M= 38	35 kU/L 62% (95%BI 24 tot 91%)	>70 pmol/L 100% (95%BI 63 tot 100%)	0,129 100% (95%BI 63 tot 100%)
		N Post-M= 143	35 kU/L 65% (95%BI 44 tot 83%)	>70 pmol/L 96% (95%BI 80 tot 100%)	0,278 77% (95%BI 56 tot 91%)

TOTAAL		RANGE TOTAAL	46,2 tot 94%	83 tot 99%	84,6 tot 87,9%
		RANGE PRE-M	62 tot 77%	75 tot 100%	75 tot 100%
		RANGE POST-M	65 tot 90%	75 tot 96,7%	70 tot 96,7%

Afkortingen: 95%BI: 95% betrouwbaarheidsinterval; NKI: Nederlands Kanker Instituut; NR: niet gerapporteerd; OC: ovariumcarcinoom; Pre-M: premenopauzale vrouwen; Post-M: postmenopauzale vrouwen

3. Positief voorspellende waarde

De positief voorspellende waarde voor het differentiëren tussen benigne en maligne adnex pathologie op basis van HE4, ROMA en/of CA 125 werd beschreven door vier observationele studies (Huy, 2018; Liest, 2018; Oranratanphan, 2018; Pitta, 2013). De resultaten worden weergegeven in tabel 4.

3.1. Positief voorspellende waarde: CA 125

De positief voorspellende waarde van CA 125 varieerde van 29,8 tot 58,2% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Huy, 2018; Oranratanphan, 2018; Pitta, 2013). De positief voorspellende waarde van CA 125 varieerde van 19,1 tot 20% onder premenopauzale vrouwen en 46 tot 81,3% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018).

3.2. Positief voorspellende waarde: HE4

De positief voorspellende waarde van HE4 varieerde van 59,2 tot 79% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Huy, 2018; Oranratanphan, 2018; Pitta, 2013). De positief voorspellende waarde van HE4 varieerde van 16 tot 66,7% onder premenopauzale vrouwen en 46 tot 100% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018).

3.3. Positief voorspellende waarde: ROMA

De positief voorspellende waarde van ROMA varieerde van 38,7 tot 70,8% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Huy, 2018; Pitta, 2013). De positief voorspellende waarde van ROMA varieerde van 17 tot 48,8% onder premenopauzale vrouwen en 47 tot 93,3% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018; Oranratanphan, 2018).

Tabel 4 Gerapporteerde positief voorspellende waarde voor het differentiëren tussen benigne en maligne adnex pathologie per tumormarker

			Positief voorspellende waarde (cut-off; %)
Auteur (jaartal)	Setting	N Prevalentie OC	CA 125	HE4	ROMA
Huy (2018)	3^e lijns (?) ziekenhuizen	N totaal= 277 Prevalentie: 10,8%	31,7%	79,0%	38,7%
		N Pre-M= 230	35 U/mL 19,1%	>70 pmol/L 66,7%	≥7.4% 21,3%
		N Post-M= 47	35 U/mL 81,3%	>140 pmol/L 100%	≥25.3% 93,3%
Liest (2018)	2^e en 3^e lijns (?) ziekenhuizen	N totaal=784 Prevalentie: 18,4%	-	-	-
		N Pre-M= 361*	41 kU/l 20%	59 pmol/L 16%	11% 17%
		N Post-M= 423*	28 kU/L 46%	82 pmol/L 46%	25% 47%
Oranratanphan (2018)	2^e of 3^elijns (?) ziekenhuis	N totaal= 281 Prevalentie: 18,1%	>35 IU/mL 29,8%	>70 pmol/L 59,2%	-
		N Pre-M= 213	-	-	Cut-off: NR 48,8%
		N Post-M= 68	-	-	Cut-off: NR 66,7%
Pitta (2013)	3^e lijns (?) ziekenhuis	N totaal= 176 Prevalentie: 34.1%	Pre-M: 69,8 U/L Post-M: 21,7 U/L 58,2%	Pre-M: 41,6 pmol/L Post-M: 96,6 pmol/L 66%	Pre-M: 5,01% Post-M: 8,2% 70,8%

TOTAAL		RANGE TOTAAL	29,8 tot 58,2%	59,2 tot 79%	38,7 tot 70,8%
		RANGE PRE-M	19,1 tot 20%	16 tot 66,7%	17 tot 48,8%
		RANGE POST-M	46 tot 81,3%	46 tot 100%	47 tot 93,3%

Afkortingen: 95%BI: 95% betrouwbaarheidsinterval; NKI: Nederlands Kanker Instituut; NR: niet gerapporteerd; OC: ovariumcarcinoom; Pre-M: premenopauzale vrouwen; Post-M: postmenopauzale vrouwen;* cut-off gebaseerd op ROC

4. Negatief voorspellende waarde

De negatief voorspellende waarde voor het differentiëren tussen benigne en maligne adnex pathologie op basis van HE4, ROMA en/of CA 125 werd beschreven door vier observationele studies (Huy, 2018; Liest, 2018; Oranratanphan, 2018; Pitta, 2013). De resultaten worden weergegeven in tabel 5.

4.1. Negatief voorspellende waarde: CA 125

De negatief voorspellende waarde van CA 125 varieerde van 80,7 tot 97,5% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Huy, 2018; Oranratanphan, 2018; Pitta, 2013). De negatief voorspellende waarde van CA 125 varieerde van 99,4 tot 100% onder premenopauzale vrouwen en 87,1 tot 93% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018).

4.2. Negatief voorspellende waarde: HE4

De negatief voorspellende waarde van HE4 varieerde van 79,9 tot 94,2% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Huy, 2018; Oranratanphan, 2018; Pitta, 2013). De negatief voorspellende waarde van HE4 varieerde van 97,7 tot 98% onder premenopauzale vrouwen en 75 tot 94% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018).

4.3. Negatief voorspellende waarde: ROMA

De negatief voorspellende waarde van ROMA varieerde van 79,9 tot 97,2% onder vrouwen bij wie de menopauzale status niet gespecificeerd was (Huy, 2018; Pitta, 2013). De negatief voorspellende waarde van ROMA varieerde van 94,2 tot 98,4% onder premenopauzale vrouwen en 90,6 tot 95% onder postmenopauzale vrouwen (Huy, 2018; Liest, 2018; Oranratanphan, 2018).

Tabel 5 Gerapporteerde negatief voorspellende waarde voor het differentiëren tussen benigne en maligne adnex pathologie per tumormarker

			Negatief voorspellende waarde (cut-off; %)
Auteur (jaartal)	Setting	N Prevalentie OC	CA 125	HE4	ROMA
Huy (2018)	3^e lijns (?) ziekenhuizen	N totaal= 277 Prevalentie: 10,8%	97,5%	94,2%	97,2%
		N Pre-M= 230	35 U/mL 99,4%	>70 pmol/L 97,7%	≥7.4% 98,4%
		N Post-M= 47	35 U/mL 87,1%	>140 pmol/L 75,0%	≥25.3% 90,6%
Liest (2018)	2^e en 3^e lijns (?) ziekenhuizen	N totaal=784 Prevalentie: 18,4%	-	-	-
		N Pre-M= 361*	41 kU/l 100%	59 pmol/L 98%	11% 98%
		N Post-M= 423*	28 kU/L 93%	82 pmol/L 94%	25% 95%
Oranratanphan (2018 )	2^e of 3^elijns (?) ziekenhuis	N totaal= 281 Prevalentie: 18,1%	>35 IU/mL 93,6%	>70 pmol/L 93,3%	-
		N Pre-M= 213	-	-	Cut-off: NR 94,2%
		N Post-M= 68	-	-	Cut-off: NR 90,9%
Pitta (2013)	3^e lijns (?) ziekenhuis	N totaal= 176 Prevalentie: 34.1%	Pre-M: 69,8 U/L Post-M: 21,7 U/L 80,7%	Pre-M: 41,6 pmol/L Post-M: 96,6 pmol/L 79,9%	Pre-M: 5,01% Post-M: 8,2% 79,9%

TOTAAL		RANGE TOTAAL	80,7 tot 97,5%	79,9 tot 94,2%	79,9 tot 97,2%
		RANGE PRE-M	99,4 tot 100%	97,7 tot 98%	94,2 tot 98,4%
		RANGE POST-M	87,1 tot 93%	75 tot 94%	90,6 tot 95%

5. Likelihoodratio

Eén systematische review rapporteerde de positieve en negatieve likelihoodratio (Ferraro, 2013). De positieve likelihoodratio wordt berekend als sensitiviteit/(1-specificiteit) en de negatieve likelihoodratio wordt berekend als (1−sensitiviteit)/ speciﬁciteit. Bij een positieve testuitslag wordt de sterkte van de indicatie voor aanwezigheid van een maligniteit beschouwd als ‘relevant’ bij een positieve likelihoodratio ≥ 10, ‘bescheiden’ bij 5,00 tot 9,99 en als ‘slecht’ bij < 5. Bij een negatieve testuitslag wordt de sterkte van de indicatie voor afwezigheid van een maligniteit beschouwd als ‘relevant’ bij een negatieve likelihoodratio van ≤ 0,10, ‘bescheiden’ bij > 0,10 en ≤ 0,20 en als ‘slecht’ bij > 0,20 en ≤ 0.50.

5.1 Likelihoodratio: CA 125

Ferraro (2013) beschreef op basis van 15 geïncludeerde studies dat de gepoolde positieve likelihoodratio van CA 125 4,15 (95%BI 3,06 tot 5,62) was en de gepoolde negatieve likelihoodratio van CA 125 0,27 (95%BI 0,23 tot 0,31) was onder vrouwen bij wie de menopauzale status niet gespecificeerd was.

5.2 Likelihoodratio: HE4

Ferraro (2013) beschreef op basis van 15 geïncludeerde studies dat de gepoolde positieve likelihoodratio van HE4 13,01 (95%BI 8,2 tot 20,65) was en de gepoolde negatieve likelihoodratio van HE4 0,23 (95%BI 0,19 tot 0,28) was onder vrouwen bij wie de menopauzale status niet gespecificeerd was.

Bewijskracht van de literatuur

De bewijskracht voor de uitkomstmaten sensitiviteit, specificiteit, positief voorspellende waarde, negatief voorspellende waarde en likelihoodratio voor de diagnostische accuratesse van HE4, ROMA en CA 125 voor het differentiëren tussen benigne en maligne adnex pathologie start op ‘hoog’ en is met twee niveaus verlaagd vanwege het risico op bias (mogelijke selectiebias in studies door alleen patiënten met complete data te selecteren, heterogeniteit tussen studies in onder andere gehanteerde afkappunten, het wel/niet includeren van borderline tumoren, geïncludeerde cystes, studiesetting en prevalentie van ovarium carcinoom). De bewijskracht komt daarmee uit op ‘Laag’.

Zoeken en selecteren

Om de uitgangsvraag te kunnen beantwoorden is er een systematische literatuuranalyse verricht naar de volgende zoekvraag:

Wat is de diagnostische accuratesse van HE4 of ROMA vergeleken met CA 125 voor differentiatie tussen benigne en maligne adnex pathologie?

P: alle vrouwen met echoscopisch vergroot adnex (> 3cm) (maligne/benigne) (na uitsluiting van endometrioom, uniloculaire cyste en dermoïdcyste);

I: HE4 of ROMA (HE4 + CA 125);

C: CA 125;

R: Histologische uitslag;

O: sensitiviteit, specificiteit, positief voorspellende waarde, negatief voorspellende waarde, likelihood ratio.

Relevante uitkomstmaten

De werkgroep achtte de sensitiviteit en specificiteit voor de besluitvorming cruciale uitkomstmaten en de positief voorspellende waarde, negatief voorspellende waarde en likelihood ratio voor de besluitvorming belangrijke uitkomstmaten.

Met een verbetering in of een optimale sensitiviteit zal het aantal patiënten dat onterecht in een algemeen ziekenhuis blijft worden beperkt. Echter, om te voorkomen dat er grotere aantallen patiënten onterecht worden doorgestuurd naar een oncologisch centrum zal een verbetering van de sensitiviteit niet ten koste moeten gaan van de specificiteit. Vanwege de samenhang tussen deze uitkomsten zijn daarom de sensitiviteit en specificiteit beide als cruciale uitkomst gekozen.

Zoeken en selecteren (Methode)

In de databases Medline (via OVID) en Embase (via Embase.com) is van 2005 tot 20 december 2018 met relevante zoektermen gezocht naar systematische reviews, randomized controlled trials (RCT’s) en observationele studies waarin de diagnostische accuratesse van HE4 en CA 125 werd vergeleken bij vrouwen met een ovarium cyste. De zoekverantwoording is weergegeven onder het tabblad Verantwoording. De literatuurzoekactie leverde 496 treffers op. Studies werden geselecteerd op grond van de volgende selectiecriteria: 1) studie beschreef vrouwen met een echoscopisch vergroot adnex (> 3cm) (maligne/benigne); 2) studie beschreef de diagnostische accuratesse van HE4 en CA 125, of ROMA (HE4 + CA 125) vergeleken met CA 125; 3) histologische uitslag werd gebruikt als gouden standaard voor het stellen van een definitieve diagnose. Studies werden geëxcludeerd voor de literatuuranalyse op grond van de volgende exclusiecriteria: 1) benigne groep bevatte ook endometrioom, uniloculaire cyste en/of dermoïd cyste en de diagnostische accuratesse werd niet apart gepresenteerd van deze groep; 2) geen of een onduidelijke definitieve histologische uitslag; 3) selectie op voorhand op basis van maligniteit. Op basis van titel en abstract werden in eerste instantie 90 studies voorgeselecteerd. Na raadpleging van de volledige tekst, werden vervolgens 84 studies geëxcludeerd (zie exclusietabel onder het tabblad Verantwoording), en 6 studies definitief geselecteerd.

Resultaten

Eén systematisch review (Ferraro, 2013) en 5 individuele diagnostische studies (Huy, 2018; Liest, 2018; Oranratanphan, 2018; Pitta, 2013; Stiekema, 2014) zijn opgenomen in de literatuuranalyse. De belangrijkste studiekarakteristieken en resultaten zijn opgenomen in de evidencetabellen. De beoordeling van de individuele studieopzet (risk of bias) is opgenomen in de risk-of-biastabellen.

Referenties

Ferraro S, Braga F, Lanzoni M, Boracchi P, Biganzoli EM, Panteghini M. Serum human epididymis protein 4 versus carbohydrate antigen 125 for ovarian cancer diagnosis: a systematic review. J Clin Pathol. 2013 Apr;66(4):273-81.
Hallamaa M, Suvitie P, Huhtinen K, Matomäki J, Poutanen M, Perheentupa A. Serum HE4 concentration is not dependent on menstrual cycle or hormonal treatment among endometriosis patients and healthy premenopausal women. Gynecol Oncol. 2012 Jun;125(3):667-72.
Han SN, Lotgerink A, Gziri MM, Van Calsteren K, Hanssens M, Amant F. Physiologic variations of serum tumor markers in gynecological malignancies during pregnancy: a systematic review. BMC Med. 2012 Aug 8;10:86.
Huy NVQ, Van Khoa V, Tam LM, Vinh TQ, Tung NS, Thanh CN, Chuang L. Standard and optimal cut-off values of serum ca-125, HE4 and ROMA in preoperative prediction of ovarian cancer in Vietnam. Gynecol Oncol Rep. 2018 Jul 18;25:110-114.
Liest AL, Omran AS, Mikiver R, Rosenberg P, Uppugunduri S. RMI and ROMA are equally effective in discriminating between benign and malignant gyn.ecological tumors: A prospective population-based study. Acta Obstet Gynecol Scand. 2019 Jan;98(1):24-33.
Oncoline richtlijn ‘Epitheliaal Ovariumcarcinoom (2.2)’, 2018 https://www.oncoline.nl/ovariumcarcinoom.
Oncoline richtlijn ‘Niet epitheliale maligniteiten van het ovarium (2.0)’, 2016 https://www.oncoline.nl/niet-epitheliale-maligniteiten-ovarium.
Oncoline richtlijn ‘Borstkanker (1.0)’, 2018 https://www.oncoline.nl/borstkanker.
Oranratanaphan S, Wanishpongpan S, Termrungruanglert W, Triratanachat S. Assessment of Diagnostic Values among CA-125, RMI, HE4, and ROMA for Cancer Prediction in Women with Nonfunctional Ovarian Cysts. Obstet Gynecol Int. 2018 Oct 8;2018:7821574.
Pitta Dda R, Sarian LO, Barreta A, Campos EA, Andrade LL, Fachini AM, Campbell LM, Derchain S. Symptoms, CA125 and HE4 for the preoperative prediction of ovarian malignancy in Brazilian women with ovarian masses. BMC Cancer. 2013 Sep 18;13:423.
Szecsi PB, Andersen MR, Bjørngaard B, Hedengran KK, Stender S. Cancer antigen 125 after delivery in women with a normal pregnancy: a prospective cohort study. Acta Obstet Gynecol Scand. 2014 Dec;93(12):1295-301.
Shuang Y, Yang H, Xie S, et al. Diagnostic value of HE4 for ovarian cancer: a meta-analysis. Clin Chem Lab Med 2012;50:1439–46.
Stiekema A, Lok CA, Kenter GG, van Driel WJ, Vincent AD, Korse CM. A predictive model combining human epididymal protein 4 and radiologic features for the diagnosis of ovarian cancer. Gynecol Oncol. 2014 Mar;132(3):573-7.

Evidence tabellen

Research question:

Study reference

Study characteristics

Patient characteristics

Index test

(test of interest)

Reference test

Follow-up

Outcome measures and effect size

Comments

Ferraro, 2013

PS., study characteristics and results are extracted from the SR (unless stated otherwise)

SR and meta-analysis

Literature search up to January 2012

A: Park, 2012

B: Bandiera, 2011

C: Escudero, 2011

D: Molina, 2011

E: Holcomb, 2011

F: Chang, 2011

G: Ruggeri, 2011

H: Jacob, 2011

I: Van Gorp, 2011

J: Montagnana, 2011

K: Yip, 2011

L: Modarres-Gilani, 2011

M: Abdel-Azeez, 2010

N: Anastasi, 2010

O: Nolen, 2010

Study design: case-control study (CC); cross-sectional study (CS); prospective clinical trial (PCT)

A: CS

B: CS

C: CC

D: CS

E: PCT

F: CS

G: CS

H: PCT

I: CC

J: PCT

K: CS

L: CC

M: CC

N: CS

O: CS

Setting and Country: not reported per included study.

Source of funding and conflicts of interest:

(commercial / non-commercial funding/ industrial co-authorship / potential conflicts of interest )

Not reported per individual study.

Ferraro (2013) reports no competing interest.

Inclusion criteria SR:

1. The primary or secondary aim of the study was at least the report of HE4 and CA-125 mean concentrations or sensitivity and speciﬁcity versus the ‘gold standard’ method for OC diagnosis—that is, laparoscopy with histological evaluation of biopsy material. 2. Diagnostic parameters were estimated according to a decisional threshold level and not to a ﬁxed speciﬁcity or sensitivity.

3. The presentation of quantitative data allowed at least calculation of the OR.

4. The investigated population was represented by women with a gynaecological disease suspected as being OC, which is the intended spectrum of patients to be investigated by circulating biomarker detection.

5. HE4 concentrations were not included in diagnostic algorithms used to classify patients (incorporation bias)

Exclusion criteria SR:

Papers were excluded in the following instances:

1. Duplicative results from the same authors’ group were being reported. 2. Serum/plasma HE4 concentrations were measured to assess OC recurrence, to monitor disease progression or the effect of therapy.

3. They were case reports.

15 studies included (1 study, ref 33, was excluded by us because it included ovarian endometriosis only)

Important patient characteristics:

Number of patients; characteristics important to the research question; for example, age, sex, bmi, ...

N OC versus. BGD

A: 66 versus. 257

B: 113 versus. 165

C: 125 versus. 289

D: 111 versus. 285

E: 34 versus. 195

F: 52 versus. 150

G: 96 versus. 90

H: 29 versus. 71

I: 161 versus. 228

J: 55 versus. 40

K: 149 versus. 350

L: 37 versus. 50

M:41 versus. 24

N: 32 versus. 86

O: 227 versus. 158

Mean age: was not reported.

Sex: 100% female in all studies

Menopause status:

A: not reported

OC: 26 pre-, 87 post-menopause; BGD: 69 pre-, 96 post-menopause

C: not reported.

OC: 27 pre-, 84 post-menopause

BGD: 226 pre-, 59 post-menopause.

OC: 34 pre-menopause

BGD: not reported

F: not reported.

G: not reported.

H: not reported.

OC: 42 pre-, 119 post-menopause;

BGD: 142 pre-, 86 post-menopause

J: not reported.

K: not reported.

L: not reported.

M: not reported

N: not reported

OC: 58 pre-, 169 post-menopause;

BGD: 18 pre-, 140 post-menopause.

Describe index and comparator tests* and

cut-off point(s):

Test 1: HE assay; cut-off (pmol/L)

Test 2: CA-125 assay; cut-off (kU/L)

A-1: test; cut-off: Abbott/Architect; 33.2

A-2: comp, cut-off:

Abbott/Architect; 38.3

B-1: test; cut-off: Abbott/Architect; pre-menopause: 70, post-menopause: 140

B-2: comp, cut-off:

Abbott/Architect; 35

C-1: test; cut-off: Abbott/Architect; 140

C-2: comp, cut-off:

Abbott/Architect; 35

D-1: test; cut-off: Abbott/Architect; 150

D-2: comp, cut-off:

Abbott/Architect; 35

E-1: test; cut-off: Abbott/Architect; 70

E-2: comp, cut-off:

Abbott/Architect; 35

F-1: test; cut-off: CanAg ELISA; 150

F-2: comp, cut-off:

CanAg ELISA; 35

G-1: test; cut-off: Abbott/Architect – Fujirebio ELISA; not reported

G-2: comp, cut-off:

Abbott/Architect – Fujirebio ELISA; not reported

H-1: test; cut-off: Fujirebio ELISA; 70

H-2: comp, cut-off:

Fujirebio ELISA; 35

I-1: test; cut-off: Fujirebio ELISA; 70 in pre-menopausal women; 150 in post-menopausal women

I-2: comp, cut-off:

Fujirebio ELISA; 35

J-1: test; cut-off: Fujirebio ELISA; 74.2

J-2: comp, cut-off:

Fujirebio ELISA; 35

K-1: test; cut-off: Luminex multiplexed ELISA; 54.8

K-2: comp, cut-off:

Luminex multiplexed ELISA; 52.2

L-1: test; cut-off: CanAg ELISA; 25

L-2: comp, cut-off:

CanAg ELISA; 37

M-1: test; cut-off: Fujirebio ELISA; 72

M-2: comp, cut-off:

Roche Diagnostics/ Cobas e411; 35

N-1: test; cut-off: Fujirebio ELISA; 150

N-2: comp, cut-off:

Radim RIA; 35

O-1: test; cut-off: Luminex multiplexed ELISA; 73.7

O-2: comp, cut-off:

Luminex multiplexed ELISA; 93.15

Describe reference test and cut-off point(s):

In all studies laparoscopy with histological evaluation of biopsy material was the golden standard.

Prevalence (%)

(based on refence test at specified cut-off point)

A: 20%

B: 40%

C: 30%

D: 28%

E: 15%

F: 26%

G: not reported

H: 29%

I: 41%

J: 53%

K: 30%

L: 43%

M: 63%

N: 27%

O: 59%

For how many participants were no complete outcome data available?

N (%)

Not reported per individual study.

Studies L and N were excluded from certain analyses due to outliers in data. Included studies reported per analysis.

Reasons for incomplete outcome data described?

Not reported per individual study.

Endpoint of follow-up:

Not reported per individual study.

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure-1: sensitivity

See meta-analysis for sensitivity data per individual study (included studies were A,B,C,D,E,F,H,I,J,K,L,M,O).

Pooled characteristic (‘type of statistical analysis’ e.g. bivariate analysis) per index test and cut-off point:

Index test-1: HE4 (cut-off= reported per individual study)

79% (95% CI 76 to 81%); P=0.0001

Heterogeneity (reasons): 70.7% (due to the use of the same antibodies and to overlapping/harmonised thresholds).

Index test-2: CA-125 (cut-off= reported per individual study) 79% (95%CI 77 to 82%); P=0.0003

Heterogeneity (reasons): 66.6% (due to the use of the same antibodies and to overlapping/harmonised thresholds).

Outcome measure-2: specificity

See meta-analysis for specificity data per individual study.

(included studies were A,B,C,D,E,F,H,I,J,K, M,N,O).

Pooled characteristic (‘type of statistical analysis’ e.g. bivariate analysis) per index test and cut-off point:

Index test-1: HE4 (cut-off= reported per individual study)

93% (95% CI 92 to 94%); P<0.0001

Heterogeneity (reasons): 89.2% (due to the use of the same antibodies and to overlapping/harmonised thresholds).

Index test-2: CA-125 cut-off= reported per individual study)

78% (95%CI 76 to 80%); P<0.0001

Heterogeneity (reasons): 94.8% (due to the use of the same antibodies and to overlapping/harmonised thresholds).

Outcome measure-3: positive LR

See meta-analysis for specificity data per individual study.

(included studies were A,B,C,D,E,F,H,I,J,K,L,M,O).

Pooled characteristic (‘type of statistical analysis’ e.g. bivariate analysis) per index test and cut-off point:

Index test-1: HE4 cut-off= reported per individual study)

13.01 (95% CI 8.2 to 20.65); P<0.0001

Heterogeneity (reasons): 86.1% (reasons not reported).

Index test-2: CA-125 cut-off= reported per individual study)

4.15 (95%CI 3.06 to 5.62); P=0.0006

Heterogeneity (reasons): 91.8% (reasons not reported).

Outcome measure-4: negative LR

See meta-analysis for specificity data per individual study.

(HE4: included studies were A,B,C,D,E,F,H,I,J,K,M,O; CA-125: included studies were A,B,C,D,E,F,H,I,J,K,L,M,N,O).

Pooled characteristic (‘type of statistical analysis’ e.g. bivariate analysis) per index test and cut-off point:

Index test-1: HE4 (cut-off= reported per individual study)

0.23 (95% CI 0.19 to 0.28); P<0.0001

Heterogeneity (reasons): 65.1% (reasons not reported).

Index test-2: CA-125 (cut-off= reported per individual study)

0.27 (95%CI 0.23 to 0.31); P=0.0895

Heterogeneity (reasons): 36.7% (reasons not reported).

Positive (LR+) and negative (LR–) likelihood ratios, corresponding to sensitivity/(1−speciﬁcity) and (1−sensitivity)/ speciﬁcity

In particular, the strength of the indication for the presence of the disease provided by the positive result of the test is relevant when LR+≥10, modest when 5≤LR+<10, and poor when 2≤LR+<5, and the strength of the indication for the absence of the disease provided by the negative result of the test is relevant when LR–≤0.10, modest when 0.10<LR–≤0.20, and poor when 0.20<LR–≤0.50

PS. pooling of test accuracy data should be based on bivariate analysis of sensitivity and specificy; always mention the cut-off points used

Study quality (ROB): method used and results per individual study

QUADAS-II tool

Place of the index test in the clinical pathway: add-on to golden standard.

Choice of cut-off point: influences test characteristics (sens, spec); important in relation to the clinical question (e.g. if a disease is to be ruled out, sensitivity is the critical outcome measure and more important than specificity: high sensitivity comes at the expense of low specificity and high rates of false postives, and usually those testing positive are subjected to further diagnostic tests for final diagnosis)

Facultative:

Brief description of author’s conclusion:

HE4 measurement seems to be superior to CA-125 in terms of diagnostic performance for identiﬁcation of OC in women with suspected gynaecological disease. Due to the high prevalence of OC in post-menopausal women and the need for data focused on early tumour stages, more studies tailored on these speciﬁc subsets are needed

Personal remarks on study quality, conclusions, and other issues (potentially) relevant to the research question

Sensitivity analyses (excluding small studies; excluding low quality studies; excluding case-control type of studies; relevant subgroup-analyses); mention only analyses which are of potential importance to the research question

Heterogeneity: clinical and statistical heterogeneity; clinical: enough similarities in patient characteristics, diagnostic tests (strategy) to allow pooling? For pooled data: assessment of statistical heterogeneity and, more importantly, assessment of the reasons for heterogeneity (if present)? Note: sensitivity and specificity depend on the situation in which the test is being used and the thresholds that have been set, and sensitivity and specificity are correlated; therefore, the use of heterogeneity statistics (p-values; I2) is problematic, and rather than testing whether heterogeneity is present, the reasons for heterogeneity should be examined.

Abbreviations: BGD: benign gynaecological disease; OC: ovarian cancer; *comparator test equals the C of the PICO; two or more index/ comparator tests may be compared; note that a comparator test is not the same as a reference test (golden standard)

Evidence table for diagnostic test accuracy studies

Study reference

Study characteristics

Patient characteristics

Index test

(test of interest)

Reference test

Follow-up

Outcome measures and effect size

Comments

Huy, 2018

Type of study: cross-sectional study

Setting and country: Departments of Obstetrics and Gynecology, Hue University Hospital and Hue Central Hospital, Vietnam.

Funding and conflicts of interest: The authors whose names are listed above certify that they have NO aﬃliations with or involvement in any organization or entity with any ﬁnancial interest (such as honoraria; educational grants; participation in speakers' bureaus; membership, employment, consultancies, stock ownership, or other equity interest; and expert testimony or patentlicensing arrangements), or non-ﬁnancial interest (such as personal or professional relationships, aﬃliations, knowledge or beliefs) in the subject matter or materials discussed in this manuscript.

Inclusion criteria: women with clinically diagnosed ovarian tumours, including benign ovarian tumors and ovarian cancers. Patients with suﬃcient personal information, clinical symptoms, data on serum CA125 and serum HE4 levels, and postoperative pathologic ﬁndings were included. All patients were hospitalized for surgery for adnexal mass.

Exclusion criteria: Pregnant women, patients with a history of ovarian, primary peritoneal, or any other associated cancer were excluded from the study.

N=277 (247 benign, 30 EOC)

Prevalence: 10.8%

Age ≥ 50 years (n,%):

Benign: 37 (15%)

Malignant: 19 (63.3%)

Sex: 0% M / 100% F

Other important characteristics:

Postmenopausal women (n, %):

Benign: 30 (12.1%)

Malignant: 17 (56.7%)

Describe index test – HE4:

ARCHITECT i1000SR system respectively

Cut-off point(s):

Premenopausal women: >70 pmol/L

Postmenopausal women: >140 pmol/L

Describe index test – ROMA:

Algorithm was calculated as described by Moore et al. 2010, see text for formula.

Cut-off point(s):

Premenopausal women: ROMA values ≥7.4% or < 7.4% are regarded as high-risk and lowrisk respectively.

Postmenopausal women: ROMA values ≥25.3% or < 25.3% are regarded as high-risk and low-risk respectively.

Comparator test – CA-125:

Elecsys 2010 system immunoassay

Cut-off point(s): 35 U/mL

Describe reference test:

Postoperative pathological findings

Cut-off point(s): NA

Time between the index test en reference test: not reported. Blood was drawn preoperatively.

For how many participants were no complete outcome data available?

N (%) 0 (0%) patients with complete data included.

Reasons for incomplete outcome data described? NA

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure 1: sensitivity

All patients (n=277)

Index test: HE4

50.0%

Index test: ROMA

80.0%

Comparator test: CA-125

83.3%

Pre-menopausal women only (n=230):

Index test: HE4

61.5%

Index test: ROMA

76.9%

Comparator test: CA-125

92.3%

Post-menopausal women only (n=47):

Index test: HE4

41.2%

Index test: ROMA

82.4%

Comparator test: CA-125

76.5%

Outcome measure 2: specificity

All patients (n=277)

Index test: HE4

98.38%

Index test: ROMA

84.6%

Comparator test: CA-125

78.5%

Pre-menopausal women only (n=230):

Index test: HE4

98.2%

Index test: ROMA

82.9%

Comparator test: CA-125

77.0%

Post-menopausal women only (n=47):

Index test: HE4

96.7%

Index test: ROMA

96.7%

Comparator test: CA-125

90.0%

Outcome measure 3: PPV

All patients (n=277)

Index test: HE4

78.95%

Index test: ROMA

38.71%

Comparator test: CA-125

31.65%

Pre-menopausal women only (n=230):

Index test: HE4

66.67%

Index test: ROMA

21.28%

Comparator test: CA-125

19.05%

Post-menopausal women only (n=47):

Index test: HE4

100%

Index test: ROMA

93.3%

Comparator test: CA-125

81.25%

Outcome measure 4: NPV

All patients (n=277)

Index test: HE4

94.19%

Index test: ROMA

97.21%

Comparator test: CA-125

97.47%

Pre-menopausal women only (n=230):

Index test: HE4

97.71%

Index test: ROMA

98.36%

Comparator test: CA-125

99.40

Post-menopausal women only (n=47):

Index test: HE4

75.0%

Index test: ROMA

90.62%

Comparator test: CA-125

87.10%

NB in abstract is stated that included women were hospitalized.

Liest, 2018

Type of study: prospective population-based study

Setting and country: the Department of Obstetrics and Gynecology, University Hospital, Linköping, Sweden, and from eight hospitals in the referral area, Sweden.

Funding and conflicts of interest:

FORSS (Medical Research Council of Southeast Sweden), County Council of Östergötland, and the local fund Östgötaregionens cancerfond.

Inclusion criteria: women aged ≥ 18 years with a pelvic mass of probable ovarian origin and scheduled for surgery. Both women with a high clinical suspicion of malignancy and those with probably benign tumors were included in the study

Exclusion criteria: none reported.

N= 784 (n=29 other malignancies; n=144 EOC including borderline, n=611 benign)

Prevalence (EOC): 18.4%

Mean age ± SD: not reported

Sex: 0% M / 100% F

Other important characteristics:

Postmenopausal (n, %):

EOC: 117 (81%)

Benign: 306 (50.1%)

Describe index test - HE4: electrochemiluminescence immunoassay on the automated cobas e602 module (Roche Diagnostics, Mannheim, Germany). The HE4 method has been standardized against the HE4 EIA method from Fujirebio Diagnostics (Gothenburg, Sweden). HE4 levels were measured in 279 urine samples by a quantitative enzyme‐linked immunosorbent assay (ELISA) kit from Fujirebio Diagnostics. Urine samples were diluted 1:40 with a tracer diluent provided with the kit prior to testing. Plates were read at 405 nm wavelength within 15 min using a Multiskan Spectrum microplate reader (Thermo Scientific, Vantaa, Finland).

Cut-off point(s):

2 methods: 1) determined by fixed specificity; 2) according to ROC.

Describe index test – ROMA: ROMA was calculated according to the algorithm proposed by Moore et al.

Cut-off point(s):

2 methods: 1) determined by fixed specificity; 2) according to ROC.

Comparator test – CA-125:

electrochemiluminescence immunoassay on the automated cobas e602 module (Roche Diagnostics, Mannheim, Germany). The CA125 method has been standardized against the Enzymun‐Test CA125 II method, which in turn has been standardized against the CA125 II RIA from Fujirebio Diagnostics (Gothenburg, Sweden)

Cut-off point(s): 2 methods: 1) determined by fixed specificity; 2) according to ROC.

Describe reference test: histopathology

Cut-off point(s): NA

Time between the index test en reference test: Blood samples for measuring CA125 and HE4 and urine samples for measuring HE4 were taken within 7 days prior to surgery

For how many participants were no complete outcome data available?

N (%) – NA, only patients with complete data selected.

Reasons for incomplete outcome data described? – NA only patients with complete data selected.

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure 1: sensitivity

Premenopausal women only: (n=361)

Cut-off based on fixed specificity of 75%:

Index test: HE4 (cut-off: 59)

75%

Index test: ROMA (cut-off: 11)

80%

Comparator test: CA-125 (cut-off: 41)

95%

Cut-off based on ROC:

Index test: HE4 (cut-off: 63)

75%

Index test: ROMA (cut-off: 13)

75%

Comparator test: CA-125 (cut-off: 109)

65%

Postmenopausal women only: (n=423)

Cut-off based on fixed specificity of 75%:

Index test: HE4 (cut-off: 82)

82%

Index test: ROMA (cut-off: 25)

84%

Comparator test: CA-125 (cut-off: 28)

80%

Cut-off based on ROC:

Index test: HE4 (cut-off: 91)

77%

Index test: ROMA (cut-off: 35)

83%

Comparator test: CA-125 (cut-off: 42)

78%

Outcome measure 2: specificity

Premenopausal women only: (n=361)

Cut-off based on fixed specificity of 75%:

Index test: HE4 (cut-off: 59)

75%

Index test: ROMA (cut-off: 11)

75%

Comparator test: CA-125 (cut-off: 41)

75%

Cut-off based on ROC:

Index test: HE4 (cut-off: 63)

81%

Index test: ROMA (cut-off: 13)

83%

Comparator test: CA-125 (cut-off: 109)

93%

Postmenopausal women only: (n=423)

Cut-off based on fixed specificity of 75%:

Index test: HE4 (cut-off: 82)

75%

Index test: ROMA (cut-off: 25)

75%

Comparator test: CA-125 (cut-off: 28)

75%

Cut-off based on ROC:

Index test: HE4 (cut-off: 91)

82%

Index test: ROMA (cut-off: 35)

89%

Comparator test: CA-125 (cut-off: 42)

87%

Outcome measure 3: PPV

Premenopausal women only: (n=361)

Cut-off based on fixed specificity of 75%:

Index test: HE4 (cut-off: 59)

16%

Index test: ROMA (cut-off: 11)

17%

Comparator test: CA-125 (cut-off: 41)

20%

Cut-off based on ROC:

Index test: HE4 (cut-off: 63)

20%

Index test: ROMA (cut-off: 13)

22%

Comparator test: CA-125 (cut-off: 109)

36%

Postmenopausal women only: (n=423)

Cut-off based on fixed specificity of 75%:

Index test: HE4 (cut-off: 82)

46%

Index test: ROMA (cut-off: 25)

47%

Comparator test: CA-125 (cut-off: 28)

46%

Cut-off based on ROC:

Index test: HE4 (cut-off: 91)

53%

Index test: ROMA (cut-off: 35)

66%

Comparator test: CA-125 (cut-off: 42)

61%

Outcome measure 4: NPV

Premenopausal women only: (n=361)

Cut-off based on fixed specificity of 75%:

Index test: HE4 (cut-off: 59)

98%

Index test: ROMA (cut-off: 11)

98%

Comparator test: CA-125 (cut-off: 41)

100%

Cut-off based on ROC:

Index test: HE4 (cut-off: 63)

98%

Index test: ROMA (cut-off: 13)

98%

Comparator test: CA-125 (cut-off: 109)

98%

Postmenopausal women only: (n=423)

Cut-off based on fixed specificity of 75%:

Index test: HE4 (cut-off: 82)

94%

Index test: ROMA (cut-off: 25)

95%

Comparator test: CA-125 (cut-off: 28)

93%

Cut-off based on ROC:

Index test: HE4 (cut-off: 91)

93%

Index test: ROMA (cut-off: 35)

95%

Comparator test: CA-125 (cut-off: 42)

94%

Of the 901 women included in the study, 784 (87%) were evaluable (Figure 1). The major cause of exclusion was missing or incomplete data (13%).

Reasons:

65 Serum samples were taken but did not reach the laboratory

19 Serum samples were not obtained before surgery

25 Ovarian cysts had disappeared and no surgery was performed

6 Incomplete or failure in case report form

2 Withdrawal of informed consent

Oranratanphan, 2018

Type of study: prospective analytic study

Setting and country:

King Chulalongkorn Memorial Hospital, Thailand.

Funding and conflicts of interest: This research was supported by the Ratchadapiseksompotch Fund, Faculty of Medicine, Chulalongkorn University.

The authors declare that they have no conﬂicts of interest

Inclusion criteria: Women,aged above than 18 years, with nonfunctional ovarian cysts larger than3cminmaximaldiameter,scheduledforsurgery

Exclusion criteria: Patients with the previous history of ovarian cancer, primary peritoneal cancer or any known malignancies, previous bilateral oophorectomy, pregnancy, or functional cysts were excluded.

N= 281 (n=225 benign (80.1%); 56 malignancy (19.9%), of which n=26 early stage OC (9.2%), n=25 advanced-stage OC (8.9%), n=5 other malignancies (1.8%))

Prevalence (OC): 18.1%

Mean age ± SD: 44 ± 13.16 years

Sex: 0% M / 100% F

Other important characteristics:

Post-menopause (n, %): 68 (24.2%)

Describe index test – HE4: electrochemiluminescence immunoassay (ECLIA) with the same

operator and the same machine (MODULAR ANALYTICS E170, cobas e601 and cobas e602 analyzers)

Cut-off point(s): >70 pMol/L and >150 pMol/L

Describe index test – ROMA: The ROMA score was calculated automatically by the computer program with a standard formula

Cut-off point(s): not specified for pre- and postmenopause, but shown separately.

Comparator test – CA-125:

electrochemiluminescence immunoassay (ECLIA) with the same

operator and the same machine (MODULAR ANALYTICS E170, cobas e601 and cobas e602 analyzers)

Cut-off point(s): >35 IU/mL

Describe reference test: pathology report

Cut-off point(s): NA

Time between the index test en reference test: before surgery, timing not specified.

For how many participants were no complete outcome data available?

N (%): not reported, presumably only patients with complete data were selected.

Reasons for incomplete outcome data described? NA

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure 1: sensitivity

Index test: HE4 (cut-off: >150 pMol/L)

53.4%

Index test: HE4 (cut-off: >70 pMol/L)

74.1%

Index test: ROMA (pre-menopause)

66.67%

Index test: ROMA (post-menopause)

88.89%

Comparator test: CA-125 (>35 IU/mL)

87.9%

Outcome measure 2: specificity

Index test: HE4 (cut-off: >150 pMol/L)

97.8%

Index test: HE4 (cut-off: >70 pMol/L)

86.5%

Index test: ROMA (pre-menopause)

88.527%

Index test: ROMA (post-menopause)

70%

Comparator test: CA-125 (>35 IU/mL)

46.2%

Outcome measure 3: PPV

Index test: HE4 (cut-off: >150 pMol/L):

86.1%

Index test: HE4 (cut-off: >70 pMol/L)

59.2%

Index test: ROMA (pre-menopause)

48.78%

Index test: ROMA (post-menopause)

66.67%

Comparator test: CA-125 (>35 IU/mL)

29.8%

Outcome measure 4: NPV

Index test: HE4 (cut-off: >150 pMol/L)

89%

Index test: HE4 (cut-off: >70 pMol/L)

93.3%

Index test: ROMA (pre-menopause)

94.197%

Index test: ROMA (post-menopause)

90.92%

Comparator test: CA-125 (>35 IU/mL)

93.6%

Pitta, 2013

Type of study: cross-sectional study

Setting and country: Unicamp school of medicine, Brazil.

Funding and conflicts of interest: no competing interests declared

Inclusion criteria: women with adnexal masses of suspected ovarian origin.

Exclusion criteria: women with previous operation for adnexal mass and ongoing pregnancy.

N=176 adnexal mass (116 benign, 60 malignant)

Prevalence (among N total for benign and malignant tumours): 34.1%

Mean age ± SD:

Benign: 47.9 ± 16.6

Malignant: 50.8 ± 20.5

Sex: 0% M / 100% F

Other important characteristics:

Postmenopausal women (n, %):

Benign: 49 (42.%)

Malignant: 38 (61.7%)

Histology (n, %):

Benign:

Epithelial 40 (34.5%), germ line 28 (24.1%); sex cord and stromal 20 (17.3%); non-neoplastic 28 (24.1%).

Malignant: epithelial 47 (78.3%); germ line 6 (10.0%), sex cord and stromal 7 (12.7%)

Describe index test: ROMA: ARCHITECT CA125 II assay, which is a Chemiluminescent Microparticle Immunoassay (CMIA)

HE4: HE4 enzyme immunometric assay Kits (EIA) (Fujirebio Diagnostics), based on the direct sandwich technique, solid-phase immunoassay according to the manufacturers’ instructions.

Cut-off point(s):

ROMA:

Premenopausal women: 5.01%

Postmenopausal women: 18.2%

HE4:

Premenopausal women: 41.6 pmol/L

Postmenopausal women: 96.6 pmol/L

Comparator test:

CA-125: solid phase chemiluminescence using OM-MA test. Immunochemiluminometric assay (ICMA), Immulite 2000 OM-MA, Siemens Medical Solutions Diagnostics.

Cut-off point(s):

Premenopausal women: 69.8 U/L

Postmenopausal women: 21.7 U/L

Describe reference test: histopathological diagnosis of surgical specimen

Cut-off point(s): NA.

Time between the index test en reference test: not reported. Blood was drawn before surgery.

For how many participants were no complete outcome data available?

N (%): not reported.

Reasons for incomplete outcome data described? Not reported.

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure 1: sensitivity

Index test: HE4

58.3% (95% CI 49.4 to 67.3%)

Index test: ROMA

56.7% (95% CI 47.6 to 65.7%)

Comparator test: CA-125

65.0% (95%CI 56.3 to 73.7%)

Outcome measure 2: specificity

Index test: HE4

84.5% (95% CI 74.7 to 94.2%)

Index test: ROMA

87.9% (95% CI 78.7 to 97.1%)

Comparator test: CA-125

75.9% (95%CI 65.6 to 86.1%)

Outcome measure 3: PPV

Index test: HE4

66.0%

Index test: ROMA

70.8%

Comparator test: CA-125

58.2%

Outcome measure 4: NPV

Index test: HE4

79.9%

Index test: ROMA

79.9%

Comparator test: CA-125

80.7%

Borderline tumours were classified as malignant: 10 out of 47 epithelial malignant tumours were rendered as borderline).

Stiekema, 2014

Type of study:

Retrospective observational study

Setting and country: Netherlands Cancer Institute, Netherlands.

Funding and conflicts of interest: there were no conflicts of interest.

Inclusion criteria: all women with histologically confirmed epithelial ovarian cancer or benign ovarian disease who were referred to the Netherlands Cancer institute.

Exclusion criteria: Borderline tumours and/or patients with insufficient clinical data to establish disease stage were excluded.

N= 181 (34 (18.8%) benign disease; 147 (81.2%) malignant disease).

Prevalence EOC (excluding other malignancies than EOC): 73.5%

Mean age ± SD:

Benign: 57 (SD not reported)

OC: 58 (SD not reported)

Sex: 0% M / 100% F

Other important characteristics:

Postmenopausal (%):

Benign: 77%

OC: 75%

Histology (n,%):

Benign disease:

Serous cysteadenoma 9 (27%); Mucinous cysteadenoma 13 (38%); Cysteadenoma NOS 3 (9%); Othert than adenoma 3 (9%);

Missing 6 (18%)

OC:

Papillary serous 72(46%); Mucinous 4 (3%); Clear cell 7 (5%); Endometrioïd 25 (16.0%); Adenocarcinoma NOS 30 (29%) ; Other than EOC 9 (6%).

Describe index test – HE4: ARCHITECT i1000SRr

Cut-off point(s): 70 pmol/L

Describe index test – ROMA: as suggested by Moore et al.

Cut-off point(s): pre-menopausal 0.129; post-menopausal 0.278

Comparator test - CA-125:

Cut-off point(s): 35 kU/L

Describe reference test: histopathology

Cut-off point(s): NA

Time between the index test and reference test: not reported.

For how many participants were no complete outcome data available? N (%) Not reported, presumably patients with complete data were selected.

Reasons for incomplete outcome data described? NA

Outcome measures and effect size (include 95%CI and p-value if available):

Outcome measure 1: sensitivity

Pre-menopausal women only (n=38)

Index test: HE4 (cut-off: 70 pmol/L)

0.84 (95% CI 0.67 to 0.95)

Index test: ROMA (cut-off: 0.129)

0.84 (95% CI 0.67 to 0.95)

Comparator test: CA-125 (cut-off: 35 kU/L)

0.91 (95% CI 0.75 to 0.98)

Post-menopausal women only (n=143)

Index test: HE4 (cut-off: 70 pmol/L)

0.91 (95% CI 0.84 to 0.96)

Index test: ROMA (cut-off: 0.278)

0.91 (95% CI 0.84 to 0.96)

Comparator test: CA-125 (cut-off: 35 kU/L)

0.91 (95% CI 0.84 to 0.96)

Outcome measure 2: specificity

Pre-menopausal women only (n=38)

Index test: HE4 (cut-off: 70 pmol/L)

1.00 (95% CI 0.63 to 1.00)

Index test: ROMA (cut-off: 0.129)

1.00 (95% CI 0.63 to 1.00)

Comparator test: CA-125 (cut-off: 35 kU/L)

0.62 (95% CI 0.24 to 0.91)

Post-menopausal women only (n=143)

Index test: HE4 (cut-off: 70 pmol/L)

0.96 (95% CI 0.80 to 1.00)

Index test: ROMA (cut-off: 0.278)

0.77 (95% CI 0.56 to 0.91)

Comparator test: CA-125 (cut-off: 35 kU/L)

0.65 (95% CI 0.44 to 0.83)

180 healthy controls were recruited in the study. Data not reported here.

Table of quality assessment for systematic reviews of diagnostic studies

Based on AMSTAR checklist (Shea, 2007; BMC Methodol 7: 10; doi:10.1186/1471-2288-7-10) and PRISMA checklist (Moher, 2009; PLoS Med 6: e1000097; doi:10.1371/journal.pmed1000097)

Study

First author, year

Appropriate and clearly focused question?¹

Yes/no/unclear

Comprehensive and systematic literature search?²

Yes/no/unclear

Description of included and excluded studies?³

Yes/no/unclear

Description of relevant characteristics of included studies?⁴

Yes/no/unclear

Assessment of scientific quality of included studies?⁵

Yes/no/unclear

Enough similarities between studies to make combining them reasonable?⁶

Yes/no/unclear

Potential risk of publication bias taken into account?⁷

Yes/no/unclear

Potential conflicts of interest reported?⁸

Yes/no/unclear

Ferraro, 2013

Yes, to critically revise the available literature on the comparison between the diagnostic accuracy of HE4 and carbohydrate antigen 125 (CA-125) to conﬁrm the additional clinical value of HE4.

Yes

Yes, see supplementary file 1 on website of journal with reasons for exclusion

Yes, although mean age was not reported per study.

Yes, QUADAS-II tool was used. Overall quality of evidence was low and authors therefore conclude that confidence in effect estimates are therefore limited.

Unclear, only 8 of 16 included studies concern target population (women with pelvic mass undergoing marker determination for diagnostic purposes).

Yes

No, not reported for the individual studies.

Research question (PICO) and inclusion criteria should be appropriate (in relation to the research question to be answered in the clinical guideline) and predefined.
Search period and strategy should be described; at least Medline searched.
Potentially relevant studies that are excluded at final selection (after reading the full text) should be referenced with reasons.
Characteristics of individual studies relevant to the research question (PICO) should be reported.
Quality of individual studies should be assessed using a quality scoring tool or checklist (preferably QUADAS-2; COSMIN checklist for measuring instruments) and taken into account in the evidence synthesis.
Clinical and statistical heterogeneity should be assessed; clinical: enough similarities in patient characteristics, diagnostic tests (strategy) to allow pooling? For pooled data: at least 5 studies available for pooling; assessment of statistical heterogeneity and, more importantly (see Note), assessment of the reasons for heterogeneity (if present)? Note: sensitivity and specificity depend on the situation in which the test is being used and the thresholds that have been set, and sensitivity and specificity are correlated; therefore, the use of heterogeneity statistics (p-values; I²) is problematic, and rather than testing whether heterogeneity is present, heterogeneity should be assessed by eye-balling (degree of overlap of confidence intervals in Forest plot), and the reasons for heterogeneity should be examined.
There is no clear evidence for publication bias in diagnostic studies, and an ongoing discussion on which statistical method should be used. Tests to identify publication bias are likely to give false-positive results, among available tests, Deeks’ test is most valid. Irrespective of the use of statistical methods, you may score “Yes” if the authors discuss the potential risk of publication bias.
Sources of support (including commercial co-authorship) should be reported in both the systematic review and the included studies. Note: To get a “yes,” source of funding or support must be indicated for the systematic review AND for each of the included studies.

Risk of bias assessment diagnostic accuracy studies (QUADAS II, 2011)

Research question:

Study reference

Patient selection

Index test

Reference standard

Flow and timing

Comments with respect to applicability

Huy, 2018

Was a consecutive or random sample of patients enrolled?

Unclear

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

If a threshold was used, was it pre-specified?

Yes

Is the reference standard likely to correctly classify the target condition?

Yes

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Yes

Did patients receive the same reference standard?

Yes

Were all patients included in the analysis?

Yes, because only patients with complete data were selected.

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes, type of cysts not specified.

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: HIGH, only patients with complete data selected.

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW, by using a prespecified cut-off bias is unlikely.

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: LOW, presumably pathologist was not aware of tumor marker values.

CONCLUSION

Could the patient flow have introduced bias?

RISK: LOW

Liest, 2018

Was a consecutive or random sample of patients enrolled?

No, non-randomized

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

If a threshold was used, was it pre-specified?

Yes, two thresholds were studied (fixed and based on ROC)

Is the reference standard likely to correctly classify the target condition?

Yes

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Yes, all included patients

Did patients receive the same reference standard?

Yes

Were all patients included in the analysis?

Yes, because only patients with complete data were selected.

Are there concerns that the included patients do not match the review question?

Yes, because type of cysts were not described.

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes, because type of cysts were not described.

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: HIGH, only people with complete data included, reasons for inclusion were reported and could have introduced selection bias.

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW, by using a prespecified cut-off bias is unlikely.

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: LOW, presumably pathologist was not aware of tumor marker values.

CONCLUSION

Could the patient flow have introduced bias?

RISK: LOW

Oranratanphan, 2018

Was a consecutive or random sample of patients enrolled?

Unclear

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

If a threshold was used, was it pre-specified?

Yes, except for ROMA which was not specified.

Is the reference standard likely to correctly classify the target condition?

Yes

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Yes

Did patients receive the same reference standard?

Yes

Were all patients included in the analysis?

Yes, because only patients with complete data were selected.

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes, because type of cysts were not described.

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: HIGH, only patients with complete data selected.

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: UNCLEAR, unknown cut-off used for ROMA

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: LOW, presumably pathologist was not aware of tumor marker values.

CONCLUSION

Could the patient flow have introduced bias?

RISK: LOW

Pitta, 2013

Was a consecutive or random sample of patients enrolled?

Unclear

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

If a threshold was used, was it pre-specified?

Yes

Is the reference standard likely to correctly classify the target condition?

Yes

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Yes

Did patients receive the same reference standard?

Yes

Were all patients included in the analysis?

Yes, because only patients with complete data were selected.

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes, possibly patients with e.g. simple cysts included which should be excluded according to our PICO.

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: HIGH, only people with complete data included, reasons for inclusion were reported and could have introduced selection bias.

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW, by using a prespecified cut-off bias is unlikely.

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: LOW, presumably pathologist was not aware of tumor marker values.

CONCLUSION

Could the patient flow have introduced bias?

RISK: LOW,

Stiekema, 2014

Was a consecutive or random sample of patients enrolled?

Unclear

Was a case-control design avoided?

Yes

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

If a threshold was used, was it pre-specified?

Yes

Is the reference standard likely to correctly classify the target condition?

Yes

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

Was there an appropriate interval between index test(s) and reference standard?

Unclear

Did all patients receive a reference standard?

Yes

Did patients receive the same reference standard?

Yes

Were all patients included in the analysis?

Yes, because presumably only patients with complete data were selected.

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: HIGH, only people with complete data included.

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW, by using a prespecified cut-off bias is unlikely.

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: LOW, presumably pathologist was not aware of tumor marker

values.

CONCLUSION

Could the patient flow have introduced bias?

RISK: LOW

(first author, year of publication)

Was a consecutive or random sample of patients enrolled?

Yes/No/Unclear

Was a case-control design avoided?

Yes/No/Unclear

Did the study avoid inappropriate exclusions?

Yes/No/Unclear

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes/No/Unclear

If a threshold was used, was it pre-specified?

Yes/No/Unclear

Is the reference standard likely to correctly classify the target condition?

Yes/No/Unclear

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes/No/Unclear

Was there an appropriate interval between index test(s) and reference standard?

Yes/No/Unclear

Did all patients receive a reference standard?

Yes/No/Unclear

Did patients receive the same reference standard?

Yes/No/Unclear

Were all patients included in the analysis?

Yes/No/Unclear

Are there concerns that the included patients do not match the review question?

Yes/No/Unclear

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes/No/Unclear

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes/No/Unclear

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: LOW/HIGH/UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW /HIGH/UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: LOW /HIGH/UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

RISK: LOW /HIGH/UNCLEAR

(first author, year of publication)

Was a consecutive or random sample of patients enrolled?

Yes/No/Unclear

Was a case-control design avoided?

Yes/No/Unclear

Did the study avoid inappropriate exclusions?

Yes/No/Unclear

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes/No/Unclear

If a threshold was used, was it pre-specified?

Yes/No/Unclear

Is the reference standard likely to correctly classify the target condition?

Yes/No/Unclear

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes/No/Unclear

Was there an appropriate interval between index test(s) and reference standard?

Yes/No/Unclear

Did all patients receive a reference standard?

Yes/No/Unclear

Did patients receive the same reference standard?

Yes/No/Unclear

Were all patients included in the analysis?

Yes/No/Unclear

Are there concerns that the included patients do not match the review question?

Yes/No/Unclear

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Yes/No/Unclear

Are there concerns that the target condition as defined by the reference standard does not match the review question?

Yes/No/Unclear

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: LOW/HIGH/UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: LOW /HIGH/UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: LOW /HIGH/UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

RISK: LOW /HIGH/UNCLEAR

Judgments on risk of bias are dependent on the research question:

some items are more likely to introduce bias than others, and may be given more weight in the final conclusion on the overall risk of bias per domain:

Patient selection:

Consecutive or random sample has a low risk to introduce bias.
A case control design is very likely to overestimate accuracy and thus introduce bias.
Inappropriate exclusion is likely to introduce bias.

Index test:

This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.
Selecting the test threshold to optimise sensitivity and/or specificity may lead to overoptimistic estimates of test performance and introduce bias.

Reference standard:

When the reference standard is not 100% sensitive and 100% specific, disagreements between the index test and reference standard may be incorrect, which increases the risk of bias.
This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.

Flow and timing:

If there is a delay or if treatment is started between index test and reference standard, misclassification may occur due to recovery or deterioration of the condition, which increases the risk of bias.
If the results of the index test influence the decision on whether to perform the reference standard or which reference standard is used, estimated diagnostic accuracy may be biased.
All patients who were recruited into the study should be included in the analysis, if not, the risk of bias is increased.

Judgement on applicability:

Patient selection: there may be concerns regarding applicability if patients included in the study differ from those targeted by the review question, in terms of severity of the target condition, demographic features, presence of differential diagnosis or co-morbidity, setting of the study and previous testing protocols.

Index test: if index tests methods differ from those specified in the review question there may be concerns regarding applicability.

Reference standard: the reference standard may be free of bias but the target condition that it defines may differ from the target condition specified in the review question.

Tabel Exclusie na het lezen van het volledige artikel

Auteur en jaartal	Redenen van exclusie
Abdel-Azeez 2010	Valt binnen search review Ferraro 2013
Adballa 2013	Voldoet niet aan PICO (inclusie van simpele cystes en endometrioom)
Al Musalhi 2016	Voldoet niet aan PICO (veel niet-epitheliale tumoren geïncludeerd)
Andersen 2010	Valt binnen search review Ferraro 2013
Anton 2012	Voldoet niet aan PICO (onduidelijk definitieve PA)
Bandiera 2013	Voldoet niet aan PICO (controles met gezonde vrouwen; inclusie endometriose)
Cao 2018	Voldoet niet aan PICO (prognose i.p.v. differentiatie)
Chan 2013	Voldoet niet aan PICO (inclusie van endometrioom)
Chang 2011	Valt binnen search review Ferraro 2013
Chen 2014	Voldoet niet aan PICO (geen vergelijking diagnostische performance van tumormarkers)
Chen 2018	Voldoet niet aan PICO (inclusie van simpele cystes en endometrioom)
Cho 2015	Voldoet niet aan PICO (inclusie van endometrioom)
Cymbaluk-Ploska 2016	Voldoet niet aan PICO (inclusie van simpele cystes)
Dayyani 2016	Review van onvoldoende kwaliteit (geen risk of bias beoordeling gedaan; onduidelijke of het een systematische search betrof)
Dolgun 2017	Voldoet niet aan PICO (inclusie van endometrioom)
ElSharkawy 2018	Voldoet niet aan PICO (alleen EOC II/III stadium vrouwen en vergelijking met gezonde controles)
Fakhar 2018	Review van onvoldoende kwaliteit (geen risk of bias beoordeling gedaan; onduidelijke of het een systematische search betrof)
Ferraro 2013	Dubbele publicatie van Ferraro 2013
Ferraro 2018	Geen systematische review (implementatiestuk)
Fujiwara 2015	Voldoet niet aan PICO (onduidelijk definitieve PA)
Goff 2017	Voldoet niet aan PICO (inclusie van endometrioom)
Hamed 2013	Voldoet niet aan PICO
Holcomb 2011	Valt binnen search review Ferraro 2013
Huang 2018	Voldoet niet aan PICO (geen vergelijking met CA125)
Jacob 2011	Valt binnen search review Ferraro 2013
Jia 2016	Geen systematische review (narrative review)
Jia 2017	Voldoet niet aan PICO (geen vergelijking met CA125)
Kadija 2012	Voldoet niet aan PICO (inclusie van endometrioom)
Kaijser 2013	Voldoet niet aan PICO (geen vergelijking diagnostische performance van tumormarkers)
Kaijser 2014	Voldoet niet aan PICO (inclusie van endometrioom)
Karakaya 2016	Voldoet niet aan PICO (vergelijkt met gezonde controles)
Karlsen 2012	Voldoet niet aan PICO (inclusie van endometrioom)
Karlsen 2014	Voldoet niet aan PICO (geen vergelijking met CA125)
Karlsen 2015	Voldoet niet aan PICO (geen vergelijking diagnostische performance van tumormarkers)
Kim 2011	Valt binnen search review Ferraro 2013
Kondalsamy-Chennakesavan 2013	Voldoet niet aan PICO (louter EOC I)
Kristjansdottir 2013	Voldoet niet aan PICO (niet-epitheliale cystes op voorhand geëxcludeerd)
Lenhard 2011	Valt binnen search review Ferraro 2013
Leung 2016	Voldoet niet aan PICO (inclusie van endometrioom)
Lin 2013	Review van onvoldoende kwaliteit (resultaten van risk of bias beoordeling niet beschikbaar)
Lokich 2015	Voldoet niet aan PICO (geen vergelijking diagnostische performance van tumormarkers)
Lycke 2018	Voldoet niet aan PICO (inclusie van simpele cystes en endometrioom)
Macedo 2014	Voldoet niet aan PICO (geen vergelijking met CA125)
Macuks 2011	Valt binnen search review Ferraro 2013
Macuks 2012	Voldoet niet aan PICO (inclusie endometrioom)
Manganaro 2015	Voldoet niet aan PICO (inclusie op basis van MRI)
Melo 2018	Voldoet niet aan PICO (inclusie van endometrioom)
Meng 2017	Voldoet niet aan PICO (geen vergelijking diagnostische performance van tumormarkers)
Minar 2018	Voldoet niet aan PICO (geen vergelijking diagnostische performance van tumormarkers)
Modarres-Gilani 2011	Valt binnen search review Ferraro 2013
Montagnana 2009	Valt binnen search review Ferraro 2013
Moore 2009	Valt binnen search review Ferraro 2013
Moszynski 2013	Voldoet niet aan PICO (inclusie van simpele cystes)
Partheen 2011	Valt binnen search review Ferraro 2013
Piovano 2017	Voldoet niet aan PICO (geen vergelijking diagnostische performance van tumormarkers)
Pitta 2013	Review van Ferraro (2012) als uitgangspunt gekozen, search van Pitta overlapt hiermee en voegt daarom niets toe.
Pitta 2013	Voldoet niet aan PICO (inclusie van endometrioom)
Plotti 2018	Voldoet niet aan PICO (geen vergelijking met CA125)
Richards 2015	Voldoet niet aan PICO (geen vergelijking diagnostische performance van tumormarkers)
Romagnolo 2016	Voldoet niet aan PICO (inclusie van endometrioom)
Ruggeri 2011	Valt binnen search review Ferraro 2013
Sandri 2013	Voldoet niet aan PICO (inclusie van simpele cystes)
Scaletta 2017	Review van onvoldoende kwaliteit (geen risk of bias beoordeling gedaan; onduidelijke of het een systematische search betrof)
Shah 2009	Valt binnen search review Ferraro 2013
Shen 2017	Voldoet niet aan PICO (inclusie van endometrioom)
Sölétormos 2016	Voldoet niet aan PICO (geen vergelijking met HE4)
Terzic 2014	Voldoet niet aan PICO
Van Gorp 2011	Valt binnen search review Ferraro 2013
Wang 2014	Review van onvoldoende kwaliteit (geen risk of bias beoordeling gedaan; onduidelijke of het een systematische search betrof)
Wilailak 2015	Voldoet niet aan PICO (geen vergelijking diagnostische performance van tumormarkers)
Winarto 2014	Voldoet niet aan PICO (inclusie van endometriose)
Wu 2012	Voldoet niet aan PICO (geen vergelijking met CA125)
Xi 2017	Voldoet niet aan PICO
Xu 2016	Voldoet niet aan PICO (inclusie van simpele cystes en endometrioom)
Yanaranop 2016	Voldoet niet aan PICO (inclusie van simpele cystes en endometrioom)
Yanaranop 2018	Voldoet niet aan PICO (alleen EOC I/II)
Yang 2013	Voldoet niet aan PICO (geen vergelijking met CA125)
Yu 2012	Niet fulltekst beschikbaar
Yu 2016	Voldoet niet aan PICO (inclusie van endometrioom)
Zapardiel 2017	Voldoet niet aan PICO (inclusie van endometrioom)
Zhang 2015	Voldoet niet aan PICO (veel myomen geïncludeerd)
Zhen 2014	Review van Ferraro (2012) als uitgangspunt gekozen, search van Zhen 2008-2012 overlapt hiermee en voegt daarom niets toe.
Zheng 2012	Voldoet niet aan PICO (inclusie van endometriose)
Zheng 2016	Voldoet niet aan PICO (inclusie van simpele cystes en endometrioom)

Verantwoording

Beoordelingsdatum en geldigheid

Laatst beoordeeld : 11-03-2021

Bij het opstellen van de module heeft de werkgroep een inschatting gemaakt over de maximale termijn waarop herbeoordeling moet plaatsvinden en eventuele aandachtspunten geformuleerd die van belang zijn bij een toekomstige herziening (update). De geldigheid van de richtlijnmodule komt eerder te vervallen indien nieuwe ontwikkelingen aanleiding zijn een herzieningstraject te starten.

Module^[1]	Regiehouder(s)^[2]	Jaar van autorisatie	Eerstvolgende beoordeling actualiteit richtlijn^[3]	Frequentie van beoordeling op actualiteit^[4]	Wie houdt er toezicht op actualiteit^[5]	Relevante factoren voor wijzigingen in aanbeveling^[6]
Tumormarkers	NVOG	2020	2025	Elke 5 jaar	NVOG	Ontwikkelingen in het vakgebied, publicatie van nieuwe onderzoeksresultaten.

[1] Naam van de module

[2] Regiehouder van de module (deze kan verschillen per module en kan ook verdeeld zijn over meerdere regiehouders)

[3] Maximaal na vijf jaar

[4] (half)Jaarlijks, eens in twee jaar, eens in vijf jaar

[5] regievoerende vereniging, gedeelde regievoerende verenigingen, of (multidisciplinaire) werkgroep die in stand blijft

[6] Lopend onderzoek, wijzigingen in vergoeding/organisatie, beschikbaarheid nieuwe middelen

Initiatief en autorisatie

Initiatief:

Nederlandse Vereniging voor Obstetrie en Gynaecologie

Geautoriseerd door:

Nederlandse Vereniging voor Obstetrie en Gynaecologie
Nederlandse Vereniging voor Klinische Chemie en Laboratoriumgeneeskunde
Patiëntenfederatie Nederland
Stichting Bekkenbodem4All

Algemene gegevens

De richtlijnontwikkeling werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten en werd gefinancierd uit de Stichting Kwaliteitsgelden Medisch Specialisten (SKMS). De financier heeft geen enkele invloed gehad op de inhoud van de richtlijn.

De richtlijnmodule is goedgekeurd door:

Stichting Bekkenbodem4All

Doel en doelgroep

Doel

Het doel is om gynaecologen te voorzien van een landelijk gedragen richtlijn voor het voorkomen en het behandelen van vrouwen met een (benigne) vergroot ovarium en die voldoet aan de eisen van een AGREE-instrument volgens de EBRO-methode. De te ontwikkelen richtlijn voorziet in de meest recente 'evidence based' informatie over het onderwerp (benigne) vergroot ovarium.

Met het opstellen van een dergelijke richtlijn wordt beoogd de onduidelijkheid en onzekerheid over het diagnosticeren en behandelen van een (benigne) ovariumcyste weg te nemen.

Doelgroep

Patiëntencategorie

De richtlijn geldt voor alle pre- en postmenopauzale vrouwen met een vergroot ovarium (vanaf de menarche), bij wie niet eerder een maligniteit (mamma, ovarium, GE) werd vastgesteld.

Richtlijngebruikers

Deze richtlijn is geschreven voor alle leden van de beroepsgroep van gynaecologen. Daarnaast kan deze richtlijn ingezien en gebruikt worden door alle zorgverleners die te maken krijgen met vrouwen met een vergroot ovarium.

Samenstelling werkgroep

Samenstelling werkgroep update 2018

Dr. P.M.A.J. Geomini, gynaecoloog, werkzaam in het Máxima Medisch Centrum te Eindhoven, NVOG, voorzitter richtlijncommissie
Dr. D. van den Broek, klinisch chemicus, werkzaam bij het NKI te Amsterdam, NVKC
Dr. J. Kaijser, gynaecoloog, werkzaam bij het Ikazia ziekenhuis te Rotterdam, NVOG
Dr. A.J. Krüse, gynaecoloog, werkzaam bij Isala te Zwolle, NVOG
Dr. C.A.R. Lok, gynaecoloog, werkzaam bij het NKI te Amsterdam, NVOG
Dr. A. Stiekema, AIOS gynaecologie, werkzaam bij het Academisch Medisch Centrum te Amsterdam, NVOG
M. Bosch, belangenbehartiging en PR Stichting Bekkenbodem4All, Stichting Bekkenbodem4All

Met ondersteuning van

dr. E.J.M. den Breejen, senior adviseur, Kennisinstituut van de Federatie Medisch Specialisten
dr. A. Bijlsma-Rutte, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
dr. W.J. Harmsen, adviseur Kennisinstituut van de Federatie Medisch Specialisten

Oude samenstelling werkgroep

Mw. dr. P.M.A.J. Geomini, gynaecoloog, Maxima Medisch Centrum, Veldhoven (voorzitter)
Dhr. prof. dr. H.A.M. Brölmann, gynaecoloog, VU Medisch Centrum, Amsterdam
Dhr. dr. F.P.H.L.J. Dijkhuizen, gynaecoloog, ziekenhuis Rijnstate, Arnhem
Dhr. dr. T. Van Gorp, gynaecologisch oncoloog, Maastricht Universitair Medisch Centrum, Maastricht
Mw. dr. C.A.R. Lok, gynaecologisch oncoloog, Centrum Gynaecologische Oncologie, Amsterdam
Mw. drs. B.M. Pijlman, gynaecoloog, Jeroen Bosch Ziekenhuis, Den Bosch
Mw. Dr. F. Vernooij, AIOS Obstetrie & Gynaecologie, epidemioloog, Meander Medisch Centrum, Amersfoort
Mw. dr. Y.M. de Mooij, AIOS, VU Medisch Centrum, Amsterdam
Ir. T.A. van Barneveld, klinisch epidemioloog, Orde van Medisch Specialisten, Utrecht
Dhr. drs. K.Y. Heida, richtlijnondersteuner Nederlandse Vereniging voor Obstetrie en Gynaecologie, Utrecht
Mw. drs. M.E.P.F. Rückert, richtlijnondersteuner Nederlandse Vereniging voor Obstetrie en Gynaecologie, Utrecht
Mw. drs. C.A.L. van Rijn, richtlijnondersteuner Nederlandse Vereniging voor Obstetrie en Gynaecologie, Utrecht

Extern advies

Mw. drs. M. Wessels, informatiespecialist, Orde van Medisch Specialisten, Utrecht

Belangenverklaringen

De KNMG-code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement, kennisvalorisatie) hebben gehad. Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

Belangenverklaringen werkgroep update 2018

Werkgroeplid	Functie	Nevenfuncties	Gemelde belangen	Ondernomen actie
Geomini*	Gynaecoloog	Geen	mede organisator van Nederlandse IOTA cursus (gericht op implementeren IOTA regels voor echo beschrijving bij vergroot adnex) 1e auteur review: Geomini et al. The accuracy of risk scores in predicting ovarian malignancy: a systematic review. Obstet Gynecol. 2009 Feb;113:384-94.	Geen
Kruse	Gynaecoloog-oncoloog, Isala, Zwolle	Geen	Geen	Geen
Kaijser	gynaecoloog Ikazia Ziekenhuis Rotterdam	Cursusinstructeur: echografie van het vergrote ovarium: Nederlandse IOTA cursus. Specialistische echocursus voor afwijkingen in de adnexiele regio. Jaarlijkse eendaags cursus voor gynaecologen en AIOS mede georganiseerd door Biomedic-Samsung, Nederland. Locatie Almere. Medio Juni 2019 zal dit voor de 4e maal plaatsvinden. Sprekersvergoeding à 500 euro.	Klinisch werkzaam met Samsun WS80 echotoestel met geïntegreerd IOTA ADNEX model voor differentiatie van adnextumoren. Toestel wordt door Ikazia Ziekenhuis via officieel huurcontract afgenomen bij Biomedic Samsung, Nederland	Geen trekker (1e auteur) bij module over diagnostische modellen (UV4)
Lok	Gynaecologisch-oncoloog Antoni van Leeuwenhoek - Nederlands Kanker Instituut	Geen betaalde nevenfuncties Begeleiding van promovendi	2 jaar geleden (kleine) subsidie (4x5000 euro) van Fujirebio gehad om een onderzoeker parttime HE4 te laten onderzoeken. Geen voorwaarden aan subsidie verbonden. Ging louter om het gebruiken van hun apparatuur voor analyse van samples. Huidig onderzoek wordt niet gefinancierd door Fujirebio. Heeft eerder ook subsidies ontvangen voor onderzoek, waarbij de subsidies altijd aan het instituut werden uitbetaald om een onderzoeker van de betalen. Geen persoonlijk financieel gewin. Ging louter om het gebruik van technologieën van de betreffende industrie, geen voorwaarden verbonden aan de publicaties. Heeft zowel positieve als negatieve bevindingen over gepubliceerd. Huidig onderzoek dat raakvlakken met de richtlijn heeft: onderzoek naar RMI en IOTA en het meten van markers, waarmee de selectie van patiënten zou kunnen worden verbeterd. Geen sponsoring van de industrie voor deze studie. Heb wel over HE4 gepubliceerd, maar ook over CA-125 en RMI. Betreft louter wetenschappelijke publicaties van trial resultaten etc. Geen opiniestukken. Deze publicaties werden niet gesponsord door de industrie. Hier hangt m.i. geen intellectueel belang aan vast omdat zowel de voor- als nadelen van bv HE4 gewoon zijn gepubliceerd.	Geen trekker (1e auteur) bij module over tumormarkers (UV3).
Broek	Klinisch chemicus/afdelingshoofd Algemeen klinisch laboratorium (fulltime) Antoni van Leeuwenhoek, Amsterdam	Vakdeskundige Raad van Accreditatie ten behoeve van IS015189 (Detachering vanuit AVL, betaald) Lid commissie slimme en snelle diagnostiek (onbetaald) Lid flexpool ZonMW call vroege opsporing (vergoeding aan AVL, nu geen deelname aan ronde) Lid METC (onbetaald) Voorzitter instituut review board (onbetaald) Lid commissie moleculaire biologische diagnostiek NVKC (onbetaald) Voor alle werkzaamheden waar een vergoeding tegenover staat komt deze ten goede aan de werkgever.	Geen Ik ben betrokken bij onderzoek dat wordt gefinancierd door fondsen en/of industrie, echter de onderwerpen van deze studies richten zich op moleculaire analyses in bloed of andere lichaamsvloeistoffen. Er zijn geen projecten die aan het onderwerp van deze richtlijn raken.	Geen
Bosch	Vice Voorzitter en PR Stichting Bekkenbodem4All	Geen	Wij behartigen belangen van patiënten en geven voorlichting en ondersteuning aan mannen, vrouwen en kinderen met bekkenbodemproblemen in de breedste zin van het woord, zonder eigen belang of financieel belang.	Geen
Stiekema	AIOS Gynaecologie, Amsterdam UMC locatie AMC Meibergdreef	Geen	Afgerond promotieonderzoek februari 2016 naar de rol van biomarker van HE4 bij onder andere het vergrote ovarium. Financiering voor dit onderzoek voor een heel klein deel (kits om laboratorium bepalingen uit te voeren) via Fujirebio. Deze contacten zijn na 2016 beëindigd.	Geen trekker (1e auteur) bij module over tumormarkers (UV3).

*voorzitter richtlijncommissie

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door een afgevaardigde van de patiëntenvereniging Stichting Bekkenbodem4All in de werkgroep deel te laten nemen. De modules worden tevens voor commentaar voorgelegd aan de Patiëntenfederatie Nederland en aan de Stichting Bekkenbodem4All.

Methode ontwikkeling

Evidence based

Implementatie

In de verschillende fasen van het ontwikkelproces is rekening gehouden met de implementatie van de richtlijnmodule en de praktische uitvoerbaarheid van de aanbevelingen. Daarbij is uitdrukkelijk gelet op factoren die de invoering van de module in de praktijk kunnen bevorderen of belemmeren. De implementatietabel is te vinden in de bijlagen. Er werden geen indicatoren ontwikkeld bij deze modules.

Werkwijze

AGREE

Deze module is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010), dat een internationaal breed geaccepteerd instrument is. Voor een stap-voor-stap beschrijving hoe een evidence-based module tot stand komt wordt verwezen naar het stappenplan Ontwikkeling van Medisch Specialistische Richtlijnen van het Kennisinstituut van de Federatie Medisch Specialisten.

Knelpuntenanalyse

Uit de inventarisatie van de knelpunten door werkgroep bleek dat er een noodzaak was voor revisie en updaten van verschillende richtlijnmodules uit de richtlijn het Vergrote Ovarium (2013). Tijdens deze inventarisatie zijn er knelpunten aangedragen door relevante partijen via een schriftelijke Invitational conference. Een verslag hiervan is opgenomen in de bijlagen.

Uitgangsvraag en uitkomstmaten

Op basis van de uitkomsten van de knelpuntenanalyse zijn door de werkgroepleden en de adviseur uitgangsvragen opgesteld. Vervolgens inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet kritiek) en onbelangrijk. Indien mogelijk definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

Strategie voor zoeken en selecteren van literatuur

Aan de hand van specifieke zoektermen werd gezocht naar gepubliceerde wetenschappelijke studies in (verschillende) elektronische databases. Tevens werd aanvullend gezocht naar studies aan de hand van de literatuurlijsten van de geselecteerde artikelen. In eerste instantie werd gezocht naar studies met de hoogste mate van bewijs. De werkgroepleden selecteerden de via de zoekactie gevonden artikelen op basis van vooraf opgestelde selectiecriteria. De geselecteerde artikelen werden gebruikt om de uitgangsvraag te beantwoorden. De geselecteerde databases waarin is gezocht en de gehanteerde selectiecriteria zijn te vinden in de module met desbetreffende uitgangsvraag. De zoekstrategie is opvraagbaar bij de Richtlijnendatabase, zie het tabblad ‘Zoekverantwoording’ voor verdere details.

Kwaliteitsbeoordeling individuele studies

Individuele studies werden systematisch beoordeeld, op basis van op voorhand opgestelde methodologische kwaliteitscriteria, om zo het risico op vertekende studieresultaten (risk of bias) te kunnen inschatten. Deze beoordelingen kunt u vinden in de Risk of Bias (RoB) tabellen. De gebruikte RoB instrumenten zijn gevalideerde instrumenten die worden aanbevolen door de Cochrane Collaboration:

AMSTAR - voor systematische reviews.
Cochrane - voor gerandomiseerd gecontroleerd onderzoek.
ACROBAT-NRS - voor observationeel onderzoek.
QUADAS II - voor diagnostisch onderzoek.

Samenvatten van de literatuur

De relevante onderzoeksgegevens van alle geselecteerde artikelen werden overzichtelijk weergegeven in evidencetabellen. De belangrijkste bevindingen uit de literatuur werden beschreven in de samenvatting van de literatuur.

Beoordelen van de kracht van het wetenschappelijke bewijs

Voor interventievragen (vragen over therapie of screening)

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/).

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie (Schünemann, 2013).

GRADE	Definitie
Hoog	er is hoge zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; het is zeer onwaarschijnlijk dat de literatuurconclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Redelijk	er is redelijke zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; het is mogelijk dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Laag	er is lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; er is een reële kans dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Zeer laag	er is zeer lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; de literatuurconclusie is zeer onzeker.

Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz, 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz, 2017).

Voor vragen over diagnostische tests, schade of bijwerkingen, etiologie en prognose

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode: GRADE-diagnostiek voor diagnostische vragen (Schünemann, 2008) en een generieke GRADE-methode voor vragen over schade of bijwerkingen, etiologie en prognose. In de gehanteerde generieke GRADE-methode werden de basisprincipes van de GRADE-methodiek toegepast: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van bewijskracht op basis van de vijf GRADE-criteria (startpunt hoog; downgraden voor risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias).

Formuleren van de conclusies

Voor elke relevante uitkomstmaat werd het wetenschappelijk bewijs samengevat in een of meerdere literatuurconclusies waarbij het niveau van bewijs werd bepaald volgens de GRADE-methodiek. De werkgroepleden maakten de balans op van elke interventie (overall conclusie). Bij het opmaken van de balans werden de gunstige en ongunstige effecten voor de patiënt afgewogen. De overall bewijskracht wordt bepaald door de laagste bewijskracht gevonden bij een van de kritieke uitkomstmaten. Bij complexe besluitvorming waarin naast de conclusies uit de systematische literatuuranalyse vele aanvullende argumenten (overwegingen) een rol spelen, werd afgezien van een overall conclusie. In dat geval werden de gunstige en ongunstige effecten van de interventies samen met alle aanvullende argumenten gewogen onder het kopje 'Overwegingen'.

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals de expertise van de werkgroepleden, de waarden en voorkeuren van de patiënt, kosten, beschikbaarheid van voorzieningen en organisatorische zaken. Deze aspecten worden, voor zover geen onderdeel van de literatuursamenvatting, vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’.

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk. De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen.

Randvoorwaarden (Organisatie van zorg)

Bij de ontwikkeling van de module is expliciet rekening gehouden met de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, menskracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van een specifieke uitgangsvraag maken onderdeel uit van de overwegingen bij de bewuste uitgangsvraag, randvoorwaarden die van invloed zijn op de implementatie van de aanbeveling zijn opgenomen in de implementatietabel.

Indicatorontwikkeling

Er werden geen indicatoren ontwikkeld bij deze modules.

Kennislacunes

Tijdens de ontwikkeling van deze module is systematisch gezocht naar onderzoek waarvan de resultaten bijdragen aan een antwoord op de uitgangsvraag. Er is nagegaan of (aanvullend) wetenschappelijk onderzoek gewenst is om de uitgangsvraag te kunnen beantwoorden. Mocht dit bij deze module het geval zijn, dan is er een aanbeveling voor het doen van onderzoek opgenomen in de bijlage Kennislacunes.

Commentaar- en autorisatiefase

De module worden aan de betrokken (wetenschappelijke) verenigingen, instanties en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptmodule aangepast en definitief vastgesteld door de werkgroep. De definitieve module werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd. De commentaartabel is op te vragen bij het Kennisinstituut van de Federatie Medisch Specialisten via secretariaat@kennisinstituut.nl

Literatuur

Brouwers MC, Kho ME, Browman GP, et al. AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348.

Hultcrantz M, Rind D, Akl EA, et al. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017 Jul;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006. Epub 2017 May 18. PubMed PMID: 28529184.

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. https://richtlijnendatabase.nl/over_deze_site/richtlijnontwikkeling.html.

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

Schünemann HJ, Oxman AD, Brozek J, et al. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ. 2008;336(7653):1106-10. doi: 10.1136/bmj.39500.677199.AE. Erratum in: BMJ. 2008;336(7654). doi: 10.1136/bmj.a139. PubMed PMID: 18483053.

Ontwikkeling van Medisch Specialistische Richtlijnen: stappenplan. Kennisinstituut van de Federatie Medisch Specialisten.

Wessels M, Hielkema L, van der Weijden T. How to identify existing literature on patients' knowledge, views, and values: the development of a validated search filter. J Med Libr Assoc. 2016 Oct;104(4):320-324. PubMed PMID: 27822157; PubMed Central PMCID: PMC5079497.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Richtlijnendatabase

Het vergrote ovarium

Het vergrote ovarium

Tumormarkers bij een vergroot ovarium

Uitgangsvraag

Aanbeveling

Overwegingen

Onderbouwing

Achtergrond

Conclusies / Summary of Findings

Samenvatting literatuur

Zoeken en selecteren

Referenties

Evidence tabellen

Verantwoording

Beoordelingsdatum en geldigheid

Initiatief en autorisatie

Algemene gegevens

Doel en doelgroep

Samenstelling werkgroep

Belangenverklaringen

Inbreng patiëntenperspectief

Methode ontwikkeling

Implementatie

Werkwijze

Zoekverantwoording

Bijlagen