Diagnostische modellen bij een vergroot ovarium

Publicatiedatum: 11-03-2021

Beoordeeld op geldigheid: 11-03-2021

Project nr: 852002128
Einddatum 04-2025

Uitgangsvraag

Welk diagnostisch model op basis van echoscopie is het meest geschikt om toe te passen voor de differentiatie tussen benigne en maligne adnex pathologie?

Aanbeveling

Overweeg voor differentiatie tussen benigne en maligne adnexpathologie bij een vergroot ovarium gebruik te maken van het International Ovarian Tumor Analaysis (IOTA) ADNEX model.

Overweeg voor de beslissing wel/ niet verwijzen naar een gynaecologische oncoloog een afkapwaarde van 40% voor het ADNEX model te hanteren om een vergelijkbare specificiteit te behouden als de Risk of Malignancy Index (RMI) (cut-off 200).

Gebruik het IOTA ADNEX model alleen bij adequate kennis en voldoende expertise van de noodzakelijk IOTA echo variabelen.

Overweeg binnen elke maatschap of vakgroep om minimaal één gynaecoloog op te leiden in het echoscopisch onderzoek van het vergroot ovarium en te trainen/scholen in het correct gebruik van de gestandaardiseerde IOTA echovariabelen en het IOTA ADNEX model.

Overwegingen

De onderstaande overwegingen en aanbevelingen gelden voor het overgrote deel van de populatie waarop de uitgangsvraag betrekking heeft.

Voor- en nadelen van de interventie en de kwaliteit van het bewijs

Op basis van de literatuuranalyse lijkt de diagnostische accuratesse van het IOTA Simple Rules model alsmede de IOTA predictiemodellen (LR2 en ADNEX) gelijk of zelfs hoger te zijn dan de diagnostische accuratesse van het RMI model voor een aantal specifieke uitkomstmaten. De bevindingen uit de literatuur worden hieronder per model beschreven. Alle bevindingen berusten op observationeel onderzoek. Het ontbreken van RCT’s binnen diagnostisch onderzoek wordt gezien als kennislacune.

1. Simple Rules model

In de bijlage ‘Diagnostische modellen’ zijn afbeeldingen van de verschillende IOTA-modellen te zien. Zie figuur 4. in de bijlage ‘Diagnostische modellen’ voor het Simple Rules model.

Mogelijk zijn de gemiddelde negatief voorspellende waarde en de sensitiviteit van het model Simple Ultrasound Rules + expert beoordeling hoger dan die van het RMI model (cut-off 200) en is er mogelijk geen verschil tussen de gemiddelde positief voorspellende waarde en specificiteit van de Simple Ultrasound Rules + expert beoordeling en het RMI model. In de praktijk betekent dit dat er meer patiënten met een maligniteit van het ovarium geselecteerd worden op basis van het Simple Rules model (met expert beoordeling voor inconclusieve tumoren), zonder dat dit leidt tot meer foutpositieve uitslagen en dus onnodige verwijzingen naar een derdelijns gynaecologisch oncologisch centrum.

De bewijskracht voor de uitkomstmaten positief voorspellende waarde, negatief voorspellende waarde, sensitiviteit, specificiteit en AUC voor de diagnostische accuratesse van de het Simple Ultrasound Rules + expert beoordeling voor het differentiëren van goed- of kwaadaardige ovariumcarcinomen is laag vanwege het ernstige risico op bias (heterogeniteit, kleine onderzoekspopulaties en beperkingen referentietest).

Mogelijk zijn de gemiddelde negatief voorspellende waarde en de sensitiviteit van het Simple Rules model (met classificatie maligne bij inconclusieve tumoren) hoger dan die van het RMI model (cut-off 200), is mogelijk de gemiddelde positief voorspellende waarde van het Simple Ultrasound Rules model lager dan die van het RMI model en is onduidelijk of er een verschil is in specificiteit tussen beide modellen. In de praktijk betekent dit dat er meer patiënten met een maligniteit van het ovarium geselecteerd worden op basis van het Simple Rules model (met classificatie maligne bij inconclusieve tumoren), doch mogelijk leidt dit tot meer fout positieve uitslagen en dus onnodige verwijzingen naar een derdelijns gynaecologisch oncologisch centrum.

De bewijskracht voor de uitkomstmaten positief voorspellende waarde, negatief voorspellende waarde, sensitiviteit en specificiteit voor de diagnostische accuratesse van de het Simple Rules model (met expert beoordeling voor inconclusieve tumoren) voor het differentiëren van goed- of kwaadaardige ovariumcarcinomen is laag gezien het observationele onderzoeksdesign en is met één niveau verlaagd vanwege het ernstige risico op bias (heterogeniteit onderzoekspopulaties en beperkingen beoordeling referentietest).

2. IOTA ADNEX model

Zie figuur 5. de bijlage ‘Diagnostische modellen’ voor een weergave van het IOTA ADNEX model.

De negatief voorspellende waarde (NPV) van het IOTA ADNEX model (cut-off 10%) is mogelijk hoger dan die van het RMI-model (cut-off 200). De positief voorspellende waarde (PPV) is mogelijk gelijk tussen het IOTA ADNEX model (cut-off 10%) en het RMI model (cut-off 200). De NPV en PPV zijn niet onderzocht voor andere afkapwaarden van het IOTA ADNEX model.

De sensitiviteit van het IOTA ADNEX model is voor de afkapwaarden 1%, 3%, 5%, 10%, 15%, 20%, 25%, 30% en 40% mogelijk hoger dan het RMI-model (cut-off 200). De sensitiviteit van het IOTA ADNEX model is mogelijk gelijk aan dat van het RMI-model (cut-off 200) bij afkapwaarden van 50%.

De specificiteit van het IOTA ADNEX model is voor de afkapwaarden 1%, 3%, 5% mogelijk lager dan het RMI model (cut-off 200). De specificiteit van het IOTA ADNEX model is voor de afkapwaarden 10%, 15%, 20%, 25%, 30%, 40% en 50% mogelijk gelijk aan het RMI-model (cut-off 200).

De NPV, PPV, sensitiviteit en specificiteit van een test zijn sterk afhankelijk van de cut-off die men kiest. Bij een lage cut-off, zoals bij het IOTA ADNEX model (bijvoorbeeld 10%) verhoog je de sensitiviteit ten koste van verlies in specificiteit. Idem vice versa, waarbij dit ook geldt voor het RMI-model.

De AUC van het IOTA ADNEX model is mogelijk significant hoger dan die van het RMI-model, dit betekent dat wanneer een cut-off wordt gekozen waarbij beide testen eenzelfde specificiteit hebben het IOTA ADNEX model altijd nog een hogere sensitiviteit heeft. Wanneer de keuze voor de cut-off zo valt dat beide testen een gelijke sensitiviteit hebben, zal de specificiteit van het IOTA ADNEX model altijd beter zijn dan die van het RMI-model.

Kort samengevat kunnen meer patiënten met een maligne ovariumtumor worden verwezen bij gebruik van het IOTA ADNEX model zonder dat dit hoeft te leiden tot een toename in het aantal fout positieve verwijzingen door de cut-off van 10% te verhogen tot bijvoorbeeld 40% (specificiteit vergelijkbaar met cut-off 200 op basis van RMI-model).

De bewijskracht voor de uitkomstmaten positief voorspellende waarde, negatief voorspellende waarde, sensitiviteit, specificiteit en AUC voor de diagnostische accuratesse van het ADNEX-model voor het differentiëren van goed- of kwaadaardige ovariumcarcinomen is laag vanwege het ernstige risico op bias (heterogeniteit, kleine onderzoekspopulaties en beperkingen referentietest).

3. IOTA LR2 model

Zie figuur 6. de bijlage ‘Diagnostische modellen’ voor een weergave van het IOTA LR2 model.

De negatief voorspellende waarde (NPV) van het IOTA LR2 model (cut-off 10%) is mogelijk gelijk aan die van het RMI-model (cut-off 200), de positief voorspellende waarde (PPV) is mogelijk lager van het LR2 model (cut-off 10%). De NPV en PPV zijn niet onderzocht voor andere afkapwaarden van het IOTA LR2 model.

De sensitiviteit van het IOTA LR2 model is voor de afkapwaarden 1%, 3%, 5%, 10%, 15%, 20%, 25% en 30% mogelijk hoger dan het RMI-model (cut-off 200). De sensitiviteit van het IOTA LR2 model is mogelijk gelijk aan dat van het RMI-model (cut-off 200) bij afkapwaarden van 40% of 50%.

De specificiteit van het IOTA LR2 model is voor de afkapwaarden 1%, 3%, 5% mogelijk lager dan het RMI-model (cut-off 200). De specificiteit van het IOTA LR2 model is voor de afkapwaarden 10%, 15%, 20%, 25%, 30%, 40% en 50% mogelijk gelijk aan het RMI-model (cut-off 200).

Dit betekent in de praktijk dat er meer terechte diagnoses van ovarium carcinoom kunnen worden gesteld bij gebruik van het LR2-model zonder dat dit per se hoeft te leiden tot een toename in het aantal foutpositieve diagnoses.

De NPV, PPV, sensitiviteit en specificiteit van een test zijn sterk afhankelijk van de cut-off die men kiest. Bij een lage cut-off zoals bij het LR2-model verhoog je je sensitiviteit ten koste van verlies in specificiteit. Idem vice versa, waarbij dit ook geldt voor het RMI-model.

De AUC van het LR2-model is mogelijk significant hoger dan die van het RMI-model, dit betekent dat wanneer een cut-off wordt gekozen waarbij beide testen eenzelfde specificiteit hebben het LR2-model altijd nog een hogere sensitiviteit heeft. Wanneer de keuze voor de cut-offs zo valt dat beide testen een gelijke sensitiviteit hebben, zal de specificiteit van het IOTA LR2 model altijd beter zijn dan die van het RMI-model.

De bewijskracht voor de uitkomstmaten positief voorspellende waarde, negatief voorspellende waarde, sensitiviteit, specificiteit en AUC voor de diagnostische accuratesse van de het LR2-model voor het differentiëren van goed- of kwaadaardige ovariumcarcinomen is laag vanwege het ernstige risico op bias (heterogeniteit, kleine onderzoekspopulaties en beperkingen referentietest).

4. Expert beoordeling

Mogelijk zijn de negatief voorspellende waarde, de sensitiviteit, de specificiteit en de positief voorspellende waarden van een expert beoordeling hoger dan die van het RMI-model.

De bewijskracht voor de uitkomstmaten positief voorspellende waarde, negatief voorspellende waarde, sensitiviteit, specificiteit en AUC voor de diagnostische accuratesse van expert beoordeling voor het differentiëren van goed- of kwaadaardige ovariumcarcinomen is laag vanwege het ernstige risico op bias (heterogeniteit, kleine onderzoekspopulaties en beperkingen referentietest).

Interpretatie resultaten literatuuranalyse

De resultaten van de literatuuranalyse suggereren dat, vergeleken met het RMI-model, het IOTA Simple Rules model en de IOTA predictiemodellen (LR2 en ADNEX), waarbij de gerapporteerde cut-off flexibel is in gebruik, van toegevoegde waarde zouden kunnen zijn in het verbeteren van de triage bij ovariumtumoren.

Op basis van het onderscheidend vermogen (discriminatie) van verschillende diagnostische modellen geniet het IOTA ADNEX model duidelijk de voorkeur boven de RMI.

Het discriminerend vermogen van een predictiemodel zoals het ADNEX-model of RMI alleen zegt niet of dit model dan ook daadwerkelijk in de klinische praktijk nuttig is om te gebruiken voor klinische besluitvorming. Daarom zijn er in de klinische besliskunde verschillende methoden ontwikkeld die in staat zijn om de juist de gevolgen/effecten van een foutpositieve en foutnegatieve classificatie te onderzoeken zoals “decision curve analysis” (Balachandran, 2015; Kerr, 2016; Localio, 2012; Saville, 2015).

Deze techniek kan ons helpen om te bepalen of een predictiemodel überhaupt de moeite waard is om te gebruiken, en welk model vanuit klinisch oogpunt de voorkeur verdient. Decision curve analysis is ook al eerder toegepast in het domein van triage bij adnextumoren. Een eerdere studie van (Wynants, 2017) toont in Figuur 7 de bijlage ‘Diagnostische modellen’, deze decision curves voor onder andere het IOTA ADNEX model en RMI. Dit figuur illustreert dat voor elke cut off van het IOTA ADNEX model variërend tussen 5 en 50% de NB (“net benefit”) als uitkomstmaat van het IOTA ADNEX model altijd hoger is dan voor het RMI model. Meer specifiek, wanneer we IOTA ADNEX gebruiken voor triage, kunnen we altijd een hoger aantal terechtpositieven correct verwijzen dan wanneer we RMI gebruiken, bij hetzelfde aantal valspositieven. Stel hypothetisch dat bij een cut-off van 40% voor IOTA ADNEX de net benefit 0.05 extra bedraagt ten opzichte van RMI, dan betekent dit dat je netto 5 meer terechtpositieven hebt per 100 vrouwen met een adnextumor, bij hetzelfde aantal foutpositieven.

Deze resultaten worden eveneens bevestigd in de studie van Calster (2020). Zie ook Figuur 8 de bijlage ‘Diagnostische modellen’. Decision curve analysis kan voor ons niet bepalen welke “threshold”of cut-off dan moet worden gekozen voor het IOTA ADNEX model in Nederland.

IOTA modellen en triage

Naast het gebruik van de IOTA-modellen voor een preoperatief onderscheid tussen een goed- of kwaadaardige adnextumor lijken de IOTA-modellen ook te kunnen worden gebruikt om een expectatief/afwachtend beleid te rechtvaardigen. Dit wordt nu onderzocht binnen de IOTA fase 5 studie (Froyman, 2019), waarbij uiteindelijk met hulp van bijvoorbeeld je risico inschatting op een maligniteit bij gebruik van het IOTA ADNEX model (bijvoorbeeld risico op een maligniteit < 1 %) een expectatief beleid te rechtvaardigen valt bij asymptomatische vrouwen met een ovariële cyste.

Een eerder gepubliceerde RCT (Nunes, 2017) laat zien dat klinische implementatie van een triageprotocol met het Simple Rules model ten opzichte van RMI in het Verenigd Koninkrijk minder vaak leidt tot onnodige heelkundige interventies binnen een populatie asymptomatische postmenopauzale patiënten met een benigne adnexcyste.

Recent gepubliceerd onderzoek (IOTA fase 5; Froyman, 2019) heeft ook laten zien dat een expectatief beleid veilig lijkt, mits een betrouwbare classificatie van een benigne adnexcyste heeft plaatsgevonden. In de nabije toekomst worden uit deze studie de resultaten verwacht over de vraag of de IOTA-modellen ook gebruikt kunnen worden om die patiënten te selecteren waarbij afwachten veilig lijkt.

Waarden en voorkeuren van patiënten (en eventueel hun verzorgers)

Een belangrijk doel voor de patiënt met een afwijkend ovarium is dat een ovariumcarcinoom zo snel mogelijk en zo goed mogelijk kan worden geïdentificeerd. Een correcte diagnose van een maligne massa in een vroeg stadium zal de kans op overleving verbeteren.

Een ander belangrijk doel voor de patiënt is het correct classificeren van een massa als benigne. Dit voorkomt dat foutpositieve patiënten ten onrechte doorverwezen worden naar een gynaecologisch oncologisch centrum en dat er besloten wordt tot onnodig aanvullend beeldvormend onderzoek en potentieel een onnodige laparotomie, met of zonder vriescoupe onderzoek.

Vergeleken met de huidige situatie (gebruik van het RMI-model), zou bij het gebruik van een IOTA model geen CA 125 meer hoeven te worden geprikt bij de patiënt en kan de diagnose in één consult worden gesteld. Dit betekent dat de patiënt geen bloedafname hoeft te ondergaan en sneller weet waar zij aan toe is, wat mogelijke angst en spanning tot aan het moment van de uitslag wegneemt. Het gebruik van CA 125 in het ADNEX-model is optioneel. Het verbetert niet het onderscheidend vermogen tussen goed- en kwaadaardig. Enkel indien er een sterke verdenking op een maligniteit bestaat en je een onderscheid wenst te maken tussen een ovariële metastase van een andere primaire tumor en een klassiek stadium 2-4 invasief ovariumcarcinoom kan dit nuttig zijn.

Een potentieel voordeel van de IOTA predictiemodellen LR2 en ADNEX ten opzichte van RMI is dat beide modellen risico’s op een maligniteit voorspellen, dit in tegenstelling tot het RMI-model dat enkel een score berekend en geen absoluut risico op een maligniteit. Zeker in het licht van “shared decision making” tussen arts en patiënt kunnen deze berekende kansen op een maligniteit mogelijk een steeds belangrijkere rol spelen binnen de besluitvorming voor de patiënt. De werkgroep wil wel benadrukken dat men voorzichtig dient te zijn in het gebruik en specifiek benoemen van kansen op een maligniteit bij de klinische besluitvorming rondom ovariumtumoren wanneer IOTA-modellen worden gehanteerd.

RMI is geen risicomodel, als gynaecoloog kan je “verschuilen” achter de waarde (wel/ geen 200) en een patiënte al dan niet verwijzen of behandelen in je eigen centrum. Toch bestaat er voor elke waarde die het RMI-model berekent ook een “kans op een maligniteit”, zoals gepubliceerd in Figuur 2 uit Testa (2014). Deze figuur en bijbehorende data zijn open acces te bekijken via https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4134495/. Het is niet mogelijk de figuur in deze richtlijn op te nemen. De meeste gynaecologen zijn niet op de hoogte van deze kansen en dus worden ze niet meegenomen in de besluitvorming met de patiënte. Testa (2014) rapporteert dat bij een RMI waarde van 200 de kans dat een patiënte een maligne ovariumtumor heeft varieert tussen de 30 en 70%, afhankelijk of je werkt in een algemeen ziekenhuis of oncologisch centrum (zie de bijlage ‘Diagnostische modellen’ - Figuur 9).

Kosten (middelenbeslag)

Meys (2018) voerde een economische evaluatie uit om de kosteneffectiviteit van het RMI model te vergelijken met de kosteneffectiviteit van het Simple Rules model met subjectieve beoordeling, het Simple Rules model waarbij inconclusieve resultaten als maligne werden beoordeeld, het LR2-model en het ADNEX model toepast op de Nederlandse setting in 2014. De studie beschreef Nederlandse, volwassen vrouwen met een vergroot ovarium die geopereerd moesten worden (n=6493). De kosten-effectiviteitsanalyse betrof de periode vanaf de detectie van de massa tot het herstel van de chirurgische ingreep (korte termijn). Geanalyseerde kosten betroffen ziekenhuiskosten, patiënt- en familie gerelateerde kosten en overige kosten, zoals afwezigheid op het werk. De resultaten lieten zien dat het Simple Rules model met subjectieve beoordeling het meest kosteneffectief lijkt te zijn, bij een willingness to pay < 350 euro per additioneel percentage correct gediagnosticeerde patiënten. Daarentegen had het RMI model de laagste kans om kosteneffectief te zijn (< 3%) en was dit model inferieur ten opzichte van subjectieve beoordeling door een expert, Simple rules met subjectieve beoordeling door een expert en het IOTA adnex model vanaf een cut off van 27% en het LR2 model vanaf een cut off van 9% (Meys, 2018).

De resultaten van de budget impact analyse varieerde van een mogelijke besparing van 4,67 miljoen euro bij het gebruik van Simple rules met subjectieve beoordeling en voorkomt 11.4% incorrecte diagnoses (fout-positieven en fout negatieven) ten opzichte van gebruik van RMI. Bij implementatie van het IOTA ADNEX model in Nederland met een cutoff van 40% zal een kostenbesparing op jaarbasis optreden van ongeveer 2 miljoen euro en zal leiden tot een 5.3% toename in het aantal correcte diagnoses ten opzichte van RMI. (Zie tabel 2 in het artikel van Meys, 2018).

Westwood en collega’s (2018) voerden eveneens een kosteneffectiviteitsanalyse in het Groot-Brittannië, waarin de IOTA-modellen kosteneffectiever bleken te zijn dan RMI. Het kosteneffectiviteitsmodel binnen deze studie prioriteert sensitiviteit boven specificiteit. Het IOTA ADNEX model bij een cut off van 10% domineert RMI. Onduidelijk blijft de disutility van een toename in het aantal vals positieven en de hieraan verbonden verwijskosten naar een oncologisch centrum.

Aanvaardbaarheid voor de overige relevante stakeholders

Er zijn geen zaken bekend.

Haalbaarheid en implementatie

Alle IOTA-modellen zijn momenteel web-based en kosteloos toegankelijk via (www.iotagroup.org), via mobile-apps (deels betaald) (i.e. Apple App store: IOTA-Models (kosteloos) en IOTA ADNEX (20 euro)/ Google PLAY: IOTA ADNEX (20 euro) en eveneens ingebouwd in high-end echotoestellen (GE Healthcare, Samsung) wat het dagelijks gebruik kan vergemakkelijken (zie de bijlage ‘Diagnostische modellen’ - figuur 10).

Vergeleken met het RMI model, is bepaling van het serum CA 125 via een bloedafname niet noodzakelijk meer bij het gebruik van een IOTA-model. Dit maakt het mogelijk om triage rondom een afwijkend adnex in één consult af te ronden. Enkel bij gebruik van het IOTA ADNEX model is het bepalen van CA 125 optioneel, doch verbeterd dit niet het onderscheid tussen een goed- en kwaadaardige ovariumtumor. Behoudens de reeds hierboven aangehaalde studie van Nunes (2017) zijn er geen andere gerandomiseerde implementatiestudies verricht die de IOTA-modellen hebben vergeleken met RMI in de dagelijkse praktijk.

Een belangrijke voorwaarde voor de implementatie van de IOTA-modellen in de dagelijkse praktijk is dat de gynaecoloog gedegen kennis van het gebruik van het IOTA-model en de definities van de echovariabelen heeft. Wetenschappelijk onderzoek suggereert dat onervaren gebruikers zonder gedegen training in de IOTA terminologie en definities vaker foutief diagnosticeren dan ervaren gebruikers (Meys, 2017b).

In Nederland is er sinds 2016 de mogelijkheid om gynaecologen en AIOS specifiek te trainen in het correct gebruik van de IOTA-modellen bij de cursus ‘Echografie van het vergrote ovarium: Nederlandse IOTA cursus’. Daarnaast zijn er internationaal ook talrijke gelegenheden waar training mogelijk is (www.iotagroup.org). Het volgen van een cursus maakt de gynaecoloog nog geen expert in IOTA modellen, het is daarnaast ook belangrijk om door voldoende exposure de benodigde expertise op te bouwen. Zie ook de module ‘Organisatie van Zorg’.

In vergelijking met de andere IOTA-modellen, kent het ADNEX-model het hoogste gebruiksgemak. In het model zijn enkel “low-cost” echovariabelen (maximale diameter (mm), maximale diameter grootste soliede component (mm), aanwezigheid van meer dan 10 loci (ja/nee), aantal papillaire structuren (1,2,3 of > 3), aanwezigheid schaduw (ja/nee), aanwezigheid ascites (ja/nee)) geïncorporeerd welke in hoge mate gelijken op de huidige echovariabelen in RMI (zie de bijlage ‘Diagnostische modellen’ - Figuur 5). Kleurendoppler, een “high-cost” echovariabele (hoge mate van interobserver variatie, sterk afhankelijk van setting echotoestel) is juist daarom verlaten. Daarbij is het ADNEX model op elke tumor toepasbaar, en is het tevens in staat om te voorspellen met welk type maligne tumor je te maken hebt (multiclass risicopredictie: i.e. benigne ovariumcyste, borderline ovariumtumor, stadium 1 invasief ovariumcarcinoom, stadium 2-4 invasief ovariumcarcinoom en een metastatische tumor naar het ovarium (zie de bijlage ‘Diagnostische modellen’ 3 - Figuur 11)). Dit is zeer belangrijk omdat de behandeling voor verschillende maligne adnextumoren anders is. Op basis van deze punten geniet het ADNEX-model volgens de werkgroep de voorkeur ten opzichte van de andere IOTA-modellen. Voorafgaand aan implementatie van het IOTA ADNEX model zal landelijk eerst nog overeenstemming moeten worden bereikt met betrekking tot de gebruikte cut-off. Cut-offs van predictiemodellen zijn niet statisch, doch flexibel. De keuze voor een bepaalde cut-off die wordt gepresenteerd in een wetenschappelijk artikel zijn enkel een stip (met bijbehorende sensitiviteit en specificiteit) op de bijgeleverde ROC curve van het model. De keuze voor een bepaalde cut-off bij gebruik van een risicomodel voor onderscheid tussen benigne en maligne ovariumtumoren is afhankelijk van veel verschillende factoren.

In de eerste en de belangrijkste plaats de optimale balans tussen sensitiviteit en specificiteit, die wenselijk wordt geacht binnen het zorglandschap rondom ovariumcarcinoom in Nederland. Er lijkt in ieder geval geen toename te moeten ontstaan in het aantal foutpositieve gevallen. Dit lijkt niet wenselijk gezien de huidige capaciteitsproblemen die zijn ontstaan na het centraliseren van de zorg voor ovariumcarcinoom in Nederland.

Met de huidige keuze voor RMI met een cut-off van 200 impliceert men dat in Nederland specificiteit boven sensitiviteit wordt geprefereerd. In dit kader lijkt een cut-off van 40% in plaats van de 10% (Van Calster, 2014) voor het IOTA ADNEX model een logische keuze aangezien de specificiteit vergelijkbaar is met RMI met een cut-off van 200. Daarentegen zullen bij een IOTA ADNEX (cut-off 40%) echter méér patiënten terecht een diagnose ovariumcarcinoom verkrijgen dan bij gebruik van RMI 200. Ook decision curve analysis onderstreept deze keuze zoals hier boven beschreven.

Dit wordt verder geïllustreerd aan de hand van tabellen 3.5 en 3.6 waarbij gebruik gemaakt is van data uit de IOTA fase 1, 1b, 2 en 3 studies. Hierin werden 2070 patiënten met een afwijkend ovarium voorafgaand aan een ingreep onderzocht in 8 niet-oncologische centra. Tabel 5 laat zien dat bij IOTA ADNEX (cut-off 40%) bij ongeveer gelijke specificiteit een hogere sensitiviteit heeft dan RMI (cut-off 200).

Tabel 5 Diagnostische accuratesse RMI (cut-off 200) en ADNEX (cut-off 40%) berekend op basis van data uit IOTA fase 1, 1b, 2 en 3 studie

Sensitiviteit en specificiteit voor RMI (cut-off 200) en het ADNEX model (cut-off 40%) voor alle patiënten (n=2070)
Strategie	Sensitiviteit	95%CI		Specificiteit	95%CI
RMI 200	59.2	50.9	67.1	94.8	91.5	96.8
ADNEX 40%	70.8	60.1	79.6	96.4	93.9	97.9

Eveneens in de pas verschenen publicatie vanuit IOTA fase 5 werd gevonden dat het IOTA ADNEX model bij een cut off van 40% dezelfde specificiteit geniet als RMI met een cut-off van 200 (95%), doch een hogere sensitiviteit heeft (73% ten opzichte van 60%) (Van Calster, 2020).

In de klinische praktijk zal niet voor elke tumor van het ovarium een model noodzakelijk zijn om een diagnose te stellen. In veel gevallen is een dermoïdcyste, endometrioma, simpele cyste of een vergevorderd ovariumcarcinoom direct tijdens de echoscopie te herkennen zonder gebruik te maken van een model. Deze “instant diagnoses” zijn mogelijk door gebruik te maken van de zogenoemde “easy descriptors” van diezelfde IOTA groep. Afhankelijk van de studiepopulatie en dus case mix is soms 40% van alle tumoren direct classeerbaar.

De diagnostische testeigenschappen van RMI (cut-off 200) en het IOTA ADNEX model (cut-off 40%) wanneer deze “easy cases” buiten beschouwing worden gelaten worden in tabel 3.6 getoond. Ook hier is bij ongeveer gelijke specificiteit (+/-90%), de sensiviteit van IOTA ADNEX (cut-off 40%) hoger dan RMI (cut-off 200).

Tabel 6 Diagnostische accuratesse RMI (cut-off 200) en ADNEX (cut-off 40%) zonder “easy cases” berekend op basis van data uit IOTA fase 1, 1b, 2 en 3 studie

Sensitiviteit en specificiteit voor RMI (cut off 200) en het ADNEX model (cut off 40%) voor patiënten (n=1332) met een adnextumor niet classeerbaar met behulp van Easy Descriptors
Stategie	Sensitiviteit	95%CI		Specificiteit	95%CI
RMI 200	59.6	50.6	67.9	91.7	86.1	95.2
ADNEX 40%	71.1	59.3	80.6	93.5	89.6	96.0

Uitdagingen met betrekking tot de haalbaarheid en implementatie van het IOTA ADNEX model in Nederland worden ook onderschreven in de meest recente versie van de NICE guidance: Tests in secondary care to identify people at high risk of ovarian cancer (2017).

Het IOTA ADNEX model wordt hierin ook neergezet als een zeer veel belovende diagnostische test, die op dit moment echter nog niet routinematig kan worden geïmplementeerd voor triage van patiënten met een hoog risico op ovariumcarcinoom naar een oncologisch centrum in het Verenigd Koninkrijk. Meer onderzoek lijkt nodig naar diagnostische accuratesse en de impact op klinische besluitvorming. Dit onderzoek vindt momenteel ook plaats in het Verenigd Koninkrijk: Refining Ovarian Cancer Test accuracy Scores (ROCkeTS): protocol for a prospective longitudinal test accuracy study to validate new risk scores in women with symptoms of suspected ovarian cancer. De gepubliceerde resultaten worden verwacht vanaf 2020.

Rationale/ balans tussen de argumenten voor en tegen de interventie

Op basis van de literatuuranalyse lijken de IOTA-modellen en subjectieve echoscopische beoordeling van adnextumoren door een expert veelbelovend en mogelijk van toegevoegde waarde te zijn, vergeleken met RMI (cut-off 200). De diagnostische accuratesse van deze modellen is voor een aantal modellen gelijk of veelal hoger dan het RMI model. Dit kan de huidige triage van adnextumoren in Nederland zeker bevorderen. De bewijskracht van de studies is echter laag, een bekend fenomeen binnen diagnostisch wetenschappelijk onderzoek, daarbij het ontbreekt aan gerandomiseerd onderzoek (RCT’s) binnen dit onderzoeksdomein.

Het IOTA ADNEX model ten opzichte van andere IOTA-modellen, zoals Simple Rules en LR2, geniet momenteel de voorkeur mede door:

De toepasbaarheid op alle ovariumtumoren.
Het gebruik van “low-cost” echovariabelen.
Gebruiksgemak.
Multiclass risicopredictie.

De belangrijke vereiste voor het gebruik van IOTA modellen in de dagelijkse praktijk is adequate kennis van het correct gebruik van de IOTA modellen en definities van echovariabelen die worden toegepast binnen deze modellen. Dit werd nogmaals onderstreept in Meys (2017) waaruit bleek dat onervaren gebruikers vaker foutief diagnosticeren dan ervaren gebruikers. Training en onderwijs in gynaecologische echoscopie van het afwijkend adnex is een belangrijke voorwaarde naast aanwezigheid van een breed draagvlak bij de zorgprofessionals voordat implementatie van IOTA modellen, bij voorkeur het IOTA ADNEX model (cut-off 40%), in de dagelijkse praktijk in Nederland kan worden doorgevoerd en triage op basis van RMI (cut-off 200) definitief kan worden verlaten.

Onderbouwing

Achtergrond

Het Risk of Malignancy Index (RMI) model wordt gebruikt om een onderscheid te maken tussen een goed -of kwaadaardige ovariumtumor voorafgaand aan chirurgie. Bij een cut-off waarde van 200 kan met een sensitiviteit van 70 tot 75% en een specificiteit van 85 tot 90% de diagnose ovariumcarcinoom (inclusief borderline tumoren) worden gesteld. Dit betekent dat bij gebruik van het RMI model potentieel 25% van alle ovariumcarcinomen kunnen worden gemist. Adequate triage is essentieel aangezien de zorg voor patiënten met ovariumcarcinoom in Nederland is gecentraliseerd in oncologische centra. Meer recent zijn er nieuwe echoscopische predictiemodellen vanuit het International Ovarian Tumor Analysis (IOTA) consortium (https://www.iotagroup.org/) ontwikkeld met het doel om deze triage te verbeteren. Dit betreffen een tweetal risicomodellen namelijk het IOTA LR2 model en het IOTA ADNEX model, dat naast een onderscheid tussen een benigne en maligne adnextumor, ook verder kan differentiëren tussen verschillende vormen van maligne tumoren (borderline tumor, stadium 1 invasief ovariumcarcinoom, stadium 2 tot 4 invasief ovariumcarcinoom of metastatische tumoren naar het ovarium van een andere primaire tumor). Daarnaast bestaan er de IOTA Simple Rules, een model dat op basis van morfologische echoscopische kenmerken van een tumor een onderscheid kan maken tussen goed- en kwaadaardig. Deze Simple Rules zijn toepasbaar in ongeveer 80% van alle ovariumtumoren. Voor de groep tumoren waarop de Simple Rules niet toepasbaar zijn is een tweestaps strategie noodzakelijk waarbij die tumoren bij voorkeur worden beoordeeld door een expert in gynaecologische echoscopie of waarbij veiligheidshalve deze geclassificeerd worden als kwaadaardig. In deze module zullen de diagnostische testkenmerken (negatief voorspellende waarde, positief voorspellende waarde, sensitiviteit, specificiteit, oppervlakte (AUC) onder de receiver-operator characteristic (ROC)-curve) van de deze nieuwe modellen (LR2, ADNEX, Simple Rules), in vergelijking met het RMI model, worden uitgewerkt.

Conclusies / Summary of Findings

Diagnostische accuratesse Simple Ultrasound Rules + expert beoordeling versus RMI

Laag

GRADE

Mogelijk is de gemiddelde negatief voorspellende waarde van de Simple Ultrasound Rules + expert beoordeling hoger (=94,0%) dan de negatief voorspellende waarde van het RMI model (cut-off: 200) (=81,2%).

(Meys, 2017a; Sayasneh, 2016; Testa, 2014)

Mogelijk is er geen verschil in de gemiddelde positief voorspellende waarde van de Simple Ultrasound Rules + expert beoordeling (=84,9%) en de positief voorspellende waarde van het RMI-model (cut-off: 200) (=80,7%).

(Meys, 2017a; Sayasneh, 2016; Testa, 2014)

Mogelijk is de sensitiviteit van het Simple Ultrasound Rules model + expert beoordeling hoger (sensitiviteit: 86% tot 92%) dan de sensitiviteit van het RMI model (cut-off: 200) (sensitiviteit: 67% tot 72%).

(Meys, 2017a; Sayasneh, 2016; Testa, 2014)

Mogelijk is er geen verschil in specificiteit tussen het Simple Ultrasound Rules model + expert beoordeling (specificiteit: 89% tot 94%) en het RMI model (cut-off: 200) (specificiteit: 79% tot 94%).

(Meys, 2017a; Sayasneh, 2016; Testa, 2014)

Diagnostische accuratesse Simple Ultrasound Rules model + MAL versus RMI

Laag

GRADE

Mogelijk is de gemiddelde negatief voorspellende waarde van het Simple Ultrasound Rules model + MAL hoger (=95,6%) dan de negatief voorspellende waarde van het RMI model (cut-off: 200) (=81,6%).

(Meys, 2017a; Mulder, 2020; Sayasneh, 2016; Testa, 2014)

Mogelijk is de gemiddelde positief voorspellende waarde van het Simple Ultrasound Rules model + MAL lager (=71,4%) dan de positief voorspellende waarde van het RMI model (cut-off: 200) (=80,9%).

(Meys, 2017a; Mulder, 2020; Sayasneh, 2016; Testa, 2014)

Mogelijk is de sensitiviteit van het Simple Ultrasound Rules model + MAL hoger (sensitiviteit: 90% tot 95%) dan de sensitiviteit van het RMI model (cut-off: 200) (sensitiviteit: 60% tot 72%).

(Meys, 201a7; Mulder, 2020; Sayasneh, 2016; Testa, 2014; Van Calster, 2020)

Mogelijk is er geen verschil is in specificiteit tussen het Simple Ultrasound Rules model + MAL (specificiteit: 68% tot 87%) en het RMI model (cut-off: 200) (specificiteit: 79% tot 95%).

(Meys, 2017a; Mulder, 2020; Sayasneh, 2016; Testa, 2014; Van Calster, 2020)

Mogelijk is de diagnostisch prestatie van het Simple Ultrasound Rules model + MAL bepaald middels de oppervlakte onder de ROC-curve (AUC), slechter dan het RMI model (cut-off: 200).

(Mulder, 2020)

Diagnostische accuratesse ADNEX model (verschillende cut-offs) versus RMI (cut-off: 200)

Laag

GRADE

Mogelijk is de gemiddelde negatief voorspellende waarde van het ADNEX-model (cut-off: 10%) hoger (=98,4%) dan de negatief voorspellende waarde van het RMI model (cut-off: 200) (=86,2%).

(Meys, 2017a; Sayasneh, 2016)

Mogelijk is er geen verschil in de gemiddelde positief voorspellende waarde tussen het ADNEX-model (cut-off: 10%) (=66,3%) en de positief voorspellende waarde van het RMI-model (cut-off: 200) (=71,1%).

(Meys, 2017a; Sayasneh, 2016)

Mogelijk is de sensitiviteit van het ADNEX-model (cut-off: 1%) hoger (sensitiviteit: 99 tot 100%) dan de sensitiviteit van het RMI model (cut-off: 200) (sensitiviteit: 60 tot 72%).