MASLD/MASH

Initiatief: NVMDL Aantal modules: 9

Identificatie MASLD-fibrose

Uitgangsvraag

Hoe kan MASLD-fibrose het beste worden geïdentificeerd middels niet-invasieve diagnostiek?

Aanbeveling

Pas de volgende niet-invasieve diagnostiek toe bij patiënten met een risico op MASLD-fibrose:

 

  • Stap 1: Bepaal het risicoprofiel van de te onderzoeken patiënt; denk daarbij aan overgewicht/obesitas, metabool syndroom, DM2, leeftijd 
  • Stap 2. Sluit secundaire oorzaken van leververvetting uit zoals medicatie en andere leverziekten
  • Stap 3: Gebruik de FIB-4 om leverfibrose (<F2) uit te sluiten; overweeg verwijzing bij FIB-4>2,67
  • Stap 4: Zet vervolgdiagnostiek in zoals de ELF-test of VCTE LSM bij*:
    • patiënten met een afwijkende FIB-4 suggestief voor ≥F2 (FIB-4 > 1,3 tot 65 jaar, FIB-4 > 2,0 ouder dan 65 jaar)
    • patiënten zonder een afwijkende FIB-4, maar waarbij op grond van het risicoprofiel toch aanvullende diagnostiek noodzakelijk is

Opmerking:

  • Herhaal bij twijfel over de uitslag van de VCTE-LSM het onderzoek na drie maanden waarbij de patiënt nuchter is gedurende langere tijd (> vier uur);
  • Voer bij twijfel over (bijkomende) aanwezigheid van andere leveraandoeningen of oorzaken van leververvetting een leverbiopsie uit. 

* Fibrose niet waarschijnlijk bij ELF < 7,7 en VCTE-LSM < 8,0 kPa.

Overwegingen

Voor- en nadelen van de interventie en de kwaliteit van het bewijs

Op basis van de geïncludeerde studies (Vali, 2020; Mózes, 2022; Han, 2021) is er een redelijke mate van zekerheid over de diagnostische accuratesse van FIB-4 en de ELF-test voor de identificatie van significante leverfibrose (F2) alsook de diagnostische accuratesse van FIB-4, de ELF-test, LSM VCTE (FibroScan®) en ALAT/ASAT voor de identificatie van ernstige leverfibrose en cirrose (F3-4) bij patiënten met MASLD, gebruikmakend van leverbiopsie als referentiestandaard. Geen van de geïncludeerde studies rapporteerde gegevens over de diagnostische accuratesse van de LSM VCTE (FibroScan®) voor de identificatie van significante leverfibrose (F2). De levertesten ALAT en ASAT hebben voor nu geen waarde in de diagnostiek van MASLD/MASH fibrose, mede gezien de brede differentiaaldiagnose en het aspecifieke karakter.

Uit de studieresultaten blijkt dat zowel de gerapporteerde sensitiviteit, specificiteit (cruciale uitkomstmaten) als positief en negatief voorspellende waarde (belangrijke uitkomstmaten) van de FIB-4, ELF-test en LSM VCTE (FibroScan®), sterk variëren naar gelang de gehanteerde afkapwaarden. Bij de keuze van de afkapwaarden moet daarom rekening gehouden worden met het bijbehorende risico op foutieve diagnoses.

Daarnaast zijn de voorspellende waarden sterk afhankelijk van de prevalentie van MASLD-fibrose in de populatie.

Voor de identificatie van ernstige leverfibrose wordt bij een MASLD-fibrose prevalentie van 30% een relatief hoge sensitiviteit, namelijk ≥90% gezien bij een afkapwaarde van 0.88 voor FIB-4, 7.7 voor de ELF-test en 7.4 kPa voor de LSM VCTE (FibroScan®). De hoogste specificiteit wordt gezien bij de volgende (gecombineerde bovenste en onderste grenzen van) afkapwaarden: voor LSM VCTE (FibroScan®)) <7,1, ≥14,1 (90%) en <10; ≥15 kPa (94%), voor FIB-4 <1,3; ≥3,25 (95%) en ELF-test van 11,30 (96%).

De bewijskracht van de gevonden resultaten wordt met name beperkt vanwege het risico op bias. De overall bewijskracht van de literatuur voor deze module is redelijk. Voor geen van de onderzochte niet-invasieve testen is de sensitiviteit én specificiteit ≥ 80%.

Er zijn geen studies gevonden die de diagnostische accuratesse van FIB-4, ELF-test en LSM VCTE (FibroScan®) vergeleken met de diagnostische accuratesse van transaminase bepalingen (ALAT, ASAT) voor het detecteren van MASLD-leverfibrose. Gezien de eerder benoemde aspecificiteit van deze leverenzymen bij MASLD/MASH wordt dit nu door de werkgroep als niet relevant bevonden.

Lopende cohortstudies zullen in de nabije toekomst een duidelijker beeld geven van de diagnostische waarde van de niet-invasieve testen voor MASLD-fibrose in verschillende (risico)populaties. Daarnaast worden ook nieuwe niet-invasieve testen ontwikkeld.

 

De prevalentie van MASLD-fibrose in de te onderzoeken doelgroep zoals bijvoorbeeld patiënten met DM2, heeft een grote invloed op de test resultaten. Het is bekend dat een lagere prevalentie samengaat met veen lagere positief voorspellende waarde van de gebruikte testen. Daarom zijn grote cohortstudies nodig om een beter inzicht te krijgen in de prevalentie van MASLD-MASH om de diagnostische accuratesse te optimaliseren ten aanzien van de MASLD-fibrose diagnostiek. Een studie bij 561 patiënten met DM2 uit de eerste lijn en endocrinologische polikliniek, toonde de aanwezigheid van MASLD aan bij 70% en fibrose bij 21% (LSM ≥7,0 kPa) van de patiënten, onderzocht met LSM-VCTE gecombineerd met FIB-4. Bij 6% werd significante fibrose (F2: LSM ≥8,2 kPa) en bij 9% ernstige fibrose/cirrose gediagnosticeerd (F3-4: LSM ≥9,7 kPa). De niet-invasieve test resultaten kwamen overeen met de uitkomsten van de LSM en de leverbiopsie, die werd uitgevoerd bij patiënten met aanwijzingen voor fibrose (LSM ≥7,0 kPa) (Lomonaco, 2021). Deze resultaten zijn vergelijkbaar met een prospectieve studie bij 501 patiënten met DM2 van ≥50 jaar waarbij een MASLD-prevalentie van 65% werd gevonden met significante fibrose (F2: ≥ 8,8 kPa met LSM VCTE (FibroScan®) en ≥3,63 kPa met MR elastografie) bij 14% en cirrose bij 6% van deze patiënten werd aangetoond. Deze studie vond eveneens een hogere prevalentie van MASLD, significante fibrose en cirrose van respectievelijk 72,6%, 18,2% en 7,5% in de subpopulatie van patiënten met DM2 én obesitas (Ajmera, 2023). Dit zijn twee studies waar retro- en prospectief de prevalentie met niet-invasieve diagnostiek in een welomschreven populatie is onderzocht. Hoewel de afkapwaarden niet in beide studies gelijk waren tonen de studies de hoge MASLD-prevalentie en mate van leveraantasting.

Nederlands onderzoek in het grote Lifelines cohort (N = 167.729) toonde een MASLD

prevalentie aan van 22% (van den Berg, 2017). In het bevolkingsonderzoek te Rotterdam

(Ommoord studie) werd in een oude populatie (N =  2811) met gemiddelde leeftijd van

76,4 ± 6,0 jaar een MASLD prevalentie van 35,1 % gevonden (Koehler, 2012). Bij onderzoek in verschillende etnische groepen in Amsterdam (Helius cohort) werd een MASLD-prevalentie gevonden van 27,3% (Van Dijk, 2022). De Nederlandse prevalentie data komen overeen met de globale prevalentie (Perumpail, 2017. Younossi, 2016).

 

In het diagnostisch algoritme (zie stroomdiagram) adviseert de werkgroep, als eerste stap in de MASLD-fibrose diagnostiek, om een niet-invasieve test te gebruiken met een hoge sensitiviteit, met als belangrijkste doel om patiënten met MASLD-fibrose op te sporen. Bij voorkeur is de test laagdrempelig in te zetten doordat deze makkelijk beschikbaar en goedkoop is. Bij patiënten met afwijkende waarden of patiënten waarbij op basis van het risicoprofiel getwijfeld wordt aan de uitslag, kan er aanvullende diagnostiek worden ingezet.

Hieronder geeft de werkgroep een aantal overwegingen mee voor de onderzochte niet-invasieve testen: FIB-4, ELF-test en LSM VCTE (FibroScan®). Vervolgens is een aanbeveling opgesteld ten aanzien van de stappen die gezet dienen te worden om patiënten met MASLD-fibrose te identificeren.

 

FIB-4

De meest gebruikte, in de literatuur beschreven afkapwaarden voor de FIB-4 zijn: <1,3, te interpreteren als een laag risico op het hebben van (gevorderde) leverfibrose en ≥2,67 als een hoog risico op de aanwezigheid van (gevorderde) leverfibrose.

Uit de meta-analyse van Mózes werd een sensitiviteit voor FIB-4 om ernstige fibrose aan te tonen berekend  van 90% bij afkapwaarde van 0.88, 69% bij 1.44 en 38% bij 2.31. De specificiteit voor de genoemde afkapwaarden waren respectievelijk  39%, 70% en 90% (Mózes, 2022). Wat betreft de positief voorspellende waarde werd bij de afkapwaarde 0.88, 1.44 en 2.31 respectievelijk 39%, 50% en 62% gevonden en voor de negatief voorspellende waarden  90%, 84% en 77% respectievelijk bij een prevalentie van 30% gevorderde fibrose. Er is een hoge negatieve voorspellende waarde om gevorderde fibrose uit te sluiten.

De studie onderzocht de verschillende gecombineerde afkapwaarden. Hierbij is de  sensitiviteit en specificiteit respectievelijk 54% en 91% met een PPV en NPV van respectievelijk 72% en 82% (zie Tabel 1). Verandering van de afkapwaarde naar <0,88 - ≥2,31 verhoogt de sensitiviteit naar 80% en daarbij daalt de specificiteit naar 79%. Bij deze waarden zijn de PPV en NPV respectievelijk 62 en 91%. Hiermee stijgt het aantal personen met een correcte diagnose maar ook het aantal onterecht gediagnostiseerden. Opvallend is dat in veel onderzoeken de afkapcriteria <1,3 - ≥2,67 wordt gebruikt en niet de gecombineerde afkapwaarden die gepaard gaan met een hogere sensitiviteit (<0,88 - ≥2,31) De afkapwaarde met hoge specificiteit wordt door veel onderzoekers gebruikt omdat de nadruk ligt op het terecht uitsluiten van significante fibrose (>F2). De werkgroep adviseert om de afkapwaarde met de hoogste sensitiviteit en specificiteit te kiezen voor de populatie waarin MASLD-fibrose wordt onderzocht waarbij rekening gehouden moet worden met een aantal aspecten zoals de leeftijd. Dus, bij een FIB-4 < 1,3 is de kans op fibrose verwaarloosbaar en bij  FIB-4 ≥2,67 reden voor aanvullend onderzoek bij de MDL-arts.  Bij waarden tussen <1,3 - ≥2.67, het zogenaamde grijze gebied, wordt geadviseerd om een tweede test in te zetten om fout negatieven op te sporen. De keuze is afhankelijk van de beschikbaarheid van de LSM-VCTE (FibroScan®). In het geval dat dit diagnosticum niet beschikbaar is dan wordt aangeraden om de ELF test uit te voeren.

Leeftijd is een variabele in de FIB-4 en heeft effect op de interpretatie van de uitslag zoals door McPherson in een stratificatie analyse werd aangetoond. In de groep tussen 35-65 jaar werd een AUROC berekend van 0,84. De specificiteit daalde sterk boven de 65 jaar naar 35% met als gevolg veel fout positieve uitslagen. De optimale afkapwaarde voor ≥65 jaar werd berekend en gevalideerd waarbij <2,0 de diagnostische effectiviteit verbeterde naar een sensitiviteit van 77% en specificiteit naar 70% (McPherson, 2017). Voor patiënten ouder dan 65 jaar is dan ook het advies om FIB-4 van 2,0 aan te houden om significante fibrose uit te sluiten. De huidige richtlijn is geen aanbeveling voor de pediatrische en adolescente populatie. De studies die zijn gebruikt in de analyses hanteerden leeftijd van minimaal 18 jaar als inclusiecriterium. Daarnaast lijkt de FIB-4 bij patiënten met DM2 een onderschatting te geven van de kans op fibrose (Blank, 2020).

 

ELF-test

Als tweede diagnostische stap kan gekozen worden voor de ELF test, een gepatenteerde test met algoritme dat is ontwikkeld door Siemens. In centra zonder de mogelijkheid om een LSM VCTE meting te verrichten is dit een goed alternatief in de diagnostiek. De uitslagen van deze test kunnen met de meest gebruikte afkapwaarden als volgt geïnterpreteerd worden: < 7,70 betekent een lage kans op (gevorderde, F2) leverfibrose met een hoge sensitiviteit van 93%, maar lage specificiteit van 34%, bij een prevalentie van MASLD-fibrose van 30% om fibrose uit te sluiten (zie Tabel 1). Bij een score van 9,8 is er een sensitiviteit van 65%, een specificiteit van 86%. Bij een score van >10,5 is er een sensitiviteit en specificiteit voor gevorderde fibrose (>F3-4) van respectievelijk 51% en 93%, waarbij de positief en negatief voorspellende waarde respectievelijk 75% en 81% bedraagt.

 

Bij het gebruik van deze test is het belangrijk om bij het interpreteren van de uitkomst rekening te houden met patiëntkarakteristieken en het feit dat de ELF-test nog niet op grote schaal in Nederland geïmplementeerd is, onder andere wegens assaykosten en organisatie van laboratoria.

 

VCTE-LSM (FibroScan®)

De meest gebruikte, beste beschikbare en best gevalideerde methode voor de VCTE-LSM is de FibroScan®. Hiermee kan op een zeer betrouwbare wijze gevorderde MASLD-fibrose gediagnosticeerd worden bij meer dan 12 kPa (F3-F4: AUC 95%). Een score < 8.0 kPa impliceert dat er waarschijnlijk geen sprake is van gevorderde MASLD-fibrose. In de literatuur wordt er bij een (gecombineerde) afkapwaarde van <7.9 - ≥9.6 kPa een sensitiviteit en specificiteit van respectievelijk 84% en 78% gerapporteerd, bij een MASLD-fibrose prevalentie van 30%. De PPV en NPV zijn respectievelijk 62% en 92% (zie Tabel 1).

 

Voordelen en nadelen niet-invasieve diagnostiek

De prevalentie en ernst van MASLD-MASH nemen toe, ook in Nederland. De niet-invasieve diagnostiek heeft als voordeel dat op een snelle, patiëntvriendelijke manier, de aanwezigheid van leverfibrose kan worden opgespoord, zowel in de eerste als tweede lijn. Het vinden van de patiënten met het grootste risico op het ontwikkelen van leverfibrose door ‘case finding’ in de genoemde populaties maakt dat therapeutische opties mogelijk zijn om regressie van leververvetting, fibrose en ontsteking te verkrijgen waarbij gewichtsreductie een belangrijke pijler in de behandeling is door middel van leefstijlaanpassing. De ontwikkeling van fibrose is een langzaam progressief proces over jaren. In hoog risico groepen zoals patiënten met DM2 en/of obesitas kan de fibrogenese sneller verlopen met de ontwikkeling van cirrose en/of HCC en is follow up onderzoek geïndiceerd (zie module HCC surveillance). Na uitvoering van non-invasieve fibrosediagnostiek kan er alsnog een indicatie bestaan voor leverbiopsie, zoals twijfel over de diagnose of de mate van fibrose. Het histologische onderzoek kan eveneens geïndiceerd zijn om secondaire leversteatose veroorzaakt bijvoorbeeld door hepatitis C, medicatie of auto immuun aandoeningen zoals AIH uit te sluiten (Liebe, 2021). Voor een goede beoordeling van het leverbiopt is de voorkeur dat het wordt afgenomen met een 16G naald en tenminste 15 mm lang is (bij voorkeur 20-25 mm). Na de juiste voorbehandeling (aansnijden en kleuring) van het biopt is het mogelijk een uitspraak te doen over de diagnose, mate van ontsteking en fibrosering. De nadelen van het leverbiopt zijn de belasting voor de patiënt, de (kleine) kans op complicaties zoals een nabloeding (<1%) en de kans op sampling error en ‘interobserver variability’ bij de patholoog.

 

Waarden en voorkeuren van patiënten

Het belangrijkste doel van de niet-invasieve diagnostiek is om enerzijds MASLD-fibrose uit te sluiten bij patiënten met milde vormen van MASLD en anderzijds ernstige leverfibrose tijdig op te pikken bij patiënten met ernstige stadia van MASLD. Daarmee worden zowel patiënten geïdentificeerd die geen controle of behandeling nodig hebben alsook patiënten met een hoog risico op het ontwikkelen van ernstig leverlijden(‘case finding’). Het voordeel van de inzet van niet-invasieve testen is dat deze snel en eenvoudig uit te voeren zijn, zonder grote belasting voor de patiënt. Patiënten met een verhoogd risico op ernstige MASLD zoals patiënten met DM2, hebben de mogelijkheid om op een snelle en veilige manier geïnformeerd te worden over de aanwezigheid en mate van de leverbeschadiging. De verkregen informatie geeft de patiënt en de zorgverlener de mogelijkheid een behandeling te starten of aan te passen. Daarnaast is er de mogelijkheid om tijdens follow-up het interventieproces te volgen en eventueel bij te stellen. De behandelopties worden in de modules over leefstijlinterventies en medicamenteuze behandeling besproken.

Een ander voordeel van deze niet invasieve testen is hun uitstekende inpasbaarheid in jaarcontroles voor aandoeningen die zeer vaak samen optreden met MASLD zoals DM2 en hart- en vaatziekten. Het is belangrijk om de voor- en nadelen van deze diagnostiek met de patiënt te bespreken en hen mee te laten beslissen over het follow-up traject. Veel patiënten die in de tweede lijn behandeld worden of verwezen zijn, kunnen na een eenvoudige uitleg, een bloedafname aangevuld met echo en VCTE-LSM (FibroScan®) krijgen. De bloedafname is vaak een redelijk goed uitvoerbare procedure en kan op elke locatie worden gedaan. De echo en LSM VCTE (FibroScan®) zijn eenvoudige handelingen die relatief weinig tijd in beslag nemen. Een punt van aandacht is de eigen bijdrage dat de patiënt moet betalen uit hun eigen risico en dit dient te worden besproken.

 

Kosten (middelenbeslag)

Het doel van het vroegtijdig opsporen van MASLD-fibrose is preventie van ernstig leverlijden en kostenreductie.

In een prospectieve studie in 3,012 patiënten werd de effectiviteit van een diagnostisch algoritme met twee non-invasieve MASLD-fibrosetesten onderzocht. In deze studie werd een twee-traps serologische diagnostiek naar MASLD-fibrose verricht (FIB-4 gevolgd door ELF). Patiënten met ernstige MASLD-fibrose (groter of gelijk aan F3) werden 5 keer beter gediagnostiseerd, en patiënten zonder ernstige MASLD-fibrose werden 81% minder vaak verwezen naar de hepatoloog ten opzichte van standaardzorg (Srivastava, 2019). Het tweeledige effect van dit onderzoek  onderstreept het belang van het gebruik van een protocollaire aanpak met non-invasieve leverfibrosetesten in de detectie van MASLD-fibrose.

Gezien het feit dat MASLD-MASH onderdeel is van metabole disregulatie met systemische effecten zal vroege detectie van MASLD-fibrose ook een preventief effect kunnen hebben op het ontstaan en verergeren van de zogenaamde extra-hepatische aandoeningen zoals bijvoorbeeld DM2. Deze chronische leefstijl-gerelateerde aandoeningen vormen een substantieel aandeel van de kosten die o.a. medische, medicamenteuze en socio-economische aspecten omvatten. In een kostenanalyse studie, uitgevoerd in Duitsland, het Verenigd Koninkrijk, Italië en Frankrijk, werd berekend dat de MASLD-gerelateerde kosten tussen €345 en €1115 per patiënt per jaar bedroegen (Witkowsky 2022). Voor de Nederlandse setting is in een cohort van patiënten met ongecompliceerde MASLD tussen 18 en 70 jaar berekend dat de kosten voor drie maanden €1424,17 bedroegen (van de Ven, 2019). Deze kostenberekeningen omvatten de kosten gemaakt door (para)medische handelingen, medicatie en ziekteverzuim. De beschreven kosten zijn naar alle waarschijnlijkheid een onderschatting, aangezien uitgaven die samenhangen met ziekteverzuim, medicatie, follow up onderzoeken en socio-economische aspecten niet zijn meegenomen. Niettemin zijn kosteneffectiviteitsstudies belangrijk om de besparing van vroegdiagnostiek en preventie in MASLD-MASH te bepalen voor toekomstig niet-invasieve diagnostiek. Uitgebreide epidemiologische studies zullen in de toekomst meer duidelijkheid hierover geven. Concluderend, een (vroegtijdige) opsporing van MASLD-MASH fibrose met co- morbiditeit zal kunnen bijdragen aan preventie van voortschrijdende ziekte en reductie van de kosten.

Er is nog geen uniformiteit over de terugbetaling van de niet-invasieve testen. De VCTE-LSM (zoals de FibroScan®) wordt in sommige ziekenhuizen afgerekend als een abdominale echografie. Overleg met verschillende partijen is lopende om een vergoeding te bepalen. Omdat er geen terugbetaling is voor de ELF-test betekent het dat dit uit eigen afdelingsbudget moet worden bekostigd. De FIB-4 is als de benodigde parameters (leeftijd, ASAT, ALAT en trombocyten) beschikbaar zijn, snel te berekenen zonder enige additionele kosten.

 

Aanvaardbaarheid, haalbaarheid en implementatie

De niet-invasieve diagnostiek, is haalbaar voor de tweede lijn in een groot aantal ziekenhuizen die beschikken over VCTE-LSM zoals bijvoorbeeld de FibroScan®. Leverbiopten voor de verfijning van de diagnostiek en uitsluiting van andere leveraandoeningen kunnen uitgevoerd worden in de meeste ziekenhuizen. De biopten kunnen - als het gaat over diagnostische twijfel - worden bekeken in een online panel van experts onder leiding van de afdeling pathologie van het Amsterdam UMC (“Dutch Liver Pathology Panel”, DLPP). De kosten van het leverbiopt zijn relatief hoog, gezien korte dag opname, echogeleide punctie en afhandeling op de afdeling pathologie. Dit maakt de uitvoering van leverbiopten op grote schaal niet mogelijk.

 

Belemmerende factoren

Er zijn weinig belemmerende factoren ten aanzien van de uitvoerbaarheid van de FIB-4. De bloedafname is eenvoudig uitvoerbaar bij personen die bereid zijn om geprikt te worden. Het betreft een beperkte bloedafname en dit is in eerste en tweede lijn nagenoeg overal uitvoerbaar.

Zoals eerder benoemd is een leeftijd > 65 jaar een factor om rekening mee te houden bij deze bepaling. Hetzelfde geldt voor een leeftijd < 35 jaar. Een ander aspect is de onderdiagnostiek van fibrose bij een afkapwaarde van < 1,3 bij patiënten met DM2. Boursier (2022) concludeerde dat patiënten met langer bestaande DM2 een grotere kans hebben op fibrose en dat de FIB-4 geen goede accurate test was. Dit werd bevestigd door andere onderzoekers (Gracen, 2022 en Kim, 2022) en pleit voor het uitvoeren van een tweede aanvullende test zoals de VCTE-LSM.

In tegenstelling tot de FIB-4 is de ELF-test niet volledig zelfstandig uit te voeren, want de gepatenteerde test wordt commercieel aangeboden en kan slechts in een beperkt aantal laboratoria worden uitgevoerd met geleverde apparatuur en media. Om het gebruik te vergroten zal de uitvoerbaarheid van de ELF-test beter toegankelijk moeten worden.

 

De VCTE-LSM meting wordt uitgevoerd in centra die de FibroScan® of een echoapparaat met een VCTE-LSM module hebben. De resultaten van de VCTE-LSM zijn goed interpreteerbaar en gevalideerd (zie boven, Vali, 2020; Mózes, 2022; Han, 2021). Centra in de tweede lijn die niet beschikken over een VCTE-LSM kunnen patiënten verwijzen naar een ander centrum. Kosten kunnen in rekening gebracht worden door het centrum waar het onderzoek wordt uitgevoerd. Of de ziektekostenverzekeraar de kosten vergoedt, hangt af van de nomenclatuur die gebruikt wordt. De kosten voor de aanschaf van een FibroScan® zijn substantieel. Er wordt gewerkt aan een lease optie waarbij per meting een vaste prijs zal berekend worden. Met de ziektekostenverzekeraar zal uiteindelijk overeengekomen moeten worden hoe de financiering van de FibroScan® zal verlopen in de tweede en ook eerste lijnzorg.

 

Het is eenvoudig om een VCTE-LSM uit te voeren en deze handeling kan na een korte instructie in de praktijk gebracht worden. Er is bij ongeveer 3% van de patiënten een onvolledige of niet goed uitvoerbare meting. De belangrijkste oorzaken zijn krappe intercostale ruimte, ascites, obesitas en moeilijke positionering van de patiënt. Het VCTE-LSM onderzoek is minder betrouwbaar indien de patiënt niet ten minste drie uur nuchter is (risico op fout-verhoogde uitslag). Het wisselen van M- naar XL-probe kan helpen om het onderzoek alsnog te doen slagen, waarbij de interpretatie van de waarden licht verschillen per probe.

 

Rationale van de aanbeveling: weging van argumenten voor en tegen de diagnostische procedure

De mate van leverfibrose is de belangrijkste indicator voor de ernst van MASLD/MASH. Er zijn diverse niet-invasieve testen beschikbaar om MASLD-fibrose te identificeren dan wel uit te sluiten, zoals de FIB-4, ELF-test, VCTE-LSM (FibroScan®) en ALAT/ASAT. De diagnostische waarde van levertestafwijkingen (ALAT/ASAT) in het kader van het opsporen van MASLD-fibrose is beperkt. De diagnostische waarde van de FIB-4 voor het identificeren van MASLD-fibrose is beperkt om de mate en ernst van fibrose/cirrose aan te tonen.  Deze test lijkt vooralsnog vooral geschikt om MASLD-fibrose uit te sluiten waarbij de afkapwaarde voor ≥65 jaar verschilt van de leeftijd tussen 35-65 jaar. Deze test is laagdrempelig in te zetten, vanwege de lage kosten en goede beschikbaarheid. Daarom is de aanbeveling om de FIB-4 als eerste stap in te zetten. De MASLD-fibrose prevalentie verschilt afhankelijk van de groep waarin getest wordt. Het wordt aangeraden om in de beoordeling van de uitslag rekening te houden met aspecten die belangrijk zijn voor de ernst en progressie van fibrose zoals overgewicht/obesitas, metabool syndroom en DM2.

Voor aanvullende diagnostiek kan gebruik gemaakt worden van de VCTE-LSM (FibroScan®). Indien er geen directe beschikbaarheid is van de mogelijkheid om een LSM VCTE met bijvoorbeeld de FibroScan® uit te voeren dan kan het best gekozen worden om een ELF-test te doen. Het nadeel van de ELF test zijn de vooralsnog beperkte implementatie in Nederland en de nog nader af te spreken kosten.

Een leverbiopsie wordt geadviseerd in die gevallen waarbij er onduidelijkheid is over de mate van ontsteking (MASH) en fibrose enerzijds en analyse van bijkomende schade aan de lever, bijvoorbeeld door alternatieve oorzaken van leversteatose (bepaalde genotypes hepatitis C, medicamenteuze beschadiging) of andere vormen van leverontsteking, of als er auto immuun aandoeningen zijn zoals AIH.

Onderbouwing

Hoewel > 5% steatose een basisvoorwaarde is voor de diagnose MASLD, is alleen van de aanwezigheid en mate van leverfibrose bij MASLD aangetoond dat het prognostische waarde heeft, zowel voor lever-gerelateerde morbiditeit en mortaliteit als voor ‘all-cause’ mortaliteit. Vooralsnog is de gouden standaard voor MASLD-MASH diagnostiek het leverbiopt. Met een biopt kan zowel de mate van vervetting alsook de ernst van de eventuele ontsteking en de fibrose graad bepaald worden. Tevens is het leverbiopt belangrijk om andere leverziekten zoals auto immuun hepatitis (AIH) en andere onderliggende leverziekten met of bij steatose uit te sluiten.

 

De relatief hoge prevalentie van MASLD, voornamelijk in de populatie met overgewicht, obesitas, metabool syndroom, diabetes mellitus, hart- en vaatziekten, vraagt echter om een andere diagnostische aanpak dan het invasieve leverbiopt, dat een klein maar belangrijk risico heeft op complicaties, zoals pijn en nabloeding. Daarnaast is het tijdrovend, relatief kostbaar en brengt het een risico met zich mee op ‘sampling error’ en ‘inter-observer’ variabiliteit, zeker bij de zogenaamde grensgevallen. Voor de prognostische cruciale inschatting van de aanwezigheid en mate van leverfibrose bij MASLD-MASH gaat daarom de voorkeur uit naar betrouwbare, niet-invasieve, eenvoudigere en goedkopere methoden. Inmiddels zijn verschillende niet-invasieve diagnostische methoden ontwikkeld waarmee de aanwezigheid en mate van leverfibrose in het geval van MASLD-MASH kan worden bepaald. Progressie van MASLD/MASH fibrose is in het algemeen een langzaam proces. Met niet-invasieve fibroseparameters kan follow-up verricht worden en kan het effect van behandelingen zoals leefstijlinterventies over de tijd gevolgd worden. Er verschijnen steeds meer publicaties die de prognostische waarde van deze niet-invasieve fibroseparameters aantonen in verschillende populaties.

 

De meest gebruikte en best gevalideerde niet-invasieve bloedonderzoeken voor MASLD-fibrose zijn: de Fibrosis-4 index (FIB-4), berekend met een formule uit de parameters leeftijd, ASAT, ALAT en trombocyten en de Enhanced Liver Fibrosis (ELF) test, bepaald aan de hand van matrix turnover eiwitten ‘hyaluronic acid’ (HA), ‘procollagen III amino-terminal peptide’ (PIIINP), en ‘tissue inhibitor matrix metalloproteïnase’ 1 (TIMP-1)). De mate van leverelasticiteit/stijfheid (‘liver stiffness measure’: LSM) als afgeleide van leverfibrose, kan worden bepaald met een gevalideerde, eenvoudig uit te voeren echografische techniek: vibration-controlled transient elastography (VCTE), waarbij FibroScan® de meest gebruikte en best gevalideerde methode is. De diagnostische eigenschappen van de genoemde testen voor MASLD-MASH fibrose zullen in deze module worden besproken.

Part 1. FIB-4

 

Conclusions

Area under the curve

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported AUCs for identifying advanced fibrosis (F3-F4) and significant fibrosis were 0.76 and 0.68 respectively.

 

Source: Mózes, 2022; Han, 2021

 

Sensitivity

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported sensitivity ranged from 34% to 90%, using various cut-offs.

For significant fibrosis (F2), the reported sensitivity was 0.42.

 

Source: Mózes, 2022; Han, 2021

 

Specificity

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported specificity ranged from 39% to 95%, using various cut-offs.

For significant fibrosis (F2), the reported specificity was 0.93.

 

Source: Mózes, 2022; Han, 2021

 

Positive predictive value

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported positive predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 39% to 79%, using various cut-offs.

 

Source: Mózes, 2022

 

Negative predictive value

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported negative predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 77% to 90%, using various cut-offs.

 

Source: Mózes, 2022

 

Part 2. ELF-test

 

Conclusions

Area under the curve

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

The reported AUCs for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) were 0.83 and 0.81 respectively.

 

Source: Vali, 2020

 

Sensitivity

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported sensitivity ranged from 0.36 to 0.93, using various cut-offs.

For significant fibrosis (F2), the reported sensitivity ranged from 0.17 to 0.97, using various cut-offs.

 

Source: Vali, 2020

 

Specificity

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported specificity ranged from 0.34 to 0.96, using various cut-offs.

For significant fibrosis (F2), the reported specificity ranged from 0.10 to 0.99, using various cut-offs.

 

Source: Vali, 2020

 

Positive predictive value

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported positive predictive values at a prevalence rate of MASLD-fibrosis of 5-10% ranged from 0.07 to 0.52, using various cut-offs.

For significant fibrosis (F2), the reported positive predictive values at a prevalence rate of MASLD-fibrosis of 5-10% ranged from 0.05 to 0.66, using various cut-offs.

 

Source: Vali, 2020

 

Negative predictive value

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported negative predictive values at a prevalence rate of MASLD-fibrosis of 5-10% ranged from 0.93 to 0.99, using various cut-offs.

For significant fibrosis (F2), the reported negative predictive values at a prevalence rate of MASLD-fibrosis of 5-10% ranged from 0.91 to 0.98, using various cut-offs.

 

Source: Vali, 2020

 

Part 3: LSM VCTE (FibroScan®)

 

Conclusions

Area under the curve

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported AUC for identifying advanced fibrosis was 0.85.

 

Source: Mózes, 2022

 

Sensitivity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported sensitivity ranged from 55% to 90%, using various cut-offs.

 

Source: Mózes, 2022

 

Specificity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported specificity ranged from 60% to 94%, using various cut-offs.

 

Source: Mózes, 2022

 

Positive predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported positive predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 49% to 81%.

 

Source: Mózes, 2022

 

Negative predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported negative predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 82% to 93%.

 

Source: Mózes, 2022

 

Part 4. Sequential combination of NITs (algorithm combining FIB-4 and LSM VCTE)

 

Conclusions

Area under the curve (AUC)

-    GRADE

None of the included studies reported on the outcome measure AUC for identification of advanced fibrosis (F3-F4) using sequential combination of tests.

 

Source: -

 

Sensitivity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of sequential combination of FIB-4 and LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported sensitivity at a prevalence rate of MASLD-fibrosis of 30% ranged from 66% to 80%, using various cut-offs.

 

Source: Mózes, 2022

 

Specificity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of sequential combination of FIB-4 and LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported specificity at a prevalence rate of MASLD-fibrosis of 30% ranged from 81% to 86%, using various cut-offs.

 

Source: Mózes, 2022

 

Positive predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of sequential combination of FIB-4 and LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported positive predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 62% to 66%, using various cut-offs.

 

Source: Mózes, 2022

 

Negative predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of sequential combination of FIB-4 and LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported negative predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 86% to 91%, using various cut-offs.

 

Source: Mózes, 2022

 

Part 5: ALAT and ASAT

 

Conclusions

Area under the curve

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported AUC for identifying fibrosis was 0.64.

 

Source: Mózes, 2022

 

Sensitivity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported sensitivity ranged from 16% to 90%, using various cut-offs.

 

Source: Mózes, 2022

 

 Specificity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported specificity ranged from 25% to 90%, using various cut-offs.

 

Source: Mózes, 2022

 

Positive predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported positive predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 34% to 41%.

 

Source: Mózes, 2022

 

Negative predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported negative predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 71% to 85%.

 

Source: Mózes, 2022

Description of studies

Mózes (2022) performed an individual patient data (IPD) meta-analysis in adults (≥ 18 years) with MASLD to evaluate the diagnostic performance of liver stiffness measurement by vibration controlled transient elastography (LSM VCTE) and Fibrosis-4 Index (FIB-4) as screening tests to identify advanced fibrosis. Data from 37 studies were pulled into a cohort of 5,735 unique patients with MASLD proven by biopsy. Median age (IQR) was 54 (NR) years. In total, 45% of the patients were women, 33% had diabetes and 43% had BMI ≥30 kg/m2. Advanced fibrosis (F3–4) and cirrhosis (F4) were the target conditions of interest. Overall, 30% of the patients had advanced fibrosis and 11% of the patients had cirrhosis. The quality of the studies was assessed with the QUADAS-2 tool. The index test of interest for diagnosis of advanced fibrosis and cirrhosis was LSM VCTE (performed with FibroScan® (Echosens, France)), which was compared to liver histology (reference standard). The diagnostic accuracy of FIB-4 was computed where data were available. Patients underwent both liver biopsy and LSM VCTE within six months of each other.

 

Han (2021) conducted a systematic review and meta-analysis to evaluate the diagnostic accuracy of FIB-4 as a screening test to identify advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with MASLD. They searched PubMed, EMBASE, the Cochrane Library, Korean Medical Database and Korean Studies Information Service System up to October 2020. 36 studies were eligible for inclusion in this systematic review. Data of 14,992 patients were included. Mean age (±SD) was 48.6±6.13 years. In total, 36.2% of the patients had diabetes. The prevalence of significant and advanced fibrosis in the study population was not reported. The quality of the studies was assessed with the QUADAS-2 tool and the QUIPS tool. The index test of interest was FIB-4, which was compared to liver histology (reference standard). The timing between liver biopsy and FIB-4 was not reported.

 

Vali (2020) performed a systematic review and meta-analysis to evaluate the diagnostic accuracy of the ELF-test to identify fibrosis in patients with (suspected) MASLD. They searched Medline, PubMed, Embase, Science Citation Index and Central, up to December 2019. 17 studies were eligible for inclusion in this systematic review. Data of 5,366 patients ≥ 18 years with paired liver histology and index biomarker data were included. Different algorithms have been developed for ELF-test, by Guha (2008) and by Siemens. To convert all thresholds to those of the Siemens algorithm, the following regression equation was used: (Siemens results = (Guha results + 8.6498)/0.8854). The target conditions were MASH (with or without fibrosis) and staging of liver fibrosis. The mean age of the patients ranged from 42 to 60 years. Four studies included patients with suspected MASLD, two studies included morbidly obese patients and 11 studies included patients with biopsy proven MASLD. The prevalence of advanced fibrosis ranged from 18% to 71%. The quality of the studies was assessed with the QUADAS-2 tool. The index test of interest was ELF-test, which was compared to liver histology (reference standard). The timing between liver biopsy and ELF-test was not consistently reported.

 

Results

Results are described per outcome measure for each NIT separately. Because of the absence of relevant studies, no conclusions could be drawn on the diagnostic performance of LSM VCTE (FibroScan®), FIB-4 and ELF-test for identification of fibrosis in adult patients at risk of MASLD, compared to ALAT and ASAT blood tests (comparator tests in PICO).

 

Part 1. FIB-4

Area under the curve (AUC)

In the IPD meta-analysis by Mózes (2022), FIB-4 had an AUC (95%CI) of 0.76 (0.74 to 0.77) for identifying advanced fibrosis. In the meta-analysis by Han (2021), the AUC (95%CI) of FIB-4 for advanced fibrosis (F3-F4) was 0.76 (0.74 to 0.81). For significant fibrosis (F2), the AUC (95%CI) was 0.68 (0.65 to 0.76).

 

Sensitivity

In the IPD meta-analysis by Mózes (2022), FIB-4 for identification of advanced fibrosis had a sensitivity (95%CI) of 90% (88 to 91), 69% (67 to 72) and 38% (36 to 41), using cut-offs of 0.88, 1.44 and 2.31. Mózes (2022) also calculated sensitivity when using various paired cut-offs (‘rule-in’ and ‘rule-out’ cut-offs for advanced fibrosis), which were adapted from the literature. Results are also reported in Table 1. In the meta-analysis by Han (2021), the pooled sensitivity (95%CI) of FIB-4 for identification of advanced fibrosis was 0.42 (0.33 to 0.51). The pooled sensitivity (95%CI) of FIB-4 for identification of significant fibrosis was 0.42 (0.16 to 0.73).

Overall, sensitivity ranged from 34% to 90%. The highest sensitivity (90%) was reported when using cut-off of 0.88 (Table 1).

 

Specificity

In the IPD meta-analysis by Mózes (2022), FIB-4 for ruling out advanced fibrosis had a specificity (95%CI) of 39% (37 to 41), 70% (69 to 72) and 90% (89 to 91), using cut-offs of 0.88, 1.44 and 2.31 respectively. Mózes (2022) also calculated specificity when using various paired cut-offs (‘rule-in’ and ‘rule-out’ cut-offs for advanced fibrosis), which were adapted from the literature. Results are also reported in Table 1.

In the meta-analysis by Han (2021), the pooled specificity (95%CI) of FIB-4 for ruling out advanced fibrosis was 0.93 (0.91 to 0.95). The pooled specificity (95%CI) of FIB-4 for ruling out significant fibrosis was 0.93 (0.56 to 0.99).

Overall, specificity ranged from 39% to 95%. The highest specificity (95%) was reported when using a paired cut-off of <1.3 (‘rule-out’), ≥3.25 (‘rule-in’) (Table 1).

 

Positive predictive value (PPV)

Mózes (2022) calculated indicative FIB-4 PPV for the range of MASLD-fibrosis prevalences (5%–50%) reported in the primary studies included in the SR (Table 2). The PPV for a prevalence of advanced fibrosis of 30%, was 39%, 50% and 62%), using cut-offs of 0.88, 1.44 and 2.31 respectively. Mózes (2022) also calculated PPV when using various paired cut-offs, which were partly adapted from the literature. Results are also reported in Table 2. Overall, PPV ranged from 39% to 79%. The highest PPV was reported when using paired cut-off of <1.3, ≥3.25.

 

Negative predictive value (NPV)

Mózes (2022) calculated indicative FIB-4 NPV for the range of MASLD-fibrosis prevalences (5%–50%) reported in the primary studies included in the SR (Table 2). The PPV for a prevalence of advanced fibrosis of 30%, was 90%, 84% and 77%, using cut-offs of 0.88, 1.44 and 2.31 respectively. Mózes (2022) also calculated NPV when using various paired cut-offs (‘rule-in’ and ‘rule-out’ cut-offs for advanced fibrosis), which were adapted from the literature. Results are also reported in Table 2. Overall, NPV ranged from 77% to 90%. The highest PPV was reported when using a cut-off of 0.88.

 

Level of evidence of the literature

Sensitivity, specificity, positive predictive value, negative predictive value and area under the curve

The level of evidence for systematic reviews of diagnostic accuracy studies starts at high. The level of evidence for the outcome measures sensitivity, specificity, positive predictive value, negative predictive value and area under the curve for FIB-4 was downgraded by one level to moderate, because of risk of bias (most of the studies had high risk of bias, mainly due to not reporting and/or exclusion of technical failures from the analysis, downgraded one level).

 

Conclusions

Area under the curve

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported AUCs for identifying advanced fibrosis (F3-F4) and significant fibrosis were 0.76 and 0.68 respectively.

 

Source: Mózes, 2022; Han, 2021

 

Sensitivity

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported sensitivity ranged from 34% to 90%, using various cut-offs.

For significant fibrosis (F2), the reported sensitivity was 0.42.

 

Source: Mózes, 2022; Han, 2021

 

Specificity

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported specificity ranged from 39% to 95%, using various cut-offs.

For significant fibrosis (F2), the reported specificity was 0.93.

 

Source: Mózes, 2022; Han, 2021

 

Positive predictive value

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported positive predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 39% to 79%, using various cut-offs.

 

Source: Mózes, 2022

 

Negative predictive value

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of FIB-4 for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported negative predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 77% to 90%, using various cut-offs.

 

Source: Mózes, 2022

 

Part 2. ELF-test

Area under the curve (AUC)

Vali (2020) reported on the AUC for detecting significant (≥F2) and advanced (F3-F4) fibrosis. The AUC (95%CI) for detecting advanced fibrosis based on a multiple thresholds model using homogenized thresholds was 0.83 (0.71 to 0.90). The AUC (95%CI) for detecting significant fibrosis was 0.81 (0.66 to 0.89), based on a meta-analysis of five studies.

 

Sensitivity

Vali (2020) reported on sensitivity of the ELF-test for identification of significant (≥F2) and advanced fibrosis (F3-F4), using various cut-offs. For identification of advanced fibrosis, results are reported in Table 1. Sensitivity ranged from 0.36 to 0.93, using various cut-offs. Highest sensitivity was reported when using the cut-off of 7.70. The sensitivity (95%CI) for detecting advanced fibrosis based on a multiple thresholds model using homogenized thresholds was 0.73 (0.60 to 0.83).

For identification of significant fibrosis, results are reported in Table 3. Sensitivity ranged from 0.17 to 0.97, using various cut-offs. Highest sensitivity was reported when using the cut-off of 7.70.

 

Specificity

Vali (2020) reported on specificity of the ELF-test in ruling out significant (≥F2) and advanced fibrosis (F3-F4), using various cut-offs. For identification of advanced fibrosis, results are reported in Table 1. Specificity ranged from 0.34 to 0.96, using various cut-offs. Highest specificity was reported when using the cut-off of 11.30. The specificity (95%CI) for ruling out advanced fibrosis based on a multiple thresholds model using homogenized thresholds was 0.80 (0.68 to 0.88).

For identification of significant fibrosis, results are reported in Table 3. Specificity ranged from 0.10 to 0.99, using various cut-offs. Highest specificity was reported when using the cut-off of 11.30.

 

Positive predictive value (PPV)

Vali (2020) calculated PPV for the range of different MASLD-fibrosis prevalences, using various cut-offs. For advanced fibrosis, results are reported in Table 2. At lower prevalence levels such as 5% or 10%, the PPV ranged from 0.07 to 0.82, using various cut-offs. Highest PPV was reported when using the cut-off of 11.30.

For identification of significant fibrosis, results are reported in Table 4. At lower prevalence levels such as 5% or 10%, the PPV ranged from 0.05 to 0.66, using various cut-offs. Highest PPV was reported when using the cut-off of 11.30.

 

Negative predictive value (NPV)

Vali (2020) calculated NPV for the range of different MASLD-fibrosis prevalences, using various cut-offs. For advanced fibrosis, results are reported in Table 2. At lower prevalence levels such as 5% or 10%, the NPV ranged from 0.93 to 0.99, using various cut-offs. Highest NPV was reported when using the cut-off of 7.70.

For significant fibrosis, results are reported in Table 4. At lower prevalence levels such as 5% or 10%, the NPV ranged from 0.91 to 0.98, using various cut-offs. Highest NPV was reported when using the cut-off of 7.70.

 

Level of evidence of the literature

Sensitivity, specificity, positive predictive value, negative predictive value and area under the curve

The level of evidence for systematic reviews of diagnostic accuracy studies starts at high. The level of evidence for the outcome measures sensitivity, specificity, positive predictive value, negative predictive value and area under the curve for the ELF-test was downgraded to moderate because of risk of bias (most of the studies had high risk of bias, mainly with regard to patient selection, index test or flow and timing, downgraded one level).

 

Conclusions

Area under the curve

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

The reported AUCs for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) were 0.83 and 0.81 respectively.

 

Source: Vali, 2020

 

Sensitivity

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported sensitivity ranged from 0.36 to 0.93, using various cut-offs.

For significant fibrosis (F2), the reported sensitivity ranged from 0.17 to 0.97, using various cut-offs.

 

Source: Vali, 2020

 

Specificity

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported specificity ranged from 0.34 to 0.96, using various cut-offs.

For significant fibrosis (F2), the reported specificity ranged from 0.10 to 0.99, using various cut-offs.

 

Source: Vali, 2020

 

Positive predictive value

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported positive predictive values at a prevalence rate of MASLD-fibrosis of 5-10% ranged from 0.07 to 0.52, using various cut-offs.

For significant fibrosis (F2), the reported positive predictive values at a prevalence rate of MASLD-fibrosis of 5-10% ranged from 0.05 to 0.66, using various cut-offs.

 

Source: Vali, 2020

 

Negative predictive value

Moderate   GRADE

There is moderate certainty about the diagnostic accuracy of ELF-test for identifying advanced fibrosis (F3-F4) and significant fibrosis (F2) in patients with (suspected) MASLD, using liver biopsy as a reference standard.

 

For advanced fibrosis (F3-F4), the reported negative predictive values at a prevalence rate of MASLD-fibrosis of 5-10% ranged from 0.93 to 0.99, using various cut-offs.

For significant fibrosis (F2), the reported negative predictive values at a prevalence rate of MASLD-fibrosis of 5-10% ranged from 0.91 to 0.98, using various cut-offs.

 

Source: Vali, 2020

 

Part 3: LSM VCTE (FibroScan®)

Area under the curve (AUC)

In the IPD meta-analysis by Mózes (2022), LSM VCTE had AUC (95%CI) of 0.85 (0.84 to 0.86) for identifying advanced fibrosis (F3-F4).

 

Sensitivity

In the IPD meta-analysis by Mózes (2022), LSM VCTE had a sensitivity (95%CI) of 90% (89 to 91), 77% (75 to 79) and 55% (52 to 57), for identifying advanced fibrosis, using cut-offs of respectively 7.4 kPa, 9.1 kPa and 12.1 kPa (Table 1). Mózes (2022) also calculated sensitivity when using various paired cut-offs, which were partly adapted from the literature. Results are also reported in Table 1. Overall, sensitivity ranged from 55% to 90%. Highest sensitivity was reported when using cut-off of 7.4 kPa.

 

Specificity

In the IPD meta-analysis by Mózes (2022), LSM VCTE had a specificity (95%CI) of 60% (59 to 61), 78% (76 to 79) and 90% (89 to 91) for ruling out advanced fibrosis, using cut-offs of respectively 7.4 kPa, 9.1 kPa and 12.1 kPa (Table 1). Mózes (2022) also calculated specificity when using various paired cut-offs, which were partly adapted from the literature. Results are also reported in Table 1. Overall, specificity ranged from 60% to 94%. Highest specificity was reported when using cut-off of <10 kPa, ≥15 kPa.

 

Positive predictive value (PPV)

Mózes (2022) calculated indicative LSM VCTE PPV for the range of MASLD-fibrosis prevalences (5%–50%) reported in the primary studies included in the SR (Table 2). The PPV for a prevalence of advanced fibrosis of 30%, was 49%, 60% and 70%, using cut-offs of 7.4 kPa, 9.1 kPa and 12.1 kPa respectively. Mózes (2022) also calculated PPV when using various paired cut-offs, which were partly adapted from the literature. Results are also reported in Table 2. Overall, PPV ranged from 49% to 81%. The highest PPV was reported when using a paired cut-off of <10 kPa (‘rule-out’), ≥15 kPa (‘rule-in').

 

Negative predictive value (NPV)

Mózes (2022) calculated indicative LSM VCTE NPV for the range of MASLD-fibrosis prevalences (5%–50%) reported in the primary studies included in the SR (Table 2). The NPV for a prevalence of advanced fibrosis of 30%, was 93%, 89% and 82%, using cut-offs of 7.4 kPa, 9.1 kPa and 12.1 kPa respectively. Mózes (2022) also calculated NPV when using various paired cut-offs (‘rule-in’ and ‘rule-out’ cut-offs for advanced fibrosis), which were adapted from the literature. Results are also reported in Table 2. Overall, NPV ranged from 82% to 93%. Highest NPV was reported when using cut-off of <7.4 kPa, ≥12.1 kPa or 7.4 kPa.

 

Level of evidence of the literature

Sensitivity, specificity, positive predictive value, negative predictive value and area under the curve

The level of evidence for systematic reviews of diagnostic accuracy studies starts at high. The level of evidence for the outcome measures sensitivity, specificity, positive predictive value, negative predictive value and area under the curve for LSM VCTE (FibroScan®) was downgraded to moderate, because of risk of bias (most of the studies had high risk of bias, mainly due to not reporting and/or exclusion of technical failures from the analysis, downgraded one level).

 

Conclusions

Area under the curve

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported AUC for identifying advanced fibrosis was 0.85.

 

Source: Mózes, 2022

 

Sensitivity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported sensitivity ranged from 55% to 90%, using various cut-offs.

 

Source: Mózes, 2022

 

Specificity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported specificity ranged from 60% to 94%, using various cut-offs.

 

Source: Mózes, 2022

 

Positive predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported positive predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 49% to 81%.

 

Source: Mózes, 2022

 

Negative predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported negative predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 82% to 93%.

 

Source: Mózes, 2022

 

Part 4. Sequential combination of NITs (algorithm combining FIB-4 and LSM VCTE)

Area under the curve (AUC)

None of the included studies reported on the outcome measure AUC for identification of advanced fibrosis using sequential combination of NITs.

 

Sensitivity

Mózes (2022) reported the sensitivity for FIB-4 + LSM VCTE sequential combination for identification of advanced fibrosis. Sensitivity ranged from 66% to 80%, using various cut-offs (Table 1). Highest sensitivity was reported when using cut-off of <0.88, ≥2.31 and <7.4 kPa, ≥12.1 kPa.

 

Specificity

Mózes (2022) reported the specificity for FIB-4 + LSM VCTE sequential combination in ruling out advanced fibrosis. Specificity ranged from 81% to 86%, using various cut-offs (Table 1). Highest specificity was reported when using cut-off of <1.3, ≥2.67 and <8.0 kPa, ≥10.0 kPa.

 

Positive predictive value (PPV)

Mózes (2022) reported the PPV for FIB-4 + LSM VCTE sequential combination at a prevalence of advanced fibrosis of 30%, which ranged from 62% to 66%, using various cut-offs (Table 2). Highest PPV was reported when using cut-off of <1.3, ≥2.67 and <7.9 kPa, ≥9.6/<8.0, ≥10.0 kPa.

 

Negative predictive value (NPV)

Mózes (2022) reported the NPV for FIB-4 + LSM VCTE sequential combination at a prevalence of advanced fibrosis of 30%, which ranged from 86% to 91%, using various cut-offs (Table 2). Highest NPV was reported when using cut-off of <0.88, ≥2.31 and <7.4 kPa, ≥12.1 kPa.

 

Level of evidence of the literature

Area under the curve (AUC)

None of the included studies reported on the outcome measure AUC for identification of advanced fibrosis using sequential combination of NITs.

 

Sensitivity, specificity, positive predictive value and negative predictive value

The level of evidence for systematic reviews of diagnostic accuracy studies starts at high. The level of evidence for the outcome measures sensitivity, specificity, positive predictive value and negative predictive value for sequential combination of NITs (algorithm combining LSM VCTE and FIB-4) was downgraded to moderate, because of risk of bias (most of the studies had high risk of bias, mainly due to not reporting and/or exclusion of technical failures from the analysis, downgraded one level).

 

Conclusions

Area under the curve (AUC)

-    GRADE

None of the included studies reported on the outcome measure AUC for identification of advanced fibrosis (F3-F4) using sequential combination of tests.

 

Source: -

 

Sensitivity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of sequential combination of FIB-4 and LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported sensitivity at a prevalence rate of MASLD-fibrosis of 30% ranged from 66% to 80%, using various cut-offs.

 

Source: Mózes, 2022

 

Specificity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of sequential combination of FIB-4 and LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported specificity at a prevalence rate of MASLD-fibrosis of 30% ranged from 81% to 86%, using various cut-offs.

 

Source: Mózes, 2022

 

Positive predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of sequential combination of FIB-4 and LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported positive predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 62% to 66%, using various cut-offs.

 

Source: Mózes, 2022

 

Negative predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of sequential combination of FIB-4 and LSM VCTE (FibroScan®) for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported negative predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 86% to 91%, using various cut-offs.

 

Source: Mózes, 2022

 

Part 5: ALAT and ASAT

Area under the curve (AUC)

In the IPD meta-analysis by Mózes (2022), ALAT/ASAT had AUC (95%CI) of 0.64 (0.62 to 0.65) for identifying advanced fibrosis (F3-F4).

 

Sensitivity

In the IPD meta-analysis by Mózes (2022), ALAT/ASAT had a sensitivity (95%CI) of 90% (87 to 91), 75% (73 to 77), and 16% (14 to 18), for identifying advanced fibrosis, using cut-offs of respectively 0.64, 0.51 and 1.34 (Table 1).

 

Specificity

In the IPD meta-analysis by Mózes (2022), ALAT/ASAT had a specificity (95%CI) of 25% (23 to 26), 47% (45 to 48) and 90% (89 to 91), for identifying advanced fibrosis, using cut-offs of respectively 0.64, 0.51 and 1.34 (Table 1).

 

Positive predictive value (PPV)

Mózes (2022) calculated indicative ALAT/ASAT PPV for the range of MASLD-fibrosis prevalences (5%–50%) reported in the primary studies included in the SR (Table 2). The PPV for a prevalence of advanced fibrosis of 30%, was 34%, 38% and 41%, using cut-offs of 0.51, 0.64 and 1.34 respectively.

 

Negative predictive value (NPV)

Mózes (2022) calculated indicative ALAT/ASAT NPV for the range of MASLD-fibrosis prevalences (5%–50%) reported in the primary studies included in the SR (Table 2). The NPV for a prevalence of advanced fibrosis of 30%, was 85%, 81% and 71%, using cut-offs of 0.51, 0.64 and 1.34 respectively.

 

Level of evidence of the literature

Sensitivity, specificity, positive predictive value, negative predictive value and area under the curve

The level of evidence for systematic reviews of diagnostic accuracy studies starts at high. The level of evidence for the outcome measures sensitivity, specificity, positive predictive value, negative predictive value and area under the curve for ALAT/ASAT was downgraded to moderate, because of risk of bias (most of the studies had high risk of bias, mainly due to not reporting and/or exclusion of technical failures from the analysis, downgraded one level).

 

Conclusions

Area under the curve

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported AUC for identifying fibrosis was 0.64.

 

Source: Mózes, 2022

 

Sensitivity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported sensitivity ranged from 16% to 90%, using various cut-offs.

 

Source: Mózes, 2022

  

Specificity

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported specificity ranged from 25% to 90%, using various cut-offs.

 

Source: Mózes, 2022

 

Positive predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported positive predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 34% to 41%.

 

Source: Mózes, 2022

 

Negative predictive value

Moderate    GRADE

There is moderate certainty about the diagnostic accuracy of ALAT/ASAT for identifying advanced fibrosis (F3-F4) in patients with MASLD, using liver biopsy as a reference standard.

 

The reported negative predictive values at a prevalence rate of MASLD-fibrosis of 30% ranged from 71% to 85%.

 

Source: Mózes, 2022

 

 

Tabel 1: Diagnostic accuracy of several non-invasive tests for identifying patients with advanced MASLD-fibrosis (F3-F4), adapted from Han (2021), Mózes (2022) and Vali (2020).

 

Cut-off 1

Cut-off 2

Cut-off 3

Cut-off 4

Cut-off 5

Cut-off 6

Cut-off 7

Cut-off 8

Cut-off 9

Cut-off 10

LSM VCTE (kPa)

N=5489

 

 

 

<9.9, ≥11.4*

<7.1, ≥14.1*

<10, ≥15*

<7.9, ≥9.6*

<7.4, ≥12.1*

7.4

9.1

12.1

 

 

Sensitivity (%)

69 (67–71)

83 (80–86)

59 (57–61)

84 (82–87)

84 (81–87)

90 (89–91)

77 (75–79)

55 (52–57)

 

 

Specificity (%)

86 (85–88)

90 (88–92)

94 (93–96)

78 (76–80)

87 (85–88)

60 (59–61)

78 (76–79)

90 (89–91)

 

 

Misclassified (%)

17 (16–19)

7 (6–8)

12 (11–13)

17 (16–19) 10

10 (9–11)

31 (31–32)

22 (22–23)

21 (20–21)

 

 

Indeterminate (%)

7 (6–8)

39 (37–40)

18 (17–19)

13 (12–14)

31 30–33)

 

 

 

 

 

PPV**

68

78

81

62

73

49

60

70

 

 

NPV**

87

93

84

92

93

93

89

82

 

 

FIB-4

N=5393

 

 

 

<1.3, ≥2.67*

<1.3, ≥3.25*

<0.88, ≥2.31*

0.88

1.44

2.31

1.02-1.45

1.515-2.09

2.67

3.25

Sensitivity (%)

54 (52–56)

44 (42–46)

80 (76–83)

90 (88–91)

69 (67–72)

38 (36–41)

69 (59-77)

74 (58-85)

34 (27-42)

39 (22-59)

Specificity (%)

91 (89–92)

95 (93–96)

79 (77–81)

39 (37–40)

70 (69–72)

90 (89–91)

64 (57-71)

80 (72-86)

95 (92-96)

95 (93-97)

Misclassified (%)

12 (11–13)

10 (9–11)

10 (9–11)

46 (46–47)

30 (30–31)

26 (25–26)

 

 

 

 

Indeterminate (%)

34 (33–35)

39 (37–40)

52 (50–53)

 

 

 

 

 

 

 

PPV**

72

79

 

39

50

62

 

 

 

 

NPV**

82

80

 

90

84

77

 

 

 

 

FIB-4 & LSM VCTE (kPa)

N=5159

 

 

 

<0.88, ≥2.31 & <7.4, ≥12.1

<1.3, ≥2.67 & <7.9, ≥9.6

<1.3, ≥2.67 & <8.0, ≥10.0

 

 

 

 

 

 

 

Sensitivity (%)

80 (77–83)

67 (64–69)

66 (63–68)

 

 

 

 

 

 

 

Specificity (%)

81 (79–83)

85 (84–87)

86 (84–87)

 

 

 

 

 

 

 

Misclassified (%)

16 (14–17)

19 (18–21)

19 (18–20)

 

 

 

 

 

 

 

Indeterminate (%)

18 (17–19)

5 (4–5)

5 (4–6)

 

 

 

 

 

 

 

PPV**

62 (60–65)

66 (64–68)

66 (64–68)

 

 

 

 

 

 

 

NPV**

91 (90–92)

86 (85–87)

86 (85–87)

 

 

 

 

 

 

 

ELF-test

N=NR

 

 

 

7.7

9.8

10.51

11.30

 

 

 

 

 

 

Sensitivity (%)

93 (82-98)

65 (49-77)

51 (31-70)

36 (15-63)

 

 

 

 

 

 

Specificity (%)

34 (13-65)

86 (77-92)

93 (85-96)

96 (90-99)

 

 

 

 

 

 

Misclassified (%)

 

 

 

 

 

 

 

 

 

 

Indeterminate (%)

 

 

 

 

 

 

 

 

 

 

PPV*

38

66

75

81

 

 

 

 

 

 

NPV*

92

85

81

78

 

 

 

 

 

 

ALAT/ASAT

N=5434

 

 

 

0.51

0.64

1.34

 

 

 

 

 

 

 

Sensitivity (%)

90 (87–91)

75 (73–77)

16 (14–18)

 

 

 

 

 

 

 

Specificity (%)

25 (23–26)

47 (45–48)

90 (89–91)

 

 

 

 

 

 

 

Misclassified (%)

56 (56–57)

45 (45–46)

32 (32–33)

 

 

 

 

 

 

 

Indeterminate (%)

 

 

 

 

 

 

 

 

 

 

PPV**

34

38

41

 

 

 

 

 

 

 

NPV**

85

81

71

 

 

 

 

 

 

 

*Also available, diagnostic accuracy of isolated cut-offs from literature (see supplemental tables Mózes, 2022). **PPV and NPV at 30% prevalence of advanced fibrosis. Part of the cut-offs were derived from literature. PPV = Positive predictive value, NPV = Negative predictive value.

 

Table 2: Indicative positive predictive value and negative predictive value for several levels of prevalence of advanced fibrosis, adapted from Mózes (2022) and Vali (2020).

 

Prevalence of advanced fibrosis*

Cut-offs

5%

10%

20%

30%

 

PPV/NPV (%)

PPV/NPV (%)

PPV/NPV (%)

PPV/NPV (%)

LSM VCTE

 

 

 

 

7.4 kPa

11/99

20/98

36/96

49/93

9.1 kPa

16/98

28/97

47/93

60/89

12.1 kPa

22/97

38/95

58/89

70/82

<7.4 kPa, ≥12.1 kPa

25/99

42/98

62/96

73/93

<9.9 kPa, ≥11.4 kPa

21/98

35/96

55/92

68/87

<7.1 kPa, ≥14.1 kPa

30/99

48/98

67/95

78/93

<10 kPa, ≥15 kPa

34/98

52/95

71/90

81/84

<7.9 kPa, ≥9.6 kPa

17/99

30/98

49/95

62/92

FIB-4

 

 

 

 

0.88

7/99

14/97

27/94

39/90

1.44

11/98

20/95

37/90

50/84

2.31

17/97

30/93

49/85

62/77

<1.3, ≥2.67

24/97

40/95

60/89

72/82

<1.3, ≥3.25

32/97

49/94

69/87

79/80

ELF-test

 

 

 

 

7.7

7/99

14/98

26/95

38/92

9.8

20/98

34/96

54/91

66/85

10.51

26/97

43/94

63/88

75/81

11.30

34/97

52/93

71/86

81/78

AST/ALT

 

 

 

 

0.51

6/98

12/96

23/91

34/85

0.64

7/97

14/94

26/88

38/81

1.34

8/95

15/91

29/81

41/71

*Also available, indicative PPV and NPV at higher levels of prevalence of advanced fibrosis (see supplemental tables Mózes, 2022 and Vali, 2020). Part of the cut-offs were derived from literature. PPV = Positive predictive value, NPV = Negative predictive value.

 

Table 3: Diagnostic accuracy of several non-invasive tests for identifying patients with significant MASLD-fibrosis (F3-F4), adapted from Han (2022) and Vali (2020).

 

Cut-off 1

Cut-off 2

Cut-off 3

Cut-off 4

LSM VCTE

Not reported

FIB-4

 

Pooled

0.66 to 0.89

1.4 to 1.9

2.67 to 3.25

Sensitivity (%)

42 (16–73)

69 (55–80)

65 (53–75)

6 (2–22)

Specificity (%)

93 (56–99)

61 (44–76)

66 (51–79)

98 (94–100)

Misclassified (%)

 

 

 

 

Indeterminate (%)

 

 

 

 

PPV*

 

 

 

 

NPV*

 

 

 

 

FIB-4 & LSM VCTE

Not reported

ELF-test

 

7.7

9.8

10.51

11.30

Sensitivity (%)

97 (88-99)

57 (40-73)

35 (22-50)

17 (9-29)

Specificity (%)

10 (3-26)

89 (73-96)

97 (89-99)

99 (96-100)

Misclassified (%)

 

 

 

 

Indeterminate (%)

 

 

 

 

PPV*

32

69

81

88

NPV*

88

83

78

74

ALAT/ASAT

Not reported

*PPV and NPV at 30% prevalence of advanced fibrosis. Part of the cut-offs were derived from literature. PPV = Positive predictive value, NPV = Negative predictive value.

 

Table 4: Indicative positive predictive value and negative predictive value for several levels of prevalence of significant fibrosis, adapted from Mózes (2022) and Vali (2020).

 

Prevalence of significant fibrosis*

Cut-offs

5%

10%

20%

30%

 

PPV/NPV (%)

PPV/NPV (%)

PPV/NPV (%)

PPV/NPV (%)

LSM VCTE

Not reported

FIB-4

Not reported

ELF-test

7.7

5/98

11/97

21/93

32/88

9.8

22/98

37/95

57/89

69/83

10.51

35/97

53/93

72/86

81/78

11.30

48/96

66/91

82/83

88/74

ALAT/ASAT

Not reported

*Also available, indicative PPV and NPV at higher levels of prevalence of advanced fibrosis (see supplemental tables Mózes, 2022 and Vali, 2020). Part of the cut-offs were derived from literature. PPV = Positive predictive value, NPV = Negative predictive value.

A systematic review of the literature was performed to answer the following question:  What is the additional diagnostic value of LCM VCTE (FibroScan®), Fibrosis-4 Index for liver fibrosis (FIB-4) and Enhanced Liver Fibrosis test (ELF) for detection of advanced liver fibrosis (F3-4), compared to alanine aminotransferase (ALT) and aspartate aminotransferase (AST) blood tests in adults at risk for MASLD, using liver biopsy with histology as a reference standard?

 

P (patients): Adults at risk for MASLD-fibrosis

I (Index test): FIB-4, ELF-test or LSM VCTE (measured with FibroScan®)

C (Comparator): AST, ALT blood test

R (Reference): Histologically scored MASLD-fibrosis

O (Outcomes): Sensitivity, specificity, positive predictive value (PPV), negative predictive value (NPV) and area under the curve (AUC)

T/S (Timing/setting): Secondary care

 

Relevant outcome measures

The guideline development group considered sensitivity (to rule out MASLD-fibrosis, first step in proposed diagnostic pathway) and specificity (to identify MASLD-fibrosis, second step in proposed diagnostic pathway) as critical outcome measures for decision making; and area under the curve (AUC), positive predictive value and negative predictive value as important additional outcome measures.

 

Search and select (Methods)

The databases Medline (via OVID) and Embase (via Embase.com) were searched with relevant search terms until the 4th of July 2022. The detailed search strategy is depicted under the tab Methods. The systematic literature search was broad and consequently resulted in many hits. Therefore, results were restricted to systematic reviews (SR). The search identified 99 SRs investigating the diagnostic accuracy of Non-invasive test (NITs) in patients with MASLD. 28 studies were initially selected based on title and abstract screening. After reading the full text, 25 studies were excluded (see the table with reasons for exclusion under the tab Methods), and three SRs were included.

 

Results

Three SRs investigating the diagnostic performance of individual NITs and sequential combination of NITs were included in the analysis of literature (Mózes, 2022; Han, 2021 and Vali, 2020). Important study characteristics and results are summarized in the evidence tables. The assessment of the risk of bias is summarized in the risk of bias tables.

  1. Ajmera, V., Cepin, S., Tesfai, K. et al (2023). A prospective study on the prevalence of NAFLD, advanced fibrosis, cirrhosis and hepatocellular carcinoma in people with type 2 diabetes. Journal of Hepatology, 78(3), 471-478.
  2. van den Berg, E. H., Amini, M., Schreuder, T. C. et al (2017). Prevalence and determinants of non-alcoholic fatty liver disease in lifelines: A large Dutch population cohort. PLoS One, 12(2), e0171502.
  3. Blank, V., Petroff, D., Beer, S. et al (2020). Current NAFLD guidelines for risk stratification in diabetic patients have poor diagnostic discrimination. Scientific reports, 10(1), 18345.
  4. Boursier, J., Hagström, H., Ekstedt, M. et al (2022). Non-invasive tests accurately stratify patients with NAFLD based on their risk of liver-related events. Journal of hepatology, 76(5), 1013-1020.
  5. Davyduke, T., Tandon, P., Al?Karaghouli, M., Abraldes, J. G., & Ma, M. M. (2019). Impact of implementing a “FIB?4 first” strategy on a pathway for patients with NAFLD referred from primary care. Hepatology communications, 3(10), 1322-1333.
  6. van Dijk, A. M., Vali, Y., Mak, A. L. et al (2022). Noninvasive tests for nonalcoholic fatty liver disease in a multi?ethnic population: The HELIUS study. Hepatology communications.
  7. Gracen, L., Hayward, K. L., Irvine, K. M., Valery, P. C., & Powell, E. E. (2022). Low accuracy of FIB-4 test to identify people with diabetes at low risk of advanced fibrosis. Journal of Hepatology, 77(4), 1219-1221.
  8. Graupera, I., Thiele, M., Serra-Burriel, M. et al & Investigators of the LiverScreen Consortium. (2022). Low accuracy of FIB-4 and NAFLD fibrosis scores for screening for liver fibrosis in the population. Clinical Gastroenterology and Hepatology, 20(11), 2567-2576.
  9. Han, S., Choi, M., Lee, B. et al (2022). Accuracy of Noninvasive Scoring Systems in Assessing Liver Fibrosis in Patients with Nonalcoholic Fatty Liver Disease: A Systematic Review and Meta-Analysis. Gut and Liver, 16(6), 952-963.
  10. Kim, R. G., Deng, J., Reaso, J. N. et al (2022). Noninvasive Fibrosis Screening in Fatty Liver Disease Among Vulnerable Populations: Impact of Diabetes and Obesity on FIB-4 Score Accuracy. Diabetes Care, 45(10), 2449-2451.
  11. Koehler, E. M., Schouten, J. N., Hansen, B. E. et al (2012). Prevalence and risk factors of non-alcoholic fatty liver disease in the elderly: results from the Rotterdam study. Journal of hepatology, 57(6), 1305-1311.
  12. Kumari, B., Kumar, R., Sharma, S. et al (2021). Diagnostic Accuracy of FIB-4 and FIB-5 Scores as Compared to Fibroscan for Assessment of Liver Fibrosis in Patients With Non-Alcoholic Fatty Liver Disease. Cureus, 13(8).
  13. Lee, J., Vali, Y., Boursier, J. et al (2021). Prognostic accuracy of FIB?4, NAFLD fibrosis score and APRI for NAFLD?related events: a systematic review. Liver International, 41(2), 261-270.
  14. Liebe, R., Esposito, I., Bock, H. H. et al (2021). Diagnosis and management of secondary causes of steatohepatitis. Journal of Hepatology, 74(6), 1455-1471.
  15. Lomonaco, R., Godinez Leiva, E. et al (2021). Advanced liver fibrosis is common in patients with type 2 diabetes followed in the outpatient setting: the need for systematic screening. Diabetes Care, 44(2), 399-406.
  16. McPherson, S., Hardy, T., Dufour, J. F. et al (2017). Age as a confounding factor for the accurate non-invasive diagnosis of advanced NAFLD fibrosis. The American journal of gastroenterology, 112(5), 740.
  17. Mózes, F. E., Lee, J. A., Selvaraj, E. A. et al (2022). Diagnostic accuracy of non-invasive tests for advanced fibrosis in patients with NAFLD: an individual patient data meta-analysis. Gut, 71(5), 1006-1019.
  18. Perumpail, B. J., Khan, M. A., Yoo, E. R. et al (2017). Clinical epidemiology and disease burden of nonalcoholic fatty liver disease. World journal of gastroenterology, 23(47), 8263.
  19. Srivastava, A., Gailer, R., Tanwar, S. et al (2019). Prospective evaluation of a primary care referral pathway for patients with non-alcoholic fatty liver disease. Journal of hepatology, 71(2), 371-378.
  20. Sharma, C., Cococcia, S., Ellis, N. et al (2021). Systematic review: Accuracy of the enhanced liver fibrosis test for diagnosing advanced liver fibrosis and cirrhosis. Journal of Gastroenterology and Hepatology, 36(7), 1788-1802.
  21. Vali, Y., Lee, J., Boursier, J., Spijker, R. et al (2020). Enhanced liver fibrosis test for the non-invasive diagnosis of fibrosis in patients with NAFLD: a systematic review and meta-analysis. Journal of hepatology, 73(2), 252-262.
  22. Younossi, Z. M., Blissett, D., Blissett, R. et al (2016). The economic and clinical burden of nonalcoholic fatty liver disease in the United States and Europe. Hepatology, 64(5), 1577-1586.

Evidence table for systematic reviews of diagnostic test accuracy studies

Research question: What is the additional diagnostic value of LCM VCTE (FibroScan®), Fibrosis-4 Index for liver fibrosis (FIB-4) and Enhanced Liver Fibrosis test (ELF) for detection of advanced liver fibrosis (F3-4), compared to alanine aminotransferase (ALT) and aspartate aminotransferase (AST) blood tests in adults at risk for MASLD, using liver biopsy with histology as a reference standard?

Study reference

Study characteristics

Patient characteristics

 

Index test

(test of interest)

Reference test

 

Follow-up

Outcome measures and effect size

Comments

Han, 2021

 

Study characteristics and results are extracted from the SR (unless stated otherwise)

SR and meta-analysis

 

Literature search up from Jan/1997 to Oct/2020

 

Study design: cohort, case-control

[prospective / retrospective]

 

Setting and Country:

Studies were conducted in Asia (N=16), Europe (N=8), America (N=9), Australia (N=1), more than 1 continent (N=2).

For details on individual studies, see table 1 (Han, 2022).

 

Source of funding and conflicts of interest:

Non-commercial funding by Basic Science Research

Program through the National Research Foundation of

Korea funded by the Ministry of Education, Science

and Technology. No competing interests were reported.

 

Inclusion criteria SR: Studies that included adult patients with biopsy-proven/suspected MAFLD with paired liver histology and index biomarker data. Only studies with histological assessment of liver biopsy as reference standard.

 

Exclusion criteria SR: Studies that included participants with coexisting liver disease, decompensated cirrhosis or that addressed a different context of use.

 

36 studies included

 

Important patient characteristics:

 

Total sample

N

14992

 

Mean age, years±SD

48.57±6.13

 

Sex, female (%)

NR

 

Diabetes (%)

36.2

 

BMI≥30 kg/m2 (%)

NR

 

MASH (%)

NR

 

For details on individual studies, see table 1 (Han, 2021).

 

Describe index tests and

cut-off point(s):

 

FIB-4 score, various cut-offs were used to determine diagnostic accuracy: 1.02 to 1.45 (20 studies); 1.515 to 2.09; 2,67 (18 studies) (5 studies) and 3.25 (9 studies).

Describe reference test and cut-off point(s):

 

Reference test in all studies: Liver histology, cut-off not reported.

 

Prevalence (%)

[based on refence test at specified cut-off point]

Not reported

 

For how many participants were no complete outcome data available?

N (%)

Not reported

 

Reasons for incomplete outcome data described?

Not reported

 

Endpoint of follow-up:

NA

Outcome measures and effect size:

 

Advanced fibrosis (F3-F4)

 

Outcome measure-sensitivity

Pooled characteristic [‘type of statistical analysis’ e.g. bivariate analysis] per index test and cut-off point:

 

Cut-off = 1.02 to 1.45 (95%CI)

0.69 (0.59–0.77

Cut-off =1.515 to 2.09 (95%CI)

0.74 (0.58–0.85)

Cut-off = 2.67 (95%CI)

0.34 (0.27–0.42)

Cut-off = 3.25 (95%CI)

0.39 (0.22–0.59)

All (95%CI)

0.42 (0.33–0.51)

Heterogeneity (reasons): NR

 

Outcome measure-specificity

Pooled characteristic [‘type of statistical analysis’ e.g. bivariate analysis] per index test and cut-off point:

 

Cut-off = 1.02 to 1.45 (95%CI)

0.64 (0.57–0.71)

Cut-off =1.515 to 2.09 (95%CI)

0.80 (0.72–0.86)

Cut-off = 2.67 (95%CI)

0.95 (0.92–0.96)

Cut-off = 3.25 (95%CI)

0.95 (0.93–0.97)

All

0.93 (0.91–0.95)

Heterogeneity (reasons): NR

 

Outcome measure-AUC

 

Pooled characteristic [‘type of statistical analysis’ e.g. bivariate analysis] per index test and cut-off point:

 

Cut-off = 1.02 to 1.45 (95%CI)

0.73 (0.67–0.80)

Cut-off =1.515 to 2.09 (95%CI)

0.82 (0.78–0.87)

Cut-off = 2.67 (95%CI)

0.74 (0.70–0.76)

Cut-off = 3.25 (95%CI)

0.76 (0.77–0.88)

All (95%CI)

0.76 (0.74–0.81)

Heterogeneity (reasons): NR

 

Significant fibrosis (F2)

 

Outcome measure-sensitvity

Pooled characteristic [‘type of statistical analysis’ e.g. bivariate analysis] per index test and cut-off point:

 

Cut-off = 0.66 to 0.89 (95%CI)

0.69 (0.55–0.80)

Cut-off =1.4 to 1.9 (95%CI)

0.65 (0.53–0.75)

Cut-off = 2.67 to 3.25  (95%CI)

0.06 (0.02–0.22)

All (95%CI)

0.42 (0.16–0.73)

Heterogeneity (reasons): NR

 

Outcome measure-specificity

Pooled characteristic [‘type of statistical analysis’ e.g. bivariate analysis] per index test and cut-off point:

 

Cut-off = 0.66 to 0.89 (95%CI)

0.61 (0.44–0.76)

Cut-off =1.4 to 1.9 (95%CI)

0.66 (0.51–0.79)

Cut-off = 2.67 to 3.25  (95%CI)

0.98 (0.94–1.00)

All (95%CI)

0.93 (0.56–0.99)

Heterogeneity (reasons): NR

 

Outcome measure-AUC

Pooled characteristic [‘type of statistical analysis’ e.g. bivariate analysis] per index test and cut-off point:

 

Cut-off = 0.66 to 0.89 (95%CI)

0.66 (0.61–0.77)

Cut-off =1.4 to 1.9 (95%CI)

0.74 (0.54–0.85)

Cut-off = 2.67 to 3.25  (95%CI)

0.67 (0.61–0.73)

All (95%CI)

0.68 (0.65–0.76)

Heterogeneity (reasons): NR

 

Study quality (ROB): QUADAS and QUIPS tool were used to assess risk of bias. Using the QUADAS tool revealed unclear or high risk of bias in 25% of the studies with regards to patient selection. Using the QUIPS tool revealed unclear or high risk of bias in 25% of the studies with regards to patient selection and prognostic factor measurement. For details, see supplementary data (Han, 2022).

 

Place of the index test in the clinical pathway: replacement/triage

 

Choice of cut-off point:

At first it is important to rule out MASLD-fibrosis (high sensitivity, low false negatives), using a test that is user-friendly and no important limitations with regards to availability and applicability. The second step is to identify MASLD-fibrosis in patients who are suspected of MASLD-fibrosis, using a more advanced test. This test should have a high specificity (low number of false positives).

Author’s conclusion

Both FIB-4 index and NFS were useful in predicting the degree of liver fibrosis in MASLD. The diagnostic accuracy of these scoring systems was higher in predicting AF than in SF. Thus, the FIB-4 index and NFS may

be considered as alternative diagnostic methods to liver

biopsy when predicting the level of fibrosis in MASLD.

 

 

Mozes (2022)

 

Study characteristics and results are extracted from the SR (unless stated otherwise)

SR and meta-analysis

 

Literature search up from Jan/1997 to Oct/2020

 

 

Study design:

all study designs were considered

 

Setting and Country:

Studies were conducted in Europe  (67%), Asia (40%) and Australia (3%).

 

For details on individual studies, see table 1 (Mozes, 2022).

 

Source of funding and conflicts of interest:

Non-commercial funding (funded by the Innovative Medicines Initiative 2 Joint Undertaking).

Authors reported several competing interests (personal fees, grants, consultancy etc from commercial parties like farmaceutical companies and Echosens).

 

Inclusion criteria SR:

Studies in adults (≥18 years) with MASLD and

paired liver histology and LSM VCTE, studies reporting histological classification of liver fibrosis

based on the MASH CRN staging system and reporting on advanced fibrosis or cirrhosis.

 

Exclusion criteria SR:

NR

 

 37 studies included (30 datasets)

 

Important patient characteristics:

 

Total sample

N

5735

 

Median age, years (IQR)

54 (19)

 

Sex, female (%)

45

 

Diabetes (%)

33

 

BMI≥30 kg/m2 (%)

43

 

MASH (%)

50

 

For details on individual studies, see table 1 (Mozes, 2022).

 

Describe index tests and

cut-off point(s):

 

Indextest of main interest: LSM VCTE

performed

with FibroScan (Echosens, France). Several cut-offs were used to determine diagnostic accuracy, of which <7.9

kPa and ≥9.6 kPa are the most used.

 

Other indextest of interest:

FIB-4 (computed where data were available)

 

For details on hardware and probe used in individual studies, see table 1 (Mozes, 2022).

Describe reference test and cut-off point(s):

 

Reference test in all studies:

histological classification of liver fibrosis

 

Cut-off points:

Based on the non-alcoholic

steatohepatitis Clinical Research

Network (MASH CRN) staging system.

 

 

Prevalence (%)

(based on refence test at specified cut-off point]

30%

 

For how many participants were no complete outcome data available?

Missing biopsy (N)

14

LSM VCTE (N)

194

 

Reasons for incomplete outcome data described?

Missing biopsy (N)

14

LSM VCTE (N)

194

 

NB. Those patients were not included in the final IPD-dataset.

Endpoint of follow-up:

N.A.

Outcome measures and effect size:

 

Outcome measure-sensitivity

Pooled characteristic (IPD-analysis) per index test and cut-off point:

 

Isolated cut-offs: corresponding to 90% sensitivity

Paired cut-offs: corresponding to 90% sensiticity (lower value) and 90% specificity (upper value)

 

LSM VCTE

Isolated cut-offs

cut-off=7.4 (95%CI)

90 (89 to 91)

cut-off=12.1 (95%CI)

55 (52 to 57)

Heterogeneity (reasons): NR

 

Paired cut-offs

Cut-off = <9.9, ≥11.4 (95%CI)

69 (67–71)

Cut-off =<7.1, ≥14.1 (95%CI)

83 (80–86)

Cut-off = <10, ≥15 (95%CI)

59 (57–61)

Cut-off = <7.9, ≥9.6 (95%CI)

84 (82–87)

Cut-off = <7.4, ≥12.1 (95%CI)

84 (81–87)

 

FIB-4

Isolated cut-offs

cut-off=0.88 (95%CI)

90 (88–91)

cut-off=2.31 (95%CI)

38 (36–41)

Heterogeneity (reasons): NR

 

Paired cut-offs

Cut-off = <1.3, ≥2.67 (95%CI)

54 (52–56)

Cut-off <1.3, ≥3.25 (95%CI)

44 (42–46)

Cut-off = <0.88, ≥2.31 (95%CI)

80 (76–83)

 

FIB-4 & LSM VCTE

Paired cut-offs

Cut-off = <0.88, ≥2.31 & <7.4, ≥12.1 (95%CI)

80 (77–83)

Cut-off <1.3, ≥2.67 & <7.9, ≥9.6 (95%CI)

67 (64–69)

Cut-off <1.3, ≥2.67 & <8.0, ≥10.0 (95%CI)

66 (63–68)

 

ALAT/ASAT

cut-off=0.51 (95%CI)

90 (87-91)

cut-off=0.64 (95%CI)

75 (73-77)

cut-off=1.34 (95%CI)

16 (14-18)

Heterogeneity (reasons): NR

 

Outcome measure-specificity

Pooled characteristic (IPD-analysis) per index test and cut-off point:

 

Isolated cut-offs: corresponding to 90% specificity

Paired cut-offs: corresponding to 90% sensiticity (lower value) and 90% specificity (upper value)

 

LSM VCTE

Isolated cut-offs

cut-off=7.4 (95%CI)

60 (59–61)

cut-off=12.1 (95%CI)

90 (89–91)

Heterogeneity (reasons): NR

 

Paired cut-offs

Cut-off = <9.9, ≥11.4 (95%CI):

86 (85–88)

Cut-off =<7.1, ≥14.1 (95%CI):

90 (88–92)

Cut-off = <10, ≥15 (95%CI):

94 (93–96)

Cut-off = <7.9, ≥9.6 (95%CI):

78 (76–80)

Cut-off = <7.4, ≥12.1 (95%CI):

87 (85–88)

Heterogeneity (reasons): NR

 

FIB-4

Isolated cut-offs

cut-off=0.88 (95%CI)

39 (37–40)

cut-off=2.31(95%CI)

90 (89–91)

Heterogeneity (reasons): NR

 

Paired cut-offs

Cut-off = <1.3, ≥2.67 (95%CI)

91 (89–92)

Cut-off <1.3, ≥3.25 (95%CI)

95 (93–96)

Cut-off = <0.88, ≥2.31 (95%CI)

79 (77–81)

 

FIB-4 & LSM VCTE

Paired cut-offs

Cut-off = <0.88, ≥2.31 & <7.4, ≥12.1 (95%CI)

81 (79–83)

Cut-off <1.3, ≥2.67 & <7.9, ≥9.6 (95%CI)

85 (84–87)

Cut-off <1.3, ≥2.67 & <8.0, ≥10.0 (95%CI)

86 (84–87)

 

ALAT/ASAT

cut-off=0.51 (95%CI)

25 (23-26)

cut-off=0.64 (95%CI)

47 (45-48)

cut-off=1.34 (95%CI)

90 (89-91)

Heterogeneity (reasons): NR

 

 

Outcome measure-AUC

Pooled characteristic (IPD-analysis) per index test:

 

LSM VCTE (95%CI)

0.85 (0.84–0.86)

FIB-4 (95%CI)

0.76 (0.74–0.77)

ALAT/ASAT (95%CI)

0.64 (0.62-0.65)

 

Outcome measure-positive predictive value

Pooled characteristic (IPD-analysis) per index test and cut-off point:

 

Isolated cut-offs: corresponding to 90% specificity

Paired cut-offs: corresponding to 90% sensiticity (lower value) and 90% specificity (upper value)

 

LSM VCTE

Paired cut-offs at prevalence of 30%*

Cut-off =<7.1, ≥14.1 (95%CI):

78 (NR)

Cut-off = <7.9, ≥9.6 (95%CI):

62 (NR)

 

*for PPV using lower or higher prevalences, see supplemental table (Mozes, 2022).

FIB-4

 

Paired cut-offs at prevalence of 30%*

Cut-off = <1.3, ≥2.67 (95%CI)

72 (NR)

Cut-off <1.3, ≥3.25 (95%CI)

79 (NR)

 

*for PPV using lower or higher prevalences, see supplemental table (Mozes, 2022).

 

FIB-4 & LSM VCTE

Paired cut-offs

Cut-off = <0.88, ≥2.31 & <7.4, ≥12.1 (95%CI)

62 (60–65)

Cut-off <1.3, ≥2.67 & <7.9, ≥9.6 (95%CI)

66 (64–68)

Cut-off <1.3, ≥2.67 & <8.0, ≥10.0 (95%CI)

66 (64–68)

 

ALAT/ASAT

cut-off=0.51 (95%CI)

34 (NR)

cut-off=0.64 (95%CI)

38 (NR)

cut-off=1.34 (95%CI)

41 (NR)

Heterogeneity (reasons): NR

 

Outcome measure-negative predictive value

Pooled characteristic (IPD-analysis) per index test and cut-off point:

 

Isolated cut-offs: corresponding to 90% specificity

Paired cut-offs: corresponding to 90% sensiticity (lower value) and 90% specificity (upper value)

 

LSM VCTE

Paired cut-offs at prevalence of 30%*

Cut-off =<7.1, ≥14.1 (95%CI):

78 (NR)

Cut-off = <7.9, ≥9.6 (95%CI):

62 (NR)

 

*for NPV using lower or higher prevalences, see supplemental table (Mozes, 2022).

 

FIB-4

Paired cut-offs at prevalence of 30%*

Cut-off = <1.3, ≥2.67 (95%CI)

93 (NR)

Cut-off <1.3, ≥3.25 (95%CI)

92 (NR)

 

*for NPV using lower or higher prevalences, see supplemental table (Mozes, 2022).

 

FIB-4 & LSM VCTE

Paired cut-offs

Cut-off = <0.88, ≥2.31 & <7.4, ≥12.1 (95%CI)

91 (90–92)

Cut-off <1.3, ≥2.67 & <7.9, ≥9.6 (95%CI)

86 (85–87)

Cut-off <1.3, ≥2.67 & <8.0, ≥10.0 (95%CI)

86 (85–87)

 

ALAT/ASAT

cut-off=0.51 (95%CI)

85 (NR)

cut-off=0.64 (95%CI)

81 (NR)

cut-off=1.34 (95%CI)

71 (NR)

Heterogeneity (reasons): NR

 

Study quality (ROB):

QUADAS-2 tool was used, only one study had low risk of bias in all domains. In other studies (65%) high risk or unlcear risk of bias in flow and timing domain. For details, see supplemental data (Mozes, 2022).

 

Place of the index test in the clinical pathway:

Replacement/triage

 

Choice of cut-off point:

At first it is important to rule out MASLD-fibrosis (high sensitivity, low false negatives), using a test that is user-friendly and no important limitations with regards to availability and applicability. The second step is to identify MASLD-fibrosis in patients who are suspected of MASLD-fibrosis, using a more advanced test. This test should have a high specificity (low number of false positives).

 

Authors conclusion

This study provides further validation of the use of sequential combination of FIB-4

and LSM VCTE to rule out patients with MASLD and advanced fibrosis who can be

managed in primary care. We have shown how the use of upper cut-offs to rule in cirrhosis in combination with lower cut-offs to rule out advanced fibrosis can lead to a reduction in the number of patients who would need to undergo liver biopsy.

 

Remarks

The time interval between biopsy and the blood

sampling varied significantly between the studies.

 

Vali  (2022)

 

Study characteristics and results are extracted from the SR (unless stated otherwise)

SR and meta-analysis

 

Literature search up to December 2019.

 

 

Study design: no restriction

 

Setting and Country:

NR

 

Source of funding and conflicts of interest:

Non-commercial funding, study is part of he LITMUS study, which is funded by the IMI2 Program of the EU. Authors reported several competing interests, like grants, consultancy and fees from commercial parties like farmaceutical companies.

 

Inclusion criteria SR

Studies, reported in peer-reviewed journals or conference abstracts,  including patients (>−

18 years) with biopsy-proven or suspected MASLD, with paired liver histology and index biomarker data. Studies including participants with mixed etiologies were only included if results were reported separately in patients with MASLD.

 

Exclusion criteria SR: Studies were excluded if they included participants with coexisting

liver disease, decompensated cirrhosis,

or addressed a different context of use.Letter/commentary designs

were also excluded, as were publications

that did not provide enough data to calculate diagnostic accuracy

estimates.

 

16  studies included

 

Important patient characteristics:

 

Total sample

N

5366

 

Median or mean age, years (range))

42 to 60

 

Sex, female (%)

NR in part of the studies

 

Diabetes (%)

NR

 

Mean BMI (kg/m2, range)

27.3 to 49.1

 

MASH (%)

NR

 

For details on individual studies, see table 1 (Vali, 2022).

 

Describe index and

cut-off point(s):

 

ELF-test: all results were converted to those of the Siemens algorithm, using the following regression: (Guha results + 8.6498)/0.8854

 

 

Describe reference test and cut-off point(s):

 

Reference test in all studies: histological assessment of

liver biopsy

 

Cut-off points:

 

Prevalence (%)

[based on refence test at specified cut-off point]

Not reported

 

For how many participants were no complete outcome data available?

N (%)

Not reported

 

Reasons for incomplete outcome data described?

Not reported

 

Endpoint of follow-up:

Not reported

Outcome measures and effect size

 

Advanced fibrosis

 

Outcome measure-sensitivity

Pooled characteristic (multiple threshold model) per index test and cut-off point:

 

ELF-test

Cut-off 7.70 (95%CI)

0.93 (0.82-0.98)

Cut-off = 9.80 (95%CI)

0.65 (0.49-0.77)

Cut-off 10.51 (95%CI)

0.51 (0.31-0.70)

Cut-off 11.30 (95%CI)

0.36 (0.15-0.63)

 

Outcome measure-specificity

Pooled characteristic (multiple threshold model) per index test and cut-off point:

 

ELF-test

Cut-off 7.70 (95%CI)

0.34 (0.13-0.65)

Cut-off = 9.80 (95%CI)

0.86 (0.77-0.92)

Cut-off 10.51 (95%CI)

0.93(0.85-0.96)

Cut-off 11.30 (95%CI)

0.96 (0.90-0.99)

 

Outcome measure-positive predictive value

At prevalence of 30%*

Pooled characteristic (multiple threshold model) per index test and cut-off point:

 

ELF-test

Cut-off 7.70 (95%CI)

0.38 (NR)

Cut-off = 9.80 (95%CI)

0.66 (NR)

Cut-off 10.51 (95%CI)

0.75 (NR)

Cut-off 11.30 (95%CI)

0.81 (NR)

*for PPV using lower or higher prevalences, see table 2 (Vali, 2022).

 

Outcome measure-negative predictive value

At prevalence of 30%*

Pooled characteristic (multiple threshold model) per index test and cut-off point:

ELF-test

Cut-off 7.70 (95%CI)

0.92 (NR)

Cut-off = 9.80 (95%CI)

0.85 (NR)

Cut-off 10.51 (95%CI)

0.81 (NR)

Cut-off 11.30 (95%CI)

0.78 (NR)

 

*for NPV using lower or higher prevalences, see table 2 (Vali, 2022).

 

Significant fibrosis

 

Outcome measure-sensitivity

Pooled characteristic (multiple threshold model) per index test and cut-off point:

 

ELF-test

Cut-off 7.70 (95%CI)

0.97 (0.88-0.99)

Cut-off = 9.80 (95%CI)

0.57 (0.40-0.73)

Cut-off 10.51 (95%CI)

0.35 (0.22-0.50)

Cut-off 11.30 (95%CI)

0.17 (0.09-0.29)

 

Outcome measure-specificity

Pooled characteristic (multiple threshold model) per index test and cut-off point:

 

ELF-test

Cut-off 7.70 (95%CI)

0.10 (0.03-0.26)

Cut-off = 9.80 (95%CI)

0.89 (0.73-0.96)

Cut-off 10.51 (95%CI)

0.97 (0.89-0.99)

Cut-off 11.30 (95%CI)

0.99 (0.96-1.0)

 

Outcome measure-positive predictive value

At prevalence of 30%*

Pooled characteristic (multiple threshold model) per index test and cut-off point:

 

ELF-test

Cut-off 7.70 (95%CI)

0.32 (NR)

Cut-off = 9.80 (95%CI)

0.69 (NR)

Cut-off 10.51 (95%CI)

0.81 (NR)

Cut-off 11.30 (95%CI)

0.88 (NR)

*for PPV using lower or higher prevalences, see supplemental table (Vali, 2022).

 

Outcome measure-negative predictive value

At prevalence of 30%*

Pooled characteristic (multiple threshold model) per index test and cut-off point:

 

ELF-test

Cut-off 7.70 (95%CI)

0.88 (NR)

Cut-off = 9.80 (95%CI)

0.83 (NR)

Cut-off 10.51 (95%CI)

0.78 (NR)

Cut-off 11.30 (95%CI)

0.74 (NR)

 

*for NPV using lower or higher prevalences, see supplemental table (Vali, 2022).

 

Study quality (ROB): risk of bias was assessed using the QUADAS-2 tool. Only one study had low risk of bias in all domains. Studies scored high risk of bias on patient selection (N=4), on index test (N=2) and on flow and timing (N=3). For details, see supplemental data (Vali, 2022).

 

Place of the index test in the clinical pathway: replacement/ triage

 

Choice of cut-off point: At first it is important to rule out MASLD-fibrosis (high sensitivity, low false negatives), using a test that is user-friendly and no important limitations with regards to availability and applicability. The second step is to identify MASLD-fibrosis in patients who are suspected of MASLD-fibrosis, using a more advanced test. This test should have a high specificity (low number of false positives).

 

Author’s conclusion

The meta-analysis of the available evidence showed ELF exhibits high sensitivity but limited specificity to exclude advanced and significant fibrosis in patients with MASLD, when using the lowcut-

off scores. The performance of the test for diagnosing significant and advanced fibrosis at higher score thresholds was also found to be limited in the context of low disease prevalence (5–10%). These estimations were, however, projected based on

the observed cumulative distribution of the ELF in diseased and non-diseased populations in the primary studies conducted in

higher prevalence settings. Clinicians should carefully consider the likely a priori disease prevalence in their clinical practice setting and select a suitable test threshold locally, to achieve the

desired level of test performance, in terms of sensitivity, specificity

and predictive values. Further comparative studies of high

methodological quality are necessary to obtain more reliable evidence of accuracy of the ELF test, especially in different clinical

settings.

 

*comparator test equals the C of the PICO; two or more index/ comparator tests may be compared; note that a comparator test is not the same as a reference test (golden standard)

 

Risk of bias tabellen

 

Table of quality assessment for systematic reviews of diagnostic studies

Based on AMSTAR checklist (Shea et al.; 2007, BMC Methodol 7: 10; doi:10.1186/1471-2288-7-10) and PRISMA checklist  (Moher et al 2009, PLoS Med 6: e1000097; doi:10.1371/journal.pmed1000097)

 

Research question:

Study

 

 

 

 

First author, year

Appropriate and clearly focused question?

 

 

 

Yes/no/unclear

Comprehensive and systematic literature search?

 

 

 

Yes/no/unclear

Description of included and excluded studies?

 

 

 

Yes/no/unclear

Description of relevant characteristics of included studies?

 

 

Yes/no/unclear

Assessment of scientific quality of included studies?

 

 

Yes/no/unclear

Enough similarities between studies to make combining them reasonable?

 

Yes/no/unclear

Potential risk of publication bias taken into account?

 

 

Yes/no/unclear

Potential conflicts of interest reported?

 

 

 

Yes/no/unclear

Mózes, 2022

Yes

 Unclear

 

The article states “10.392 articles were identified in a search performed for a larger systematic review evaluating the diagnostic performance of LSM VCTE and other index tests for the staging of fibrosis and diagnosis of MASH in adult patients with MASLD’, but does not specify databases and search date.

Yes

 

Authors conducted an IPD meta-analysis, all studies that could not supply data were excluded from the final selection.

Yes

Yes

Yes

No

 No

Han, 2021

Yes

  Yes

Yes

Yes

Yes

Unclear

Yes

 No

Vali, 2020

Yes

 Yes

Yes

Yes

Yes

Unclear

Yes

 No

 

Table of excluded studies

 

Reference

Reason for exclusion

Liu H, Fu J, Hong R, Liu L, Li F. Acoustic Radiation Force Impulse Elastography for the Non-Invasive Evaluation of Hepatic Fibrosis in Non-Alcoholic Fatty Liver Disease Patients: A Systematic Review & Meta-Analysis. PLoS One. 2015 Jul 1;10(7):e0127782. doi: 10.1371/journal.pone.0127782. PMID: 26131717; PMCID: PMC4489183.

Does not fit the PICO criteria

Zhang X, Wong GL, Wong VW. Application of transient elastography in nonalcoholic fatty liver disease. Clin Mol Hepatol. 2020 Apr;26(2):128-141. doi: 10.3350/cmh.2019.0001n. Epub 2019 Nov 8. PMID: 31696690; PMCID: PMC7160347.

Narrative review

Mi XX, Wang L, Xun YH, Shi JP. Assessment nonalcoholic fatty liver disease fibrosis score for staging and predicting outcome. Int J Clin Exp Med. 2016; 9(8). 16146-16156. ISSN:1940-5901/IJCEM0027973

Narrative review

Herrmann E, de Lédinghen V, Cassinotto C, Chu WC, Leung VY, Ferraioli G, Filice C, Castera L, Vilgrain V, Ronot M, Dumortier J, Guibal A, Pol S, Trebicka J, Jansen C, Strassburg C, Zheng R, Zheng J, Francque S, Vanwolleghem T, Vonghia L, Manesis EK, Zoumpoulis P, Sporea I, Thiele M, Krag A, Cohen-Bacrie C, Criton A, Gay J, Deffieux T, Friedrich-Rust M. Assessment of biopsy-proven liver fibrosis by two-dimensional shear wave elastography: An individual patient data-based meta-analysis. Hepatology. 2018 Jan;67(1):260-272. doi: 10.1002/hep.29179. Epub 2017 Nov 15. PMID: 28370257; PMCID: PMC5765493.

Does not fit the PICO criteria

Petroff D, Blank V, Newsome PN, Shalimar, Voican CS, Thiele M, de Lédinghen V, Baumeler S, Chan WK, Perlemuter G, Cardoso AC, Aggarwal S, Sasso M, Eddowes PJ, Allison M, Tsochatzis E, Anstee QM, Sheridan D, Cobbold JF, Naveau S, Lupsor-Platon M, Mueller S, Krag A, Irles-Depe M, Semela D, Wong GL, Wong VW, Villela-Nogueira CA, Garg H, Chazouillères O, Wiegand J, Karlas T. Assessment of hepatic steatosis by controlled attenuation parameter using the M and XL probes: an individual patient data meta-analysis. Lancet Gastroenterol Hepatol. 2021 Mar;6(3):185-198. doi: 10.1016/S2468-1253(20)30357-5. Epub 2021 Jan 16. PMID: 33460567.

Does not fit the PICO criteria

Hashemi SA, Alavian SM, Gholami-Fesharaki M. Assessment of transient elastography (FibroScan) for diagnosis of fibrosis in non-alcoholic fatty liver disease: A systematic review and meta-analysis. Caspian J Intern Med. 2016 Fall;7(4):242-252. PMID: 27999641; PMCID: PMC5153515.

Excluded because a more recent SR was available

Sun W, Cui H, Li N, Wei Y, Lai S, Yang Y, Yin X, Chen DF. Comparison of FIB-4 index, NAFLD fibrosis score and BARD score for prediction of advanced fibrosis in adult patients with non-alcoholic fatty liver disease: A meta-analysis study. Hepatol Res. 2016 Aug;46(9):862-70. doi: 10.1111/hepr.12647. Epub 2016 Feb 16. PMID: 26763834.

Does not fit the PICO criteria (wrong comparison)

Hydes T, Brown E, Hamid A, Bateman AC, Cuthbertson DJ. Current and Emerging Biomarkers and Imaging Modalities for Nonalcoholic Fatty Liver Disease: Clinical and Research Applications. Clin Ther. 2021 Sep;43(9):1505-1522. doi: 10.1016/j.clinthera.2021.07.012. Epub 2021 Aug 13. PMID: 34400007.

Narrative review

Stoopen-Rometti M, Encinas-Escobar ER, Ramirez-Carmona CR, Wolpert-Barraza E, Kimura-Hayama E, Sosa-Lozano LA, Favila R, Kimura-Fujikami Y, Saavedra-Abril JA, Loaeza-Del Castillo A. Diagnosis and quantification of fibrosis, steatosis, and hepatic siderosis through multiparametric magnetic resonance imaging. Rev Gastroenterol Mex. 2017 Jan-Mar;82(1):32-45. English, Spanish. doi: 10.1016/j.rgmx.2016.06.001. Epub 2017 Jan 12. PMID: 28089429.

Does not fit the PICO criteria

Castera L. Diagnosis of non-alcoholic fatty liver disease/non-alcoholic steatohepatitis: Non-invasive tests are enough. Liver Int. 2018 Feb;38 Suppl 1:67-70. doi: 10.1111/liv.13658. PMID: 29427494.

Narrative review

Pu K, Wang Y, Bai S, Wei H, Zhou Y, Fan J, Qiao L. Diagnostic accuracy of controlled attenuation parameter (CAP) as a non-invasive test for steatosis in suspected non-alcoholic fatty liver disease: a systematic review and meta-analysis. BMC Gastroenterol. 2019 Apr 8;19(1):51. doi: 10.1186/s12876-019-0961-9. PMID: 30961539; PMCID: PMC6454693.

Does not fit the PICO criteria

Cai Y, Liu D, Cui J, Sha Y, Zhou H, Tang N, Wang N, Huang A, Xia J. Diagnostic accuracy of red blood cell distribution width to platelet ratio for predicting staging liver fibrosis in chronic liver disease patients: A systematic review and meta-analysis. Medicine (Baltimore). 2019 Apr;98(14):e15096. doi: 10.1097/MD.0000000000015096. PMID: 30946368; PMCID: PMC6455720.

Does not fit the PICO criteria

Roeb E. Diagnostic and Therapy of Nonalcoholic Fatty Liver Disease: A Narrative Review. Visc Med. 2022 Apr;38(2):126-132. doi: 10.1159/000519611. Epub 2021 Oct 26. PMID: 35614896; PMCID: PMC9082206.

Narrative review

Wang XM, Zhang XJ, Ma L. Diagnostic performance of magnetic resonance technology in detecting steatosis or fibrosis in patients with nonalcoholic fatty liver disease: A meta-analysis. Medicine (Baltimore). 2018 May;97(21):e10605. doi: 10.1097/MD.0000000000010605. PMID: 29794735; PMCID: PMC6392510.

Does not fit the PICO criteria

Sumida Y, Shima T, Mitsumoto Y, Katayama T, Umemura A, Yamaguchi K, Itoh Y, Yoneda M, Okanoue T. Epidemiology: Pathogenesis, and Diagnostic Strategy of Diabetic Liver Disease in Japan. Int J Mol Sci. 2020 Jun 18;21(12):4337. doi: 10.3390/ijms21124337. PMID: 32570776; PMCID: PMC7352222.

Narrative review

Steadman R, Myers RP, Leggett L, Lorenzetti D, Noseworthy T, Rose S, Sutherland L, Clement F. A health technology assessment of transient elastography in adult liver disease. Can J Gastroenterol. 2013 Mar;27(3):149-58. doi: 10.1155/2013/684982. PMID: 23516679; PMCID: PMC3732152.

Does not fit the PICO criteria

Bersoux S, Mi L, Aqel BA, Dickson RC. Hepatitis C Testing and Liver Fibrosis Predictors in the Birth Cohort of a Primary Care Practice. Mayo Clin Proc Innov Qual Outcomes. 2020 Jul 15;4(4):384-390. doi: 10.1016/j.mayocpiqo.2020.04.003. PMID: 32793866; PMCID: PMC7411155.

Does not fit the PICO criteria

Karlas T, Petroff D, Sasso M, Fan JG, Mi YQ, de Lédinghen V, Kumar M, Lupsor-Platon M, Han KH, Cardoso AC, Ferraioli G, Chan WK, Wong VW, Myers RP, Chayama K, Friedrich-Rust M, Beaugrand M, Shen F, Hiriart JB, Sarin SK, Badea R, Jung KS, Marcellin P, Filice C, Mahadeva S, Wong GL, Crotty P, Masaki K, Bojunga J, Bedossa P, Keim V, Wiegand J. Individual patient data meta-analysis of controlled attenuation parameter (CAP) technology for assessing steatosis. J Hepatol. 2017 May;66(5):1022-1030. doi: 10.1016/j.jhep.2016.12.022. Epub 2016 Dec 28. PMID: 28039099.

Does not fit the PICO criteria

Sumida Y, Nakajima A, Itoh Y. Limitations of liver biopsy and non-invasive diagnostic tests for the diagnosis of nonalcoholic fatty liver disease/nonalcoholic steatohepatitis. World J Gastroenterol. 2014 Jan 14;20(2):475-85. doi: 10.3748/wjg.v20.i2.475. PMID: 24574716; PMCID: PMC3923022.

Narrative review

Stål P. Liver fibrosis in non-alcoholic fatty liver disease - diagnostic challenge with prognostic significance. World J Gastroenterol. 2015 Oct 21;21(39):11077-87. doi: 10.3748/wjg.v21.i39.11077. PMID: 26494963; PMCID: PMC4607906.

Narrative review

Singh S, Venkatesh SK, Loomba R, Wang Z, Sirlin C, Chen J, Yin M, Miller FH, Low RN, Hassanein T, Godfrey EM, Asbach P, Murad MH, Lomas DJ, Talwalkar JA, Ehman RL. Magnetic resonance elastography for staging liver fibrosis in non-alcoholic fatty liver disease: a diagnostic accuracy systematic review and individual participant data pooled analysis. Eur Radiol. 2016 May;26(5):1431-40. doi: 10.1007/s00330-015-3949-z. Epub 2015 Aug 28. PMID: 26314479; PMCID: PMC5051267.

Does not fit the PICO criteria

Liang Y, Li D. Magnetic resonance elastography in staging liver fibrosis in non-alcoholic fatty liver disease: a pooled analysis of the diagnostic accuracy. BMC Gastroenterol. 2020 Apr 6;20(1):89. doi: 10.1186/s12876-020-01234-x. PMID: 32252641; PMCID: PMC7137512.

Does not fit the PICO criteria

Hsu C, Caussy C, Imajo K, Chen J, Singh S, Kaulback K, Le MD, Hooker J, Tu X, Bettencourt R, Yin M, Sirlin CB, Ehman RL, Nakajima A, Loomba R. Magnetic Resonance vs Transient Elastography Analysis of Patients With Nonalcoholic Fatty Liver Disease: A Systematic Review and Pooled Analysis of Individual Participants. Clin Gastroenterol Hepatol. 2019 Mar;17(4):630-637.e8. doi: 10.1016/j.cgh.2018.05.059. Epub 2018 Jun 14. PMID: 29908362; PMCID: PMC6294709.

Does not fit the PICO criteria

Noorian S, Patel A, Ashkar C, Saab S. Identifying Advanced Fibrosis in NAFLD Using Noninvasive Tests: A Systematic Review of Sequential Algorithms. J Clin Gastroenterol. 2022 Mar 1;56(3):266-272. doi: 10.1097/MCG.0000000000001517. PMID: 33780219.

Narrative review with systematic search

Sharma C, Cococcia S, Ellis N, Parkes J, Rosenberg W. Systematic review: Accuracy of the enhanced liver fibrosis test for diagnosing advanced liver fibrosis and cirrhosis. J Gastroenterol Hepatol. 2021 Jul;36(7):1788-1802. doi: 10.1111/jgh.15482. Epub 2021 Mar 17. PMID: 33668077.

Narrative review

Autorisatiedatum en geldigheid

Laatst beoordeeld  : 19-03-2024

Laatst geautoriseerd  : 19-03-2024

Geplande herbeoordeling  : 01-12-2027

De NVMDL is regiehouder van deze richtlijn en eerstverantwoordelijke op het gebied van de actualiteitsbeoordeling van de richtlijn. De andere aan deze richtlijn deelnemende wetenschappelijke verenigingen of gebruikers van de richtlijn delen de verantwoordelijkheid en informeren de regiehouder over relevante ontwikkelingen binnen hun vakgebied. De werkgroep heeft per module een inschatting gemaakt van de periode waarbinnen de modules beoordeeld zouden moeten worden voor eventuele herziening.

 

Module

Uiterlijk jaar voor beoordeling

Identificatie MASLD-fibrose

2027

Leefstijlinterventies

2027

Medicamenteuze behandeling

2025

Bariatrische chirurgie

2027

Cardiovasculair risicomanagement

2027

Monitoring progressie van leverfibrose

2027

HCC-surveillance

2025

Organisatie van zorg

2025

Initiatief en autorisatie

Initiatief:
  • Nederlandse Vereniging van Maag-Darm-Leverartsen
Geautoriseerd door:
  • Nederlands Huisartsen Genootschap
  • Nederlandse Internisten Vereniging
  • Nederlandse Vereniging van Maag-Darm-Leverartsen
  • Verpleegkundigen en Verzorgenden Nederland
  • Nederlandse Vereniging van Diëtisten
  • Nederlandse Leverpatiënten Vereniging

Algemene gegevens

De ontwikkeling/herziening van deze richtlijnmodule werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten (www.demedischspecialist.nl/kennisinstituut) en werd gefinancierd uit de Kwaliteitsgelden Medisch Specialisten (SKMS). Patiëntenparticipatie bij deze richtlijn werd medegefinancierd uit de Kwaliteitsgelden Patiënten Consumenten (SKPC) binnen het programma KIDZ.

De financier heeft geen enkele invloed gehad op de inhoud van de richtlijnmodule.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijnmodule is in 2020 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen (zie hiervoor de Samenstelling van de werkgroep) die betrokken zijn bij de zorg voor patiënten met MASLD/MASH.

 

Werkgroep

  • Dr. M.E. Tushuizen (voorzitter), MDL-arts, Leids Universitair Medisch Centrum, NVMDL
  • Dr. A.G. Holleboom, internist-endocrinoloog en vasculaire geneeskunde, Amsterdam UMC, NIV
  • Dr. J.G.P. Reijnders (vice-voorzitter), MDL-arts, HagaZiekenhuis, NVMDL
  • Dr. M.M.J. Guichelaar, MDL-arts, Medisch Spectrum Twente, NVMDL
  • Dr. J. Blokzijl, MDL-arts, Universitair Medisch Centrum Groningen, NVMDL
  • Dr. G. H. Koek, MDL-arts en leefstijlcoach, Maastricht UMC+, NVMDL
  • Dr. S. Simsek, internist-endocrinoloog en vasculaire geneeskunde, Noordwest Ziekenhuisgroep, NIV
  • Prof. dr. M.E. Numans, hoogleraar huisartsengeneeskunde/huisarts, NHG
  • T.A. Korpershoek, Verpleegkundig specialist MDL, Albert Schweitzer ziekenhuis, V&VN MDL
  • Drs. L.C. te Nijenhuis-Noort, Diëtist, NVD
  • Drs. J.A. Willemse, Directeur/patiëntvertegenwoordiger, NLV

Klankbordgroep

  • Prof. dr. J. Verheij, patholoog, Amsterdam UMC, NVVP

 Met ondersteuning van

  • H. Olthuis-van Essen, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • H.J. van der Hart, junior adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Dr. A.J. Versteeg, adviseur, Kennisinstituut van de Federatie Medisch Specialisten

Belangenverklaringen

De Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement) hebben gehad. Gedurende de ontwikkeling of herziening van een module worden wijzigingen in belangen aan de voorzitter doorgegeven. De belangenverklaring wordt opnieuw bevestigd tijdens de commentaarfase.

Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Werkgroeplid

Functie

Nevenfuncties

Gemelde belangen

Ondernomen actie

Dr. M.E. Tushuizen (voorzitter)

MDL-arts, Leids Universitair Medisch Centrum

Geen

Ontwikkeling screening NAFLD bij DM2, projectleider, financier: Novo Nordisk; Ontwikkeling zorgpad NAFLD/NASH, geen projectleider, financier: Gilead; Ontwikkeling zorgpad NAFLD/NASH, projectleider, financier MLDS; Internationaal onderwijsprogramma, projectleider, financier: Pfizer.

Vicevoorzitter aangesteld, voor module over medicamenteuze behandeling en module over CVRM. Daarmee restricties ten aanzien van besluitvorming bij de betreffende modules.

Dr. J.G.P. Reijnders (vice-voorzitter)

MDL-arts, HagaZiekenhuis, Erasmus MC (vanaf sept 2023)

Lid Raad Kwaliteit NVMDL (onbetaald); Lid clinical board DGEA/DRCE/PRISMA netwerk

Geen

Geen restricties

Dr. M.M.J. Guichelaar

MDL-arts, Medisch Spectrum Twente

Lid Kwaliteitsvisitatie commissie-audits;

Lid Auto-immuun hepatitis werkgroep (onbetaald);

Secretaris NAFLD/ NASH werkgroep (onbetaald)

Ontwikkeling Serious game voor NAFLD, financier: MLDS

Geen restricties

Dr. J. Blokzijl

MDL-arts, Universitair Medisch Centrum Groningen

Geen

Extracellular vesicles: towards personalized monitoring NAFLD, geen projectleider, financier MLDS

Geen restricties

Dr. G. Koek

MDL-arts, Maastricht UMC+, onderzoeker NUTRIM Universiteit Maastricht

Lid adviesraad NLV

Nieuwe medicatie bij NASH, projectleider, financier: Boehringer Ingelheim; Genfit Resolve-it trial, projectleider, financier Convance/Genfit; Onderzoek semaglutide, projectleider, financier: Novo Nordisk; ontwikkeling Happi Lever App, rol als projectleider, financier MLDS

Restricties ten aanzien van besluitvorming bij de module over medicamenteuze behandeling.

Dr. A.G. Holleboom

Internist-endocrinoloog en vasculaire geneeskunde en assistant professor Amsterdam UMC; staflid vasculaire geneeskunde

Betaald adviseurschap Novo Nordisk (neergelegd)

Studie naar autophagic turnover of lipid droplets in NASH, projectleider, financier: Gilead; Ontwikkeling zorgpad NAFLD/NASH, geen projectleider, financier: Gilead; onderzoek naar non-invasieve proxies en Fibroscan in NAFLD in Helius study population, financier: Novo Nordisk.

Restricties ten aanzien van besluitvorming bij de module over medicamenteuze behandeling.

Dr. S. Simsek

Internist-endocrinoloog Noordwest Ziekenhuisgroep en Amsterdam UMC

Voorzitter wetenschapscommissie NWZ;

Begeleider promovendi

Onderzoek naar semaglutide, participatie, financier: Novo Nordisk

Restricties ten aanzien van besluitvorming bij de module over medicamenteuze behandeling.

Prof. dr. M.E. Numans

hoogleraar huisartsengeneeskunde LUMC

Huisarts in Utrecht (betaald); voorzitter Autorisatiecommissie Standaarden NHG (vacatiegelden);

Bestuurslid stichting SALTRO2 Diagnostic Living Lab (vacatiegelden);

Adviesraad Leefstijl Norgine (onbetaald)

Geen

Geen restricties

T.A. Korpershoek

Verpleegkundig specialist MDL, Albert Schweitzer ziekenhuis; flex-docent HAN-MDL opleiding

Bestuurslid V&VN MDL; Voorzitter netwerk VS MDL V&VN MDL (vacatiegelden)

Geen

Geen restricties

Drs. L.C. te Nijenhuis-Noort

Diëtist/Klinisch epidemioloog

Lid Netwerk MDL diëtisten (onbetaald); Lid Commissie Voeding NVMDL (onbetaald)

Geen

Geen restricties

Drs. J.A. Willemse

Directeur NLV

Board member Liver Patients International (onbetaald); Member management board ERN RARE LIVER (patient advocate, (onbetaald); lid diverse internationale expert groups NAFLD/NASH (onbetaald)

 

Geen restricties

 

Klankbordgroep

lid

Functie

Nevenfuncties

Gemelde belangen

Ondernomen actie

Prof. dr. J. Verheij

Patholoog, Amsterdam UMC

Geen

Geen

Geen restricties

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door afvaardiging van de Nederlandse Leverpatiënten Vereniging in de werkgroep. De verkregen input is meegenomen bij het opstellen van de uitgangsvragen, de keuze voor de uitkomstmaten en bij het opstellen van de overwegingen (zie kopje waarden en voorkeuren van patiënten). De conceptrichtlijn is tevens voor commentaar voorgelegd aan de Nederlandse Leverpatiënten Vereniging en de aangeleverde commentaren zijn bekeken en verwerkt.

 

Wkkgz & Kwalitatieve raming van mogelijke substantiële financiële gevolgen

Kwalitatieve raming van mogelijke financiële gevolgen in het kader van de Wkkgz

Bij de richtlijn is conform de Wet kwaliteit, klachten en geschillen zorg (Wkkgz) een kwalitatieve raming uitgevoerd of de aanbevelingen mogelijk leiden tot substantiële financiële gevolgen. Bij het uitvoeren van deze beoordeling zijn richtlijnmodules op verschillende domeinen getoetst (zie het stroomschema op de Richtlijnendatabase).

 

Uit de kwalitatieve raming blijkt dat er waarschijnlijk geen substantiële financiële gevolgen zijn, zie onderstaande tabel.

 

Module

Uitkomst raming

Toelichting

Identificatie MASLD-fibrose

Geen financiële gevolgen

Hoewel uit de toetsing volgt dat de aanbeveling(en) breed toepasbaar zijn (>40.000 patiënten), volgt uit de toetsing dat het geen nieuwe manier van zorgverlening of andere organisatie van zorgverlening betreft, het geen toename in het aantal in te zetten voltijdsequivalenten aan zorgverleners betreft en het geen wijziging in het opleidingsniveau van zorgpersoneel betreft. Er worden daarom geen financiële gevolgen verwacht.

Werkwijze

AGREE

Deze richtlijnmodule is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010).

 

Knelpuntenanalyse en uitgangsvragen

Tijdens de voorbereidende fase inventariseerde de werkgroep de knelpunten in de zorg voor patiënten met MASLD/MASH. Tevens zijn er (aanvullende) knelpunten aangedragen door de Nederlandse Vereniging van Maag-Darm-Leverartsen, Nederlandse Internisten Vereniging, Nederlandse Vereniging voor Klinische Geriatrie en de Nederlandse Vereniging van Ziekenhuizen via een schriftelijke knelpuntenanalyse. Een verslag hiervan is opgenomen onder aanverwante producten. Op basis van de uitkomsten van de knelpuntenanalyse zijn door de werkgroep concept-uitgangsvragen opgesteld en definitief vastgesteld.

 

Uitkomstmaten

Na het opstellen van de zoekvraag behorende bij de uitgangsvraag inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. Hierbij werd een maximum van acht uitkomstmaten gehanteerd. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

 

Methode literatuursamenvatting

Een uitgebreide beschrijving van de strategie voor zoeken en selecteren van literatuur is te vinden onder ‘Zoeken en selecteren’ onder Onderbouwing. Indien mogelijk werd de data uit verschillende studies gepoold in een random-effects model. Review Manager 5.4 werd gebruikt voor de statistische analyses. De beoordeling van de kracht van het wetenschappelijke bewijs wordt hieronder toegelicht.

 

Beoordelen van de kracht van het wetenschappelijke bewijs

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/). De basisprincipes van de GRADE-methodiek zijn: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van de bewijskracht per uitkomstmaat op basis van de acht GRADE-domeinen (domeinen voor downgraden: risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias; domeinen voor upgraden: dosis-effect relatie, groot effect, en residuele plausibele confounding).

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie, in het bijzonder de mate van zekerheid dat de literatuurconclusie de aanbeveling adequaat ondersteunt (Schünemann, 2013; Hultcrantz, 2017).

 

GRADE

Definitie

Hoog

  • er is hoge zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt;
  • het is zeer onwaarschijnlijk dat de literatuurconclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Redelijk

  • er is redelijke zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt;
  • het is mogelijk dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Laag

  • er is lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt;
  • er is een reële kans dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Zeer laag

  • er is zeer lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt;
  • de literatuurconclusie is zeer onzeker.

 

Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz, 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz, 2017).

 

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals aanvullende argumenten uit bijvoorbeeld de biomechanica of fysiologie, waarden en voorkeuren van patiënten, kosten (middelenbeslag), aanvaardbaarheid, haalbaarheid en implementatie. Deze aspecten zijn systematisch vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’ en kunnen (mede) gebaseerd zijn op expert opinion. Hierbij is gebruik gemaakt van een gestructureerd format gebaseerd op het evidence-to-decision framework van de internationale GRADE Working Group (Alonso-Coello, 2016a; Alonso-Coello 2016b). Dit evidence-to-decision framework is een integraal onderdeel van de GRADE methodiek.

 

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk (Agoritsas, 2017; Neumann, 2016). De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen. De werkgroep heeft bij elke aanbeveling opgenomen hoe zij tot de richting en sterkte van de aanbeveling zijn gekomen.

In de GRADE-methodiek wordt onderscheid gemaakt tussen sterke en zwakke (of conditionele) aanbevelingen. De sterkte van een aanbeveling verwijst naar de mate van zekerheid dat de voordelen van de interventie opwegen tegen de nadelen (of vice versa), gezien over het hele spectrum van patiënten waarvoor de aanbeveling is bedoeld. De sterkte van een aanbeveling heeft duidelijke implicaties voor patiënten, behandelaars en beleidsmakers (zie onderstaande tabel). Een aanbeveling is geen dictaat, zelfs een sterke aanbeveling gebaseerd op bewijs van hoge kwaliteit (GRADE gradering HOOG) zal niet altijd van toepassing zijn, onder alle mogelijke omstandigheden en voor elke individuele patiënt.

 

Implicaties van sterke en zwakke aanbevelingen voor verschillende richtlijngebruikers

 

 

Sterke aanbeveling

Zwakke (conditionele) aanbeveling

Voor patiënten

De meeste patiënten zouden de aanbevolen interventie of aanpak kiezen en slechts een klein aantal niet.

Een aanzienlijk deel van de patiënten zouden de aanbevolen interventie of aanpak kiezen, maar veel patiënten ook niet. 

Voor behandelaars

De meeste patiënten zouden de aanbevolen interventie of aanpak moeten ontvangen.

Er zijn meerdere geschikte interventies of aanpakken. De patiënt moet worden ondersteund bij de keuze voor de interventie of aanpak die het beste aansluit bij zijn of haar waarden en voorkeuren.

Voor beleidsmakers

De aanbevolen interventie of aanpak kan worden gezien als standaardbeleid.

Beleidsbepaling vereist uitvoerige discussie met betrokkenheid van veel stakeholders. Er is een grotere kans op lokale beleidsverschillen. 

 

Organisatie van zorg

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijnmodule is expliciet aandacht geweest voor de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, mankracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van deze specifieke uitgangsvraag zijn genoemd bij de overwegingen. Meer algemene, overkoepelende, of bijkomende aspecten van de organisatie van zorg worden behandeld in de module Organisatie van zorg.

 

Commentaar- en autorisatiefase

De conceptrichtlijnmodule werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijnmodule aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijnmodule werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

 

Literatuur

Agoritsas T, Merglen A, Heen AF, Kristiansen A, Neumann I, Brito JP, Brignardello-Petersen R, Alexander PE, Rind DM, Vandvik PO, Guyatt GH. UpToDate adherence to GRADE criteria for strong recommendations: an analytical survey. BMJ Open. 2017 Nov 16;7(11):e018593. doi: 10.1136/bmjopen-2017-018593. PubMed PMID: 29150475; PubMed Central PMCID: PMC5701989.

Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ. 2016 Jun 28;353:i2016. doi: 10.1136/bmj.i2016. PubMed PMID: 27353417.

Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ. 2016 Jun 30;353:i2089. doi: 10.1136/bmj.i2089. PubMed PMID: 27365494.

Brouwers MC, Kho ME, Browman GP, Burgers JS, Cluzeau F, Feder G, Fervers B, Graham ID, Grimshaw J, Hanna SE, Littlejohns P, Makarski J, Zitzelsberger L; AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010 Dec 14;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348; PubMed Central PMCID: PMC3001530.

Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017 Jul;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006. Epub 2017 May 18. PubMed PMID: 28529184; PubMed Central PMCID: PMC6542664.

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. http://richtlijnendatabase.nl/over_deze_site/over_richtlijnontwikkeling.html

Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016 Apr;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017. Epub 2016 Jan 6. Review. PubMed PMID: 26772609.

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Volgende:
Leefstijlinterventies