Scoringsystemen ernst FI bij rectumprolaps

Beoordeeld: 01-07-2017

Uitgangsvraag

Welke scoringsystemen dienen gebruikt te worden voor het scoren van de ernst van fecale incontinentie (FI) bij verdenking op rectumprolaps?

Aanbeveling

Gebruik de Nederlandse Fecal Incontinence Quality of Life Scale (FIQL) om de impact van fecale incontinentie op de kwaliteit van het leven in te schatten bij (verdenking op) een rectum prolaps.

Gebruik de Nederlandse Fecal Incontinence Severity Index (FISI) bij (verdenking op) een rectum prolaps om de subjectieve mate van fecale incontinentie vast te stellen.

Overwegingen

De veelheid aan beschikbare vragenlijsten om de ernst van de incontinentia alvi vast te stellen geven al aan dat er geen optimale vragen lijst bestaat. Menigeen gaat ervan uit dat het meetinstrument waar men mee opgeleid of opgevoed is de norm is. In een Nederlandse studie van Bols (2013) kwam men tot de volgende conclusies: de beschikbare meetinstrumenten om de ernst van FI en de kwaliteit van leven (St. Marks, Cleveland, FIQL) evalueren hebben nog niet de hoogste levels van psychometrisch deugdelijkheid bereikt. Uit de beschreven literatuur komt naar voren dat de Cleveland-vragenlijst, de Vaizy-vragenlijst en de FISI elkaar niet veel ontlopen. Opmerkelijk is dat de Minimaal Important Change (MIC) bij deze vragenlijsten niet te onderscheiden is van de meetfout. Mogelijk dat de vragenlijsten weinig bruikbaar zijn om het effect van een interventie te toetsen. Hetzelfde geldt ook voor de FIQL.

Zowel de FISI als de FIQL zijn gevalideerd voor de Nederlandse situatie. De werkgroep geeft derhalve de voorkeur aan deze twee testen. De werkgroep vindt het begrijpelijk dat bij lopend onderzoek de St. Marks of de Cleveland score gebruikt wordt. Bij nieuw te starten onderzoek gaat de voorkeur uit naar gevalideerde vragenlijsten. De werkgroep geeft ook het belang aan van het uitvragen van de andere compartimenten van de bekkenbodem. De werkgroep adviseert om bij iedere patiënt met fecale incontinentie een algemene bekkenbodem vragenlijst aan de patiënt voor te leggen, bijvoorbeeld de NVOG-vragenlijst (alleen toepasbaar voor vrouwen) of de PelFis vragenlijst (76 items-mannen; 83 items-vrouwen). Deze vragenlijsten zijn opgenomen als aanverwant product (toepassen).

Overzicht scoringssystemen FI

Naam scoringssysteem	Doel/domein	Nederlandse validatie?	Klinimetrische eigenschappen Nederlandse validatie (zie evidence tabel voor specifieke scores)	Geschikt voor wetenschappelijk onderzoek?
Feacal Incontinence Quality of Life Scale (FIQL)	Meet kwaliteit van leven	Hoen, 2016. Bols, 2013	Goede scores op reproduceerbaarheid, interne consistentie en construct validiteit; minimaal verschil in scores (t1 versus t2) niet te onderscheiden van eventuele meetfout van de vragenlijst	Ja
Feacal Incontinence Severity Index (FISI)	Meet ernst van de incontinentie	Hoen, 2016	Redelijke scores op reproduceerbaarheid, interne consistentie en construct validiteit; minimaal verschil in scores (t1 versus t2) niet te onderscheiden van eventuele meetfout van de vragenlijst	Mogelijk
Cleveland score (Wexner Cleveland Clinic Florida Score)	Meet ernst van de incontinentie	Bols, 2013	Het is niet goed te bepalen of de Cleveland-vragenlijst een geschikte vragenlijst is om de ernst van de klachten bij patiënten met fecale incontinentie te bepalen (op basis van interne en externe responsiviteit en construct validiteit)	Mogelijk
St. Marks score (adaptation of Wexner score)	Meet ernst van de incontinentie	Bols, 2013 nee	Het is niet goed te bepalen of de St. Marks-vragenlijst een geschikte vragenlijst is om de ernst van de klachten bij patiënten met fecale incontinentie te bepalen (op basis van interne en externe responsiviteit en construct validiteit)	Mogelijk

Onderbouwing

Achtergrond

De anamnese bij patiënten met fecale incontinentie (al dan niet met een rectumprolaps) wordt door vele artsen en continentieverpleegkundigen afgenomen en geeft een velerlei antwoorden zonder een duidelijke reproduceerbaarheid en een richting van de oplossing. Een gestandaardiseerde vragenlijst geeft een beter begrip van de oorzaken en de impact op de leefstijl, geeft mogelijk richting aan de behandelingsstrategie en kan uitkomsten van behandelingen vergelijken.

Fecale incontinentie is ongewild en ongecontroleerd verlies van ontlasting. De patiënt kan zelf niet bepalen wanneer en hoe vaak hij naar de wc gaat. Het kan betekenen dat er bijvoorbeeld geen aandranggevoel meer is of dat hij de ontlasting niet meer op kan houden. Vaak treden deze verschijnselen gecombineerd op. Fecale incontinentie is geen fatale ziekte, maar leidt vaak tot een forse aanpassing van de persoonlijke levensstijl afhankelijk van de ernst van de aandoeningen en van iemands karakter. Het lijkt dan ook voor de hand te liggen om fecale incontinentie vooral symptoom gericht te behandelen in tegenstelling tot een meer gebruikelijke ziekte /oorzakelijk gerelateerde aanpak.

Symptoom gerelateerde aanpak vraagt om een subjectief meetinstrument zoals de bekende vragenlijsten. Objectieve meetinstrumenten zoals het AnoRectaal Functie Onderzoek (ARFO) zoals elders beschreven in deze richtlijn (module ‘AFRO bij rectumprolaps prognose van FI of OD’) zijn van belang om oorzaken vast te stellen van fecale incontinentie en een eventuele behandeling strategie te ondersteunen. Objectieve meetinstrumenten (bijvoorbeeld AFRO) meten echter geen incontinentie en hebben een beperkte correlatie met klinische symptomen (Lam, 2012; Prichard, 2015).

De vragenlijsten om de subjectieve ernst van fecale incontinentie vast te stellen zijn beschrijvend over het type van verlies -zoals flatus, vloeibare, vaste ontlasting en soms slijm-, de frequentie van het verlies en de impact op de leefstijl. Kwaliteit van leven vragenlijsten zijn ook gebruikelijk. De ernst van de klachten wordt in een getal uitgedrukt en leidt tot een totaalscore. Helaas zijn de vragenlijsten voor verschillende culturen nog maar weinig gevalideerd. In deze module wordt uitgezocht welke scoringsystemen gebruikt dienen te worden voor het scoren van de ernst van fecale incontinentie (FI) veroorzaakt door rectumprolaps.

Conclusies / Summary of Findings

Geen GRADE

FIQL - Nederlandse versie

De FIQL lijkt een geschikte methode om de kwaliteit van leven bij patiënten met fecale incontinentie te bepalen (op het gebied van reproduceerbaarheid, interne consistentie en construct validiteit).

Bronnen (Hoen, 2016; Bols, 2013)

Geen GRADE

FISI - Nederlandse versie

De FISI lijkt een redelijke methode om de ernst van klachten bij patiënten met fecale incontinentie te bepalen (op het gebied van reproduceerbaarheid, interne consistentie en construct validiteit).

Bronnen (Hoen, 2016)

Geen GRADE

St. Marks score - Nederlandse versie

Het is niet goed te bepalen of de St. Marks-vragenlijst een geschikte vragenlijst is om de ernst van de klachten bij patiënten met fecale incontinentie te bepalen (op basis van interne en externe responsiviteit en construct validiteit).

Bronnen (Bols, 2013)

Geen GRADE

Cleveland score- Nederlandse versie

Het is niet goed te bepalen of de Cleveland-vragenlijst een geschikte vragenlijst is om de ernst van de klachten bij patiënten met fecale incontinentie te bepalen (op basis van interne en externe responsiviteit en construct validiteit)

Bronnen (Bols, 2013)

Geen GRADE

De genoemde vragenlijsten kunnen niet als diagnosticum gebruikt worden om IRP te diagnosticeren.

Samenvatting literatuur

Beschrijving studies

Beide studies valideerden fecale incontinentievragenlijsten. Het zijn klinimetrische studies die hebben onderzocht hoe valide de vragenlijsten zijn in de Nederlandse setting. Het betrof dus geen diagnostische studies om te bepalen of de mensen die hoog scoren op FI ook werkelijk FI hebben.

De studie van Hoen, 2016 had als doel de Nederlandse versie van de Fecal Incontinence Severity Index (FISI) en de Nederlandse versie van de Fecal Incontinence Quality of Life Scale (FIQL) te valideren. In totaal werd van 55 fecaal incontinente patiënten en 277 niet aangedane personen als controlegroep de betrouwbaarheid, validiteit, interpreteerbaarheid en responsiviteit bestudeerd.

De studie van Bols, 2013 had als doel de responsiviteit en interpretatie van de St. Marks score, Cleveland score en FIQL te evalueren in patiënten met FI. Dit werd gedaan op basis van een tweede analyse van data in de RCT die bekkenfysiotherapie met rectale ballontraining vergeleek met bekkenfysiotherapie alleen. De St. Marks, Cleveland en FIQL werden afgenomen en vergeleken met de GPE-score (Global Perceived Effect). Patiënten scoorden significant lager (p<0,001) op de FIQL-scores (gemiddelde score van 2,58, SD=0,7) ten opzichte van de referentiegroep (gemiddelde score van 3,92, SD=0,36) en significant hoger (p<0,001) op de FISI-vragenlijst (gemiddelde score 38,58, SD=10,73 in de patiëntengroep en gemiddeld 23,17 met een SD=15,10 in de referentiegroep). Dit laat het onderscheidend vermogen van de vragenlijst zien tussen een patiënten en gewone populatie. Hoe hoger de FISI-score, hoe ernstiger de FI-klachten; bij de FIQL geldt dat een lagere score een slechtere kwaliteit van leven weergeeft met betrekking tot FI-klachten.

Resultaten

Betrouwbaarheid van de vragenlijst

De FIQL en FISI werden onderzocht op interne consistentie en reproduceerbaarheid. De FIQL scoorde op beide hoog en de FISI scoorde gemiddeld.

a. Interne consistentie

De specifieke resultaten per domein zijn te vinden in de evidence-tabel.

De studie van Hoen (2016) demonstreerde voor de FIQL interne consistentie op alle domeinen in de patiëntengroep met een Cronbach’s alfa van 0,95 in totaal. Eén domein (schaamte, embarassement) had een lagere score, en Cronbach’s alfa van 0,55. In de referentiegroep was dit 0,96 in totaal en 0,72 op het domein van schaamte.

De FISI had een Cronbach’s alfa van 0,22 in de patiëntengroep en 0,66 in de referentiegroep.

b. Reproduceerbaarheid

De specifieke resultaten per domein zijn te vinden in de evidence-tabel.

De Intraclass correlatie, een maat voor de reproduceerbaarheid bij het afnemen van twee dezelfde testen, was berekend voor de totale vragenlijst. Een waarde vanaf 0,7 wordt gezien als adequate test-retest betrouwbaarheid. Voor de FIQL was de ICC hoog: 0,95 met een 95%BI van 0,9 tot 0,97. Voor de FISI was de ICC adequaat: 0,71 met een 95% BI van 0,53 tot 0,84. (Hoen, 2016)

Validiteit van de vragenlijst

a. Content validiteit

De vertaalde vragenlijsten werden in een pilotproject (Hoen, 2016) getest door de onderzoekers en tien patiënten voor zowel de FISI als de FIQL en de vertalingen werden als adequaat beoordeeld.

b. Construct validiteit

De studie van Hoen (2016) rapporteerde de volgende correlatie (Pearson) tussen totaalscores van de vragenlijsten (correlaties tussen totaal versus domeinscores zijn te vinden in de evidence-tabel): FISI – FIQL: -0,17 (p>0,05) voor de patiëntengroep en -0,25 (p<0,01) voor de referentiegroep; de FISI met de Mental Component Summary Scale (gebaseerd op de Short Form Health Survey SF-12) had een correlatie van -0,36 (p>0,05) en de FISI met de Physical Component Summary Scale -0,31 (p>0,05) (beide alleen gemeten voor de patiëntengroep).

De studie van Hoen, 2016 testte de construct validiteit door middel van vier hypothesen. De hypothesen met uitkomsten waren als volgt:

de FISI- en FIQL-scores zullen negatief gecorreleerd zijn. Er werd geen significante correlatie gevonden en de hypothese kon niet bevestigd worden;
FISI-scores zullen hoger zijn in de patiëntengroep dan in de referentiegroep. Dit werd bevestigd door de resultaten;
FIQL-scores zullen lager zijn in patiënten dan in de referentiegroep. Dit werd bevestigd door de resultaten;
FIQL-scores bij patiënten zullen een positieve correlatie hebben met de MSC-12-scores. Dit werd bevestigd op alle domeinen.

In de studie van Bols (2013) werd constructvaliditeit gemeten aan de mate waarin verschilscores waren gerelateerd aan scores van andere meetinstrumenten die hetzelfde construct meten.

De correlatie tussen de Cleveland en de St. Marks score was 0,91 met een p-waarde van <0,05 (hoge correlatie); de correlatie tussen de Cleveland en de FIQL was -0,45 p-waarde <0,05 (adequate correlatie) en de correlatie tussen de St. Marks score en FIQL was -0,53 p-waarde <0,05 (adequate correlatie).

Interpreteerbaarheid van de vragenlijst

In de studie van Hoen werd interpreteerbaarheid gemeten door middel van de minimaal relevant verschil (minimal important change, MIC) waarbij dit werd gedefinieerd als het optimale afkappunt van de ROC-curve.

De sensitiviteit en specificiteit van de FIQL en de FISI werd bepaald met de Rand-36-health transition item als referentietest (percentage correct geïdentificeerde verbeteringen bij de sensitiviteit en percentage correct geïdentificeerd als niet-verbeterd bij de specificiteit).

De sensitiviteit van de FIQL was 63%. De specificiteit was 0,75). Deze waardes werden gemeten in 31 patiënten die een behandeling voor hun klachten hadden ondergaan.

De MIC was 0,4 en de limits of agreement (LOA) liep van -0,51 tot 0,47 (maat voor meten van meetfouten: systematische- en randomfouten van een score die niet toegeschreven kunnen worden aan de werkelijke verandering). Omdat de gevonden MIC (0,4) binnen de LOA valt, is de MIC niet te onderscheiden van een meetfout.

Voor de FISI-vragenlijst was de sensitiviteit 100% en de specificiteit 16%. De MIC was 11,5 met een LOA van -16,26 tot 13,02, waardoor ook deze MIC niet kan worden onderscheiden van een meetfout.

De studie van Bols rapporteerde een MIC-range op de St. Marks-vragenlijst van -3 tot -5. Voor de Cleveland-vragenlijst was dit van -2 tot -3 en op de FIQL was dit van 1,1 tot 1,2. Het is in deze studie onduidelijk of de MIC groter is dan de meetfout (LOA).

Responsiviteit van de vragenlijst

In de studie van Hoen werd na zes maanden follow-up door 45 patiënten de vragenlijst ingevuld, waarvan 32 patiënten behandeling hadden gekregen voor hun klachten. Zeventien patiënten hadden een conservatieve behandeling ondergaan, negen een behandeling met medicijnen en zes patiënten een operatie.

De Area Under the Curve (AUC) was 0,45 voor de FISI (p-waarde van 0,62) en voor de FIQL was dit 0,69 (p-waarde van 0,08), met de RAND-36-health transition item als referentie-test. Deze resultaten moeten voorzichtig geïnterpreteerd worden, omdat de RAND-36-health transition item een imperfecte referentiestandaard is.

Bols (2013) rapporteerde de interne en externe responsiviteit.

Interne responsiviteit werd gemeten door middel van de gestandaardiseerde gemiddelde respons (SRM): het gemiddelde verschil gedeeld door de standaarddeviatie van dit verschil. Een absolute SRM van 0,2 tot 0,5 wordt gezien als klein, 0,5 tot 0,8 wordt gezien als matig en vanaf 0,8 als hoog.

De externe responsiviteit werd gemeten door de correlatie te berekenen tussen de verschillen in de totaalscores en de 9-punts GPE-score. De AUC-score werd berekend met de GPE-score als referentietest.

De St. Marks-vragenlijst en de Cleveland score hadden een hoge SRM van -0,9, de FIQL-vragenlijst had een matige SRM van 0,5.

De St. Marks-score had een correlatie van 0,6 (Pearson) met de GPE-score (hoge correlatie), de Cleveland score had een correlatie van 0,44 en de FIQL 0,48 (adequate correlaties). De AUC-scores waren respectievelijk: 0,886, 0,842 en 0,765 (adequate AUC-scores). Deze resultaten moeten voorzichtig geïnterpreteerd worden, omdat de GPE-score een imperfecte referentiestandaard is.

Bewijskracht van de literatuur

Geen GRADE toegepast (zie Verantwoording). De beperkingen aan de studie van Hoen (2016) waren de beperkte sample size van de patiëntengroep (n=33) en het ontbreken van een factoranalyse om de structuur binnen de FIQL en FISI-vragenlijst te onderzoeken.

Het was in de studie van Bols, 2013 niet duidelijk of de MIC groter was dan de meetfout.

Zoeken en selecteren

Om de uitgangsvraag te kunnen beantwoorden is er een systematische literatuuranalyse verricht naar de volgende wetenschappelijke vraagstelling:

Welke scoringsystemen dienen gebruikt te worden voor het scoren van de ernst van fecale incontinentie (FI) bij verdenking op rectumprolaps?

P patiënten met fecale incontinentie;

I functionele scoringsystemen;

C geen of andere scoringssystemen;

O accuratesse/klinimetrische testeigenschappen met betrekking tot ernst klachten, validatie van het scoringsysteem.

Relevante uitkomstmaten

De werkgroep achtte betrouwbaarheid, validiteit, interpreteerbaarheid en responsiviteit voor de besluitvorming kritieke uitkomstmaten.

De werkgroep definieerde niet a priori de genoemde uitkomstmaten, maar hanteerde de in de studies gebruikte definities.

Zoeken en selecteren (Methode)

In de databases Medline (via OVID), en Embase (via OVID) is op 15 maart 2016 met relevante zoektermen gezocht naar scoringssystemen voor fecale incontinentie. De zoekverantwoording is weergegeven onder het tabblad Verantwoording. De literatuurzoekactie leverde 164 treffers op. Studies werden geselecteerd op grond van de volgende selectiecriteria: Nederlandse validatiestudies van scoringssystemen voor fecale incontinentie. Op basis van titel en abstract werden geen studies voorgeselecteerd. Na het toevoegen van studies via leden van de werkgroep, werden negen studies voorgeselecteerd. Na raadpleging van de volledige tekst, werden vervolgens zeven studies geëxcludeerd (zie exclusietabel) en twee studies definitief geselecteerd.

Resultaten

Twee onderzoeken (Hoen, 2016; Bols, 2013) zijn opgenomen in de literatuuranalyse. De evidence-tabellen hiervan en de beoordeling van individuele studiekwaliteit kunt u in onder het tabblad Onderbouwing vinden.

Referenties

Avinoam Nevler. The epidemiology of anal incontinence and symptom severity scoring. Gastroenterology Report. doi:10.1093/gastro/gou005. 2014.
Bols EM, Hendriks HJ, Berghmans LC, et al. Responsiveness and interpretability of incontinence severity scores and FIQL in patients with fecal incontinence: a secondary analysis from a randomized controlled trial. Int Urogynecol J. 2013;24(3):469-78.
Lam TJ, Kuik DJ, Felt-Bersma RJ. Anorectal function evaluation and predictive factors for faecal incontinence in 600 patients. Colorectal Dis. 2012;14(2):214-23. doi: 10.1111/j.1463-1318.2011.02548.x. PubMed PMID: 21689265.
Moo-Kyung Seong, Sung-Il Jung, Tae-won Kim, et al. Comparative analysis of summary scoring systems in measuring fecal incontinence. J Korean Surg Soc. 2011;81:326-331.
Prichard D, Harvey DM, Fletcher JG, et al. Relationship Among Anal Sphincter Injury, Patulous Anal Canal, and Anal Pressures in Patients With Anorectal Disorders. Clin Gastroenterol Hepatol. 2015;13(10):1793-1800.e1. doi: 10.1016/j.cgh.2015.03.033. PubMed PMID: 25869638; PubMed Central PMCID: PMC4575824.
't Hoen LA, Utomo E, Schouten WR, et al. The fecal incontinence quality of life scale (FIQL) and fecal incontinence severity index (FISI): Validation of the Dutch versions. Neurourol Urodyn. 2016. doi: 10.1002/nau.23003. PMID: 27028557

Evidence tabellen

Research question: which scorings system should be used to determine the severity of faecal incontinence?

Study reference

Study characteristics

Patient characteristics

Index test

(test of interest)

Reference test

Follow-up

Outcome measures and effect size

Comments

Bols, 2013

Type of study[1]:

Analysis of RCT data

Setting:

Single centre

Country:

The Netherlands

Conflicts of interest:

None reported

Inclusion criteria:

-patients visiting the hospital between August 2006 – May 2009 when they reported having had FI for more than 6 months, with a Vaizey incontinence score ≥12 (range 0-24) and failure of dietary measures and medication

Exclusion criteria:

-Patients diagnosed with an anorectal tumor within the past 2 years

-absent squeeze

pressure of the anal sphincter, chronic diarrhea (always fluid

stool three or more times a day)

-overflow incontinence,

Proctitis

-ulcerative colitis

-Crohn’s disease, -previous ileoanal

or coloanal anastomosis, and/or rectal prolapse in situ.

-Participants who had received physiotherapy during the

previous 6 months or who were considered unable to comply

with therapy

N=80

Prevalence:

All patients experienced complaints of faecal incontinence

Mean age (SD):

59.3 (11.9)

Sex: / % F

90% Female

Other important characteristics:

Time since onset of FI symptoms:

78.4 months (SD: 99.5)

FI symptoms:

Mixed FI (symptoms of both urgency and passive FI): 56.3%

Urgency FI: 33.8%

Passive FI: 10%

Describe index test:

Vaizey score (Dutch version). Outcome ranges from 0 (complete continence)

to 24 (complete incontinence

Cut-off point(s):

Not applicable

Comparator test[2]:

Wexner-score (Dutch version)

The Wexner score was derived from the Vaizey score (without the items urgency and medication use and a higher weighting for pad use) and ranges from 0 (complete continence) to 20

(complete incontinence)

Cut-off point(s):

Not applicable

Comparator test[3]:

Feacal Incontinence Quality of Life Scale (FIQL). This is a 29-item condition-specific QoL questionnaire ranging from 4 to 16 and composed of four multi-item subscales: lifestyle (10 items), coping/behavior (9 items), depression/self-perception (7 items), and embarrassment (3 items) [12]. A higher score indicates better QOL. Next to one question on general health and one on self-perception, items are partly scored on a 4-point scale ranging from most of the time to none of the time and partly from strongly agree to strongly disagree.

The FIQL was translated for use in the Dutch population, checking the translation by means of a back translation procedure.

Cut-off point(s):

Not applicable

Reference test test[4]:

GPE-score: Global Perceived Effect. A 9-point GPE score asked patients to score their perceived change after physiotherapy treatment. Categories (words) ranged from very much improved to very much worse.

Cut-off point(s):

Not applicable

The self-administered FIQL and GPE score were completed at home after the patient’s hospital visit, thereby avoiding socially desirable answers.

Time between the index test en reference test:

Mean time between baseline and follow-up: 6.8 weeks (SD 5.3) with a maximum of 9 weeks.

For how many participants were no complete outcome data available?

N (%): 0

Reasons for incomplete outcome data described?

Not applicable

Standardized response mean (SRM): mean change divided by the standard deviation (SD) of this change.

Pearson correlation: correlation coefficient between the changes in the individual items and total scores and the 9-point GPE score.

AUC: score questionnaire (index) compared with GPE.

Internal responsiveness:

Total Vaizey score:

SRM: -0.9

Total Wexner score:

SRM: -0.9

Total FIQL score:

SRM: 0.5

External responsiveness:

Total Vaizey score:

AUC: 0.886

Pearson correlation: r=0.6

Total Wexner score:

AUC: 0.842

Pearson correlation: r=0.44

Total FIQL score:

AUC: 0.765

Pearson correlation: r=-0.48

Longitudinal construct validity

[Degree to which change scores are related to scores of other instruments that measure the same construct]

Correlations:

Wexner-Vaizey: r=0.91

P<0.05

Wexner -FIQL: r=-0.45

P<0.05

Vaizey-FIQL: r=-0.53

P<0.05

Ceiling and floor effects

[Ceiling and floor effects were present if ≥ 15% of responders had the worst (highest) and most desirable (lowest) possible outcome, respectively in the individual and total scores.]

Ceiling effects were observed when related to the individual

items of the Vaizey score and the item pad use of the Wexner score.

Floor effects were

observed for the individual item solid stool incontinence

(Vaizey) and the embarrassment subscale of the FIQL.

Interpretability

[Degree to which one can assign a qualitative meaning to an instrument’s change in scores. For each scoringssystem, the mean scores at baseline and follow-up with the corresponding SRM were calculated, separately for each of the nine GPE-categories.]

Improved: category 1-4 (much more better – slightly better)

Not improved: category 5-9 (unchanged – much more worse)

Vaizey: SRM

Improved: -1.4

Not improved: -0.1, p<0.001

Wexner: SRM

Imrpoved: -1.5

Not improved: -0.4, p<0.001

FIQL: SRM

Improved: 1.1

Not improved: 0.0 p<0.001

Minimally important change (MIC)

Vaizey:

-3 to -5

Hoen, 2016

Type of study:

Validation study

Setting:

Single centre

Country:

The Netherlands

Conflicts of interest:

None reported. Grant sponsor: Urological Research Foundation

Inclusion criteria:

-patients who experienced symptoms of FI for at least 3 months

-speaking Dutch fluently

-over 18 years old

Exclusion criteria:

Patients with:

-current malignancy

-dementia

-mental retardation and/or

-another neurological disease

N: 55 in patient group, 277 in reference group

Prevalence:

All patients experienced complaints of faecal incontinence

Mean age ± SD:

P=patient group

R=reference group

P: 59.3 (12.45)

R: 48.7 (16.2)

Sex: % F

P: 95%

R: 51%

Other important characteristics:

Mean scores (SD) FISI

P: 38.58 (10.73)

R: 23.17 (15.01)

Mean scores (SD) FIQL

P: 2.58 (0.7)

R: 3.92 (0.36)

Patient group:

As described in the inclusion criteria

Describe index test:

Fecal Incontinence Quaility of Life Score (FIQL), which is a condition specific quality of life measure to assess faecal incontinence (FI)

The measure consists of 29 questions, subdivided into four subscales: Lifestyle, Coping/

Behavior, Depression/Self-perception, and embarrassment.

With a few exceptions, responses are graded on a 4-point Likert-scale ranging from 1 strongly agree to 4 strongly disagree. The additional response option not applicable is graded with a score of 4, in concordance with Dr. Rockwood, developer of the FIQL. Question 1, general health, is graded from 1 excellent to 5 poor and is reversely scored. Question

4, FI specific depression, is graded from 1 extremely so to 6 not at all. The scale scores are calculated by adding the numerical values of all responses in that specific scale and then dividing by its number of items. Scale scores are only calculated if at least half of the items have been answered. Higher scores indicate a better QoL.

Cut-off point(s):

Not applicable

Comparator test:

Fecal Incontinence Severity Index, which is a scoring system to assess the severity of symptoms of FI.

This score evaluates the frequency of four types of FI: gas, mucus, and liquid and

solid stool. Frequency options range from two or more times a day to never. Surgeon and patient specific ratings are available. In this study, the scores were based on patient specific ratings. Higher scores indicate more severe FI

Cut-off point(s):

Not applicable

Reference group:

An ISO-certified (ISO 26362) panel was used as a reference group. Stratification for age, educational level, and residence was performed to create a representative group

of the Dutch general population. Beforehand, the presence of FI was unknown.

Describe reference test:

RAND-36-HTI

An extra question taken from the RAND 36-Item Health Survey, the RAND 36- Health Transition Item (RAND 36-HTI), was added to the last questionnaires. This question compares the general health of patients to 1 year ago.

Cut-off point(s):

Not applicable

Time between the index test en reference test:

6 months

For how many participants were no complete outcome data available?

N (%): 3.5% (2/57)

Reasons for incomplete outcome data described?

Yes (non-responders).

Reliability

Internal consistency: Cronbach’s alfa

FIQL total (n=40)

P: 0.95

R: 0.96

FIQL Lifestyle

P: 0.93

R: 0.94

FIQL coping behaviour

P: 0.86

R: 0.93

FIQL Depression/self-perception

P: 0.89

R: 0.79

FIQL Embarassement

P: 0.55

R: 0.762

FISI total (n-42)

P: 0.22

R: 0.66

Reproducibility

Test-retest period: mean of 7.5 dyas.

ICC (95%BI)

FIQL total (n=40)

0.95 (0.90–0.97)

Limits of agreement: -0.51 to 0.47; impact of 25%

FIQL Lifestyle

0.94 (0.89–0.97)

FIQL coping behaviour

0.93 (0.88–0.96)

FIQL Depression/self-perception

0.95 (0.90–0.97)

FIQL Embarassement

0.80 (0.67–0.89)

FISI total (n-42)

0.71 (0.53–0.84)

Limits of agreement: -16.26 to 13.02; impact of 48%

Validity

Content validity

Face validity was considered adequate for the FIQL and FISI

by the researchers and 10 patients during the pilot study. For the total score of the FIQL, a ceiling effect was observed in 68% of the reference group, reflecting the low prevalence of FI in this group. For the FISI, a floor effect was observed in

the reference group (16%), again reflecting the low prevalence of FI.

Criterion validity

Pearsons correlation

FIQL-total-FIQL lifestyle

P: 0.87 p<0.01

R: 0.57 p<0.01

FIQL total-FIQL coping/behaviour

P: 0.82 p<0.01

R: 0.66 p<0.01

FIQL total – FIQL depression/self-perception

P: 0.86 p<0.01

R: 0.64 p<0.01

FIQL total-FIQL embarassement

P: 0.64 p<0.01

R: 0.57 p<0.01

FIQL total – PCS-12

P: 0.15 p>0.05

FIQL total – MCS-12

P: 0.77 p<0.01

These correlations were not studied for the reference group.

FIQL total – FISI

P:-0.17 p>0.05

R:-0.25 p<0.01

FISI – PCS-12

P: -0.36 p>0.05

FISI – MCS-12

P: -0.31 p>0.05

These correlations were not studied for the reference group.

Construct validity

Three of four predefined hypotheses were confirmed,

indicating good construct validity.

a. An insignificant correlation was found between FIQL and

FISI scores, and the hypothesis could therefore not be

confirmed.

b. FISI scores of patients were higher than those of the

reference group.

c. FIQL scores of patients were lower scores than those of

the reference group.

d. The MCS-12 was positively correlated with the FIQL on all

domains.

Responsiveness

At 6 month follow-up 45 patients completed the FIQL and FISI, ofwhom32 patients had received treatment (71%)

Conservative treatment: 17 patients (37.8% of total)

Pharmaceutical treatment:

9 patients (20% of total)

Surgery: 6 patients (22.2 % of total)

FIQL:

AUC 0.69, p=0.08

FISI:

AUC: 0.45, p=0.62

Interpretability

FIQL:

MIC FIQL of 0.40 with 63% correctly identified as improved and 75% as not improved. The MIC is just within the range of the LOA, indicating that a change of 0.40 points could possibly be attributed to measurement error.

FISI:

MIC of 11.50 with 100%

correctly identified as improved and 16% as not improved is found. This MIC is within the LOA range, indicating that with a change of 11.50 points a true improvement cannot be de

distinguished from a measurement error

Only a small number of patients (n=31) received treatment during the 6 months follow-up. This complicated the adequate evaluation of the responsiveness and interpretability for the FISI.

Risk of bias assessment diagnostic accuracy studies (QUADAS II, 2011)

Research question: : which scorings system should be used to determine the severity of faecal incontinence caused by IRP?

Study reference

Patient selection

Index test

Reference standard

Flow and timing

Comments with respect to applicability

Bols, 2013

Was a consecutive or random sample of patients enrolled?

Yes, the patients who were enrolled in the RCT were randomly assigned to rectal balloon training with pelvic floor muscle training or pelvic floor muscle training alone

Was a case-control design avoided?

Yes, all participants filled in all questionnaires

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

There was no reference standard

If a threshold was used, was it pre-specified?

Not applicable

Is the reference standard likely to correctly classify the target condition?

No, there was no reference standard

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

Was there an appropriate interval between index test(s) and reference standard?

Yes

Did all patients receive a reference standard?

Yes (GPE-score)

Did patients receive the same reference standard?

Yes (GPE-score)

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

Yes (patients were selected for a RCT to evaluate add-on effect of rectal balloon training)

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: HIGH

CONCLUSION

Could the patient flow have introduced bias?

RISK: LOW

Hoen, 2016

Was a consecutive or random sample of patients enrolled?

Yes, eligible patients were informed about this study by their physician during a regular outpatient visit.

Was a case-control design avoided?

Yes, all participants filled in all questionnaires

Did the study avoid inappropriate exclusions?

Yes

Were the index test results interpreted without knowledge of the results of the reference standard?

No reference standard

If a threshold was used, was it pre-specified?

Not applicable

Is the reference standard likely to correctly classify the target condition?

No: the reference group was representative for the Dutch population, not for the FI study group

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

Was there an appropriate interval between index test(s) and reference standard?

Yes (6 months)

Did all patients receive a reference standard?

Yes, RAND 36 HTI questionnaire

Did patients receive the same reference standard?

Yes

Were all patients included in the analysis?

No, 2 patients had incomplete questionnaires and were excluded from the analysis

Are there concerns that the included patients do not match the review question?

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

Are there concerns that the target condition as defined by the reference standard does not match the review question?

CONCLUSION:

Could the selection of patients have introduced bias?

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

RISK: UNCLEAR

Judgments on risk of bias are dependent on the research question: some items are more likely to introduce bias than others, and may be given more weight in the final conclusion on the overall risk of bias per domain:

Patient selection:

Consecutive or random sample has a low risk to introduce bias.
A case control design is very likely to overestimate accuracy and thus introduce bias.
Inappropriate exclusion is likely to introduce bias.

Index test:

This item is similar to blinding in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.
Selecting the test threshold to optimise sensitivity and/or specificity may lead to overoptimistic estimates of test performance and introduce bias.

Reference standard:

When the reference standard is not 100% sensitive and 100% specific, disagreements between the index test and reference standard may be incorrect, which increases the risk of bias.
This item is similar to blinding in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.

Flow and timing:

If there is a delay or if treatment is started between index test and reference standard, misclassification may occur due to recovery or deterioration of the condition, which increases the risk of bias.
If the results of the index test influence the decision on whether to perform the reference standard or which reference standard is used, estimated diagnostic accuracy may be biased.
All patients who were recruited into the study should be included in the analysis, if not, the risk of bias is increased.

Judgement on applicability:

Patient selection: there may be concerns regarding applicability if patients included in the study differ from those targeted by the review question, in terms of severity of the target condition, demographic features, presence of differential diagnosis or co-morbidity, setting of the study and previous testing protocols.

Index test: if index tests methods differ from those specified in the review question there may be concerns regarding applicability.

Reference standard: the reference standard may be free of bias but the target condition that it defines may differ from the target condition specified in the review question.

Exclusietabel

Tabel Exclusie na het lezen van het volledige artikel

Auteur en jaartal	Redenen van exclusie
Devesa, 2002	Geen validatiestudie in Nederlandse setting
Jorge Wexner, 1993	Geen validatiestudie in Nederlandse setting
Nevler, 2014	Geen validatie van een FI vragenlijst, overzichtsartikel.
Rockwood, 1999	Geen validatiestudie in Nederlandse setting
Rockwood, 2000	Geen validatiestudie in Nederlandse setting
Seong, 2012	Geen validatiestudie in Nederlandse setting
Vaizey, 1999	Geen validatiestudie in Nederlandse setting

[1] In geval van een case-control design moeten de patiëntkarakteristieken per groep (cases en controls) worden uitgewerkt. NB; case control studies zullen de accuratesse overschatten (Lijmer et al., 1999)

[2] Comparator test is vergelijkbaar met de C uit de PICO van een interventievraag. Er kunnen ook meerdere tests worden vergeleken. Voeg die toe als comparator test 2 etc. Let op: de comparator test kan nooit de referentiestandaard zijn.

[3] Comparator test is vergelijkbaar met de C uit de PICO van een interventievraag. Er kunnen ook meerdere tests worden vergeleken. Voeg die toe als comparator test 2 etc. Let op: de comparator test kan nooit de referentiestandaard zijn.

[4] De referentiestandaard is de test waarmee definitief wordt aangetoond of iemand al dan niet ziek is. Idealiter is de referentiestandaard de Gouden standaard (100% sensitief en 100% specifiek). Let op! dit is niet de comparison test/index 2.

⁴ Beschrijf de statistische parameters voor de vergelijking van de indextest(en) met de referentietest, en voor de vergelijking tussen de indextesten onderling (als er twee of meer indextesten worden vergeleken).

Verantwoording

Beoordelingsdatum en geldigheid

Laatst beoordeeld : 01-07-2017

Voor het beoordelen van de actualiteit van deze richtlijn is de werkgroep niet in stand gehouden. Op modulair niveau is een onderhoudsplan beschreven, zie de tabel hieronder. Het bestuur van de Nederlandse Vereniging voor Heelkunde (NVvH) bepaalt of de modules nog actueel zijn. Bij het opstellen van de richtlijn heeft de werkgroep per module een inschatting gemaakt over de maximale termijn waarop herbeoordeling moet plaatsvinden en eventuele aandachtspunten geformuleerd die van belang zijn bij een toekomstige herziening (update). De geldigheid van de richtlijn komt eerder te vervallen indien nieuwe ontwikkelingen aanleiding zijn een herzieningstraject te starten.

De NVvH is regiehouder van deze richtlijn en eerstverantwoordelijke op het gebied van de actualiteitsbeoordeling van de richtlijn. De andere aan deze richtlijn deelnemende wetenschappelijke verenigingen of gebruikers van de richtlijn delen de verantwoordelijkheid en informeren de regiehouder over relevante ontwikkelingen binnen hun vakgebied.

Module	Eerstvolgende beoordeling actualiteit richtlijn
ARFO	2021
Diagnostiek	2021
Scoringssystemen FI	2021
Scoringssystemen OD	2021
Work-up	2021
Conservatieve therapie OD	2021
Conservatieve therapie FI	2021
Indicatiestelling	2021
Chirurgische behandeling IRP	2019
Chirurgische behandeling ERP	2019
Materiaalkeuze	2021

Initiatief en autorisatie

Initiatief:

Nederlandse Vereniging voor Heelkunde

Geautoriseerd door:

Nederlandse Vereniging van Maag-Darm-Leverartsen
Nederlandse Vereniging voor Heelkunde
Nederlandse Vereniging voor Obstetrie en Gynaecologie
Nederlandse Vereniging voor Radiologie
Nederlandse Vereniging voor Urologie

Algemene gegevens

De richtlijnontwikkeling werd ondersteund door het Kennisinstituut van Medisch Specialisten (www.kennisinstituut.nl) en werd gefinancierd uit de Kwaliteitsgelden Medisch Specialisten (SKMS).

Doel en doelgroep

Doel

Er bestaat behoefte aan uniformiteit met betrekking tot de indicatiestelling voor conservatief- of operatief beleid alsmede de inhoud van het beleid, in het bijzonder in geval van operatief beleid (operatietechnieken en materiaalkeuze). De indicatistelling dient optimaal recht te doen aan de patiënt. Dat wil zeggen dat de indicatiestelling zo gekozen wordt dat patiënten niet onnodig een operatie ondergaan maar ook andersom er niet te veel patiënten, die veel baat bij een operatie zouden hebben, een operatie ontzegd worden. De patiënteninformatie bijhorende deze richtlijn kan ertoe bijdragen dat een patiënt beter geïnformeerd is over de behandelopties en de mogelijke risico’s. Dit stelt de patiënt in staat om een goede afwezging te maken en mee te beslissen over de keuze tussen conservatief en operatiefbeleid.

Doelgroep

De op te stellen richtlijn is in wezen een professioneel technische standaard op de eerste plaats bedoeld voor de doelgroep gevormd door chirurgen, MDL-artsen, gynaecologen, bekkenfysiotherapeuten, urologen en radiologen. In tweede plaats is de richtlijn bedoeld om zorgverleners die te maken hebben met patiënten met RP zoals huisartsen, continentieverpleegkundigen, verpleegkundig specialisten en physician assistant te informeren. Er zijn geen aanbevelingen voor de eerste lijn opgenomen.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijn is in 2015 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen die betrokken zijn bij de zorg voor patiënten met (verdenking op) een rectum prolaps (zie hieronder).

De werkgroepleden zijn door hun beroepsverenigingen gemandateerd voor deelname.

De werkgroep is verantwoordelijk voor de integrale tekst van deze richtlijn.

Werkgroep

Dr. N.A.T. Wijffels, chirurg, Antonius ziekenhuis, NVvH (voorzitter)
Dr. E. Consten, chirurg, Meander MC, Amersfoort, NVvH
Dr. S.J. van der Hagen, chirurg, Treant Zorggroep Stadskanaal, Emmen en Hoogeveen, NVvH
Dr. A. Pronk, chirurg, Diakonessenhuis, Utrecht, NVvH
Dr. R.J.F. Felt-Bersma, Maag-, darm- en leverarts, VU medisch centrum, Amsterdam, NVMDL
Drs. M. Stegeman, gynaecoloog,Elisabeth-TweeSteden Ziekenhuis, Tilburg, NVOG
Drs. E.J.L. Bosboom, radioloog, ZiekenhuisGroep Twente, Almelo, NVvR
J.A.J. Kalkdijk MSc., bekkenfysiotherapeut, Bekken en Bekkenbodem Zorgcentrum, Leeuwarden, NVFB
Drs. D.A van Reijn, bekkenfysiotherapeut, Bekkenfysiotherapie Baarn, Proctos Kliniek Bilthoven, NVFB
Drs. A.H.P. Meier, uroloog, VieCuri, Venlo, NVU
T.J.C. Paulides MSc., arts in opleiding tot chirurg (aios chirurgie), Meander MC, Amersfoort, NVvH

Klankbordgroep

Drs. G.G.A. (Alec) Malmberg, patiëntvertegenwoordiger/gynaecoloog, Universitair Medisch Centrum Groningen, Bekkenbodem4All
T. (Thea) Boele, patiëntvertegenwoordiger, Bekkenbodem4All, Brandwijk
Prof. Dr. W.A. Bemelman, chirurg, Academisch Medisch Centrum, Amsterdam, NVvH
Dr. S. Festen, chirurg, OLVG, Amsterdam, NVvH
Dr. D.D.E. Zimmerman, colorectaal chirurg, Elisabeth-TweeSteden Ziekenhuis, Tilburg, NVvH

Met ondersteuning van

E.A. Rake MSc., junior adviseur, Kennisinstituut van Medisch Specialisten (vanaf januari 2016)
H.L. Vreeken MSc., adviseur, Kennisinstituut van Medisch Specialisten (tot december 2015)
Dr. W.A. van Enst, senior adviseur, Kennisinstituut van Medisch Specialisten

Belangenverklaringen

De KNMG-Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatie management, kennisvalorisatie) hebben gehad. Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in de tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van Medisch Specialisten.

*Achternaam*	*Functie*	*Nevenfuncties*	*Persoonlijke financiële belangen*	*Persoonlijke relaties*	*Reputatiemanagement*	*Extern gefinancierd onderzoek*	*Kennisvalorisatie*	*Overige belangen*	*Getekend*
*Stegeman*	Gynaecoloog	Medisch Manager	geen	geen	geen	geen	geen	geen	ja, 27-05-2015
*Wijffels*	Gastro-intestinaal chirurg, regiomaatschap Chirurgie Midden-Nederland	Lid bestuur werkgroep coloproctologie (WCP)	geen	geen	WCP	geen	geen	Gedeelten van de NVvH en WCP worden door diverse partijen gesponsord	ja, 09-06-2015
*Felt-Bersma*	MDL arts	MDL arts VuMC consultant MDL arts MCV de Veluwe, Apeldoorn consultant MDL arts Proctoskliniek Bilthoven	geen	geen	geen	geen	geen	geen	ja, 09-06-2015
*Consten*	Gastro-intestinaal chirurg.	Voorzitter NVEL opleiding Heelkunde, Meander MC	geen	geen	geen	geen	geen	geen	ja, 09-06-2015
*Pronk*	gastro-intestinaal chirurg, Diakonessenhuis Utrecht en Zeist		werkzaam colorectaal chirurg in ziekenhuis (Diakonessenhuis)	geen	2002-2008 lid beroepsbelangen vereniging heelkunde	geen	geen	geen	ja, 12-06-2015
*Bosboom*	Fellow radioloog ZGT almelo	geen	geen	geen	geen	geen	geen	geen	ja, 15-06-2015
*Van der Hagen*	gastro-intestinaal chirurg in TREANT Zorggroep	Bestuurslid stafbestuur MSN NON (betaald) Bestuurslid stafbestuur TREANT zorggroep (betaald)	geen	geen	geen	geen	geen	geen	ja, 13-06-2015
*Huisman*	gynaecoloog Haga Bekkenbodem Centrum	geen	geen	geen	geen	geen	geen	geen	15-7-2015
*Kalkdijk*	Bekkenfysiotherapeut Promovendus Heelkunde Onderzoeker Anorectaal Functiecentrum UMCG	geen	geen	geen	geen	geen	geen	geen	ja, 13-07-2015
*Meier*	Uroloog	geen	geen financiele belangen	Geen persoonlijke relaties die baat kunnen hebben bij een bepaalde uitkomst of advies	geen belangen, geen deelname	Geen extern gefinancieerd onderzoek	Expertise op gebied van colpopromontoriopexie voor urogenitale prolaps Expertise centrum voor de ALTIS SIS tape voor stress-urine-incontinentie van de Fa.Coloplast	geen	ja, 16-10-2015
*Van Reijn*	Bekkenfysiotherapeut	geen	geen	geen	geen	geen	geen	geen	ja, 01-12-2015
*Malmberg*	Gynaecoloog en sectie voorzitter algemene gynaecologie Bestuurslid Bekkenbodem4All (voormalig SBP)	Ambassadeur compassion for care onbetaald ontwikkelen en onderzoeken e health mogelijkheden, #PCiCare BIJVOORBEELDonbetaald	geen lidmaatschap van adviescommissie (s) aandeelhouder in #PCiCare BV	directe collega F. Hoogenboom colorectaal chiruge umcg vriendenkring bekkenfysiotherapeut	Bestuurslid Bekkenbodem4All Ambassadeur Compassion for care, car for sustainable health, noorden duurzaam. Biotoop bijeenkomstenGroningen	geen	geen	niet dat ik weet	ja, 27-11-2015
*Boele*	Bestuurslid Patiëntenorganisatie Bekkenbodem4All	Telefoniste informatie-advieslijn Bekkenbodem4All Teamcoördinator Beide onbetaald	geen	geen	Wij nemen deel aan deze commissie om de belangen van patiënten te behartigen en de goede communicatie tussen arts en patiënt te bewerkstellingen.	Wij schrijven voor sommige onderzoeken brieven waarin wij het onderzoek aanbevelen, uitsluitend als wij daar ook als bestuur geheel achter staan. Voor het schrijven van deze brieven vragen wij een kleine vergoeding, nogmaals uitsluitend om als patiënten geen vereniging onszelf staande te houden.	geen	geen	ja, 22-03-2016
*Paulides*	Promovendus Heelkunde	Literatuuronderzoek en meeschrijven aanbeveling (onbetaald).	geen	geen	geen	geen	geen	nee	ja, 22-03-2016

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door de focusgroep die bij de richtlijn prolaps werd gehouden, te gebruiken. Een verslag van de patientenfocusgroep uit de richtlijn Prolaps (bijlage Notulen patiëntenfocusgroep) is besproken in de werkgroep. De knelpunten die betrekking hadden op deze richtlijn zijn verwerkt. De conceptrichtlijn is tevens voor commentaar voorgelegd aan de Bekkenbodem4All (een fusie van Patiëntvereniging Gynaecologie en Stichting Bekkenbodem Patiënten) en de Patiëntenfederatie Nederland. Gedurende de commentaarfase is patiënteninformatie ontwikkeld (Patiënteninformatietool) in samenwerking met de Patiëntenfederatie Nederland.

Methode ontwikkeling

Evidence based

Implementatie

In de verschillende fasen van de richtlijnontwikkeling is rekening gehouden met de implementatie van de richtlijn (module) en de praktische uitvoerbaarheid van de aanbevelingen. Daarbij is uitdrukkelijk gelet op factoren die de invoering van de richtlijn in de praktijk kunnen bevorderen of belemmeren. Het implementatieplan is te vinden bij de aanverwante producten (Implementatieplan). De werkgroep heeft tevens een interne kwaliteitsindicator ontwikkeld om het toepassen van de richtlijn in de praktijk te volgen en te versterken (zie Indicatorontwikkeling en Indicatoren).

Werkwijze

AGREE

Deze richtlijn is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010), dat een internationaal breed geaccepteerd instrument is. Voor een stap-voor-stap beschrijving hoe een evidence-based richtlijn tot stand komt wordt verwezen naar het stappenplan Ontwikkeling van Medisch Specialistische Richtlijnen van het Kennisinstituut van Medisch Specialisten.

Knelpuntenanalyse

Tijdens de voorbereidende fase inventariseerden de voorzitter van de werkgroep en de adviseur de knelpunten. Tevens werden de volgende stakeholders schriftelijk uitgenodigd te reageren op het concept-raamwerk van de richtlijn rectum prolaps: IGZ, NVZ, NFU, STZ, ZKN, Lareb, Nefarma, NVvH, NVMDL, NVOG, NVvR, KNGF-NVFB, NVU, PGN, SBP, (tegenwoordig zijn PGN en SBP gefuseerd tot Bekkenbodem4All) NVA, V&VN, Patiëntenfederatie Nederland, Zorginstituut Nederland, ZN, NGH. De invitational conference van de Richtlijn Prolaps werd hierbij als uitgangspunt genomen. Een overzicht van de binnengekomen suggesties en de reactie van de werkgroep hierop is opgenomen onder aanverwante producten (Knelpuntanalyse).

Uitgangsvragen en uitkomstmaten

Op basis van de uitkomsten van de knelpuntenanalyse zijn door de voorzitter en de adviseur concept-uitgangsvragen opgesteld. Deze zijn met de werkgroep besproken waarna de werkgroep de definitieve uitgangsvragen heeft vastgesteld. Vervolgens inventariseerde de werkgroep per uitgangsvraag welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als kritiek, belangrijk (maar niet kritiek) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de kritieke uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

Strategie voor zoeken en selecteren van literatuur

Voor de afzonderlijke uitgangsvragen werd aan de hand van specifieke zoektermen gezocht naar gepubliceerde wetenschappelijke studies in (verschillende) elektronische databases. Tevens werd aanvullend gezocht naar studies aan de hand van de literatuurlijsten van de geselecteerde artikelen. In eerste instantie werd gezocht naar studies met de hoogste mate van bewijs. De werkgroepleden selecteerden de via de zoekactie gevonden artikelen op basis van vooraf opgestelde selectiecriteria. De geselecteerde artikelen werden gebruikt om de uitgangsvraag te beantwoorden. De databases waarin is gezocht, de zoekstrategie en de gehanteerde selectiecriteria zijn te vinden in de module met desbetreffende uitgangsvraag. De zoekstrategie voor de oriënterende zoekactie en patiëntenperspectief zijn opgenomen onder aanverwante producten.

Kwaliteitsbeoordeling individuele studies

Individuele studies werden systematisch beoordeeld, op basis van op voorhand opgestelde methodologische kwaliteitscriteria, om zo het risico op vertekende studieresultaten (risk of bias) te kunnen inschatten. Deze beoordelingen kunt u vinden in de Risk of Bias (RoB) tabellen. De gebruikte RoB instrumenten zijn gevalideerde instrumenten die worden aanbevolen door de Cochrane Collaboration: AMSTAR – voor systematische reviews; Cochrane – voor gerandomiseerd gecontroleerd onderzoek; ROBINS – voor observationeel onderzoek; QUADAS II – voor diagnostisch onderzoek.

Samenvatten van de literatuur

De relevante onderzoeksgegevens van alle geselecteerde artikelen werden overzichtelijk weergegeven in evidence-tabellen. De belangrijkste bevindingen uit de literatuur werden beschreven in de samenvatting van de literatuur. Bij een voldoende aantal studies en overeenkomstigheid (homogeniteit) tussen de studies werden de gegevens ook kwantitatief samengevat (meta-analyse) met behulp van Review Manager 5.

Beoordelen van de kracht van het wetenschappelijke bewijs

A) Voor interventievragen (vragen over therapie of screening)

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor Grading Recommendations Assessment, Development and Evaluation (zie http://www.gradeworkinggroup.org/).

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, matig, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie (Schünemann, 2013).

GRADE	Definitie
Hoog	er is hoge zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; het is zeer onwaarschijnlijk dat de literatuurconclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Matig	er is matige zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; het is mogelijk dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Laag	er is lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; er is een reële kans dat de conclusie verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Zeer laag	er is zeer lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt zoals vermeld in de literatuurconclusie; de literatuurconclusie is zeer onzeker.

B) Voor vragen over diagnostische tests, schade of bijwerkingen, etiologie en prognose

De kracht van het wetenschappelijke bewijs werd eveneens bepaald volgens de GRADE-methode: GRADE-diagnostiek voor diagnostische vragen (Schünemann, 2008), en een generieke GRADE-methode voor vragen over schade of bijwerkingen, etiologie en prognose. In de gehanteerde generieke GRADE-methode werden de basisprincipes van de GRADE-methodiek toegepast: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van bewijskracht op basis van de vijf GRADE-criteria (startpunt hoog; downgraden voor risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias).

C) Voor vragen over de waarde van meet- of classificatie-instrumenten (klinimetrie)

Deze instrumenten werden beoordeeld op validiteit, intra- (test-hertest) en inter-beoordelaarsbetrouwbaarheid, responsiviteit (alleen bij meetinstrumenten) en bruikbaarheid in de praktijk. Bij ontbreken van een gouden standaard, werd een beoordeling van de bewijskracht van literatuurconclusies achterwege gelaten.

Formuleren van de conclusies

Voor elke relevante uitkomstmaat werd het wetenschappelijk bewijs samengevat in een of meerdere literatuurconclusies waarbij het niveau van bewijs werd bepaald volgens de GRADE-methodiek. De werkgroepleden maakten de balans op van elke interventie (overall conclusie). Bij het opmaken van de balans werden de gunstige en ongunstige effecten voor de patiënt afgewogen. De overall bewijskracht wordt bepaald door de laagste bewijskracht gevonden bij een van de kritieke uitkomstmaten. Bij complexe besluitvorming waarin naast de conclusies uit de systematische literatuuranalyse vele aanvullende argumenten (overwegingen) een rol spelen, werd afgezien van een overall conclusie. In dat geval werden de gunstige en ongunstige effecten van de interventies samen met alle aanvullende argumenten gewogen onder het kopje Overwegingen.

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals de expertise van de werkgroepleden, de waarden en voorkeuren van de patiënt (patient values and preferences), kosten, beschikbaarheid van voorzieningen en organisatorische zaken. Deze aspecten worden, voor zover geen onderdeel van de literatuursamenvatting, vermeld en beoordeeld (gewogen) onder het kopje Overwegingen.

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk. De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen.

Randvoorwaarden (Organisatie van zorg)

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijn is expliciet rekening gehouden met de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, menskracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van een specifieke uitgangsvraag maken onderdeel uit van de overwegingen bij de bewuste uitgangsvraag. Meer algemene, overkoepelende, of bijkomende aspecten van de organisatie van zorg worden behandeld in een aparte module over Organisatie van Zorg.

Indicatorontwikkeling

Gelijktijdig met het ontwikkelen van de richtlijn werd er een interne kwaliteitsindicator ontwikkeld om het toepassen van de richtlijn in de praktijk te volgen en te versterken (Indicatoren). Meer informatie over de methode van indicatorontwikkeling is op te vragen bij het Kennisinstituut van Medisch Specialisten (secretariaat@kennisinstituut.nl).

Kennislacunes

Tijdens de ontwikkeling van deze richtlijn is systematisch gezocht naar onderzoek waarvan de resultaten bijdragen aan een antwoord op de uitgangsvragen. Bij elke uitgangsvraag is door de werkgroep nagegaan of er (aanvullend) wetenschappelijk onderzoek gewenst is om de uitgangsvraag te kunnen beantwoorden. Een overzicht van de onderwerpen waarvoor (aanvullend) wetenschappelijk van belang wordt geacht, is als aanbeveling in de Kennislacunes beschreven (onder aanverwante producten; Kennislacunes).

Commentaar- en autorisatiefase

De conceptrichtlijn is aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren zijn verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren is de conceptrichtlijn aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijn is aan de deelnemende (wetenschappelijke) verenigingen en (patiënt)organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

Literatuur

Brouwers MC, Kho ME, Browman GP, et al. AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348.

Kennisinstituut van Medisch Specialisten. Ontwikkeling van Medisch Specialistische Richtlijnen: stappenplan.

Medisch Specialistische Richtlijnen 2.0. Adviescommissie Richtlijnen van de Raad Kwalitieit. https://richtlijnendatabase.nl/over_deze_site/richtlijnontwikkeling.html. 2012.

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

Schünemann HJ, Oxman AD, Brozek J, et al. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ. 2008;336(7653):1106-10. doi: 10.1136/bmj.39500.677199.AE. Erratum in: BMJ. 2008;336(7654). doi: 10.1136/bmj.a139. PubMed PMID: 18483053.

Zoekverantwoording

Database

Zoektermen

Totaal

Medline (OVID)

2000 – maart 2016

exp Rectal Prolapse/ or exp Intussusception/ or ((rectal or anal) adj5 prolaps*).ab,ti. or rectocele*.ab,ti. or enterocele*.ab,ti. or proctocele*.ab,ti. or sigmoidocele*.ab,ti. or intussusception*.ab,ti. or (rectal adj2 invagination*).ab,ti.

AND exp Fecal Incontinence/ or (((fecal or faecal or feces or anal) adj2 (incontinen* or continen*)) or ((defaecation or defecation) adj2 (obstruct* or disorder*))).ab,ti.

AND (wexner or ((incontinence or constipation or symptom) adj2 (score* or scoring or severity or index)) or 'rome criteria' or 'scoring system*' or ccis or fisi or cccs or 'pac-qol' or pacqol or fiql).ab,ti.

limit to (yr=2000 -Current and (dutch or english or german))

Gebruikte filters:

Systematische reviews: (meta-analysis/ or meta-analysis as topic/ or (meta adj analy$).tw. or ((systematic* or literature) adj2 review$1).tw. or (systematic adj overview$1).tw. or exp Review Literature as Topic/ or cochrane.ab. or cochrane.jw. or embase.ab. or medline.ab. or (psychlit or psyclit).ab. or (cinahl or cinhal).ab. or cancerlit.ab. or ((selection criteria or data extraction).ab. and review/)) not (Comment/ or Editorial/ or Letter/ or (animals/ not humans/))

RCTs: (exp clinical trial/ or randomized controlled trial/ or exp clinical trials as topic/ or randomized controlled trials as topic/ or Random Allocation/ or Double-Blind Method/ or Single-Blind Method/ or (clinical trial, phase i or clinical trial, phase ii or clinical trial, phase iii or clinical trial, phase iv or controlled clinical trial or randomized controlled trial or multicenter study or clinical trial).pt. or random*.ti,ab. or (clinic* adj trial*).tw. or ((singl* or doubl* or treb* or tripl*) adj (blind$3 or mask$3)).tw. or Placebos/ or placebo*.tw.) not (animals/ not humans/)

Observationeel: Epidemiologic studies/ or case control studies/ or exp cohort studies/ or Controlled Before-After Studies/ or Case control.tw. or (cohort adj (study or studies)).tw. or Cohort analy$.tw. or (Follow up adj (study or studies)).tw. or (observational adj (study or studies)).tw. or Longitudinal.tw. or Retrospective*.tw. or prospective*.tw. or consecutive*.tw. or Cross sectional.tw. or Cross-sectional studies/ or historically controlled study/ or interrupted time series analysis/ [Onder exp cohort studies vallen ook longitudinale, prospectieve en retrospectieve studies]

=110

164

Embase (Elsevier)

((rectal OR anal) NEAR/5 prolaps*):ab,ti OR rectocele*:ab,ti OR enterocele*:ab,ti OR proctocele*:ab,ti OR sigmoidocele*:ab,ti OR 'intussusception'/exp OR 'colon intussusception'/exp OR intussusception*:ab,ti OR (rectal NEAR/2 invagination*):ab,ti OR 'rectum prolapse'/exp

AND (((fecal OR faecal OR feces OR anal) NEAR/2 (incontinen* OR continen*)):ab,ti OR 'defecation disorder'/exp OR 'feces incontinence'/exp OR ((defaecation OR defecation) NEAR/2 (obstruct* OR disorder*)):ab,ti)

AND 'wexner score'/exp OR 'wexner':ab,ti OR ((incontinence OR constipation OR symptom OR ods) NEAR/2 (score* OR scoring OR severity OR index)):ab,ti OR 'rome criteria':ab,ti OR 'scoring system'/exp OR ccis:ab,ti OR fisi:ab,ti OR cccs:ab,ti OR 'pac qol':ab,ti OR pacqol:ab,ti OR fiql:ab,ti

AND ([dutch]/lim OR [english]/lim OR [german]/lim) AND [2000-2016]/py NOT 'conference abstract':it

Gebruikte filters:

Systematische reviews: 'meta analysis'/de OR cochrane:ab OR embase:ab OR psychlit:ab OR cinahl:ab OR medline:ab OR (systematic NEAR/1 (review OR overview)):ab,ti OR (meta NEAR/1 analy*):ab,ti OR metaanalys*:ab,ti OR 'data extraction':ab OR cochrane:jt OR 'systematic review'/de

RCTs: 'clinical trial'/exp OR 'randomization'/exp OR 'single blind procedure'/exp OR 'double blind procedure'/exp OR 'crossover procedure'/exp OR 'placebo'/exp OR 'prospective study'/exp OR rct:ab,ti OR random*:ab,ti OR 'single blind':ab,ti OR 'randomised controlled trial':ab,ti OR 'randomized controlled trial'/exp OR placebo*:ab,ti NOT 'conference abstract':it

Observationeel: 'clinical study'/de OR 'case control study'/de OR 'family study'/de OR 'longitudinal study'/de OR 'retrospective study'/de OR ('prospective study'/de NOT 'randomized controlled trial'/de) OR 'cohort analysis'/de OR (cohort NEAR/1 (study OR studies)):ab,ti OR (case:ab,ti AND (control NEAR/1 (study OR studies)):ab,ti) OR (follow:ab,ti AND (up NEAR/1 (study OR studies)):ab,ti) OR (observational NEAR/1 (study OR studies)):ab,ti OR (epidemiologic NEAR/1 (study OR studies)):ab,ti OR ('cross sectional' NEAR/1 (study OR studies)):ab,ti

=133

Richtlijnendatabase

Rectumprolaps

Rectumprolaps

Scoringsystemen ernst FI bij rectumprolaps

Uitgangsvraag

Aanbeveling

Overwegingen

Onderbouwing

Achtergrond

Conclusies / Summary of Findings

Samenvatting literatuur

Zoeken en selecteren

Referenties

Evidence tabellen

Verantwoording

Beoordelingsdatum en geldigheid

Initiatief en autorisatie

Algemene gegevens

Doel en doelgroep

Samenstelling werkgroep

Belangenverklaringen

Inbreng patiëntenperspectief

Methode ontwikkeling

Implementatie

Werkwijze

Zoekverantwoording

Bijlagen