Pijnmeting en behandeling bij kinderen

Initiatief: NVK Aantal modules: 59

Meetinstrumenten acute pijn

Uitgangsvraag

Welke meetinstrumenten kunnen het best gebruikt worden voor de beoordeling van de mate van acute pijn bij pre verbale kinderen/neonaten (<1 maand), verbale kinderen, adolescenten (tot 18 jaar), kinderen met neurobiologische ontwikkelingsstoornissen?

Aanbeveling

Gebruik een meetinstrument om acute pijn bij kinderen te meten.

 

Gebruik voor de kinderen van 6 jaar en ouder (met een leeftijdsadequaat ontwikkelingsniveau) NRS-11. Alternatieven zijn FPS-R (vanaf 7 jaar) of CAS (vanaf 8 jaar).

 

Overweeg voor kinderen jonger dan 6 jaar en kinderen met neurobiologische ontwikkelingsstoornis NRS proxy en/of een comfort schaal te gebruiken, op basis van expert opinion.

 

Overweeg voor neonaten een observatieschaal, zoals NIPS of PIPP-R, of comfort-neo te gebruiken.

Overwegingen

Voor- en nadelen van de interventie en de kwaliteit van het bewijs

Er is een systematisch literatuuronderzoek uitgevoerd naar de validiteit en bruikbaarheid van meetinstrumenten voor acute pijn bij kinderen. Het gaat om unidimensionele meetinstrumenten.

De systematische literatuuranalyse laat zien dat voor de cruciale uitkomstmaat validiteit bewijs van zeer lage kwaliteit is gevonden over de volgende meetinstrumenten voor acute pijn bij kinderen: CAS, FACES, FPS(-R), NRS-11, Oucher, Pieces of hurt, VAS (Birnie, 2019; Le May, 2018), en mPAT en COVERS (O’Sullivan, 2016). De zeer lage kwaliteit van dit bewijs werd met name veroorzaakt door een groot risico op vertekening van de resultaten doordat informatie over de studieopzet ontbrak of een groot risico op vertekening met zich meebracht, en ook door de grote onzekerheid die de resultaten lieten zien. Tevens is een beperking in onderzoek naar deze meetinstrumenten het ontbreken van een gouden standaard, met name voor nonverbale kinderen.

Voor de belangrijke uitkomstmaat betrouwbaarheid werd voor de CAS, FACES en FPS(-R) bewijs van lage kwaliteit gevonden voor een acceptabele betrouwbaarheid. Dat suggereert dat deze meetinstrumenten mogelijk een betrouwbare weergave kunnen geven van acute pijn bij kinderen. Voor de overige meetinstrumenten werd bewijs van zeer lage kwaliteit of geen bewijs gevonden, waardoor het niet mogelijk is om een oordeel te geven over de mate van betrouwbaarheid van deze instrumenten.

 

Voor de neonaten werden geen studies geïncludeerd in de literatuuranalyse die de validiteit en/of betrouwbaarheid van unidimensionele meetinstrumenten onderzochten. Wel is de validiteit en betrouwbaarheid onderzocht van multidimensionele meetinstrumenten zoals de Neonatal Pain, Agitation, and Sedation Scale N-PASS en Neonatal Infant Pain Scale (NIPS). In een studie van Desai (2018) werd de waarde van de N-PASS onderzocht ten opzichte van de NIPS voor het meten van chronische en acute pijn op de NICU. Wanneer de uitkomsten werden vergeleken, genereerde de N-PASS 98% van de pijnscores hoger dan de NIPS.

 

Evidence-based aanbevelingen

Birnie (2019) presenteerde evidence-based aanbevelingen over het gebruik van verschillende meetinstrumenten die acute pijn bij kinderen meten. Zij bevelen sterk het gebruik aan van de volgende meetinstrumenten: NRS-11 (vanaf 6 jaar), FPS-R (vanaf 7 jaar) en CAS (vanaf 8 jaar). Ze raden het gebruik van een van deze meetinstrumenten af voor jonge kinderen.

 

Figuur 1 - Evidence-based aanbevelingen voor zelfgerapporteerde meetinstrumenten voor acute pijn. Aangepast uit Birnie (2019).

Afkortingen: VAS, Visual Analogue Scale; FPS-R, Faces Pain Scale-Revised (and Faces Pain Scale); NRS-11, Eleven-point Numeric Rating Scale; CAS, Color Analogue Scale; FACES, Wong-Baker FACES Pain Rating Scale).

 

Een valide unidimensioneel instrument om pijn te scoren bij kinderen onder de 6 jaar en/of neurobiologische ontwikkelingsstoornissen bestaat (nog) niet. De mate waarin deze kinderen een inschatting kunnen maken in een tweede dimensie zoals kleur of een cijfer is beperkt. Jonge kinderen kiezen bijvoorbeeld eerder voor een kleur die ze mooi vinden in plaats van een kleur die volgens de codering past bij een bepaald pijnniveau.

 

Waarden en voorkeuren van patiënten (en evt. hun verzorgers)

Alle kinderen, maakt niet uit van welke leeftijd of neurobiologisch ontwikkelingsniveau, kunnen pijn ervaren. Het is van belang om daar proactief aandacht voor te hebben. Toepassen van positief taalgebruik is een voorwaarde om negatieve effecten van het toepassen van pijnmetingen te voorkomen. Het betrekken van ouders/verzorgers bij inschatting van pijnintensiteit is een voorwaarde omdat zij het kind immers het beste kennen.

 

Kosten (middelenbeslag)

Toepassing van een pijnmeetinstrument en registratie van de uitkomst kost tijd. In de praktijk blijkt dat instrumenten die snel toegepast kunnen worden een duidelijke voorkeur hebben boven observatiescores die vaak meer tijd in beslag nemen. Naast de tijdsduur bepaalt de frequentie van pijnmeting de totale zorgtijd die geïnvesteerd wordt. Een eenduidig advies ten aanzien van de juiste balans tussen tijdsinvestering en opbrengst van toepassing van pijnmetingen, namelijk het verlichten van pijn, is in deze richtlijn niet te formuleren maar moet wel punt van aandacht zijn in de dagelijkse praktijk.

 

Aanvaardbaarheid, haalbaarheid en implementatie

Er worden in de huidige praktijk veel verschillende pijnmeetinstrumenten gebruikt. Belangrijk hierbij is de mogelijkheid tot registratie in het ICT systeem. Voordeel van het toepassen van een uniform instrument is niet alleen het kunnen vergelijken van resultaten maar ook continuïteit van methode bij netwerkzorg of het kunnen aanbieden van standaarden in de meest gebruikte ICTsystemen.

 

Rationale van de aanbeveling: weging van argumenten voor en tegen de interventies

Er zijn voor de genoemde doelgroepen veel verschillende pijnscores in gebruik bij verschillende instellingen. Zodra er sprake is van een situatie waarbij zelfrapportage niet mogelijk is, wordt de beoordeling complexer omdat er in de praktijk gebruik gemaakt van een inschatting van de pijn door een ouder/hulpverlener met rapportage volgens een eendimensionale vragenlijst en/of een observatie van pijn of comfort volgens een multidimensionale vragenlijst.

 

Voor kinderen vanaf 6 jaar met een leeftijdsadequaat ontwikkelingsniveau blijkt op basis van de beschikbare literatuur dat het verbaal uitvragen van de NRS 11 een goed meetinstrument is voor het beoordelen van acute pijn. Bij toepassing van de NRS 11 bij kinderen tussen de 4 en 6 jaar ontstaat er onbetrouwbaarheid op het gebied van verschil in meetresultaten in vergelijking met de FPS-R, wat de betrouwbaarheid van de NRS 11 voor deze specifieke leeftijdsgroep in twijfel trekt. Het kan betekenen dat de NRS 11 mogelijk minder geschikt is voor kinderen van deze leeftijdscategorie (in vergelijking met de FPS-R). Uit meerdere studies met verschillende meetinstrumenten blijkt dat met name kinderen in leeftijdscategorie 4 tot 6 jaar mogelijk niet in staat de pijn die ze ervaren in kaart te brengen op een tweede dimensie (zoals kleur of een cijfer).

 

Eendimensionale meetinstrumenten voor het beoordelen van acute pijn zijn niet beschikbaar voor neonaten, kinderen < 6 jaar of kinderen met neurobiologische ontwikkelingsstoornissen. Bij deze groepen wordt in de praktijk pragmatisch wel vaak gebruik gemaakt van de NRS als methode om pijn bij deze kinderen in kaart te brengen en vast te leggen door een hulpverlener of ouder. Vaak wordt deze score aangeduid als NRSproxy, omdat niet door het kind zelf gescoord wordt maar door een hulpverlener of ouder. Voordeel van deze methode is dat op snelle en simpele manier een score aan de pijn wordt toegekend en geregistreerd. Echter, deze methode is op geen enkele manier gevalideerd. Toepassing van een observatiescore kost meer tijd maar geeft een beter onderbouwde score van het welbevinden van het kind.

 

Voor de neonaten werden geen studies gevonden die de validiteit en/of betrouwbaarheid van unidimensionele meetinstrumenten voor het meten van acute pijn onderzochten. In deze groep wordt aanbevolen om een observatieschaal te overwegen.

 

Kinderen met neurobiologische ontwikkelingsstoornissen kunnen mogelijk de pijn die ze ervaren niet in kaart brengen op een tweede dimensie in de vorm van een unidimensionele meetinstrument. Daarom wordt op basis van expert opinion aanbevolen om bij deze groep een NRS proxy en/of een comfort schaal te overwegen.

Onderbouwing

Toepassing van een adequaat meetinstrument is van belang om pijn bij een kind te signaleren en te registreren, om zo zicht te krijgen op de pijnbeleving van het kind. In principe zijn meetinstrumenten voor acute pijn baseert op zelfrapportage van de pijnintensiteit. De mogelijkheid van zelfrapportage is afhankelijk van het ontwikkelingsniveau en/of de leeftijd van het kind. Indien zelfrapportage niet mogelijk is wordt een meetinstrument door ouder of hulpverlener gebruikt gebaseerd op de observaties van de gevolgen van pijn, zoals pijngedrag.

Een goed pijnmeetinstrument voor kinderen geeft een geldige weergave van de pijnervaring, is betrouwbaarheid en toepasbaar.

Bij acute pijn wordt onderscheid gemaakt tussen eendimensionale vragenlijsten (pijn intensiteit) en multidimensionale vragenlijsten (psychologische, sociale en functionele dimensies van pijn).

Deze module richt zich alleen op eendimensionale vragenlijsten. De multidimensionale vragenlijsten worden besproken in module 6 die zich richt op beoordeling van comfort.

Color Analogue Scale (CAS)

Very low       GRADE

It is unclear whether the Color Analogue Scale (CAS) could possibly be a valid measurement tool (hypotheses testing, criterion validity, responsiveness) for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019; Le May, 2018

 

Low GRADE

The evidence suggests that the Color Analogue Scale (CAS) might not be a reliable measurement tool for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019; Le May, 2018

 

Wong-Baker FACES Pain Rating Scale (FACES)

Very low       GRADE

It is unclear whether the FACES could be a valid measurement tool (hypotheses testing, criterion validity, cross-cultural validity, responsiveness) for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019

 

Very low       GRADE

It is unclear whether the FACES could be a reliable measurement tool for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019

 

Faces Pain Scale (FPS)

Very low       GRADE

It is unclear whether the Faces Pain Scale (FPS) could be a valid measurement tool (hypotheses testing, criterion validity, responsiveness) for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019

 

Low GRADE

The evidence suggests that the Faces Pain Scale (FPS) might not be a reliable measurement tool for the assessment of acute pain in verbal children.

 

Source: Birnie, 2019

 

Faces Pain Scale-Revised (FPS-R)

Very low       GRADE

It is unclear whether the Faces Pain Scale-Revised (FPS-R) could be a valid measurement tool (content validity, hypotheses testing, criterion validity, cross-cultural validity, responsiveness) for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019; Le May, 2018

 

Low GRADE

The evidence suggests that the Faces Pain Scale-Revised (FPS-R) might be a reliable measurement tool for the assessment of acute pain in verbal children of 7 years of age or older.

 

Source: Birnie, 2019; Le May, 2018

 

Low GRADE

The evidence suggests that the Faces Pain Scale-Revised (FPS-R) might not be a reliable measurement tool for the assessment of acute pain in verbal children younger than 7 years of age.

 

Source: Birnie, 2019

 

Eleven-point Numeric Rating Scale (NRS-11)

Very low       GRADE

It is unclear whether the Eleven-point Numeric Rating Scale (NRS-11) could be a valid measurement tool (hypotheses testing, criterion validity, responsiveness) for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019

 

Low GRADE

The evidence suggests that the Eleven-point Numeric Rating Scale (NRS-11) might not be a reliable measurement tool for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019

 

Oucher Scale

Very low       GRADE

It is unclear whether the Oucher Scale could be a valid measurement tool (hypotheses testing, criterion validity) for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019

 

Very low       GRADE

The evidence suggests that the Oucher Scale might not be a reliable measurement tool for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019

 

Pieces of hurt

Very low       GRADE

It is unclear whether the Pieces of hurt scale could be a valid measurement tool (hypotheses testing, cross-cultural validity, criterion validity) for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019

 

Very low       GRADE

It is unclear whether the Pieces of hurt scale could be a reliable measurement tool for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019

 

Visual Analogue Scale (VAS)

Very low       GRADE

It is unclear whether the Visual Analogue Scale (VAS) could be a valid measurement tool (hypotheses testing, criterion validity, responsiveness) for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019; Le May, 2018

 

Very low       GRADE

It is unclear whether the Visual Analogue Scale (VAS) could be a reliable measurement tool for the assessment of acute pain in verbal children and adolescents.

 

Source: Birnie, 2019; Le May, 2018

 

COVERS

Very low       GRADE

It is unclear whether COVERS could be a valid measurement tool (hypotheses testing, internal consistency) for the assessment of acute pain in verbal children and adolescents.

 

Source: O’Sullivan, 2016

 

Very low       GRADE

It is unclear whether COVERS could be a reliable measurement tool for the assessment of acute pain in verbal children and adolescents.

 

Source: O’Sullivan, 2016

 

Modified PAT

Very low       GRADE

It is unclear whether the Modified PAT (mPAT) could be a valid measurement tool (hypotheses testing) for the assessment of acute pain in verbal children and adolescents.

 

Source: O’Sullivan, 2016

 

No GRADE

No evidence was found regarding other measures of reliability of the Modified PAT (mPAT) for the assessment of acute pain in verbal children and adolescents.

Description of studies

Birnie (2019) performed a systematic review to evaluate the measurement properties of single-item self-report pain intensity measures in children 3 to 18 years old. In addition, evidence-based recommendations for measurement of child and adolescent self-report of acute, postoperative, and chronic pain were developed. MEDLINE, EMBASE, PsycINFO, Cochrane Central Register of Controlled Trials (CENTRAL), Web of Science and CINAHL were searched from 2005 up to 13 November 2017 for articles published since the original systematic review (Stinson 2006). Reference lists from included studies were also checked. Peer-reviewed English language research studies with the primary objective of examining measurement properties of self-report single-item measures of pain intensity in children and adolescents 3 to 18 years of age were included. Pain measures have been included if they met Cohen’s criteria of “well-established assessment”. Unpublished manuscripts, reviews, guidelines, commentaries, and other descriptive articles were excluded. COnsensus based Standards for the selection of health Measurement INstruments (COSMIN) was used to assess methodological quality and sufficiency of measurement properties for reliability, validity, responsiveness, and interpretability. However, they reported only these categories: “poor”, “fair”, “good”, and “excellent”. In total, 80 studies were included in the qualitative synthesis, and 40 studies reported about acute pain (Badr, 2006; Bailey, 2007; Bailey, 2010; Bailey, 2012; Belter, 1988; Beyer, 1988; Beyer, 1986; Bulloch, 2009; Bulloch (a), 2002; Bulloch (b), 2002; Chambers, 1999; Charry, 2014; Ellis, 2011; Garra, 2010; Garra, 2013; Gharbaibeh, 2002; Goodenough, 1997; Hester, 1979; Hicks - sample 2, 2001; Keck, 1996; Luffy, 2003; McClellan, 2009; McConahay, 2006; McConahay, 2007; McGrath, 1996; Miro, 2004; Myrvik, 2015; Newman, 2005; Powell, 2001; Stanford, 2006; Stein, 1995; St-Laurent-Gagnon, 1999; Subhashini, 2008; Tsze, 2013; Tsze, 2015; Tsze, 2016; Tsze, 2017; Villarual, 1991; von Baeyer, 2013; von Baeyer - sample 3, 2009; Wong, 1988).

 

Birnie (2019) reported the following single-item self-report pain intensity measures for acute pain in children and adolescents:

  • Color Analogue Scale (CAS): range from small and white to wider and deep red reflecting pain intensity.
  • Wong-Baker FACES Pain Rating Scale: six black and white faces ranging from a smiling face to a sad and tearful face indicating as much hurt as you can imagine.
  • Faces Pain Scale-Revised (and Faces Pain Scale): six faces representing ‘no pain’ to ‘very much pain’.
  • Eleven-point Numeric Rating Scale (NRS-11): range from 0 to 10.
  • Oucher (photo, numerical, combined): two scales presented together: a 10-point numeric scale and a 6-picture scale of color photographs showing increasing levels of pain.
  • Pieces of hurt: a scale of four red poker chips by which the child can indicate the level of pain.
  • Visual Analogue Scale (VAS): range from 0 to 100 or 0 to 10.

O’Sullivan (2016) performed an observational study to assess the reliability, validity and clinical utility of two measures of neonatal pain. The study included neonates who were treated at the Newborn Intensive Care Unit (NICU) in a hospital in New Zealand, and their mothers. Pain was assessed once before or after, and once during heel lancing for blood collection. The study reported on the following measures of pain:

  • COVERS Scale: six items scored 0-2, resulting in a score 0-12
  • Modified PAT scale: ten items of physiological and behavioral parameters scored 0-2, resulting in a score 0-20

Le May (2018) performed an observational study, which was a secondary analysis of a randomized controlled trial to assess the efficacy of morphine and ibuprofen or a combination thereof in pediatric patients aged 6-17 with a musculoskeletal injury. The study compared three pain scales:

  • Mechanical Visual Analog Scale (VAS)
  • Faces Pain Scale Revised (FPS-R)
  • Colour Analogue Scale (CAS)

Results

The results of the outcomes of the included studies were summarized in table 1 and described here.

 

1. Validity (critical outcome)

The domain validity aims to reflect the degree to which an outcome measure measures the construct it intends to measure and contains the measurement properties content validity (including face validity), construct validity (including structural validity, hypotheses testing, and cross-cultural validity/measurement invariance) and criterion validity.

 

1.1   Content validity

Birnie (2019) reported a sufficient content validity for the FSP-R in children aged 7 years of age (n=1), and an indeterminate content validity for the Oucher scale (n=2)

 

For the other pain measures, no content validity outcomes were reported.

 

1.2   Construct validity

1.2.1         Structural validity

No studies reported on outcome measures to assess structural validity.

 

1.2.2         Hypotheses testing

Birnie (2019) reported sufficient hypotheses testing for the CAS (n=4), FPS-R (n=4) NRS-11 (n=3), FPS (n=2), Pieces of hurt (n=3) and VAS (n=3). Insufficient hypotheses testing was reported for FACES (n=8), and the Oucher scale (n=4).

 

O’Sullivan (2016) reported sufficient hypotheses testing for COVERS compared to mPAT (0.81, p<0.001)

No hypotheses testing outcome measures were reported for other pain measurement scales.

 

1.2.3         Cross-cultural validity

Birnie (2019) reported indeterminate cross-culture validity for FACES (n=2), FPS-R (n=1), and Pieces of hurt (n=1).

Cross-cultural validity was not reported for the other pain measures.

 

1.2.4.     Convergent validity

The domain convergent validity refers to the degree to which the measurement is related to other measurements that measure the same (or similar) constructs.

 

1.3   Criterion validity

Birnie (2019) reported indeterminate criterion validity for several CAS (n=4) FPS-R (n=5), Oucher scales (n=3) and Pieces of hurt (n=4), NRS-11 (n=6), Oucher scale (n=3), Pieces of hurt (n=4); and (mostly) sufficient criterion validity for FACES (n=10), NRS-11 (n=6), and VAS (n=3).

 

Le May (2018) reported an excellent correlation between VAS and CAS: 0.92 (95% CI: 0.90 to 0.93), and good correlations between VAS and FPS-R: 0.78 (95% CI: 0.75 to 0.82), and CAS and FPS-R: 0.79 (95% CI: 0.75 to 0.83).

 

2. Reliability (important outcome)

The domain reliability refers to the degree to which the measurement is free from measurement error, and it contains the measurement properties internal consistency, reliability, and measurement error.

 

2.1 Internal consistency

O’Sullivan (2016) reported mostly optimal interitem consistency for COVERS (0.19 to 0.68), and for mPAT (0.35 to 0.71).

 

2.2 Reliability

Birnie (2019) reported sufficient reliability for CAS (n=3), FPS-R (n=3), and NRS-11 (n=3). Insufficient or indeterminate reliability was reported for FACES (n=5), Oucher (n=2), and Pieces of hurt (n=2) and VAS (n=2).

 

Le May (2018) reported good reliability of VAS: 0.79 (95% CI: 0.75 to 0.82), CAS: 0.82 (95% CI: 0.78 to 0.95), and FPS-R: 0.76 (95% CI: 0.72 to 0.80).

 

O’Sullivan (2016) reported fair reliability for COVERS (median 0.44, range 0.29 to 0.78), and poor reliability for mPAT (median 0.34, range -0.07 to 0.69).

 

2.3 Measurement error

Measurement error was not reported for any of the pain measures.

 

Table 1. COSMIN checklist – adapted from Birnie (2019)

Measure

 

Reliability

Content validity

Hypothesis testing

Cross-cultural validity

Criterion validity

Responsiveness

 

N studies (n patients)

N studies (n patients)

Meth quality*

Result (rating)**

 

 

N studies (n patients)

Meth quality*

Result (rating)**

 

N studies (n patients)

Meth quality*

Result (rating)**

 

N studies (n patients)

Meth quality*

Result (rating)**

N studies (n patients)

Meth quality*

Result (rating)**

 

N studies (n patients)

Meth quality*

Result (rating)**

CAS

11

3 (911)

Fair

+ (7+y)

-

-

 

4 (965)

Poor

+

-

-

 

4 (948)

Poor

?

5 (1241)

Poor

+

- (4-7y)

FACES

14

5 (651)

Poor

+ (6-7y)

-

-

 

8 (1058)

Poor

-

2 (283)

Poor

?

10 (1228)

Fair

+

3 (211)

Poor

+

- (4-5y)

FPS

4

1 (121)

Poor

?

-

-

 

2 (110)

Poor

?

-

-

 

3 (185)

Good

?

2 (181)

Poor

+

FPS-R

9

3 (1205)

Fair

+ (7+y)

1 (214)

Excellent

- (3-6y)

4 (1287)

Good

+

1 (371)

Fair

?

5 (1403)

Fair

?

2 (934)

Good

+

- (3-6y)

+ (7y)

NRS-11

7

3 (1112)

Poor

+ (6-7y)

-

-

 

3 (1112)

Fair

+

-

-

 

6 (1529)

Poor

+

2 (962)

Poor

+

Oucher

6

2 (150)

Poor

?

2 (>78)

Fair

?

4 (298)

Poor

-

-

-

 

3 (198)

Poor

?

-

-

 

Pieces of hurt

5

2 (>95)

Poor

- (4-5y)

-

-

 

3 (198)

Fair

+

1 (95)

Poor

?

4 (293)

Poor

?

-

-

 

VAS

6

2 (187)

Poor

- (3-7y)

-

-

 

1 (100)

Poor

+

-

-

 

3 (237)

Fair

+

1 (73)

Fair

+

*Risk of bias assessment based on COSMIN risk of bias tool

**Measurement properties of each study could be rated as: sufficient (+), insufficient (–), or indeterminate (?)

Abbreviations: CAS, Color Analogue Scale; FACES, Wong-Baker FACES Pain Rating Scale; FPS, Faces Pain Scale; FPS-R, Faces Pain Scale-Revised (and Faces Pain Scale); NRS-11, Eleven-point Numeric Rating Scale; VAS, Visual Analogue Scale

 

Level of evidence of the literature

Color Analogue Scale (CAS)

The level of evidence regarding the outcome reliability started as High (systematic review of observational studies) and was downgraded by two levels because of risk of bias (2 levels, because of poor quality of included studies) to Low.

 

The level of evidence regarding the outcome hypotheses testing started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome criterion validity started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome responsiveness started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcomes content validity, structural validity, cross-cultural validity, convergent validity, internal consistency, and measurement error were not assessed because no studies were included investigating these outcomes.

 

Wong-Baker FACES Pain Rating Scale (FACES)

The level of evidence regarding the outcome reliability started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome hypotheses testing started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome cross-cultural validity started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome criterion validity started as High (systematic review of observational studies) and was downgraded by two levels because of risk of bias (2 levels, because of fair quality of included studies) to Low. 

 

The level of evidence regarding the outcome responsiveness started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcomes content validity, structural validity, convergent validity, internal consistency, and measurement error were not assessed because no studies were included investigating these outcomes.

 

Faces Pain Scale (FPS)

The level of evidence regarding the outcome reliability started as High (systematic review of observational studies) and was downgraded by two levels because of risk of bias (2 levels, because of fair quality of included studies) to Low. 

 

The level of evidence regarding the outcome hypotheses testing started as High (systematic review of observational studies) and was downgraded by two levels because of risk of bias (2 levels, because of poor quality of included studies) to Low.

 

The level of evidence regarding the outcome criterion validity started as High (systematic review of observational studies) and was downgraded by one level because of risk of bias (1 level, because of good study quality) to Moderate.

 

The level of evidence regarding the outcome responsiveness started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcomes content validity, structural validity, cross-cultural validity, convergent validity, internal consistency, and measurement error were not assessed because no studies were included investigating these outcomes.

 

Faces Pain Scale-Revised (FPS-R)

The level of evidence regarding the outcome reliability started as High (systematic review of observational studies) and was downgraded by two levels because of risk of bias (2 levels, because of fair quality of included studies) to Low.

 

The level of evidence regarding the outcome content validity was downgraded by one level because of imprecision (1 level, because there was only 1 study included) to Moderate.

 

The level of evidence regarding the outcome hypotheses testing started as High (systematic review of observational studies) and was downgraded by one level because of risk of bias (1 level, because of good study quality) to Moderate.

 

The level of evidence regarding the outcome cross-cultural validity started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because one study of fair quality was included) to Very low.

 

The level of evidence regarding the outcome criterion validity started as High (systematic review of observational studies) and was downgraded by two levels because of risk of bias (2 levels, because of fair quality of included studies) to Low.

 

The level of evidence regarding the outcome responsiveness started as High (systematic review of observational studies) and was not downgraded.

 

The level of evidence regarding the outcomes content validity, structural validity, convergent validity, internal consistency, and measurement error were not assessed because no studies were included investigating these outcomes.

 

Eleven-point Numeric Rating Scale (NRS-11)

The level of evidence regarding the outcome reliability started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Low. 

 

The level of evidence regarding the outcome hypotheses testing started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Low.

 

The level of evidence regarding the outcome criterion validity started as High (systematic review of observational studies) and was downgraded by one levels because of inconsistency (1 level, because of variation in study quality) to Moderate.

 

The level of evidence regarding the outcome responsiveness started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcomes content validity, structural validity, cross-cultural validity, convergent validity, internal consistency, and measurement error were not assessed because no studies were included investigating these outcomes.

 

Oucher pain scale

The level of evidence regarding the outcome reliability started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome hypotheses testing started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome criterion validity started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcomes content validity, structural validity, cross-cultural validity, convergent validity, internal consistency, measurement error and responsiveness were not assessed because no studies were included investigating these outcomes.

 

Pieces of hurt

The level of evidence regarding the outcome reliability started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome hypotheses testing started as High (systematic review of observational studies) and was downgraded by two levels because of risk of bias (2 levels, because of fair quality of included studies) to Low.

 

The level of evidence regarding the outcome cross-cultural validity started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome criterion validity started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcomes content validity, structural validity, convergent validity, internal consistency, measurement error and responsiveness were not assessed because no studies were included investigating these outcomes.

 

Visual Analogue Scale (VAS)

The level of evidence regarding the outcome reliability started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome hypotheses testing started as High (systematic review of observational studies) and was downgraded by three levels because of risk of bias (3 levels, because of poor quality of included studies) to Very low.

 

The level of evidence regarding the outcome criterion validity started as High (systematic review of observational studies) and was downgraded by two levels because of risk of bias (2 levels, because of poor quality of included studies) to Low.

 

The level of evidence regarding the outcome responsiveness started as High (systematic review of observational studies) and was downgraded by two levels because of risk of bias (2 levels, because of poor quality of included studies) to Low.

 

The level of evidence regarding the outcomes content validity, structural validity, cross-cultural validity, convergent validity, internal consistency, and measurement error were not assessed because no studies were included investigating these outcomes.

 

COVERS

The level of evidence regarding the outcome reliability started as Low (observational study) and was downgraded by one level because of imprecision (because of a low number of participants) to Very low.

 

The level of evidence regarding the outcome hypothesis testing started as Low (observational study) and was downgraded by one level because of imprecision (because of a low number of participants) to Very low.

 

The level of evidence regarding the outcome internal consistency started as Low (observational study) and was downgraded by one level because of imprecision (because of a low number of participants) to Very low.

 

The level of evidence regarding the outcomes content validity, criterion validity, structural validity, cross-cultural validity, convergent validity, responsiveness, and measurement error were not assessed because no studies were included investigating these outcomes.

 

mPAT

The level of evidence regarding the outcome hypothesis testing started as Low (observational study) and was downgraded by one level because of imprecision (because of a low number of participants) to Very low.

 

The level of evidence regarding the outcomes content validity, criterion validity, structural validity, cross-cultural validity, convergent validity, internal consistency, reliability, responsiveness, and measurement error were not assessed because no studies were included investigating these outcomes.

A systematic review of the literature was performed to answer the following question: What is the validity and reliability of measures for the assessment of acute pain in preverbal children/neonates, verbal children, adolescents and children with neurodevelopmental disorders?

 

P:

P1. preverbal children/neonates (<1 month)

P2. verbal children

P3. Adolescents (up to 18 years)

P4. children with neurodevelopmental disorders

I:

Measures for the assessment of acute pain

I1. Neonatal Infant Pain Scale, Neonatal Pain, Agitation, and Sedation Scale, Neonatal Facial Coding System, Leuven Neonatal Pain Scale, CRIES, Premature Infant Pain Profile. Facial Affective Scale / McGrath faces scale, Faces Pain Scale-Revised (FPS-R) / Face Pain Scale - Revised, FLACC (adapted for Developmental Delay/Nonverbal Children), Behavioral pain Scale

I2. COMFORT Scale, Children's Hospital of Eastern Ontario Pain Scale

I3. Children's Hospital of Eastern Ontario Pain Scale, NRS, VAS,

I4. FLACC (adapted for Developmental Delay/Nonverbal Children), Non-Communicating Children’s Pain Checklist – Revised (NCCPC- R), Behavioral pain Scale

C: Other measures for the assessment of acute pain
O: Validity, reliability

 

Relevant outcome measures

The guideline development group considered validity as a critical outcome measure for decision making; and reliability as an important outcome measure for decision making.

The measurement properties were defined following the taxonomy of the Consensus-based Standards for the selection of health Measurement INstruments (COSMIN) (Mokkink, 2010).

The working group defined the discriminate validity of the screening tools as follows:

AUC < 0.7: poor; 0.7 ≤ AUC < 0.8: acceptable; 0.8 ≤ AUC < 0.9: excellent; AUC ≥ 0.9: outstanding. The working group defined the reliability of the screening tools as follows: ICC < 0.5: poor; 0.5 ≤ ICC < 0.75: moderate; 0.75 ≥ ICC < 0.9: good; ICC≥ 0.9: excellent.

 

Search and select (Methods)

The databases Medline (via OVID) and Embase (via Embase.com) were searched with relevant search terms from 2007 until 1 September 2022. The detailed search strategy is depicted under the tab Methods. The systematic literature search resulted in 261 hits. Studies were selected based on the following criteria: relevance to PICO, systematic review (with meta-analysis), or observational study. Ten (10) studies were initially selected based on title and abstract screening. After reading the full text, seven (7) studies were excluded (see the table with reasons for exclusion under the tab Methods), and three (3) studies were included.

 

Results

Three (3) studies were included in the analysis of the literature. Only nonverbal and verbal children were included in the included studies (subgroups 1 and 2), no studies included adolescents and children with neurobiological developmental disorders (subgroups 3 and 4). Important study characteristics and results are summarized in the evidence tables. The assessment of the risk of bias is summarized in the risk of bias tables. The COSMIN Risk of Bias tool was used to assess the quality of single studies for each measurement property.

  1. 1 - Birnie KA, Hundert AS, Lalloo C, Nguyen C, Stinson JN. Recommendations for selection of self-report pain intensity measures in children and adolescents: a systematic review and quality assessment of measurement properties. Pain. 2019 Jan;160(1):5-18. doi: 10.1097/j.pain.0000000000001377. PMID: 30180088.
  2. 2 - Le May S, Ballard A, Khadra C, Gouin S, Plint AC, Villeneuve E, Mâsse B, Tsze DS, Neto G, Drendel AL, Auclair MC, McGrath PJ, Ali S. Comparison of the psychometric properties of 3 pain scales used in the pediatric emergency department: Visual Analogue Scale, Faces Pain Scale-Revised, and Colour Analogue Scale. Pain. 2018 Aug;159(8):1508-1517. doi: 10.1097/j.pain.0000000000001236. PMID: 29608509.
  3. 3 - O'Sullivan AT, Rowley S, Ellis S, Faasse K, Petrie KJ. The Validity and Clinical Utility of the COVERS Scale and Pain Assessment Tool for Assessing Pain in Neonates Admitted to an Intensive Care Unit. Clin J Pain. 2016 Jan;32(1):51-7. doi: 10.1097/AJP.0000000000000228. PMID: 25756556.

Evidence table for systematic review of RCTs and observational studies (intervention studies)

Study reference

Study characteristics

Patient characteristics

Intervention (I)

Comparison / control (C)

 

Follow-up

Outcome measures and effect size

Comments

Birnie, 2019

 

[individual study characteristics deduced from [Birnie, 2019]]

 

PS., study characteristics and results are extracted from the SR (unless stated otherwise)

SR of peer-reviewed English language research studies (study design not reported)

 

Literature search up to November 2017

 

Study design:

Not reported

 

Setting and Country:

Not reported

 

Source of funding and conflicts of interest:

The authors have no conflict of interest to declare (not reported for individual studies)

Inclusion criteria SR:

- Peer-reviewed English language research studies with the primary objective of examining measurement properties of self-report single-item measures of pain intensity in children and adolescents 3 to 18 years of age

- Pain measures met Cohen’s criteria of “well-established assessment”

 

Exclusion criteria SR:

Unpublished manuscripts, reviews, guidelines, commentaries, and other descriptive articles

 

80 studies included (n=40 about acute pain)

 

Important patient characteristics at baseline:

CAS

  • Bailey, 2007; 8-18 years
  • Bulloch, 2009; 5-16 years
  • Bulloch (a), 2002; 5-16 years
  • Bulloch (b), 2002; 5-16 years
  • McConahay, 2006; 5-16years
  • McConahay, 2007; 5-12 years
  • McGrath, 1996; 5-16 years
  • Subhashini, 2008; 6-12 years
  • Tsze, 2013; 4-17 years
  • Tsze, 2015; 4-17 years
  • Tsze, 2016; 4-17 years

FACES

  • Badr, 2006; 4-10 years
  • Bailey, 2007; 8-18 years
  • Chambers, 1999; 5-12 years
  • Ellis, 2011; 5-83 years
  • Garra, 2010; 8-17 years
  • Garra, 2013; 7-12 years
  • Gharbaibeh, 2002; 3-14 years
  • Keck, 1996; 3-18 years
  • Luffy, 2003; 3-18 years
  • McClellan, 2009; 2-17 years
  • Newman, 2005; 4-11 years
  • Stein, 1995; …-4 years
  • Subhashini, 2008; 6-12 years
  • Wong, 1988; not reported

FPS

  • Bulloch (a), 2002; 5-16 years
  • Bulloch (b), 2002; 5-16 years
  • Chambers, 1999; 5-12 years
  • Goodenough, 1997; 4-6 years

FPS-R

  • Charry, 2014; 6-10 years
  • Hicks - sample 2, 2001; 4-12 years
  • Miro, 2004; mean: 10.86 years (SD 1.55)
  • Newman, 2005; 4-11 years
  • Stanford, 2006; 3-6 years
  • Tsze, 2013; 4-17 years
  • Tsze, 2015; 4-17 years
  • Tsze, 2016; 4-17 years
  • von Baeyer, 2013; 3-5 years

NRS-11

  • Bailey, 2007; 8-18 years
  • Bailey, 2010; 8-17 years
  • Keck, 1996; 3-18 years
  • Myrvik, 2015; 4.65 ± SD 3.12 years
  • Tsze, 2017; 4-17 years
  • von Baeyer - sample 3, 2009; 7-17 years
  • Wong, 1988; not reported

Oucher

  • Luffy, 2003; 3-18 years
  • Beyer, 1988; 3-12 years
  • Belter, 1988; 3-6 years
  • Beyer, 1986; not reported
  • Villarual, 1991; not reported

Pieces of hurt

  • Gharbaibeh, 2002; 3-14 years
  • Goodenough, 1997; 4-6 years
  • Hester, 1979; 4-7 years
  • Hester, 1990; not reported
  • St-Laurent-Gagnon, 1999; 4-6 years

VAS

  • Bailey, 2007; 8-18 years
  • Bailey, 2012; 8-17 years
  • Luffy, 2003; 3-18 years
  • Myrvik, 2015; 4.65 ± SD 3.12 years
  • Newman, 2005; 4-11 years
  • Powell, 2001; 8-15 years

Measures for assessment of chronic pain:

 

  • Color Analogue Scale (CAS)
  • Eleven-point Numeric Rating Scale (NRS-11)
  • Faces Pain Scale-Revised (and Faces Pain Scale): FPS(-R)
  • Visual Analogue Scale (VAS)
  • Wong-Baker FACES Pain Rating Scale
  • Oucher pain scale
  • Pieces of hurt (PoH)

 

No comparison

 

Endpoint of follow-up: NA

 

For how many participants were no complete outcome data available?

Missing data reported in the study but not specified for acute pain.

 

 

No effect sizes were reported.

 

Content validity

  • CAS: not applicable (na)
  • FACES:  na
  • FPS(-R): Excellent
  • NRS-11: na
  • Oucher: Fair
  • PoH: na
  • VAS: na

 

Hypotheses testing

  • CAS: poor
  • FACES:  poor
  • FPS: Poor
  • FPS-R: Good
  • NRS-11:
  • Oucher: 
  • PoH: Poor
  • VAS: Poor

 

Criterion validity

  • CAS: Poor
  • FACES:  Poor
  • FPS: Poor
  • FPS-R: Fair
  • NRS-11: Poor
  • Oucher:  Poor
  • PoH: Poor
  • VAS: Poor

 

 

 

 

 

 

 

 

 

Personal remarks:

No quantifiable data about the properties for the self-report pain intensity measures were reported.
A well-structured quality assessment was performed on several aspects of pain measure properties.

 

 

 

Risk of bias tables

Risk of bias table cohort studies

Author, year

Selection of participants

 

Was selection of exposed and non-exposed cohorts drawn from the same population?

 

Exposure

 

 

Can we be confident in the assessment of exposure?

 

 

 

 

 

Outcome of interest

 

Can we be confident that the outcome of interest was not present at start of study?

 

 

 

Confounding-assessment

 

Can we be confident in the assessment of confounding factors? 

 

Confounding-analysis

 

Did the study match exposed and unexposed for all variables that are associated with the outcome of interest or did the statistical analysis adjust for these confounding variables?

Assessment of outcome

 

Can we be confident in the assessment of outcome?

 

 

 

 

 

 

Follow up

 

 

Was the follow up of cohorts adequate? In particular, was outcome data complete or imputed?

Co-interventions

 

Were co-interventions similar between groups?

 

 

 

 

Overall Risk of bias

 

 

 

 

 

 

 

 

Definitely yes, probably yes, probably no, definitely no

Definitely yes, probably yes, probably no, definitely no

Definitely yes, probably yes, probably no, definitely no

Definitely yes, probably yes, probably no, definitely no

Definitely yes, probably yes, probably no, definitely no

Definitely yes, probably yes, probably no, definitely no

Definitely yes, probably yes, probably no, definitely no

Definitely yes, probably yes, probably no, definitely no

Low, Some concerns, High

O’Sullivan, 2016

Definitely yes

 

Reason: no comparison between groups

 

Definitely yes

 

Reason: Trained nurse assessed exposure

Definitely yes

 

Reason: Not relevant

Definitely yes

 

Reason: Not applicable

Definitely yes

 

Reason: Measurements on same patients

Probably yes

 

Reason: Blinding for other measurement was not reported

Not applicable

Not applicable

Some concerns

Le May, 2018

Definitely yes

 

Reason: no comparison between groups

 

Definitely no

 

Reason:

Subsequent self-report of very similar measures pain leads to high risk for overestimation of validity

Not applicable

 

Not applicable

 

Not applicable

 

Definitely no

 

Reason:

Subsequent self-report of very similar measures pain leads to high risk for overestimation of validity

Not applicable

 

Reason:

 

Not applicable

 

Reason:

 

Some concerns

 

Table of excluded studies

Reference

Reason for exclusion

Hullett, 2009

Wrong I

Von Baeyer, 2007

Overlap with SR Birnie

Tsze, 2018

In SR Birnie

Tsze, 2018a

In SR Birnie

Bailey, 2010

In SR Birnie

Bailey, 2012

In SR Birnie

Garra, 2010

In SR Birnie

Hu, 2021

Wrong I

Autorisatiedatum en geldigheid

Laatst beoordeeld  : 19-04-2024

Laatst geautoriseerd  : 19-04-2024

Geplande herbeoordeling  : 19-04-2029

Initiatief en autorisatie

Initiatief:
  • Nederlandse Vereniging voor Kindergeneeskunde
Geautoriseerd door:
  • Nederlandse Vereniging voor Anesthesiologie
  • Nederlandse Vereniging voor Heelkunde
  • Nederlandse Vereniging voor Kindergeneeskunde
  • Verpleegkundigen en Verzorgenden Nederland
  • Nederlands Instituut van Psychologen
  • Stichting Kind en Ziekenhuis

Algemene gegevens

De ontwikkeling/herziening van deze richtlijnmodule werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten (www.demedischspecialist.nl/kennisinstituut) en werd gefinancierd uit de Kwaliteitsgelden Medisch Specialisten (SKMS).

De financier heeft geen enkele invloed gehad op de inhoud van de richtlijnmodule.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijnmodule is in 2021 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen (zie hiervoor de Samenstelling van de werkgroep) die betrokken zijn bij de zorg voor kinderen met pijn.

 

Kernwerkgroep

  • Drs. M.A. (Maarten) Mensink, kinderanesthesioloog en pijnarts, werkzaam in het Prinses Máxima Centrum voor Kinderoncologie te Utrecht, NVA, voorzitter
  • Drs. J.F. (Joanne) Goorhuis, algemeen kinderarts, werkzaam in het Medisch Spectrum Twente, NVK
  • Dr. F (Felix) Kreier, algemeen kinderarts, werkzaam in het OLVG te Amsterdam, NVK
  • Drs. M.S. (Sukru) Genco, algemeen kinderarts, werkzaam in het OLVG te Amsterdam, NVK
  • Dr. S.H. (Steven) Renes, anesthesioloog-pijnspecialist, werkzaam in het Radboud UMC te Nijmegen, NVA
  • Dr. P. (Petra) Honig-Mazer, psychotherapeut, werkzaam in het Erasmus MC Sophia te Rotterdam, NIP/LVMP
  • Drs. M. (Marjorie) de Neef, kinder-IC verpleegkundige, werkzaam in het Amsterdam UMC, V&VN
  • R. (Rowy) Uitzinger, junior projectmanager en beleidsmedewerker, Stichting Kind en Ziekenhuis, tot 1 juni 2022
  • E.C. (Esen) Doganer, junior projectmanager en beleidsmedewerker, Stichting Kind en Ziekenhuis, vanaf 1 juni 2022

Werkgroep

  • Drs. L.A.M. (Lonneke) Aarts, algemeen kinderarts, werkzaam in het RadboudUMC Amalia kinderziekenhuis te Nijmegen, NVK
  • Prof. dr. W.J.E. (Wim) Tissing, kinderoncoloog, werkzaam in het UMCG te Groningen en Prinses Máxima Centrum te Utrecht, NVK
  • Prof. dr. S.N. (Saskia) de Wildt, kinderintensivist, werkzaam in het RadboudUMC te Nijmegen, NVK (tot 9-9-2022)
  • Prof. dr. N.M. (Nico) Wulffraat, kinderreumatoloog, werkzaam in het UMC Utrecht te Utrecht, NVK (tot 1-11-2022)
  • Drs. P. (Petra) Hissink-Muller, kinderreumatoloog, werkzaam in het Erasmus MC Sophia te Rotterdam (vanaf 1-11-2022)
  • Drs. A.M. (Arine) Vlieger, algemeen kinderarts, werkzaam in het St. Antonius Ziekenhuis te Utrecht, NVK
  • Dr. S.H.P. (Sinno) Simons, kinderarts-neonatoloog, werkzaam in het Erasmus MC Sophia te Rotterdam, NVK
  • Drs. K. (Karina) Elangovan, kinderanesthesioloog, werkzaam in het Erasmus MC Sophia te Rotterdam, NVA
  • Dr. C.M.G. (Claudia) Keyzer – Dekker, kinderchirurg, werkzaam in het Erasmus MC Sophia te Rotterdam, NVvH
  • A.P. (Annette) van der Kaa, kinderfysiotherapeut, werkzaam in het Erasumc MC Sophia te Rotterdam, NVFK en KNGF
  • Drs. A. H. (Agnes) Dommerholt, klinisch psycholoog, werkzaam in het OLVG te Amsterdam, NIP/LVMP (vanaf 1-1-2023)

 Klankbordgroep

  • Drs. J. (Judig) Blaauw, kinderrevalidatiearts, VRA
  • Dr. H. (Hanneke) Bruijnzeel, AIOS, werkzaam in het UMC Utrecht te Utrecht, NVKNO
  • Dr. A.M.J.W. (Anne-Marie) Scheepers, ziekenhuisapotheker, werkzaam in het MUMC te Maastricht, NVZA
  • Dr. S.A. (Sylvia) Obermann-Borst, ervaringsdeskundige ouder & huisarts-epidemioloog, Care4Neo (voorheen Vereniging van Ouders van Couveusekinderen - VOC) 
  • Dr. I.H. (Ilse) Zaal-Schuller, arts voor verstandelijk gehandicapten/kaderarts palliatieve zorg i.o., werkzaam bij Prinsenstichting Purmerend/ AmsterdamUMC locatie AMC, NVAVG
  • M. (Miep) van der Doelen, CliniClowns Nederland (tot 1-9-2023)
  • Dr. E. (Eva) Schaffrath, anesthesioloog, werkzaam in het Maastricht UMC te Maastricht, PROSA Kenniscentrum
  • M. (Mirjam) Jansen op de Haar, HME-MO Vereniging Nederland

 Met ondersteuning van

  • Dr. J. (Janneke) Hoogervorst – Schilp, senior adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Dr. C. (Cécile) Overman, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Dr. T. (Tim) Christen, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Drs. D.A.M. (Danique) Middelhuis, junior adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Drs. M. (Mark) van Eck, junior adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Drs. L. (Liza) van Mun, junior adviseur, Kennisinstituut van de Federatie Medisch Specialisten

Belangenverklaringen

De Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement) hebben gehad. Gedurende de ontwikkeling of herziening van een module worden wijzigingen in belangen aan de voorzitter doorgegeven. De belangenverklaring wordt opnieuw bevestigd tijdens de commentaarfase.

 

Een overzicht van de belangen van (kern)werkgroepleden en klankbordgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Betrokkenen

Functie

Nevenfuncties

Gemelde belangen

Ondernomen actie

Werkgroep

Aarts

Algemeen kinderarts in het Amalia kinderziekenhuissinds november 2017

Interne functies onbetaald: 1. voorzitter Pijn werkgroep Amalia kinderziekenhuis. 2. Verbonden aan werkgroep procedurele sedatie bij kinderen. 3. Implementatie VR in Amalia.
Stage coördinator coschap kindergeneeskunde, tot 01-09-2020 betaalde functie intern. Onderzoek naar effect voor toepassing comfort talk technieken op de polikliniek Amalia. Onbetaald, vanuit betaalbaar beter project VGZ wel financiële ondersteuning gekregen, eenmalig.

Onderzoek naar effect comfort talk technieken; maar eenmalige subsidie gekregen voor uitvoer. Geen extern belang qua uitkomst.

Geen actie

Dommerholt

Klinisch psycholoog KJ, vakgroep kindergeneeskunde OLVG

Praktijk Dommerholt, praktijk voor kinder- en jeugdpsychotherapie, supervisie en doceren. (momenteel inactief).

Lid vakgroep en medische staf, uitvoeren van psychologische diagnostiek en behandeling van kinderen en hun systeem, opleider.

Geen

Geen actie

Elangovan

Universitair medisch specialist Anesthesioloog-pijnspecialist; ErasmusMC

Geen

Geen

Geen actie

Genco

Kinderarts, OLVG, Amsterdam
Unitleider kindergeneeskunde

- Eigenaar Genco Med. Beheer B.V.
- GM BV is 100% aandeelhouder van de VATAN Kliniek B.V.
- dienstbetrekking GencoMed B.V. 0,1 fte, betaald
- voorzitter st. kindersedatie, onbetaald
- congres director PROSA procedurele sedatie en analgese congres, betaald.
- Voorzitter st. ontw. kindergeneeskunde OLVG, onbetaald

Directe belangen bij eigen B.V. maar geen relatie met de bezigheden  van de werkgroep.
Patenthouder van een medisch hulpmiddel voor het verrichten van circancisies, geen relatie met bezigheden van de werkgroep

Bijvangst van het project kan zijn: nieuwe kennis en ervaring om binnen onze organisatie te delen.

Geen actie

Goorhuis

Algemeen kinderarts - acute kindergeneeskunde
Medisch Spectrum Twente Enschede
100%

Geen

Geen

Geen actie

Hissink-Muller

Kinderreumatoloog, Erasmus MC Sophia

 

 

 

Kaa, van der

Kinderfysiotherapeut
Erasmus MC Sophia

-Docent Master Kinderfysiotherapie bij Breederode Hogeschool

- Universitair docent
Erasmus MC (2 uur per week)

-Kinderfysiotherapeut 1e lijn (Fysio van der Linden)

Geen

Geen actie

Keyzer-Dekker

Kinderchirurg Sophia Kinderziekenhuis ErasmusMC te Rotterdam

APLS instructeur SSHK Riel, dagvergoeding

Geen

Geen actie

Kreier

Kinderarts OLVG Amsterdam

Medeauteur en -oprichter “De hamster in je brein”
Faculty en lid wetenschappelijke bijraad PROSA

Geen

Geen actie

Mensink*

kinderanesthesioloog - pijnarts - Prinses Máxima Centrum voor kinderoncologie

Bestuurslid sectie Pijn&palliatieve geneeskunde NVA - onbetaalde functie
sectielid SKA-NVA - onbetaalde functie
voorzitter project Choosing Wisely Opioids NVA - onbetaalde functie
werkgroeplid Verstandig Gebruik Opioiden IVM/NVA/VWS - onbetaalde functie
commissielid programmacommissie Anesthesiologendagen - onbetaalde functie
Auteur richtlijnherziening Palliatieve zorg bij kinderen NVK/NVA - onbetaalde functie

Geen

Geen actie

Neef, de

Verpleegkundig onderzoeker, Kinder IC, Amsterdam UMC

Geen

Geen

Geen actie

Petra Honig-Mazer

Erasmus MC - Sophia Kinderziekenhuis  Afdeling Kinder- en Jeugdpsychiatrie/psychologie Unit Psychosociale Zorg Psychotherapeut BIG                                  

Kleine eigen praktijk: Praktijk voor Psychotherapie Honig-Mazer, betaald

Geen

Geen actie

Renes

Anesthesioloog-pijnspecialist Radboudumc

Kwaliteitsvisitaties Nederlandse Vereniging Anesthesiologie, vacatiegeld
Tijd voor verbinding VMS, vacatiegeld

Geen

Geen actie

Simons

Kinderarts - neonatoloog - klinisch farmacoloog (Universitair Medische Specialist)
Erasmus MC- Sophia

Lid geneesmiddelencommissie Erasmus MC (onbetaald)
Voorzitter pharmacology section European Society Pediatric research (onbetaald)
Lid NKFK (Kinderformularium redactie) (onkostenvergoeding)
Voorzitter Neonatal Pain Special interest group (onbetaald)

Geen

Geen actie

Tissing

Kinderoncoloog, Hoogleraar supportive care in de kinderoncologie. 0.6 fte Prinses Maxima Centrum, 0,4 fte UMCG

PI van onderzoek naar app over invloed van laagdrempelig contact op pijn bij patiënten met kanker.

Geen

Geen actie

Uitzinger

Junior Project manager en beleidsmedewerker Stichting kind en ziekenhuis

Geen

Geen

Geen actie

Vlieger

1. Kinderarts St Antonius ziekenhuis Nieuwegein

1. Les geven via Cure en Care en via het Prinses MAxima Centrum op het gebiedvan hypnose bij kinderen. Dit is betaald.
2. Mede -eigenaar van een klein bedrijfje Skills4Comfort waarbij wij les geven in ziekenhuizen op het gebied van non-farmacologische technieken om het comfort van patienten te verbeteren, mn tijdens procedures. Dit is uiteraard een betaalde functie.
3. Voorzitter Stichting Hypnose bij Kinderen. Dit is onbetaald.
4. Tot een paar maanden geleden was ik ook bestuurslid en mede-oprichter van de stichting Procedureel comfort bij Kinderen (Prosa)

Aangezien ik les geef op het gebied van non-farmacologische methoden om pijn en angst te voorkomen cq te behandelen kan ik daar theoretisch voordeel van ondervinden als nog meer afdelingen hun personeel geschoold wilt hebben in non-farmacologische technieken. in de richtlijn komen uiteraard geen namen van bedrijven te staan, dus ik verwacht geen evident voordeel.

Mijn mede eigenaars van het skills4comfort bedrijf. Overigens loopt dit al heel goed. Iedereen is gelukkig al overtuigd van het belang van het aanleren van positief taalgebruik, afleiden, echt contact maken en een vertrouwensband opbouwen.

Uitsluiten van besluitvorming voor modules over non-farmacologische pijnbestrijding. Mag wel meelezen.

Wildt, de

Kinderarts-intensivist, hoogleraar klinische farmacologie, Radboudumc
Kinderarts-onderzoeker, Erasmus MC (0.1 fte)

Directeur stichting Nederlands Kenniscentrum Farmacotherapie Kinderen (detachering
vanuit Radboudumc, betaald door stichting)
Directeur Kinderformularium BV (detachering vanuit Radboudumc, betaald door stichting)
Voorzitter Medisch Wetenschappelijke Adviesraad Kiddygoodpills (onbetaald)
Bestuurslid NVKFB (onbetaald)
Redactielid NTvG (farmacotherapie sectie, onbetaald)
Directeur PEDMED-NL (kindertrialnetwerk Nederland)
KNAW Van Walraven Fonds, Ter Meulen Fonds commissielid (onbetaald)
FMS Richtlijn Delier (betaald aan Radboudumc, vacatiegelden)

Patent: Gebruik van PENK voor nierfunctiebepaling bij kinderen (aangevraagd).

Bill and Melinda Gates Foundation: model-informed dosing for pediatric dosing
guidelines
EU IMI2 Conect4children: EU wide pediatric clinical trial network Kinderformularium BV heeft als doel, zonder winstoogmerk, om de doseeradviezen
van het Nederlandse kinderformularium, ook beschikbaar te stellen aan
buitenlandse, non profit (!) partijen. Dit gebeurt nu voor Noorwegen, Duitsland en Oostenrijk (overheid/ kinderziekenhuizen) Dit is goedgekeurd door het Min van VWS, de financier van het kinderformularium. De neodose doseringen helpen mee het
kinderformularium beter te maken, en daarmee aantrekkelijk voor andere non-profit partijen om aan te sluiten.

Geen actie

Wulffraat

Hoogleraar kinderimmunologie/reumatologie. UMCU

Voorzitter (coordinator) ERN-RITA (european reference network (onbetaald).

Onze vakgroep heeft zeer veel extern gefinancierd onderzoek. Er is geen direct belang van de financier bij deze richtlijn. Onderzoekslijn chronische pijn bij jeugdreuma is puur academisch. Mensink (aangesteld in PMC) is hier de promovendus. Ik ben de promotor.

Geen actie

 

 

Klankbordgroep

Bruijnzeel

Arts-assistent Keel-, Neus- en Oorheelkunde, UMC Utrecht

Kerngroep Pediatrie (KNO vereniging) - onbetaald
- Commissie PrevENT (KNO vereniging) - onbetaald
- Junior ESPO bestuur - onbetaald

Geen

Geen actie

Scheepers

ziekenhuisapotheker, Maastricht UMC+

Geen

Geen

Geen actie

Obermann-Borst

Coördinator Wetenschap bij Care4Neo 10 u per week
Huisarts - zelfstandige 18 u per week
docent Radboud UMC 8 uur per week

Coördinator Wetenschap bij Care4Neo 75% betaald/25% vrijwillig verzorgen van bijdrage vanuit patientenperspectief aan wetenschap, richtlijnen en kwaliteit van zorg namens de patientenvereniging voor ouders van en voor kinderen die te vroeg, te klein en/of ziek geboren zijn.

Huisarts - zelfstandige 18 u per week betaald
docent Radboud UMC 8uur/week EBM onderwijs bij huisartsopleiding

Geen

Geen actie

Zaal Schuller

Arts voor verstandelijk gehandicapten
Werkgever:
Prinsenstichting (Purmerend): 29 uur per week
Amsterdam UMC loc AMC: 2 uur per week

Arts voor verstandelijk gehandicapten, betaald.

Geen

Geen actie

Schaffrath

Kinderanesthesioloog MUMC

Faculty member PROSA (tegen dagvergoeding)
Spreker op diverse congresses (zonder vergoeding)

Geen

Geen actie

Blaauw

Kinderrevalidatiearts

Geen

Geen

Geen actie

Bruijn, de (interim)
Neemt eenmalig deel 1e kernwerkgroepverg. 6/7/2021

Kinderrevalidatiearts bij Revalidatie Friesland

Lid kwaliteitscommissie VRA (deels betaald, vacatiegeld)
Voorzitter landelijke werkgroep Chronische Pijn en vermoeidheid in de kinderrevalidatie, subwerkgroep van de kindersectie van de VRA (onbetaald)

Geen

Geen actie

Doelen

CliniClown bij stichting CliniClowns 28 uur per week
Onderzoeker bij stichting CliniClowns 8 uur per week, als onderzoeker van CliniClowns commissielid bij project Pijn bij Kinderen.

Bestuurslid theaterproducties Natuurtheater de Kersouwe in Heeswijk Dinther (onbetaald)

Hoofddoel van mijn bijdrage aan de werkgroep is de kennis en ervaring van CliniClowns in te zetten bij het geven van feedback op de gemaakte stukken.

Geen actie

Haar, van der

Freelance consultant Moonshot

Bestuurslid HME-MO Vereniging Nederland

Geen

Geen actie

* Voorzitter

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door afvaardiging van Stichting Kind en Ziekenhuis in de kernwerkgroep en Care4Neo, CliniClowns Nederland en HME-MO Vereniging Nederland in de klankbordgroep. Op verschillende momenten is input gevraagd tijdens een invitational conference en bij het opstellen van het raamwerk. Het verslag van de invitational conference [zie aanverwante producten] is besproken in de werkgroep. De verkregen input is meegenomen bij het opstellen van de uitgangsvragen, de keuze voor de uitkomstmaten en bij het opstellen van de overwegingen. De conceptrichtlijn is tevens voor commentaar voorgelegd aan de patiëntenorganisaties en de eventueel aangeleverde commentaren zijn bekeken en verwerkt.

 

Kwalitatieve raming van mogelijke financiële gevolgen in het kader van de Wkkgz

Bij de richtlijnmodule is conform de Wet kwaliteit, klachten en geschillen zorg (Wkkgz) een kwalitatieve raming uitgevoerd om te beoordelen of de aanbevelingen mogelijk leiden tot substantiële financiële gevolgen. Bij het uitvoeren van deze beoordeling is de richtlijnmodule op verschillende domeinen getoetst (zie het stroomschema op de Richtlijnendatabase).

 

Module

Uitkomst raming

Toelichting

Meetinstrumenten acute pijn bij kinderen

Geen financiële gevolgen

Hoewel uit de toetsing volgt dat de aanbeveling(en) breed toepasbaar zijn (>40.000 patiënten), volgt ook uit de toetsing dat het geen nieuwe manier van zorgverlening of andere organisatie van zorgverlening betreft, het geen toename in het aantal in te zetten voltijdsequivalenten aan zorgverleners betreft en het geen wijziging in het opleidingsniveau van zorgpersoneel betreft. Er worden daarom geen substantiële financiële gevolgen verwacht.

 

Werkwijze

AGREE

Deze richtlijnmodule is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010).

 

Knelpuntenanalyse en uitgangsvragen

Voorafgaand aan de voorbereidende fase is een invitational conference georganiseerd over herkenning en behandeling van pijn binnen de kindzorg. Een verslag hiervan is opgenomen onder aanverwante producten. Daarnaast werd tijdens de voorbereidende fase van de richtlijn een schriftelijke knelpunteninventarisatie gehouden. Op basis van de uitkomsten van de knelpuntenanalyse zijn door de werkgroep concept-uitgangsvragen opgesteld en definitief vastgesteld.

 

Uitkomstmaten

Na het opstellen van de zoekvraag behorende bij de uitgangsvraag inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. Hierbij werd een maximum van acht uitkomstmaten gehanteerd. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

 

Methode literatuursamenvatting

Een uitgebreide beschrijving van de strategie voor zoeken en selecteren van literatuur en de beoordeling van de risk-of-bias van de individuele studies is te vinden onder ‘Zoeken en selecteren’ onder Onderbouwing. De beoordeling van de kracht van het wetenschappelijke bewijs wordt hieronder toegelicht.

 

Beoordelen van de kracht van het wetenschappelijke bewijs

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie https://www.gradeworkinggroup.org/). De basisprincipes van de GRADE-methodiek zijn: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van de bewijskracht per uitkomstmaat op basis van de acht GRADE-domeinen (domeinen voor downgraden: risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias; domeinen voor upgraden: dosis-effect relatie, groot effect, en residuele plausibele confounding).

 

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie, in het bijzonder de mate van zekerheid dat de literatuurconclusie de aanbeveling adequaat ondersteunt (Schünemann, 2013; Hultcrantz, 2017).

 

GRADE

Definitie

Hoog

  • er is hoge zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt;
  • het is zeer onwaarschijnlijk dat de literatuurconclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Redelijk

  • er is redelijke zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt;
  • het is mogelijk dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Laag

  • er is lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt;
  • er is een reële kans dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Zeer laag

  • er is zeer lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt;
  • de literatuurconclusie is zeer onzeker.

 

Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz, 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz, 2017).

 

COSMIN

The COSMIN Risk of Bias tool was used to assess the quality of single studies for each measurement property. Thereby, the worst-score-counts method was used to determine the risk of bias, this means that the lowest rating given in a box determines the final rating, i.e. the quality of the study. The result of each study on a measurement property were rated against the updated criteria for good measurement properties (Table 1). Each result was rated as either sufficient (+), insufficient (–), or indeterminate (?).

 

Table 1. Criteria for good measurement properties (Mokkink, 2018)

Measurement property

Rating[1]

Criteria

Structural validity

+

CTT:

CFA: CFI or TLI or comparable measure >0.95 OR RMSEA <0.06 OR SRMR <0.08[2]

IRT/Rasch:

No violation of unidimensionality[3]: CFI or TLI or comparable measure >0.95 OR RMSEA <0.06 OR SRMR <0.08

AND

no violation of local independence: residual correlations among the items after controlling for the dominant factor < 0.20 OR Q3's < 0.37

AND

no violation of monotonicity: adequate looking graphs OR item scalability >0.30

AND

adequate model fit:

IRT: χ2 >0.01

Rasch: infit and outfit mean squares ≥ 0.5 and ≤ 1.5 OR Z-standardized values > ‐2 and <2

?

CTT: Not all information for ‘+’ reported

IRT/Rasch: Model fit not reported

-

Criteria for ‘+’ not met

Internal consistency

+

At least low evidence[4] for sufficient structural validity[5] AND

Cronbach's alpha(s) ≥ 0.70 for each unidimensional scale or Subscale.[6]

?

Criteria for “At least low evidence for sufficient structural validity” not met

-

At least low evidence4 for sufficient structural validity5 AND

Cronbach’s alpha(s) < 0.70 for each unidimensional scale or Subscale.6

Reliability

+

ICC or weighted Kappa ≥ 0.70

?

ICC or weighted Kappa not reported

-

ICC or weighted Kappa < 0.70

Measurement error

+

SDC or LoA < MIC

?

MIC not defined

-

SDC or LoA > MIC

Hypotheses testing for

construct validity

+

The result is in accordance with the hypothesis[7]

?

No hypothesis defined (by the review team)

-

The result is not in accordance with the hypothesis

Cross‐cultural

validity\measurement

invariance

+

No important differences found between group factors (such as age, gender, language) in multiple group factor analysis OR no important DIF for group factors (McFadden's R2 < 0.02)

?

No multiple group factor analysis OR DIF analysis performed

-

Important differences between group factors OR DIF was found

Criterion validity

+

Correlation with gold standard ≥ 0.70 OR AUC ≥ 0.70

?

Not all information for ‘+’ reported

-

Correlation with gold standard < 0.70 OR AUC < 0.70

Responsiveness

+

The result is in accordance with the hypothesis OR AUC ≥ 0.70

?

No hypothesis defined (by the review team)

-

The result is not in accordance with the hypothesis OR AUC < 0.70

AUC: area under the curve, CFA: confirmatory factor analysis, CFI: comparative fit index, CTT: classical test theory, DIF: differential item functioning, ICC: intraclass correlation coefficient, IRT: item response theory, LoA: limits of agreement, MIC: minimal important change, RMSEA: Root Mean Square Error of Approximation, SEM: Standard Error of Measurement, SDC: smallest detectable change, SRMR: Standardized Root Mean Residuals, TLI = Tucker‐Lewis Index

[1] “+” = sufficient, ” –“ = insufficient, “?” = indeterminate

[2] To rate the quality of the summary score, the factor structures should be equal across studies

[3] unidimensionality refers to a factor analysis per subscale, while structural validity refers to a factor analysis of a (multidimensional) patient‐reported outcome measure

[4] As defined by grading the evidence according to the GRADE approach

[5] This evidence may come from different studies

[6] The criteria ‘Cronbach alpha < 0.95’ was deleted, as this is relevant in the development phase of a PROM and not when evaluating an existing PROM.

[7] The results of all studies should be taken together and it should then be decided if 75% of the results are in accordance with the hypotheses

 

 

The level of evidence of the literature was evaluated as described in the COSMIN user manual for systematic reviews of patient-reported outcome measures (Mokkink, 2018). The following four factors were taken into account: (1) risk of bias (i.e. the methodological quality of the studies), (2) inconsistency (i.e. unexplained inconsistency of results across studies), (3) imprecision (i.e. total sample size of the available studies), and (4) indirectness (i.e. evidence from different populations than the population of interest in the review). The quality of evidence could be downgraded with one level (e.g. from high to moderate evidence) if there is serious risk of bias, with two levels (e.g. from high to low) if there is very serious risk of bias, or with three levels (i.e. from high to very low) if there is extremely risk of bias. The quality of the evidence could be downgraded with one or two levels for inconsistency, imprecision (-1 if total N=50-100; -2 if total N<50) and indirectness.

 

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals aanvullende argumenten uit bijvoorbeeld de biomechanica of fysiologie, waarden en voorkeuren van patiënten, kosten (middelenbeslag), aanvaardbaarheid, haalbaarheid en implementatie. Deze aspecten zijn systematisch vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’ en kunnen (mede) gebaseerd zijn op expert opinion. Hierbij is gebruik gemaakt van een gestructureerd format gebaseerd op het evidence-to-decision framework van de internationale GRADE Working Group (Alonso-Coello, 2016a; Alonso-Coello 2016b). Dit evidence-to-decision framework is een integraal onderdeel van de GRADE-methodiek.

 

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk (Agoritsas, 2017; Neumann, 2016). De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen. De werkgroep heeft bij elke aanbeveling opgenomen hoe zij tot de richting en sterkte van de aanbeveling zijn gekomen.

 

In de GRADE-methodiek wordt onderscheid gemaakt tussen sterke en zwakke (of conditionele) aanbevelingen. De sterkte van een aanbeveling verwijst naar de mate van zekerheid dat de voordelen van de interventie opwegen tegen de nadelen (of vice versa), gezien over het hele spectrum van patiënten waarvoor de aanbeveling is bedoeld. De sterkte van een aanbeveling heeft duidelijke implicaties voor patiënten, behandelaars en beleidsmakers (zie onderstaande tabel). Een aanbeveling is geen dictaat, zelfs een sterke aanbeveling gebaseerd op bewijs van hoge kwaliteit (GRADE gradering HOOG) zal niet altijd van toepassing zijn, onder alle mogelijke omstandigheden en voor elke individuele patiënt.

 

Implicaties van sterke en zwakke aanbevelingen voor verschillende richtlijngebruikers

 

Sterke aanbeveling

Zwakke (conditionele) aanbeveling

Voor patiënten

De meeste patiënten zouden de aanbevolen interventie of aanpak kiezen en slechts een klein aantal niet.

Een aanzienlijk deel van de patiënten zouden de aanbevolen interventie of aanpak kiezen, maar veel patiënten ook niet. 

Voor behandelaars

De meeste patiënten zouden de aanbevolen interventie of aanpak moeten ontvangen.

Er zijn meerdere geschikte interventies of aanpakken. De patiënt moet worden ondersteund bij de keuze voor de interventie of aanpak die het beste aansluit bij zijn of haar waarden en voorkeuren.

Voor beleidsmakers

De aanbevolen interventie of aanpak kan worden gezien als standaardbeleid.

Beleidsbepaling vereist uitvoerige discussie met betrokkenheid van veel stakeholders. Er is een grotere kans op lokale beleidsverschillen. 

 

Organisatie van zorg

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijnmodule is expliciet aandacht geweest voor de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, mankracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van deze specifieke uitgangsvraag zijn genoemd bij de overwegingen. Meer algemene, overkoepelende, of bijkomende aspecten van de organisatie van zorg worden behandeld in de module Organisatie van zorg.

 

Commentaar- en autorisatiefase

De conceptrichtlijnmodule werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijnmodule aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijnmodule werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

 

Referenties

Agoritsas T, Merglen A, Heen AF, Kristiansen A, Neumann I, Brito JP, Brignardello-Petersen R, Alexander PE, Rind DM, Vandvik PO, Guyatt GH. UpToDate adherence to GRADE criteria for strong recommendations: an analytical survey. BMJ Open. 2017 Nov 16;7(11):e018593. doi: 10.1136/bmjopen-2017-018593. PubMed PMID: 29150475; PubMed Central PMCID: PMC5701989.

 

Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ. 2016 Jun 28;353:i2016. doi: 10.1136/bmj.i2016. PubMed PMID: 27353417.

 

Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ. 2016 Jun 30;353:i2089. doi: 10.1136/bmj.i2089. PubMed PMID: 27365494.

 

Brouwers MC, Kho ME, Browman GP, Burgers JS, Cluzeau F, Feder G, Fervers B, Graham ID, Grimshaw J, Hanna SE, Littlejohns P, Makarski J, Zitzelsberger L; AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010 Dec 14;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348; PubMed Central PMCID: PMC3001530.

 

Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017 Jul;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006. Epub 2017 May 18. PubMed PMID: 28529184; PubMed Central PMCID: PMC6542664.

 

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. http://richtlijnendatabase.nl/over_deze_site/over_richtlijnontwikkeling.html

 

Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016 Apr;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017. Epub 2016 Jan 6. Review. PubMed PMID: 26772609.

 

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

 

Schünemann HJ, Oxman AD, Brozek J, Glasziou P, Jaeschke R, Vist GE, Williams JW Jr, Kunz R, Craig J, Montori VM, Bossuyt P, Guyatt GH; GRADE Working Group. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ. 2008 May 17;336(7653):1106-10. doi: 10.1136/bmj.39500.677199.AE. Erratum in: BMJ. 2008 May 24;336(7654). doi: 10.1136/bmj.a139.

 

Schünemann, A Holger J [corrected to Schünemann, Holger J]. PubMed PMID: 18483053; PubMed Central PMCID: PMC2386626.

 

Wessels M, Hielkema L, van der Weijden T. How to identify existing literature on patients' knowledge, views, and values: the development of a validated search filter. J Med Libr Assoc. 2016 Oct;104(4):320-324. PubMed PMID: 27822157; PubMed Central PMCID: PMC5079497.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Volgende:
Meetinstrumenten chronische pijn