Obstructief slaapapneu (OSA) bij kinderen

Initiatief: NVKNO Aantal modules: 27

Diagnostiek door vragenlijsten en korte filmopnames bij kinderen met OSA

Uitgangsvraag

Wat is de waarde van diagnostische vragenlijsten of korte filmopnames vergeleken met anamnese en lichamelijk onderzoek bij de diagnostiek van OSA bij kinderen?

Aanbeveling

Gebruik geen vragenlijsten en smartphone opnames om pediatrisch OSA bij kinderen uit te sluiten teneinde overbehandeling tegen te gaan, vanwege de lage specificiteit.

 

Overweeg de PSQ in te zetten als vragenlijst om met meer zekerheid (matig) pediatrisch OSA te diagnosticeren en het effect op behandeling te evalueren.

 

Overweeg door ouders opgenomen smartphone opnames van hun snurkende kind in te zetten om met meer zekerheid (matig) pediatrisch OSA te diagnosticeren en het effect op behandeling te evalueren. Overweeg hierbij om de Monash kwalificatie te gebruiken.

 

Doe altijd een PSG wanneer er ook verdenking is op andere slaapstoornissen en/of bij kinderen met ernstige comorbiditeiten, of wanneer objectivering van OSA ernst en risicostratificatie en/of effect van OSA behandeling nodig is.

Overwegingen

Voor- en nadelen van de interventie en de kwaliteit van het bewijs

Er is een literatuuronderzoek uitgevoerd naar de diagnostische accuratesse van diagnostische vragenlijsten en smartphone video’s bij het diagnosticeren van OSA aan de hand van de AHI in vergelijking met de referentiestandaard polysomnografie PSG. Drie systematische reviews en vier studies die vragenlijsten onderzocht hebben werden geïncludeerd. Twee systematische reviews en drie studies onderzochten de diagnostische vragenlijst PSQ (Incerti Parenti, 2021; Wu, 2020; Ferry, 2020; Solis, 2022; Umano, 2022). Twee systematische reviews onderzochten de diagnostische vragenlijst OSA-18 (Incerti Parenti, 2021; Wu, 2020). Eén systematische review onderzocht de diagnostische vragenlijsten OSA Score en Severity Score (Patel, 2020) en één studie onderzocht de diagnostische vragenlijst SCR (Mylona, 2022). Uit de resultaten blijkt dat er in de literatuur conflicterende resultaten bestaan met betrekking tot de diagnostische accuratesse van diagnostische vragenlijsten voor het diagnosticeren van OSA bij kinderen.

Er werd één studie gevonden die korte smartphone opnames vergeleek met de uitslag van de PSG (Thomas, 2022). Er werden geen studies gevonden die diagnostische vragenlijsten of video’s gemaakt door ouders vergeleken met anamnese/lichamelijk onderzoek.

 

Er is voor de verschillende diagnostische vragenlijsten bij verschillende AHI-afkappunten (mild, matig en ernstige OSA) gekeken naar de sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde. De werkgroep vindt een hoge specificiteit van de vragenlijsten/smartphone filmpjes het meest belangrijk in de huidige Nederlandse praktijkvoering (zie verder onder overwegingen).

Voor de diagnostische vragenlijst PSQ werd een redelijke sensitiviteit en lage specificiteit gevonden voor milde (AHI< 5) en matige (AHI 5-10) OSA. Voor ernstige OSA (AHI > 10) werd een redelijk tot hoge sensitiviteit gevonden en een lage specificiteit. De PSQ is dus redelijk geschikt om patiënten met OSA te diagnosticeren, maar niet geschikt om patiënten zonder OSA te identificeren. Bij patiënten met een hogere AHI is pediatrisch OSA iets makkelijker te diagnosticeren met de PSQ dan bij patiënten met een lagere AHI.

Voor de diagnostische vragenlijst OSA-18 werd een lage tot redelijke sensitiviteit gevonden, waarbij de sensitiviteit hoger was voor een hogere AHI-waarde. De OSA-18 is dus niet zo geschikt om OSA te diagnosticeren. Daarnaast werd er een lage specificiteit gevonden, wat betekent dat de OSA-18 dus ook niet geschikt is om patiënten zonder OSA te identificeren. Voor de diagnostische vragenlijst OSA Score werd een lage sensitiviteit en een redelijke specificiteit gevonden voor milde en matige OSA. De OSA Score is dus redelijk geschikt om patiënten zonder milde of matige OSA te identificeren, maar niet geschikt om patiënten met milde of matige OSA te diagnosticeren. Er werden geen studies naar de diagnostische accuratesse van de OSA Score voor ernstige OSA gevonden.

Voor de diagnostische vragenlijst Severity Score werd voor milde OSA een lage sensitiviteit en laag tot redelijke specificiteit gevonden. Voor matige OSA werd een lage tot redelijke sensitiviteit en een redelijke specificiteit gevonden. De Severity Score is dus niet geschikt om patiënten met milde of matige OSA te diagnosticeren, maar redelijk geschikt om patiënten zonder milde of matige OSA te identificeren. Er werden geen studies naar de diagnostische accuratesse van de Severity Score voor ernstige OSA gevonden. Voor de SCR (sleep clinical record) werd een hoge sensitiviteit en een lage specificiteit gevonden voor matige OSA. De SCR lijkt dus geschikt om matige OSA te diagnosticeren, maar niet geschikt om patiënten zonder matige OSA te identificeren. Er werden geen studies naar de diagnostische accuratesse van de SCR voor milde en ernstige OSA gevonden.

 

Voor kortdurende (1-2 minuten) smartphone video’s (afkappunt ≥3) werd een sensitiviteit en negatief voorspellende waarde van 100% gevonden voor het diagnosticeren van matig tot ernstige OSA. Er werd een lage specificiteit en positief voorspellende waarde gevonden. Kortdurende smartphone video’s zijn dus geschikt om matig tot ernstige OSA te diagnosticeren, maar deze zijn niet geschikt om patiënten zonder matig tot ernstige OSA te identificeren.

 

Overwegingen

In het literatuuronderzoek zijn vijf vragenlijsten onderzocht op diagnostische accuraatheid: de pediatric sleeping scale (PSQ) volgens Chervin (2007), de OSA-score volgens Brouillette (1984), de Severity Score volgens Spruyt (2012) (inclusief revisie volgens Kadmon (2013)), de OSA 18 vragenlijst volgens Franco (2000) en de Sleep Clinical Record volgens Villa (2013).

 

Belangrijke vraag bij het beoordelen van deze vragenlijsten is wat het doel van de vragenlijst moet zijn. Is dit om te voorkomen dat er geen kinderen met OSA gemist worden (hoge sensitiviteit), of om te voorkomen dat kinderen zonder OSA toch (chirurgisch) behandeld worden (hoge specificiteit)? In de huidige Nederlandse praktijk wordt de diagnose pediatrisch OSA gesteld op basis van anamnese en lichamelijk onderzoek in de spreekkamer, meestal door de KNO-arts. Kinderen zijn hier doorgaans naartoe verwezen door de huisarts en/of door de jeugdgezondheidszorg vanwege de klachten van obstructieve ademhaling in de slaap (snurken, stokkende ademhaling, moeheid overdag etc.). Deze poliklinische inschatting heeft een lage sensitiviteit en lage positief voorspellende waarde op het voorkomen van pediatrisch OSA als voor de diagnose pediatrisch OSA de PSG-waardes wordt gebruikt. De vraag is of gevalideerde vragenlijsten hier meer onderscheidend in kunnen zijn.

 

Bij verdenking op pediatrisch OSA in de spreekkamer zal, in afwezigheid van voorhanden meetinstrumenten, laagdrempelig worden overgegaan tot behandeling. Dit is zeer begrijpelijk: een onbehandeld pediatrisch OSA kan ernstige gevolgen hebben. Het risico bestaat dat er met deze huidige praktijk kinderen behandeld worden terwijl ze geen pediatrisch OSA hebben en dus eigenlijk geen behandeling nodig hebben. De werkgroep acht het dan ook het meest wenselijk dat er een vragenlijst komt met een hoge specificiteit; eentje die kinderen zonder pediatrisch OSA goed kan identificeren opdat zij niet onterecht chirurgisch behandeld worden. Helaas heeft geen enkele onderzochte vragenlijst een goede specificiteit voor de diagnose pediatrisch OSA. Dat betekent dat vragenlijsten geen verhelderende rol spelen in het voorkomen van onnodige behandeling van kinderen zonder pediatrisch OSA als daarvoor strikt naar de PSG-waardes wordt gekeken. Ook voor de door ouders opgenomen smartphone filmpjes geldt een lage specificiteit.

 

De twee vragenlijsten met de hoogste sensitiviteit voor het diagnosticeren van pediatrisch OSA zijn de PSQ en de SCR. Beide vragenlijsten worden ook in de meest recente pediartisch OSA richtlijn van de ERS (European Respiratory Society) genoemd als nuttige vragenlijsten om aanwezigheid van matig OSA waarschijnlijker te maken als PSG niet voorhanden is. (Kaditis, 2015). Beide vragenlijsten hebben de hoogste sensitiviteit voor het voorspellen van matig/ernstig OSA (AHI> 5). De SCR is echter nog weinig onderzocht in validatie studies.

 

De klinische waarde van deze instrumenten valt of staat bij de validiteit van de PSG-meting en in het bijzonder de AHI als de belangrijkste maat en methode om pediatrisch OSA te diagnosticeren. De waarde van de PSG en de AHI om de ernst van symptomen en effect van behandeling te voorspellen is twijfelachtig voor kinderen en volwassenen. Rosen (2015) toonde in de CHAT trial binnen een subpopulatie van 5 tot 9-jarigen met milde obstructieve klachten aan dat de score op de PSQ-vragenlijst een veel betere correlatie heeft met OSA gerelateerde neurocognitieve klachten, slaperigheid overdag en ziekte specifieke kwaliteit van leven dan de waardes die uit de PSG verkregen zijn. Hetzelfde geldt voor de correlatie met verbetering op neurocognitieve klachten, slaperigheid overdag en kwaliteit van leven na adenotonsillectomie: de PSQ heeft een betere correlatie dan de waardes, verkregen met de PSG. Dit kan betekenen dat het incorporeren van gerichte vragenlijsten van waarde is voor het inschatten van de ernst van de OSA en het effect van behandeling (zie module Gradering ernst van OSA bij kinderen.

 

Het gebruik van kortdurende smartphone opnames heeft een hoge sensitiviteit voor het diagnosticeren van matig OSA (oAHI > 5) echter een lage specificiteit en lage positief voorspellende waarde. Wel moet vermeld dat er in de enige studie die dit heeft onderzocht slechts een zeer klein deel van de ouders daadwerkelijk een bruikbaar filmpje heeft aangeleverd. Idealiter dient bij het beoordelen van de smartphone opnames gebruik gemaakt te worden van de door Thomas (2022) beschreven “Monash Obstructive Sleep Apnoea Video Score” (Zie bijlage Tabel Monash score).

 

Waarden en voorkeuren van patiënten (en evt. hun verzorgers)

In de beslissing wel of niet over te gaan tot (chirurgische) behandeling van hun kind zullen ouders geen probleem hebben met het invullen van een korte vragenlijst of het maken van een smartphone filmpje van hun slapende kind en dit mailen naar de betreffende arts. Technisch kan het maken van een filmpje van het slapende kind en daarbij filmen van de snurkende geluiden, ligging, borst- en buikbewegingen en eventuele intrekkingen lastig zijn en in de praktijk zal dit niet altijd bruikbare opnames opleveren, gezien ook het lage aantal ingeleverde filmpjes in de studie van Thomas (2022). Wanneer ervoor gekozen wordt om videobeelden te gebruiken om het slapende kind te kunnen beoordelen is het belangrijk dat ouders/verzorgers een duidelijke instructie krijgen over hoe ze moeten filmen, waar ze de camera op moeten richten en waar ze op moeten letten.

 

Kosten (middelenbeslag)

Klinisch gebruikmaken van gevalideerde vragenlijsten en smartphone opnames is zeer goedkoop, zeker wanneer afgezet tegen de zeer kostbare polysomnografie. In de Nederlandse situatie zullen vragenlijsten en smartphone-opnames niet zozeer de PSG vervangen maar als extra klinische evaluatie kunnen dienen om de waarschijnlijkheid van de diagnose en het positieve effect van behadeling vast te kunnen stellen. Ook voor dit doel zijn de kosten zeer klein.

Gezien de lage specificiteit hebben de vragenlijsten en smartphone filmpjes geen rol in het voorkomen van (chirurgische) behandeling van kinderen die wellicht geen OSA hebben en geen behandeling behoeven.

 

Aanvaardbaarheid, haalbaarheid en implementatie

De vragenlijst, mits beschikbaar in het Nederlands zou eenvoudig geïncorporeerd kunnen worden in de spreekkamer om waarschijnlijkheid van pediatrisch OSA en positief effect van (chirurgische) behandeling te voorspellen.

 

Rationale van de aanbeveling: weging van argumenten voor en tegen de diagnostische procedure

Na evaluatie van bovengenoemde literatuur en overwegingen beveelt de werkgroep aan om de PSQ-vragenlijst en smartphone opnames gemaakt door ouders alleen in te zetten om kinderen met pediatrisch OSA te identificeren, niet om pediatrisch OSA bij kinderen uit te sluiten.

Onderbouwing

De gouden standaard om pediatrisch OSA vast te stellen of uit te sluiten is de klinische polysomnografie. In Nederland is de polysomnografie voor kinderen in verband met kosten en beschikbaarheid niet geschikt om grote groepen te screenen op OSA. Behalve bij geselecteerde patiëntengroepen met een hoge a priori kans op pediatrisch OSA wordt in de dagelijkse praktijk de waarschijnlijkheidsdiagnose obstructieve ademhaling of pediatrisch OSA gesteld op basis van anamnese en lichamelijk onderzoek in de spreekkamer. In de richtlijn uit 2012 is gesteld dat de waarde van anamnese en lichamelijk onderzoek, net als de waarde van vragenlijsten onvoldoende is om de diagnose pediatrisch OSA met zekerheid te stellen. Dit betekent dat in de Nederlandse praktijk veel kinderen behandeld worden voor een verdenking pediatrisch OSA zonder dat er zekerheid is over de diagnose.

Er is in Nederland duidelijk behoefte aan non-invasieve, goedkope middelen om zekerheid over de diagnose pediatrisch OSA te verkrijgen zonder een PSG nodig te hebben. Deze module onderzoekt in hoeverre diagnostische vragenlijsten en korte filmopnames, gemaakt door ouders met een smartphone, van toegevoegde waarde zijn bij de beoordeling van kinderen met een verdenking op pediatrisch OSA.

Questionnaires

Sensitivity

Moderate GRADE

The sensitivity of questionnaires for the diagnosis of mild, moderate, and severe OSA in children with suspected OSA varies between low and medium for the different questionnaires.

The sensitivity of questionnaires for the diagnosis of moderate to severe OSA in children with suspected OSA varies between low and high for the different questionnaires.

The sensitivity of questionnaires for the diagnosis of severe OSA in children with suspected OSA with the use of a questionnaire is medium for the different questionnaires.

 

Source: Ferry, 2020; Incerti Parenti, 2021; Kalyoncu, 2023; Mylona, 2023; Patel, 2020; Solis, 2022; Umano, 2022; Wu, 2020

 

Specificity

Moderate GRADE

The specificity of questionnaires for the diagnosis of mild, moderate, and severe OSA in children with suspected OSA varies between low and medium for the different questionnaires.

The specificity of questionnaires for the diagnosis of moderate to severe OSA in children with suspected OSA varies between low and high for the different questionnaires.

The specificity of questionnaires for the diagnosis of severe OSA in children with suspected OSA is low for the different questionnaires.

 

Source: Ferry, 2020; Incerti Parenti, 2021; Kalyoncu, 2023; Mylona, 2023; Patel, 2020; Solis, 2022; Umano, 2022; Wu, 2020

 

Positive predictive value (PPV)

Moderate GRADE

The PPV of questionnaires for the diagnosis of mild, moderate, and severe OSA in children with suspected OSA varies between low and high for the different questionnaires.

The PPV of questionnaires for the diagnosis of moderate to severe OSA in children with suspected OSA varies between low and medium for the different questionnaires.

The PPV of questionnaires for the diagnosis of severe OSA in children with suspected OSA is low for the different questionnaires.

 

Source: Ferry, 2020; Incerti Parenti, 2021; Kalyoncu, 2023; Mylona, 2023; Patel, 2020; Solis, 2022; Umano, 2022; Wu, 2020

 

Negative predictive value (NPV)

Moderate GRADE

The NPV of questionnaires for the diagnosis of mild, moderate, and severe OSA in children with suspected OSA varies between low and medium for the different questionnaires.

The NPV of questionnaires for the diagnosis of moderate to severe OSA in children with suspected OSA varies between low and high for the different questionnaires.

The NPV of questionnaires for the diagnosis of severe OSA in children with suspected OSA is medium for the different questionnaires.

 

Source: Ferry, 2020; Incerti Parenti, 2021; Kalyoncu, 2023; Mylona, 2023; Patel, 2020; Solis, 2022; Umano, 2022; Wu, 2020

 

Smartphone videos

Sensitivity, negative predictive value

Low

GRADE

The sensitivity and NPV of smartphone videos for the diagnosis of moderate to severe OSA in children with suspected OSA are very high.

 

Source: Thomas, 2022

 

Specificity, positive predictive value

Low

GRADE

The specificity and PPV of smartphone videos for the diagnosis of moderate to severe OSA in children with suspected OSA are low.

 

Source: Thomas, 2022

Description of studies

SRs

Incerti Parenti (2021) performed a systematic review to evaluate the diagnostic accuracy of screening questionnaires for pediatric obstructive sleep apnea (OSA). Both prospective and retrospective studies that met the following inclusion criteria were eligible: the use of any parent answered questionnaire for the screening of OSA in children, participants under eighteen years of age and polysomnography (PSG) employed as the reference standard to confirm the diagnosis of OSA. Exclusion criteria were: the use of any other diagnostic test (e.g., clinical exams, pulse oximetry, electrocardiography, laboratory testing), lack of data to measure sensitivity, specificity, diagnostic odds ratio, positive and negative likelihood ratio of screening questionnaires, and exclusive evaluation of other sleep related problems (e.g., sleepiness, insomnia, narcolepsy, nighttime walking, difficulty to wake up). Studies considered eligible for the qualitative analysis were further selected for subsequent quantitative analysis to the following inclusion criteria: use of the currently accepted diagnostic threshold of AHI ≥1, and questionnaires adopted by at least four studies. PubMed, Scopus, Web of Science and The Cochrane Library were searched until May 2020. In total, thirteen studies considering two questionnaires (PSQ: pediatric sleep questionnaire and OSA-18) were included in the quantitative analysis. Bivariate meta-analysis was performed to calculate sensitivity, specificity, positive/negative likelihood ratios and DOR.

 

Patel (2020) performed a systematic review to assess the diagnostic test accuracy of questionnaire and clinical examination-based scoring tools in the diagnosis of pediatric obstructive sleep apnea (OSA). Studies were eligible for inclusion if they assessed the diagnostic accuracy of a clinical scoring tool for the diagnosis of pediatric OSA (children under the age of eighteen), which can be completed in a single outpatient visit. Exclusion criteria were scoring tools that rely on specialist investigations such as overnight oximetry, invasive tests, or laboratory blood analysis that are not widely available and studies assessing children with craniofacial, neurological, congenital syndromic pathologies, or other complex medical conditions. The reference standard used in the studies had to be overnight, attended PSG. Since interpretation of AHI thresholds vary, any criteria for diagnosis were acceptable, if clearly stated. MEDLINE, Embase, and Cumulative Index to Nursing and Allied Health Literature databases were searched from January 1960 to February 2018. In total, 27 studies considering four questionnaires (OSA Score, Sleep-Related Breathing Disorder Scale (PSQ), Severity Score, and OSA-18) were included in the analysis. Meta-analysis was performed to calculate sensitivity and specificity.

 

Wu (2020) performed a systematic review to compare the pooled sensitivity and specificity of the Pediatric Sleep Questionnaire (PSQ) and the Obstructive Sleep Apnea Questionnaire (OSA-18) according to OSA severity. Original articles that met the following inclusion criteria were eligible: examination of children and adolescents aged one to eighteen years, and assessment of the sensitivity and specificity of the PSQ, OSA-18, and pulse oximetry compared with the AHI (≥1 = mild, ≥5 = moderate, ≥10 = severe) measured through overnight in-laboratory or in-home polysomnography (reference standard). No exclusion criteria were reported. Embase, PubMed and ProQuest Dissertations and Theses A&I were searched from their inception to September 29, 2018. In total, fourteen studies considering PSQ, seven studies considering OSA-18, and eighteen studies considering pulse oximetry were included in the analysis. Meta-regression analysis was performed.

 

Diagnostic studies

Ferry (2020) performed a retrospective chart review to analyze the relationship between a patient’s subjective complaints and the results from the PSG to determine the diagnostic value of the Pediatric Sleep Questionnaire (PSQ) for detecting OSA in children. Patients under the age of eighteen years who were evaluated by a pediatric otolaryngologist for suspected OSA were included in the analysis. In total, 63 patients completed the PSQ and underwent PSG, and were therefore eligible for analysis. The indextest, the PSQ was compared with the reference standard, the PSG, for AHI cut-off values > 1 and > 5. The following relevant diagnostic outcome measures were reported: sensitivity, specificity, positive predictive value, and negative predictive value.

 

Kalyoncu (2023) performed a retrospective diagnostic accuracy study to examine the association between results of polysomnography (PSG) and the Pediatric Sleep Questionnaire (PSQ), and the specificity and sensitivity of the PSQ for OSA in patients with chronic illnesses. Patients performing sleep studies between the ages of 0 and 21 were included (outcome measures calculated for subgroup 2 to 18). No exclusion criteria were reported. In total, 745 patients were included, of whom 588 patients were between 2 and 18 years old. The prevalence of mild OSA was 26.2%, the prevalence of moderate OSA was 9.1%, and the prevalence of severe OSA was 16.2%. The index test, the PSQ, was compared with the reference standard, the PSG, for the oAHI cut-off value ≥5. The following relevant outcome measures were reported: sensitivity, specificity, positive predictive value, and negative predictive value.

 

Mylona (2023) performed a prospective diagnostic accuracy study to determine the best sleep clinical record (SCR) score that could facilitate diagnosis of moderate-to-severe OSA in children with snoring. Children between two and sixteen years old who had snoring and were referred for PSG were included in the analysis. Exclusion criteria were signs of an acute respiratory tract infection, prior AT, or any other treatment interventions for OSA, and a history of craniofacial abnormalities, neuromuscular neurocutaneous or genetic diseases, congenital heart disease, or chronic lung disease. In total, 273 patients were included in the in the analysis. The prevalence of OSA in the population was 17% for moderate or severe OSA, while 83% of the population met the criteria for mild OSA or primary snoring (PS). The index test, the sleep clinical record, was compared with the reference standard, the PSG, for AHI cut-off values ≤5 and > 5. The following relevant outcome measures were reported: sensitivity, specificity, positive predictive value, and negative predictive value.

 

Solis (2022) performed a retrospective cohort study to determine the accuracy of the Pediatric Sleep Questionnaire (PSQ) as a screening tool for obstructive sleep apnea in children with craniofacial anomalies. Children seen for a multidisciplinary evaluation between the ages of two to eighteen years who completed PSQ within nine months of having a full-night, in-laboratory PSG at the university sleep lab were eligible for inclusion. Exclusion criteria were patients with an isolated cleft lip, and those that had an interval surgery between completing the PSQ and obtaining a PSG (children with prior sleep surgery, e.g., adenotonsillectomy, were not excluded). In total, 50 patients were included in the analysis. The prevalence of OSA (AHI ≥5) was 17.6% in children without a syndrome compared to 51.5% in children with a syndrome. The index test, the PSQ, was compared with the reference standard, the polysomnography, for the AHI cut-off value ≥5. The following relevant outcome measures were reported: sensitivity, specificity, positive predictive value, and negative predictive value.

 

Umano (2022) performed a retrospective diagnostic accuracy study to verify the association of PSQ with polysomnographic characteristics in children and adolescents with obesity and to identify a predictive cut-off for severe OSA. Children with obesity (BMI ≥95th for age and sex according to reference charts, and children who presented a pathological score on a sleep questionnaire for OSA screening were eligible. Exclusion criteria were drug consumption and secondary forms of obesity. In total, 60 patients were included in the analysis. The prevalence of mild OSA was 41.1%, the prevalence of moderate OSA was 27.9%, and the prevalence of severe OSA was 22.8%. The remaining 8.2% of the patients had primary snoring. The index test, the PSQ was compared with the reference standard, the polysomnography, for AHI cut-off values 1 < AHI ≤ 5 (mild), 5 > AHI < 10 (moderate), and AHI ≥ 10 (severe). The following relevant outcome measures were reported: sensitivity, specificity, positive predictive value, and negative predictive value.

 

Thomas (2022) developed and tested a standardized scoring system for smartphone videos taken by parents of children with suspected OSA. Parents were asked to take a smartphone video of their children of approximately one to two minutes, capturing the breathing pattern that they were worried about. The authors created and subsequently adjusted the Monash obstructive sleep apnea video score tool to score the videos. Children aged one to sixteen years undergoing polysomnography for suspected OSA were eligible. Exclusion criteria were major medical comorbidities, non-English speaking parents, or parents without an email address to use to submit the video. In total, 43 children were included in the analysis. The prevalence of mild OSA was 32.6% and the prevalence of moderate-severe OSA was 41.9%. The index test, a one to two minute video of the breathing of the child, was compared with the reference standard, the polysomnography. An AHI cut-off value of ≥5 (moderate to severe OSA) was used. The following relevant outcome measures were reported: sensitivity, specificity, positive predictive value, and negative predictive value.

 

Results

Diagnostic accuracy

Sensitivity (important), specificity (critical), positive predictive value (important), negative predictive value (important)

Three systematic reviews (Incerti Parenti, 2021; Patel, 2020; Wu, 2020) and five studies (Ferry, 2020; Kalyoncu, 2023; Mylona, 2023; Solis, 2022; Umano, 2022) reported sensitivity, specificity, positive predictive value, and negative predictive value of the questionnaires PSQ, OSA-18, OSA score, Severity score, and Sleep Clinic Record. The results are presented in Table 1. One study reported sensitivity, specificity, positive predictive value, and negative predictive value of smartphone videos taken by parents.

 

Table 1 – Diagnostic accuracy measures for PSQ, OSA-18, OSA score, Severity score and Sleep Clinic Record

 

Number of patients

Prevalence

AHI/OAI criterion

Sensitivity (%)

Specificity (%)

PPV

NPV

PSQ

AHI ≥1 / AHI ≥1.5 / AHI ≥2 (mild OSA)

Bertran, 2015

83

42.2

> 1

71.4

52.1

52.1

71.4

Chervin, 2007

105

39

≥1

78

72

64

84

Ehsan, 2017

160

48

> 1

81.6

13.1

46.4

43.5

Ferry, 2020

63

65

> 1

83

32

70

50

Ishman, 2016

45

84.4

≥1

82

71

94

42

Li, 2016

235

62

≥1

77.6

86.7

91

71

Longlalerng, 2019

62

59.7

≥1

62

60

69.66

51.59

Øverland, 2019

100

35

≥1

75.6

45.5

43

76

Pabary, 2019

523

 NR

≥1

67.1

38.9

NR

NR

Sproson, 2009

61

79.69

≥1

84.8

16.6

79.96

21.77

Chan, 2012

102

27

> 1.5

50

55

29

75

Ward, 2017 a

68

NR

≥1.5

86

28

NR

NR

Ward, 2017 b

75

NR

≥1.5

63

42

NR

NR

Cielo, 2014

83

53.0

> 2

57

51

57

51

AHI ≥5 (moderate OSA)

Ahmed, 2018

43

51.16

≥5

72.73

61.9

66.67

68.42

Carno, 2008

96

61.5

≥5

84

23

63.54

47.37

Chervin, 2000

82

85

≥5

85 (IP)

87

97.37

50.58

Cielo, 2014

83

27.7

> 5

57

48

30.0

74.0

Ferry, 2020

63

32

> 5

95

30

39

93

Ishman, 2016

45

48.9

≥5

86

38

55.0

75.0

Kalyoncu, 2023

429

9.1

≥5

71.8

40.4

27.6

81.9

Øverland, 2019

100

23

≥5

82.4

37

28

88

Pabary, 2019

523

NR

≥5

71.6

38.5

NR

NR

Pena-Zarza, 2012

98

15

> 5

91

30.2

19

95

Solis, 2022

50

40

≥5

70

40

0.44

0.67

Sproson, 2009

61

31.14

≥5

88.2

17.1

32.48

76.22

Umano, 2022

60

50

> 5

80

100

100

83.33

AHI ≥10 (severe OSA)

Øverland, 2019

100

29

≥10

85.7

31.9

34

85

Pena-Zarza, 2012

98

9

> 10

100

22.7

11

100

OSA-18

AHI ≥1 / AHI ≥1.5 / AHI ≥2 (mild OSA)

Borgstrom, 2013

225

90.22

> 1

55.2

40.9

89.6

9

Huang, 2015

251

NR

> 1

79

77

86

68

Ishman, 2015

79

89.9

≥ 1

54.9

75

95.1

15.8

Kang, 2014

109

71.56

≥ 1

62.8

83.9

90.7

47.3

Mousailidis, 2014

141

62.4

≥ 1

53.4

83

83.9

51.77

Øverland, 2019

100

35

≥ 1

54.7

45.5

35

65

Walter, 2016

216

NR

> 2

95

30

NR

NR

AHI ≥5 (moderate OSA)

Ahmed, 2018

43

51.16

≥ 5

59.09

57.14

59.09

57.14

Borstrom, 2013

225

56.88

≥ 5

59.3

48.5

60.30

47.50

Ishman, 2015

79

59.5

≥ 5

56.3

54.8

65.9

44.7

Øverland, 2019

100

23

≥ 5

58.8

50

26

80

Walter, 2016

216

21.3

> 5

93

25

25.13

92.96

AHI ≥10 (severe OSA)

Ishman, 2015

79

36.7

≥ 10

69

58

48.8

76.3

Øverland, 2019

100

29

≥10

67.9

50.7

36

79

OSA Score

AHI ≥1 / AHI ≥1.5 / AHI ≥2 (mild OSA)

Carroll, 1995

83

42

≥ 1

31.4

87.5

64.7

63.6

Rosen, 1999

326

59

 ≥ 1

46.9

28.4

48.4

27.1

AHI ≥5 (moderate OSA)

Lamm, 1999

23

48

≥ 5

45.5

83.3

71.4

62.5

Severity score

AHI ≥1 / AHI ≥1.5 / AHI ≥2 (mild OSA)

Abumuamar, 2017

179

55

≥ 1.5 (< 13 yr)

 

57.6

51.3

59.4

49.4

Spruyt, 2012

667

NR

≥ 3

59.0

82.9

35.4

92.7

AHI ≥5 (moderate OSA)

Kadmon, 2013

85

16

≥ 5

85.7

63.9

31.6

95.8

Abumuamar, 2017

5

NR

≥ 5 (> 13 yr)

38.4

78.8

64.4

56.1

Nguyen, 2017

96

29

≥ 5

82.1

80.9

63.9

91.7

Sleep Clinical Record

AHI ≥5 (moderate OSA)

Mylona, 2021

273

17

> 5

100

53

30

100

NR = not reported (or could not be calculated)

 

Two systematic reviews presented pooled results for the sensitivity and specificity of the included studies (Incerti Parenti, 2021; Wu, 2020). These results are presented in Table 2. Patel did not report pooled results for the sensitivity and specificity.

 

Table 2 – Pooled sensitivity and specificity in two systematic reviews

 

PSQ AHI ≥ 1

PSQ AHI ≥ 5

PSQ AHI ≥ 10

OSA-18 AHI ≥ 1

OSA-18 AHI ≥ 5

OSA-18 AHI ≥ 10

Incerti Parenti (2021)

 

 

 

 

 

 

Number of studies

4

7

NR

4

4

NR

Number of participants

248

487

NR

554

563

NR

Pooled sensitivity

0.76 (0.65 to 0.84)

0.79 (0.69 to 0.86)

NR

0.56 (0.51 to 0.61)

0.69 (0.45 to 0.85)

NR

Pooled specificity

0.43 (0.27 to 0.60)

0.47 (0.28 to 0.67)

NR

0.73 (0.53 to 0.87)

0.44 (0.31 to 0.58)

NR

Wu (2020)

 

 

 

 

 

 

Number of studies

13

7

2

7

3

2

Number of participants

NR

NR

NR

NR

NR

NR

Pooled sensitivity

0.73 (0.67 to 0.78)

0.80 (0.71 to 0.86)

0.89 (0.75 to 0.97)

0.68 (0.52 to 0.80)

0.69 (0.60 to 0.76)

0.69 (0.55 to 0.80)

Pooled specificity

0.48 (0.35 to 0.61)

0.46 (0.28 to 0.65)

0.26 (0.20 to 0.34)

0.64 (0.46 to 0.79)

0.33 (0.27 to 0.40)

0.53 (0.44 to 0.62)

 

Smartphone videos

Thomas (2022) reported the outcome measures sensitivity, specificity, positive predictive value, and negative predictive value. For a total video score of ≥3, the sensitivity was 100% (95% CI 82 to 100), the specificity was 36% (95% CI 18 to 58), the positive predictive value was 53% (95% CI 35 to 70), and the negative predictive value was 100% (95% CI 66 to 100) to predict moderate-severe OSA.

 

Level of evidence of the literature

Questionnaires

The certainty of the evidence started high, as the evidence originated from a systematic review of diagnostic accuracy studies and diagnostic accuracy studies.

 

Sensitivity, specificity, PPV, NPV

The level of evidence regarding the outcome measures sensitivity, specificity, PPV, and NPV was downgraded by one level because of conflicting results (inconsistency, -1). The level of evidence was therefore graded as moderate.

 

Smartphone videos

The certainty of the evidence started high, as the evidence originated from a diagnostic accuracy study.

 

Sensitivity, specificity, PPV, NPV

The level of evidence regarding the outcome measures sensitivity, specificity, PPV, and NPV was downgraded by two levels because of study limitations (risk of bias, -1) and because of a small population (imprecision, -1). The level of evidence was therefore graded as low.

A systematic review of the literature was performed to answer the following question:

What is the diagnostic accuracy of diagnostic questionnaires compared to anamnesis and physical examination to detect pediatric OSA in children?

 

P (Patients)

Children with suspected OSA

I (Intervention)

Diagnostic questionnaires (OSA score, SRBD scale, Severity score, OSA-18, sleep clinic record), and/or (smartphone) video made by parents + anamnesis and physical examination

C (Comparison)

anamnesis and physical examination

R (Reference)

Type 1 polysomnography (PSG)

O (Outcome)

Diagnostic accuracy (negative predictive value, positive predictive value, sensitivity, specificity)

T/S (Timing and Setting)

In the doctor’s office, after a child has been referred

 

Relevant outcome measures

The guideline development group considered the ability for questionnaires/smartphone videos to rule out pediatric OSA a critical outcome measure for decision making, with true negatives and false negatives as critical outcomes and True positives, false positives, and inconclusive outcomes as important outcomes. Therefore, specificity and negative predictive value are considered critical outcome measures for decision making.

 

Outcome

Consequence

Relevance

True positives (TP)

Patient is correctly diagnosed with OSA, and gets relevant treatment

Important

True negatives (TN)

Patients is correctly not diagnosed with OSA, and will get other diagnostic test to diagnose correct condition

Critical

False positives (FP)

Patient is wrongly diagnosed with OSA, and gets treatment which is not necessary, and symptoms of condition may persist

Important

False negatives (FN)

Patients is wrongly not diagnosed with OSA and does net get relevant treatment and symptoms of OSA may persist or get worse

Critical

Inconclusive outcomes

Patient is subjected to other diagnostic tests, but will get treatment according to the guideline

Important

 

Search and select (Methods)

The databases Medline (via OVID) and Embase (via Embase.com) were searched with relevant search terms until September 25th, 2023. The detailed search strategy is depicted under the tab Methods. The systematic literature search resulted in 479 hits. Studies were selected based on the following criteria: systematic reviews and diagnostic accuracy studies comparing diagnostic questionnaires and/or videos made by parents with physical examination (intervention) and anamnesis (comparison) and/or type 1 polysomnography in children with suspected OSA (reference). In total, 37 studies were initially selected based on title and abstract screening. After reading the full text, 21 studies were excluded (see the table with reasons for exclusion under the tab Methods), and sixteen studies were included. Seven of the sixteen studies were included in the systematic reviews by Incerti Parenti (2021), Patel (2020), and Wu (2020). Therefore, in total, three systematic reviews and six diagnostic test accuracy studies were included.

 

Results

Three systematic reviews and five diagnostic test accuracy studies were included in the analysis of the literature comparing diagnostic questionnaires with type 1 polysomnography. One study was found comparing parental made short smartphone videos with PSG outcome.

No studies on questionnaires or videos made by parents compared with anamnesis and physical examination were found. Important study characteristics and results are summarized in the evidence tables. The assessment of the risk of bias is summarized in the risk of bias tables.

  1. Brouilette R, Hanson D, David R, Klemka L, Szatkowski A, Fernbach S, Hunt C. A diagnostic approach to suspected obstructive sleep apnea in children. J Pediatr. 1984 Jul;105(1):10-4. doi: 10.1016/s0022-3476(84)80348-0. PMID: 6737123.
  2. Chervin RD, Weatherly RA, Garetz SL, Ruzicka DL, Giordani BJ, Hodges EK, Dillon JE, Guire KE. Pediatric sleep questionnaire: prediction of sleep apnea and outcomes. Arch Otolaryngol Head Neck Surg. 2007 Mar;133(3):216-22. doi: 10.1001/archotol.133.3.216. PMID: 17372077.
  3. Ferry AM, Wright AE, Ohlstein JF, Khoo K, Pine HS. Efficacy of a Pediatric Sleep Questionnaire for the Diagnosis of Obstructive Sleep Apnea in Children. Cureus. 2020 Dec 23;12(12):e12244. doi: 10.7759/cureus.12244. PMID: 33500863; PMCID: PMC7819429.
  4. Franco RA Jr, Rosenfeld RM, Rao M. First place--resident clinical science award 1999. Quality of life for children with obstructive sleep apnea. Otolaryngol Head Neck Surg. 2000 Jul;123(1 Pt 1):9-16. doi: 10.1067/mhn.2000.105254. PMID: 10889473.
  5. Incerti Parenti S, Fiordelli A, Bartolucci ML, Martina S, D'Antò V, Alessandri-Bonetti G. Diagnostic accuracy of screening questionnaires for obstructive sleep apnea in children: A systematic review and meta-analysis. Sleep Med Rev. 2021 Jun;57:101464. doi: 10.1016/j.smrv.2021.101464. Epub 2021 Mar 11. PMID: 33827032.
  6. Kaditis AG, Alonso Alvarez ML, Boudewyns A, Alexopoulos EI, Ersu R, Joosten K, Larramona H, Miano S, Narang I, Trang H, Tsaoussoglou M, Vandenbussche N, Villa MP, Van Waardenburg D, Weber S, Verhulst S. Obstructive sleep disordered breathing in 2- to 18-year-old children: diagnosis and management. Eur Respir J. 2016 Jan;47(1):69-94. doi: 10.1183/13993003.00385-2015. Epub 2015 Nov 5. PMID: 26541535.
  7. Kadmon G, Shapiro CM, Chung SA, Gozal D. Validation of a pediatric obstructive sleep apnea screening tool. Int J Pediatr Otorhinolaryngol. 2013 Sep;77(9):1461-4. doi: 10.1016/j.ijporl.2013.06.009. Epub 2013 Jul 6. PMID: 23838544.
  8. Mylona AM, Rapti G, Vavougios G, Lachanas VA, Liakos P, Skoulakis C, Kaditis AG, Gourgoulianis K, Alexopoulos EI. Accuracy of the sleep clinical record for the diagnosis of pediatric moderate-to-severe obstructive sleep apnea syndrome. Sleep Breath. 2022 Jun;26(2):763-769. doi: 10.1007/s11325-021-02471-4. Epub 2021 Aug 8. PMID: 34365608.
  9. Patel AP, Meghji S, Phillips JS. Accuracy of clinical scoring tools for the diagnosis of pediatric obstructive sleep apnea. Laryngoscope. 2020 Apr;130(4):1034-1043. doi: 10.1002/lary.28146. Epub 2019 Jun 24. PMID: 31233218.
  10. Rosen CL, Wang R, Taylor HG, Marcus CL, Katz ES, Paruthi S, Arens R, Muzumdar H, Garetz SL, Mitchell RB, Jones D, Weng J, Ellenberg S, Redline S, Chervin RD. Utility of symptoms to predict treatment outcomes in obstructive sleep apnea syndrome. Pediatrics. 2015 Mar;135(3):e662-71. doi: 10.1542/peds.2014-3099. Epub 2015 Feb 9. Erratum in: Pediatrics. 2016 Apr;137(4): PMID: 25667240; PMCID: PMC4338327.
  11. Solis RN, Aulakh SS, Velazquez-Castro OS, Farber NI, Olarewaju AM, Nandalike K, Tollefson TT, Senders CW, Funamura JL. Utility of Screening for Obstructive Sleep Apnea with the Pediatric Sleep Questionnaire (PSQ) in Children with Craniofacial Anomalies. Cleft Palate Craniofac J. 2022 Dec 26:10556656221147815. doi: 10.1177/10556656221147815. Epub ahead of print. PMID: 36572962.
  12. Spruyt K, Gozal D. Screening of pediatric sleep-disordered breathing: a proposed unbiased discriminative set of questions using clinical severity scales. Chest. 2012 Dec;142(6):1508-1515. doi: 10.1378/chest.11-3164. PMID: 22677350; PMCID: PMC3515026.
  13. Thomas RJ, Dalton S, Harman K, Thacker J, Horne RSC, Davey MJ, Nixon GM. Smartphone videos to predict the severity of obstructive sleep apnoea. Arch Dis Child. 2022 Feb;107(2):148-152. doi: 10.1136/archdischild-2020-320752. Epub 2021 Jul 8. PMID: 34244163.
  14. Umano GR, Rondinelli G, Luciano M, Pennarella A, Aiello F, Mangoni di Santo Stefano GSRC, Di Sessa A, Marzuillo P, Papparella A, Miraglia Del Giudice E. Pediatric Sleep Questionnaire Predicts Moderate-to-Severe Obstructive Sleep Apnea in Children and Adolescents with Obesity. Children (Basel). 2022 Aug 27;9(9):1303. doi: 10.3390/children9091303. PMID: 36138612; PMCID: PMC9497855.
  15. Villa MP, Paolino MC, Castaldo R, Vanacore N, Rizzoli A, Miano S, Del Pozzo M, Montesano M. Sleep clinical record: an aid to rapid and accurate diagnosis of paediatric sleep disordered breathing. Eur Respir J. 2013 Jun;41(6):1355-61. doi: 10.1183/09031936.00215411. Epub 2012 Sep 27. PMID: 23018902.
  16. Wu CR, Tu YK, Chuang LP, Gordon C, Chen NH, Chen PY, Hasan F, Kurniasari MD, Susanty S, Chiu HY. Diagnostic meta-analysis of the Pediatric Sleep Questionnaire, OSA-18, and pulse oximetry in detecting pediatric obstructive sleep apnea syndrome. Sleep Med Rev. 2020 Dec;54:101355. doi: 10.1016/j.smrv.2020.101355. Epub 2020 Jul 15. PMID: 32750654.

Evidence table for systematic reviews of diagnostic test accuracy studies 

Study reference

Study characteristics

Patient characteristics

 

Index test

(test of interest)

Reference test

 

Follow-up

Outcome measures and effect size

Comments

Incerti Parenti, 2021

 

Individual study characteristics deduced from Incerti Parenti, 2021

 

 

SR and meta-analysis

 

Literature search up to May 2020

 

A: Ahmed, 2018

B: Bertran, 2015

C: Borgstrom, 2013

D: Carno, 2008

E: Chervin, 2000

F: Cielo, 2014

G: Ishman, 2015

H: Ishman, 2016

I: Kang, 2012

J: Longlalerng, 2018

K: Mousailidis, 2014

L: Sproson, 2009

M: Walter, 2015

 

Study design: Systematic review of cohort studies (diagnostic test accuracy studies)

 

Setting and Country:

University of Bologna, Italy

 

Source of funding and conflicts of interest:

No funding and no conflicts of interest.

 

 

Inclusion criteria SR:

Prospective and retrospective studies: use of any parent answered questionnaire for the screening of OSA in children, participants under 18 y of age, PSG employed as the reference standard to confirm the diagnosis of OSA. Further selection (quantitative analysis): use of the currently accepted diagnostic threshold of AHI ≥1, questionnaires adopted by at least four studies.

 

Exclusion criteria SR: use of any other diagnostic tests (clinical exams, pulse oximetry, electrocardiography, laboratory testing), lack of data to measure sensitivity, specificity, diagnostic odds ratio, positive and negative likelihood ratio of screening questionnaires, exclusive evaluation of other sleep related problems, low quality studies and small sample size (less than 30 participants).

 

13 studies included in this analysis

 

Important patient characteristics:

See Table 1 Description of studies includedin the qualitative analysis - Incerti Parenti (2021)

Describe index and comparator tests* and

cut-off point(s):

Diagnostic questionnaires (PSQ, OSA-18). See table 1 in Results.

Describe reference test and cut-off point(s): polysomnography. See table 1 in Results

 

Prevalence (%)

[based on refence test at specified cut-off point]

See table 1 in Results.

 

For how many participants were no complete outcome data available?

If outcome data were unavailable in the included studies, they were computed using the available outcome data.

 

Endpoint of follow-up:

Not reported.

Outcome measures and effect size (include 95% CI and p-value if available):

 

Sensitivity, specificity, PPV, NPV

See table 1 in Results or Table 2 (AHI ≥1), Table 3 (AHI ≥5), Table 4 (pooled results for sensitivity and specificity) in SR of Incerti Parenti (2021).

 

Pooled characteristic [‘type of statistical analysis’ e.g., bivariate analysis] per index test and cut-off point:

PSQ (AHI ≥1)

-Sensitivity: 0.76 [95% CI 0.65 to 0.84]

-Specificity: 0.43 [95% CI 0.27 to 0.60]

PSQ (AHI ≥5)

-Sensitivity: 0.79 [95% CI 0.69 to 0.86]

-Specificity: 0.47 [95% CI 0.28 to 0.67]

OSA-18 (AHI ≥1)

-Sensitivity: 0.56 [95% CI 0.51 to 0.61]

-Specificity: 0.73 [95% CI 0.53 to 0.87]

OSA-18 (AHI ≥5)

-Sensitivity: 0.69 [95% CI 0.45 to 0.85]

-Specificity: 0.44 [95% CI 0.31 to 0.58]

 

 

 

Study quality (ROB):

Quality assessment of diagnostic accuracy studies (QUADAS-2) used. No studies were judged at high risk of bias (see Fig 2 Incerti Parenti 2021).

 

Place of the index test in the clinical pathway:

Triage/replacement

 

Choice of cut-off point:

AHI ≥1

AHI ≥5

 

Heterogeneity:

Significant heterogeneity due to different population conditions and large OSA prevalence range in study population and large age range.

 

 

 

Patel, 2020

 

Individual study characteristics deduced from Patel, 2020

Systematic review

 

Literature search from January 1960 up to February 2018

 

A: Abumuamar, 2017

B: Caroll, 1995

C: Kadmon, 2013

D: Lamm, 1999

E: Nguyen, 2017

F: Rosen, 1999

G: Spruyt, 2012

 

Study design: Systematic review of cohort studies (diagnostic test accuracy studies)

 

Setting and Country:

Department of Ear, Nose and Throat Surgery, Cambridge University, Cambridge, United Kingdom

 

Source of funding and conflicts of interest:

No funding and no conflicts of interest.

Inclusion criteria SR:

assessed the diagnostic accuracy of a clinical scoring tool for the diagnosis of pediatric OSA (children under the age of eighteen), which can be completed in a single outpatient visit.

 

Exclusion criteria SR:

scoring tools that rely on specialist investigations such as overnight oximetry, invasive tests, or laboratory blood analysis that are not widely available and studies assessing children with craniofacial, neurological, congenital syndromic pathologies, or other complex medical conditions

 

7 studies included in this analysis

 

Important patient characteristics:

See Table 1 Study details for four commonly used scoring tools – Patel (2020)

 

 

 

 

Describe index and comparator tests* and

cut-off point(s):

Diagnostic questionnaires (PSQ and OSA-18). See table 1 in Results.

Describe reference test and cut-off point(s): polysomnography. See table 1 in Results.

 

Prevalence (%)

[based on refence test at specified cut-off point]

See table 1 in Results.

 

For how many participants were no complete outcome data available?

Where possible, raw data were requested such that 95% Cis could be calculated.

Endpoint of follow-up:

Not reported.

Outcome measures and effect size (include 95% CI and p-value if available):

 

Sensitivity, specificity, PPV, NPV

See table 1 in Results or Table 1 Study details for four commonly used scoring tools (Patel, 2020).

 

 

Study quality (ROB):

Quality assessment of diagnostic accuracy studies (QUADAS-2) used (see Fig 3 Patel, 2020).

 

Place of the index test in the clinical pathway:

Triage/replacement

 

Choice of cut-off point:

AHI ≥1

AHI ≥1.5

AHI ≥3

AHI ≥5

 

Heterogeneity:

Heterogeneity due to different population cohorts (country of origin, age of children, referral criteria, underlying prevalence of OSA) and variable thresholds of AHI used for diagnosis of OSA.

 

Wu, 2020

 

Individual study characteristics deduced from Wu, 2020

Systematic review and meta-analysis

 

Literature search up to January 11, 2020

 

A: Chan, 2012

B: Chervin, 2007

C: Ehsan, 2017

D: Li, 2016

E: Overland, 2019

F: Pabary, 2019

G: Pena-Zarza, 2012

H: Ward, 2017

 

Study design: Systematic review of cohort studies (diagnostic test accuracy studies)

 

Setting and Country:

Taipei Medical University, Taipei, Taiwan

 

Source of funding and conflicts of interest:

Source of funding not reported. No conflicts of interest.

Inclusion criteria SR:

examination of children and adolescents aged one to eighteen years, and assessment of the sensitivity and specificity of the PSQ, OSA-18, and pulse oximetry compared with the AHI (≥1 = mild, ≥5 = moderate, ≥10 = severe) measured through overnight in-laboratory or in-home polysomnography (reference standard)


Exclusion criteria SR:

None reported.

 

8 studies included in this analysis

 

Important patient characteristics:

See Table 1 Characteristics of included studies in investigating the PSQ, OSA-18, and Pulse oximetry – Wu 2020

 

Describe index and comparator tests* and

cut-off point(s):

Diagnostic questionnaires (PSQ and OSA-18). See table 1 in Results.

Describe reference test and cut-off point(s): polysomnography. See table 1 in Results.

 

Prevalence (%)

[based on refence test at specified cut-off point]

See table 1 in Results.

 

For how many participants were no complete outcome data available?

Not reported.

Endpoint of follow-up:

Not reported.

Outcome measures and effect size (include 95% CI and p-value if available):

 

Sensitivity, specificity, PPV, NPV

See table 1 in Results or Table 1 (pooled sensitivity and specificity) in Wu (2020).

 

Pooled characteristic [‘type of statistical analysis’ e.g., bivariate analysis] per index test and cut-off point:

PSQ (AHI ≥1)

-Sensitivity: 0.73 [95% CI 0.67 to 0.78]

-Specificity: 0.48 [95% CI 0.35 to 0.61]

PSQ (AHI ≥5)

-Sensitivity: 0.80 [95% CI 0.71 to 0.86]

-Specificity: 0.46 [95% CI 0.28 to 0.65]

PSQ (AHI ≥10)

-Sensitivity: 0.89 [95% CI 0.75 to 0.97]

-Specificity: 0.26 [95% CI 0.20 to 0.34]

OSA-18 (AHI ≥1)

-Sensitivity: 0.68 [95% CI 0.52 to 0.80]

-Specificity: 0.64 [95% CI 0.46 to 0.79]

OSA-18 (AHI ≥5)

-Sensitivity: 0.69 [95% CI 0.60 to 0.76]

-Specificity: 0.33 [95% CI 0.27 to 0.40]

OSA-18 (AHI ≥10)

-Sensitivity: 0.69 [95% CI 0.55 to 0.80]

-Specificity: 0.53 [95% CI 0.44 to 0.62]

Study quality (ROB):

Quality assessment of diagnostic accuracy studies (QUADAS-2) used (see Supplementary Table S5, Wu 2020).

 

Place of the index test in the clinical pathway:

Triage/replacement

 

Choice of cut-off point:

AHI ≥1

AHI ≥5

AHI ≥10

 

Heterogeneity:

Significant study heterogeneity (see Table S9, Wu 2020)

 

Sensitivity analysis:

Sensitivity and specificity remained unchanged for both PSQ and OSA-18 after exclusion of studies using a different cut-off value.

 

*Comparator test equals the C of the PICO; two or more index/ comparator tests may be compared; note that a comparator test is not the same as a reference test (golden standard)

 

Evidence table for diagnostic test accuracy studies

Study reference

Study characteristics

Patient characteristics

 

Index test

(test of interest)

Reference test

 

Follow-up

Outcome measures and effect size

Comments

Ferry, 2020

Type of study:

retrospective chart review

 

Setting and country: University of Texas Medical Branch at Galveston (UTMB), USA

 

Funding and conflicts of interest: No financial support and no conflict of interest declared.

Inclusion criteria:

Patients under the age of 18 years who were evaluated by a pediatric otolaryngologist for suspected OSA.

 

Exclusion criteria:

Not reported.

 

N=63

 

Prevalence: 65%

 

Mean age ± SD:

Not reported.

 

Sex: % M / % F:

Not reported.

Describe index test:

The Pediatric Sleep Questionnaire (PSQ) to predict sleep-related breathing disorders. Answer choices included “yes”, “no”, or “don’t know”.

 

Cut-off point(s):

Questionnaire scores > 33% were deemed positive.

 

Comparator test:

Not applicable.

 

Cut-off point(s):

Not applicable.

Describe reference test:

Polysomnography (PSG).

 

Cut-off point(s):

> 1 AHI < 5 (mild)

> 5 AHI < 10 (moderate)

 

 

Time between the index test and reference test:

Not reported.

Pre-operative PSQ scores compared with PSG.

 

For how many participants were no complete outcome data available?

98 (61%)

 

Reasons for incomplete outcome data described?

PSG or PSQ not completed.

Sensitivity:

AHI > 1: 0.83

AHI > 5: 0.95

 

Specificity:

AHI > 1: 0.32

AHI > 5: 0.30

 

Positive predictive value:

AHI > 1: 0.70

AHI > 5: 0.39

 

Negative predictive value:

AHI > 1: 0.50

AHI > 5: 0.93

 

 

 

Kalyoncu, 2023

Type of study: retrospective diagnostic accuracy study

 

Setting and country:

Pediatric Pulmonology Division of Marmara University, Istanbul, Turkey

 

Funding and conflicts of interest:

No funding, no competing interests.

Inclusion criteria:

Patients performing sleep studies between the ages of 0 and 21 were included (outcome measures calculated for subgroup 2 to 18).

 

Exclusion criteria:

Not reported.

 

N=745

 

Prevalence:

The prevalence of mild OSA was 26.2%, the prevalence of moderate OSA was 9.1%, and the prevalence of severe OSA was 16.2%.

 

Age median (25-27p) in months:

81 (34-151)

 

Sex: % M:

462 (62)

Index test:

The Pediatric Sleep Questionnaire (PSQ) to predict sleep-related breathing disorders. Answer choices included “yes”, “no”, or “don’t know”.

 

Cut-off point(s):

Questionnaire scores > 33% were deemed positive.

 

Comparator test:

Not applicable.

 

Cut-off point(s):

Not applicable.

Describe reference test:

Polysomnography (PSG).

 

Cut-off point(s):

≥5 AHI (moderate)

Time between the index test and reference test:

Not reported.

 

For how many participants were no complete outcome data available?

159 (27.1%)

 

Reasons for incomplete outcome data described?

PSQ not completed.

Sensitivity:

AHI ≥5: 71.8

 

Specificity:

AHI ≥5: 40.4

 

Positive predictive value:

AHI ≥5: 27.6

 

Negative predictive value:

AHI ≥5: 81.9

Children with complex chronic diseases.

Mylona, 2022

Type of study:

Prospective diagnostic test accuracy study

 

Setting and country:

The Larissa University Hospital, Larissa, Greece

 

Funding and conflicts of interest: Sources of funding were not reported. The authors declare no competing interests.

Inclusion criteria:

Children between two and sixteen years old who had snoring and were referred for PSG.

 

Exclusion criteria:

signs of an acute respiratory tract infection, prior AT, or any other treatment interventions for OSA, and a history of craniofacial abnormalities, neuromuscular neurocutaneous or genetic diseases, congenital heart disease, or chronic lung disease.

 

N=273

 

Prevalence:

Moderate or severe OSA: 17%, mild OSA or primary snoring: 83%.

 

Mean age ± SD:

AHI ≤5: 6.3 ± 2.4

AHI > 5: 6.4 ± 3.3

 

Sex: % M:

AHI ≤5: 134 (58%)

AHI > 5: 22 (52%)

Describe index test:

Sleep clinical record (SCR): physical examination findings, patients’ subjective symptoms and features of inattention and hyperactivity.

 

Cut-off point(s):

Not reported.

 

Comparator test:

Not applicable.

 

Cut-off point(s):

Not applicable.

Describe reference test:

Laboratory polysomnography (PSG).

 

Cut-off point(s):

AHI > 5 (moderate to severe OSA)

Time between the index test and reference test:

Same day.

 

For how many participants were no complete outcome data available?

Not reported.

 

Reasons for incomplete outcome data described?

Not reported.

Outcome measures and effect size (include 95% CI and p-value if available)4:

 

Sensitivity:

AHI > 5: 100

 

Specificity:

AHI > 5: 53

 

Positive predictive value:

AHI > 5: 30

 

Negative predictive value:

AHI > 5: 100

 

 

Solis, 2022

Type of study:

Retrospective cohort study

 

Setting and country:

Multidisciplinary cleft and craniofacial clinic at a tertiary care center, California, USA.

 

Funding and conflicts of interest: The authors received no financial support for the research, authorship and/or publication of this article. Nothing reported about conflicts of interest.

Inclusion criteria:

Children seen for a multidisciplinary evaluation between the ages of two to eighteen years who completed PSQ within nine months of having a full-night, in-laboratory PSG at the university sleep lab.

 

Exclusion criteria:

isolated cleft lip, and those that had an interval surgery between completing the PSQ and obtaining a PSG.

 

N=50

 

Prevalence:

AHI ≥5: 17.6% (children without syndrome)

AHI ≥5: 51.5% (children with syndrome)

 

Mean age ± SD:

9.6 ± 4.0

 

Sex: % F:

25 (50%)

Describe index test:

The Pediatric Sleep Questionnaire (PSQ): 22 yes or no questions related to the symptoms of OSA.

 

Cut-off point(s):

A score of ≥ 0.33 was a positive screen.

 

Comparator test:

Not applicable.

 

Cut-off point(s):

Not applicable.

 

Describe reference test:

Full-night, in-laboratory polysomnography.

 

Cut-off point(s):

AHI ≥5

 

Time between the index test en reference test:

Completion of PSQ within 9 months of PSG.

 

For how many participants were no complete outcome data available?

Not reported.

 

Reasons for incomplete outcome data described?

Not reported.

Outcome measures and effect size (include 95% CI and p-value if available)4:

 

Sensitivity:

AHI ≥5: 0.70

 

Specificity:

AHI ≥5: 0.40

 

Positive predictive value:

AHI ≥5: 0.44

 

Negative predictive value:

AHI ≥5: 0.67

 

 

 

 

Umano, 2022

Type of study:

Retrospective diagnostic accuracy study

 

Setting and country:

Pediatric unit of the University of Campania, Italy.

 

Funding and conflicts of interest:

No external funding, no conflicts of interest declared.

Inclusion criteria:

Children with obesity (BMI ≥95th for age and sex according to reference charts, and children who presented a pathological score on a sleep questionnaire for OSA screening.

 

Exclusion criteria:

drug assumption and secondary forms of obesity.

 

N=60

 

Prevalence:

Mild OSA: 41.1%

Moderate OSA: 27.9%

Severe OSA: 22.8%

 

Mean age ± SD:

11 (9.2-14)

 

Sex: % M:

54.1%

Describe index test:

Pediatric sleep questionnaire (PSQ) (for moderate to severe OSA diagnosis).

 

Cut-off point(s):

≥0.33 indicative for OSA.

 

Comparator test:

Not applicable.

 

Cut-off point(s):

 Not applicable.

Describe reference test:

Cardiorespiratory polygraphy (nasal airflow, oral airflow, oximetry, respiratory thoracic and abdominal muscle activity, and electrocardiogram).

 

Cut-off point(s):

Mild: 1 < AHI ≤5

Moderate: 5 > AHI < 10

Severe: ≥10

 

Time between the index test and reference test:

Not reported.

 

For how many participants were no complete outcome data available?

Not reported.

 

Reasons for incomplete outcome data described?

Not reported.

Sensitivity:

AHI > 5: 80

 

Specificity:

AHI > 5: 100

 

Positive predictive value:

AHI > 5: 100

 

Negative predictive value:

AHI > 5: 83.33

 

Thomas, 2022

Type of study:

Prospective diagnostic accuracy study

 

Setting and country:

Melbourne Children’s Sleep Centre, Monash Children’s Hospital, Clayton, Victoria, Australia.

 

Funding and conflicts of interest:

Supported by Equity Trustees, no competing interests declared.

Inclusion criteria:

Children aged one to sixteen years undergoing polysomnography for suspected OSA were eligible.

 

Exclusion criteria:

major medical comorbidities, non-English speaking parents, or parents without an email address to use to submit the video.

 

N=43

 

Prevalence:

The prevalence of mild OSA was 32.6% and the prevalence of moderate-severe OSA was 41.9%.

 

Mean age median (range):

5.7 (2.7-14.0)

 

Sex % M:

65%

A smartphone video made by parents of their children of approximately one to two minutes, capturing the breathing pattern that they were worried about.

 

Cut-off (highest sensitivity): ≥3

Overnight polysomnography

 

Cut off: ≥5 (moderate-severe OSA)

 

Time between the index test and reference test:

Maximum of one week between video and PSG.

 

For how many participants were no complete outcome data available?

n=16

-video low quality (n=15)

-inadequate PSG (n=1)

 

 

Sensitivity:

100%

 

Specificity:

36%

 

Positive predictive value:

53%

 

Negative predictive value:

100%

 

 

 Risk of bias tables

Table of quality assessment for systematic reviews of diagnostic studies

Based on AMSTAR checklist (Shea, 2007, BMC Methodol 7: 10; doi:10.1186/1471-2288-7-10) and PRISMA checklist (Moher, 2009, PLoS Med 6: e1000097; doi:10.1371/journal.pmed1000097)

Study

 

 

 

 

First author, year

Appropriate and clearly focused question?1

 

 

 

Yes/no/unclear

Comprehensive and systematic literature search?2

 

 

 

Yes/no/unclear

Description of included and excluded studies?3

 

 

 

Yes/no/unclear

Description of relevant characteristics of included studies?4

 

 

Yes/no/unclear

Assessment of scientific quality of included studies?5

 

 

Yes/no/unclear

Enough similarities between studies to make combining them reasonable?6

 

Yes/no/unclear

Potential risk of publication bias taken into account?7

 

 

Yes/no/unclear

Potential conflicts of interest reported?8

 

 

 

Yes/no/unclear

Incerti Parenti, 2021

Yes

Yes

Yes

Yes

Yes

Unclear

No

Yes

Patel, 2020

Yes

Yes

No

Yes

Yes

Unclear

No

Yes

Wu, 2020

Yes

Yes

Yes

Yes

Yes

Unclear

Yes

Yes

 

Table of quality assessment for diagnostic accuracy studies

Study reference

Patient selection

 

 

Index test

Reference standard

Flow and timing

Comments with respect to applicability

Ferry, 2020

Was a consecutive or random sample of patients enrolled?

Unclear

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: LOW

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: UNCLEAR

Mylona, 2022

 

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Unclear

 

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Yes

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: LOW

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: LOW

Solis, 2022

 

Was a consecutive or random sample of patients enrolled?

Unclear

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

No

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

 

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: HIGH

Umano, 2022

Was a consecutive or random sample of patients enrolled?

Unclear

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

 

 

Is the reference standard likely to correctly classify the target condition?

Unclear

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

Yes

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: UNCLEAR

Thomas, 2022

Was a consecutive or random sample of patients enrolled?

Yes

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Yes

 

If a threshold was used, was it pre-specified?

No

 

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Yes

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

No

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: LOW

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: HIGH

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: HIGH

Kalyoncu, 2023

Was a consecutive or random sample of patients enrolled?

Unclear

 

Was a case-control design avoided?

Yes

 

Did the study avoid inappropriate exclusions?

Yes

 

 

Were the index test results interpreted without knowledge of the results of the reference standard?

Unclear

 

If a threshold was used, was it pre-specified?

Yes

 

Is the reference standard likely to correctly classify the target condition?

Yes

 

Were the reference standard results interpreted without knowledge of the results of the index test?

Unclear

 

 

 

Was there an appropriate interval between index test(s) and reference standard?

Unclear

 

Did all patients receive a reference standard?

Yes

 

Did patients receive the same reference standard?

Yes

 

Were all patients included in the analysis?

No

Are there concerns that the included patients do not match the review question?

No

 

Are there concerns that the index test, its conduct, or interpretation differ from the review question?

No

 

Are there concerns that the target condition as defined by the reference standard does not match the review question?

No

 

 

CONCLUSION:

Could the selection of patients have introduced bias?

 

 

RISK: UNCLEAR

CONCLUSION:

Could the conduct or interpretation of the index test have introduced bias?

 

RISK: UNCLEAR

CONCLUSION:

Could the reference standard, its conduct, or its interpretation have introduced bias?

 

RISK: UNCLEAR

CONCLUSION

Could the patient flow have introduced bias?

 

 

RISK: HIGH

 

Table of excluded studies

Reference

Reason for exclusion

Bannink N, Maliepaard M, Raat H, Joosten KF, Mathijssen IM. Reliability and validity of the obstructive sleep apnea-18 survey in healthy children and children with syndromic craniosynostosis. J Dev Behav Pediatr. 2011 Jan;32(1):27-33. doi: 10.1097/DBP.0b013e3181fa579f. PMID: 21160438.

Not conform PICO: wrong population (healthy children and children with craniosynostosis)

 

Brockmann Veloso, P. E., Holmgren, N. L., Salinas, P., & Prado, F. (2011). Usefulness of a clinical questionnaire for diagnosis of respiratory disorders of sleep in children with neuromuscular diseases.

Not conform PICO: Population: children with neuromuscular disease (21 children), diagnosis of sleep disordered breathing

Bseikri M, Zhang J, Kirley J, Lee C, Castillo A, Feliciano EMC. Predicting obstructive sleep apnea severity in children referred for polysomnography: use of the Pediatric Sleep Questionnaire and Subscales. Sleep Breath. 2023 May;27(2):545-552. doi: 10.1007/s11325-022-02647-6. Epub 2022 May 28. PMID: 35633476.

Not conform PICO: wrong outcome measures (AUC), Population: children referred for PSG due to concern for sleep disorder, PSQ subscales

 

Church GD. The role of polysomnography in diagnosing and treating obstructive sleep apnea in pediatric patients. Curr Probl Pediatr Adolesc Health Care. 2012 Jan;42(1):2-25. doi: 10.1016/j.cppeds.2011.10.001. PMID: 22221590.

Wrong study design: narrative review

Constantin E, Tewfik TL, Brouillette RT. Can the OSA-18 quality-of-life questionnaire detect obstructive sleep apnea in children? Pediatrics. 2010 Jan;125(1):e162-8. doi: 10.1542/peds.2009-0731. Epub 2009 Dec 21. PMID: 20026494.

Not conform PICO: reference is nocturnal pulse oximetry study

 

Corrêa CC, Weber SAT, Evangelisti M, Villa MP. The short evaluation of orofacial myofunctional protocol (ShOM) and the sleep clinical record in pediatric obstructive sleep apnea. Int J Pediatr Otorhinolaryngol. 2020 Oct;137:110240. doi: 10.1016/j.ijporl.2020.110240. Epub 2020 Jul 12. PMID: 32896353.

Not conform PICO: physical examination

 

De Luca Canto G, Singh V, Major MP, Witmans M, El-Hakim H, Major PW, Flores-Mir C. Diagnostic capability of questionnaires and clinical examinations to assess sleep-disordered breathing in children: a systematic review and meta-analysis. J Am Dent Assoc. 2014 Feb;145(2):165-78. doi: 10.14219/jada.2013.26. PMID: 24487608.

Article not available, Diagnosis of SDB

 

Goldstein NA, Stefanov DG, Graw-Panzer KD, Fahmy SA, Fishkin S, Jackson A, Sarhis JS, Weedon J. Validation of a clinical assessment score for pediatric sleep-disordered breathing. Laryngoscope. 2012 Sep;122(9):2096-104. doi: 10.1002/lary.23455. Epub 2012 Aug 13. PMID: 22890967.

Not conform PICO: no sensitivity/specificity for questionnaires (only for clinical assessment score), Population: children suspective of SDB.

 

Isaiah A, Shikara M, Pereira KD, Das G. Refining screening questionnaires for prediction of sleep apnea severity in children. Sleep Breath. 2020 Dec;24(4):1349-1356. doi: 10.1007/s11325-019-01964-7. Epub 2019 Nov 27. PMID: 31776897.

Not conform PICO: correlation between different questions of questionnaires, wrong outcome measures

 

Kaditis AG, Alonso Alvarez ML, Boudewyns A, Alexopoulos EI, Ersu R, Joosten K, Larramona H, Miano S, Narang I, Trang H, Tsaoussoglou M, Vandenbussche N, Villa MP, Van Waardenburg D, Weber S, Verhulst S. Obstructive sleep disordered breathing in 2- to 18-year-old children: diagnosis and management. Eur Respir J. 2016 Jan;47(1):69-94. doi: 10.1183/13993003.00385-2015. Epub 2015 Nov 5. PMID: 26541535.

Not conform PICO: Population: diagnosis of SDB, no comparison, no questionnaire

 

Kumar HV, Schroeder JW, Gang Z, Sheldon SH. Mallampati score and pediatric obstructive sleep apnea. J Clin Sleep Med. 2014 Sep 15;10(9):985-90. doi: 10.5664/jcsm.4032. PMID: 25142764; PMCID: PMC4153107.

Not conform PICO: Malampatti score (physical examination)

 

Masoud AI, Adavadkar PA, Park C, Gowharji LF, Alwadei AH, Carley DW. Comparing two pediatric sleep questionnaires: The Pediatric Sleep Questionnaire (PSQ) and a set of 6 hierarchically arranged questions (6Q). Cranio. 2022 Jul;40(4):303-312. doi: 10.1080/08869634.2020.1792221. Epub 2020 Jul 26. PMID: 32713295.

Not conform PICO: no results for PSQ, wrong comparison with PSG. Population: 7-17, referred for sleep study, to predict sleep apnea (not necessarily obstructive).

 

Michelet D, Julien-Marsollier F, Vacher T, Bellon M, Skhiri A, Bruneau B, Fournier J, Diallo T, Luce V, Brasher C, Dahmani S. Accuracy of the sleep-related breathing disorder scale to diagnose obstructive sleep apnea in children: a meta-analysis. Sleep Med. 2019 Feb;54:78-85. doi: 10.1016/j.sleep.2018.09.027. Epub 2018 Oct 28. PMID: 30529781.

Accuracy of SRBD scale in diagnosis of OSA compared with PSG, mostly overlapping with other SRs, few extra studies but specific groups (kidney failure) and no AHI specified

 

Mitchell RB, Garetz S, Moore RH, Rosen CL, Marcus CL, Katz ES, Arens R, Chervin RD, Paruthi S, Amin R, Elden L, Ellenberg SS, Redline S. The use of clinical parameters to predict obstructive sleep apnea syndrome severity in children: the Childhood Adenotonsillectomy (CHAT) study randomized clinical trial. JAMA Otolaryngol Head Neck Surg. 2015 Feb;141(2):130-6. doi: 10.1001/jamaoto.2014.3049. PMID: 25474490; PMCID: PMC4795000.

Not conform PICO: univariate and multivariable correlations, wrong outcome measures

 

Skotko BG, Macklin EA, Muselli M, Voelz L, McDonough ME, Davidson E, Allareddy V, Jayaratne YS, Bruun R, Ching N, Weintraub G, Gozal D, Rosen D. A predictive model for obstructive sleep apnea and Down syndrome. Am J Med Genet A. 2017 Apr;173(4):889-896. doi: 10.1002/ajmg.a.38137. Epub 2017 Jan 26. PMID: 28124477; PMCID: PMC9933889.

Population: children with DS 3-24 years, model created with Logic Learning Machine based on survey, physical examination, cephalograms, photography, metabolic markers

 

Soh HJ, Rowe K, Davey MJ, Horne RSC, Nixon GM. The OSA-5: Development and validation of a brief questionnaire screening tool for obstructive sleep apnea in children. Int J Pediatr Otorhinolaryngol. 2018 Oct;113:62-66. doi: 10.1016/j.ijporl.2018.07.029. Epub 2018 Jul 19. PMID: 30174012.

Not conform PICO: no results for OSA 18, OSA-5, compared with PSG (subgroup)

 

Teplitzky TB, Zauher AJ, Isaiah A. Alternatives to Polysomnography for the Diagnosis of Pediatric Obstructive Sleep Apnea. Diagnostics (Basel). 2023 Jun 3;13(11):1956. doi: 10.3390/diagnostics13111956. PMID: 37296808; PMCID: PMC10252945.

Wrong study design: narrative review

Villa MP, Sujanska A, Vitelli O, Evangelisti M, Rabasco J, Pietropaoli N, Banovcin P, Kheirandish-Gozal L, Gozal D. Use of the sleep clinical record in the follow-up of children with obstructive sleep apnea (OSA) after treatment. Sleep Breath. 2016 Mar;20(1):321-9. doi: 10.1007/s11325-015-1287-7. Epub 2015 Nov 13. PMID: 26564170.

Not conform PICO: sleep clinical record for follow-up after treatment, not diagnosis

 

Walter LM, Biggs SN, Cikor N, Rowe K, Davey MJ, Horne RS, Nixon GM. The efficacy of the OSA-18 as a waiting list triage tool for OSA in children. Sleep Breath. 2016 May;20(2):837-44. doi: 10.1007/s11325-015-1289-5. Epub 2015 Dec 15. PMID: 26669876.

Not conform PICO: screening tool for sleep disordered breathing, sens/spec only for subscales, part of children had oximetry as reference

Wijayaratne PR, Williams K, Davey MJ, Horne RSC, Nixon GM. Prediction of obstructive sleep apnoea in children and adolescents with Down syndrome. J Intellect Disabil Res. 2023 Sep;67(9):880- 892. doi: 10.1111/jir.13065. Epub 2023 Jun 29. PMID: 37382027.

Not conform PICO: questionnaire not defined in PICO.

Wu D, Li X, Guo X, Qin J, Li S. A simple diagnostic scale based on the analysis and screening of clinical parameters in paediatric obstructive sleep apnoea hypopnea syndrome. J Laryngol Otol. 2017 Apr;131(4):363-367. doi: 10.1017/S0022215117000238. PMID: 28244843.

Not conform PICO: clinical parameters instead of questionnaire

 

 

Autorisatiedatum en geldigheid

Laatst beoordeeld  : 16-04-2024

Laatst geautoriseerd  : 16-04-2024

Geplande herbeoordeling  : 16-04-2029

Initiatief en autorisatie

Initiatief:
  • Nederlandse Vereniging voor Keel-Neus-Oorheelkunde en Heelkunde van het Hoofd-Halsgebied
Geautoriseerd door:
  • Nederlandse Vereniging voor Anesthesiologie
  • Nederlandse Vereniging voor Keel-Neus-Oorheelkunde en Heelkunde van het Hoofd-Halsgebied
  • Nederlandse Vereniging voor Kindergeneeskunde
  • Nederlandse Vereniging voor Mond- Kaak- en Aangezichtschirurgie
  • Nederlandse Vereniging van Orthodontisten
  • Apneuvereniging

Algemene gegevens

De ontwikkeling/herziening van deze richtlijnmodule werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten (www.demedischspecialist.nl/kennisinstituut) en werd gefinancierd uit de Kwaliteitsgelden Medisch Specialisten (SKMS). De financier heeft geen enkele invloed gehad op de inhoud van de richtlijnmodule.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijnmodule is in 2021 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen (zie hiervoor de Samenstelling van de werkgroep) die betrokken zijn bij de zorg voor patiënten met pediatrisch OSA.

 

Werkgroep

  • dr. B. (Bas) Pullens (voorzitter), NVKNO, kno-arts (Erasmus MC)
  • dr. M.A.J. (Marjolein) van Looij, NVKNO, kno-arts (OLVG)
  • drs. C.C.A.F.M. (Christianne) Veugen, NVKNO, AIOS kno (UMCG)
  • F.H. (Frea) Kruisinga, NVK, algemeen kinderarts (Amsterdam UMC)
  • E.M. (Esther) Dias, NVA, anesthesioloog (Máxima Medisch Centrum)
  • dr. J.W. (Jitske) Nolte, NVMKA, MKA-chirurg (Amsterdam UMC)
  • E.C. (Esen) Doganer, Stichting Kind en Ziekenhuis, patiëntvertegenwoordiger, tijdelijk vervangen door:
    • Anne Swinkels, Stichting Kind en Ziekenhuis (maart 2023 – augustus 2023)
    • Marjolein Jager, Stichting Kind en Ziekenhuis (vanaf september 2023)
  • T. (Tanja) Mast, Apneuvereniging, patiëntvertegenwoordiger

Klankbordgroep

  • drs. W.J.D.M. (Wilma) van Beers, NVvO, orthodontist (tot mei 2023)
  • drs. P.C.M. (Petra) Zuurbier, NVvO, orthodontist (vanaf mei 2023)

Met dank aan

  • Prof. dr. K.F.M. (Koen) Joosten, kinderarts-intensivist (Erasmus MC)

Met ondersteuning van

  • dr. A. (Anja) van der Hout, adviseur Kennisinstituut (vanaf september 2022)
  • drs. E.R.L. (Evie) Verweg, junior adviseur Kennisinstituut (vanaf november 2022)
  • dr. I. (Iris) Duif, adviseur Kennisinstituut (tot september 2022)

Belangenverklaringen

De Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement) hebben gehad. Gedurende de ontwikkeling of herziening van een module worden wijzigingen in belangen aan de voorzitter doorgegeven. De belangenverklaring wordt opnieuw bevestigd tijdens de commentaarfase.

Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Werkgroeplid

Functie

Nevenfuncties

Gemelde belangen

Ondernomen actie

Pullens

KNO arts Erasmus MC

Voorzitter werkgroep landelijke kwaliteitsregistratie Amandeloperaties (die zal een landelijke registratie over amandeloperaties opzetten). Daarnaast voorzitter van de “educational committee” van de Europese kinderKNO vereniging ESPO

Presentatie tegen vergoeding (sprekersfee) bij Smith & Nephew over coblatie-operaties bij amandelen

Exclusie bij beslissingen over module aangaande coblatie-operaties bij amandelen.

Veugen

AIOS Keel-, Neus-, en Oorheelkunde UMCG

- PhD kandidaat KNO St. Antonius Ziekenhuis/UMCU (onbetaald)

- Lid Kerngroep slaapgeneeskunde van de KNO-vereniging

Promotieonderzoek op het gebied van OSA bij volwassenen, deels gefinancierd door de industrie. Dit gaat echter om OSA bij volwassenen, derhalve hebben zij geen belang in de adviezen die voortvloeien uit de richtlijn pediatrisch OSA.

Geen restricties

Van Looij

KNO-arts, somnoloog OLVG

- Voorzitter Commissie Kwaliteit en Accreditatie SVNL (onbetaald)

- Lid richtlijncommissie ESRS

- Lid Bestuur SVNL, a.i. voorzitter (onbetaald)

- Lid Commissie PrevENT, KNO-vereniging (onbetaald, vacatiegelden)

- Adviserend arts voor DEKRA Certification B.V. (incidenteel)

- Lid klankbordgroep van de themagroep slaapgeneeskunde van de KNO-vereniging.

- Plaatsvervangend opleider van de AIOS en HAIO’s

Geen

Geen restricties. Niet de verwachting dat DEKRA Certification B.V. belang heeft bij product.

Dias

Anesthesioloog Máxima Medisch Centrum

Geen

- Sprekersfee (Johnson en Johnson) voor praatjes die niet relateren aan OSA bij kinderen

- Principal investigator van Multi-Centre Clinical Trial (PREPARATION)

- Wil een onderzoek opzetten naar post-operatief beloop van kinderen met obesitas en bariatrische chirurgie.

Geen restricties

Nolte

MKA-chirurg Amsterdam UMC en Schisisteam Amsterdam

Bestuur Nederlandse Vereniging voor Schisis en Craniofaciale Afwijkingen (NVSCA, penningmeester, onbetaald)

Geen

Geen restricties

Kruisinga

Algemeen kinderarts

Geen

Wetenschappelijk onderzoek OSA bij kinderen waaronder: diagnostische instrumenten

Geen restricties

Mast

Medewerker ApneuVereniging t.a.v. apneu bij kinderen en t.a.v. de Löwenstein

- Afdelingssecretaresse Thoraxcentrum Enschede (betaald)

- Secretaresse hartrevalidatie bij het Thoraxcentrum

Geen

Geen restricties

Doganer

Junior projectmanager/ beleidsmedewerker Stichting Kind en Ziekenhuis

Geen

Geen

Geen restricties

Swinkels

Junior projectmanager/ beleidsmedewerker Stichting Kind en Ziekenhuis

Geen

Geen

Geen restricties

Jager

Junior beleids- en projectmedewerker Stichting Kind en Ziekenhuis

Begeleider C bij Sherpa, betaald (3 contracturen).

Geen

Geen restricties

Zuurbier

- Orthodontist, deels eigenaar praktijk orthodontisten Heemstede

-Orthodontist, staflid afdeling orthodontie, ACTA

Lid wetenschappelijke commissie van de NVTS

Geen

Geen restricties

Van Beers

Recent met pensioen, voorheen praktijkhouder orthodontisten praktijk

- Vice voorzitter College Tandheelkundig Specialisten

- Lid VICO, visitatiecommissie orthodontisten

- Lid Consilium orthodontiae

- Lid LOP

- Lid verantwoordingsorgaan tandarts pensioenfonds (betaald),

- Zelfstandig gevestigd mediator

- Ombudspersoon voor Volt Europa

- Waarnemer zzp (betaald)

Geen

Geen restricties

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door inbreng van De Apneu Vereniging en Stichting Kind en Ziekenhuis in de knelpuntenanalyse en afgevaardigden van De Apneu Vereniging en Stichting Kind en Ziekenhuis in de werkgroep. De verkregen input is meegenomen bij het opstellen van de uitgangsvragen, de keuze voor de uitkomstmaten en bij het opstellen van de overwegingen. De conceptrichtlijn is tevens voor commentaar voorgelegd aan Stichting Kind en Ziekenhuis en de Apneuvereniging en de eventueel aangeleverde commentaren zijn bekeken en verwerkt.

 

Kwalitatieve raming van mogelijke financiële gevolgen in het kader van de Wkkgz

Bij de richtlijn is conform de Wet kwaliteit, klachten en geschillen zorg (Wkkgz) een kwalitatieve raming uitgevoerd of de aanbevelingen mogelijk leiden tot substantiële financiële gevolgen. Bij het uitvoeren van deze beoordeling zijn richtlijnmodules op verschillende domeinen getoetst (zie het stroomschema op de Richtlijnendatabase).

 

Uit de kwalitatieve raming blijkt dat er waarschijnlijk geen substantiële financiële gevolgen zijn, zie onderstaande tabel.

 

Module

Uitkomst raming

Toelichting

Module Diagnostiek door vragenlijsten

geen financiële gevolgen

Hoewel uit de toetsing volgt dat de aanbeveling(en) breed toepasbaar zijn (> 40.000 patiënten), volgt ook uit de toetsing dat het geen nieuwe manier van zorgverlening of andere organisatie van zorgverlening betreft, het geen toename in het aantal in te zetten voltijdsequivalenten aan zorgverleners betreft en het geen wijziging in het opleidingsniveau van zorgpersoneel betreft. Er worden daarom geen substantiële financiële gevolgen verwacht.

Werkwijze

AGREE

Deze richtlijnmodule is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010).

 

Knelpuntenanalyse en uitgangsvragen

Tijdens de voorbereidende fase inventariseerde de werkgroep de knelpunten in de zorg voor patiënten met pediatrisch OSA. De werkgroep beoordeelde de aanbeveling(en) uit de eerdere richtlijnmodule (NVKNO, 2013) op noodzaak tot revisie. Tevens zijn er knelpunten aangedragen door De Apneu Vereniging en Stichting Kind en Ziekenhuis. Een verslag hiervan is opgenomen onder aanverwante producten.

 

Uitkomstmaten

Na het opstellen van de zoekvraag behorende bij de uitgangsvraag inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. Hierbij werd een maximum van acht uitkomstmaten gehanteerd. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

 

Methode literatuursamenvatting

Een uitgebreide beschrijving van de strategie voor zoeken en selecteren van literatuur is te vinden onder ‘Zoeken en selecteren’ onder Onderbouwing. Indien mogelijk werd de data uit verschillende studies gepoold in een random-effects model. Review Manager 5.4 werd gebruikt voor de statistische analyses. De beoordeling van de kracht van het wetenschappelijke bewijs wordt hieronder toegelicht.

 

Beoordelen van de kracht van het wetenschappelijke bewijs

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie https://www.gradeworkinggroup.org). De basisprincipes van de GRADE-methodiek zijn: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van de bewijskracht per uitkomstmaat op basis van de acht GRADE-domeinen (domeinen voor downgraden: risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias; domeinen voor upgraden: dosis-effect relatie, groot effect, en residuele plausibele confounding).

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie, in het bijzonder de mate van zekerheid dat de literatuurconclusie de aanbeveling adequaat ondersteunt (Schünemann, 2013; Hultcrantz, 2017).

 

GRADE

Definitie

Hoog

  • er is hoge zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • het is zeer onwaarschijnlijk dat de literatuurconclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Redelijk

  • er is redelijke zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • het is mogelijk dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Laag

  • er is lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • er is een reële kans dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Zeer laag

  • er is zeer lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • de literatuurconclusie is zeer onzeker.

 

Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz, 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz, 2017).

 

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals aanvullende argumenten uit bijvoorbeeld de biomechanica of fysiologie, waarden en voorkeuren van patiënten, kosten (middelenbeslag), aanvaardbaarheid, haalbaarheid en implementatie. Deze aspecten zijn systematisch vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’ en kunnen (mede) gebaseerd zijn op expert opinion. Hierbij is gebruik gemaakt van een gestructureerd format gebaseerd op het evidence-to-decision framework van de internationale GRADE Working Group (Alonso-Coello, 2016a; Alonso-Coello 2016b). Dit evidence-to-decision framework is een integraal onderdeel van de GRADE methodiek.

 

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk (Agoritsas, 2017; Neumann, 2016). De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen. De werkgroep heeft bij elke aanbeveling opgenomen hoe zij tot de richting en sterkte van de aanbeveling zijn gekomen.

 

In de GRADE-methodiek wordt onderscheid gemaakt tussen sterke en zwakke (of conditionele) aanbevelingen. De sterkte van een aanbeveling verwijst naar de mate van zekerheid dat de voordelen van de interventie opwegen tegen de nadelen (of vice versa), gezien over het hele spectrum van patiënten waarvoor de aanbeveling is bedoeld. De sterkte van een aanbeveling heeft duidelijke implicaties voor patiënten, behandelaars en beleidsmakers (zie onderstaande tabel). Een aanbeveling is geen dictaat, zelfs een sterke aanbeveling gebaseerd op bewijs van hoge kwaliteit (GRADE gradering HOOG) zal niet altijd van toepassing zijn, onder alle mogelijke omstandigheden en voor elke individuele patiënt.

 

Implicaties van sterke en zwakke aanbevelingen voor verschillende richtlijngebruikers

 

 

Sterke aanbeveling

Zwakke (conditionele) aanbeveling

Voor patiënten

De meeste patiënten zouden de aanbevolen interventie of aanpak kiezen en slechts een klein aantal niet.

Een aanzienlijk deel van de patiënten zouden de aanbevolen interventie of aanpak kiezen, maar veel patiënten ook niet.

Voor behandelaars

De meeste patiënten zouden de aanbevolen interventie of aanpak moeten ontvangen.

Er zijn meerdere geschikte interventies of aanpakken. De patiënt moet worden ondersteund bij de keuze voor de interventie of aanpak die het beste aansluit bij zijn of haar waarden en voorkeuren.

Voor beleidsmakers

De aanbevolen interventie of aanpak kan worden gezien als standaardbeleid.

Beleidsbepaling vereist uitvoerige discussie met betrokkenheid van veel stakeholders. Er is een grotere kans op lokale beleidsverschillen.

 

Organisatie van zorg

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijnmodule is expliciet aandacht geweest voor de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, mankracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van deze specifieke uitgangsvraag zijn genoemd bij de overwegingen. Meer algemene, overkoepelende, of bijkomende aspecten van de organisatie van zorg worden behandeld in de module Organisatie van zorg.

 

Commentaar- en autorisatiefase

De conceptrichtlijnmodule werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijnmodule aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijnmodule werd aan de NVKNO, NVA, NVK en Apneuvereniging voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

 

Literatuur

Agoritsas T, Merglen A, Heen AF, Kristiansen A, Neumann I, Brito JP, Brignardello-Petersen R, Alexander PE, Rind DM, Vandvik PO, Guyatt GH. UpToDate adherence to GRADE criteria for strong recommendations: an analytical survey. BMJ Open. 2017 Nov 16;7(11):e018593. doi: 10.1136/bmjopen-2017-018593. PubMed PMID: 29150475; PubMed Central PMCID: PMC5701989.

 

Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ. 2016 Jun 28;353:i2016. doi: 10.1136/bmj.i2016. PubMed PMID: 27353417.

 

Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ. 2016 Jun 30;353:i2089. doi: 10.1136/bmj.i2089. PubMed PMID: 27365494.

 

Brouwers MC, Kho ME, Browman GP, Burgers JS, Cluzeau F, Feder G, Fervers B, Graham ID, Grimshaw J, Hanna SE, Littlejohns P, Makarski J, Zitzelsberger L; AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010 Dec 14;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348; PubMed Central PMCID: PMC3001530.

 

Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017 Jul;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006. Epub 2017 May 18. PubMed PMID: 28529184; PubMed Central PMCID: PMC6542664.

 

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. http://richtlijnendatabase.nl/over_deze_site/over_richtlijnontwikkeling.html

 

Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016 Apr;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017. Epub 2016 Jan 6. Review. PubMed PMID: 26772609.

 

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Volgende:
Chirurgische therapie van OSA bij kinderen