AI gebaseerde predictiemodellen
Uitgangsvraag
Wat is de rol van predictiemodellen gebaseerd op AI bij het maken van behandelbeslissingen?
Aanbeveling
Geef geen prognoses aan patiënten met CRS op basis van predictiemodellen die niet extern gevalideerd zijn.
Gebruik reeds gepubliceerde intern gevalideerde modellen eerst in onderzoeksverband op eigen data ten behoeve van de externe validatie. Ontwikkel pas nieuwe predictiemodellen als eerder ontwikkelde modellen niet blijken te voldoen, om een wildgroei aan modellen te voorkomen.
Overwegingen
Voor- en nadelen van de interventie en de kwaliteit van het bewijs
Er werd geen bewijs gevonden over de waarde van predictiemodellen gebaseerd op machine learning/deep learning in vergelijking met predictiemodellen gebaseerd op het klinisch oordeel of klassieke statistische methoden, bij patiënten met CRS. Er werden geen studies gevonden die voldoen aan de PICO en dus is er geen GRADE beoordeling uitgevoerd.
- Er werden wel twee studies gevonden met twee predictiemodellen, die op basis van baseline data een predictie geven voor de uitkomst van chirurgie (Goedmakers, 2021; Liew, 2020). In Tabel 1 weergeeft een samenvatting van studieresultaten. Goedmakers (2021) rapporteerde over drie AI-modellen (VGGNet19, ResNet18 and ResNet50) die kunnen helpen om post-operatief adjacent segment diasease (ASD) te voorspellen op basis van preoperatieve T2 saggitale MRI-beelden. De predictieve waarde van de modellen werd vergeleken met een voorspelling gebaseerd op klinisch oordeel met behulp van de Matsumoto MRI grading scale. De waarde van het model is weergegeven in tabel 1 in de vorm van sensitiviteit, specificiteit, positief voorspellende waarde en negatief voorspellende waarde, F1 score en AUC. Reflecterend op de AUC-waarde, scoorde het ResNet50 model het best met een AUC van 0.89. Coëfficiënten werden niet gerapporteerd omdat de modellen zich baseren op T2 MRI-beelden.
- Liew (2020) rapporteerde over drie AI-methoden (least absolute shrinikage and selection operator (LASSO), boosting en multivariate adaptive regression splines (MUaRS)) om postoperatieve disability, arm-pijn en nek-pijn 12 maanden na ACDF-chirurgie bij patiënten met cervicaal radiculair syndroom (CRS) te voorspellen. Model fit is gepresenteerd met behulp van de root mean squared error (RMSE), waarbij lagere waarden een betere model-fit weergeven. Gezien het feit dat RMSE-waarden grafisch zijn gerapporteerd, is voor alle uitkomsten gebruik gemaakt van de web-applicatie WebPlotDigitizer. De laagste RMSE waarden zijn gevonden voor een klassiek model resulterend uit stapsgewijze selectie waarmee nekpijn kon worden voorspeld (RMSE 25.2, 95% BI 18.2 tot 32.21) en een model gebaseerd op stapsgewijze selectie waarmee disability werd voorspeld (RMSE 7.90, 95% BI 6.78 tot 9.012). Voor het voorspellen van armpijn, vertoonde een model ontwikkeld met behulp van LASSO de beste waarden (RMSE 24.6, 95% BI 20.8 tot 28.53).
Het eerste model (Goedmakers, 2021) maakt gebruik van baseline MRI beelden om adjacent segment disease na een median follow-up 19 maanden (IQR: 12-38 maanden) te voorspellen. Het model is intern gevalideerd met data van het eigen centrum, dit betekent dat het model matig valide is (AUC: 0.69). Voordat een predictiemodel gebruikt kan worden in de klinische praktijk, dient de prestatie van het model te worden bestudeerd in nieuwe patiënten (externe validiteit). Een externe validatie ontbreekt echter voor het model van Goedmakers (2021).
Het tweede model (Liew, 2020) voorspelt disability, arm-pijn en/of nek-pijn 12 maanden na ACDF-chirurgie op basis van baseline klinische data (zie voetnoten 1-3). Ook dit model is slechts intern gevalideerd, waardoor het model niet bruikbaar is in de klinische praktijk.
Gezien het feit dat de twee predictiemodellen niet extern gevalideerd zijn, dienen deze uitkomsten met de nodige voorzichtigheid te worden geïnterpreteerd.
Het literatuuronderzoek laat ook zien dat er wel regelmatig met behulp van machine learning modellen algoritmen worden ontworpen. In Tabel 2 staan overige op AI gebaseerde predictiemodellen die in de systematische search gevonden werden. Deze predictiemodellen waren geen volledige match met de vooraf opgestelde PICO (ontbreken controlegroep, bredere patiëntenpopulatie), maar geven wel de omvang van het aantal intern gevalideerde modellen in het veld weer.
Indien onderzoekers of zorgverleners predictiemodellen voor patiënten met CRS verder willen ontwikkelen, dan adviseert werkgroep om gebruik te maken van de reeds bestaande predictiemodellen en die toe te passen op de eigen data. Op die manier kunnen bestaande predictiemodellen extern gevalideerd worden en daarmee waarde krijgen voor algemene toepasbaarheid.
Tabel 1. Samenvatting van studieresultaten (Engelstalig)
Study |
Population (design, n) |
Outcome of interest |
AI-model(s) evaluated |
AI model performance |
Comparison model |
Comparison model performance |
Goedmakers, 2021 |
Patients with cervical radiculopathy undergoing ACDF
(retrospective chart review, 340) |
ASD Prevalence at final clinical follow-up (median follow-up 19 months (IQR: 12-38 months): 16% |
VGGNet19 trained using T2 sagittal MRI |
F1, sensitivity, specificity, PPV, NPV: NR |
Prediction by clinical expert, using the Matsumoto MRI grading scale |
F1: 0.32 (95% CI NR) |
PPV: 27 (95% CI NR) |
||||||
Sensitivity: 60 (95% CI NR) |
||||||
Specificity: 58 (95% CI NR) |
||||||
NPV: 88 (95% CI NR) |
||||||
AUC: 0.69 (95% CI NR) |
AUC: NR |
|||||
ResNet18 trained using T2 sagittal MRI |
F1, Sensitivity, specificity, PPV, NPV: NR |
|||||
AUC: 0.86 (95% CI NR) |
||||||
ResNet50 trained using T2 sagittal MRI |
F1: 0.83 (95% CI NR) |
|||||
Sensitivity: 80 (95% CI NR) |
||||||
Specificity: 97 (95% CI NR) |
||||||
PPV: 86 (95% CI NR) |
||||||
NPV: 96 (95% CI NR) |
||||||
AUC: 0.89 (95% CI NR) |
||||||
Liew, 2020 |
Patients with cervical radiculopathy undergoing ACDF or PCF
(prospective cohort dataset, 201) |
NDI neck pain intensity, and present arm pain intensity at follow-up (12 months post-surgery) |
LASSO |
RMSE NDI: 8.13 (95% CI 6.90 to 9.34) |
Two stage stepwise linear regression |
RMSE NDI: 7.90 (95% CI 6.78 to 9.01)* |
RMSE Neck pain: 23.0 (95% CI 19.4 to 26.6) |
||||||
RMSE Arm pain: 24.6 (95% CI 20.8 to 28.5)* |
RMSE Arm pain: 25.2 (95% CI 18.2 to 32.2)
|
|||||
Boosting |
RMSE NDI: 8.16 (95% CI 6.93 to 9.37) |
|||||
RMSE Neck pain: 22.9 (95% CI 19.2 to 26.6) |
RMSE Neck pain: 21.7 (95% CI 18.3 to 25.1)*
|
|||||
RMSE Arm pain: 25.0 (95% CI 20.9 to 29.2) |
||||||
MuARS |
RMSE NDI: 8.19 (95% CI 6.93 to 9.44) |
|||||
RMSE Neck pain: 23.5 (95% CI 19.2 to 27.8) |
||||||
RMSE Arm pain: 24.6 (95% CI 20.1 to 29.1) |
||||||
Abbreviations: ASD, adjacent segment disease; AUC, area under the ROC-curve; LASSO, least absolute shrinkage and selection operator; MUaRS, multivariate adaptive regression splines; NDI, neck disability index; NPV, negative predictive value; PPV, positive predictive value; RMSE, root mean squared error *lowest RMSE |
Tabel 2. Overige predictiemodellen (Engelstalig)
Study ID |
Population |
Model(s) intervention |
Model(s) control |
Outcome |
Reported measures for accuracy |
Schroerder, 2017 |
Patients with radiculopathy or myeloradiculopathy undergoing TDR with Mobi-C cervical artificial disc or ACDF |
LASSO logistic regression |
NR |
Patient satisfaction |
AUC |
Rodigues, 2022 |
Patients who underwent ACDF procedures |
Traditional machine learning algorithms, LR and SVM |
NR |
Postoperative complications, unfavorable 90-day readmissions, and two-year reoperations |
AUC |
Karhade, 2019 |
Patients who underwent inpatient and outpatient ACDF. 25.4% of the patients had myelopathy and 36.2% had radiculopathy |
Random forest, SGB, neural network, SVM, elastic-net penalized logistic regression |
NR |
Sustained opioid prescription |
dc-statistic), calibration slope/intercept, and Brier score |
Arvind, 2018 |
Patients undergoing ACDF |
ANN, SVM, and random forest decision tree (RF) model |
compared to the ASA physical status classification system |
Surgical complications |
AUC |
Wang, 2021 |
Patients undergoing ACDF |
artificial neural network (ANN) using preoperative variables |
legacy risk-stratification measures: ASA and Charlson Comorbidity Index (CCI) |
Complications within one week of index surgery |
AUC |
Veeramani, 2022 |
Patients undergoing ACDF |
LR, Decision Tree (DT), RF, Gradient Boosting (GB), Extreme Gradient Boosting (XGB), and a Neural Network (NN) |
NR |
Unplanned intubation |
AUC, Brier-score |
Rudisill, 2022 |
Patients undergoing ACDF |
extreme gradient boost (XGBoost) |
NR |
Early-onset adjacent segment degeneration |
F1, AUC |
Karhade, 2021 |
Patients undergoing ACDF |
RF, SGB, neural network, SVM, elastic-net penalized logistic regression |
NR |
Lenght of stay >1 day after index |
AUC, calibration, c-statistic, Brier-score |
Gowd, 2022 |
Patients undergoing ACDF |
LR, gradient boosting trees, RF, and decision tree |
A predictive linear regression model constructed solely from comorbidity indices (ASA classification and frailty index) was used as comparison |
Complications |
AUC |
Wong, 2020 |
Patients undergoing ACDF for degenerative cervical spine pathology |
support vector machine algorithm |
NR |
early onset adjacent segment degeneration |
AUC |
Abbreviations: ANN, artificial neural network; ASD, adjacent segment disease; AUC, area under the ROC-curve; LASSO, least absolute shrinkage and selection operator; LR, logistic regression; MUaRS, multivariate adaptive regression splines; NDI, neck disability index; NPV, negative predictive value; PPV, positive predictive value; RF, random forest; SGB, stochastic gradient boosting; SVM, support vector machine |
Waarden en voorkeuren van patiënten (en evt. hun verzorgers)
Indien patiënten vragen hebben over de voorspelling van behandeluitkomsten die betrekking hebben op hun eigen klinische situatie, dan is het van groot belang om patiënten goed te infomeren over het feit dat bestaande predictiemodellen slechts intern (of niet) gevalideerd zijn en dus niet betrouwbaar toepasbaar zijn in de klinische praktijk. Het ligt in de lijn der verwachting dat in de komende jaren externe validatie van predictiemodellen zal volgen.
Kosten (middelenbeslag)
De werkgroep is niet bekend met kosten-effectiviteitsstudies op het gebied van predictiemodellen bij patiënten met CRS. Over de mogelijke kosten kan de werkgroep in stadium nog geen inschatting geven.
Aanvaardbaarheid, haalbaarheid en implementatie
Het moet worden aangetekend dat voor het laten ‘draaien’ van dergelijke predictiemodellen programma’s moeten worden gedownload (zoals R of Python) die niet in elk ziekenhuis voorhanden zijn en/of die niet door de ICT van het ziekenhuis worden ondersteund. Het ligt sterk in de lijn der verwachting dat deze randvoorwaarde voor het in de praktijk toepasbaar laten zijn voor predictiemodellen de komende jaren aandacht zal krijgen.
Voetnoten:
NDI, C7 level pinprick on right (left) normal and Achilles (triceps brachii) muscle reflex on right normal.
NDI, level light touch on right normal, level pinprick on right normal and achilles (triceps brachii) muscle reflex on right normal
VAS-arm worst, NDI, MSPQ, EQ5D, cervical flexion (extension) active range of motion, cervical flexion (right rotation) active range of motion, head reposition accuracy from right to neutral, right hand grip strength, Romberg, Figure 8, coping strategies questionnaire, coping subscale, C5 level light touch on right normal, C6 level light touch on right normal and C7 level pinprick on right normal.
Rationale van de aanbeveling: weging van argumenten voor en tegen de diagnostische procedure
Gezien de afwezigheid externe gevalideerde predictiemodellen en het slechts zeer beperkt aanwezig zijn van intern gevalideerde predictiemodellen kunnen aanbevelingen alleen met veel reserve worden gegeven. Op basis van de beschikbare gegevens adviseert de werkgroep om terughoudend te zijn met het bepalen van prognoses op basis van de predictiemodellen.
Onderbouwing
Achtergrond
Hoewel chirurgie voor een CRS door wervelkolomchirurgen over het algemeen wordt beschouwd als een procedure met een hoog succespercentage, blijkt uit verschillende studies dat ongeveer 25% van de patiënten na de ingreep een lage tevredenheid meldt (Hessler, 2012; Wichmann, 2021). Het preoperatief identificeren van deze patiënten kan onnodige procedures voorkomen en leiden tot kostenbesparingen. Desondanks blijft het zeer uitdagend om vooraf te bepalen welke groep patiënten baat zal hebben bij de operatie en welke groep niet (Iyer, 2016).
Predictiemodellen kunnen wervelkolomchirurgen mogelijk beter inzicht geven in het succes van chirurgie voor een specifieke patiënt. Op basis van patiëntkarakteristieken, radiologische en/of klinische parameters kan een voorspelling worden gedaan over het verwachte resultaat voor de patiënt. Dit zou zorgverleners in staat stellen een betere beslissing te nemen over het aanbieden van de operatie aan de patiënt en de patiënt een beter idee geven van het verwachte resultaat. Deze module evalueert de rol van predictiemodellen bij het maken van behandelbeslissingen bij patiënten met CRS.
Conclusies
All outcomes
No GRADE |
No evidence was found regarding the performance of models based on machine learning/deep learning in predicting clinical outcomes/complications when compared with clinical judgement or a models based on classical statistical methods in patients with cervical radiculopathy undergoing ACDF-surgery.
|
Samenvatting literatuur
Level of evidence of the literature
No studies were included in the analysis of the literature.
Zoeken en selecteren
A systematic review of the literature was performed to answer the following question: Which model predicts clinical outcomes and complications (adjacent segment disease/ continued opioid use) in patients with cervical radiculopathy and what is the predictive value of this model?
P: Patients with cervical radiculopathy undergoing ACDF surgery
I: Validated prediction model based on machine learning/deep learning principles
C: Model based on clinical judgement or classical statistical methods (e.g. regression-analysis)
O: Model performance (predictive value, fit, discrimination parameters (AUC), Brier score, F1 score) for predicting complications (adjacent segment disease/sustained opioid prescription) or clinical outcomes (e.g. disability or pain)
T/S: Based on pre-operative data predicting postoperative outcomes, in-hospital setting
Relevant outcome measures
The guideline development group considered discrimination parameters (such as area under curve) as a critical outcome measure for decision making; and all other outcomes as an important outcome measure for decision making.
The working group defined the outcomes measures as follows:
- Disability: Neck disability index (NDI)
- Pain: Visual analogue scale (VAS) or numerical rating scale (NRS)
For other outcomes, the working group did not define the outcome measures listed above but used the definitions used in the studies.
The working group defined the performance of the included models as follows (Habibzadeh, 2016; Ludemann, 2006; Obuchowski, 2003; Metz, 1978):
- AUC <0.6: failed
- 0.6 ≤ AUC<0.7: poor
- 0.7≤AUC<0.8: acceptable,
- 0.8≤AUC<0.9: excellent,
- AUC≥0.9: outstanding.
Search and select (Methods)
In the first step, the databases Medline (via OVID) and Embase (via Embase.com) were searched with relevant search terms until February 1sth, 2023. The detailed search strategy is depicted under the tab Methods. The systematic literature search resulted in 153 hits. Studies were initially selected based on the following criteria:
- Reporting prediction model with complication or clinical outcome as dependent variable and risk factors based on machine learning/deep learning as independent variables, the described model(s) were internally and externally validated,
- Studies were full text available in English or Dutch, and
- Studies according to the PICO.
Twenty-three studies were initially selected based on title and abstract screening. After reading the full text, all studies were excluded (see the table with reasons for exclusion under the tab Methods), and no studies were included.
Results
No studies were included in the analysis of the literature.
Referenties
- Arvind V, Kim JS, Oermann EK, Kaji D, Cho SK. Predicting Surgical Complications in Adult Patients Undergoing Anterior Cervical Discectomy and Fusion Using Machine Learning. Neurospine. 2018 Dec;15(4):329-337. doi: 10.14245/ns.1836248.124. Epub 2018 Dec 17. PMID: 30554505; PMCID: PMC6347343.
- Gowd AK, O'Neill CN, Barghi A, O'Gara TJ, Carmouche JJ. Feasibility of Machine Learning in the Prediction of Short-Term Outcomes Following Anterior Cervical Discectomy and Fusion. World Neurosurg. 2022 Dec;168:e223-e232. doi: 10.1016/j.wneu.2022.09.090. Epub 2022 Sep 26. PMID: 36174945.
- Hessler C, Boysen K, Regelsberger J, Vettorazzi E, Winkler D, Westphal M. Patient satisfaction after anterior cervical discectomy and fusion is primarily driven by relieving pain. Clin J Pain. 2012 Jun;28(5):398-403. doi: 10.1097/AJP.0b013e318232cddc. PMID: 22193847.
- Karhade AV, Ogink PT, Thio QCBS, Broekman MLD, Cha TD, Hershman SH, Mao J, Peul WC, Schoenfeld AJ, Bono CM, Schwab JH. Machine learning for prediction of sustained opioid prescription after anterior cervical discectomy and fusion. Spine J. 2019 Jun;19(6):976-983. doi: 10.1016/j.spinee.2019.01.009. Epub 2019 Jan 30. PMID: 30710731.
- Karhade AV, Shin D, Florissi I, Schwab JH. Development of predictive algorithms for length of stay greater than one day after one- or two-level anterior cervical discectomy and fusion. Seminars in Spine Surgery. 2021 Jun;33(2):100874. https://doi.org/10.1016/j.semss.2021.100874
- Iyer S, Kim HJ. Cervical radiculopathy. Curr Rev Musculoskelet Med. 2016 Sep;9(3):272-80. doi: 10.1007/s12178-016-9349-4. PMID: 27250042; PMCID: PMC4958381.
- Lüdemann L, Grieger W, Wurm R, Wust P, Zimmer C. Glioma assessment using quantitative blood volume maps generated by T1-weighted dynamic contrast-enhanced magnetic resonance imaging: a receiver operating characteristic study. Acta Radiol. 2006 Apr;47(3):303-10. doi: 10.1080/02841850500539033. PMID: 16613313.
- Metz CE. Basic principles of ROC analysis. Semin Nucl Med. 1978 Oct;8(4):283-98. doi: 10.1016/s0001-2998(78)80014-2. PMID: 112681.
- Obuchowski NA. Receiver operating characteristic curves and their use in radiology. Radiology. 2003 Oct;229(1):3-8. doi: 10.1148/radiol.2291010898. PMID: 14519861.
- Rodrigues AJ, Schonfeld E, Varshneya K, Stienen MN, Staartjes VE, Jin MC, Veeravagu A. Comparison of Deep Learning and Classical Machine Learning Algorithms to Predict Postoperative Outcomes for Anterior Cervical Discectomy and Fusion Procedures With State-of-the-art Performance. Spine (Phila Pa 1976). 2022 Dec 1;47(23):1637-1644. doi: 10.1097/BRS.0000000000004481. Epub 2022 Sep 21. PMID: 36149852.
- Rudisill SS, Hornung AL, Barajas JN, Bridge JJ, Mallow GM, Lopez W, Sayari AJ, Louie PK, Harada GK, Tao Y, Wilke HJ, Colman MW, Phillips FM, An HS, Samartzis D. Artificial intelligence in predicting early-onset adjacent segment degeneration following anterior cervical discectomy and fusion. Eur Spine J. 2022 Aug;31(8):2104-2114. doi: 10.1007/s00586-022-07238-3. Epub 2022 May 11. PMID: 35543762.
- Schroeder GD, Coric D, Kim HJ, Albert TJ, Radcliff KE. Are patient-reported outcomes predictive of patient satisfaction 5 years after anterior cervical spine surgery? Spine J. 2017 Jul;17(7):943-952. doi: 10.1016/j.spinee.2017.02.008. Epub 2017 Feb 27. PMID: 28254671.
- Veeramani A, Zhang AS, Blackburn AZ, Etzel CM, DiSilvestro KJ, McDonald CL, Daniels AH. An Artificial Intelligence Approach to Predicting Unplanned Intubation Following Anterior Cervical Discectomy and Fusion. Global Spine J. 2023 Sep;13(7):1849-1855. doi: 10.1177/21925682211053593. Epub 2022 Feb 8. PMID: 35132907; PMCID: PMC10556901.
- Wang KY, Suresh KV, Puvanesarajah V, Raad M, Margalit A, Jain A. Using Predictive Modeling and Machine Learning to Identify Patients Appropriate for Outpatient Anterior Cervical Fusion and Discectomy. Spine (Phila Pa 1976). 2021 May 15;46(10):665-670. doi: 10.1097/BRS.0000000000003865. PMID: 33306613.
- Wichmann TO, Rasmussen MM, Einarsson HB. Predictors of patient satisfaction following anterior cervical discectomy and fusion for cervical radiculopathy. Clin Neurol Neurosurg. 2021 Apr 16;205:106648. doi: 10.1016/j.clineuro.2021.106648. Epub ahead of print. PMID: 33901749.
- Wong JJ, Côté P, Quesnele JJ, Stern PJ, Mior SA. The course and prognostic factors of symptomatic cervical disc herniation with radiculopathy: a systematic review of the literature. Spine J. 2014 Aug 1;14(8):1781-9. doi: 10.1016/j.spinee.2014.02.032. Epub 2014 Mar 12. PMID: 24614255Wong AYL, Harada G, Lee R, Gandhi SD, Dziedzic A, Espinoza-Orias A, Parnianpour M, Louie PK, Basques B, An HS, Samartzis D. Preoperative paraspinal neck muscle characteristics predict early onset adjacent segment degeneration in anterior cervical fusion patients: A machine-learning modeling analysis. J Orthop Res. 2021 Aug;39(8):1732-1744. doi: 10.1002/jor.24829. Epub 2020 Aug 28. PMID: 32816312.
Verantwoording
Autorisatiedatum en geldigheid
Laatst beoordeeld : 01-07-2024
Laatst geautoriseerd : 01-07-2024
Geplande herbeoordeling : 01-07-2027
Samenstelling werkgroep
Voor het ontwikkelen van de richtlijnmodules is in 2022 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen (zie hiervoor de ‘samenstelling van de werkgroep’) die betrokken zijn bij de zorg voor patiënten met een CRS.
WERKGROEP
- Mevr. dr. Carmen Vleggeert-Lankamp (voorzitter), neurochirurg, NVvN
- Dhr. dr. Ruben Dammers, neurochirurg, NVvN
- Mevr. drs. Martine van Bilsen, neurochirurg, NVvN
- Dhr. drs. Maarten Liedorp, neuroloog, NVN
- Mevr. drs. Germine Mochel, neuroloog, NVN
- Mevr. dr. Akkie Rood, orthopedisch chirurg, NOV
- Dhr. dr. Erik Thoomes, fysiotherapeut en manueel therapeut, KNGF/NVMT
- Dhr. prof. dr. Jan Van Zundert, hoogleraar Pijngeneeskunde, NVA
- Dhr. Leen Voogt, ervaringsdeskundige, Nederlandse Vereniging van Rugpatiënten ‘de Wervelkolom’
KLANKBORDGROEP
- Mevr. Elien Nijland, ergotherapeut/handtherapeut, EN
- Mevr. Meimei Yau, oefentherapeut, VvOCM
Met ondersteuning van:
- Mevr. dr. Charlotte Michels, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
- Mevr. drs. Beatrix Vogelaar, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
Belangenverklaringen
De Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement) hebben gehad. Gedurende de ontwikkeling of herziening van een module worden wijzigingen in belangen aan de voorzitter doorgegeven. De belangenverklaring wordt opnieuw bevestigd tijdens de commentaarfase.
Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.
Naam lid werkgroep |
Hoofdfunctie |
Nevenwerkzaamheden |
Gemelde belangen |
Ondernomen actie |
Carmen Vleggeert-Lankamp (voorzitter) |
Neurochirurg, Leiden Universitair Medisch Centrum, Leiden
|
* Medisch Manager Neurochirurgie Spaarne Gasthuis, Hoofdorp/ Haarlem, gedetacheerd vanuit LUMC (betaald) * Boardmember Eurospine, chair research committee |
*Niet anders dan onderzoeksleider in projecten naar etiologie van en uitkomsten in het CRS. |
Geen actie |
Akkie Rood |
Orthopedisch chirurg, Sint Maartenskliniek, Nijmegen |
Lid NOV, DSS, NvA |
Geen |
Geen actie |
Erik Thoomes |
Fysio-Manueel therapeut / praktijkeigenaar, Fysio-Experts, Hazerswoude |
*Promovendus / wetenschappelijk onderzoeker Universiteit van Birmingham, UK,School of Sport, Exercise and Rehabilitation Sciences, |
Geen |
Geen actie |
Germine Mochel |
Neuroloog, DC klinieken (loondienst) |
Lid werkgroep pijn NVN Lid NHV en VNHC |
*Dienstverband bij DC klinieken, alwaar behandeling/diagnostiek patiënten CRS
|
Geen actie |
Jan Van Zundert |
*Anesthesioloog-pijnspecialist. |
Geen |
Geen financiering omtrent projecten die betrekking hebben op cervicaal radiculair lijden (17 jaar geleden op CRS onderwerk gepromoveerd, nadien geen PhD CRS-projecten begeleidt).
|
Geen actie |
Leen Voogt |
*Ervaringsdeskundige CRS. *Voorzitter Nederlandse Vereniging van Rugpatiënten 'de Wervelkolom' (NVVR) |
Vrijwilligerswerk voor de patiëntenvereniging (onbetaald). |
Geen |
Geen actie |
Maarten Liedorp |
Neuroloog in loondienst (0.6 fte), ZBC Kliniek Lange Voorhout, Rijswijk |
*lid oudergeleding MR IKC de Piramide (onbetaald) |
Geen |
Geen actie |
Martine van Bilsen |
Neurochirurg, Radboudumc, Nijmegen |
Geen |
Geen |
Geen actie |
Ruben Dammers |
Neurochirurg, ErasmusMC, Rotterdam |
Geen |
Geen |
Geen actie |
Naam lid klankbordgroep |
Hoofdfunctie |
Nevenwerkzaamheden |
Gemelde belangen |
Ondernomen actie |
Meimei Yau |
Praktijkhouder Yau Oefentherapeut, Oefentherapeut Mensendieck, Den Haag. |
Geen |
Kennis opdoen, informatie/expertise uitwisselen met andere disciplines, oefentherapeut vertegenwoordigen. KP register |
Geen actie |
Vera Keil |
Radioloog, AmsterdamUMC, Amsterdam. Afgevaardigde NVvR Neurosectie |
Geen |
Als radioloog heb ik natuurlijk een interesse aan een sterke rol van de beeldvorming. |
Geen actie |
Elien Nijland |
Ergotherapeut/hand-ergotherapeut (totaal 27 uur) bij Treant zorggroep (Bethesda Hoogeveen) en Refaja ziekenhuis (Stadskanaal) |
Voorzitter Adviesraad Hand-ergotherapie (onbetaald) |
|
Geen actie |
Inbreng patiëntenperspectief
Er werd aandacht besteed aan het patiëntenperspectief door een afgevaardigde van de Nederlandse Vereniging van Rugpatiënten ‘de Wervelkolom’ te betrekken in de werkgroep. De verkregen input is meegenomen bij het opstellen van de uitgangsvragen, de keuze voor de uitkomstmaten en bij het opstellen van de overwegingen (zie kop ‘Waarden en voorkeuren van patiënten’). De conceptrichtlijn is tevens voor commentaar voorgelegd aan de Nederlandse Vereniging van Rugpatiënten ‘de Wervelkolom’ en de eventueel aangeleverde commentaren zijn bekeken en verwerkt.
Kwalitatieve raming van mogelijke financiële gevolgen in het kader van de Wkkgz
Bij de richtlijn is conform de Wet kwaliteit, klachten en geschillen zorg (Wkkgz) een kwalitatieve raming uitgevoerd of de aanbevelingen mogelijk leiden tot substantiële financiële gevolgen. Bij het uitvoeren van deze beoordeling zijn richtlijnmodules op verschillende domeinen getoetst (zie het stroomschema op de Richtlijnendatabase).
Uit de kwalitatieve raming blijkt dat er waarschijnlijk geen substantiële financiële gevolgen zijn, zie onderstaande tabel.
Module |
Uitkomst raming |
Toelichting |
Predictie conservatief versus chirurgisch |
Geen financiële gevolgen |
Hoewel uit de toetsing volgt dat de aanbeveling(en) breed toepasbaar zijn (5.000-40.000 patiënten), volgt ook uit de toetsing dat het overgrote deel (±90%) van de zorgaanbieders en zorgverleners al aan de norm voldoet en het geen nieuwe manier van zorgverlening of andere organisatie van zorgverlening betreft. Er worden daarom geen financiële gevolgen verwacht. |
Werkwijze
AGREE
Deze richtlijnmodule is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010).
Knelpuntenanalyse en uitgangsvragen
Tijdens de voorbereidende fase inventariseerde de werkgroep de knelpunten in de zorg voor patiënten met CRS. Tevens zijn er knelpunten aangedragen door Ergotherapie Nederland, het Nederlands Huisartsen Genootschap, Nederlandse Vereniging van Ziekenhuizen, Nederlandse Vereniging van Revalidatieartsen, Vereniging van Oefentherapeuten Cesar en Mensendieck, Zorginstituut Nederland, Zelfstandige Klinieken Nederland, via enquête. Op basis van de uitkomsten van de knelpuntenanalyse zijn door de werkgroep concept-uitgangsvragen opgesteld en definitief vastgesteld.
Uitkomstmaten
Na het opstellen van de zoekvraag behorende bij de uitgangsvraag inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. Hierbij werd een maximum van acht uitkomstmaten gehanteerd. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.
Methode literatuursamenvatting
Een uitgebreide beschrijving van de strategie voor zoeken en selecteren van literatuur is te vinden onder ‘Zoeken en selecteren’ onder Onderbouwing. Indien mogelijk werd de data uit verschillende studies gepoold in een random-effects model. Review Manager 5.4 werd gebruikt voor de statistische analyses. De beoordeling van de kracht van het wetenschappelijke bewijs wordt hieronder toegelicht.
Beoordelen van de kracht van het wetenschappelijke bewijs
De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/). De basisprincipes van de GRADE-methodiek zijn: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van de bewijskracht per uitkomstmaat op basis van de acht GRADE-domeinen (domeinen voor downgraden: risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias; domeinen voor upgraden: dosis-effect relatie, groot effect, en residuele plausibele confounding).
GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie, in het bijzonder de mate van zekerheid dat de literatuurconclusie de aanbeveling adequaat ondersteunt (Schünemann, 2013; Hultcrantz, 2017).
GRADE |
Definitie |
Hoog |
|
Redelijk |
|
Laag |
|
Zeer laag |
|
Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz, 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz, 2017).
Overwegingen (van bewijs naar aanbeveling)
Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals aanvullende argumenten uit bijvoorbeeld de biomechanica of fysiologie, waarden en voorkeuren van patiënten, kosten (middelenbeslag), aanvaardbaarheid, haalbaarheid en implementatie. Deze aspecten zijn systematisch vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’ en kunnen (mede) gebaseerd zijn op expert opinion. Hierbij is gebruik gemaakt van een gestructureerd format gebaseerd op het evidence-to-decision framework van de internationale GRADE Working Group (Alonso-Coello, 2016a; Alonso-Coello 2016b). Dit evidence-to-decision framework is een integraal onderdeel van de GRADE methodiek.
Formuleren van aanbevelingen
De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk (Agoritsas, 2017; Neumann, 2016). De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen. De werkgroep heeft bij elke aanbeveling opgenomen hoe zij tot de richting en sterkte van de aanbeveling zijn gekomen.
In de GRADE-methodiek wordt onderscheid gemaakt tussen sterke en zwakke (of conditionele) aanbevelingen. De sterkte van een aanbeveling verwijst naar de mate van zekerheid dat de voordelen van de interventie opwegen tegen de nadelen (of vice versa), gezien over het hele spectrum van patiënten waarvoor de aanbeveling is bedoeld. De sterkte van een aanbeveling heeft duidelijke implicaties voor patiënten, behandelaars en beleidsmakers (zie onderstaande tabel). Een aanbeveling is geen dictaat, zelfs een sterke aanbeveling gebaseerd op bewijs van hoge kwaliteit (GRADE gradering HOOG) zal niet altijd van toepassing zijn, onder alle mogelijke omstandigheden en voor elke individuele patiënt.
Implicaties van sterke en zwakke aanbevelingen voor verschillende richtlijngebruikers |
||
|
Sterke aanbeveling |
Zwakke (conditionele) aanbeveling |
Voor patiënten |
De meeste patiënten zouden de aanbevolen interventie of aanpak kiezen en slechts een klein aantal niet. |
Een aanzienlijk deel van de patiënten zouden de aanbevolen interventie of aanpak kiezen, maar veel patiënten ook niet. |
Voor behandelaars |
De meeste patiënten zouden de aanbevolen interventie of aanpak moeten ontvangen. |
Er zijn meerdere geschikte interventies of aanpakken. De patiënt moet worden ondersteund bij de keuze voor de interventie of aanpak die het beste aansluit bij zijn of haar waarden en voorkeuren. |
Voor beleidsmakers |
De aanbevolen interventie of aanpak kan worden gezien als standaardbeleid. |
Beleidsbepaling vereist uitvoerige discussie met betrokkenheid van veel stakeholders. Er is een grotere kans op lokale beleidsverschillen. |
Organisatie van zorg
In de knelpuntenanalyse en bij de ontwikkeling van de richtlijnmodule is expliciet aandacht geweest voor de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, mankracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van deze specifieke uitgangsvraag zijn genoemd bij de overwegingen. Meer algemene, overkoepelende, of bijkomende aspecten van de organisatie van zorg worden behandeld in de module Organisatie van zorg.
Commentaar- en autorisatiefase
De conceptrichtlijnmodule werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijnmodule aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijnmodule werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.
Literatuur
Agoritsas T, Merglen A, Heen AF, Kristiansen A, Neumann I, Brito JP, Brignardello-Petersen R, Alexander PE, Rind DM, Vandvik PO, Guyatt GH. UpToDate adherence to GRADE criteria for strong recommendations: an analytical survey. BMJ Open. 2017 Nov 16;7(11):e018593. doi: 10.1136/bmjopen-2017-018593. PubMed PMID: 29150475; PubMed Central PMCID: PMC5701989.
Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ. 2016 Jun 28;353:i2016. doi: 10.1136/bmj.i2016. PubMed PMID: 27353417.
Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ. 2016 Jun 30;353:i2089. doi: 10.1136/bmj.i2089. PubMed PMID: 27365494.
Brouwers MC, Kho ME, Browman GP, Burgers JS, Cluzeau F, Feder G, Fervers B, Graham ID, Grimshaw J, Hanna SE, Littlejohns P, Makarski J, Zitzelsberger L; AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010 Dec 14;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348; PubMed Central PMCID: PMC3001530.
Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017 Jul;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006. Epub 2017 May 18. PubMed PMID: 28529184; PubMed Central PMCID: PMC6542664.
Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. http://richtlijnendatabase.nl/over_deze_site/over_richtlijnontwikkeling.html
Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016 Apr;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017. Epub 2016 Jan 6. Review. PubMed PMID: 26772609.
NHG, 2018. NHG-Standaard Pijn (M106). Published: juni 2018. Laatste aanpassing: Laatste aanpassing: september 2023. Link: https://richtlijnen.nhg.org/standaarden/pijnhttps://richtlijnen.nhg.org/standaarden/pijn
NVN, 2020. Richtlijn Lumbosacraal Radiculair Syndroom (LRS). Beoordeeld: 21-09-2020. Link: https://richtlijnendatabase.nl/richtlijn/lumbosacraal_radiculair_syndroom_lrs/startpagina_-_lrs.html
Radhakrishnan K, Litchy WJ, O'Fallon WM, Kurland LT. Epidemiology of cervical radiculopathy. A population-based study from Rochester, Minnesota, 1976 through 1990. Brain. 1994 Apr;117 ( Pt 2):325-35. doi: 10.1093/brain/117.2.325. PMID: 8186959.
Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.
Zoekverantwoording
Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.