Meetinstrumenten SAPS
Uitgangsvraag
Welke meetinstrumenten zijn het meest geschikt om het effect van behandeling van SAPS te meten?
Aanbeveling
Het is aan te bevelen visuele inschatting van de range of motion alleen te gebruiken om onderscheid te maken tussen de aangedane en de contralaterale schouder.
Het is aan te bevelen voor metingen van de range of motion gebruik te maken van een goniometer.
De werkgroep adviseert minimaal één van de volgende meetinstrumenten te gebruiken voor evaluatie van behandeling van SAPS: de Disabilities of the Arm, Shoulder and Hand (DASH), Dutch Oxford Shoulder Score (DOSS), Dutch Simple Shoulder Test (DSST) of de Shoulder Disability Questionnaire (SDQ-NL).
Overwegingen
Visuele inschatting van de ROM lijkt hooguit voldoende adequaat als het gaat om onderscheid te maken tussen de aangedane en de contralaterale zijde. Het gebruik van een goniometer (of inclinometer) kan de betrouwbaarheid van de metingen vergroten; het is eenvoudig in het gebruik en goedkoop in de aanschaf. Wanneer het echter om herhaalde metingen gaat is het raadzaam deze door dezelfde persoon te laten uitvoeren, gezien de lage inter-beoordelaar betrouwbaarheid.
Bij de keuze van een meetinstrument voor de evaluatie van de behandeling van SAPS, kunnen een aantal afwegingen worden gemaakt. In de eerste plaats is het van belang dat het meetinstrument gevalideerd is in het Nederlands. Aangezien dit niet het geval is voor de Constant-Murley score en de QuickDASH-DLV, zijn deze niet aan te raden voor gebruik in Nederland. Alhoewel de DASH een vrij uitvoerig meetinstrument is en niet schouderspecifiek is, wordt deze wel veelvuldig toegepast binnen (internationale) schouderstudies. De Simple Shoulder Test en de Oxford Shoulder Score zijn meetinstrumenten met relatief weinig vragen en zijn eenvoudig in het gebruik. De Nederlandse Shoulder Disability Questionnaire is met 16 vragen een middellange vragenlijst en is eveneens eenvoudig in het gebruik. De Shoulder Rating Questionnaire daarentegen is wat uitvoeriger, heeft een meer ingewikkelde berekening van de somscore en heeft in het geval van bepaalde items relatief vaak ontbrekende antwoorden. Deze laatste is daarom minder aan te bevelen. De enige aandoening specifieke vragenlijst is de WORC. Deze is echter dermate recent beschikbaar gekomen (epub ahead of print jul 2012) dat hiermee nog geen ervaring is opgebouwd in Nederland. Derhalve kan deze vragenlijst nog niet worden aanbevolen. De keuze van een meetinstrument zal met name ook genomen moeten worden op basis van de gewenste toepassing: evaluatie van eigen klinisch handelen, welke patiëntenpopulatie, vergelijking met andere studieresultaten, etc.
Onderbouwing
Achtergrond
Er bestaan een groot aantal meetinstrumenten die schouderpijn en/of –functie meten. Deze zijn diagnose/aandoening specifiek (bijvoorbeeld instabiliteit of rotator cuff aandoeningen) of hebben betrekking op de schouder in het algemeen (bijvoorbeeld schouderfunctie, schouderpijn of klachten van nek, arm en schouder). Sommigen worden door de patiënt zelf ingevuld (patient-based), anderen door de onderzoeker/arts (physician-based). Verschillende van de origineel ontwikkelde meetinstrumenten zijn door de jaren heen gemodificeerd, zoals de (individueel relatieve) Constant-Murley score Het merendeel van de schouder meetinstrumenten zijn ontwikkeld in/voor Engelstalige toepassing. Slechts een beperkt deel hiervan is in het Nederlands vertaald en gevalideerd. In dit hoofdstuk worden uitsluitend meetinstrumenten vermeld die bruikbaar zijn voor SAPS. Het doel van dit hoofdstuk is om een overzicht te geven van de meetinstrumenten die schouderpijn en/of -functie meten, welke internationaal gepubliceerd en voor Nederland gevalideerd (en vertaald) zijn.
Conclusies
Niveau 2 |
Het is aannemelijk dat metingen van ROM met behulp van meetinstrumenten (goniometrie en inclinometrie) betrouwbaarder zijn dan op basis van visuele inschatting.
Bronnen (A2: Pol, R.J. van der, 2010 |
Niveau 2 |
Het is aannemelijk dat Dutch Shoulder Disability Questionnaire responsief is.
Bronnen (B: Heijden, G.J.M.G. van der, 2000; Windt, D.A.W.M. van der, 1998) |
Niveau 2/3 |
Het is aannemelijk dat de interne consistentievan de Dutch Simple Shoulder Test hoog is en de construct validiteit matig tot goed (niveau 2).
Er zijn aanwijzingen dat de test-hertest betrouwbaarheid van de DSS erg goed is (niveau 3; N=55).
Bronnen (A2/B: Kampen, D.A. van, 2011) |
Niveau 3 |
Er is onvoldoende inter-beoordelaar betrouwbaarheid van visuele inschatting van de ROM. De visuele inschatting van de ROM is alleen een geschikte methode om onderscheid te maken tussen de aangedane en de contralaterale schouder.
Bronnen (B: Terwee, C.B, 2011) |
Niveau 3 |
Er zijn aanwijzingen dat de inter-beoordelaar betrouwbaarheid van ROM gemeten met behulp van een digitale inclinometer voor individuele patiënten slecht is, waarbij verschillen in ROM minder dan 20-25 graden niet worden onderscheiden van de meetfout.
Bronnen (B: Winter, A.F. de, 2004) |
Niveau 3 |
Er zijn aanwijzingen dat er een redelijke criteriumvaliditeit bestaat voor hand-vastgehouden dynamometers en statische dynamometers voor isometrische spierkrachtmetingen van flexie, exorotatie en abductie van de schouder.
Bronnen (B: Roy, S.J., 2009) |
Niveau 3 |
Er zijn aanwijzingen dat de DASH-DLV een uitstekende interne consistentie heeft, een redelijke test-hertest betrouwbaarheid en redelijke criteriumvaliditeit.
Bronnen (B: Veehof, M.M., 2002) |
Niveau 3 |
Er zijn aanwijzingen dat de Dutch Oxford Shoulder Score een hoge test-hertest betrouwbaarheid heeft, een hoge interne consistentie en een zwak tot matige criteriumvaliditeit heeft.
Bronnen (B: Berendes, T., 2010) |
Niveau 3 |
Er zijn aanwijzingen dat de Dutch Shoulder Rating Questionnaire een hoge interne consistentie heeft, een hoge test-hertest betrouwbaarheid, een zwakke tot goede criteriumvaliditeit heeft en behoudens het domein werk, een geschikt instrument is om klinische verschillen aan te tonen.
Bronnen (B: Vermeulen, H.M., 2005) |
Niveau 3 |
Er zijn aanwijzingen dat de Dutch Western Ontario rotator cuff Index een hoge interne consistentie heeft en een hoge test-hertest betrouwbaarheid.
Bronnen (B: Wiertsema, S.H., 2012) |
Niveau 4 |
Het is mogelijk dat isokinetische spierkracht metingen met behulp van een dynamometer een goede betrouwbaarheid hebben op groepsniveau en een slechte betrouwbaarheid op individueel niveau.
Bronnen (C: Meeteren, J. van, 2002) |
Samenvatting literatuur
Meten van range of motion (ROM)
Klachten van de schouder houden veelal verband met een beperkte ROM, oftewel een beperkt bewegingsbereik. Het meten van de ROM van de schouder speelt niet alleen een belangrijke rol in het stellen van een diagnose of in het beoordelen van de ernst van de beperking, maar ook in het meten van het effect van een behandeling. Verschillende methoden zijn beschikbaar voor het kwantificeren van de ROM, zoals goniometrie en inclinometrie (Winter, A.F. de, 2004). In de klinische praktijk wordt echter vaak gebruik gemaakt van een visuele inschatting van de schouder ROM.
Terwee, C.B, 2011 heeft de inter-beoordelaars betrouwbaarheid van de visuele inschatting van de ROM van actieve en passieve bewegingen van de schouder beoordeeld. Daarnaast heeft hij gekeken of klinische karakteristieken van invloed waren op deze betrouwbaarheid. De inter-beoordelaars betrouwbaarheid bleek het laagste te zijn voor de actieve en passieve elevatie, met name bij patiënten met veel pijn en schouderbeperkingen. De waarde van visuele beoordeling van de ROM door verschillende onderzoekers is derhalve twijfelachtig. Behalve voor de horizontale adductie lijkt visuele inschatting van de ROM wel een geschikte methode om onderscheid te maken tussen de aangedane en de contralaterale schouder (intra-class correlatie coëfficiënt (ICC) resp. 0,49 versus >0,70).
Winter, A.F. de, 2004 heeft de inter-beoordelaars betrouwbaarheid onderzocht van waarden van de bewegingsuitslag (ROM), gemeten met behulp van een digitale inclinometer (Cybex Electronic Digital Inclinometer-320), hetgeen een goedkoop en gemakkelijk te hanteren instrument is. Twee fysiotherapeuten hebben onafhankelijk van elkaar de passieve ROM van de glenohumerale abductie en exorotatie gemeten bij 155 patiënten met schouderpijn. Het percentage van overeenstemming binnen 10o was voor abductie en exorotatie respectievelijk 72 en 70%. De ICC varieerde van 0,28 tot 0,90, waarbij de contralaterale zijde slechter scoorde (abductie 0,28 en exorotatie 0,56) dan de aangedane zijde (abductie 0,83 en exorotatie 0,90). De inter-beoordelaar betrouwbaarheid is daarmee slecht te noemen. Als individuele patiënten door twee verschillende personen worden beoordeeld, dan kunnen verschillen in ROM minder dan 20-25 graden niet worden onderscheiden van de meetfout. Daarentegen is er wel een acceptabele betrouwbaarheid gevonden voor de inclinometrische metingen van de aangedane zijde en de verschillen tussen de aangedane en contralaterale zijde, hetgeen aangeeft dat de inclinometrie wel nuttig is voor studies waarin groepen met elkaar vergeleken worden.
Pol, R.J. van der, 2010 hebben een systematische review gepubliceerd waarin zij studies samenvatten die de inter-beoordelaars betrouwbaarheid van passieve bewegingen van de schouder, elleboog en pols/hand/vingers onderzoeken (n=21). Dertien studies hebben betrekking op de schouder en meten de ROM middels goniometrie (n=2), inclinometrie (n=4), visuele inschatting (n=6) en tape meting (n=1). De meeste studies hebben een slechte kwaliteit. Eén studie van hoge kwaliteit vond echter een bijna perfecte betrouwbaarheid voor visuele inschatting van de ROM (abductie ICC 0,96 en exorotatie ICC 0,70). Tussen de andere studies werd echter een grote variatie gevonden in met name exorotatie en abductie. Over het algemeen bleken de metingen van ROM met behulp van meetinstrumenten (goniometrie en inclinometrie) betrouwbaarder dan op basis van visuele inschatting.
Meten van isokinetische spierkracht
Isokinetische dynamometrie wordt gebruikt om zowel de ROM als de spierkracht te meten. Isokinetische metingen van de schouder kunnen in verschillende uitgangsposities (zittend, staand, liggend en met verschillende hoeken van abductie, anteflexie, etc.). Het is echter niet bekend wat de meest betrouwbare positie is.
Meeteren, J. van, 2002 hebben de test-hertest betrouwbaarheid van isokinetische spierkracht metingen met behulp van een dynamometer onderzocht voor abductie, adductie, exo- en endorotatie. Verschillen in gemiddeld maximumkoppel, uitgesplitst naar spiergroep en geslacht, waren significant. De intraclass correlatiecoëfficiënt varieerde van 0,69 tot 0,92. Dit betekent een goede tot uitstekende betrouwbaarheid voor wat betreft de onderzoeksgroepen. Om de test-hertest betrouwbaarheid voor twee opeenvolgende metingen van een individu te bepalen, is het kleinst detecteerbare verschil berekend, wat varieerde van 21 tot 43%. Daarmee is het twijfelachtig of dit verschil klein genoeg is om werkelijke verschillen in spierkracht te detecteren. Door de auteurs konden hogere of lagere scores bij de tweede meting verklaard worden door een leereffect, dan wel door een lagere motivatie.
Meten van isometrische spierkracht
Bij isometrische spierkracht wordt een contractie geleverd zonder beweging. De meest bekende toepassing van het meten van isometrische spierkracht als onderdeel van een meetinstrument, is het meten van isometrische abductiekracht als onderdeel van de Constant-Murley Score (zie 7.4). De isometrische spierkracht kan gemeten worden met relatief dure statische, maar ook nauwkeurige, dynamometers (bijvoorbeeld Cybex®) die niet makkelijk verplaatsbaar zijn, maar ook met goedkopere hand-vastgehouden dynamometers (bijvoorbeeld handyscale®) die makkelijk in het gebruik en makkelijk mee te nemen zijn.
Roy, S.J., 2009 hebben de criteriumvaliditeit van de hand-vastgehouden JTech PowerTrack IITM dynamometer en de LIDO WorksetTM statische dynamometer voor isometrische spierkracht van flexie, exorotatie en abductie van de schouder onderzocht. De Pearson correlaties varieerden van 0.81 tot 0.87 (95% confidence interval: 0.66 – 0.92), wat wijst op een goede criteriumvaliditeit. Hieruit kan worden geconcludeerd dat beide instrumenten valide metingen van isometrische spierkracht van de schouder kunnen geven.
Constant-Murley Score (CMS)
De CMS is wereldwijd het meest gebruikte schouder meetinstrument (Constant, C.R., 1987 Het instrument is zowel patiënt-based als physician-based in de verhouding 35:65. Het subjectieve deel bestaat uit vragen met betrekking tot pijn (maximaal 15 punten) en dagelijkse activiteiten (maximaal 20 punten) en de objectieve metingen betreffen de ROM (maximaal 40 punten) en isometrische spierkracht bij abductie (maximaal 25 punten). De somscore varieert van 0 (slechtste score) tot maximaal 100 punten (beste score). Van de actieve ROM worden de anteflexie, de abductie, de endo- en exorotatie gemeten, waarbij de behaalde graden anteflexie en abductie met een goniometer bepaald worden. Voor het meten van de endo- en de exorotatie moeten bepaalde houdingen worden aangenomen, waarbij gekeken wordt of bepaalde posities van de armen ten opzichte van het lichaam kunnen worden bereikt. Bij het meten van de isometrische spierkracht wordt gebruik gemaakt van een dynamometer (Cybex II), waarbij de arm in 900 abductie moet worden gehouden. De maximale score is 25 “pound” voor een 25 jaar oude man (ongeveer 11 kg), hetgeen 25 punten oplevert. Omdat de spierkracht met toename van de leeftijd afneemt, zijn er normtabellen ontwikkelt voor mannen en vrouwen van verschillende leeftijden. Alhoewel de CMS reeds lange tijd voor klinische en wetenschappelijke doeleinden in Nederland wordt gebruikt, is deze nog steeds niet voor het Nederlands gevalideerd.
Disabilities of the Arm, Shoulder and Hand (DASH)
De DASH vragenlijst is een patiënt-based vragenlijst en is ontwikkeld door de American Academy of Orthopedic Surgeons en het Institute for Work and Health (Hudak, P.C., 1996. Het is bedoeld om symptomen gerelateerd aan klachten van de arm te beoordelen, evenals het vermogen om activiteiten uit te voeren. De in het Nederlands vertaalde vragenlijst bestaat uit 30 items, waarvan 21 betrekking hebben op fysiek functioneren (bijvoorbeeld een maaltijd bereiden, een sleutel omdraaien), zes betrekking hebben op symptomen (bijvoorbeeld arm-, schouder- of handpijn, tintelingen) en drie op sociale of rolfuncties (bijvoorbeeld in welke mate arm-, schouder- of handproblemen van invloed zijn op sociale activiteiten met familie en vrienden). De items worden gescoord op een 5-punt Likert-schaal en betreffen situaties van de afgelopen week. Met behulp van een formule worden de ruwe scores omgerekend naar een eindscore van 0 (minimale beperkingen) tot 100 (maximale beperkingen). In 2005 is er door Beaton, D.E., 2005 een verkorte versie van de DASH gepubliceerd, QuickDASH genaamd, bestaande uit 11 items. Uit een vergelijkend onderzoek van Gummesson, C., 2009 blijkt dat de gemiddelde scores op de QuickDASH gemiddeld wat hoger uitvallen vergeleken met de DASH (4,2; 95% BI 3,2-5,3), maar dat de overall effect size en de standardized response mean van beide vragenlijsten gelijk zijn. De QuickDASH kan daarom met gelijke precisie gebruikt worden als de DASH voor aandoeningen van de bovenste extremiteit. Alhoewel de QuickDASH wel naar het Nederlands vertaald is door Schuurman (UMC Utrecht) en in de klinische praktijk wordt toegepast, is deze nog niet voor het Nederlands gevalideerd.
Veehof, M.M., 2002 hebben van de Nederlandse versie van de DASH (DASH-DLV) verschillende psychometrische kwaliteiten beoordeeld bij 50 patiënten met unilaterale klachten van de arm (vinger(s), hand, pols of elleboog). Zij onderzochten de interne consistentie, de test-hertest betrouwbaarheid en de criteriumvaliditeit. De interne consistentie geschat met behulp van de Cronbach’s Alpha was 0,95 (vrijwel perfect). In het test-hertest onderzoek werd een klein, maar significant gemiddeld verschil (1,7 ± 4,2 (p <0,01)) gevonden waarbij de hertest scores iets lager waren dan de initiële scores. Dit werd door de onderzoekers verklaard door het feit dat de patiënten tussen het invullen van de eerste en de tweede vragenlijst een behandeling hadden gehad, hetgeen op zichzelf succesvol kan zijn geweest, dan wel een positief effect kan hebben gehad op de psychologische status van de deelnemers. De Pearson’s correlatie coëfficiënt tussen de test en hertest scores was substantieel (Kappa coëfficiënt=0,67, p <0,001). De Canadian Occupational Performance Measure (COPM) is gebruikt als referentie meetinstrument voor het bepalen van de criteriumvaliditeit. Tussen de corresponderende items van beide vragenlijsten werd een Kappa coëfficiënt van 0,79 (p <0,001; substantiële correlatie) gevonden. De COPM is echter niet gevalideerd voor schouderpatiënten.
Simple Shoulder Test (SST)
De SST is een schouder specifieke patiënt-based 12-item vragenlijst, ontwikkeld door Lippit, S.B., 1993 voor patiënten met veel voorkomende schouderaandoeningen, zoals rotator cuff rupturen, impingement, instabiliteit en artrose. Voor elke vraag moet de patiënt aangeven of hij in staat is een activiteit uit te voeren en heeft hierbij een dichotome antwoordmogelijkheid. De somscore varieert van 0 (slechtst) tot 12 (best) voor de schouderfunctie. Bij één of twee ontbrekende items werden deze vervangen door het gemiddelde van de overige vragen. Bij meer ontbrekende items wordt de vragenlijst als ongeldig verklaard en wordt er geen somscore berekend.
De SST is door Kampen, D.A. van, 2011 naar het Nederlands vertaald en onderzocht op interne consistentie, test-hertest betrouwbaarheid en criterium validiteit. Verder doen de auteurs nog uitspraken over het plafond- en vloereffect en geven onterecht aan dat zij ook de responsiviteit meten. Naast de SST hebben de patiënten de Oxford Shoulder Score, de DASH en de Short Form 36 ingevuld en is de CMS afgenomen. De onderzoekers vonden een hoge interne consistentie, met een Cronbach’s Alpha van 0,78. De test-hertest betrouwbaarheid was erg goed (ICC 0,92). De criterium validiteit was goed, zoals verwacht, met hoge correlaties tussen de Nederlandse SST, de DASH (r=-0,74) en de Oxford Shoulder Score (r=-0,74), en een matige correlatie met de CMS (r=0,59). De kleinste klinisch relevante verandering die gevonden werd was 3,3, hetgeen betekent dat als men een behandeleffect wil vaststellen, iemand minimaal 3,3 punten op de SST vooruit moet gaan. Dan weet men zeker dat het geen random fout betreft. Er werden geen plafond- en vloereffecten gevonden: 1,8% van alle patiënten had de laagst mogelijke score (0) en 13,6% behaalde de hoogst mogelijke score (12).
Oxford Shoulder Score (OSS)
De OSS is een schouder specifieke patiënt-based 12-item vragenlijst, ontwikkeld door Dawson et al., in 1996 voor patiënten met degeneratieve afwijkingen of ontstekingen van de schouder. De lijst is niet geschikt voor instabiliteit van de schouder. Voor elke vraag zijn vijf categorieën van antwoorden, welke van één tot vijf gescoord worden. De somscore varieert van 12 (beste) tot 60 (slechtste score). De vragen hebben betrekking op pijn en eventuele handicaps in privé en beroepssituaties.
Berendes, T., 2010 hebben de OSS naar het Nederlands vertaald en getest voor wat betreft de interne consistentie, de test-hertest betrouwbaarheid en criteriumvaliditeit. De ICC voor deze groep was 0,98, met een gemiddeld verschil tussen beide metingen van 2,7 punten. De interne consistentie was hoog (Cronbach’s alpha 0,92), waarbij slechts twee items een lage correlatie hadden met de totale correlatie (0,46 en 0,38). De criteriumvaliditeit is beoordeeld met de (Dutch) SST, de MOS Short Form 36 en de CMS als referenties, berekend met de Pearson correlatie coëfficiënt. Voor alle vergelijkende scores werden significante correlaties gevonden (R=0,20-0,68), behalve voor “geestelijke” (R=0,15) en “algemene gezondheid” (R=0,10). Als kanttekening moet hierbij vermeld worden dat de CMS niet voor het Nederlands gevalideerd is (zie kopje: meten van isometrische spierkracht).
Shoulder Disability Questionnaire (SDQ)
De SDQ is een schouder specifieke vragenlijst die pijngerelateerde beperkingen meet. De SDQ-NL is in 1996 door Van der Heijden et al., ontwikkeld (gepubliceerd in 2000) en heeft de Shoulder Disability Questionnaire (SDQ-UK) van Croft, P., 1994 als uitgangspunt. De vragenlijst bestaat uit 16 vragen die veel voorkomende situaties beschrijven, betreffende de afgelopen 24 uur, die klachten kunnen veroorzaken bij patiënten met schouderklachten. De vragen kunnen beantwoord worden met “ja”, “nee” of “niet van toepassing” (indien niet voorgekomen in de afgelopen 24 uur). De score wordt berekend door het aantal positief beantwoorde vragen te delen door het aantal items dat van toepassing was, vermenigvuldigd met 100 (range 0 (geen beperkingen) tot 100 (alle items positief beantwoord)).
(Heijden, G.J.M.G. van der, 2000) heeft de responsiviteit onderzocht van de SDQ-NL. Volgens de gecalibreerde responsiviteit ratio (1,14) en de oppervlakte onder de ROC (0,72) discrimineert de SDQ-NL nauwkeurig tussen klinisch stabiele en verbeterde patiënten.
(Windt, D.A.W.M. van der, 1998) hebben de responsiviteit van de SDQ-NL onderzocht. Als vergelijkend instrument werd een vraag gesteld over de functionele status (FSQ) en een vraag betreffende de ernst van de pijn (PSS). De responsiviteit ratio’s waren iets hoger voor de PSS vergeleken met de SDQ-NL (2,53 versus 2,22 na één maand, 2,24 versus 1,89 na zes maanden). De oppervlakte onder de ROC was 0,84 voor zowel de SDQ-NL als de PSS en 0,72 voor de FSQ. Een verandering van score van 18,75 punten (drie items op de SDQ-NL) geeft de kleinste klinisch relevante verandering weer. Er kan geconcludeerd kan worden dat de SDQ-NL responsief is en dat het een nuttig instrument is voor het meten van functionele beperkingen in longitudinale studies.
Shoulder Rating Questionnaire (SRQ)
In 1997 hebben LInsalata, J.C., 1997 het design gepubliceerd van de SRQ. In tegenstelling tot meetinstrumenten als bijvoorbeeld de SDQ-NL, heeft de SRQ twee extra dimensies, te weten: recreatieve en sportieve activiteiten en werk. De overige dimensies zijn: pijn, dagelijkse activiteiten (ADL) en gebieden van verbetering en voldoening. De vragenlijst bestaat uit een visueel analoge schaal (VAS) voor een globale inschatting hoe het met de schouder gaat en 19 meerkeuze vragen (score 1=slechtst tot 5=best). De scores op de vijf subschalen worden berekend door de gemiddelde scores van de betreffende vragen te vermenigvuldigen met twee en een gewogen factor. De VAS levert maximaal 15 punten op, pijn maximaal 40 punten, dagelijkse activiteiten (ADL) maximaal 20 punten, recreatieve en sportieve activiteiten maximaal 15 punten en werk maximaal 10 punten. De somscore varieert van minimaal 17 tot maximaal 100 punten. Een nadeel van de vragenlijst is dat er verschillende vragen onbeantwoord kunnen blijven doordat een patiënt een activiteit niet uitvoert (zoals het werpen van een bal).
(Vermeulen, H.M., 2005) hebben de SRQ vertaald en de interne consistentie, de test-hertest betrouwbaarheid, de criteriumvaliditeit en responsiviteit onderzocht. Naast de SRQ werd 1) de ROM bepaald (flexie, abductie en exorotatie), 2) de spierkracht gemeten met behulp van een dynamometer (glenohumerale abductie, elevatie en exorotatie), 3) de VAS pijn in rust, tijdens beweging en ‘s nachts afgenomen, 4) de armfunctie en werkdimensies van de Nederlandse Arthritis Impact Measurement Scales-2 (Dutch-AIMS2 arm functie en werk), 5) de SDQ, 6) de Shoulder Assessment Scale, 7) de Short Form-36 ingevuld en 8) de subjectieve beoordeling van de schouder na behandeling gevraagd. De Cronbach’s Alpha voor interne consistentie voor de hele vragenlijst was 0,89 en respectievelijk 0,81, 0,80, 0,72 en 0,84 voor de domeinen pijn, ADL, sport/recreatieve activiteiten en werk. 93 van de 97 patiënten hebben de SRQ binnen een week retour gezonden (ten behoeve van de test-hertest betrouwbaarheid). De ICC voor de gehele SRQ was 0,85 (afzonderlijke domeinen: globale beoordeling ICC 0,63; pijn ICC 0,81; ADL ICC 0,66; sport/recreatieve activiteiten ICC 0,80; werk ICC 0,86). Op de tweede vragenlijst werd echter significant beter gescoord voor de somscore en de domeinen ADL en sport/recreatieve activiteiten. De auteurs verklaren dit als regressie naar het gemiddelde. De Spearman’s correlatie coëfficiënt voor de criteriumvaliditeit waren zwak tot matig voor de ROM r = 0,13 - -0,57; Dutch-AIMS2 arm functie r = -0,49; SDQ r = -0,31; Short Form-36 (mentale gezondheid) r = 0,34. Hogere correlatie coëfficiënten werden gevonden voor de Dutch AIMS2 werk r = -0,74; SFA r = 0,62; Short Form-36 (fysieke gezondheid) r = 0,62. De data van 97 patiënten zijn gebruikt voor het vergelijken van de verschillen tussen baseline en follow-up (ten behoeve van de responsiviteit).
Behalve het domein werk (SRM 0,27), blijken alle overige domeinen uitermate geschikt om klinische verschillen aan te tonen (SRM 1,0 – 1,11). Een verandering van score van 15,2 punten geeft de kleinste klinisch relevante verandering weer.
Western Ontario rotator cuff Index (WORC)
In 2003 hebben (Kirkley, A., 2003) het design van de Western Ontario Rotator Cuff Index gepubliceerd, een quality-of-life vragenlijst speciaal ontwikkeld voor aandoeningen van de rotator cuff. De WORC is een patient-based vragenlijst bestaande uit 21 items verdeeld over vijf domeinen: zes items fysieke symptomen, vier items sport en recreatie, vier items werk, vier items lifestyle en drie items emoties. Elk item wordt op een 100-mm visueel analoge schaal gescoord (VAS). De totaal score varieert van 0 tot 2100 punten, met een hogere score overeenkomend met een afgenomen gezondheid gerelateerd quality-of-life.
(Wiertsema, S.H., 2012) hebben de WORC naar het Nederlands vertaald en hebben de interne consistentie en de test-hertest betrouwbaarheid onderzocht. Hiervoor zijn respectievelijk de Cronbachs α en de intraclass correlatie coëfficiënt berekend. De Cronbachs α varieerde van 0,91 tot 0,97 voor de totale WORC score en de vijf verschillende domeinen. De intraclass correlatie coëfficiënt was 0,94 voor de totale WORC score en varieerde tussen 0,85 en 0,91 voor de verschillende domeinen. De WORC heeft daarmee een goede interne consistentie en een goede reproduceerbaarheid. Op het moment van schrijven van deze richtlijn is het artikel van (Wiertsema, S.H., 2012) nog niet officieel gepubliceerd, maar slechts als “epub ahead of print” beschikbaar. Daardoor is met de Nederlandse vertaling van de WORC nog geen of weinig ervaring.
Zoeken en selecteren
De methodologische kwaliteit van de studies werd beoordeeld aan de hand van de COSMIN checklist (Terwee, C.B, 2011). Deze checklist is ontwikkeld en gevalideerd voor het beoordelen van studies die de klinimetrische kwaliteit van meetinstrumenten evalueren. De methodologische kwaliteit van de studies wordt gescoord als uitstekend, goed, matig of zwak. Deze eindscore wordt bepaald door het laagst gescoorde item binnen de te beoordelen categorie. Voor iedere COSMIN-score zal aangegeven worden welk item het laagst gescoord heeft.
Referenties
- Beaton, D.E., Wright, J.G., Katz, J.N., & Upper Extremity Collaborative Group. (2005). Development of the QuickDASH: comparison of three item-reduction approaches. J Bone Joint Surg Am, 87, 1038-46.
- Berendes, T., Pilot, P., Willems, J., Verburg, H., & Slaa, R. te. (2010). Validation of the Dutch version of the Oxford Shoulder Score. J Shoulder Elbow Surg, 19, 829-836.
- Constant, C.R., & Murley, A.H. (1987). A clinical method of functional assessment of the shoulder. Clin Orthop Relat Res, 214, 160-4.
- Croft, P., Pope, D., Zonca, M. O’Neill, T., & Silman, A. (1994). Measurement of shoulder disability: results of a validation study. Ann Rheum Dis, 53, 525-8.
- Dawson, J., Fitzpatrick, R., & Carr A. (1996). Questionnaire on the perceptions of patients about shoulder surgery. J Bone Joint Surg Br, 78, 593-600.
- Fialka, C., Oberleitner, G., Stampfl, P., Brannath, W., Hexel, M., & Vecsei, V. (2005). Modification of the Constant-Murley shoulder score-introduction of the individual relative Constant score Individual shoulder assessment. Injury, 36, 1159-1165.
- Gummesson, C., Ward, M.M., & Atrosi, I. (2009). The shortened disabilities of the arm, shoulder and hand questionnaire (QuickDASH): validity and reliability based on responses within the full-length DASH. BMC Musculoskelet Disord, 18, 7-44.
- Heijden, G.J.M.G. van der, Leffers, P., & Bouter, L.M. (2000). Shoulder disability questionnaire design and responsiveness of a functional status measure. J Clin Epidemiol, 53, 29-38.
- Hudak, P.C., Amadio, P.C., & Bombardier, C. (1996). Development of an upper extremity outcome measure: the DASH (Disabilities of the Arm, Shoulder and Hand). Am J Indust Med, 29, 602-8.
- Kampen, D.A. van, Beers, L.W. van, Scholtes, V.A., Terwee, C.B., & Willems, W.J. (2011). Validation of the Dutch version of the Simple Shoulder Test. J Shoulder Elbow Surg, 0, x-x.
- Kirkley, A., Alvarez, C., & Griffin, S. (2003). The development and evaluation of a disease-specific quality-of-life questionnaire for disorders of the rotator cuff: The Western Ontario Rotator Cuff Index. Clin J Sport Med, 13, 84-92.
- LInsalata, J.C., Warren, R.F., Cohen, S.B., Altchek, D.W., & Peterson, M.G.E. (1997). A self-administered questionnaire for assessment of symptoms and function of the shoulder. J Bone Joint Surg Br, 79, 738-48.
- Lippit, S.B., Harryman, D.T., & Matsen, F.A. III. (1993). A practical tool for evaluating function: the Simple Shoulder Test. In: Matsen, F.A. III, Fu, F.H., Hawkins, R.J., editors. The shoulder: a balance of mobility and , 0, x-x.
- Meeteren, J. van, Roebroeck, M.E., & Stam, H.J. (2002). Test-retest reliability in isokinetic muscle strength measurements of the shoulder. J Rehabil Med, 34, 91-95.
- Pol, R.J. van der, Trijffel, E. van, & Lucas, C. (2010). Inter-rater reliability for measurement of passive physiological range of motion of upper extremity joints is better if instruments are used: a systematic review. J Psysiother, 56, 7-17.
- Roy, S.J., MacDermid, J.C., Orton, B., Faber, K.J., Drosdowech, D., & Athwal, G.S. (2009). The concurrent validity of a hand-held versus a stationary dynamometer in testing isometric shoulder strength. J Hand Ther, 22, 320-7.
- Terwee, C.B, Mokkink, L.B., Knol, D.L., Ostelo, R.W., Bouter, L.M., & Vet, H.C. de. (2011). Rating the methodological quality in systematic reviews of studies on measurement properties: a scoring system for the COSMIN checklist.. Qual Life Res, 0, x-x.
- Veehof, M.M., Sleegers, E.J.A., Veldhoven, N.H.M.J. van, Schuurman, A.H., & Meeteren, N.L.U. van. (2002). Psychometric Qualities of the Dutch Language Version of the Disabilities of the Arm, Shoulder, and Hand Questionnaire (DASH-DLV). . J Hand Ther, 15, 347-354.
- Vermeulen, H.M., Boonman, D.C.G., Schüller, H.M., Obermann, W.R., Houwelingen, H.C. van, Rozing, P.M., & Vliet Vlieland, T.P.M. (2005). Translation, adaptation and validation of the Shoulder Rating Questionnaire (SRQ) into the Dutch language. Clinical Rehabilitation, 19, 300-311.
- Wiertsema, S.H., Rietberg, M.B., Hekman Schothorst, M., Steultjens, M.P., & Dekker, J. (2012). Reproducibility of the Dutch version of the Western Ontario rotator cuff Index. J Shoulder Elbow Surg, 0, x-x.
- Windt, D.A.W.M. van der, Heijden, G.J.M.G. van der, Winter, A.F. de, Koes, B.W., Devillé, W., & Bouter, L.M. (1998). The responsiveness of the Shoulder Disability Questionnaire. Ann Rheum Dis, 57, 82-87.
- Winter, A.F. de, Heemskerk, M.A.M.B., Terwee, C.B., Jans, M.P., Devillé, W., Schaardenburg, D.J. van, … Bouter, L.M. (2004). Inter-observer reproducibility of measurements of range of motion in patients with shoulder pain using a digital inclinometer. BMC Musculoskelet Disord, 5, 18-x.
Evidence tabellen
Research question: what are the measurement properties of instruments used to evaluate treatment of subacromial pain syndrome?
Study reference |
Study characteristics |
Patient characteristics |
Type of test
|
Follow-up |
Outcome measures and effect size |
Level of evidence |
Comments |
Berendes, 2010 |
Translation and validation of the Dutch version of the Oxford Shoulder Score (OSS)
Netherlands
No funding reported |
Inclusion criteria: patients suffering from degenerative and inflammatory changes, together with post-traumatic problems of the shoulder region (arthritis, cuff pathology, or tendinitis calcarea) selected from out-patient clinics.
Exclusion criteria: none mentioned.
N= 103 |
After inclusion the patients completed the Dutch OSS together with the Dutch Simple Shoulder Test (DSST), the MOS SF-36 and the Constant-Murley Shoulder Score. Internal consistency was tested for the OSS. 27 patients filled in the OSS twice for testing of test-retest reliability. Criterium validity was determined by comparing the OSS with various subscales of the generic MOS SF-36, the Constant-Murley Assessment Score and the DSST. |
103 patients completed the questionnaires and were investigated clinically (60 patients included in Delft and 43 patients included in Amsterdam).
The patients seen in Delft were asked to fill in the questionnaire twice for testing of test-retest reliability. Thirty-seven questionnaires were received; however, 10 were anonymous, leaving 27 for evaluation (45 % useful response).
|
Intra-class correlation coefficient for test-retest reproducibility was R = .981.
The Cronbach’s alpha for internal consistency was 0.921.
The criterium validity was tested by the Pearson correlation coefficient. There was a significant correlation between the Dutch OSS and the DSST (0.61), the Constant-Murley Score (0.64) and most subscales of the MOS SF-36 (0.20 – 0.68). Only the subscales mental health and general health did not have a significant correlation at the 0.01 level (2-tailed; P=.123 and P=.316, respectively). |
Test-retest reproducibility – cosmin score: weak (1. Small sample size and 2. nonresponse 55%).
Internal consistency – cosmin score: weak (factor analysis not performed and no reference to another study).
Criterium validity – cosmin score: fair (1. not clear how missing items were handled and 2. Unclear whether the criterion used can be considered an adequate ‘gold’ standard).
|
|
De Winter, 2004 |
Inter-observer reproducibility of measurements of range of motion in patients with shoulder pain using a digital inclinometer.
Netherlands
No funding reported
|
Inclusion criteria: patients with shoulder complaints aged between 18 and 75 years, ability to co-operate (no dementia, sufficient knowledge of the Dutch language).
Exclusion criteria: shoulder problems due to neurological, vascular or internal disorders, systemic rheumatic diseases, prior dislocations or fractures.
N=201 |
Two observers independently measured the range of motion of the shoulder joint using the Cybex Electronic Digital Inclinometer-320 (EDI 320). Each observer measured both shoulders once. Passive glenohumeral abduction was measured first, followed by measurements of the passive external rotation. Within one hour the second observer repeated the measurements of the first observer. The sequence of the observers was randomly allocated. The patients did not receive any therapy between the two measurements. The performance of all measurements were standardized, to make sure that the physiotherapists assessed the patients in the same way. |
Complete data on the inclinometric measurements were available for 155 of the 201 patients included.
No inclinometric measurements were available for 46 patients, for the following reasons: no measurements were performed because of high pain intensity (30 patients), lack of time (3 patients), difficulties during the measurement procedure (8 patients), and errors in the registration of the measurement results (5 patients). |
Reproducibility For the affected side, the limits of agreement were 0.8±19.6 for the glenohumeral abduction and -4.6±18.8 for external rotation. The percentage agreement within 100 for these measurements were 72% and 70% respectively.
Reliability Intra-class correlation coefficient for affected side (AS) and contralateral side (CS): Glenohumeral abduction - AS .83 - CS .28 - CS – AS .78 External rotation - AS .90 - CS .56 - CS – AS .88
|
Reliability – cosmin score: good (1. not described but it can be deduced how missing items were handled, 2. assumable that patients were stable in the interim period and 3. assumable that test conditions were similar). |
|
Terwee, 2005 |
Interobserver reproducibility of the visual estimation of range of motion of the shoulder.
Netherlands
Supported by the Foundation Stichting Anna Fonds |
Inclusion criteria: informed consent, patients with shoulder complaints between 18 and 75 years of age, able to complete questionnaires (eg. no dementia).
Exclusion criteria: patients with shoulder problems resulting from neurologic, vascular, or internal disorders; systemic rheumatic diseases; prior fractures or dislocations.
N=201 |
Independent visual estimation by 2 physiotherapists of the ROM. A second physical examination was performed within 1 hour after the first examination. To prevent the occurrence of systematic differences between examiners because of repeated testing, the sequence of the examiners was randomly allocated. All measurements were standardized |
For the passive scapulohumeral abduction, no data were available for 20 (10%) patients because palpation of the scapular movement was not possible due to adipositas or insufficient relaxation of the patients. |
Intra-class correlation coefficients for affected side (AS) and contralateral side CS): Active elevation - AS .88 (.84-.91) - CS .76 (.81-.89) Passive elevation AS .87 (.83-.90) CS .73 (.66-.79) Passive scapulohumeral abduction - AS .67 (.35-.81) - CS .15 (.02-.29) Passive external rotation - AS .73 (.22-.88) - CS .34 (.00-.65) Passive horizontal adduction - AS .36 (.22-.48) - CS .18 (.04-.32) |
Reliability – cosmin score: fair (not clear how missing items were handled). |
|
Van der Heijden, 2000 |
Design and responsiveness study of the Shoulder Disability Questionnaire
Netherlands
No funding reported |
Inclusion criteria: soft tissue disorders in which ultrasound and electrotherapy had been ineffective. Eligible patients had either or both (1) pain in the deltoid region during glenohumeral movement, and restrictive passive range of glenohumeral motion, while it was very likely that they had either or both (3) a localized soft tissue lesion, and (4) involvement of the sympathetic nerve system.
Exclusion criteria: stroke, polyneuropathy, multiple sclerosis, rheumatoid arthritis, polymyalgia, ankylosing spondylitis, malignancy, haemophilia, prior fractures, prior surgery, motor or sensory deficits, skin defects in the shoulder, upper limb, neck or thorax, major shoulder hypermobility, complete rotator cuff tears, glenohumeral joint inflammation, referred pain from the neck or from internal organs in the shoulder, being completely of nearly completely free of symptoms, already having received electrotherapy or ultrasound during the current episode, or those who indicated reluctance to adherence to the allocated treatment or to complete follow-up.
N=180 |
The Shoulder Disability Questionnaire (SDQ) is a measure covering 16 items designed to evaluate functional status limitation in patients with shoulder disorders. The responsiveness of the SDQ was evaluated for 180 shoulder patients. These patients participated in a randomized placebo-controlled trial, in which ultrasound and electrotherapy appeared to be ineffective as adjuvants to standardized exercise therapy. At baseline and at 6-week follow-up, patients completed the SDQ and rated severity of shoulder pain and their chief complaint, while a research physiotherapist rated severity of symptoms and restriction of mobility. At the 6-week follow-up, patients also rated overall change since baseline. |
180 subjects of whom 92 (51%) were clinically improved and 82 (46%) were clinically stable.
All subjects completed the SDQ at baseline and 6 weeks later. |
Calibrated responsiveness ratio (CRR) and area under the receiver-operator characteristic curve (AUC).
Non-parametric CRRs for the SDQ: - SDQ 1.14 - Chief complaint 1.59 - Shoulder pain 1.96
Not responsive: - Symptoms 0.56 - Mobility 0.40
AUCs responsive when exceeding 0.5: - SDQ 0.72 - shoulder pain 0.80 - chief complaint 0.79 - symptoms 0.76 - mobility 0.67
|
Responsiveness – cosmin score: poor (no information on the measurement properties of the comparator instrument). |
|
Van der Windt, 1998 |
Responsiveness of the Shoulder Disability Questionnaire (SDQ)
Netherlands
No funding reported |
Inclusion criteria: informed consent, age 18 years or older, ability to complete questionnaires (no dementia, sufficient knowledge of the Dutch language), shoulder pain originating from within the shoulder girdle (no known neurological or vascular disorders, neoplasms, referred pain from internal organs or systematic rheumatic conditions, no fractures or luxations, no consultations for the afflicted shoulder in the preceding 12 months.
No exclusion criteria reported.
N = 349 |
The study was conducted within the framework of an observational study on shoulder disorders in primary care. After first presentation of their complaints to the general practitioner and one and six months, participants completed the SDQ, a single question on functional status (FSQ), and an ordinal 11 point scale for the severity of pain (PSS). Responsiveness of the SDQ was evaluated compared with that of the FSQ and PSS, by calculating responsiveness ratios and by plotting receiver operating characteristic (ROC) curves. Recovery according to the patient was used as an external criterion for clinically relevant improvement (complete recovery or much improved on a six point Likert scale was denoted as clinically relevant improvement). |
The baseline questionnaire was returned by 335 participants (96%).
Response rates to follow up questionnaires were 92% (N=321) after one month and 89% (N=312) after six months.
No reasons for incomplete outcome data described. |
The mean change of SDQ scores in clinically improved patients at one and six months follow up was 40 and 51, respectively.
The mean change score in clinically improved patients was somewhat smaller for the SDQ than for the PSS, resulting in slightly lower responsiveness ratios: 2.22 versus 2.53 at one month and 1.89 versus 2.24 at six months.
The area under the curve was 0.84 for both the SDQ and the PSS, and 0.72 for the FSQ. At six months follow up the area under the curve was slightly higher for all instruments: 0.88 for the SDQ, 0.86 for the PSS, and 0.79 for the FSQ.
An improvement of 18.75 points (three items on the SDQ) approximates the optimal trade off between sensitivity (74%) and specificity (77%). |
Responsiveness – cosmin score: poor (1. unclear what was expected about changes in scores before data collection, 2. no information on the measurement properties of the comparator instrument). |
|
Van Kampen, 2011 |
Translation and validation study of the Dutch version of the Simple Shoulder Test
Netherlands
No funding reported |
Inclusion criteria: age of 16 years or older and presence of shoulder problems diagnosed by an orthopedic surgeon.
Exclusion criteria: fractures, frozen shoulder, and problems with reading and understanding the Dutch language.
N= 110
Test-retest reliability N= 55 |
The Simple Shoulder Test was translated into Dutch using forward and backward translations. A consecutive cohort of patients with shoulder problems visiting an orthopedic clinic completed the Dutch version of the SST twice within 28 days (N=55). In addition, the Dutch validated versions of the Disabilities of the Arm, Shoulder and Hand, Oxford Shoulder Score, and Constant-Murley Score were completed for assessing criterium validity. |
110 patients all completed the questionnaires once.
For the test-retest reliability N= 51 (3 patient failed to complete the questionnaires a second time and one patient had too much time between the test and the retest (57 days)). |
The Cronbach’s Alpha for internal consistency was 0.78.
The intraclass correlation coefficient for test-retest reliability was 0.92.
Criterium validity – Pearson correlation coefficient with SST: OSS -0.74 DASH -0.74 SF-36 0.16 – 0.56 CM score 0.59 |
Internal consistency – cosmin score: excellent (excellent scores for all items).
Test-retest reliability – cosmin score: good (1. good sample size, 2. assumption that patients were stable during the interim period on the construct to be measured, 3. assumption that test conditions were similar for both measurements).
Criterium validity – cosmin score: fair. |
|
Van Meeteren, 2002 |
Test-retest reliability in isokinetic muscle strength measurements of the shoulder
Netherlands
No funding reported |
Inclusion criteria: healthy men and women of varying ages without pain and diseases. N= 20 (ten of the subjects were active sportspersons with asymmetrical use of the arms and 10 were not sportspersons or sportspersons with symmetrical use of the arms).
Both groups 50% was male.
Asymmetrical group: 8 persons right-handed and 2 persons no clear dominance; mean age 27 (SD 9.6). Symmetrical group: 8 persons right-handed and 2 persons left-handed; mean age 32 (SD 12.7). |
For the isokinetic muscle strength measurements a Biodex® dynamometer (Multi joint system 2) was used. Abduction/adduction and external/internal rotation were measured according to a standardized protocol. Performed scheme: two sessions with a 2-week interval, all measurements were done with 600/second (5 repetitions) and respectively 1200/second and 1800/second (10 repetitions). |
No missing data reported. |
ICC (intraclass correlation coefficient)
ICC Abduction Female: 0.86 Male: 0.85
ICC Adduction Female: 0.69 Male: 0.91
ICC External rotation Female: 0.74 Male: 0.87
ICC Internal rotation Female: 0.81 Male: 0.92
SDD (smallest detectable difference)
SDD Abduction Female: 25% Male: 37%
SDD Adduction Female: 43% Male: 21%
SDD External rotation Female: 39% Male: 28%
SDD Internal rotation Female: 39% Male: 25% |
Test-retest reliability – cosmin score: weak (small sample size; N= 20).
|
- Small sample size - Healthy subjects |
Veehof, 2002 |
Psychometric qualities of the Dutch language version of the Disabilities of the Arm, Shoulder and Hand Questionnaire (DAH-DLV)
Netherlands
No funding reported |
Inclusion criteria: patients with a unilateral disorder of the upper limb.
Exclusion criteria: patients with relevant co-morbidity (e.g., rheumatoid arthritis, polyneuropathy) and patients who because of amputation were missing a digit.
N=50 |
Internal consistency, test-retest reliability, and concurrent validity of the Dutch version of the DASH were evaluated. All patients completed the Canadian Occupational Performance Measure (COPM) and theee DAS |
No missing data reported. |
The internal consistency was excellent (Cronbach’s α = 0.95), and the test-retest reliability was satisfactory (Pearson’s r = 0.98, p<0.0001; ᶄ coefficient = 0.67, p <0.0001). The concurrent validity of the DASH-DLV was assessed by comparison with the COPM outcomes: 81% of the problematic activities mentioned during COPM administrationwere included in the questionnaire (ᶄ coefficient = 0.79, p < 0.0001). |
Internal consistency – cosmin score: fair (not clear how missing items were handled).
Test-retest reliability – cosmin score: fair (1. not clear how missing items were handled, 2. doubltful whether the time interval was appropriate, and 3. Pearson correlation coefficient calculated without evidence provided that no systematic change occurred).
Criterion validity – cosmin score: poor (1. Criterion used can not be considered an adequate ‘gold’ standard, and 2. Correlations or the area under the receiver operating curve were not calculated. |
COPM not validated for shoulder patients. |
Vermeulen, 2005 |
Translation, adaptation and validation study of the Shoulder Rating Questionnaire
Netherlands
No funding reported |
Inclusion criteria: patients at least 18 years of age and fluent in Dutch; three groups: 1) adhesive capsulitis for physiotherapy (N=68); 2) calcifying tendinitis rotator cuff for needling (N=22); 3) subacromial impingement syndrome or rotator cuff lesion for surgery (N=17). |
The Shoulder Rating Questionnaire (SRQ) was translated and adapted following international guidelines. The Dutch SRQ was used among other measures of body function and structure, activities and societal participation in order to determine reliability, internal consistency, validity and responsiveness. Assessments were done at baseline and three months after treatment, with the Dutch SRQ being re-administered within one week before the baseline measurement and the start of the treatment for testing reliability. |
97 patients fulfilled baseline and three months follow-up measurements.
For the test-retest reliability N=93
|
Cronbach’s Alpha for internal consistency was 0.89 for the total SRQ and 0.81, 0.80, 0.72 and 0.84 for the domains pain, daily activities, sports/recreational activities and work, respectively.
Intraclass correlation coefficient for test-retest reliability (95% CI): SRQ 0.85 (0.78-0.90) Domains: Gl ass 0.63 (0.49-0.74) Pain 0.81 (0.73-0.87) ADL 0.66 (0.53-0.76) Sp/re 0.80 (0.71-0.86) Work 0.86 (0.80-0.90)
Spearman’s rho for criterion validity: ROM Abduction 0.41 Flexion 0.38 Ext rot 0.13 Force Abduction 0.37 Elevation 0.30 Ext rot 0.22 VAS Pain rest -0.41 Pain movement -0.48 Pain night -0.57 Dutch-AIMS2 arm function -.049 Dutch-AIMS2 work -0.74 SDQ -0.31 SFA scale 0.62 SF-36 (physical health) 0.62 SF-36 (mental health) 0.34
Responsiveness – effect size and standardized response mean (see article). |
Internal consistency – cosmin score: poor (factor analysis not performed and no reference to another study).
Test-retest reliability – cosmin score: poor (test conditions were not similar).
Criterion validity – cosmin score: fair (unclear wether the criterion used can be considered an adequate ‘gold’standard).
Responsiveness – cosmin score: good (1. good sample size and 2. assumable what intervention occurred in the interim period). |
|
Verantwoording
Autorisatiedatum en geldigheid
Laatst beoordeeld : 08-02-2013
Laatst geautoriseerd : 08-02-2013
Geplande herbeoordeling : 01-01-2018
Uiterlijk in 2017 bepaalt het bestuur van de Nederlandse Orthopaedische Vereniging of deze richtlijn nog actueel is. Zo nodig wordt een nieuwe werkgroep geïnstalleerd om de richtlijn te herzien. De geldigheid van de richtlijn komt eerder te vervallen indien nieuwe ontwikkelingen aanleiding zijn een herzieningstraject te starten.
De Nederlandse Orthopaedische Vereniging is als houder van deze richtlijn de eerstverantwoordelijke voor de actualiteit van deze richtlijn. De andere aan deze richtlijn deelnemende wetenschappelijk verenigingen of gebruikers van de richtlijn delen de verantwoordelijkheid en informeren de eerstverantwoordelijke over relevante ontwikkelingen binnen hun vakgebied.
Algemene gegevens
Met ondersteuning van de Orde van Medisch Specialisten. De richtlijnontwikkeling werd gefinancierd uit de Kwaliteitsgelden Medisch Specialisten (SKMS)
Doel en doelgroep
De breed samengestelde werkgroep heeft zich ten doel gesteld om de werkvelden van de eerstelijns, tweedelijns en sociaal geneeskundige sector een onderbouwd overzicht te geven van diagnostiek, interventies en meetinstrumenten, bruikbaar voor patiënten met schouderklachten die gekenmerkt worden door pijnklachten in het abductietraject.
Deze richtlijn is geschreven voor alle leden van de beroepsgroepen die betrokken zijn bij de zorg voor patiënten met SAPS.
Samenstelling werkgroep
- Dr. C. Bron, fysiotherapeut, Koninklijk Nederlands Genootschap voor Fysiotherapie
- Prof. dr. R.L. Diercks, orthopedisch chirurg, Nederlandse Orthopaedische Vereniging, voorzitter
- Dr. O. Dorrestijn, orthopedisch chirurg, Nederlandse Orthopaedische Vereniging
- Dr. C.G.M. Meskers, revalidatiearts, Nederlandse Vereniging van Revalidatieartsen
- Drs. R.J. Naber, bedrijfsarts, Nederlandse Vereniging voor Arbeids- en Bedrijfsgeneeskunde
- Drs. T.J.W. de Ruiter, revalidatiearts, Nederlandse Vereniging van Revalidatieartsen
- Dr. W.J. Willems, orthopedisch chirurg, Nederlandse Orthopaedische Vereniging
- Dr. J.C. Winters, huisarts, Nederlands Huisartsen Genootschap
- Dr. H.J. van der Woude, radioloog, Nederlandse Vereniging voor Radiologie
Met ondersteuning van:
- Mw. drs. S.B. Muller-Ploeger, junior adviseur afdeling Ondersteuning Professionele Kwaliteit, Orde van Medisch Specialisten
- Mw. dr. N.H.J. van Veen, adviseur afdeling Ondersteuning Professionele Kwaliteit, Orde van Medisch Specialisten
- Mw. Ir. I.W. Loman, junior adviseur afdeling Ondersteuning Professionele Kwaliteit, Orde van Medisch Specialisten (indicatoren)
Voor het ontwikkelen van de richtlijn is in 2010 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen die betrokken zijn bij de zorg voor patiënten met SAPS (zie hiervoor de samenstelling van de werkgroep).
De werkgroepleden zijn door hun beroepsverenigingen gemandateerd voor deelname. De werkgroep werkte gedurende twee jaar aan de totstandkoming van de richtlijn.
Belangenverklaringen
De werkgroepleden hebben schriftelijk verklaard of ze in de laatste vijf jaar een (financieel ondersteunde) betrekking onderhielden met commerciële bedrijven, organisaties of instellingen die in verband staan met het onderwerp van de richtlijn.
Geen van de werkgroepleden heeft aangegeven belangen te hebben die mogelijk kunnen interfereren met de besluitvorming in de werkgroep ten aanzien van de interpretatie van het wetenschappelijk bewijs en het opstellen van aanbevelingen.
Inbreng patiëntenperspectief
Het patiëntenperspectief wordt gezien als een waardevolle aanvulling bij het tot stand komen van deze richtlijn. Er is literatuuronderzoek gedaan naar de patiënttevredenheid na behandeling van SAPS. Ook is er een onderzoek onder patiënten met SAPS verricht waarbij onder meer werd gevraagd wat de relatie was tussen hun werkzaamheden, hun sportieve activiteiten en de schouderklachten en of ze na afsluiting van de specialistische behandeling aanvullende behandeling hadden gezocht. De resultaten staan beschreven in Hoofdstuk 10.
Methode ontwikkeling
Evidence based
Implementatie
In de verschillende fasen van de richtlijnontwikkeling is rekening gehouden met de implementatie van de richtlijn en de praktische uitvoerbaarheid van de aanbevelingen. Daarbij is uitdrukkelijk gelet op factoren die de invoering van de richtlijn in de praktijk kunnen bevorderen of belemmeren.
Na autorisatie zal de richtlijn digitaal worden verspreid onder alle relevante beroepsgroepen. Ook zal de richtlijn te downloaden zijn vanaf de website van de Kwaliteitskoepel: www.kwaliteitskoepel.nl.
Uit de richtlijn zullen toetsitems ten behoeve van een Richtlijntoets ontwikkeld worden. De Richtlijntoets bestaat uit web-based meerkeuze vragen die direct gekoppeld zijn aan de conclusies en aanbevelingen van een richtlijn en wordt geaccrediteerd.
Werkwijze
AGREE
Deze richtlijn is opgesteld conform de eisen in het rapport ‘Richtlijnen 2.0’ van de adviescommissie Richtlijnen van de Orde van Medisch Specialisten. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II). Dit is een internationaal breed geaccepteerd instrument voor de beoordeling van de kwaliteit van richtlijnen.
Knelpuntenanalyse, uitgangsvragen en uitkomstmaten
Op basis van de uitkomsten van de knelpuntenanalyse zijn door de voorzitter en de adviseur concept uitgangsvragen opgesteld. Deze zijn met de werkgroep besproken, waarna de werkgroep de definitieve uitgangsvragen heeft vastgesteld. Vervolgens inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, namelijk vermindering van pijn en verbetering van schouderfunctie.
Strategie voor zoeken en selecteren van literatuur
De databases waarin is gezocht, de zoekactie of gebruikte trefwoorden van de zoekactie en de gehanteerde selectiecriteria zijn te vinden onder 'zoekverantwoording'.
Beoordelen en samenvatten van de literatuur
Individuele studies werden systematisch beoordeeld, op basis van op voorhand opgestelde methodologische kwaliteitscriteria (zie Tabel 1.1 en 1.2). De belangrijkste bevindingen uit de literatuur zijn beschreven in de samenvatting van de literatuur en in evidence-tabellen (zie Bijlage 3). Het wetenschappelijke bewijs werd samengevat in één of meerdere conclusies, waarbij het niveau van het meest relevante bewijs is weergegeven (zie Tabel 1.3).
Tabel 1.1 GRADE bewijsniveaus van interventiestudies
Bewijsniveau |
Interventie onderzoek (voorbeelden) |
Hoog |
RCTs zonder ernstige beperkingen Observationele studies met zeer grote effecten en zonder ernstige beperkingen |
Matig |
RCTs met ernstige beperkingen Observationele studies met grote effecten en zonder ernstige beperkingen |
Laag |
RCTs met zeer ernstige beperkingen Observationele studies zonder ernstige beperkingen |
Zeer laag |
RCTs met zeer ernstige beperkingen en inconsistente resultaten Observationele studies met ernstige beperkingen Niet-systematische klinische observaties (vb. case series of case reports) |
Tabel 1.2 EBRO bewijsniveaus van diagnostisch accuratesse onderzoek of onderzoek naar etiologie en prognose
Bewijs niveau |
Diagnostisch accuratesse onderzoek |
Etiologie, prognose |
A1 |
Meta-analyse van min. 2 onafhankelijk van elkaar uitgevoerde onderzoeken van A2-niveau |
|
A2 |
Onderzoek t.o.v. een referentietest (‘gouden standaard’) met tevoren gedefinieerde afkapwaarden en onafhankelijke beoordeling van resultaten, met voldoende grote serie van opeenvolgende patiënten die allen de index- en referentietest hebben gehad |
Prospectief cohort onderzoek van voldoende omvang en follow-up, waarbij adequaat gecontroleerd is voor ‘confounding’ en selectieve follow-up voldoende is uitgesloten. |
B |
Onderzoek t.o.v. een referentietest, maar niet met alle kenmerken die onder A2 zijn genoemd |
Prospectief cohort onderzoek, maar niet met alle kenmerken als genoemd onder A2 of retrospectief cohort onderzoek of patiëntcontrole onderzoek |
C |
Niet-vergelijkend onderzoek |
Tabel 1.3 Niveau van bewijskracht van de conclusie op basis van de aan de conclusie ten grondslag liggende literatuur
Niveau |
Conclusie gebaseerd op |
1 |
Voor therapeutische interventiestudies: studies van hoge kwaliteit Voor diagnostisch accuratesse onderzoek of prognose, etiologie of bijwerkingen: onderzoek van niveau A1 of tenminste 2 onafhankelijk van elkaar uitgevoerde onderzoeken van niveau A2 |
2 |
Voor therapeutische interventiestudies: studies van matige kwaliteit Voor diagnostisch accuratesse onderzoek of prognose, etiologie of bijwerkingen: 1 onderzoek van niveau A2 of tenminste 2 onafhankelijk van elkaar uitgevoerde onderzoeken van niveau B |
3 |
Voor therapeutische interventiestudies: studies van lage kwaliteit Voor diagnostisch accuratesse onderzoek of prognose, etiologie of bijwerkingen: 1 onderzoek van niveau B of tenminste 2 onafhankelijk van elkaar uitgevoerde onderzoeken van niveau C |
4 |
Voor therapeutische interventiestudies: studies van zeer lage kwaliteit Voor diagnostisch accuratesse onderzoek of prognose, etiologie of bijwerkingen: 1 onderzoek van niveau C |
Overwegingen
Voor een aanbeveling zijn, naast het wetenschappelijke bewijs, ook andere aspecten belangrijk, zoals de expertise van de werkgroepleden, patiëntenvoorkeuren, kosten, beschikbaarheid van voorzieningen of organisatorische zaken. Deze aspecten zijn, voor zover niet wetenschappelijk onderzocht, vermeld onder het kopje ‘Overwegingen’.
Formuleren van aanbevelingen
De aanbevelingen geven een antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen.
Indicatorontwikkeling
Gelijktijdig met het ontwikkelen van de conceptrichtlijn werden er interne kwaliteitsindicatoren ontwikkeld om het toepassen van de richtlijn in de praktijk te volgen en te versterken. Meer informatie over de methode van indicatorontwikkeling is op te vragen bij de afdeling Ondersteuning Professionele Kwaliteit (OPK) van de Orde van Medisch Specialisten. In Hoofdstuk 11 zijn een drietal indicatoren opgenomen.
Kennislacunes
Tijdens de ontwikkeling van deze richtlijn is systematisch gezocht naar onderzoek waarvan de resultaten bijdragen aan een antwoord op de uitgangsvragen. Bij elke uitgangsvraag is door de werkgroep nagegaan of er (aanvullend) wetenschappelijk onderzoek gewenst is. Een overzicht van aanbevelingen voor nader (vervolg)onderzoek staat in Hoofdstuk 12.
Commentaar- en autorisatiefase
De conceptrichtlijn is aan de betrokken (wetenschappelijke) verenigingen voorgelegd voor commentaar. De commentaren zullen worden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren zal de conceptrichtlijn aangepast en definitief vastgesteld worden door de werkgroep. De definitieve richtlijn zal aan de betrokken (wetenschappelijke) verenigingen voorgelegd worden voor autorisatie.
Zoekverantwoording
Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.