Spraak-in-ruistesten

Beoordeeld: 11-04-2025

Uitgangsvraag

Wat is de meerwaarde van het inzetten van een spraak-in-ruis test in audiologische diagnostiek en/of revalidatie en hoe kan de test het beste uitgevoerd worden?

Aanbeveling

Overweeg een spraak-in-ruis (SiR)-test bij de volgende patiëntengroepen:
- Personen met klachten over spraakverstaan in rumoer en normale tot licht verhoogde toondrempels;
- Slechthorenden met beiderzijds licht tot matig gehoorverlies (PTA (1,2,4 kHz) < 55 dBHL, beste oor);
- Slechthorenden met asymmetrisch gehoorverlies (PTA (1,2,4 kHz) < 55 dBHL, beste oor);
- Slechthorenden met een bijzonder audiogram, zoals een lage-tonen gehoorverlies en komvormig gehoorverlies;
- Slechthorenden met gehoorverlies waarvoor in de werksituatie een goede communicatie in achtergrondgeluid van belang is;
- Slechthorenden die mogelijk in aanmerking komen voor een cochleair implantaat.
Kies de parameters van de SiR-test zodanig dat de test zoveel mogelijk aansluit bij voor de patiënt relevante moeilijke luistersituaties en leidt tot voldoende meetnauwkeurigheid:
- Gebruik zinnen in fluctuerende ruis of stoorspreker(s). Als verwacht wordt dat cognitieve en linguïstische factoren de meting beïnvloeden op een manier die niet optreedt in het dagelijks leven, of de uitvoering van de test verhinderen, gebruik dan de DIN-test.
- Meet in het vrije-veld op normaal geluidsniveau (65 dB SPL), indien PTA (1,2,4 kHz) > 35 dBHL alleen met hoortoestel(len).
- Meet met spraak en ruis uit 0°en zo mogelijk ook in een meetconditie met spatieel gescheiden bronnen, waarbij de spatiele scheiding 45° – 60° is.
- Gebruik zo mogelijk woordscoring.
- Gebruik een adaptieve procedure als de verstaansscore zonder ruis hoog is (>90%) en gebruik anders een vaste spraak-ruisverhouding, die zo gekozen is dat plafond- en vloereffecten zoveel mogelijk vermeden worden.
- Bied bij vergelijking van verschillende condities en bij gebruik van fluctuerende ruis of stoorspreker(s) voorafgaand aan de SiR-test voldoende oefenlijsten aan om het leereffect te laten optreden. In andere gevallen is één oefenlijst voldoende.
- Gebruik per conditie zo nodig meerdere spraaklijsten om de nauwkeurigheid te verbeteren, indien het doel van de test dit vereist en de testtijd dit toelaat.
Indien de patiënt een hoorhulpmiddel draagt, meet dan met hoorhulpmiddel, en let daarbij op dat de maskeerruis bij voorkeur continu en minstens voldoende lang aan staat voordat de spreker start. Dit is om de hoorhulpmiddelen zich te laten instellen (regeltijden).

Overwegingen

Voor- en nadelen van de interventie en de kwaliteit van het bewijs

Voor deze module is een systematische literatuursearch uitgevoerd. Er zijn geen artikelen gevonden die voldoen aan de PICO. Dit komt mede omdat de populatie niet voldoet; veel van de onderzoeken zijn uitgevoerd bij een populatie met een normaal gehoor of met een cochleair implantaat.

Beschrijving spraak-in-ruistest

Een spraak-in-ruis (SiR) test is een test waarin spraakmateriaal, zoals gesproken zinnen of cijfercombinaties, wordt aangeboden terwijl er tegelijkertijd ook ruis aangeboden wordt. De verhouding van het spraakniveau en het ruisniveau wordt in de test gevarieerd. De uitkomst van de test is de spraak-in-ruis drempel (SRT: Speech Reception Threshold), gedefinieerd als de signaal-ruisverhouding (SNR) waarbij 50% van het spraakmateriaal verstaan wordt. De vraag is wat de meerwaarde is van deze test in de klinische praktijk en hoe de test het beste uitgevoerd kan worden, afhankelijk van het doel.

Een SiR-test heeft meerwaarde t.o.v. toon- en spraakaudiometrie

Een SiR-test heeft meerwaarde ten opzichte van het toonaudiogram, omdat de test afwijkende bovendrempelige geluidsperceptie beoogt te meten. Dit gebeurt door het geluidsniveau zo te verhogen dat het spraak- en ruissignaal voldoende boven de gehoordrempel uitkomt. Zo wordt geprobeerd het effect van hoorbaarheid te minimaliseren. Een verslechtering van de SRT t.o.v. een normwaarde wordt dan geïnterpreteerd als de mate van vervorming die optreedt vanwege verminderde bovendrempelige geluidsverwerking, zoals het spectraal- en temporeel onderscheidend vermogen (Plomp, 1978) en cognitieve invloeden.

Uit onderzoeken blijkt dat de SRT van de SiR-test vaak toch niet volledig bepaald wordt door verminderde bovendrempelige geluidsverwerking, maar deels ook door verminderde hoorbaarheid van de spraak. De SRT(SiR) is over een brede range aan gehoorverliezen matig gecorreleerd met de pure-tone average (PTA) van het toonaudiogram (Duquesnoy, 1983a; Wilson, 2011; Fitzgerald, 2023). In deze onderzoeken is de SRT(SiR) gemeten met hoofdtelefoon of insert phone op een verhoogd geluidsniveau. De matige correlatie impliceert enerzijds dat de SRT(SiR) inderdaad iets toevoegt ten opzichte van het toonaudiogram: voor gehoorverliezen met (vrijwel) dezelfde PTA kan de SRT(SiR) heel verschillend zijn. Anderzijds kan de matige correlatie ook betekenen dat hoorbaarheidseffecten niet helemaal uitgesloten zijn. Al is gemeten met een verhoogd geluidsniveau, toch kan het voorkomen dat een deel van het spraakspectrum niet voldoende boven de gehoordrempel uitkomt. Dit resulteert in een hogere (d.w.z. slechtere) SRT(SiR)-waarde (Lee and Humes, 1993). Voorwaarde voor het meten van de vervormingscomponent is dus dat de spraak voor het hele spraakspectrum voldoende boven de gehoordrempel uitkomt, bij voorkeur door frequentiespecifieke versterking van het signaal. Een andere mogelijkheid is het gebruik van een hoortoestel vanwege de mogelijkheid om frequentie-specifiek te versterken. Maar ook dan is volledige hoorbaarheid niet gegarandeerd én zijn er signaalbewerkingen die het resultaat mogelijk beïnvloeden.

Voor slechthorenden met gehoorverliezen boven 55 dB (PTA (1,2,4 kHz)) is de SRT(SiR) voor vrijwel alle slechthorenden verhoogd (Duquesnoy, 1983a; Wilson, 2011; Fitzgerald, 2023) en is ook zonder SiR-test wel duidelijk dat ze moeite zullen hebben met spraakverstaan in rumoer. De SiR-test geeft dan wel informatie over de mate waarin de SRT(SiR) verslechterd is, maar hoorbaarheid en vervorming kunnen met de test echter niet meer van elkaar worden onderscheiden. Bij slechthorenden met een licht tot matig gehoorverlies (PTA (1,2,4 kHz) < 55 dBHL beste oor) is dit wel mogelijk en daarom is de SiR-test vooral voor deze groep van toegevoegde waarde. Immers, met de SiR-test kan men vaststellen of het spraakverstaan in ruis het gevolg is van verminderde hoorbaarheid (wat in principe is op te lossen met versterking) of vervorming (wat eigenlijk niet met versterking is op te lossen). De informatie van de SiR-test helpt bij het bespreken van wat de patiënt (niet) mag verwachten van hoortoestellen.

Een SiR-test geeft ook extra informatie ten opzichte van spraakaudiometrie in stilte. De maximale foneem- of woordscore kan voor een range aan gehoorverliezen 100% zijn, terwijl de SRT van de SiR-test heel verschillend kan zijn (Wilson, 2011; Fitzgerald, 2023). De spraak zonder ruis heeft nog een zekere mate van redundantie, waardoor het effect van het gehoorverlies nog niet zichtbaar is in de testscore. De mate van redundantie vermindert wel door het gehoorverlies, maar er is nog voldoende spraakinformatie over om goed te verstaan. Door het toevoegen van ruis is er geen redundantie meer en wordt het effect van het gehoorverlies wel zichtbaar.

De meerwaarde van een spraak-in-ruistest is deels gelegen in de gebruikte testopzet. Een voordeel van een adaptieve spraak-in-ruistest is dat er geen plafond- en vloereffecten zijn. Spraak-in-ruis testen kunnen ook sensitiever zijn dan CVC-foneemscores zonder ruis voor verschillen tussen condities, zoals twee verschillende hoortoestellen. Dit is bijvoorbeeld het geval als getest wordt met gesproken zinnen, met gebruik van woordscoring (Dingemanse en Goedegebure, 2019). Ook testen met een gesloten set spraakfragmenten, zoals de Digits in Noise (DIN) test, zijn relatief sensitief om een verschil tussen twee condities te meten (Smits, 2013).

SiR tests versus vragenlijsten voor het kwantificeren van door de patiënt ervaren problemen met verstaan in achtergrondgeluid

Een spraak-in-ruistest sluit op het eerste gezicht beter aan bij de veel gehoorde klacht van slechthorenden dat ze moeite hebben met verstaan in achtergrondgeluid (face validity). Een andere mogelijkheid om de ervaren beperkingen te meten is het gebruik van vragenlijsten (Patient-reported outcome measures, PROMs). Studies met grotere aantallen proefpersonen en gevalideerde PROMs rapporteren afwezige tot matige correlaties tussen SiR-scores en PROMs. (Humes, 2003; Killion, 2005; Dornhoffer, 2020; Fitzgerald, 2024). Verder zijn er lage correlaties gevonden tussen verbetering in SRT en zelf-gerapporteerd succes van hoortoestellen (Dornhoffer, 2020; Davidson, 2021). Enerzijds bevestigen gevonden correlaties dat SiR testen waarschijnlijk wel voorspellende waarde hebben voor de problemen met verstaan in achtergrondgeluid in het dagelijks leven. Anderzijds meten de SiR test en een PROM deels ook andere effecten. Een verklaring voor de beperkte relatie tussen spraak-in-ruisscores en PROMs is dat er naast spraak-in-ruis scores allerlei andere factoren zijn die de scores op de PROMs mede bepalen, zoals het effect van audiovisuele spraakherkenning (Moberly, 2018) en persoonlijkheid (Huang, 2017). Ook is een vragenlijstmeting sterk gebaseerd op herinning van situaties, waarbij de slechthorende vooral de moeilijkste situaties herinnert of juist een recente herinnering aan een wat makkelijkere situatie heeft. Al met al hebben de SiR test en de PROMs elk hun eigen waarde in de diagnostiek.

Overwegingen bij de testopzet en testopstelling

In de Audiologische Centra zijn er meerdere gevalideerde testmaterialen beschikbaar: Plomp-zinnen in stationaire en fluctuerende ruis, VU-zinnen in stationaire ruis, cijfertriplets in stationaire ruis en de matrixtest in stationaire ruis. De vraag is welke materialen op welke manier ingezet kunnen worden in de diagnostiek bij volwassenen met gehoorproblemen. Daarbij is het van belang om het doel van de SiR-test als uitgangspunt te nemen. Als het doel van de spraak-in-ruistest is om de ervaren problemen met verstaan in ruis in een testscore weer te geven, dan is het evident om het testmateriaal en de testopzet daarbij te laten aansluiten en te kiezen voor zinnen en fluctuerende ruis. Als het doel is het effect van een revalidatie-optie, zoals een hoortoestel te meten, dan is de test-retest nauwkeurigheid van de test belangrijk en ook moet rekening gehouden worden met de wisselwerking tussen testmateriaal en geluidsprocessing door compressie, ruisonderdrukking etc. De effecten zijn niet groot, maar ook niet verwaarloosbaar (Madsen, 2014). Als de test bruikbaar moet zijn voor doelgroepen met verminderde talige en/of cognitieve vermogens, dan is het gebruik van cijfertriplets voor de hand liggend (Kaandorp, 2015; Kaandorp, 2016; Kaandorp, 2017). Verder mag een SiR-test niet te lang duren, vanwege de haalbaarheid van het klinisch gebruik. De uiteindelijke keuze voor het testmateriaal en de testopzet zijn een compromis tussen deze verschillende doelen en vereisten.

De stimuli van de digit triplets en matrix testen hebben een specifieke vaste structuur en hebben een gesloten set van antwoordelementen, namelijk de digits of de woorden uit de matrix. Winn en Wright (2022) beschrijven een aantal nadelen van deze spraakmaterialen. Ze zijn ongevoelig voor verschillende soorten fouten in spraakperceptie, omdat de luisteraars de optie kiezen die het meest lijkt op wat hij heeft gehoord en niet zegt wat is gehoord. De SRT is voor deze materialen relatief laag en sterk negatief. De grenzen van auditieve perceptie waarbij spraakverstaan vrijwel niet mogelijk is, worden getest, maar het is minder ideaal voor het testen van spraakverstaan in typische situaties waarin mensen regelmatig communiceren. Verder kan dit materiaal extra sensitief zijn voor factoren die specifiek zijn voor het spraakmateriaal, zoals het aandeel van frequenties boven 8kHz (Polspoel, 2021). Matrixtesten doen een extra beroep op het werkgeheugen vergeleken met ander materiaal (Füllgrabe, 2016). Daar staat tegenover dat deze testen in het algemeen een relatief goede test-retest betrouwbaarheid hebben vanwege een steile psychometrische curve en kleine verschillen in SRT tussen lijsten. Voor de Nederlandse DIN-test is dat inderdaad aangetoond (Smits, 2013), maar voor de Nederlandse Matrixtest is de psychometrische curve niet zo steil als voor matrixtesten in andere talen (Houben, 2014). De helling van de curve is vergelijkbaar met die van de Plomp- en VU-zinnen. Wel maakt de matrixtest gebruik van woordscoring, wat positief kan zijn voor de test-retest nauwkeurigheid. Een ander voordeel van de digit triplets en matrix testen is dat ze ook voor ernstig slechthorenden toepasbaar zijn.

Een relevant aspect van SiR-testen is de gevoeligheid van de test om verschillen te meten. Mogelijk is een meting met fluctuerende ruis gevoeliger is om veranderingen te detecteren (Festen, 1990; Versfeld, 2002; George, 2006). De spreiding van SRT-waarden over personen wordt groter, vergeleken met de spreiding van SRT-waarden die zijn gemeten met stationaire ruis. Maar de test-retest nauwkeurigheid wordt lager (Smits, 2013). De vraag is of deze effecten elkaar opheffen of niet. Dat kan verschillend zijn voor verschillende testmaterialen (Smits, 2013). De DIN-test heeft een relatief goede test-retest betrouwbaarheid, maar mogelijk is de gevoeligheid voor verschillen minder. Zo vonden Smits (2013) dat de SRT gemeten met de Plomp test (zinnen) meer verschillen liet zien dan de SRT gemeten met de DIN test voor verschillende mate van gesimuleerd gehoorverlies bij normaalhorende Nederlandstalige jongvolwassenen.

Afhankelijk van het spraakmateriaal en het soort ruis kunnen er leereffecten optreden. Bij gebruik van zinnen met fluctuerende ruis of stoorspreker(s) is er een leereffect bij herhaald aanbieden (Rhebergen , 2010; Versfeld, 2021). Ook voor matrixtesten en de DIN-test is een leereffect evident, omdat luisteraars de vaak herhaalde spraakelementen leren kennen. In het dagelijks leven is de luistersituatie meestal niet zo constant. Voor een indruk van het spraakverstaan in rumoer is het daarom niet per se nodig om eerst het leereffect volledig te laten optreden door oefenlijsten te gebruiken. Met één oefenlijst is vaak het grootste deel van het leereffect al bereikt. Alleen als het doel is om verschillende condities met elkaar te vergelijken, is het nodig om eerst voldoende oefenlijsten aan te bieden, zodat de uiteindelijke vergelijking van de condities niet beïnvloed wordt door het leereffect.

Het testen van gescheiden bronnen is gewenst, omdat dat aansluit bij situaties in het dagelijks leven en er dan extra aspecten van (binauraal) horen en verstaan in de meting meegenomen worden (e.g. Bronkhorst, 2000, 2015). De keuze voor de mate van scheiding van de bronnen sluit bij voorkeur ook aan bij in het dagelijks leven veel voorkomende bronscheiding: ca 30° – 60°. Het effect van bronscheiding is het grootst voor hoeken van 60° – 90°. Bij gebruik van deze hoeken is de kans op een significant verschil met spraak en ruis uit 0° het grootst. Als compromis tussen realisme en goede meeteigenschappen kan daarom gekozen worden voor een hoek van 45° – 60°.

Het is te overwegen om de test alleen af te nemen met een geluidsniveau dat overeenkomt met geluidsniveaus in het dagelijks leven. Om effecten van onvoldoende hoorbaarheid dan zo goed mogelijk uit te sluiten is het te overwegen om de SiR-test alleen met hoorhulpmiddel af te nemen. Bij SiR-tests met hoortoestellen of CIs kunnen de in het toestel aanwezige ruisonderdrukkingsalgoritmen de score echter wel beïnvloeden. Dit geldt zeker voor stationaire ruis. De effecten zijn niet groot, maar ook niet verwaarloosbaar (Madsen, 2014). De meeste SiR testen resulteren in een SRT bij een negatieve SNR. Negatieve SNRs zijn niet representatief voor alledaagse situaties en hoortoestelalgoritmen zullen het geluid dan mogelijk anders bewerken dan bij positieve SNRs. Bij uitvoering van SiR testen met hoortoestellen is het daarom aan te bevelen om te meten met realistische ruissignalen en die lang genoeg vooraf aan de spraakstimulus af te spelen, of zelfs continu aan staan, zodat de hoortoestelalgoritmen geactiveerd zijn.

Gezien bovenstaande overwegingen is het voorstel om voor een SiR-test voor volwassenen in principe te meten met zinsmateriaal, in combinatie met fluctuerende ruis of stoorsprekers en een mogelijkheid om ook met gescheiden bronnen te meten. Alleen als de cognitieve en linguïstische factoren beter niet meegenomen kunnen worden, kan ook de DIN-test gebruikt worden om daarmee vooral verschil in bottom-up auditieve informatie te meten.

Overwegingen bij indicaties en contra-indicaties voor de SiR-test

Er zijn verschillende patiëntgroepen waarbij een spraak-in-ruistest in het bijzonder meerwaarde kan hebben:

Mensen met klachten over spraakverstaan in rumoer, die normale tot licht verhoogde toondrempels hebben. Een SiR-test kan uitsluiten dat het ervaren probleem met verstaan in rumoer een auditief probleem is, dan wel de klachten bevestigen (Phatak, 2019; Vermiglio, 2021).
Slechthorenden met licht tot matig gehoorverlies (PTA(1,2,4 kHz) < 55 dBHL, beste oor). Met de SiR-test kan men vaststellen of het spraakverstaan in ruis het gevolg is van verminderde hoorbaarheid (wat in principe is op te lossen met versterking) of vervorming (wat eigenlijk niet met hoortoestellen is op te lossen). De informatie van de SiR-test helpt bij het bespreken wat (niet) van hoortoestellen verwacht mag worden.
Slechthorenden met asymmetrisch gehoorverlies. Een SiR-test met spatieel gescheiden bronnen kan inzicht geven in hoeverre de slechthorende nog gebruik kan maken van binaurale cues bij spraakverstaan in rumoer. Als die testopzet niet beschikbaar is, dan kan de SRT voor beide oren afzonderlijk bepaald worden, waarbij het andere oor afgesloten wordt.
Slechthorenden met een bijzonder audiogram, zoals een lage-tonen gehoorverlies en komvormig gehoorverlies. Bij dit type gehoorverliezen is upward-spread-of-masking een risico en is het aan te bevelen om met een SiR-test na te gaan of de SRT met hoortoestellen niet significant verslechtert.
Slechthorenden waarvoor in de werksituatie een goede communicatie in achtergrondgeluid van belang is. Een SiR-test kan meer inzicht geven in de oorzaak van de communicatieproblemen en kan helpen om te bepalen welke aanvullende hoorhulpmiddelen nodig zijn of hoe de werkomgeving dient te worden aangepast wat betreft achtergrondgeluid en akoestiek.
Ondersteuning CI-indicatie: mensen met een relatief goede foneemscore en een relatief slechte spraak-in-ruisscore kunnen baat hebben bij een CI wat betreft spraakverstaan in ruis, terwijl het foneemverstaan slechts beperkt verbetert (Dingemanse, 2021).

Voor de genoemde groepen kan de SiR-test ook ondersteunen in de keuze om wel/geen externe microfoon te adviseren.

SiR-testen zijn niet bij elke patiënt uitvoerbaar:

Bij gehoorverliezen met een PTA(1,2,4 kHz) > 75-80 dB (HL) is de meting niet uitvoerbaar via een hoofdtelefoon of insert phone. Het benodigde geluidsniveau voor de spraak-in-ruistest wordt dan groter of gelijk aan het maximaal haalbare spraakniveau van een audiometer.
Bij een foneemdiscriminatieverlies is het gebruik van zinnen i.c.m. adaptieve procedures niet meer uitvoerbaar of geeft een onvoldoende nauwkeurig resultaat. Advies: Meet het gemiddeld verstaan bij een vaste SNR in de range van 0 dB tot +15 dB, afhankelijk van materiaal, zodanig dat plafond- en vloereffecten zoveel mogelijk vermeden worden.
Bij slechthorenden met Nederlands niet als moedertaal.
Bij slechthorenden met cognitieve problemen.

Voor de laatste drie redenen zou gebruik van eenvoudiger spraakmateriaal, zoals de DIN-test, de uitvoering van de test weer mogelijk kunnen maken, maar de resultaten worden dan mogelijk alsnog door de genoemde beperkingen beïnvloed. Ook het realisme van de test is dan minder.

Waarden en voorkeuren van patiënten (en evt. hun verzorgers)

De patiënt geeft vaak aan dat spraakverstaan in stilte, of met losse woordjes (de standaardprocedure) niet realistisch is en niets te maken heeft met de problemen die hij of zij ervaart. De patiënt zal de SiR test, zeker met gescheiden bronnen en stoorsprekers, waarschijnlijk wel ervaren als een test die aansluit bij de problemen die hij/zij ervaart.

Kosten (middelenbeslag)

Het opvolgen van de aanbevelingen vereist dat elk AC beschikt over de juiste apparatuur, meetopstelling, protocollen en deskundigheid. Is dit niet het geval dan dient hierin geïnvesteerd te worden of dient men door te verwijzen naar een naburig AC dat hier wel over beschikt. Dit betekent extra reiskosten voor de patiënt.

Afhankelijk van de bestaande praktijk van een AC zullen de aanbevelingen mogelijk leiden tot een toename in het aantal SiR testen dat uitgevoerd zal worden. Het uitvoeren van extra SiR testen kost tijd en geld.

Aanvaardbaarheid, haalbaarheid en implementatie

Mits weloverwogen toegepast kunnen SiR testen meerwaarde hebben voor de patiënt. Zowel in de diagnostische fase, bij de counseling als bij de evaluatie van de technische revalidatie met hoorapparatuur. Voor de patiënt kan het bijdragen aan het ziekte-inzicht, realistische verwachtingen ten aanzien van hoorapparatuur en de acceptatie van restbeperkingen.

De SiR-test is in de eenvoudigste vorm (spraak in stationaire ruis via hoofdtelefoon of luidspreker) beschikbaar op elk AC. Fluctuerende ruis vormt een belangrijke toevoeging en is eenvoudig en goedkoop te implementeren. Lastiger, maar zeker niet onmogelijk, zijn de SiR-test met gescheiden bronnen, het ruim voor de spraak laten starten van de ruis en het gebruik van woordscoring. Dit vereist een aanpassing aan de standaard opstelling bij de audiometrie, aanpassing van de spraak-ruisbestanden en aanpassing van de adaptieve procedure in de software van zinscoring naar woordscoring. Dit vereist aanschaf van software óf het ontwikkelen van speciale software conform de MDR, hetgeen een uitvoerig en kostbaar proces is.

Voor SiR-testen waarbij de stimuli met een luidspreker aangeboden worden en er fluctuerende ruis en/of gescheiden bronnen gebruikt worden, heeft de meetruimte en de positie van de luidspreker(s) daarin een effect op de uitkomsten van spraak-in-ruistesten. Daarom dient normdata per ruimte+opstelling bepaald te worden als onderdeel van het implementatietraject. Ook moeten gegevens beschikbaar zijn over het leereffect en de meetnauwkeurigheid. Anders kan er geen oordeel gevormd worden over de uitkomsten van de test.

De SiR-test is een specialistische test die tot op heden alleen uitgevoerd wordt op ACs en bij wetenschappelijk onderzoek. Aangezien deze test kennis en kunde vereist (vooral m.b.t. interpretatie van de resultaten) is het aan te bevelen de tests exclusief op het AC te houden. Bijkomend probleem van proliferatie zou zijn dat het spraakmateriaal bekend wordt. Aangezien geheugen (het onthouden van de inhoud van de zinnetjes) voor dit materiaal een rol speelt, kan dit de test minder valide of zelfs onbruikbaar maken.

Rationale

Een SiR-test heeft meerwaarde ten opzichte van toon- en spraakaudometrie, vooral bij bepaalde patiëntgroepen, vanwege het meten van bovendrempelige geluidsverwerking, het voorkomen van plafondeffecten en extra meetgevoeligheid.

De aanbevelingen zijn gericht op het verbeteren van de relatie tussen testuitkomst en de door de patiënt ervaren problemen, t.o.v. gebruik van stationaire ruis, gebruikmakend van bestaand testmateriaal, met aandacht voor voldoende testnauwkeurigheid.

Onderbouwing

Achtergrond

Spraak-in-ruistesten (SiR testen) worden wisselend gebruikt in Audiologische Centra. Mogelijk is de meerwaarde onvoldoende (duidelijk) en/of kost het te veel tijd. En als ze gebruikt worden, zijn er veel testvarianten mogelijk wat betreft de keuze van het spraakmateriaal, het ruismateriaal, de transducer(s), geluidsniveaus, testprocedures enzovoort. Daarin is er ook praktijkvariatie. De vraag is wat de meerwaarde is van een SiR test in audiologische diagnostiek en/of revalidatie en zo ja, welke testvariant dan geschikt is voor welk doel.

Samenvatting literatuur

Description of studies

Not applicable

Results

Not applicable

Level of evidence of the literature

Not applicable

Zoeken en selecteren

A systematic review of the literature was performed to answer the following question: What is the added value of speech-in-noise tests in the evaluation of understanding of speech in background noise in adults with hearing loss and hearing aids?

P:	Adults with (experienced) hearing loss with a hearing aid
I:	Speech in noise test, speech material (digits, sentences, words), noise material (stationary noise, fluctuating noise, babble, competing speech), procedure (adaptive vs fixed speech noise ratio), position of the sources (yes/no spatial separation)
C:	No speech-in-noise test
O:	Subjectively experienced auditory impairment; satisfaction/improvement/discomfort or objective improvement/discomfort

Relevant outcome measures

The guideline development group considered subjective improvement/satisfaction/discomfort and objective improve/discomfort as a critical outcome measure for decision making.

A priori, the working group did not define the outcome measures listed above but used the definitions used in the studies.

A priori, the working group did not define the outcome measures listed above but used the definitions used in the studies. The working group defined the GRADE-standard limit of 25% difference for dichotomous outcomes (RR < 0.8 or > 1.25), and 10% for continuous outcomes as a minimal clinically (patient) important difference.

Search and select (Methods)

The databases Medline (via OVID) and Embase (via Embase.com) were searched with relevant search terms until 03-03-2023. The search strategy is available upon reasonable request via info@richtlijnendatabase.nl. The systematic literature search resulted in 329 hits. Studies were selected based on the following criteria:

- Systematic review (detailed search strategy, risk of bias assessment, and results of individual comparative studies available), randomized controlled trial

- Research question includes all elements of the PICO;

- Full text available;

- Full text written in English or Dutch.

Eleven studies were initially selected based on title and abstract screening. After reading the full text, eleven studies were excluded (see the table with reasons for exclusion under the tab Methods), and no studies were included.

Results

No studies were included in the analysis of the literature.

Referenties

Bernstein JG, Grant KW. Auditory and auditory-visual intelligibility of speech in fluctuating maskers for normal-hearing and hearing-impaired listeners. J Acoust Soc Am. 2009 May;125(5):3358-72. doi: 10.1121/1.3110132. PMID: 19425676.
Bronkhorst, A. W. (2000). The cocktail party phenomenon: A review of research on speech intelligibility in multiple-talker conditions. Acta Acustica united with Acustica, 86(1), 117-128.
Bronkhorst, A. W. (2015). The cocktail-party problem revisited: early processing and selection of multi-talker speech. Atten Percept Psychophys, 77(5), 1465-1487.
Byrne AJ, Conroy C, Kidd G. Individual differences in speech-on-speech masking are correlated with cognitive and visual task performance. J Acoust Soc Am. 2023 Oct 1;154(4):2137-2153. doi: 10.1121/10.0021301. PMID: 37800988.
Davidson A, Marrone N, Wong B, Musiek F. Predicting Hearing Aid Satisfaction in Adults: A Systematic Review of Speech-in-noise Tests and Other Behavioral Measures. Ear Hear. 2021 Nov-Dec 01;42(6):1485-1498. doi: 10.1097/AUD.0000000000001051. PMID: 33883425.
Dingemanse JG, Goedegebure A. The Important Role of Contextual Information in Speech Perception in Cochlear Implant Users and Its Consequences in Speech Tests. Trends Hear. 2019 Jan-Dec;23:2331216519838672. doi: 10.1177/2331216519838672. PMID: 30991904; PMCID: PMC6472157.
Dingemanse, J.G. (2021). Listening to Speech in Background Noise using a Cochlear Implant.
Dornhoffer JR, Meyer TA, Dubno JR, McRackan TR. Assessment of Hearing Aid Benefit Using Patient-Reported Outcomes and Audiologic Measures. Audiol Neurootol. 2020;25(4):215-223. doi: 10.1159/000506666. Epub 2020 Apr 2. PMID: 32241007; PMCID: PMC7371552.
Duquesnoy AJ. The intelligibility of sentences in quiet and in noise in aged listeners. J Acoust Soc Am. 1983a Oct;74(4):1136-44. doi: 10.1121/1.390037. PMID: 6643835.
Duquesnoy AJ. Effect of a single interfering noise or speech source upon the binaural sentence intelligibility of aged persons. J Acoust Soc Am. 1983b Sep;74(3):739-43. doi: 10.1121/1.389859. PMID: 6630729.
Festen JM, Plomp R. Effects of fluctuating noise and interfering speech on the speech-reception threshold for impaired and normal hearing. J Acoust Soc Am. 1990 Oct;88(4):1725-36. doi: 10.1121/1.400247. PMID: 2262629.
Fitzgerald MB, Gianakas SP, Qian ZJ, Losorelli S, Swanson AC. Preliminary Guidelines for Replacing Word-Recognition in Quiet With Speech in Noise Assessment in the Routine Audiologic Test Battery. Ear Hear. 2023 Nov-Dec 01;44(6):1548-1561. doi: 10.1097/AUD.0000000000001409. Epub 2023 Aug 22. PMID: 37703127; PMCID: PMC10583951.
Fitzgerald, M. B., Ward, K. M., Gianakas, S. P., Smith, M. L., Blevins, N. H., & Swanson, A. P. (2024). Speech-in-Noise Assessment in the Routine Audiologic Test Battery: Relationship to Perceived Auditory Disability. Ear and Hearing, 45(4), 816-826.
Füllgrabe, C., & Rosen, S. (2016). On the (un) importance of working memory in speech-in-noise processing for listeners with normal hearing thresholds. Frontiers in psychology, 7, 1268.
George EL, Festen JM, Houtgast T. Factors affecting masking release for speech in modulated noise for normal-hearing and hearing-impaired listeners. J Acoust Soc Am. 2006 Oct;120(4):2295-311. doi: 10.1121/1.2266530. PMID: 17069325.
Huang, I. C., J. L. Lee, P. Ketheeswaran, C. M. Jones, D. A. Revicki, and A. W. Wu. 2017. "Does Personality Affect Health-Related Quality of Life? A Systematic Review." PloS One 12 (3): e0173806. doi:10.1371/journal.pone.0173806.
Humes LE, Wilson DL, Humes AC. Examination of differences between successful and unsuccessful elderly hearing aid candidates matched for age, hearing loss and gender. Int J Audiol. 2003 Oct;42(7):432-41. doi: 10.3109/14992020309080053. PMID: 14582640.
Humes LE. Modeling and predicting hearing aid outcome. Trends Amplif. 2003;7(2):41-75. doi: 10.1177/108471380300700202. PMID: 15004647; PMCID: PMC4168944.
Killion MC, Gudmundsen GI. Fitting hearing aids using clinical prefitting speech measures: an evidence-based review. J Am Acad Audiol. 2005 Jul-Aug;16(7):439-47. doi: 10.3766/jaaa.16.7.4. PMID: 16295231.
Lee LW, Humes LE. Evaluating a speech-reception threshold model for hearing-impaired listeners. J Acoust Soc Am. 1993 May;93(5):2879-85. doi: 10.1121/1.405807. PMID: 8315151.
Madsen SM, Moore BC. Music and hearing aids. Trends Hear. 2014 Oct 31;18:2331216514558271. doi: 10.1177/2331216514558271. PMID: 25361601; PMCID: PMC4271761.
Moberly, A. C, M. S. Harris, L. Boyce, K. Vasil, T. Wucinich, D. B. Pisoni, J. Baxter, C. Ray, and V. Shafiro. 2018. "Relating Quality of Life to Outcomes and Predictors in Adult Cochlear Implant Users: Are We Measuring the Right Things?" The Laryngoscope 128 (4): 959-966. doi:10.1002/lary.26791.
Pearsons KS, Bennett RL, Fidell SA. Speech levels in various noise environments. Office of Health and Ecological Effects. 1977. Office of Research and Development, US EPA.
Phatak, S. A., Brungart, D. S., Zion, D. J., & Grant, K. W. (2019). Clinical assessment of functional hearing deficits: Speech-in-noise performance. Ear and Hearing, 40(2), 426-436.
Polspoel, S., Kramer, S. E., van Dijk, B., & Smits, C. (2022). The importance of extended high-frequency speech information in the recognition of digits, words, and sentences in quiet and noise. Ear and hearing, 43(3), 913-920.
Plomp R. Auditory handicap of hearing impairment and the limited benefit of hearing aids. J Acoust Soc Am. 1978 Feb;63(2):533-49. doi: 10.1121/1.381753. PMID: 670550.
Plomp R, Mimpen AM. Improving the reliability of testing the speech reception threshold for sentences. Audiology. 1979 Jan-Feb;18(1):43-52. doi: 10.3109/00206097909072618. PMID: 760724.
Smeds K, Wolters F, Rung M. Estimation of Signal-to-Noise Ratios in Realistic Sound Scenarios. J Am Acad Audiol. 2015 Feb;26(2):183-96. doi: 10.3766/jaaa.26.2.7. PMID: 25690777.
Smits C, Theo Goverts S, Festen JM. The digits-in-noise test: assessing auditory speech recognition abilities in noise. J Acoust Soc Am. 2013 Mar;133(3):1693-706. doi: 10.1121/1.4789933. PMID: 23464039.
Smits, C., & Festen, J. M. (2013). The interpretation of speech reception threshold data in normal-hearing and hearing-impaired listeners: II. Fluctuating noise. J Acoust Soc Am, 133(5), 3004-3015. https://doi.org/10.1121/1.4798667
Vermiglio, A. J., Leclerc, L., Thornton, M., Osborne, H., Bonilla, E., & Fang, X. (2021). Diagnostic accuracy of the AzBio speech recognition in noise test. Journal of Speech, Language, and Hearing Research, 64(8), 3303-3316.
Versfeld NJ, Daalder L, Festen JM, Houtgast T. Method for the selection of sentence materials for efficient measurement of the speech reception threshold. J Acoust Soc Am. 2000 Mar;107(3):1671-84. doi: 10.1121/1.428451. PMID: 10738820.
Versfeld NJ, Dreschler WA. The relationship between the intelligibility of time-compressed speech and speech in noise in young and elderly listeners. J Acoust Soc Am. 2002 Jan;111(1 Pt 1):401-8. doi: 10.1121/1.1426376. PMID: 11831813.
Versfeld NJ, Lie S, Kramer SE, Zekveld AA. Informational masking with speech-on-speech intelligibility: Pupil response and time-course of learning. J Acoust Soc Am. 2021 Apr;149(4):2353. doi: 10.1121/10.0003952. PMID: 33940918.
Wilson RH. Clinical experience with the words-in-noise test on 3430 veterans: comparisons with pure-tone thresholds and word recognition in quiet. J Am Acad Audiol. 2011 Jul-Aug;22(7):405-23. doi: 10.3766/jaaa.22.7.3. PMID: 21993048.
Wu YH, Stangl E, Chipara O, Hasan SS, Welhaven A, Oleson J. Characteristics of Real-World Signal to Noise Ratios and Speech Listening Situations of Older Adults With Mild to Moderate Hearing Loss. Ear Hear. 2018 Mar/Apr;39(2):293-304. doi: 10.1097/AUD.0000000000000486. PMID: 29466265; PMCID: PMC5824438.

Evidence tabellen

Table of excluded studies

Reference	Reason for exclusion
Boyle, P. J. and Nunn, T. B. and O'Connor, A. F. and Moore, B. C. STARR: a speech test for evaluation of the effectiveness of auditory prostheses under realistic conditions. Ear and hearing. 2013; 34 (2) :203-212	Wrong population (normal-hearing population and with cochlear implant)
Compton-Conley, C. L. and Neuman, A. C. and Killion, M. C. and Levitt, H. Performance of directional microphones for hearing aids: real-world versus simulation. Journal of the American Academy of Audiology. 2004; 15 (6) :440-455	Wrong comparison
Culling, J. F. and Jelfs, S. and Talbert, A. and Grange, J. A. and Backhouse, S. S. The benefit of bilateral versus unilateral cochlear implantation to speech intelligibility in noise. Ear and hearing. 2012; 33 (6) :673-682	Wrong population (with cochlear implant)
Davidson, A. and Marrone, N. and Wong, B. and Musiek, F. Predicting Hearing Aid Satisfaction in Adults: A Systematic Review of Speech-in-noise Tests and Other Behavioral Measures. Ear and hearing. 2021; 42 (6) :1485-1498	Wrong comparison
Gifford, R. H. and Dorman, M. F. Bimodal Hearing or Bilateral Cochlear Implants? Ask the Patient. Ear and hearing. 2019; 40 (3) :501-516	Wrong population (with cochlear implant)
Gifford, Rene H. and Driscoll, Colin L. W. and Davis, Timothy J. and Fiebig, Pam and Micco, Alan and Dorman, Michael F. A Within-Subject Comparison of Bimodal Hearing, Bilateral Cochlear Implantation, and Bilateral Cochlear Implantation With Bilateral Hearing Preservation: High-Performing Patients. Otology & neurotology : official publication of the American Otological Society, American Neurotology Society [and] European Academy of Otology and Neurotology. 2015; 36 (8) :1331-7	Wrong population (with cochlear implant)
Mackersie, C. L. and Boothroyd, A. and Prida, T. Use of a simultaneous sentence perception test to enhance sensitivity to ease of listening. Journal of speech, language, and hearing research : JSLHR. 2000; 43 (3) :675-682	Wrong population (normal-hearing population)
Ricketts, Todd A. and Hornsby, Benjamin W. Y. Distance and reverberation effects on directional benefit. Ear and hearing. 2003; 24 (6) :472-84	Wrong comparison
Sargent, E. W. and Herrmann, B. and Hollenbeak, C. S. and Bankaitis, A. E. The minimum speech test battery in profound unilateral hearing loss. Otology and Neurotology. 2001; 22 (4) :480-486	Wrong comparison
Smulders, Y. E. and Rinia, A. B. and Pourier, V. E. C. and Van Zon, A. and Van Zanten, G. A. and Stegeman, I. and Scherf, F. W. A. C. and Smit, A. L. and Topsakal, V. and Tange, R. A. and Grolman, W. Validation of the U-STARR with the AB-York crescent of sound, a new instrument to evaluate speech intelligibility in noise and spatial hearing skills. Audiology and Neurotology Extra. 2015; 5 (1) :1-10	Wrong population (normal-hearing population and with cochlear implant)
Wagner, L. Geiling, L. Hauth, C. Hocke, T. Plontke, S. and Rahne, T. Improved binaural speech reception thresholds through small symmetrical separation of speech and noise. PLoS One. 2020 Aug 5;15(8):e0236469. doi: 10.1371/journal.pone.0236469. Erratum in: PLoS One. 2021;16(5):e0251766.	Wrong population (normal-hearing population)

Verantwoording

Beoordelingsdatum en geldigheid

Laatst beoordeeld : 11-04-2025

Initiatief en autorisatie

Initiatief:

Nederlandse Vereniging voor Klinische Fysica

Geautoriseerd door:

Nederlandse Vereniging voor Keel-Neus-Oorheelkunde en Heelkunde van het Hoofd-Halsgebied
Nederlandse Vereniging voor Klinische Fysica
Hoormij / Nederlandse Vereniging voor Slechthorenden
Landelijke Werkverband van Maatschappelijk werkers in de Audiologie

Algemene gegevens

De ontwikkeling/herziening van deze richtlijnmodule werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten (www.demedischspecialist.nl/kennisinstituut) en werd gefinancierd uit de Kwaliteitsgelden Medisch Specialisten (SKMS). De financier heeft geen enkele invloed gehad op de inhoud van de richtlijnmodule.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijnmodule is in 2021 een multidisciplinaire werkgroep samengesteld, bestaande uit vertegenwoordigers van alle relevante specialismen (zie hiervoor de Samenstelling van de werkgroep) die betrokken zijn bij de audiologische zorg voor slechthorende volwassenen.

Werkgroep

Drs. D.J.E.J. Pans, voorzitter, klinisch fysicus-audioloog, Nederlandse Vereniging voor Klinische Fysica (NVKF)
Dr. M. Boymans, vice-voorzitter, klinisch fysicus-audioloog, Nederlandse Vereniging voor Klinische Fysica (NVKF)
Dr. ir. N.J. Versfeld, klinisch fysicus-audioloog, Nederlandse Vereniging voor Klinische Fysica (NVKF)
Ir. M.B.A. Rodenburg, klinisch fysicus-audioloog, Nederlandse Vereniging voor Klinische Fysica (NVKF)
Dr. ir. K. Douma, klinisch fysicus-audioloog, Nederlandse Vereniging voor Klinische Fysica (NVKF)
M. van den Tillaart, klinisch fysicus-audioloog, Nederlandse Vereniging voor Klinische Fysica (NVKF), tot januari 2023
Dr. ir. J.G. Dingemanse, klinisch fysicus-audioloog, Nederlandse Vereniging voor Klinische Fysica (NVKF)
Ir. T.P.W. Thielemans, klinisch fysicus-audioloog, Nederlandse Vereniging voor Klinische Fysica (NVKF), vanaf maart 2023
Drs. C.P.A. Delsing, kno-arts, Nederlandse Vereniging voor Keel-Neus-Oorheelkunde (NVKNO), tot september 2023
M.P. van der Heijden, maatschappelijk werker, Landelijk Werkverband voor Maatschappelijk werkers In de Audiologie (LWMA)
Drs. H.W. Hofstee, patiëntvertegenwoordiger, Stichting Hoormij

Klankbordgroep

W.J. Dekker, patiëntvertegenwoordiger, Stichting Hoormij
Drs. A.G. Schriemer, bedrijfsarts, Nederlandse Vereniging voor Arbeids- en Bedrijfsgeneeskunde (NVAB)
C.P.W.M. van Daelen-Swinkels, logopedist, Nederlandse vereniging voor Logopedie en Foniatrie (NVLF)
Drs. B. van Oel, logopedist, Nederlandse vereniging voor Logopedie en Foniatrie (NVLF)
H.F.M. Bijsterveld, Geestelijke Gezondheidszorg en Maatschappelijke Dienstverlening voor doven en slechthorenden (GGMD)
M.E. Delreux, MSc, Master Audiologen actief in Nederland (MAaN)
A. Knoop, MSc, Master Audiologen actief in Nederland (MAaN)

Met ondersteuning van

Drs. A.E. Sussenbach, junior adviseur, Kennisinstituut van de Federatie Medisch Specialisten
Dr. A.N. Nguyen, adviseur, Kennisinstituut van de Federatie Medisch Specialisten
L.H.M. Niesink-Boerboom, literatuurspecialist, Kennisinstituut van de Federatie Medisch Specialisten
L.W.M. Boerboom, literatuurspecialist, Kennisinstituut van de Federatie Medisch Specialisten

Belangenverklaringen

De Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement) hebben gehad. Gedurende de ontwikkeling of herziening van een module worden wijzigingen in belangen aan de voorzitter doorgegeven. De belangenverklaring wordt opnieuw bevestigd tijdens de commentaarfase.

Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

Werkgroeplid	Functie	Nevenfuncties	Gemelde belangen	Ondernomen actie
Drs. D.J.E.J. Pans	Klinisch fysicus-audioloog, B-opleider KF- Medisch manager, Adelante-zorggroep in Hoensbroek	- Bestuurslid LAD (Landelijke Vereniging Artsen in Dienstverband) - Onafhankelijk voorzitter Raad van Advies StAr (Stichting Audicienregister)	Geen	Geen actie vereist
Dr. ir. N.J. Versfeld	Klinisch fysicus-audioloog, Amsterdam UMC, locatie VUmc	Geen	Geen	Geen actie vereist
Ir. M.B.A. Rodenburg	Klinisch fysicus-audioloog bij Koninklijke Auris Groep, Audiologisch Centrum Rotterdam	Geen	Geen	Geen actie vereist
Dr. ir. K. Douma	Klinisch fysicus-audioloog	Geen	Geen	Geen actie vereist
Dr. M. Boymans	Klinisch fysicus-audioloog en medisch manager bij Libra Revalidatie en Audiologie Patientenzorg en beleid	- Wetenschappelijk onderzoeker bij Amsterdam UMC locatie AMC - Begeleiden promovendi - MT lid van de FENAC	Geen	Geen actie vereist
M. van den Tillaart	Klinisch fysicus-audioloog bij Pento Audiologisch Centrum Amersfoort Volwassen team en Kinderteam, Coördinator/kartrekker van Tinnitus zorgteam	Geen	Geen	Geen actie vereist
Dr. ir. J.G. Dingemanse	Klinisch fysicus-audioloog Bij Erasmus MC	Lid werkgroep binnen NVKF	Geen	Geen actie vereist
Ir. T.P.W. Thielemans	Klinisch fysicus-audioloog, Hoortoestel Advies Centrum	- Docent audiologie-assistenten opleiding - Docent audiciens opleiding Verzorgen van audiologische trainingen via audicate.nl Consultant zorgverzekeraar Beheerder HT-database voor stichting SPHHM - Audiologisch ondersteuner als ZZP'er bij ziekenhuis Elkerliek binnen de KNO-poli	Geen	Geen actie vereist
Drs. C.P.A. Delsing	KNO-arts/Fellowship otologie Sydney	Plug&Play	Geen	Geen actie vereist
M.P. van der Heijden	Audiologisch maatschappelijk werker, Libra Revalidatie en Audiologie	- Bestuurslid LWMA - Opleidingscommissie FENAC	Geen	Geen actie vereist
Drs H.W. Hofstee	Ervaringsdeskundige Hoormij. NVVS	Geen	Geen	Geen actie vereist

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door deelname van Stichting Hoormij aan de werkgroep en deelname aan de klankbordgroep. De verkregen input is meegenomen bij het opstellen van de uitgangsvragen, de keuze voor de uitkomstmaten en bij het opstellen van de overwegingen. De conceptrichtlijn is tevens voor commentaar voorgelegd aan Stichting Hoormij en de eventueel aangeleverde commentaren zijn bekeken en verwerkt.

Wkkgz & Kwalitatieve raming van mogelijke substantiële financiële gevolgen

Kwalitatieve raming van mogelijke financiële gevolgen in het kader van de Wkkgz

Bij de richtlijn is conform de Wet kwaliteit, klachten en geschillen zorg (Wkkgz) een kwalitatieve raming uitgevoerd of de aanbevelingen mogelijk leiden tot substantiële financiële gevolgen. Bij het uitvoeren van deze beoordeling zijn richtlijnmodules op verschillende domeinen getoetst (zie het stroomschema op de Richtlijnendatabase).

Uit de kwalitatieve raming blijkt dat er waarschijnlijk geen substantiële financiële gevolgen zijn, zie onderstaande tabel.

Module	Uitkomst raming	Toelichting
Spraak-in-ruis-testen	geen financiële gevolgen	Hoewel uit de toetsing volgt dat de aanbeveling(en) breed toepasbaar zijn (>40.000 patiënten), volgt uit de toetsing dat het geen nieuwe manier van zorgverlening of andere organisatie van zorgverlening betreft en het geen wijziging in het opleidingsniveau van zorgpersoneel betreft. Er worden daarom geen financiële gevolgen verwacht.

Werkwijze

AGREE

Deze richtlijnmodule is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 3.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II, Brouwers 2010).

Knelpuntenanalyse en uitgangsvragen

Tijdens de voorbereidende fase inventariseerde de werkgroep de knelpunten in de zorg voor patiënten met langdurig of blijvend gehoorverlies. Tevens zijn er knelpunten aangedragen door de NVKF, NVLF, CVZA, Audined, Stichting Plots- en Laatdoven, Stichting Hoormij, Hoorprofs, NVAB, GGMD, LWMA en DKA via een invitational conference. Een verslag hiervan is opgenomen onder aanverwante producten.

Op basis van de uitkomsten van de knelpuntenanalyse zijn door de werkgroep concept-uitgangsvragen opgesteld en definitief vastgesteld.

Uitkomstmaten

Na het opstellen van de zoekvraag behorende bij de uitgangsvraag inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. Hierbij werd een maximum van acht uitkomstmaten gehanteerd. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

Methode literatuursamenvatting

Een uitgebreide beschrijving van de strategie voor zoeken en selecteren van literatuur is te vinden onder ‘Zoeken en selecteren’ onder Onderbouwing. Indien mogelijk werd de data uit verschillende studies gepoold in een random-effects model. Review Manager 5.4 werd gebruikt voor de statistische analyses. De beoordeling van de kracht van het wetenschappelijke bewijs wordt hieronder toegelicht.

Beoordelen van de kracht van het wetenschappelijke bewijs

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/). De basisprincipes van de GRADE-methodiek zijn: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van de bewijskracht per uitkomstmaat op basis van de acht GRADE-domeinen (domeinen voor downgraden: risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias; domeinen voor upgraden: dosis-effect relatie, groot effect, en residuele plausibele confounding).

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie, in het bijzonder de mate van zekerheid dat de literatuurconclusie de aanbeveling adequaat ondersteunt (Schünemann 2013, Hultcrantz 2017).

GRADE	Definitie
Hoog	er is hoge zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt; het is zeer onwaarschijnlijk dat de literatuurconclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Redelijk	er is redelijke zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt; het is mogelijk dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Laag	er is lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt; er is een reële kans dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.
Zeer laag	er is zeer lage zekerheid dat het ware effect van behandeling dichtbij het geschatte effect van behandeling ligt; de literatuurconclusie is zeer onzeker.

Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz 2017).

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals aanvullende argumenten uit aanpalende specialismen KNO-heelkunde, geriatrie of bedrijfsgeneeskunde bijvoorbeeld, waarden en voorkeuren van patiënten, kosten (middelenbeslag), aanvaardbaarheid, haalbaarheid en implementatie. Deze aspecten zijn systematisch vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’ en kunnen (mede) gebaseerd zijn op expert opinion. Hierbij is gebruik gemaakt van een gestructureerd format gebaseerd op het evidence-to-decision framework van de internationale GRADE Working Group (Alonso-Coello 2016a, Alonso-Coello 2016b). Dit evidence-to-decision framework is een integraal onderdeel van de GRADE methodiek.

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk (Agoritsas 2017, Neumann 2016). De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen. De werkgroep heeft bij elke aanbeveling opgenomen hoe zij tot de richting en sterkte van de aanbeveling zijn gekomen.

In de GRADE-methodiek wordt onderscheid gemaakt tussen sterke en zwakke (of conditionele) aanbevelingen. De sterkte van een aanbeveling verwijst naar de mate van zekerheid dat de voordelen van de interventie opwegen tegen de nadelen (of vice versa), gezien over het hele spectrum van patiënten waarvoor de aanbeveling is bedoeld. De sterkte van een aanbeveling heeft duidelijke implicaties voor patiënten, behandelaars en beleidsmakers (zie onderstaande tabel). Een aanbeveling is geen dictaat, zelfs een sterke aanbeveling gebaseerd op bewijs van hoge kwaliteit (GRADE gradering HOOG) zal niet altijd van toepassing zijn, onder alle mogelijke omstandigheden en voor elke individuele patiënt.

Implicaties van sterke en zwakke aanbevelingen voor verschillende richtlijngebruikers

	Sterke aanbeveling	Zwakke (conditionele) aanbeveling
Voor patiënten	De meeste patiënten zouden de aanbevolen interventie of aanpak kiezen en slechts een klein aantal niet.	Een aanzienlijk deel van de patiënten zouden de aanbevolen interventie of aanpak kiezen, maar veel patiënten ook niet.
Voor behandelaars	De meeste patiënten zouden de aanbevolen interventie of aanpak moeten ontvangen.	Er zijn meerdere geschikte interventies of aanpakken. De patiënt moet worden ondersteund bij de keuze voor de interventie of aanpak die het beste aansluit bij zijn of haar waarden en voorkeuren.
Voor beleidsmakers	De aanbevolen interventie of aanpak kan worden gezien als standaardbeleid.	Beleidsbepaling vereist uitvoerige discussie met betrokkenheid van veel stakeholders. Er is een grotere kans op lokale beleidsverschillen.

Organisatie van zorg

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijnmodule is expliciet aandacht geweest voor de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, mankracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van deze specifieke uitgangsvraag zijn genoemd bij de overwegingen.

Commentaar- en autorisatiefase

De conceptrichtlijnmodule werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijnmodule aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijnmodule werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

Literatuur

Agoritsas T, Merglen A, Heen AF, Kristiansen A, Neumann I, Brito JP, Brignardello-Petersen R, Alexander PE, Rind DM, Vandvik PO, Guyatt GH. UpToDate adherence to GRADE criteria for strong recommendations: an analytical survey. BMJ Open 2017;7(11):e018593. doi: 10.1136/bmjopen-2017-018593.

Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ. 2016 28;353:i2016. doi: 10.1136/bmj.i2016.

Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S,Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ. 2016, 353:i2089. doi: 10.1136/bmj.i2089.

Brouwers MC, Kho ME, Browman GP, Burgers JS, Cluzeau F, Feder G, Fervers B, Graham ID, Grimshaw J, Hanna SE, Littlejohns P, Makarski J, Zitzelsberger L; AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in healthcare. CMAJ 2010;182(18):E839-42. doi: 10.1503/cmaj.090449.

Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006.

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. http://richtlijnendatabase.nl/over_deze_site/over_richtlijnontwikkeling.html

Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017.

Schünemann H, Brożek J, Guyatt G, GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html

Richtlijnendatabase

Audiologische zorg voor slechthorende volwassenen

Audiologische zorg voor slechthorende volwassenen

Spraak-in-ruistesten

Uitgangsvraag

Aanbeveling

Overwegingen

Onderbouwing

Achtergrond

Samenvatting literatuur

Zoeken en selecteren

Referenties

Evidence tabellen

Verantwoording

Beoordelingsdatum en geldigheid

Initiatief en autorisatie

Algemene gegevens

Samenstelling werkgroep

Belangenverklaringen

Inbreng patiëntenperspectief

Werkwijze

Bijlagen