Hoofd-halstumoren

Initiatief: NVKNO Aantal modules: 83

Behandeling T1-2N0-1 orofarynxcarcinomen

Uitgangsvraag

Hoe worden patiënten met T1-2N0-1 orofaryngeale tumoren behandeld?

Aanbeveling

Aanbeveling-1

Ondersteun de patiënt bij het maken van een behandelkeuze tussen chirurgische behandeling (TORS) en radiotherapie,  waarbij de individuele patiëntkarakteristieken dienen te worden afgewogen.

 

En bespreek de volgende belangrijke voor- en nadelen van de interventies indien van toepassing op de patiënt:

  • Behandelduur:
    De duur van de behandelingen zonder complicaties bij TORS is één ingreep met een opnameduur van één tot enkele dagen. Voor RT is de behandelduur tot zeven weken.
  • Procedures:
    TORS wordt onder narcose verricht, RT niet. RT zal volgens een behandelschema verlopen.
  • Korte en lange termijn complicaties en toxiciteit:
    Bij TORS kunnen bloedingen, pijnklachten en ontstekingen optreden. Bij RT kan smaakverlies, een droge mond en slikklachten optreden. Ook kunnen hypothyroïdie, versnelling van artherosclerose en, met een zeer gering risico, secundaire tumoren ontstaan ten gevolge van RT. De kans op radiatiecariës en radionecrose neemt toe naar mate de tumor dicht bij de mandibula ligt of de manibula invalideert.
  • Kans op adjuvante behandeling:
    Voor TORS bestaat er een aanzienlijke kans op een adjuvante behandeling met (chemo)radiatie.

Aanbeveling-2

Geef radiotherapie bij patiënten met primaire T1-2N0-1 orofarynxcarcinomen, tenzij er patiëntvoorkeuren voor een chirurgische behandeling zijn.

Overwegingen

Er werd één gerandomiseerde trial gevonden over Transoral Robotic Surgery (TORS) versus radtiotherapie (RT) die alle uitkomstmaten van interesse rapporteerde, behalve lokale controle (Nichols, 2019). Er was een zeer laag vertrouwen in de gerapporteerde 5-jaars overleving (log-rank p=0,89; HR=0,83 met 95%BHI: 0,21 tot 8,35). Het gerapporteerde verschil in overleving werd niet als klinisch relevant beschouwd, want hiervoor behoorde de hazard ratio kleiner dan 0,7 te zijn. Het is enigszins onduidelijk hoe de gerapporteerde hazard ratio tot stand is gekomen en welke groep als referentiegroep is gekozen in de calculatie hiervan. Ook werd er geen reden aangedragen waarom er een groot aantal deelnemers uit beide interventiegroepen gecensureerd werden in de analyse. Vermoedelijk verlieten deelnemers het onderzoek (de mediane follow-up was 27 maanden), maar het gerapporteerde verlies in de follow-up in de studie-doorstroom was slechts 2 personen in de primaire radiotherapie groep. Eén patiënt in de studie overleed ten gevolge van een Transoral Robotic Surgery (TORS)-ingreep gerelateerde bloeding. Er was verder een zeer laag vertrouwen in de gerapporteerde ziektevrije overleving (HR=1,07 met 95%BHI: 0,28 tot 4,01), slikklachten (RR=1,11 met 95%BHI: 0.90 tot 1.37; Eén persoon in de studie (radiotherapie-groep) had een percutane voedingssonde) en kwaliteit van leven (MDADI totale score: 80,1 (TORS) versus 86,9 (RT), p=0,042; MDADI composietscore: 80,2 (TORS) versus 86,7 (RT), p=0,049). Er werden significante verschillen in (slik-gerelateerde) kwaliteit van leven met het MDADI-instrument gemeten, maar deze konden niet worden gezien als een klinisch relevant verschil (dat wil zeggen >10 punten verschil). Kwaliteit van leven werd tevens met meerdere vragenlijsten beoordeeld. Zie Tabel 1 in de resultaten onder het tabblad ‘Onderbouwing’ voor de door Nichols (2019) gerapporteerde scores. Het zeer lage vertrouwen werd veroorzaakt door het geringe aantal deelnemers in de studie en het gebrek aan blindering van patiënten, zorgverleners en uitkomstbeoordelaars bij ‘zachte’ uitkomstmaten. Er werden geen resultaten gevonden voor lokale controle. Ook in de gevonden resultaten over de belangrijke uitkomstmaten is er op dit moment een zeer laag vertrouwen door het geringe aantal deelnemers in de studie en het gebrek aan blindering van patiënten, zorgverleners en uitkomstbeoordelaars.

 

Nichols (2019) berekende het benodigde aantal deelnemers aan de hand van het klinisch relevante verschil op de MDADI (gemiddeld verschil: 10 punten; gepoolde SD: 12; alfa=0,05, bèta=0,1, 10% verwachte drop-out). Het aantal deelnemers in de studie voldeed aan deze berekening, maar er werd geen klinisch relevant verschil gevonden. Aan de hand van het daadwerkelijk gevonden verschil kon worden berekend dat de behaalde ‘power’ 0,57 was bij een gemiddeld verschil van 6,8 punten, een gepoolde SD van 12,3, een alfa van 0,05, een bèta van 0,9, en met n=30 per arm (er waren 30 (TORS) en 27 (RT) ingevulde vragenlijsten op het 1-jaars tijdpunt). Omdat er een zeer beperkt aantal patiënten aan deze studie deelnamen is de imprecisie van de effectschatters groot. In de toekomst zullen resultaten van andere gerandomiseerde studies meer informatie toevoegen over het eventuele (on)gunstige effect van transorale robotische chirurgie ten opzichte van primaire radiotherapie. Via het zoekportaal in het International Clinical Trials Registry Platform (http://apps.who.int/trialsearch/Default.aspx) van de World Health Organization werd er naar geregistreerde gerandomiseerde studies gezocht die transorale robotische chirurgie vergeleken met een vorm van primaire radiotherapie. Er werden vijf gerandomiseerde trials gevonden (zie Tabel 2), waarvan er 1 reeds werd beëindigd, 2 actief zijn maar niet rekruteren en 2 op dit moment rekruteren. Naar verwachting zullen de laatste metingen van patiënten in de trials plaats vinden tussen 2021 en 2029.

 

Tabel 2 Geïdentificeerde trials naar transorale robotische chirurgie versus radiotherapie voor orofarynx carcinomen; uit het International Clinical Trials Registy Platform van de World Health Organization

Randomized trial

Trial ID

Status

Intervention A

Intervention B

Inclusion TNM

Primary completion date (last participant recruitment)

Study completion date (last measurement of intervention / treatment)

EORTC-1420-HNCG-ROG (“Best of” trial)

NCT02984410

(Clinicaltrials.gov)

Recruiting

Any transoral surgery approach (e.g. transoral laser micro-surgery, conventional transoral surgery, transoral robotic surgery)

Intensity modulated radiotherapy with simultaneous integrated boost

 

June 2021

January 2027

QoLATI

NCT04124198

(Clinicaltrials.gov)

Recruiting

Transoral robotic surgery + neck dissection

Intensity-modulated radiation therapy

cT1-2

cN0-1

Distant metastases will be excluded

January 2024

January 2029

ECOG 3311

NCT01898494 (Clinicaltrials.gov)

 

Active, not recruiting

Transoral surgery

Transoral surgery + low-dose intensity-modulated radiation therapy

 

Transoral surgery + standard-dose intensity-modulated radiation therapy

 

Transoral surgery + standard-dose intensity-modulated radiation therapy + chemotherapy

Stage III

Stage IVa

Stage IVb

No evidence of distant metastases

February 2020

 

February 2023

 

ORATOR

NCT01590355 (Clinicaltrials.gov)

 

Active, not recruiting

Transoral robotic surgery + neck dissection

Radiotherapy with or without chemotherapy

T1-2

N0-2

Without extranodal extension

June 2021

 

June 2021

 

NRG/RTOG 1221

NCT01953952 (Clinicaltrials.gov) 

Withdrawn (Slow accrual)

-

-

-

-

-

 

In 2009 werd TORS goedgekeurd voor de behandeling T1-2 orofarynxcarcinomen door de Amerikaanse Food and Drug Administration (FDA) op basis van korte termijn uitkomsten (30-dagen). De volgende studies hebben destijds tot de goedkeuring geleid en zijn samengevat in Tabel 3. (Weinstein, 2007; Weinstein, 2007). Zowel TORS als radiotherapie hebben een curatief doel. Beide behandelingen hebben echter een verschillend patroon van complicaties en toxiciteit door de aard van de interventie. De voorkeur van een patiënt voor één van beide interventies kan hiervan afhangen. Het is daarom belangrijk om de voor- en nadelen van beide interventies met de patiënt te bespreken.

 

Tabel 3 Uitkomsten van studies die tot de FDA goedkeuring hebben geleid

Author (year)

Intervention

Sample size

Patient characteristics

Outcomes

Weinstein (2007)

Radical tonsillectomy

n=27 (1 patient lost to follow-up)

Sex:

25 males / 2 females

 

T-stage, n:

T1: 5

T2: 16

T3: 6

 

N-stage, n:

N0: 4

N1: 13

N2: 10

N3: 0

 

Differentiation, n:

Well: 2

Moderate to well: 2

Moderate: 11

Moderate to poor: 6

Poor: 6

 

Karnofsky score, n:

0-60: 0

70: 1

80: 3

90: 15

100: 8

 

Charlson Comorbidity Index, n:

0: 11

1: 12

2: 2

3: 3

During TORS procedure:

Mean blood loss, ml (range):

189 (0-500)

 

30-day postoperative complications:

Mucosal bleeding, n:

1/27 (4%)

 

Tracheotomy (for exacerbation of sleep apnea), n:

1/27 (4%)

 

Moderate trismus, n:

2/27 (7%)

 

Hypernasality, n:

1/27 (4%)

 

Delirium tremens, n:

1/27 (4%)

 

Mortality, n:

0/27 (0%)

 

Follow-up:

Local or regional recurrences, n:

0/26 (0%)

 

Intubation period:

1 patient had a tracheotomy during the TORS procedure

20 patients were extubated at the end of the TORS procedure

6 patients remained intubated for 2.7 days postoperatively (range: 2-3 days)

 

Swallowing without the use of gastrostomy, n:

26/27 (96%)

 

Adjuvant therapy, n:

Postoperative radiation without chemotherapy: 9

Postoperative irradiation with chemotherapy: 15

Postoperative chemotherapy: 1

Weinstein (2007)

Supraglottic partial laryngectomy

n=3

Sex:

2 males / 1 female

 

Median age, years:

62.3

 

TNM-stage, n:

T2N0M0: 2

T3N0M0: 1

Surgical time, hours:minutes:seconds:

Patient 1: 2:58:18

Patient 2: 1:35:01

Patient 3: 1:32:48

 

Hospitalization, days:

Patient 1: 3

Patient 2: 8

Patient 3: 5

 

Return to swallowing, week:

Patient 1: 6

Patient 2: 5

Patient 3: 5

 

Mean blood loss, ml (range):

200 (100-400)

 

Complications:

No complications

 

Conversions:

No conversions

 

Adjuvant therapy:

The patient with the T3N0M0 carcinoma received chemoradiation after positive lymph nodes were found from neck dissection

 

TORS heeft als voordeel dat het één enkele ingreep betreft en, wanneer er geen complicaties optreden, de opnameduur één nacht is. Wanneer bij histopathologisch onderzoek van het resectiepreparaat na TORS geen indicaties voor adjuvante radiotherapie bestaat kan radiotherapie achter de hand worden gehouden voor het geval er recidief of tweede primaire tumor optreedt. Echter, een nadeel van TORS is dat de patiënt onder narcose moet om de operatie te ondergaan. Er kunnen bloedingen, pijn en ontstekingen ontstaan. Na de ingreep kan tevens blijken dat TORS niet afdoende is geweest en zal een nabehandeling met (chemo)radiatie noodzakelijk zijn. Wanneer er gekozen wordt voor een behandeling met TORS bestaat er een kans dat adjuvante behandeling noodzakelijk blijkt. In de RCT van Nichols (2019), waarin de helft (51%) van de deelnemers N2 status hadden, kregen 70,6% van de deelnemers die TORS ondergingen óók postoperatieve radiotherapie (n=16; 47,1%) of chemoradiotherapie (n=8; 23,5%). De kans op adjuvante chemoradiotherapie zou hoogstwaarschijnlijk lager zijn wanneer er geen patiënten met N2 status waren gerekruteerd. Voor radiotherapie hoeven patiënten niet onder narcose. Door de aard van deze interventie levert radiotherapie géén chirurgie-gerelateerde complicaties op, zoals bloedingen en ontstekingen. Bij het verstrekken van radiotherapie is de duur van de behandeling langer dan de chirurgische interventie. Een radiotherapeutische behandeling kan tot zeven weken duren. Radiotherapie kan daarnaast acute toxiciteit veroorzaken met slikklachten, smaakverlies en een droge mond als gevolg. Ook kunnen lange termijn bijwerkingen optreden zoals, eveneens, slikklachten en een droge mond, maar ook hypothyroïdie, radiatiecariës, radionecrose en/of versnelling van de atherosclerose. Als gevolg van de radiotherapie kunnen met zeer geringe kans op langere termijn secundaire tumoren ontstaan in het hoofd-halsgebied. Van de patiënten die in de RCT van Nichols (2019) radiotherapie ondergingen, in plaats van TORS, ontving 71,9% (n=23) óók concomitante chemotherapie.

 

De kosteneffectiviteit van deze therapieën zouden een verdere afweging kunnen zijn. De Almeida (2015) beschreef dat TORS kosteneffectief is bij patiënten met vroege T-stadium tumoren ongeacht het N-stadium, maar dat de kosteneffectiviteit afneemt naarmate er vaker adjuvante therapie na TORS gegeven moet worden. De auteurs stellen dat een goede patiëntenselectie hierbij belangrijk is om de waarschijnlijkheid op een adjuvante behandeling te verminderen. Rudmik (2015) rapporteert dat intensiteitsgemoduleerde radiotherapie een grotere waarschijnlijkheid heeft om kosteneffectief te zijn dan TORS bij patiënten met T1-2N0M0 tumoren bij afkapwaarden van de bereidheid tot betalen tussen $50.000 en $150.000 per quality-adjusted life-year (QALY). De auteurs dragen aan dat hoog-volume centra wellicht de waarde van zorg (zgn. value of care) van TORS zou kunnen verhogen. Rodin (2016) beschrijft dat de kosteneffectiviteit van zowel TORS als RT afhankelijk waren van specifieke klinische situaties bij niet eerder behandelde patiënten met cT1-2cN0-1 tumoren. De auteurs rapporteren door middel van een probabilistische analyse dat RT een grotere waarschijnlijkheid heeft om kosteneffectief te zijn bij afkapwaarden van de bereidheid tot betalen tussen $50.000 en $150.000 per QALY. Sher (2016) beschreef dat RT een kosteneffectieve behandeling met hoge waarde was voor de niet-rokende, 65 jaar oude man met een HPV-positieve T1-2N2a-b tumor. De auteurs gaven aan dat TORS wellicht een kosteneffectieve interventie zou kunnen worden wanneer het tot een betekenisvolle relatieve verbetering van locoregionale controle zou leiden ten opzichte van primaire chemoradiotherapie, maar dat er nog geen literatuur bekend was die dit aan zou tonen. Kosteneffectiviteitsanalyses zijn afhankelijk van de gebruikte parameters in het model en de eventuele aannames in de analyses. De hier besproken kosteneffectiviteitsanalyses zijn daarom wellicht niet direct één-op-één over te nemen voor de Nederlandse situatie.

 

In Nederland wordt TORS uitgevoerd in een beperkt aantal geselecteeerde centra voor beperkte indicaties. Er zijn geen algemeen geaccepteerde indicaties maar vaak uitgeoefende selectiecriteria zijn de volgende: de tumor is goed bereikbaar, een excisie met chirurgische marges (1cm) is haalbaar en er is geen of één kleine lymfekliermetastase in de hals. De overweging is om adjuvante RT na TORS te voorkomen.

 

Op dit moment is radiotherapie de standaardbehandeling in Nederland. Het is van belang dat de patiënt hiervan op de hoogte wordt gebracht, maar ook dat er eventueel een alternatieve chirurgische optie mogelijk is middels TORS. Door de voor- en nadelen van beide interventies te bespreken in combinatie met de professionele opinie van de medisch-specialist zal gezamenlijk (middels gedeelde besluitvorming) moeten worden afgewogen welke behandeling zal worden ingezet.

 

De werkgroep is echter van mening dat radiotherapie op dit moment de standaard zorg blijft, omdat er onvoldoende bewijs werd gevonden wat met hogere zekerheid het afwijken van de huidige standaardbehandeling ten faveure van TORS in voldoende mate ondersteunt. Er zijn een aantal lopende gerandomiseerde studies geïdentificeerd (Tabel 2). Resultaten van die studies zullen meer wetenschappelijke data toevoegen zodat er in de toekomst mogelijk met hogere zekerheid aanbevelingen kunnen worden gemaakt met betrekking tot de (on)gunstige effecten van beide interventies.

 

Door een sterke voorkeur van de patiënt voor een chirurgische behandeling zou TORS als alternatieve interventie eventueel ingezet kunnen worden wanneer TORS in dat geval óók door de medisch specialist als adequaat voor de betreffende situatie wordt beschouwd. De chirurgische optie vervalt vanzelfsprekend indien er contra-indicaties voor TORS aanwezig zijn. Om de chirurgische interventie (dat wil zeggen TORS) te kunnen uitvoeren moet de betreffende chirurg de benodigde certificering hebben. Daarnaast moet de chirurg ook ervaring met deze operatie hebben en de operatie op regelmatige basis uitvoeren om TORS te kunnen aanbieden.

 

Rationale van de aanbeveling: weging van argumenten voor en tegen de interventies

Aanbeveling-1

De werkgroep is van mening dat patiënten door de verschillende complicatie- en toxiciteitspatronen die ontstaan wegens de aard van beide interventies een sterke voorkeur voor één van beide interventies kan hebben. De werkgroep acht het daarom belangrijk dat de voor- en nadelen van beide interventies besproken moeten worden, maar ook dat aangegeven wordt dat radiotherapie vooralsnog de huidige standaardzorg is.

 

Aanbeveling-2

De werkgroep is van mening dat radiotherapie de standaardbehandeling van patiënten met T1-2N0-1 orofarynxcarcinomen blijft. Op dit moment is de huidige behandeling radiotherapie en geeft de lage zekerheid in het gevonden bewijs vooralsnog geen richting om TORS boven radiotherapie te verkiezen, maar behandel patiënten zo veel mogelijk met één behandelingsmodaliteit. Bij patiënten met N1 ziekte die behandeld worden met TORS zal er een halsklierdissectie verricht moeten worden. De resultaten van de lopende gerandomiseerde studies dienen afgewacht te worden.

 

Deze aanbeveling is daarom gebaseerd op het ontbreken van een hoge(re) zekerheid in alle eindpunten die in de PICO gedefinieerd zijn. Er is maar één RCT beschikbaar. Vanuit deze studie zijn er met lage zekerheid aanwijzingen dat beide behandelingen (TORS en RT) mogelijk een vergelijkbare 5-jaars overleving hebben. Er is geen data over de impact van beide modaliteiten wat betreft de lokale controle in deze studie. Tevens is het effect van TORS ten opzichte van RT op alle toxiciteit eindpunten onduidelijk vanuit deze studie.

Onderbouwing

De standaardbehandeling van patiënten met T1-2N0-1 orofarynxcarcinomen is radiotherapie. Transorale robotische chirurgie (Transoral Robotic Surgery, TORS) wordt in aantal ziekenhuizen aangeboden als alternatief. In de Verenigde Staten is TORS geregistreerd voor deze indicatie door de Food and Drugs Administration (FDA). Gezien het feit dat deze aandoening bij een steeds jongere patientenpopulatie vastgesteld wordt door de toename van HPV+ tumoren en gelet de toxiciteit van de radiotherapie, zeker op lange termijn, wordt de behandeling middels TORS al dan niet in combinatie met (een eventueel lagere dosis) radiotherapie intensief onderzocht.

Conclusions

Transoral robotic surgery (TORS, including patients that received adjuvant (chemo)radiotherapy) versus primary radiotherapy (RT, including patients that reveived concurrent chemotherapy and salvage surgery)

Very low

GRADE

We are unsure about the differences between TORS and RT in the 5-year overall survival.

 

Sources: (Nichols, 2019)

 

Very low GRADE

We are unsure about the effect of TORS on the disease-free survival when compared to RT.

 

Sources: (Nichols, 2019)

 

Very low

GRADE

We are unsure about the effect of TORS on swallowing complaints when compared to RT.

 

Sources: (Nichols, 2019)

 

-

GRADE

No studies were included that assessed and reported the local control.

 

Very low GRADE

We are unsure about the effect of TORS on the quality of life when compared to RT.

 

Sources: (Nichols, 2019)

 

Very low GRADE

We are unsure about the effect of TORS on trismus when compared to RT.

 

Sources: (Nichols, 2019)

 

Very low GRADE

We are unsure about the effect of TORS on taste alterations when compared to RT.

 

Sources: (Nichols, 2019)

 

Very low GRADE

We are unsure about the effect of TORS on the dryness of the mouth when compared to RT.

 

Sources: (Nichols, 2019)

 

Very low GRADE

We are unsure about the effect of TORS on oral mucositis when compared to RT.

 

Sources: (Nichols, 2019)

Description of studies

Transoral robotic surgery (TORS) versus primary radiotherapy (RT) in Nichols (2019)

Nichols (2019) reported on a multicenter randomized controlled trial with centers recruiting in Canada and Australia to compare TORS with neck dissection (on indication) with primary radiotherapy (RT) as part of the ORATOR-trial. Data and procedures were extracted from the study protocol (Nichols, 2013) and the study report with appendices (Nichols, 2019).

 

Nichols (2019) included patients who were over 18 years old, had an ECOG-status of 0 to 2, had a histologically confirmed squamous cell carcinoma where the primary site was the oropharynx, had a T1-2 carcinoma and were likely to have negative resection margins at surgery, had N0-2 without extranodal extension (on pre-randomization imaging), the complete blood count/differential was obtained 4 week prior to randomization (with adequate bone marrow, hepatic, and renal function), and the patient was assessed at a multidisciplinary head and neck clinic and presented at a multidisciplinary tumor board prior to randomization. Patients were excluded when there were serious medical comorbidities, there were contraindications to therapy (radiotherapy, chemotherapy, surgery), there was prior history of head and neck cancer within 5 years, the patient had prior head or neck radiation, the patient had metastases, the patient was unable to attend full-course radiotherapy or follow-up visits, the patient had prior malignant disease (unless 5-year disease-free) with the exception of non-melanoma skin cancer, the patient was pregnant or lactating, or when the patient was unwilling or unable to complete the quality of life questionnaires.

 

A total of 68 patients were recruited and randomly allocated (1:1 allocation, block size 4). Patients in the TORS-group (n=34, 28 males) had a median age of 58.2 years (IQR: 52.6 to 64.5) and the primary tumor located at the tonsil / tonsillar fossa (n=24) or at the base of the tongue (n=10). Patients had an ECOG score of either 0 (n=30) or 1 (n=4), while 6 out of 22 (27%) who were asked drank over 21 drinks per week. Twenty-one (62%) patients undergoing TORS had a smoking history. Clinical T-stage was either T1 (n=17) or T2 (n=17), while clinical N-stage was N0 (n=9), N1 (n=7), or N2 (n=18). There were 30 HPV-positive patients in the TORS-group, as measured with p16 staining. Patients in the radiotherapy-group (n=34, 31 males) had a median age of 60 years (IQR: 53.2 to 65.2) and the primary tumor located at the tonsil / tonsillar fossa (n=26) or at the base of the tongue (n=8). Patients had an ECOG score of 0 (n=30) or 1 (n=4). Eighteen persons were asked about the alcohol-intake, resulting in 1 person (6%) having more than 21 drinks per week. Twenty-eight (82%) patients had a smoking history. In the RT group, the clinical T-stage was T1 (n=13) or T2 (n=21), while the clinical N-stage was N0 (n=12), N1 (n=5), or N2 (n=17). There were 30 HPV-positive patients by p16 staining in the RT-group as well.

 

In the TORS-group, a surgical robot was used to excise the primary oropharyngeal tumor with the spatula caultry (1cm resection margin). Selective neck dissection was performed at the discretion of the surgeon during surgery or within 2 weeks after surgery. Surgeons had to perform at least 10 TORS excisions prior to enrolling patients in the study. The surgical specimen was sent for frozen section analysis and the excision continued until negative margins were obtained. Adjuvant radiotherapy was given, however could be omitted when there was no extranodal extension, positive margins, pT3-4, nodal disease, or lymphovascular invasion. Thus, radiotherapy was given in the region of positive margins (64 Gy, 30 fractions, 6 weeks), in high risk nodal areas (60 Gy, 30 fractions, 6 weeks), or in low risk nodal areas (54 Gy, 30 fractions, 6 weeks). Concurrent chemotherapy with cisplatin (100mg/m2 every 3 weeks in a 3 week cycle) could be administered when there were positive margins or extracapsular extensions. When patients were deemed unfit for cisplatin chemotherapy the doses and schedules could be modified, or cetuximab or weekly carboplatin (AUC 1.5) could be administered at the discretion of the medical oncologist. Out of the 34 patients in the TORS-group, 24 (71%) patients received radiotherapy and 8 (24%) patients received chemotherapy (cisplatin: n=5, carboplatin: n=3). Patients received chemotherapy in a median number of cycles of 6 (IQR: 4.5 to 6). It was unclear whether there were any deviations from the cisplatin schedule (100mg/m2 every 3 weeks in a 3 week cycle) at the medical oncologist’s discretion.

 

In the RT-group, primary radiotherapy was given to the gross tumor and nodes (70 Gy, 35 fractions, 7 weeks). Radiotherapy was further administered in high risk nodal areas (63 Gy, 35 fractions, 7 weeks) and in low risk nodal areas (56 Gy, 35 fractions, 7 weeks). At the treating radiation oncologist’s discretion the radiotherapy regimen could be accelerated or hyperfractionated, where the same dose could be provided in 6 weeks. Concurrent chemotherapy was administered with positive nodes (i.e. N1-2) and omitted when N0. Chemotherapy doses and schedules could be modified for patients who were deemed unfit for cisplatin, or cetuximab or weekly carboplatin (AUC 1.5) could be administered at the discretion of the medical oncologist. Twenty-three (68%) patients received chemotherapy (cisplatin: n=19, carboplatin: n=3, cetuximab: n=1). Patients received chemotherapy in a median number of cycles of 3 (IQR: 2-6). It was unclear whether there were any deviations from the cisplatin schedule (100mg/m2 every 3 weeks in a 3 week cycle) at the medical oncologist’s discretion.Treatment response was evaluated by CT or PET-CT 8 to 12 weeks after completion of radiotherapy. When the CT showed residual nodes over 1 centimeter, patients were recommended salvage surgery. For PET-CT evaluation, residual nodes had to be over 1 centimeter and FDG-avid. Patients were offered surgical salvage when feasible for relapse or progressive disease. Four (12%) patients received salvage surgery, however it was unclear whether nodes were examined by a pathologist to confirm metastases.

 

Patients were followed-up every 3 months in the first two years and every 6 months in year 3 to 5. Physical examination and adverse event monitoring took place at every visit. Quality of life measurements and a chest x-ray was performed every 6 months, with the exception of the 1-year time point where a CT-scan was taken instead of an x-ray. The RT-group had an additional assessment at 8 to 12 weeks post-radiotherapy to assess the treatment response and the need for salvage surgery. The median follow-up in de study was 27 months (IQR: 20 to 48). Two patients in the RT-group withdrew consent after randomization (no reasons provided).

 

Nichols (2019) measured quality of life (QoL) with several validated questionnaires: MD Anderson Dysphagia Index (MDADI, score range: 20 to 100, higher indicates a better QoL), European Organization for Research and Treatment of Cancer Quality of Life of Cancer Patients general (EORTC QLQ-C30, score range: 0 to 100, higher score indicates a worse QoL), Organization for Research and Treatment of Cancer Quality of Life of Cancer Patients Head and Neck (EORTC H&N35, score range: 0 to 100, higher score indicates a worse QoL), Voice Handicap Index (VHI-10, score range: 0 to 40, higher score indicates a better QoL), Neck Dissection Impairment Index (NDII, score range: 0 to 100, higher score indicates a better QoL), Patient Neurotoxicity Questionnaire (PNQ, 2 items on a 5-point Likert scale), and Functional Oral Intake Scale (FOIS, 7-point Likert scale, higher scores indicate a better QoL).

 

Results

Transoral robotic surgery (TORS) versus primary radiotherapy (RT)

Overall survival

Nichols (2019) reported the 5-year overall survival of both groups, each containing 34 patients (reference group=TORS; log-rank p=0.89; HR=0.83, 95%CI: 0.21 to 8.35). Over the course of 5 years, there were 4 observed deaths in the RT-group (n=3 metastatic disease, n=1 cardiac event outside the hospital) and 5 observed deaths in the TORS group (n=3 metastatic disease, n=1 TORS-related bleeding, n=1 cardiac arrest after alcohol overdose and hypoglycaemia). A total of 27 persons in the TORS-group and 28 persons in the RT-group were censored over the course of 5 years. No reasons for censoring were provided.

 

Disease-free survival

Nichols (2019) defined the 5-year ‘progression-free survival’ as the time from randomization to either death or recurrence, whichever occurred first. A hazard ratio of 1.07 (95%CI: 0.28 to 4.01; reference group=TORS) and a log-rank p of 0.63 were reported. A total of 26 persons in the TORS-group and 28 persons in the RT-group were censored over the course of 5 years. No reasons for censoring were provided. There were 4 recurrences observed in each group.

 

Swallowing

Nichols (2019) reported swallowing complications per grade. The relative risk (RR) was not reported, however from these data the RR could be calculated. For grade 1 to 2 dysphagia an RR of 1.00 (95%CI: 0.69 to 1.45, reference group=RT) was reported. Both in the TORS and RT-group 21 grade 1-2 events were observed. Grade 3 dysphagia had 9 events in the TORS-group and 6 events in the RT-group. Here, an RR of 1.50 (95%CI: 0.60 to 3.75) was calculated. When all observed events were combined (TORS: 30 events, RT: 27 events) the RR was 1.11 (95%CI: 0.90 to 1.37). One person in the RT-group used a percutaneous feeding tube at the 1 year time point, compared to none in the TORS-group.

 

Local control

No studies were included that reported the local control.

 

Quality of life

Nichols (2019) assessed the 1-year quality of life with several questionnaires, however the quality of life as measured with the MDADI was the primary outcome measure. The MDADI total score differed significantly between groups at 1 year (TORS: 80.1 (SD: 13), RT: 86.9 (SD: 11.4), p=0.042), indicating the RT-group had a better swallowing-related quality of life. Similarly, a statistically significant difference was reported for the MDADI composite score (TORS: 80.2 (SD: 13.1), RT: 86.7 (SD: 11.4), p=0.049), indicating a better swallowing-related quality of life for the RT-group. The total score on the VHI-10 (TORS: 4.5 (SD: 4.3), RT: 4.4 (SD: 4.6), p=0.89) and NDII (TORS: 81.5 (SD: 28.7), RT: 92.3 (SD: 10), p=0.072) showed no significant difference. Summary scores for the EORTC QLQ-C30 and the EORTC H&N35 were not reported. For scores on sub-scales of the questionnaires we refer to Table 1.

 

Table 1 Overview of the 1-year quality of Life measurements per questionnaire as measured by Nichols (2019)

Quality of life instrument

Outcome

MD Anderson Dysphagia Index (MDADI, score range: 20-100, higher indicates a better QoL), completed surveys at the 1-year time point: 30 for TORS, 27 for RT.

MDADI total score, mean score (SD):

TORS: 80.1 (13)

RT: 86.9 (11.4)

Mean difference: 6.7 (95%CI: 0.2 to 13.2)

Statistically significant difference between groups: p=0.042

 

MDADI global sub-scale score, mean score (SD):

TORS: 79.3 (22.6)

RT: 89.6 (15.1)

Mean difference: 10.3 (95%CI: 0.2 to 20.4)

Statistically significant difference between groups: p=0.046

 

MDADI emotional sub-scale score, mean score (SD):

TORS: 81.3 (12.5)

RT: 88.8 (12)

Mean difference: 7.4 (95%CI: 0.9 to 14)

Statistically significant difference between groups: p=0.027

 

MDADI functional sub-scale score, mean score (SD):

TORS: 86.5 (12)

RT: 89.9 (11.5)

Mean difference: 3.4 (95%CI: -2.9 to 9.6)

No statistically significant difference between groups: p=0.28

 

MDADI physical sub-scale score, mean score (SD):

TORS: 75.3 (16.5)

RT: 83.1 (14.1)

Mean difference: 7.9 (95%CI: -0.3 to 16)

No statistically significant difference between groups: p=0.058

 

MDADI composite score, mean score (SD):

TORS: 80.2 (13.1)

RT: 86.7 (11.4)

Mean difference: 6.5 (95%CI: 0.0 to 13.1)

Statistically significant difference between groups: p=0.049

European Organization for Research and Treatment of Cancer Quality of Life of Cancer Patients General (EORTC QLQ-C30, score range: 0-100, higher score indicates a worse QoL on symptom scales, a high score on functional and global health scales represent higher functioning/QoL), unclear number of completed surveys at the 1-year time point.

EORTC-C30 Global health status sub-scale score, mean score (SD):

TORS: 77.9 (19.5)

RT: 76.2 (20.9)

No statistically significant difference between groups: p= 0.76

 

EORTC-C30 Physical functioning sub-scale score, mean score (SD):

TORS: 9.4 (16.1)

RT: 5.9 (7.2)

No statistically significant difference between groups: p= 0.29

 

EORTC-C30 Role functioning sub-scale score, mean score (SD):

TORS: 18.3 (30.1)

RT: 11.1 (17.9)

No statistically significant difference between groups: p= 0.27

 

EORTC-C30 Emotional functioning sub-scale score, mean score (SD):

TORS: 14.9 (19.5)

RT: 12.0 (15.9)

No statistically significant difference between groups: p= 0.54

 

EORTC-C30 Cognitive functioning sub-scale score, mean score (SD):

TORS: 13.8 (18.9)

RT: 11.7 (15.9)

No statistically significant difference between groups: p=0.66

 

EORTC-C30 Social functioning status sub-scale score, mean score (SD):

TORS: 13.2 (20.1)

RT: 6.4 (13.4)

No statistically significant difference between groups: p= 0.14

 

EORTC-C30 Fatigue sub-scale score, mean score (SD):

TORS: 18.1 (20.5)

RT: 15.6 (13.5)

No statistically significant difference between groups: p= 0.59

 

EORTC-C30 Nausea/ vomiting sub-scale score, mean score (SD):

TORS: 5.0 (9.9)

RT: 4.3 (10.9)

No statistically significant difference between groups: p= 0.81

 

EORTC-C30 Pain sub-scale score, mean score (SD):

TORS: 21.8 (25.2)

RT: 8.0 (16.3)

Statistically significant difference between groups: p= 0.018

 

EORTC-C30 Dyspnea sub-scale score, mean score (SD):

TORS: 7.8 (14.3)

RT: 4.9 (12.1)

No statistically significant difference between groups: p= 0.42

 

EORTC-C30 Insomnia sub-scale score, mean score (SD):

TORS: 17.8 (27.3)

RT: 28.4 (28.8)

No statistically significant difference between groups: p= 0.16

 

EORTC-C30 Appetite loss sub-scale score, mean score (SD):

TORS: 13.3 (27.1)

RT: 16.0 (25.1)

No statistically significant difference between groups: p= 0.70

 

EORTC-C30 Constipation sub-scale score, mean score (SD):

TORS: 4.4 (14.5)

RT: 8.6 (14.9)

No statistically significant difference between groups: p= 0.29

 

EORTC-C30 Diarrhea sub-scale score, mean score (SD):

TORS: 5.7 (15.6)

RT: 2.5 (8.9)

No statistically significant difference between groups: p= 0.34

 

EORTC-C30 Financial difficulties sub-scale score, mean score (SD):

TORS: 14.9 (29.0)

RT: 11.1 (24.5)

No statistically significant difference between groups: p= 0.59

Organization for Research and Treatment of Cancer Quality of Life of Cancer Patients Head and Neck (EORTC H&N35, score range: 0-100, higher score indicates a worse QoL on symptom scales, a high score on functional scales represent higher functioning/QoL), unclear number of completed surveys at the 1-year time point.

EORTC QLQ-HN35 Pain sub-scale score, mean score (SD):

TORS: 13.3 (14.9)

RT: 9.0 (12.4)

No statistically significant difference between groups: p= 0.23

 

EORTC QLQ-HN35 Swallowing sub-scale score, mean score (SD):

TORS: 12.7 (16.1)

RT: 7.4 (7.4)

No statistically significant difference between groups: p= 0.11

 

EORTC QLQ -HN35 Senses sub-scale score, mean score (SD):

TORS: 20.6 (21.3)

RT: 20.5 (22.8)

No statistically significant difference between groups: p > 0.99

 

EORTC QLQ -HN35 Speech sub-scale score, mean score (SD):

TORS: 7.7 (9.9)

RT: 5.8 (9.9)

No statistically significant difference between groups: p= 0.48

 

EORTC QLQ -HN35 Social eating sub-scale score, mean score (SD):

TORS: 11.8 (14.4)

RT: 7.1 (10.3)

No statistically significant difference between groups: p= 0.16

 

EORTC QLQ -HN35 Social contact sub-scale score, mean score (SD):

TORS: 4.6 (10.1)

RT: 1.5 (6.5)

No statistically significant difference between groups: p= 0.17

 

EORTC QLQ -HN35 Less sexuality sub-scale score, mean score (SD):

TORS: 22.0 (27.6)

RT: 17.3 (25.2)

No statistically significant difference between groups: p= 0.51

 

EORTC QLQ -HN35 Teeth sub-scale score, mean score (SD):

TORS: 12.2 (22.3)

RT: 1.2 (6.4)

Statistically significant difference between groups: p= 0.014

 

EORTC QLQ -HN35 Opening mouth sub-scale score, mean score (SD):

TORS: 11.1 (22.0)

RT: 6.4 (13.4)

No statistically significant difference between groups: p= 0.33

 

EORTC QLQ -HN35 Dry mouth sub-scale score, mean score (SD):

TORS: 44.4 (30.7)

RT: 53.1 (31.0)

No statistically significant difference between groups: p= 0.30

 

EORTC QLQ -HN35 Sticky saliva sub-scale score, mean score (SD):

TORS: 31.1 (34.9)

RT: 32.1 (28.5)

No statistically significant difference between groups: p= 0.91

 

EORTC QLQ -HN35 Coughing sub-scale score, mean score (SD):

TORS: 22.2 (23.7)

RT: 24.7 (25.5)

No statistically significant difference between groups: p= 0.71

 

EORTC QLQ -HN35 Felt ill sub-scale score, mean score (SD):

TORS: 6.7 (13.6)

RT: 3.7 (10.7)

No statistically significant difference between groups: p= 0.36

 

EORTC QLQ -HN35 Pain killers sub-scale score, mean score (SD):

TORS: 44.8 (50.6)

RT: 14.8 (36.2)

Statistically significant difference between groups: p= 0.013

 

EORTC QLQ -HN35 Nutritional supplements sub-scale score, mean score (SD):

TORS: 24.1 (43.5)

RT: 29.6 (46.5)

No statistically significant difference between groups: p= 0.65

 

EORTC QLQ -HN35 feeding tube sub-scale score, mean score (SD):

TORS: 0.0 (0)

RT: 3.7 (19.2)

No statistically significant difference between groups: p= 0.33

 

EORTC QLQ -HN35 weight loss sub-scale score, mean score (SD):

TORS: 20.7 (41.2)

RT: 3.7 (19.2)

No statistically significant difference between groups: p= 0.053

 

EORTC QLQ -HN35 weight gain sub-scale score, mean score (SD):

TORS: 37.9 (49.4)

RT: 40.7 (50.1)

No statistically significant difference between groups: p= 0.83

Voice Handicap Index (VHI-10, score range: 0-40, higher score indicates a better QoL), unclear number of completed surveys at the 1-year time point.

VHI-10 total score, mean score (SD):

TORS: 4.5 (4.3)

RT: 4.4 (4.6)

No statistically significant difference between groups: p= 0.89

Neck Dissection Impairment Index (NDII, score range: 0-100, higher score indicates a better QoL), unclear number of completed surveys at the 1-year time point.

NDII total score, mean score (SD):

TORS: 81.5 (28.7)

RT: 92.3 (10.0)

No statistically significant difference between groups: p= 0.072

Patient Neurotoxicity Questionnaire (PNQ, 2 items on a 5-point Likert scale), unclear number of completed surveys at the 1-year time point.

PNQ Numbness sub-scale score, mean score (SD):

TORS: 0.5 (0.8)

RT: 0.3 (0.6)

No statistically significant difference between groups: p= 0.57

 

PNQ Weakness sub-scale score, mean score (SD):

TORS: 0.5 (1.0)

RT: 0.2 (0.5)

No statistically significant difference between groups: p= 0.14

Functional Oral Intake Scale (FOIS, 7-point Likert scale, higher scores indicate a better QoL), unclear number of completed surveys at the 1-year time point.

FOIS, level 7 “expansion of oral diet” reached at 1 year, n(%):

TORS: 26/31 (84%)

RT: 27/27 (100%)

No statistically significant difference between groups: p= 0.055

QoL: Quality of Life

RT: Radiotherapy-group

TORS: Transoral robotic surgery-group

 

Trismus

Nichols (2019) reported grade 1-2 trismus in 8 of the 34 patients (23.5%) in the TORS-group and in 1 of the 34 patients (2.9%) in the RT-group. The RR was not reported, however from these data the RR could be calculated. Based on the data an RR of 8.00 (95%CI: 1.06 to 60.5) was calculated. One patient in the TORS-group had a grade 3 trismus complication, therefore the overall RR was 9.00 (95%CI: 1.21 to 67.21).

 

Taste

Grade 1 to 2 taste alterations were observed by Nichols (2019) in 17 patients (50%) in the TORS-group, compared to 19 patients (55.9%) in the RT group. The RR was not reported, however from these data the RR could be calculated. An RR of 0.89 (95%CI: 0.57 to 1.40) was calculated. Taste alterations in grade 3 or higher were not prevalent in both groups.

 

Dryness of the mouth

Grade 1 to 2 dryness of the mouth was reported in 18 of the 34 patients (52.9%) in the TORS-group, compared to 24 out of 34 patients (70.6%) in the RT-group. The RR was not reported, however from these data the RR could be calculated. The calculated RR was 0.75 (95%CI: 0.51 to 1.10). One patient in the RT-group had a grade 3 dryness of the mouth. The RR of all observed events was 0.72 (95%CI: 0.49 to 1.05, TORS: 18 events, RT: 25 events).

 

Mucositis

Nichols (2019) reported oral mucositis in 8 (23.5%) patients in the TORS-group, compared to 11 (32.4%) patients in the RT-group. The RR was not reported, however from these data the RR could be calculated. From the data, the calculated RR was 0.73 (95%CI: 0.33 to 1.58). Four patients in the RT-group had a grade 3 oral mucositis. The overall RR for oral mucositis was 0.53 (95%CI: 0.26 to 1.09, TORS: 8 events, RT: 15 events).

 

Level of evidence of the literature

Transoral robotic surgery (TORS) versus primary radiotherapy (RT)

The level of evidence regarding the outcome measure overall survival (crucial) was downgraded by 3 levels because of the number of included patients (imprecision: only 34 patients were included in each study arm. The number of censored participants was large in both arms, providing limited data to the 5-year overall survival); indirectness (1 level for indirectness: about half of the recruited patients had an N2 carcinoma); publication bias could not be assessed. We did not downgrade for a lack of blinding (risk of bias), because overall survival was considered as a ‘hard’ outcome measure.

 

The level of evidence regarding the outcome measure disease-free survival (crucial) was downgraded by 4 levels because of study limitations (1 level for risk of bias: care providers and outcome assessors were not blinded for the treatment allocation); and the number of included patients (2 levels for imprecision: only 34 patients were included in each study arm. The number of censored participants was large in both arms, providing limited data to the 5-year disease-free survival); indirectness (1 level for indirectness: about half of the recruited patients had an N2 carcinoma); publication bias could not be assessed.

 

The level of evidence regarding the outcome measure swallowing (crucial) was downgraded by 4 levels because of study limitations (1 level for risk of bias: patients, care providers and outcome assessors were not blinded for the treatment allocation); and the number of included patients (2 levels for imprecision: only 34 patients were included in each study arm); indirectness (1 level for indirectness: about half of the recruited patients had an N2 carcinoma); publication bias could not be assessed.

 

The level of evidence regarding the outcome measure local control (crucial) was not graded, since there were no studies included that reported this outcome measure.

 

The level of evidence regarding the outcome quality of life (crucial) was downgraded by 4 levels because of study limitations (1 level for risk of bias: patients, care providers and outcome assessors were not blinded for the treatment allocation); and the number of included patients (2 levels for imprecision: only 34 patients were included in each study arm. Power calculation (using the reported mean difference of 6.8 on de MDADI, SD=12.2, alpha=0.05, beta=0.1, +10% assumed dropout) revealed that 75 participants per arm were needed); indirectness (1 level for indirectness: about half of the recruited patients had an N2 carcinoma); publication bias could not be assessed.

 

The level of evidence regarding the outcome measure trismus (important) was downgraded by 4 levels because of study limitations (1 level for risk of bias: patients, care providers and outcome assessors were not blinded for the treatment allocation); and the number of included patients (2 levels for imprecision: only 34 patients were included in each study arm); indirectness (1 level for indirectness: about half of the recruited patients had an N2 carcinoma); publication bias could not be assessed.

 

The level of evidence regarding the outcome measure taste (important) was downgraded by 4 levels because of study limitations (1 level for risk of bias: patients, care providers and outcome assessors were not blinded for the treatment allocation); and the number of included patients (2 levels for imprecision: only 34 patients were included in each study arm); indirectness (1 level for indirectness: about half of the recruited patients had an N2 carcinoma); publication bias could not be assessed.

 

The level of evidence regarding the outcome measure dryness of the mouth (important) was downgraded by 4 levels because of study limitations (1 level for risk of bias: patients, care providers and outcome assessors were not blinded for the treatment allocation); and the number of included patients (2 levels for imprecision: only 34 patients were included in each study arm); indirectness (1 level for indirectness: about half of the recruited patients had an N2 carcinoma); publication bias could not be assessed.

 

The level of evidence regarding the outcome measure mucositis (important) was downgraded by 4 levels because of study limitations (1 level for risk of bias: patients, care providers and outcome assessors were not blinded for the treatment allocation); and the number of included patients (2 levels for imprecision: only 34 patients were included in each study arm); indirectness (1 level for indirectness: about half of the recruited patients had an N2 carcinoma); publication bias could not be assessed.

A systematic review of the literature was performed to answer the following question:

What are the (un)beneficial effects of TORS (with or without transoral microsurgery, and with or without adjuvant radiotherapy) on overall survival, disease-free survival, local control and quality of life, e.g. swallowing, trismus, taste, dryness of the mouth, and mucositis in patients with a T1-2N0-1 oropharyngeal carcinoma, when compared to primary radiotherapy.

 

P: patients with a T1-2N0-1 oropharyngeal carcinoma;

I: transoral robotic surgery with or without transoral microsurgery and with or without adjuvant radiotherapy;

C: primary radiotherapy;

O: overall survival, disease-free survival, local control, swallowing (complaints), trismus, taste, dryness of the mouth, mucositis, quality of life.

 

Relevant outcome measures

The guideline development group considered overall survival, disease-free survival, local control, swallowing, and quality of life (as measured with the MD Anderson Dysphagia Index (MDADI)) as a critical outcome measure for decision making; and trismus, dryness of the mouth, and mucositis as an important outcome measure for decision making.

 

A priori, the working group did not define the outcome measures listed above but used the definitions used in the studies.

 

The working group defined a minimal clinically relevant difference as (in line with “NVMO-commissie ter Beoordeling van Oncologische Middelen (BOM)”):

  • > 5% difference or more >3% and HR <0.7 in overall survival.
  • HR< 0.7 for progression free survival.

And, in case of absence of a clinically relevant difference in overall survival or progression free survival:

  • A minimal clinically important difference of 10 points on the quality of life instrument EORTC QLQ-C30 (in line with Mehanna, 2019) or a difference of a similar magnitude on other quality of life instruments.
  • Statistically significant less complications/adverse events.
  • Statistically significant better functional outcomes, work participation.

 

Search and select (Methods)

The databases Medline (via OVID) and Embase (via Embase.com) were searched with relevant search terms until 6th of January 2019 for systematic reviews and randomized controlled trials. The detailed search strategy is depicted under the tab Methods. The systematic literature search resulted in 106 hits. Studies or systematic reviews were selected based on the following criteria: patients had a T1-2N0-1 oropharyngeal carcinoma, transoral robotic surgery was compared with primary radiotherapy, at least one of the outcomes of interest was reported (overall survival, disease-free survival, local control, swallowing (complaints), trismus, dryness of the mouth, mucositis, quality of life), the study design was a randomized controlled trial or the systematic review contained randomized controlled trials, reports had to be written in English or Dutch. Twenty-one studies were initially selected based on title and abstract screening. After reading the full text, 20 studies were excluded (see the table with reasons for exclusion under the tab Evidence tables) and 1 randomized controlled trial was included.

 

Results

One randomized controlled trial (Nichols, 2019) was included in the analysis of the literature. Important study characteristics and results are summarized in the evidence tables. The assessment of the risk of bias is summarized in the risk of bias tables (under the tab Evidence tables).

  1. De Almeida JR, Moskowitz AJ, Miles BA, Goldstein DP, Teng MS, Sikora AG, Gupta V, Posner M, Genden EM. Cost-effectiveness of transoral robotic surgery versus (chemo)radiotherapy for early T classification oropharyngeal carcinoma: A cost-utility analysis. Head Neck. 2016 Apr;38(4):589-600. doi: 10.1002/hed.23930. Epub 2015 Jun 30. PMID: 25488048.
  2. Nichols AC, Yoo J, Hammond JA, Fung K, Winquist E, Read N, Venkatesan V, MacNeil SD, Ernst DS, Kuruvilla S, Chen J, Corsten M, Odell M, Eapen L, Theurer J, Doyle PC, Wehrli B, Kwan K, Palma DA. Early-stage squamous cell carcinoma of the oropharynx: radiotherapy versus. trans-oral robotic surgery (ORATOR)—study protocol for a randomized phase II trial. BMC Cancer. 2013 Mar 20;13:133. doi: 10.1186/1471-2407-13-133. PubMed PMID: 23514246; PubMed Central PMCID: PMC3621077.
  3. Nichols AC, Theurer J, Prisman E, Read N, Berthelet E, Tran E, Fung K, de Almeida JR, Bayley A, Goldstein DP, Hier M, Sultanem K, Richardson K, Mlynarek A, Krishnan S, Le H, Yoo J, MacNeil SD, Winquist E, Hammond JA, Venkatesan V, Kuruvilla S, Warner A, Mitchell S, Chen J, Corsten M, Johnson-Obaseki S, Eapen L, Odell M, Parker C, Wehrli B, Kwan K, Palma DA. Radiotherapy versus transoral robotic surgery and neck dissection for oropharyngeal squamous cell carcinoma (ORATOR): an open-label, phase 2, randomised trial. Lancet Oncol. 2019 Oct;20(10):1349-1359. doi: 10.1016/S1470-2045(19)30410-3. Epub 2019 Aug 12. Erratum in: Lancet Oncol. 2019 Dec;20(12):e663. PubMed PMID: 31416685.
  4. NVMO-commissie ter Beoordeling van Oncologische Middelen (BOM). PASKWIL criteria 2018.
  5. Rodin D, Caulley L, Burger E, Kim J, Johnson-Obaseki S, Palma D, Louie AV, Hansen A, O'Sullivan B. Cost-Effectiveness Analysis of Radiation Therapy Versus Transoral Robotic Surgery for Oropharyngeal Squamous Cell Carcinoma. Int J Radiat Oncol Biol Phys. 2017 Mar 15;97(4):709-717. doi: 10.1016/j.ijrobp.2016.11.029. Epub 2016 Nov 27. PMID: 28244405.
  6. Rudmik L, An W, Livingstone D, Matthews W, Seikaly H, Scrimger R, Marshall D. Making a case for high-volume robotic surgery centers: A cost-effectiveness analysis of transoral robotic surgery. J Surg Oncol. 2015 Aug;112(2):155-63. doi: 10.1002/jso.23974. Epub 2015 Jul 14. PMID: 26171771.
  7. Sher DJ, Fidler MJ, Tishler RB, Stenson K, al-Khudari S. Cost-Effectiveness Analysis of Chemoradiation Therapy Versus Transoral Robotic Surgery for Human Papillomavirus-Associated, Clinical N2 Oropharyngeal Cancer. Int J Radiat Oncol Biol Phys. 2016 Mar 1;94(3):512-22. doi: 10.1016/j.ijrobp.2015.11.006. Epub 2015 Nov 10. PMID: 26867880.
  8. Weinstein GS, O'Malley BW Jr, Snyder W, Sherman E, Quon H. Transoral robotic surgery: radical tonsillectomy. Arch Otolaryngol Head Neck Surg. 2007 Dec;133(12):1220-6. doi: 10.1001/archotol.133.12.1220. PMID: 18086963.
  9. Weinstein GS, O'Malley BW Jr, Snyder W, Hockstein NG. Transoral robotic surgery: supraglottic partial laryngectomy. Ann Otol Rhinol Laryngol. 2007 Jan;116(1):19-23. doi: 10.1177/000348940711600104. PMID: 17305273.

Study reference

 

 

 

 

(first author, publication year)

Describe method of randomisation1

Bias due to inadequate concealment of allocation?2

 

 

 

 

(unlikely/likely/unclear)

Bias due to inadequate blinding of participants to treatment allocation?3

 

 

(unlikely/likely/unclear)

Bias due to inadequate blinding of care providers to treatment allocation?3

 

 

(unlikely/likely/unclear)

Bias due to inadequate blinding of outcome assessors to treatment allocation?3

 

(unlikely/likely/unclear)

Bias due to selective outcome reporting on basis of the results?4

 

 

(unlikely/likely/unclear)

Bias due to loss to follow-up?5

 

 

 

 

 

 

(unlikely/likely/unclear)

Bias due to violation of

intention to treat analysis?6

 

 

 

 

(unlikely/likely/unclear)

Nichols 2019

Random 1:1 (block size 4) assignment using a computer-generated randomisation list. The list was prepared by a statistician, who was not involved in the study. Groups were stratified by p16-status (hpv surrogate marker)

Unlikely

 

Reason: Assignment was done by a trial coordinator who was not involved in clinical management. Only the trial coordinator had access to the locked and concealed list of allocations. Allocation of treatment group was communicated by mail. The block-size of 4 might be too small for complete concealment. However, only the statistician knew the exact block size.

 Unlikely (for overall survival)

 

Reason: Overall survival was seen as a hard outcome measure not affected by blinding.

Unlikely (for overall survival)

 

Reason: Overall survival was seen as a hard outcome measure not affected by blinding.

Unlikely (for overall survival)

 

Reason: Overall survival was seen as a hard outcome measure not affected by blinding.

Unlikely

 

Reason: All outcomes of interest were reported in the protocol and the published study report.

Unlikely

 

Reason: Two persons (2/34, 5.9%) withdrew from the study after randomization in the radiotherapy group.

Unlikely

 

Reason: Authors state that an ITT analysis was performed. There were no indications that participants deviated from the protocol. However, there is some missing data other than loss to follow-up and no reason was provided. Data was not imputed, and cases were thus excluded from analysis (e.g., 27/34 (RT) and 30/34 (TORS) datapoints were available for the primary outcome at 1 year); There is more missing data than withdrawal (figure 1 in the study report) and mortality (figure 3) account for.

Likely (for progression-free survival, complications, toxicity, swallowing function, quality of life)

 

Reason: Authors state that patients were not blinded.

Likely (for progression-free survival, complications, toxicity, swallowing function, quality of life)

 

Reason: Authors state that physicians were not blinded.

Likely (for progression-free survival, complications, toxicity)

Unclear (for quality of life)

 

Reason: It is unclear who was the assessor of the quality-of-life questionnaires, although it might presumably be the treating physician.

  1. Randomisation: generation of allocation sequences have to be unpredictable, for example computer generated random-numbers or drawing lots or envelopes. Examples of inadequate procedures are generation of allocation sequences by alternation, according to case record number, date of birth or date of admission.
  2. Allocation concealment: refers to the protection (blinding) of the randomisation process. Concealment of allocation sequences is adequate if patients and enrolling investigators cannot foresee assignment, for example central randomisation (performed at a site remote from trial location) or sequentially numbered, sealed, opaque envelopes. Inadequate procedures are all procedures based on inadequate randomisation procedures or open allocation schedules.
  3. Blinding: neither the patient nor the care provider (attending physician) knows which patient is getting the special treatment. Blinding is sometimes impossible, for example when comparing surgical with non-surgical treatments. The outcome assessor records the study results. Blinding of those assessing outcomes prevents that the knowledge of patient assignement influences the proces of outcome assessment (detection or information bias). If a study has hard (objective) outcome measures, like death, blinding of outcome assessment is not necessary. If a study has “soft” (subjective) outcome measures, like the assessment of an X-ray, blinding of outcome assessment is necessary.
  4. Results of all predefined outcome measures should be reported; if the protocol is available, then outcomes in the protocol and published report can be compared; if not, then outcomes listed in the methods section of an article can be compared with those whose results are reported.
  5. If the percentage of patients lost to follow-up is large, or differs between treatment groups, or the reasons for loss to follow-up differ between treatment groups, bias is likely. If the number of patients lost to follow-up, or the reasons why, are not reported, the risk of bias is unclear.
  6. Participants included in the analysis are exactly those who were randomized into the trial. If the numbers randomized into each intervention group are not clearly reported, the risk of bias is unclear; an ITT analysis implies that (a) participants are kept in the intervention groups to which they were randomized, regardless of the intervention they actually received, (b) outcome data are measured on all participants, and (c) all randomized participants are included in the analysis.

Evidence table for intervention studies (randomized controlled trials and non-randomized observational studies (cohort studies, case-control studies, case series))1

This table is also suitable for diagnostic studies (screening studies) that compare the effectiveness of two or more tests. This only applies if the test is included as part of a test-and-treat strategy - otherwise the evidence table for studies of diagnostic test accuracy should be used.

Study reference

Study character-istics

Patient characteristics 2

Intervention (I)

Comparison / control (C) 3

 

Follow-up

Outcome measures and effect size 4

Comments

Nichols 2019

Type of study:

RCT (multicentre, international)

 

Setting and country: Hospital, Canada and Australia

 

Funding and conflicts of interest: Canadian cancer society research institute grant, Ontario institute for carcer reseach clinicion-scientist grant, Wolfe surgical research professorship in the biology of head and neck cancers grant. One author received honoraria and educational grants from Eisai and Genzyme-Sanofi (declared as unrelated to the RCT). All other authors declare no CoI.

Inclusion criteria:

From the Protocol (Nichols 2013, BMJ): >18 years, providing informed consent, ECOG status 0-2, histologically confirmed SCC, primary site is the oropharynx, T1-2 with likely negative resection margins at surgery, N0-2 without extranodal extension on pre-randomization imaging, CBC/differential obtained within 4 weeks prior of randomization (with adequate bone marrow, hepatic, and renal function), patient was assessed at a head and neck multidisciplinary clinic and presented at a multidisciplinary tumor board prior to randomization.

 

Exclusion criteria:

From the Protocol (Nichols 2013, BMJ): Serious medical comorbidities, contraindications to radio therapy / chemotherapy / surgery, prior history of head and neck cancer within 5 years, prior head and neck radiation, metastatic disease, inability to attend full-course radiotherapy or follow-up visits, prior invasive malignant disease (unles 5 year disease-free) with the exception of non-melanoma skin cancer, unable or unwilling to complete QoL questionnaires, pregnant or lactating.

 

N total at baseline:

Intervention: 34

Control: 34

 

Important prognostic factors2:

Median age (IQR):

TORS: 58.2 (52.6-64.5)

C: 60 (53.2-65.2)

 

Sex (M/F):

TORS: 28M/6F

RT: 31M/3F

 

Smoking history, n (%):

TORS: 21 (62%)

RT: 28 (82%)

 

Over 21 drinks per week, n (%):

TORS: 6/22 (27%)

RT: 1/18 (6%)

 

Tumor location:

TORS: tonsil/ tonsilar foss (n=24), base of tongue (n=10)

RT: tonsil/ tonsilar foss (n=26), base of tongue (n=8)

 

cT-stage, n:

TORS: T1 (n=17), T2 (n=17)

RT: T1 (n=13), T2 (n=21)

 

cN-stage, n:

TORS: N0 (n=9), N1 (n=7), N2 (n=18)

RT: N0 (n=12), N1 (n=5), N2 (n=17)

 

Baseline ECOG status, n:

TORS: score 0 (n=30), score 1 (n=4)

RT: score 0 (n=30), score 1 (n=4)

 

HPV p16-positive, n (%):

TORS: 30 (88%)

RT: 30 (88%)

 

Groups comparable at baseline?

 

Describe intervention (treatment/procedure/test):

 

TORS + Neck dissection:

A surgical robot (Da Vinci) was used to surgically excise the primary oropharyngeal tumor with the spatula cautery (resection margin: 1cm). Neck dissection was performed selectively at the time of surgery or within 2 weeks of surgery (at the discretion of the surgeon). Surgeons had to have at least 10 TORS operations performed prior to enrolling patients to the trial.

 

Surgical specimen was sent for frozen section analysis. The resection proceeded until negative margins were obtained.

 

Adjuvant radiotherapy (intensity modulated radiotherapy) was given. Radiotherapy could be omitted when there were no extranodal extensions, positive margins, pT3-4, nodal disease, or lympovascular invasion.

 

RT doses and fractionations:

Gross tumor and nodes: N/A

Region of positive margins/ estranodal extension: 64 Gy / 30 fraction / 6 weeks

High risk nodal area: 60Gy / 30 fractions / 6 weeks

Low risk nodal area: 54Gy / 30 fractions / 6 weeks

 

Adjuvant chemotherapy (cisplatin, 100mg/m^2 was delivered every 3 weeks in a 3-week cycle) was given concurrent with radiotherapy when there were positive margins or extra-capsular extension. Doses and/or schedule for patients deemed unfit for cisplatin could be modified, or cetuximab or weekly carboplatin could be administered.

 

 

 

***

Out of 34 persons, 24 (71%) received radiotherapy, and 8 (24%) received chemotherapy (cisplatin: 5/8 (63%), carboplatin: 3/8 (38%), cetuximab: 0/8 (0%)). Median chemotherapy cycles: 6 (IQR:4.5-6)

***

Describe control (treatment/procedure/test):

 

Radiotherapy (intensity modulated):

 

Radiotherapy was given.

Gross tumor and nodes: 70Gy / 35 fractions / 7 weeks

Region of positive margins/ estranodal extension: N/A

High risk nodal area: 63Gy / 35 fractions / 7 weeks

Low risk nodal area: 56Gy / 35 fractions / 7 weeks

Accelerated or hyperfractionated regimens (i.e., same dose at 6 weeks) could have been used at the radiation oncologist’s discretion.

 

Concurrent chemotherapy was given when T1-2N1-2 and omitted when T1-2N0.

 

In the additional files the authors state that cisplatin 100mg/m^2 was delivered every 3 weeks in a 3-week cycle. Doses and/or schedule for patients deemed unfit for cisplatin could be modified, or cetuximab or weekly carboplatin could be administered.

 

Treatment response was evaluated 8 to 12 weeks after completion of radiotherapy by CT or PET-CT. For CT, patients with residual nodes >1cm were recommended for salvage surgery. For PET-CT, salvage surgery was recommended for FDG-avid nodes >1cm. Patients having a relapse or progressive disease following RT, surgical salvage was offered when feasible.

 

 

 

***

Out of 34 persons, 32 (94%) received radiotherapy (2 lost to follow-up). Twenty-three (68%) persons received chemotherapy (cisplatin: 19/23 (83%), carboplatin: 3/23 (13%), cetuximab: 1/23 (4%)) Median chemotherapy cycles: 3 (IQR: 2-6)

***

Length of follow-up:

Every 3 months in the first 2 years. Every 6 months in year 3-5. (Median follow-up was 27 months, IQR: 20-48)

 

Physical examination: all visits

Adverse events monitoring: all visits.

QoL measurement: every 6 months

Chest x-ray: every 6 months (except at T=year 1, where a CT was taken)

 

In the RT group: additional scan at 8-12 weeks after radiotherapy to assess treatment response / need for salvage surgery.

 

Loss-to-follow-up:

Intervention (TORS+ND): 0

Reasons (describe)

 

Control (RT): 2

N=2 (5.9%)

Reasons (describe): not provided.

 

 

Incomplete outcome data:

For primary endpoint at T0:

Intervention (TORS+ND): 3

N=3 (8.8%)

Reasons (describe): no reasons provided.

 

Control (RT): 2

N=2 (5.9%)

Reasons (describe)

 

For primary endpoint at T1:

Intervention (TORS+ND): 4

N=4 (11.8%)

Reasons (describe): No reasons described. However, from survival analysis: 2 persons died. O

 

Control (RT): 7

N=7 (20.6%)

Reasons (describe): No reasons described. However, from survival analysis: 1 person died and 3 were censored. From trial flow: 2 were lost to follow-up (unclear whether they were censored in the survival analyses or not)

 

 

 

Outcome measures and effect size (include 95%CI and p-value if available):

 

Overall survival:

5-year overall survival:

TORS: 2 at risk (27 censored)

RT: 2 at risk (28 censored)

RT/TORS: HR = 0.83 (95%CI: 0.21-8.35), log-rank p-value = 0.89

Unclear why patients were censored.

 

One patient in the TORS group died of bleeding.

 

 

Disease-free survival:

5-year progression-free survival:

Progression-free survival was defined as time from randomization to either death or recurrence of disease (whichever occurred first in time)

TORS: 2 at risk (27 censored)

RT: 2 at risk (28 censored)

RT/TORS: HR = 1.07 (95%CI: 0.28-4.01), log-rank p-value = 0.63

Unclear why patients were censored.

 

 

Swallowing:

Grade 1-2 dysphagia, n (%):

TORS: 21/34 (61.8%)

RT: 21/34 (61.8%)

RR (TORS/RT) = 1.00 (95%CI: 0.69-1.45)

 

Grade 3 dysphagia, n (%):

TORS: 9/34 (26.5%)

RT: 6/34 (17.6%)

RR (TORS/RT) = 1.50 (95%CI: 0.60-3.75)

 

All grade dysphagia, n (%):

TORS: 30/34 (88.2%)

RT: 27/34 (79.4%)

RR (TORS/RT) = 1.11 (95%CI: 0.90-1.37)

 

Use of percutaneous feeding tube at 1 year, n (%):

TORS: 0/34 (0%)

RT: 1/34 (3%)

 

 

Trismus:

Grade 1-2 trismus, n (%):

TORS: 8/34 (23.5%)

RT: 1/34 (2.9%)

RR (TORS/RT) = 8.00 (95%CI: 1.06-60.5)

 

All grades trismus, n (%):

TORS: 9/34 (23.5%)

RT: 1/34 (2.9%)

RR (TORS/RT) = 9.00 (95%CI: 1.21-67.21)

 

 

Taste:

All taste alteration, n (%):

Only grade 1-2 alterations were observed.

TORS: 17/34 (50%)

RT: 19/34 (55.9%)

RR (TORS/RT) = 0.89 (95%CI: 0.57-1.40)

 

 

Dryness of mouth:

Grade 1-2 dry mouth, n (%):

TORS: 18/34 (52.9%)

RT: 24/34 (70.6%)

RR (TORS/RT) = 0.75 (95%CI: 0.51-1.10)

 

All grades dry mouth, n (%):

TORS: 18/34 (52.9%)

RT: 25/34 (73.5%)

RR (TORS/RT) = 0.72 (95%CI: 0.49-1.05)

 

 

Mucositis:

Grade 1-2 oral mucositis, n (%):

TORS: 8/34 (23.5%)

RT: 11/34 (32.4%)

RR (TORS/RT) = 0.73 (95%CI: 0.33-1.58)

 

All grade oral mucositis, n (%):

TORS: 8/34 (23.5%)

RT: 15/34 (44.1%)

RR (TORS/RT) = 0.53 (95%CI: 0.26-1.09)

 

 

Quality of life:

MDADI:

MDADI total score, mean score (SD):

TORS: 80.1 (13)

RT: 86.9 (11.4)

Mean difference: 6.7 (95%CI: 0.2 to 13.2)

Statistically significant difference between groups: p=0.042

 

MDADI global sub-scale score, mean score (SD):

TORS: 79.3 (22.6)

RT: 89.6 (15.1)

Mean difference: 10.3 (95%CI: 0.2 to 20.4)

Statistically significant difference between groups: p=0.046

 

MDADI emotional sub-scale score, mean score (SD):

TORS: 81.3 (12.5)

RT: 88.8 (12)

Mean difference: 7.4 (95%CI: 0.9 to 14)

Statistically significant difference between groups: p=0.027

 

MDADI functional sub-scale score, mean score (SD):

TORS: 86.5 (12)

RT: 89.9 (11.5)

Mean difference: 3.4 (95%CI: -2.9 to 9.6)

No statistically significant difference between groups: p=0.28

 

MDADI physical sub-scale score, mean score (SD):

TORS: 75.3 (16.5)

RT: 83.1 (14.1)

Mean difference: 7.9 (95%CI: -0.3 to 16)

No statistically significant difference between groups: p=0.058

 

MDADI composite score, mean score (SD):

TORS: 80.2 (13.1)

RT: 86.7 (11.4)

Mean difference: 6.5 (95%CI: 0.0 to 13.1)

Statistically significant difference between groups: p=0.049

 

C30:

EORTC-C30 Global health status sub-scale score, mean score (SD):

TORS: 77.9 (19.5)

RT: 76.2 (20.9)

No statistically significant difference between groups: p= 0.76

 

EORTC-C30 Physical functioning sub-scale score, mean score (SD):

TORS: 9.4 (16.1)

RT: 5.9 (7.2)

No statistically significant difference between groups: p= 0.29

 

EORTC-C30 Role functioning sub-scale score, mean score (SD):

TORS: 18.3 (30.1)

RT: 11.1 (17.9)

No statistically significant difference between groups: p= 0.27

 

EORTC-C30 Emotional functioning sub-scale score, mean score (SD):

TORS: 14.9 (19.5)

RT: 12.0 (15.9)

No statistically significant difference between groups: p= 0.54

 

EORTC-C30 Cognitive functioning sub-scale score, mean score (SD):

TORS: 13.8 (18.9)

RT: 11.7 (15.9)

No statistically significant difference between groups: p=0.66

 

EORTC-C30 Social functioning status sub-scale score, mean score (SD):

TORS: 13.2 (20.1)

RT: 6.4 (13.4)

No statistically significant difference between groups: p= 0.14

 

EORTC-C30 Fatigue sub-scale score, mean score (SD):

TORS: 18.1 (20.5)

RT: 15.6 (13.5)

No statistically significant difference between groups: p= 0.59

 

EORTC-C30 Nausea/ vomiting sub-scale score, mean score (SD):

TORS: 5.0 (9.9)

RT: 4.3 (10.9)

No statistically significant difference between groups: p= 0.81

 

EORTC-C30 Pain sub-scale score, mean score (SD):

TORS: 21.8 (25.2)

RT: 8.0 (16.3)

Statistically significant difference between groups: p= 0.018

 

EORTC-C30 Dyspnea sub-scale score, mean score (SD):

TORS: 7.8 (14.3)

RT: 4.9 (12.1)

No statistically significant difference between groups: p= 0.42

 

EORTC-C30 Insomnia sub-scale score, mean score (SD):

TORS: 17.8 (27.3)

RT: 28.4 (28.8)

No statistically significant difference between groups: p= 0.16

 

EORTC-C30 Appetite loss sub-scale score, mean score (SD):

TORS: 13.3 (27.1)

RT: 16.0 (25.1)

No statistically significant difference between groups: p= 0.70

 

EORTC-C30 Constipation sub-scale score, mean score (SD):

TORS: 4.4 (14.5)

RT: 8.6 (14.9)

No statistically significant difference between groups: p= 0.29

 

EORTC-C30 Diarrhea sub-scale score, mean score (SD):

TORS: 5.7 (15.6)

RT: 2.5 (8.9)

No statistically significant difference between groups: p= 0.34

 

EORTC-C30 Financial difficulties sub-scale score, mean score (SD):

TORS: 14.9 (29.0)

RT: 11.1 (24.5)

No statistically significant difference between groups: p= 0.59

 

HN-35:

EORTC-HN35 Pain sub-scale score, mean score (SD):

TORS: 13.3 (14.9)

RT: 9.0 (12.4)

No statistically significant difference between groups: p= 0.23

 

EORTC-HN35 Swallowing sub-scale score, mean score (SD):

TORS: 12.7 (16.1)

RT: 7.4 (7.4)

No statistically significant difference between groups: p= 0.11

 

EORTC-HN35 Senses sub-scale score, mean score (SD):

TORS: 20.6 (21.3)

RT: 20.5 (22.8)

No statistically significant difference between groups: p > 0.99

 

EORTC-HN35 Speech sub-scale score, mean score (SD):

TORS: 7.7 (9.9)

RT: 5.8 (9.9)

No statistically significant difference between groups: p= 0.48

 

EORTC-HN35 Social eating sub-scale score, mean score (SD):

TORS: 11.8 (14.4)

RT: 7.1 (10.3)

No statistically significant difference between groups: p= 0.16

 

EORTC-HN35 Social contact sub-scale score, mean score (SD):

TORS: 4.6 (10.1)

RT: 1.5 (6.5)

No statistically significant difference between groups: p= 0.17

 

EORTC-HN35 Less sexuality sub-scale score, mean score (SD):

TORS: 22.0 (27.6)

RT: 17.3 (25.2)

No statistically significant difference between groups: p= 0.51

 

EORTC-HN35 Teeth sub-scale score, mean score (SD):

TORS: 12.2 (22.3)

RT: 1.2 (6.4)

Statistically significant difference between groups: p= 0.014

 

EORTC-HN35 Opening mouth sub-scale score, mean score (SD):

TORS: 11.1 (22.0)

RT: 6.4 (13.4)

No statistically significant difference between groups: p= 0.33

 

EORTC-HN35 Dry mouth sub-scale score, mean score (SD):

TORS: 44.4 (30.7)

RT: 53.1 (31.0)

No statistically significant difference between groups: p= 0.30

 

EORTC-HN35 Sticky saliva sub-scale score, mean score (SD):

TORS: 31.1 (34.9)

RT: 32.1 (28.5)

No statistically significant difference between groups: p= 0.91

 

EORTC-HN35 Coughing sub-scale score, mean score (SD):

TORS: 22.2 (23.7)

RT: 24.7 (25.5)

No statistically significant difference between groups: p= 0.71

 

EORTC-HN35 Felt ill sub-scale score, mean score (SD):

TORS: 6.7 (13.6)

RT: 3.7 (10.7)

No statistically significant difference between groups: p= 0.36

 

EORTC-HN35 Pain killers sub-scale score, mean score (SD):

TORS: 44.8 (50.6)

RT: 14.8 (36.2)

Statistically significant difference between groups: p= 0.013

 

EORTC-HN35 Nutritional supplements sub-scale score, mean score (SD):

TORS: 24.1 (43.5)

RT: 29.6 (46.5)

No statistically significant difference between groups: p= 0.65

 

EORTC-HN35 feeding tube sub-scale score, mean score (SD):

TORS: 0.0 (0)

RT: 3.7 (19.2)

Statistically significant difference between groups: p= 0.33

 

EORTC-HN35 weight loss sub-scale score, mean score (SD):

TORS: 20.7 (41.2)

RT: 3.7 (19.2)

No statistically significant difference between groups: p= 0.053

 

EORTC-HN35 weight gain sub-scale score, mean score (SD):

TORS: 37.9 (49.4)

RT: 40.7 (50.1)

No statistically significant difference between groups: p= 0.83

 

 

NDII:

NDII total score, mean score (SD):

TORS: 81.5 (28.7)

RT: 92.3 (10.0)

No statistically significant difference between groups: p= 0.072

 

 

PNQ:

PNQ Numbness sub-scale score, mean score (SD):

TORS: 0.5 (0.8)

RT: 0.3 (0.6)

No statistically significant difference between groups: p= 0.57

 

PNQ Weakness sub-scale score, mean score (SD):

TORS: 0.5 (1.0)

RT: 0.2 (0.5)

No statistically significant difference between groups: p= 0.14

 

 

VSI-10:

VHI-10 total score, mean score (SD):

TORS: 4.5 (4.3)

RT: 4.4 (4.6)

No statistically significant difference between groups: p= 0.89

 

 

FOIS:

FOIS, level 7 reached at 1 year, n(%):

TORS: 26/31 (84%)

RT: 27/27 (100%)

No statistically significant difference between groups: p= 0.055

The authors describe that there was an ITT analysis performed. Trial flow (figure 1) shows that n=68 patients were analysed. However, some tables and figures show other numbers analysed (e.g., table 2 where clinically meaningful decline was analysed in 26 or 27 patients per group). Authors chose not to impute data.

 

 

Notes:

  1. Prognostic balance between treatment groups is usually guaranteed in randomized studies, but non-randomized (observational) studies require matching of patients between treatment groups (case-control studies) or multivariate adjustment for prognostic factors (confounders) (cohort studies); the evidence table should contain sufficient details on these procedures.
  2. Provide data per treatment group on the most important prognostic factors ((potential) confounders).
  3. For case-control studies, provide sufficient detail on the procedure used to match cases and controls.
  4. For cohort studies, provide sufficient detail on the (multivariate) analyses used to adjust for (potential) confounders.

 

Table of excluded studies

Author and year

Reason for exclusion

Beitler 2016

Delphi consensus study

Channir 2018

Article in Danish

De Almeida 2014

No RCT included

Dhanireddy 2019

Non-randomized design

Dias 2017

Narrative review

Fabian 2019

Article in German

Genden 2011

Non-randomized design

Howard 2014

No RCT included

Ling 2016

Non-randomized design

Monnier 2015

Opinion statement

More 2013

Non-randomized design

O'Hara 2016

Non-randomized design

Rubek 2017

Non-randomized design

Rudmik 2015

Cost-effectiveness study

Sharma 2016

Non-randomized design

Smith 2015

Non-randomized design

Thuy 2018

Non-randomized design

Viros Porcuna 2019

Non-randomized design

Wang 2015

No RCT included

Yeah 2015

No RCT included

Autorisatiedatum en geldigheid

Laatst beoordeeld  :

Laatst geautoriseerd  :

Geplande herbeoordeling  : 01-01-2028

Initiatief en autorisatie

Initiatief:
  • Nederlandse Vereniging voor Keel-Neus-Oorheelkunde en Heelkunde van het Hoofd-Halsgebied
Geautoriseerd door:
  • Nederlandse Internisten Vereniging
  • Nederlandse Vereniging voor Keel-Neus-Oorheelkunde en Heelkunde van het Hoofd-Halsgebied
  • Nederlandse Vereniging voor Nucleaire geneeskunde
  • Nederlandse Vereniging voor Pathologie
  • Nederlandse Vereniging voor Plastische Chirurgie
  • Nederlandse Vereniging voor Radiologie
  • Nederlandse Vereniging voor Radiotherapie en Oncologie
  • Nederlandse Vereniging voor Mond- Kaak- en Aangezichtschirurgie

Algemene gegevens

De ontwikkeling/herziening van deze richtlijnmodule werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten en werd gefinancierd uit de Stichting Kwaliteitsgelden Medisch Specialisten (SKMS). De financier heeft geen enkele invloed gehad op de inhoud van de richtlijnmodule.

Samenstelling werkgroep

Voor het ontwikkelen van de richtlijnmodule is in 2019 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen die betrokken zijn bij de zorg voor patiënten met hoofd-halstumoren.

 

Werkgroep

  • Prof. Dr. R. de Bree, KNO-arts/hoofd-halschirurg, UMC Utrecht, Utrecht, NVKNO (voorzitter)
  • Dr. M.B. Karakullukcu, KNO-arts/hoofd-halschirurg, NKI, Amsterdam, NVKNO
  • Dr. H.P. Verschuur, KNO-arts/hoofd-halschirurg, Haaglanden MC, Den Haag, NVKNO
  • Dr. M. Walenkamp, AIOS-KNO, LUMC, Leiden, NVKNO
  • Dr. A. Sewnaik, KNO-arts/hoofd-halschirurg, Erasmus MC, Rotterdam, NVKNO
  • Drs. L.H.E. Karssemakers, MKA-chirurg-oncoloog/hoofd-hals chirurg, NKI, Amsterdam, NVMKA
  • Dr. M.J.H. Witjes, MKA-chirurg-oncoloog, UMC Groningen, Groningen, NVMKA
  • Drs. L.A.A. Vaassen, MKA-chirurg-oncoloog, Maastricht UMC+, Maastricht, NVMKA
  • Drs. W.L.J. Weijs, MKA-chirurg-oncoloog, Radboud UMC, Nijmegen, NVKMA
  • Drs. E.M. Zwijnenburg, Radiotherapeut-oncoloog, Radboud UMC, Nijmegen, NVRO
  • Dr. A. Al-Mamgani, Radiotherapeut-oncoloog, NKI, Amsterdam, NVRO
  • Prof. Dr. C.H.J. Terhaard, Radiotherapeut-oncoloog, UMC Utrecht, Utrecht, NVRO
  • Drs. J.G.M. Van den Hoek, Radiotherapeut-oncoloog, UMC Groningen, Groningen, NVRO
  • Dr. E. Van Meerten, Internist-oncoloog, Erasmus MC Kanker Instituut, Rotterdam, NIV
  • Dr. M. Slingerland, Internist-oncoloog, LUMC, Leiden, NIV
  • Drs. M.A. Huijing, Plastisch Chirurg, UMC Groningen, Groningen, NVPC
  • Prof. Dr. S.M. Willems, Klinisch patholoog, UMC Groningen, Groningen, NVVP
  • Prof. Dr. E. Bloemena, Klinisch patholoog, Amsterdam UMC, locatie Vumc, Amsterdam, NVVP
  • R.A. Burdorf, Voorzitter dagelijks bestuur patiëntenvereniging, Patiëntenvereniging HOOFD-HALS, PvHH
  • P.S. Verdouw, Hoofd infocentrum patiëntenvereniging, Patiëntenvereniging HOOFD-HALS, PvHH
  • A.A.M. Goossens, Verpleegkundig specialist oncologie, Haaglanden MC, Den Haag, V&VN
  • Dr. P. de Graaf, Radioloog, Amsterdam UMC, Amsterdam, NVvR
  • Dr. W.V. Vogel, Nucleair geneeskundige/radiotherapeut-oncoloog, NKI, Amsterdam, NVNG
  • Drs. G.J.C. Zwezerijnen, Nucleair geneeskundige, Amsterdam UMC, Amsterdam, NVNG

 

Klankbordgroep

  • Dr. C.M. Speksnijder, Fysiotherapeut, UMC Utrecht, Utrecht, KNGF
  • Ir. A. Kok, Diëtist, UMC Utrecht, Utrecht, NVD
  • Dr. M.M. Hakkesteegt, Logopedist, Erasmus MC, Rotterdam, NVLF
  • Drs. D.J.M. Buurman, Tandarts-MFP, Maastricht UMC+, Maastricht, KNMT
  • W. Van der Groot-Roggen, Mondhygiënist, UMC Groningen, Groningen, NVvM
  • Drs. D.J.S. Dona, Bedrijfsarts/Klinisch arbeidsgeneeskundige oncologie, Radboud UMC, Nijmegen, NVKA
  • Dr. M. Sloots, Ergotherapeut, UMC Utrecht, Utrecht
  • J. Poelstra, Medisch maatschappelijk werkster, op persoonlijke titel

 

Met ondersteuning van

  • Dr. J. Boschman, Senior adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Dr. C. Gaasterland, Adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Dr. A. Van der Hout, Adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Dr. L. Oostendorp, Adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Drs. M. Oerbekke, Adviseur, Kennisinstituut van de Federatie Medisch Specialisten
  • Drs. A. Hoeven, Junior adviseur, Kennisinstituut van de Federatie Medisch Specialisten

Belangenverklaringen

De Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoeksfinanciering) of indirecte belangen (persoonlijke relaties, reputatiemanagement) hebben gehad. Gedurende de ontwikkeling of herziening van een module worden wijzigingen in belangen aan de voorzitter doorgegeven. De belangenverklaring wordt opnieuw bevestigd tijdens de commentaarfase.

 

Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.

 

Werkgroeplid

Functie

Nevenfuncties

Gemelde belangen

Ondernomen actie

Bree, de

KNO-arts/hoofd-halschirurg, UMC Utrecht

* Lid Algemeen Bestuur Patiëntenvereniging Hoofd-Hals (onbetaald)

* Voorzitter Research Stuurgroep NWHHT

* Lid Richtlijnen commissie NWHHT

* Lid dagelijks bestuur NWHHT

* Lid Clinical Audit Board van de Dutch Head and Neck Audit (DHNA)

* Lid wetenschappelijk adviescommissie DORP

* Voorzitter Adviescommissie onderzoek hoofd-halskanker (IKNL/PALGA/DHNA/NWHHT)

Geen

Geen

Slingerland

Internist-oncoloog, LUMC

* 2018-present: Treasurer of the "Dutch Association of Medical Oncology"(NVMO - vacancy fees)

* 2018-present: Member of the "Dutch Working Group for Head-Neck Tumors" (NWHHT-Systemic therapy)

* 2016-present: Member of the 'Dutch Working Group for Head-Neck Tumors" (NWHHT - study group steering group (coordinating))

* 2016-present: Member of the "Dutch Working Group for Head-Neck Tumors" (NWHHT - Elderly Platform)

* 2012-present: Member "Working Group for Head-Neck Tumors" (WHHT) "University Cancer Centre"(UCK) Leiden - Den Haag

* 2019: Member CAB DHNA

Deelname Nationaal expert forum hoofd-halskanker MSD dd 2-5-2018

 

* Deelname Checkmate studie, sponsor Bristol-Myers Squibb (BMS): An open label, randomized phase 3 clinical trial of nivolumab versus therapy of investigator's choice in recurrent or metastatic platinum-refractory squamous cell carcinoma of the head and neck (SCCHN)

* Deelname Commence studie, sponsor Radboud University, in collaboration with Merck Serono International SA (among several Dutch medical centers): A phase lB-II study of the combination of cetuximab and methotrexate in recurrent of metastatic squamous cell carcinoma of the head and neck. A study of the Dutch Head and Neck Society, MOHN01/COMMENCE study.

* Deelname HESPECTA studie: Phase I study: to determine the biological activity of two HPV16E6 specific peptides coupled to Amplivant®, a Toll-like receptor ligand in non-metastatic patients treated for HPV16-positive head and neck cancer.

* Deelname PINCH studie (nog niet open): PD-L1 ImagiNg to predict durvalumab treatment response in HNSCC (PINCH) trial; patiënten met biopt bewezen locally recurrent of gemetastaseerd HNSCC

* Deelname ISA 101b-HN-01-17 studie (nog niet open): A randomized, Double-blind, Placebo-Controlled, Phase 2 Study of Cemiplimab versus the combination of Cemiplimab with ISA101b in the Treatment of Subjects.

In de werkgroep participeren 2 internist-oncologen, zodat één van beide de voortrekker is van modules over systemische therapie. Actie: werkgroeplid is uitgesloten van besluitvorming bij modules die betrekking hebben op de onderwerpen van de gemelde onderzoeken: nivolumab, cetuximab + methotrexaat, Amplivant, durvalumab, cemiplimab.

Meerten, van

Internist-oncoloog, Erasmus MC Kanker Instituut

Geen

Op dit moment Principal Investigator voor NL van gerandomiseerde fase III trial naar toegevoegde waarde van pembrolizumab aan chemoradiotherapie bij patiënten met gevorderd hoofdhalskanker. Sponsor: GlaxoSmithKline Research & Development Ltd. Studie is nog lopend, resultaten zullen pas bekend zijn na verschijning van de richtlijn.

 

In toekomst mogelijk participatie aan door industrie gesponsorde studies op gebied van behandeling van hoofdhalskanker

In de werkgroep participeren 2 internist-oncologen, zodat één van beide de voortrekker is van modules over systemische therapie. Actie: werkgroeplid is uitgesloten van besluitvorming bij modules die betrekking hebben op het onderwerp van het gemelde onderzoeken: de toegevoegde waarde van pembrolizumab bij patiënten met gevorderd hoofdhalskanker.

Huijing

Plastisch chirurg, UMC Groningen

Geen

Geen

Geen

Sewnaik

KNO-arts/hoofd Hals chirurg, Erasmus MC

Sectorhoofd Hoofd-Hals chirurgie

Geen

Geen

Vaassen

MKA-chirurg-oncoloog, Maastricht UMC+ / CBT Zuid-Limburg

*Lid Bestuur NVMKA

*Waarnemend hoofd MKA-chirurgie MUMC

Geen

Geen

Witjes

MKA-chirurg-oncoloog, UMC Groningen

Geen

PI van KWF grant: RUG 2015 -8084: Image guided surgery for margin assessment of head & neck Cancer using cetuximab-IRDye800 cONjugate (ICON)

 

geen financieel belang

Geen. Financiering door KWF werd niet als een belang ingeschat.

Bloemena

Klinisch patholoog, Amsterdam UMC (locatie Vumc) / Radboud UMC / Academisch Centrum voor Tandheelkunde Amsterdam (ACTA)

* Lid bestuur Nederlandse Vereniging voor Pathologie (NVVP) – vacatiegeld (tot 1-12-20)

* Voorzitter Commissie Bij- en Nascholing (NVVP)

* Voorzitter (tot 1-12-20) Wetenschappelijke Raad PALGA - onbezoldigd

Geen

Geen

Willems

Klinisch patholoog, UMC Groningen

Vice-vz PALGA, AB NWHHT, CAB DHNA, mede-vz en oprichter expertisegroep HH pathologie NL,

Hoofdhalspathologie UMC Groningen

PDL1 trainer NL voor MSD

Onderzoeksfinanciering van Pfizer, Roche, MSD, BMS, Lilly, Novartis, Bayer, Amge, AstraZeneca

Geen

Karakullukcu

KNO-arts/hoofd-hals chirurg, NKI/AVL

Geen

Geen

Geen

Verschuur

KNO-arts/Hoofd-hals chirurg, Haaglanden MC

* Opleider KNO-artsen
* Dagvoorzitter

Geen

Geen

Walenkamp

AIOS KNO, LUMC

Geen

Geen

Geen

Al-Mamgani

Radiotherapeut-oncoloog, NKI/AVL

Geen

Geen

Geen

Terhaard

Radiotherapeut-oncoloog, UMC Utrecht

Niet van toepassing

Geen

Geen

Hoek, van den

Radiotherapeut-oncoloog UMCG

Niet van toepassing

Geen

Geen

Zwijnenburg

Radiotherapeut, Hoofd-hals Radboud UMC

Geen

Geen

Geen

Burdorf

Patiëntvertegenwoordiger

Geen

Geen

Geen

Verdouw

Hoofd Infocentrum patiëntenvereniging HOOFD HALS

Geen

Werkzaam bij de patiëntenvereniging. De achterban heeft baat bij een herziening van de richtlijn

Geen

Karssemakers

Hoofd-hals chirurg NKI/AVL

 

MKA-chirurg-oncoloog Amsterdam UMC (locatie AMC) / vakgroep kaakchirurgie Amsterdam West

Niet van toepassing

Geen

Geen

Goossens

Verpleegkundig specialist, Haaglanden Medisch Centrum (HMC)

* Bestuurslid (penningmeester) PWHHT (onbetaald)

* Lid Commissie voorlichting PVHH (onbetaald)

Geen

Geen

Zwezerijnen

Nucleair geneeskundige, Amsterdam UMC (locatie Vumc)

 

PhD kandidaat, Amsterdam UMC (locatie Vumc)

Lid als nucleair geneeskundige in HOVON imaging werkgroep (bespreken van richtlijnen en opzetten/uitvoeren van wetenschappelijke studies met betrekking tot beeldvorming in de hematologie); onbetaald

Geen

Geen

Vogel

Nucleair geneeskundige/radiotherapeut-oncoloog, AVL

Geen

In de afgelopen jaren incidenteel advies of onderwijs, betaald door Bayer, maar niet gerelateerd aan hoofd-hals

 

KWF-grant speekselklier toxiteit na behandeling. Geen belang bij de richtlijn

Geen

Graaf, de

Radioloog, Amsterdam UMC (locatie Vumc)

Bestuurslid sectie Hoofd-Hals radiologie (onbetaald)

Geen

Geen

Weijs

MKA-chirurg-oncoloog, Radboudumc

MKA-chirurg, Weijsheidstand B.V. Werkzaam als algemeen praktiserend MKA-chirurg, betaald (0,1 fte)

Geen

Geen

Inbreng patiëntenperspectief

Er werd aandacht besteed aan het patiëntenperspectief door het uitnodigen van de patiëntenvereniging HOOFD-HALS (PVHH) voor de Invitational conference en met afgevaardigden van de PVHH in de werkgroep. Het verslag hiervan (zie bijlagen) is besproken in de werkgroep. De verkregen input is meegenomen bij het opstellen van de uitgangsvragen, de keuze voor de uitkomstmaten en bij het opstellen van de overwegingen. De conceptrichtlijn is tevens voor commentaar voorgelegd aan de patiëntenvereniging HOOFD-HALS en de eventueel aangeleverde commentaren zijn bekeken en verwerkt.

Methode ontwikkeling

Evidence based

Werkwijze

AGREE

Deze richtlijnmodule is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010).

 

Knelpuntenanalyse en uitgangsvragen

Tijdens de voorbereidende fase inventariseerden de werkgroep de knelpunten in de zorg voor patiënten met hoofd-halstumoren. De werkgroep beoordeelde de aanbeveling(en) uit de eerdere richtlijnmodule (NVKNO, 2014) op noodzaak tot revisie. Tevens zijn er knelpunten aangedragen door de patiëntenvereniging en genodigde partijen tijdens de invitational conference (zie de bijlagen voor het verslag van de invitational conference). Op basis van de uitkomsten van de knelpuntenanalyse zijn door de werkgroep concept-uitgangsvragen opgesteld en definitief vastgesteld.

 

Uitkomstmaten

Na het opstellen van de zoekvraag behorende bij de uitgangsvraag inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. Hierbij werd een maximum van acht uitkomstmaten gehanteerd. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.

 

Methode literatuursamenvatting

Een uitgebreide beschrijving van de strategie voor zoeken en selecteren van literatuur en de beoordeling van de risk-of-bias van de individuele studies is te vinden onder ‘Zoeken en selecteren’ onder Onderbouwing. De beoordeling van de kracht van het wetenschappelijke bewijs wordt hieronder toegelicht.

 

Beoordelen van de kracht van het wetenschappelijke bewijs

De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/). De basisprincipes van de GRADE-methodiek zijn: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van de bewijskracht per uitkomstmaat op basis van de acht GRADE-domeinen (domeinen voor downgraden: risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias; domeinen voor upgraden: dosis-effect relatie, groot effect, en residuele plausibele confounding).

 

GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie, in het bijzonder de mate van zekerheid dat de literatuurconclusie de aanbeveling adequaat ondersteunt (Schünemann, 2013; Hultcrantz, 2017).

 

GRADE

Definitie

Hoog

  • er is hoge zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • het is zeer onwaarschijnlijk dat de literatuurconclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Redelijk

  • er is redelijke zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • het is mogelijk dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Laag

  • er is lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • er is een reële kans dat de conclusie klinisch relevant verandert wanneer er resultaten van nieuw grootschalig onderzoek aan de literatuuranalyse worden toegevoegd.

Zeer laag

  • er is zeer lage zekerheid dat het ware effect van behandeling dicht bij het geschatte effect van behandeling ligt;
  • de literatuurconclusie is zeer onzeker.

 

Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz, 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz, 2017).

 

Overwegingen (van bewijs naar aanbeveling)

Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals aanvullende argumenten uit bijvoorbeeld de biomechanica of fysiologie, waarden en voorkeuren van patiënten, kosten (middelenbeslag), aanvaardbaarheid, haalbaarheid en implementatie. Deze aspecten zijn systematisch vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’ en kunnen (mede) gebaseerd zijn op expert opinion. Hierbij is gebruik gemaakt van een gestructureerd format gebaseerd op het evidence-to-decision framework van de internationale GRADE Working Group (Alonso-Coello, 2016a; Alonso-Coello, 2016b). Dit evidence-to-decision framework is een integraal onderdeel van de GRADE-methodiek.

 

Formuleren van aanbevelingen

De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk (Agoritsas, 2017; Neumann, 2016). De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen. De werkgroep heeft bij elke aanbeveling opgenomen hoe zij tot de richting en sterkte van de aanbeveling zijn gekomen.

 

In de GRADE-methodiek wordt onderscheid gemaakt tussen sterke en zwakke (of conditionele) aanbevelingen. De sterkte van een aanbeveling verwijst naar de mate van zekerheid dat de voordelen van de interventie opwegen tegen de nadelen (of vice versa), gezien over het hele spectrum van patiënten waarvoor de aanbeveling is bedoeld. De sterkte van een aanbeveling heeft duidelijke implicaties voor patiënten, behandelaars en beleidsmakers (zie onderstaande tabel). Een aanbeveling is geen dictaat, zelfs een sterke aanbeveling gebaseerd op bewijs van hoge kwaliteit (GRADE-gradering HOOG) zal niet altijd van toepassing zijn, onder alle mogelijke omstandigheden en voor elke individuele patiënt.

 

Implicaties van sterke en zwakke aanbevelingen voor verschillende richtlijngebruikers

 

Sterke aanbeveling

Zwakke (conditionele) aanbeveling

Voor patiënten

De meeste patiënten zouden de aanbevolen interventie of aanpak kiezen en slechts een klein aantal niet.

Een aanzienlijk deel van de patiënten zouden de aanbevolen interventie of aanpak kiezen, maar veel patiënten ook niet.

Voor behandelaars

De meeste patiënten zouden de aanbevolen interventie of aanpak moeten ontvangen.

Er zijn meerdere geschikte interventies of aanpakken. De patiënt moet worden ondersteund bij de keuze voor de interventie of aanpak die het beste aansluit bij zijn of haar waarden en voorkeuren.

Voor beleidsmakers

De aanbevolen interventie of aanpak kan worden gezien als standaardbeleid.

Beleidsbepaling vereist uitvoerige discussie met betrokkenheid van veel stakeholders. Er is een grotere kans op lokale beleidsverschillen.

 

Organisatie van zorg

In de knelpuntenanalyse en bij de ontwikkeling van de richtlijnmodule is expliciet aandacht geweest voor de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, mankracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van deze specifieke uitgangsvraag zijn genoemd bij de overwegingen. Meer algemene, overkoepelende, of bijkomende aspecten van de organisatie van zorg worden behandeld in de module Organisatie van zorg.

 

Commentaar- en autorisatiefase

De conceptrichtlijnmodule werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijnmodule aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijnmodule werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.

 

Literatuur

Agoritsas T, Merglen A, Heen AF, Kristiansen A, Neumann I, Brito JP, Brignardello-Petersen R, Alexander PE, Rind DM, Vandvik PO, Guyatt GH. UpToDate adherence to GRADE criteria for strong recommendations: an analytical survey. BMJ Open. 2017 Nov 16;7(11):e018593. doi: 10.1136/bmjopen-2017-018593. PubMed PMID: 29150475; PubMed Central PMCID: PMC5701989.

Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ. 2016 Jun 28;353:i2016. doi: 10.1136/bmj.i2016. PubMed PMID: 27353417.

Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ. 2016 Jun 30;353:i2089. doi: 10.1136/bmj.i2089. PubMed PMID: 27365494.

Brouwers MC, Kho ME, Browman GP, Burgers JS, Cluzeau F, Feder G, Fervers B, Graham ID, Grimshaw J, Hanna SE, Littlejohns P, Makarski J, Zitzelsberger L; AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010 Dec 14;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348; PubMed Central PMCID: PMC3001530.

Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017 Jul;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006. Epub 2017 May 18. PubMed PMID: 28529184; PubMed Central PMCID: PMC6542664.

Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwalitieit. https://richtlijnendatabase.nl/over_deze_site/richtlijnontwikkeling.html.

Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016 Apr;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017. Epub 2016 Jan 6. Review. PubMed PMID: 26772609.

Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.

Schünemann HJ, Oxman AD, Brozek J, Glasziou P, Jaeschke R, Vist GE, Williams JW Jr, Kunz R, Craig J, Montori VM, Bossuyt P, Guyatt GH; GRADE Working Group. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ. 2008 May 17;336(7653):1106-10. doi: 10.1136/bmj.39500.677199.AE. Erratum in: BMJ. 2008 May 24;336(7654). doi: 10.1136/bmj.a139.

Schünemann, A Holger J (corrected to Schünemann, Holger J). PubMed PMID: 18483053; PubMed Central PMCID: PMC2386626.

Wessels M, Hielkema L, van der Weijden T. How to identify existing literature on patients' knowledge, views, and values: the development of a validated search filter. J Med Libr Assoc. 2016 Oct;104(4):320-324. PubMed PMID: 27822157; PubMed Central PMCID: PMC5079497.

Zoekverantwoording

Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.

Volgende:
Follow-up/Nazorg