Bij wetenschappelijke artikelen is het van belang om de cijfers goed over te brengen


Hendel
Slechte wetenschappers
De studie van het New England Journal of Medicine naar respiratoire vaccins is een uitgebreide studie en verdient daarom zorgvuldige communicatie. Een positief resultaat, uitgedrukt met de bijbehorende onzekerheidsmarge, is sterker dan de retoriek van degenen die beweren dat vaccins onfeilbaar zijn, en steviger dan de absolute overtuigingen van degenen die ze ronduit afwijzen.
Over hetzelfde onderwerp:
Het onlangs gepubliceerde artikel in het New England Journal of Medicine over respiratoire vaccins is een breed en datarijk werk dat bijdraagt aan een actueel beeld van de werkzaamheid en veiligheid van vaccins tegen COVID-19, influenza en het respiratoir syncytieel virus (RSV). Juist daarom verdient het echter zorgvuldige communicatie.
Hoewel de auteurs zelf duidelijke beperkingen aanhalen – slechts 12 procent van de opgenomen studies waren gecontroleerde studies, meer dan de helft had ten minste een matig risico op bias en de GRADE-methode werd niet toegepast om de algehele kwaliteit van het bewijs te beoordelen – zijn de werkzaamheidsresultaten robuust. Vernieuwde mRNA-vaccins verminderen het risico op ziekenhuisopname door COVID-19 met ongeveer de helft bij volwassenen en met 56 procent bij ouderen; bij immuungecompromitteerde personen daalt de bescherming tot 37 procent. Griepvaccins verminderen het aantal ziekenhuisopnames met 60-70 procent bij kinderen en met 40-50 procent bij volwassenen, en nieuwe vaccins of antilichamen tegen RSV verminderen het aantal ziekenhuisopnames bij pasgeborenen met maximaal 80 procent, hoewel de gegevens momenteel slechts één virusseizoen bestrijken.
Het meest delicate punt is de interpretatie van veiligheidsresultaten, bijvoorbeeld bij zwangerschap. In de commentaren na de publicatie werd de term "geen verband" vaak geïnterpreteerd als "verband uitgesloten". In statistisch jargon is dit echter onjuist. De term "geen verband" betekent niet dat het risico is uitgesloten, maar eerder dat het met de genomen metingen niet mogelijk is om betrouwbare beslissingen te nemen over de omvang van het beoordeelde effect, met het gekozen niveau van statistische significantie. Met andere woorden, de beschikbare gegevens stellen ons niet in staat om te stellen of er al dan niet een effect bestaat, noch om de omvang ervan nauwkeurig te definiëren. Het is een technische formule die aangeeft dat het effect, met het beschikbare bewijs en het gewenste betrouwbaarheidsniveau, niet met zekerheid kan worden vastgesteld. Om dit punt volledig te begrijpen, is het noodzakelijk om te verduidelijken wat de p-waarde en het zogenaamde "betrouwbaarheidsinterval" vertegenwoordigen. Deze laatste term, hoe traditioneel ook, kan misleidend zijn, omdat deze lijkt te verwijzen naar een marge van persoonlijk vertrouwen. In werkelijkheid, in het geval waarin we hier geïnteresseerd zijn – het evalueren van de veiligheid van een behandeling – toont dit interval de set van relatieve risicowaarden die compatibel zijn met de verzamelde gegevens. Daarom is het tegenwoordig correcter om te spreken van een compatibiliteitsinterval: het meet niet het vertrouwen van de onderzoeker, maar de consistentie tussen risicohypothesen en observaties.
Wanneer risico, zoals in de klinische praktijk, wordt uitgedrukt door een ratio – zoals een relatief risico (RR), odds ratio (OR) of hazard ratio (HR) – volgt de interpretatie van de betekenis van het compatibiliteitsinterval een precieze regel. Als het allemaal onder 1 ligt, zijn de gegevens uitsluitend compatibel met de hypothese van een verminderd risico; als het allemaal boven 1 ligt, is er sprake van een toename; als het 1 overschrijdt, betekent dit dat de gegevens compatibel zijn met zowel de afwezigheid van een verschil tussen behandelde en niet-behandelde personen, als met de mogelijkheid van een reële variatie in risico (positief of negatief), die echter niet wordt aangetoond met het gekozen betrouwbaarheidsniveau. De p-waarde meet op zijn beurt hoe waarschijnlijk het zou zijn om effecten te verkrijgen die gelijk zijn aan of extremer zijn dan die welke door puur toeval zijn waargenomen als er in werkelijkheid geen verschil zou zijn tussen de behandelde en onbehandelde groepen. Als de p-waarde lager is dan de conventionele drempelwaarde van 0,05, zijn de gegevens niet erg compatibel met de hypothese van een relatie zonder effect; Als het groter is, betekent dit dat we met dat betrouwbaarheidsniveau de mogelijkheid dat het verschil aan toeval te wijten is, niet kunnen uitsluiten. Maar dit wil niet zeggen dat het effect niet bestaat: het geeft alleen aan dat het bewijs ons voorlopig niet toestaat de omvang of richting ervan nauwkeurig te schatten.
Laten we deze overwegingen toepassen op het werk van de NEJM, bijvoorbeeld in het geval van maternale vaccinatie tegen RSV met het RSVpreF-vaccin. Voor vroeggeboorte rapporteert het artikel drie belangrijke schattingen: een relatief risico van 1,01 met een bereik van 0,89 tot 1,15; een andere van 1,20 met een bereik van 0,98-1,46; en een odds ratio van 1,03 met een bereik van 0,55-1,93. Alle waarden overschrijden de waarde van 1, en daarom zijn de p-waarden groter dan 0,05. Met de gehanteerde betrouwbaarheidsdrempel laten de gegevens ons niet toe om het bestaan van een verhoogd risico te bevestigen, maar ook niet om het volledig uit te sluiten. In het geval van 1,20 (0,98-1,46) zijn de resultaten bijvoorbeeld compatibel met zowel geen verschil als een toename van het risico tot 46%. ‘Geen verband’ of zelfs ‘niet-significante p’ betekent dus niet dat het risico nul is, maar dat de beschikbare gegevens, met de gehanteerde statistische precisie, niet toelaten om betrouwbare beslissingen te nemen over de consistentie van het onderzochte effect.
Dezelfde redenering geldt voor mRNA-vaccins tijdens de zwangerschap. Voor spontane abortus bijvoorbeeld liggen de gecorrigeerde odds ratio's dicht bij 1, met brede marges: één studie rapporteert 0,97 (0,57-1,66), een andere 0,59 (0,29-1,19). Ook hier overschrijden de marges de 1, wat betekent dat de gegevens compatibel zijn met ofwel geen verschil, een kleine vermindering of een kleine toename van het risico. Voor vroeggeboorte blijven sommige schattingen onder de 1, met marges die geen 1 bevatten (bijvoorbeeld 0,7-0,8), wat wijst op een mogelijke risicovermindering; andere bevatten echter wel 1 en laten ons daarom niet concluderen of er al dan niet een effect is. Dezelfde logica geldt voor de gelijktijdige toediening van vaccins. De meeste studies tonen een adequate immuunrespons aan wanneer COVID-19-, influenza- en RSV-vaccins samen worden toegediend; in sommige gevallen tonen de analyses echter niet duidelijk aan dat de respons exact dezelfde is als die verkregen door ze afzonderlijk toe te dienen. Ook hier betekent een p-waarde boven 0,05 niet dat de gecombineerde immuunrespons inferieur is, maar alleen dat de gegevens, met de gekozen betrouwbaarheidsdrempel, onvoldoende zijn om volledige equivalentie te kunnen vaststellen. Dit is een oproep tot precisie, geen gezondheidswaarschuwing.
Alles in perspectief plaatsend, is de boodschap die hieruit naar voren komt duidelijk: respiratoire vaccins verminderen consequent het risico op ernstige ziekte; er worden geen concrete signalen van een verhoogd risico waargenomen voor belangrijke uitkomsten tijdens de zwangerschap, en er worden gunstige trends opgemerkt voor sommige vaccins, zoals een lagere incidentie van vroeggeboorte. Voor sommige uitkomsten en voor sommige populaties blijven de compatibiliteitsmarges echter groot: kleine risicoverhogingen of -verlagingen kunnen niet worden uitgesloten. De wetenschap spreekt hier niet in zwart-wit: ze laat zien wat waarschijnlijk lijkt en wat nog moet worden opgehelderd. Het gaat er niet om deze studie te gebruiken om te zeggen dat "alles zeker is en de discussie gesloten", noch om ongegronde twijfels te zaaien. Het gaat erom de cijfers goed te communiceren. Een goed resultaat, uitgedrukt met de bijbehorende onzekerheidsmarge, is overtuigender dan welke verzonnen zekerheid dan ook. Het is sterker dan de retoriek van degenen die beweren dat vaccins onfeilbaar zijn, en oneindig veel steviger dan de absolute overtuigingen van degenen die ze ronduit afwijzen.
Natuurlijk zullen sommigen beweren dat deze taal voorbehouden is aan wetenschappers en dat "duidelijke" boodschappen nodig zijn op sociale media of in kranten. Maar duidelijkheid komt niet voort uit vereenvoudiging; als de precisie verloren gaat, leidt dat tot onrealistische overtuigingen. Zeggen dat een effect onbewezen is, is geen manier om een standpunt te vermijden, maar om er een in te nemen op basis van data. Dit gaat niet over voorzichtigheid of ambiguïteit: het gaat over transparantie. Communiceren dat positieve resultaten voor zichzelf spreken, zelfs binnen hun onzekerheidsmarge, is effectiever dan welke slogan dan ook, omdat onderzoek geen zekerheden hoeft te schreeuwen om geloofwaardig te zijn, maar eerder de volledige, begrijpelijke waarheid moet vertellen. Vaccins verdienen het om verdedigd te worden voor wat ze zijn: hulpmiddelen die het risico op ernstige ziekte daadwerkelijk verminderen, binnen de onzekerheidsmarges die de wetenschap meet en openlijk verklaart. Door ze op deze manier te beschrijven, met nauwkeurigheid en eerlijkheid, kunnen we de gegevens het beste voor zichzelf laten spreken. Zo kunnen we datgene behouden wat de wetenschap werkelijk sterk maakt: de transparantie bij het uitleggen van niet alleen wát we weten, maar ook hoeveel en in welke mate we dat weten.
Dit is precies het tegenovergestelde van de tegenstanders van vaccinaties, die zonder enige methode tegen vaccins schreeuwen en vooropgezette, ongefundeerde, slecht onderbouwde of zelfs frauduleuze argumenten naar voren brengen. Laten we in ieder geval proberen om onszelf niet met hen te verwarren.
Meer over deze onderwerpen:
ilmanifesto




