
Prof. Denis G. Rancourt, badacz Ontario Civil Liberties Association (ocla.ca)
Ten artykuł opublikowano 20 września 2021r. na stronie: https://denisrancourt.ca/entries.php?id=106
Tłumaczenie: Weronika Kokot
Spis treści
- Cel badawczy
- Zakończenie
- Czy wybrany test na obecność przeciwciał jest odpowiedni w tej sytuacji?
- Czy test na obecność przeciwciał jest specyficzny dla SARS-CoV-2?
- Czy test na obecność przeciwciał został zwalidowany do stosowania w Bangladeszu?
- Czy InBios i Abaluck i wsp. należycie ocenili „odchylenie widma”? Czy wyniki pozytywne są wiarygodne?
- Wniosek w zakresie testu serologicznego
- Czy ramię kontrolne i badawcze są ważne (tj. porównywalne)?
- Sama profilaktyka w porównaniu z profilaktyką połączoną z dodatkowymi interwencjami
- Aspekty naukowe związku między odpornością i stresem
- Mechanizmy błędu wynikające z dodatkowych interwencji
- Czy rozmiar próby jest wystarczający dla uzyskania wiarygodnych wyników?
- Wszyscy dorośli uczestnicy, w wieku 18-60+ lat, obydwa typy maseczek. Najstarsza grupa wiekowa, osoby w wieku 60+ lat, tylko w maseczkach chirurgicznych
- Zakończenie
Bibliografia
Załącznik A: Recenzje badania maseczek Abaluck i wsp. (2021) w mediach
Moje kompetencje do recenzowania badań naukowych dotyczących COVID-19
Cel badawczy
“To naprawdę powinno zakończyć dyskusję,” stwierdza Ashley Styczynski, badaczka chorób zakaźnych na Uniwersytecie Stanford w Kalifornii i współautorka artykułu naukowego przed recenzją, opisującego to badanie. Badanie “posuwa rygor naukowy o krok naprzód”, komentuje Deepak Bhatt, badacz medyczny Harvard Medical School w Bostonie w stanie Massachusetts, który opublikował wyniki badań dotyczących noszenia maseczek w Nature | News | z 9 września 2021r. w artykule pt. “Face masks for COVID pass their largest test yet” (tłum. „Maseczki przeciwko COVID-19 zaliczają swój największy do tej pory egzamin)”.
Wiodące, ustalające trendy media głównego nurtu i biura public relations różnych instytucji od początku są niepohamowanie entuzjastyczne wobec „badania maseczek z Bangladeszu” (zob. Załącznik A).
W tej recenzji oceniam metody i wyniki tego badania Abaluck i wsp. (2021), opublikowanego jako dokument roboczy Innovations for Poverty Action (IPA) pt.: “The Impact of Community Masking on COVID-19: A Cluster-Randomized Trial in Bangladesh” (tłum. „Wpływ noszenia maseczek przez społeczność na COVID-19: Klastrowe randomizowane badanie w Bangladeszu”) 1 września 2021r.
Głównym wynikiem w zakresie korzyści z noszenia maseczek była „objawowa seroprewalencja SARS-CoV-2”, tzn. prewalencja [SARS-CoV-2] mierzona u osób, które w toku badania odnotowały u siebie objawy COVID-19 i które otrzymały pozytywny wynik laboratoryjnego badania krwi uznawanego za specyficzne dla SARS-CoV-2.
Zakończenie
Klastrowe randomizowane badanie Abaluck i wsp. (2021) ma wady krytyczne, wobec czego jest bezwartościowe dla polityki zdrowia publicznego z dwóch powodów:
- Wykrywanie przeciwciał przeprowadzono za pomocą jednego komercyjnego testu serologicznego, który dopuszczono do stosowania w sytuacjach wyjątkowych (w ramach tzw. EUA), nieodpowiedniego do tego celu, tzn. do wykrywania SARS-CoV-2 w Bangladeszu (nieskalibrowany i niewalidowany dla populacji w Bangladeszu; o nieokreślonej reaktywności krzyżowej z szerokim zakresem przeciwciał IgM, przeciwko malarii, grypie, itp.).
- Uczestnikami (na poziomie osób, rodzin i wiosek) z ramienia kontrolnego i badawczego rozporządzano w wyraźnie odmienny sposób, co miało wpływ na wystąpienie czynników silnie związanych z zakażeniem i ciężkością przebiegu wirusowych chorób układu oddechowego oraz zdrowiem ogólnym uczestników.
Te wady krytyczne badania są opisane poniżej. Każda z nich jest wystarczająca, żeby unieważnić wyniki i wnioski Abaluck i wsp.
Ponadto, wyniki dotyczące objawowej seroprewalencji (SSP) uzyskane przez Abaluck i wsp. już na pierwszy rzut oka są nie do obronienia ze statystycznego punktu widzenia. Różnice w liczbie osób objawowo seropozytywnych w grupie kontrolnej i badawczej są zbyt małe, żeby móc wykluczyć duży nieznany czynnik współwystępujący, podstawową heterogeniczność i błędy wynikające z projektu badania. Ponadto, w najlepszym wypadku są na granicy istotności statystycznej, pod względem czysto idealnych statystycznych szacunków niepewności. Na koniec, praktyka uwzględniania w badaniu całych gospodarstw domowych, jednocześnie dokonując sprawozdań z pojedynczych przypadków, wprowadza nieznane korelacje i klastry, oraz wypacza matematyczne założenia stojące za metodą statystyczną.
Czy wybrany test na obecność przeciwciał jest odpowiedni w tej sytuacji?
Czy test na obecność przeciwciał jest specyficzny dla SARS-CoV-2?
W badaniu Abaluck i wsp. (2021) zastosowano tylko jeden test laboratoryjny – zestaw do badań „SCoV-2 Detect™ IgG ELISA” (InBios, Seattle, Washington).
ELISA oznacza test immunoenzymatyczny, i jest to jedna z trzech głównych, rutynowo stosowanych jakościowych i ilościowych metod wykrywania przeciwciał. IgG to klasa immunoglobulin. Aby przybliżyć temat laikowi, dwie z pięciu klas immunoglobulin, które mają znaczenie dla niniejszej krytyki, można opisać następująco:
- Immunoglobuliny M (IgM) – to przeciwciała wytwarzane w pierwszej reakcji ciała na nową infekcję lub na nowy antygen „non-self” (tzn. obcy, „nie-ja”), zapewniające ochronę krótkoterminową. Ich stężenie rośnie przez parę tygodni, a następnie spada wraz z rozpoczęciem wytwarzania IgG.
- Immunoglobuliny G (IgG) – około 70-80% immunoglobulin we krwi to IgG. Specyficzne przeciwciała IgG są wytwarzane podczas pierwszego zakażenia lub narażenia na kontakt z antygenem w inny sposób. Ich stężenie rośnie do kilku tygodni po kontakcie, a następnie spada i się stabilizuje. Ciało przechowuje katalog przeciwciał IgG, które mogą być szybko odtwarzane w razie ponownego kontaktu z tym samym antygenem. Przeciwciała IgG tworzą podstawy długoterminowej odporności przeciwko mikroorganizmom. U osób o normalnie funkcjonującym układzie odpornościowym wytwarzana jest wystarczająca liczba przeciwciał, aby zapobiec ponownemu zakażeniu. Szczepionki zapobiegają zakażeniom i wzbogacają katalog przeciwciał IgG organizmu – otrzymujący szczepionkę jest wystawiany na kontakt z osłabionym, żywym mikroorganizmem lub antygenem, który stymuluje rozpoznawanie tego mikroorganizmu — Merk Manuals | Immunoglobulins (IgA, IgG, IgM) | dostęp 15 września 2021r.
Jak twierdzą Abaluck i wsp.(2021), „Ten test wykrywa przeciwciała IgG przeciwko podjednostce S1 białka kolca SARS-CoV-2”. To zdanie jest błędne.
W żadnym z oficjalnych dokumentów dotyczących testu nie ma stwierdzenia, że test wykrywa „podjednostkę S1 SARS-CoV-2” lub którąkolwiek część białka kolca. Napisane jest tylko ogólnie, że „SCoV-2 Detect IgG ELISA jest dopuszczony do wykrywania przeciwciał przeciwko SARS-CoV-2 w ludzkiej surowicy lub osoczu” i „SPOSÓB PRZEZNACZENIA: SCoV-2 Detect™ IgG ELISA to diagnostyczny test in vitro do wykrywania ilościowego przeciwciał IgG przeciwko SARS-CoV-2 w ludzkiej surowicy lub osoczu”:
- IFU LBL-0113-03 (dokument w wersji angielskiej) (Instructions for Use) (19 maja 2021r.)
- FDA EUA Letter of Authorization COVE-G (14 maja 2021r.)
- Health Care Provider Fact Sheet COVE-G (14 maja 2021r.)
Te dokumenty są dostępne na stronie FDA: https://www.fda.gov/medical-devices/coronavirus-disease-2019-covid-19-emergency-use-authorizations-medical-devices/in-vitro-diagnostics-euas
Jedyna wzmianka o „białku kolca”, którą zdołałem znaleźć, jest na stronie FDA pt. “EUA Authorized Serology Test Performance” , tłum. „Wykonanie dopuszczonego w ramach EUA testu serologicznego” (data ostatniej aktualizacji 18 sierpnia 2021r., dostęp 14 września 2021r.) i znajduje się w pod tytułem sekcji dotyczącej tego testu:
Wzmiankowana sekcja strony FDA (Test Performance, 2021r.) przedstawia niezależną ocenę naukową testu we fragmencie o podtytule „Test Facts”. Jest tam podany link do badań, z których korzystała FDA wydając dopuszczenie EUA dla testu – “NCI’s Frederick National Laboratory for Cancer Research Evaluation Report” (data ostatniej aktualizacji 13 lipca 2021r., dostęp 14 września 2021r.).
Ta niezależna ocena naukowa (FNLCR, 2021r.) jest dokumentem źródłowym dla oceny testu zastosowanego przez Abaluck i wsp. (2021). Sprawozdanie FNLCR (2021r.) wykłada jasno, że test nie był zwalidowany do wykrywania przeciwciał IgG specyficznych dla SARS-CoV-2 ani do rozróżniania między IgM i IgG:
„Wybrane próbki pozytywne mogą nie oddawać rozkładu poziomu przeciwciał w populacjach pacjentów ocenianych za pomocą takiego testu. Ponieważ wszystkie próbki są pozytywne zarówno na IgM jak i IgG, ta ocena nie może zweryfikować, czy testy wykrywające IgM i IgG osobno wykrywają te przeciwciała niezależnie od siebie.”
Ze względu na niespecyficzność IgM – które ze swojej natury są częścią odpowiedzi immmunologicznej o szerszym spektrum działania— jest wysoce prawdopodobne, że test może wykazywać reaktywność krzyżową ze szerokim zakresem zakażeń i chorób.
Producent testu (InBios) donosi, że stworzył wewnątrzzakładową (tzn. nie niezależną) ocenę „Reaktywności Krzyżowej (Specyficzności Analitycznej)”. Na podstawie małej liczby (n = 3-8) nieokreślonych próbek referencyjnych nie stwierdza żadnej reaktywności krzyżowej dla kilku przeciwciał przeciwko innym wirusom i autoprzeciwciał, jn. (InBios, IFU LBL-0113-03, 2021):
Próbki referencyjne prawdopodobnie dobrano tak, aby miały IgG specyficzne dla badanych zakażeń wirusowych, i z tego powodu zapewne cechowały się małą ilością lub całkowitym brakiem IgM, które powstają jako pierwsze po zakażeniu badanym patogenem. Wynika to z tego, że IgG są wytwarzane wraz z zanikaniem IgM – ich stężenia są funkcjami od czasu wystąpienia objawów.
Na postawie Tabeli (InBios, IFU LBL-0113-03, 2021) słusznie można zapytać: Jeśli reaktywność krzyżową na czynnik reumatoidalny wykryto badając 18 próbek (w 3/18), dlaczego nie zbadano większej liczby próbek dla innych chorób (np. przynajmniej 18)? Przecież, standardów może być bardzo wiele, jak dzieje się m.in. w przypadku grypy. Przy tak małej liczbie zbadanych próbek całkowicie możliwe jest pominięcie licznych przypadków reaktywności krzyżowej.
Według stanu na dzień dzisiejszy, reaktywność krzyżowa jest odnotowywana tylko dla „Rheumatoid Factor”, tj. czynnika reumatoidalnego (3/18) (InBios, IFU LBL-0113-03, 2021). Ze względu na tę reaktywność krzyżową testu, Abaluck i wsp. powinni byli określić podstawową prewalencję reumatoidalnego zapalenia stawów i zespołu Sjogrena w ramieniu badawczym i kontrolnym , szczególnie u osób w podeszłym wieku (50-60, oraz 60+ lat), i dla obydwóch typów maseczek, lub powinni byli wykluczyć te dolegliwości u „objawowo seropozytywnych” uczestników badania w podeszłym wieku, zwłaszcza w świetle ich najbardziej zaskakujących wyników (zob. Ryc. 3). Abaluck i wsp. tego nie zrobili (a przynajmniej o tym nie napisali).
Yadouleton i wsp. (2021) zbadali reaktywność krzyżową (specyficzność) testu InBios SCoV-2 Detect™ IgG ELISA oraz innego testu ELISA wykrywającego przeciwciała przeciwko SARS-CoV-2. Wykazali że test InBios określił wiele próbek z Beninu spośród 60 sprzed pandemii COVID-19 (z 2019r.) jako bliskie progowi odgraniczającemu wyniki pozytywne od negatywnych (tzw. „cut-off”) (Ryc. 1A, czwarty panel z rzeczonego badania). Na podstawie wyników obydwóch testów doszli do wniosku, że „malaria o ostrym przebiegu jest najbardziej wiarygodnym wyjaśnieniem niespecyficznej dla SARS-CoV-2 reaktywności testów ELISA w próbach kontrolnych sprzed pandemii” i stwierdzili, że odsetek fałszywie pozytywnych wyników wynosił aż 25% (dla testu niewyprodukowanego przez InBios).
Badanie Yadouleton i wsp. (2021) jest szczególnie istotne, ponieważ „Bangladesz jest jednym z czterech głównych państw w Południowo-Wschodniej Azji, w których malaria występuje endemicznie – około 34% populacji państwa jest narażone na zachorowanie […] a prewalencja mieści się w przedziale między 3,1% a 36%” (Islam i wsp., 2013). Abaluck i wsp. nie informowali o przeprowadzeniu ankiety dotyczącej przejścia malarii lub trwającego właśnie zakażenia malarią u uczestników swojego badania.
Czy test na obecność przeciwciał został zwalidowany do stosowania w Bangladeszu?
Krótka odpowiedź brzmi „nie”. Długa jest następująca.
Po pierwsze, potrzebujemy dokładnych definicji specyficzności i czułości testu, które FDA sformułowała następująco (Test Performance, 2021):
Wydajność tych [zatwierdzonych w ramach EUA] testów [serologicznych] jest opisywana za pomocą ich „czułości”, czyli ich zdolności do identyfikowania próbek z przeciwciałami przeciwko SARS-CoV-2 (wskaźnik prawdziwie pozytywnych wyników) oraz ich „specyficzności”, czyli zdolności do identyfikowania próbek pozbawionych przeciwciał przeciwko SARS-CoV-2 (wskaźnik prawdziwie negatywnych wyników).
Istnieją dwa główne problemy z zastosowaniem testu wykrywającego przeciwciała firmy InBios na populacjach w Bangladeszu.
Pierwszym głównym problemem jest to, że dopuszczony do użytkowania w ramach EUA test firmy InBios nigdy nie został oceniony na prawdziwej populacji w świecie (tzn. poza laboratorium); ani w Stanach, ani w Bangladeszu. Cytując niezależnych recenzentów (FNLCR, 2021) (str. 4):
Użyte próbki nie były dobierane losowo, a szacunkowa czułość (PPA) i specyficzność (NPA) w sprawozdaniu mogą się nie pokrywać z wydajnością testu InBios International Inc. SCoV-2 Detect™ IgG ELISA w warunkach pozalaboratoryjnych. […]
1.3 Ważne zastrzeżenia
Szacunkowa czułość i specyficzność w tym sprawozdaniu może się nie pokrywać z wydajnością testu InBios International Inc. SCoV-2 Detect™ IgG ELISA w warunkach pozalaboratoryjnych. […]
Liczba próbek w panelu stanowi najmniejszy możliwy rozmiar próbki, który może dostarczyć rozsądnych szacunków i przedziałów ufności dla wydajności testu, a użyte próbki mogą nie być reprezentatywne dla profilu przeciwciał obserwowanych w populacjach pacjentów.
Kolejny główny problem jest następujący.
W ostatnim kroku testu produkt firmy InBios mierzy gęstość optyczną (OD) przez roztwór ELISA: im bardziej reaktywna jest próbka (w stosunku do substratu testu ELISA, wiążącym się z docelowym przeciwciałem), tym większa jest gęstość optyczna. Zmierzona gęstość optyczna jest dzielona przez „średnią gęstość optyczną plus trzy odchylenia standardowe” dla wielu próbek referencyjnych uznawanych za niezawierające przeciwciała docelowego. Ten stosunek (gęstości optycznej OD próbki/linię odgraniczenia OD), znany jako „Współczynnik Statusu Immunologicznego” (ISR) różnicuje „pozytywne” (ISR≥ 1,1) i „negatywne” (ISR ≤ 0,9) próbki. Producent uważa, że wartości ISR w zakresie >0.9 i >1.1 dają wyniki „graniczne”/ nieustalone.
W słowach producenta (InBios, IFU LBL-0113-03, 2021) (str. 10):
Wartość odgraniczająca dla testu została określona poprzez badanie przesiewowe dużej liczby (>100) normalnych próbek ludzkiej surowicy (NHS), które pobrano w USA przed rozpoczęciem pandemii COVID-19 (około listopada 2019r.). Miejsce odgraniczenia określono poprzez oszacowanie średniej z negatywnych próbek plus trzy (3) odchylenia standardowe.
Jak widać, określenie odgraniczenia OD jest szalenie istotne, a jego wartość jest uzależniona od populacji, z której pobiera się próbki NHS. Możemy założyć, ze InBios pobrał swoje próbki NHS z populacji USA, i że arbitralne kryteria „progów 1,1/0,9 ISR” i „plus trzy (3) odchylenia standardowe” zostały dobrane tak, „żeby wszystko się zgadzało” – Dokonano różnicowania „pozytywnych” i „negatywnych” próbek surowicy na podstawie wyników mieszkańców USA, o których wiedziano, że mogą mieć niezależnie pozytywne wyniki badania na SARS-CoV-2.
Jest mało prawdopodobne, by tak przyjęte wartości testowe (odgraniczenie OD i progi ISR 1,1/0,9) określone za pomocą NHS od mieszkańców USA, miały zastosowanie w populacji obywateli Bangladeszu. Można się spodziewać, że NHS obywateli Bangladeszu sprzed pandemii COVID-19 odbiega od NHS mieszkańców USA w sposób statystycznie istotny prewalencją autoprzeciwciał i przeciwciał przeciwko różnym zakażeniom wirusowym oraz reaktywnością krzyżową z produktami odpowiedzi immunologicznej po różnych innych zakażeniach (np. malarii) i chorobach (np. reumatoidalne zapalenie stawów, zespół Sjogrena).
Nawet badania przeprowadzane na samej populacji USA, takie jak duże badanie Kaufman i wsp. (2021) pt. „Wyniki ponad 2,4mln testów serologicznych wykrywających IgG przeciwko SARS-CoV-2 (wykonywanych od 21 kwietnia 2020r.) i 6,6mln testów NAAT (amplifikacji kwasów nukleinowych) (wykonywanych od 9 marca 2020r.) osób ze Stanów Zjednoczonych według stanu na 10 lipca 2020r.”, wykryło, że „Pozytywność wyników testów wykrywających IgG przeciwko SARS-CoV-2 stwierdzono u 91% (19,434/21,452) badanych osób po pozytywnym wyniku testu NAAT i u 10% (7,831/80,968) osób po negatywnym wyniku testu NAAT. Czynnikami związanymi z seropozytywnością były wiek, miejsce zamieszkania pacjenta i upływ czasu miedzy testem NAAT a testem serologicznym na IgG.”
Dla jasności, Kaufman i wsp. (2021) wykazali, że zarówno odsetek pozytywnych testów na IgG wśród osób z pozytywnym wynikiem testu NAAT (czułość), jak i odsetek pozytywnych testów na IgG u osób z negatywnym wynikiem testu NAAT (odsetek wyników fałszywie dodatnich) różniły się w sposób statystycznie istotny w zależności od miejsca zamieszkania w Stanach Zjednoczonych: odpowiednio 93,4% do 86,2% i 16,4% do 4,8%, poruszając się od obszaru pięciu stanów NE (NY/NJ/MA/RI/CT) w kierunku wszystkich innych stanów (Zob. Ryc. 3).
Zatem musimy uznać, że mogą istnieć duże systematyczne różnice w wydajności testów serologicznych i/lub odpowiedzi immunologicznej lub charakterystyce populacji USA i Bangladeszu. Szacowana wielkość tego systematycznego efektu, wskazanego w obszernych badaniach Kaufman i wsp. (2021) dla różnych miejsc w USA, jest wystarczająca, żeby unieważnić wyniki Abaluck i wsp., opierające się na małych różnicach liczbowych między uczestnikami (jak w przypadku wpływu maseczek chirurgicznych ma najstarsze kohorty wiekowe). Jest to kolejny problem z tym badaniem po opisanych wyżej nieprawidłowościach związanych z walidacją testu InBios.
Ponadto, z immunologicznego punktu widzenia warto rozważyć, czy populacje USA i Bangladeszu wykazują różnice w prewalencji niespecyficznych IgM, których test InBios nie odróżnia od IgG.
Mówiąc konkretnie, spektrum prewalencji chorób w Bangladeszu i USA drastycznie się różni. Według The World Factbook dla Bangladeszu istnieje „wysokie” ryzyko (2020): biegunki bakteryjnej i pierwotniaczej, wirusowego zapalenia wątroby typu A i E, tyfusu, dengi, malarii, leptospirozy i wścieklizny; odsetek osób z otyłością wynosi 3,6% (2016) w porównaniu odsetkiem dla USA – wynoszącym 36,2% (2016) (wskaźnik prewalencji wśród dorosłych).
Należy oczekiwać, że w porównaniu z USA efekty macierzy surowicy („reaktywność krzyżowa”) w Bangladeszu będą znaczne i odmienne. Bez względu na wszystko (w tym zapewnienia producenta), Abaluck i wsp. (2021) powinni byli rygorystycznie przebadać testem InBios reprezentatywną próbę poddanych wiarygodnej i niezależnej ocenie pozytywnych i negatywnych próbek surowicy z Bangladeszu. Bez minimalnej ostrożności wyrażonej uprzednią weryfikacją w celu wykluczenia różnic i zwalidowania użyteczności testu, wyniki testów są bezużyteczne z naukowego punktu widzenia.
Czy InBios i Abaluck i wsp. należycie ocenili „odchylenie widma”? Czy wyniki pozytywne są wiarygodne?
Odpowiedź brzmi „nie”, przynajmniej na podstawie przedłożonych danych.
„Błąd widma” to nieodłączna zmienność wyników testu wynikająca z rozkładu częstotliwości („widma”) wartości mierzonych przez test w badanej populacji (zob. np. Usher-Smith i wsp., 2016).
Napotykamy dwa problemy.
- W momencie kalibracji – test może mieć wydajność różniącą się w sposób statystycznie istotny od wydajności określonej za pomocą danego zestawu lub zbioru próbek, jeśli
producent dokonał kalibracji (w celu ustanowienia odgraniczenia – tzw. cut-off, zakresu nieustalonego oraz protokołu testu) biorąc pod uwagę tylko średnie i odchylenia standardowe – a nie uwzględniając kształtu rozkładu wyników pomiarów (wartości OD) próbek kalibracyjnych (“>100 NHS” dla próbek InBios). To może doprowadzić do wprowadzającej w błąd i nadmiernie entuzjastycznej charakterystyki wydajności testu, i pokazuje znaczenie reprezentatywnych próbek do kalibracji.
- W terenie test może mieć drastycznie odmienną wydajność (czułość, specyficzność) dla różnych populacji mających różne rozkłady mierzonych w teście parametrów (wartości OD), nawet jeśli populacje są w generalnie porównywalne (mają porównywalną reaktywność krzyżową z patogenami, czynniki współwystępujące, strukturę wieku, status zdrowotny, itp.).
Jednym prostym skutkiem „błędu widma” jest bliskość wielu z wyników badań w populacjach o niskiej prewalencji do wartości progowej odgraniczającej wyniki pozytywne od negatywnych, co prowadzi do szczególnie dużych błędów. Dlatego FDA stwierdza (FDA, Test Performance, 2021) (str. 2):
W populacjach o niskiej prewalencji, wynik pojedynczego testu na przeciwciała prawdopodobnie nie dostarcza wystarczająco dokładnych informacji żeby określić, czy dana osoba przebyła uprzednio [jakieś] zakażenie czy rzeczywiście ma przeciwciała przeciwko wirusowi. W takich sytuacjach, aby zwiększyć dokładność testowania należałoby wykonać drugi test, zwykle wykrywający obecność przeciwciał przeciwko innemu białku wirusowemu.
Dlatego FDA (Test Performance, 2021) (str. 47) szacuje, że teoretyczny przedział ufności, który miałby pozytywną wartość predyktywną (PPV – prawdopodobieństwo prawidłowego wyniku) dla testu InBios, wynosi 95% (50,5%; 100%) dla 5% prewalencji w populacji, pomimo astronomicznych liczb w ocenie EUA.
To oznacza, że w zależności od „prewalencji” choroby wykazującej reaktywność z testem w badaniu Abaluck i wsp., przeprowadzanym na populacjach w Bangladeszu, wiarygodność pozytywnego oznaczenia próbki może wynosić 50% lub mniej (dla niskiej prewalencji). Abaluck i wsp. informują o objawowej prewalencji wynoszącej 0,76% (w ramieniu kontrolnym) i 0,68% (w ramieniu badawczym).
W tym wypadku, „pomiar testu” lub „wartość mierzona” jest opisanym powyżej stosunkiem (OD próbki/wartość odgraniczająca OD), nazywanym „współczynnikiem statusu immunologicznego (ISR)”, pozyskanym dla danej próbki surowicy za pomocą testu InBios. To zmienna ciągła, podatna rzecz jasna na „błąd widma”. Sam producent definiuje nawet zakres nieustalony dla ISR>0,9 do >1,1 zamiast prostej wartości progowej dla oznaczenia wyniku jako pozytywny/negatywny.
Jeśli InBios chciałby, żeby recenzenci i użytkownicy ustalili potencjalny „błąd widma”, opublikowałby między innymi rozkład wartości ISR dużej liczby próbek NHS pobranych w USA przed rozpoczęciem pandemii COVID-19 (InBios, IFU LBL-0113-03, 2021). Nie mogłem dotrzeć do takich informacji ani nie napotkałem nigdzie dyskusji dotyczącej tej kwestii. Podobnie FNLCR (2021) podaje tylko status pozytywny/negatywny, a nie wartości ISR dla badanych próbek w swojej ocenie testu.
Abaluck i wsp. również nie podają wartości ISR ani ich rozkładu, nie stwierdzają nawet, ile z ich próbek ma nieoznaczone („wątpliwe”) wartości ISR w pierwszym pomiarze (Abaluck i wsp., 2021):
- stosunek statusu immunologicznego (ISR) został obliczony dzieląc gęstość optyczną poprzez wartość odgraniczającą „cut-off”. Próbki były uznawane za pozytywne jeśli ich wartość ISR wynosiła najmniej 1,1. Próbki o wartości ISR 0,9 lub poniżej uznawano za negatywne. Próbki o wątpliwych wartościach ISR były poddawane ponownemu badaniu, a tak powstałe wartości ISR uśredniano.
Na przykład, czy rozkład wartości ISR jest różny dla ramienia kontrolnego i badawczego? Nie wiemy tego.
Wniosek w zakresie testu serologicznego
Podsumowując, Abaluck i wsp. (2021) zastosowali dopuszczony przez FDA w ramach EUA test serologiczny firmy InBios w niewłaściwy sposób:
- Nie jest on specyficzny dla SARS-CoV-2, ponieważ ma nieoznaczoną reaktywność krzyżową z niespecyficznymi przeciwciałami IgM (n=0) i innymi koronawirusami (n=0), prawdopodobną reaktywność krzyżową z malarią (zrecenzowany przez innych naukowców artykuł), znaną reaktywność krzyżową z czynnikiem reumatoidalnym (n=18), niewystarczająco zbadaną reaktywność krzyżową z grypą typu A/B (n=7), wirusowym zapaleniem wątroby typu B i C (n=5), syncytialnym wirusem oddechowym (n=4) i innymi czynnikami patogennymi wysokiego ryzyka endemicznymi dla Bangladeszu (n=0) (biegunka bakteryjna i pierwotniacza, zapalenie wątroby typu A i E, tyfus, denga, malaria, leptospiroza, wścieklizna). Nie porównano również efektów macierzy surowicy dla prób z USA i Bangladeszu.
- Nie został zwalidowany dla żadnej populacji, ani w USA, ani w Bangladeszu, a do kalibracji użyto tylko próbek surowicy z USA.
- Nie został skalibrowany ani zwalidowany dla Bangladeszu, więc nie może być zastosowany jako matryca dla obywateli Bangladeszu.
Uważam za niedopuszczalne, że test którego nie zatwierdzono dla pacjentów —
OGRANICZENIA:… • Wyniki testu powinny być zawsze interpretowane w kontekście innych wyników laboratoryjnych i ogólnego stanu klinicznego pacjenta (InBios, IFU LBL-0113-03, 2021) (str. 12)
— został użyty do diagnozowania COVID-19 u uczestników badania klinicznego bez poparcia jego wyników jakąkolwiek oceną kliniczną poza samodzielnym zgłoszeniem objawów przez uczestników badania (poprzez wypełnienie kwestionariusza). Tak dokonana ocena posłużyła za uzasadnienie długoterminowego stosowania pewnego działania prewencyjnego o znanych i niepoznanych jeszcze działaniach niepożądanych u milionów ludzi (Rancourt, 2021).
Czy ramię kontrolne i badawcze są ważne (tj. porównywalne)?
Pozwól mi rozpocząć od stwierdzenia oczywistego, a jednak umykającego uwadze niemal wszystkich mediów i recenzentów public relations (w tym pracowników Nature): Badanie, w którym przeznacza się istotne środki na przekonanie grupy badawczej do zaakceptowania lub przyjęcia danego działania nie jest ani „randomizowane”, ani „kontrolowane”. Tak naprawdę jest to badanie, w którym jedną z grup poddaje się natarczywej manipulacji, żeby przyjęła dane działanie, zaś druga grupa jest wolna od tej manipulacji. Badania nie zaprojektowano w taki sposób, żeby grupę kontrolną i badawczą w sposób systematyczny odróżniała tylko obecność lub brak danego działania. Ponadto w przypadku tego badania, osoby z obydwu grup mają możliwość przyjęcia tego działania lub nie, a ich wybór w żadnej z grup z pewnością nie jest losowy. Właściwie badanie Abaluck i wsp. jest tylko kolejnym badaniem porównawczym (z intensywną ingerencją badacza).
Sama profilaktyka w porównaniu z profilaktyką połączoną z dodatkowymi interwencjami
Badanie Abaluck i wsp. (2021) jest obarczone poważnym utrudnieniem: badacze muszą stosować istotne i powtarzalne interwencje w grupie badawczej (prowadząc kampanię akceptacji noszenia maseczek), jednocześnie zapobiegając wpływowi tych interwencji w grupie badawczej na powstanie błędu w wyniku.
Innymi słowy, to klastrowe randomizowane badanie nie jest tylko niezaślepione. Jest to przypadek, w którym badane osoby nie są poddawane jedynie danemu działaniu (noszeniu maseczek), ale także wieloczynnikowej kampanii interwencji mających je przekonać do akceptacji tego działania.
Można zaprojektować i ocenić interwencje nakłaniające uczestników do noszenia maseczek, ale czymś trudniejszym jest zmierzyć wpływ samego noszenia maseczek na zdrowie publiczne bez wprowadzania dodatkowych czynników, wynikających z tych interwencji.
Jednym ze sposobów na zmniejszenie potencjalnego błędu byłoby mierzenie prewalencji choroby wyłącznie w losowo wybranych, niepoddawanych żadnym interwencjom rodzinach w ramieniu badawczym (w wioskach, w których noszono maseczki) – jeśli przeprojektowanie interwencji badawczych w ten sposób byłoby możliwe. Jednak tego nie zrobiono. Prewalencja w ramieniu badawczym została zmierzona u tych samych osób i rodzin, które poddawano interwencjom.
Jeśli istniałyby przekonujące dowody empiryczne na to, że dodatkowe interwencje nie mogą mieć wpływu na wynik badania, sama ich obecność nie stanowiłaby wady krytycznej badania. W tym przypadku jest jednak odwrotnie: istnieją przekonujące dowody na to, że dodatkowe interwencje mogą mieć wpływ na wynik, jak wyjaśniono poniżej.
Podstawowa dodatkowa interwencja została opisana przez
Abaluck i wsp. (2021) następująco:
Aby podkreślić znaczenie noszenia maseczek, przygotowaliśmy krótki film, w którym sławne osoby publiczne omawiają dlaczego, jak i kiedy należy nosić maseczkę. Film, w którym wzięli udział była premier Bangladeszu Sheikh Hasina, dyrektor Imam Training Academy i narodowy gwiazdor krykieta Shakib Al Hasan, odtworzono w każdym gospodarstwie domowym w trakcie wizyty dedykowanej rozdawaniu maseczek. Podczas tej wizyty każde z gospodarstw domowych otrzymało również ulotkę opracowaną na podstawie materiałów WHO, przedstawiającą właściwy sposób noszenia maseczek.
We wszystkich wioskach grupy badawczej wdrożyliśmy zbiór podstawowych interwencji. Dodatkowe elementy interwencyjne w dobranych losowo podzbiorach wiosek badawczych poddaliśmy randomizacji krzyżowej, aby dociec, czy wywierają dodatkowy wpływ na noszenie maseczek. Zbiór podstawowych interwencji składał się z pięciu głównych elementów:
- Jednorazowe rozdawanie i promowanie maseczek w gospodarstwach domowych.
- Rozdawanie maseczek na rynkach 3-6 dni w tygodniu.
- Rozdawanie maseczek w meczetach w 3 piątki w ciągu pierwszych czterech tygodni interwencji.
- Promowanie maseczek w miejscach publicznych i na rynkach połączone z zachęcaniem do ich zakładania osób nienoszących maseczek (co tydzień lub co dwa tygodnie).
- Dawanie dobrego przykładu i wyrażanie poparcia przez lokalnych przywódców, w tym wygłaszanie przygotowanych przez zespół badawczy przemówień na temat znaczenia maseczek przez imamów podczas piątkowych modlitw.
Nikt z uczestników, promujących maseczki ani nikt z obsługi nadzorującej noszenie maseczek nie był zaślepiony, ponieważ materiały służące do przeprowadzenia interwencji były widoczne.
Aspekty naukowe związku między odpornością i stresem
Nauka następująco tłumaczy, dlaczego interwencje Abaluck i wsp. mogą mieć wpływ na prewalencję.
Po pierwsze, badacze wykonujący kliniczne badania porównawcze wyników związanych z odpowiedzią immunologiczną muszą mieć świadomość, że zwykły stres psychologiczny ma istotny wpływ na odpowiedź immunologiczną, i że psychoneuroimmunologia to duży obszar badań (Ader i Cohen, 1993).
Status społeczny wewnątrz danej hierarchii dominacji jest ważnym czynnikiem prognostycznym przewlekłego stresu u zwierząt społecznych, w tym ludzi (Cohen i wsp., 1997a) (Sapolsky, 2005), a [przewlekły stres] może być głównym wyznacznikiem zdrowia osobniczego, obciążenia chorobą i długości życia (Cohen et al, 2007).
Wiadomo, że zwykły stres psychologiczny jest dominującym czynnikiem predysponującym danego osobnika do zakażenia wirusowymi chorobami układu oddechowego, oraz do cięższego przebiegu zakażenia (Cohen i wsp., 1991). Ponadto wiadomo że izolacja społeczna (niedostatek interakcji społecznych) połączona z indywidualnym stresem psychologicznym wywiera dodatkowy wpływ na osobniczą podatność na choroby układu oddechowego (Cohen i wsp., 1997b).
Co więcej, wiadomo, że wpływ tego czynnika jest silnie uzależniony od wieku: wydłużone okresy stresu psychologicznego mają bardziej szkodliwy wpływ na osoby starsze, niż na młode (Prenderville i wsp., 2015).
Jednakże związek między stresem a odpornością nie jest jednostajną funkcją zintegrowanej intensywności. Częstotliwość i czas trwania są szalenie istotne: przewlekły lub długotrwały stres działa szkodliwie na odpowiedź immunologiczną, zaś krótkotrwały stres adaptacyjny wzmacnia odpowiedź immunologiczną. Według często cytowanej recenzji autorstwa Dhabhar (2014):
Krótkotrwały (tzn. trwający kilka minut lub godzin) stres, którego doświadcza się podczas aktywacji układu immunologicznego wzmacnia wrodzoną/pierwotną i adaptacyjną/ wtórną odpowiedź immunologiczną. Takie wzmocnienie układu immunologicznego przejawia się m. in. zmianami w migracji, dojrzewaniu i funkcjonowaniu komórek dendrytycznych, neutrofilów i makrofagów oraz miejscowym i układowym wytwarzaniem cytokin. Natomiast długoterminowy stres obniża i rozregulowuje wrodzoną i adaptacyjną odpowiedź immunologiczną poprzez zaburzenie równowagi cytokin typu 1 i 2, wywołanie przewlekłego zapalenia o słabo nasilonych objawach, zahamowanie migracji i funkcjonowania komórek immunoprotekcyjnych oraz obniżenie ich liczebności.
Peters i wsp. (2021) dokonali oceny znaczenia tego zjawiska [tj. wpływu stresu na odporność – przyp. tłum] oraz związanych z nim aspektów naukowych dla COVID-19. Wskazali, że „Niedawno doniesiono, że kwestie socjoekonomiczne i różne aspekty zachodniego stylu życia blisko związane ze stresem psychologiczno-socjologicznym przyczyniają się do wystąpienia COVID-19”. Ich ostatecznym celem jest „wyjaśnić, czy interwencje psychologiczno-socjologiczne mogłyby zoptymalizować neuroendokrynną odpowiedź immunologiczną przeciwko zakażeniom wirusami układu oddechowego podczas i poza pandemią COVID-19.”
Mechanizmy błędu wynikające z dodatkowych interwencji
Ze względu na przytoczone powyżej fakty, wydaje mi sie oczywiste, że Abaluck i wsp. (2021) nie uwzględnili decydującej kwestii w projekcie badawczym. Ich interwencje to interakcje międzyludzkie i społeczne. Choć ich oddziaływanie obserwuje się w różnym stopniu i ma różny czas trwania, wszystkie takie interakcje wzbudzają lub rozluźniają doświadczany przez daną osobę stres psychologiczno-społeczny.
Można oczekiwać, że określone i wdrożone przez Abaluck i wsp. elementy (1 do 5) „zbioru podstawowych interwencji” będą następująco modulować stres psychologiczno-społeczny:
- (1) wizyta dedykowana rozdawaniu maseczek w każdym gospodarstwie domowym w grupie badawczej: „Film, w którym wzięli udział była premier Bangladeszu Sheikh Hasina, dyrektor Imam Training Academy i narodowy gwiazdor krykieta Shakib Al Hasan, odtworzono w każdym gospodarstwie domowym w trakcie wizyty dedykowanej rozdawaniu maseczek. Podczas tej wizyty każde z gospodarstw domowych otrzymało również ulotkę opracowaną na podstawie materiałów WHO, przedstawiającą właściwy sposób noszenia maseczek.”
→Taka wizyta zapewniłaby (zgodnie z zamierzeniem, jak się zdaje) członkom rodzin poczucie walidacji przez hierarchię dominacyjną. W ten sposób doszłoby do podniesienia ich statusu społecznego i zmniejszenia stresu związanego z hierarchią dominacji (dotykającego niższych warstw społecznych) poniżej jego długoterminowej wartości podstawowej sprzed wizyty.
- (2, 3) Same maseczki mogłyby stanowić wizualny symbol przynależności do grupy uprzywilejowanej, a regularne ich rozdawanie (na rynkach i w meczetach) – stałe interaktywne potwierdzenie uznania i troski hierarchicznego autorytetu; wszystko to zwiększałoby postrzegany status społeczny i redukowało lub eliminowało stres związany z hierarchią dominacji.
- (4) „Promowanie noszenia maseczek w miejscach publicznych i na rynkach gdzie nienoszący ich są zachęcani do zmiany postępowania (co tydzień lub co dwa tygodnie)”: „promujący maseczki patrolowali miejsca publiczne kilka razy w tygodniu i prosili nienoszących maseczek, żeby je zakładali.” (Abaluck i wsp. odkryli, że ogólny wzrost stosowania maseczek spadł z 28,4% do 10,9% w przypadku eliminacji tego elementu z procedury.)
→ Takie interakcje to klasyczne krótkotrwałe, w większości nieprzewidywalne i powtarzające się zdarzenia wywołujące stres, który „zwiększa wrodzoną/pierwotną i adaptacyjną/wtórną odpowiedź immunologiczną” (Dhabhar, 2014).
- (5) „Dawanie dobrego przykładu i wyrażanie poparcia przez lokalnych przywódców, w tym wygłaszanie przygotowanych przez zespół badawczy przemówień na temat znaczenia maseczek przez imamów podczas piątkowych modlitw”
„Dawanie dobrego przykładu” jeszcze bardziej podniosłoby postrzegany status społeczny i zredukowałoby stres związany z hierarchią dominacji. Chociaż „wyrażanie poparcia” może się opierać na wywieraniu nacisku, może mieć też charakter współpracy, co się lepiej sprawdza w sytuacji gdy popierający nie może nadzorować czy przymuszać. Jest to kolejny z elementów obniżających długoterminowy stres związany z hierarchią dominacji poniżej poziomu podstawowego sprzed badania.
Zatem na podstawie wiedzy na temat związku między stresem a odpornością, dodatkowe interwencje stosowane przez Abaluck i wsp. wzmocniłyby odpowiedź immunologiczną uczestników w próbie badawczej, w konsekwencji zmniejszając prawdopodobieństwo rozwinięcia objawów i zakażenia, niezależnie od właściwości filtrujących maseczek.
W konkretnym przypadku COVID-19 Peters i wsp. (2021) zakładają i argumentują za postępowaniem prewencyjnym polegającym na strategiach zarządzania stresem.
Co więcej, odnosząca sukcesy kampania społeczna i edukacyjna dotyczącą bezpieczeństwa zapewnianego przez maseczki mogłaby wytworzyć błąd w kierunku nierozpoznawania i nieodnotowywania objawów. W badaniu Abaluck i wsp., objawy podawano przez telefon lub osobiście za pomocą ankiety przeprowadzanej z głowami rodzin.
Zatem w samym projekcie badania Abaluck i wsp. istnieją przewidywalne błędy prawdopodobnie tworzące przekłamania w tym kierunku. Ich plan eksperymentu i interwencje mają wady krytyczne, wyniki są zatem bezwartościowe, niezależnie od problemów z badaniem krwi.
Czy rozmiar próby jest wystarczający dla uzyskania wiarygodnych wyników?
Wszyscy dorośli w wieku 18+ do 60+ lat, noszący obydwa rodzaje maseczek
W każdym z ramion badania było około 170 tysięcy osób, co stanowi dużą liczbę (Abaluck i wsp., 2021). To samo w sobie nie gwarantuje wiarygodnych statystycznie wyników. Wszystko zależy od rozmiarów różnic obserwowanych między próbą kontrolną a badawczą w porównaniu z istotnymi teoretycznymi odchyleniami standardowymi założonych idealnych statystycznych zmienności.
(Podkreślam „idealne statystyczne” ponieważ, jak wyjaśniono poniżej, Abaluck i wsp. prowadzili badanie na członkach rodzin, którzy wchodzili w bliskie interakcje, a następnie wykonywali sprawozdania z wyników w taki sposób, jakby chodziło o pojedyncze osoby. Takie postępowanie wypacza teoretyczne założenia „niezależności, braku korelacji i losowości” we wszystkich (idealnych) statystycznych obliczeniach niepewności i przedziałów ufności.)
Spośród około 170 tysięcy osób w każdym ramieniu, około 13,5 tysięcy odnotowało u siebie objawy „wskazujące na COVID-19” w trakcie badania: 13 273, tj. 7,62% w ramieniu badawczym i 13 893, tj. 8,62% w ramieniu kontrolnym. Różnica między grupą kontrolną a badawczą wynosi 620, i jest istotna ponieważ jest 5 razy większa niż idealne statystyczne odchylenia standardowe liczb przed wyciągnięciem pierwiastka kwadratowego z ich różnicy (13,5 tys.).
Liczba objawowych osób które miały pozytywny wynik testu serologicznego i różnica miedzy grupą kontrolną a badawczą w tym badaniu jest już jednak znacznie mniejsza. Abaluck i wsp. (2021) zdecydowali się nie podać tych liczb – podali jedynie „objawową seroprewalencję” (SSP) w procentach po uwzględnieniu odsetka osób, które wyraziły zgodę na badanie krwi (~40 %) – tj. (RCB): 0,68% dla grupy badawczej i 0.76% dla grupy kontrolnej.
Poniżej przedstawiam, jak na podstawie tych danych obliczyłem liczbę objawowych osób, u których wynik badania krwi był pozytywny:
Ramię badawcze:
178 288 uczestników x 0,0068 (SSP) x 0,408 (RCB) = 495 (2σ≈44) osób objawowo seropozytywnych
- Po skalowaniu na populację ramienia kontrolnego → 455 (2σ≈41)
Ramię kontrolne:
163 838 uczestników x 0,0076 (SSP) x 0,399 (RCB) = 497 (2σ≈45) osób objawowo seropozytywnych
Te równania są prawidłowe, jeśli moja interpretacja następującego (dwuznacznego) zdania jest prawdziwa: „Po wykluczeniu objawowych uczestników, którzy nie wyrazili zgody na pobranie krwi, objawowa seroprewalencja wynosiła 0,76% w wioskach kontrolnych i 0,68% w wioskach badawczych. Ponieważ te liczby pomijają niewyrażających zgody, prawdopodobnie prawdziwe wskaźniki objawowej seroprewalencji są znacznie wyższe (być może 2,5 razy, jeśli seroprewalencja u wyrażających i niewyrażających zgody jest zbliżona).”
Różnica, tzn. 497-495 = 2 osoby, daje różnicę bezwzględną objawowej seroprewalencji (SSP) w badaniu Abaluck i wsp. wynoszącą 0,0008. Taka różnica w SSP gdy w ramieniu badawczym noszone są maseczki, po uwzględnieniu spodziewanych źródeł błędu, błędów pomiarowych (j.w.) i skali różnic stwierdzonych między tylko dwoma (2) porównywanymi przez Abaluck i wsp. zdarzeniami, nie może być uznana za wiarygodną. Różnica „2 osób” jest 10 razy mniejsza niż przybliżone idealne statystyczne odchylenie standardowe (1σ) tych liczb przed ich odjęciem w celu otrzymania porównywalnych rozmiarów populacji wyjściowych. To powinno dać każdemu do myślenia.
Jeśli następnie obliczę współczynnik prewalencji (PR) z 95% przedziałami ufności, PR = 455 [414, 496] ÷ 497 [452, 542] = 0,92 [0,80, 1,04],
Co jest wartością nieróżniącą się sposób statystycznie istotny od 1. Stwarza to fałszywe wrażenie, że jest to wynik na granicy istotności statystycznej z czysto idealnego statystycznego punktu widzenia.
Abaluck i wsp. stwierdzają: „Po uwzględnieniu podstawowych kowariancji, interwencja zredukowała objawową seroprewalencję o 9,3% (skorygowany współczynnik prewalencji (aPR) = 0,91 [0,82, 1,00]; prewalencja w grupie kontrolnej 0j76%; w badawczej 0,68%).”
Jednakże bez podania idealnego statystycznego błędu i przy ignorowaniu przez autorów wszystkich innych błędów, ich śmiały wniosek dotyczący względnej redukcji SSP wynoszącej 9,3% to czysta fikcja.
Mylące jest także to, że Abaluck i wsp. przedstawiają względną redukcję SSP za pomocą dwóch cyfr znaczących (jako 9,3%), bez „korekcji”. Względna redukcja SSP według moich obliczeń ((497 – 455)/497) wynosi 8,4 % ± 12,2 % (2σ), co pokrywa się z zerem.
Najstarsza grupa wiekowa 60+ lat, nosząca tylko maseczki chirurgiczne
Najbardziej zaskakującym wynikiem badania Abaluck i wsp. (2021) jest statystycznie istotne zmniejszenie objawowej seroprewalencji o wartość wyrażoną za pomocą trzech cyfr znaczących – 34,7% (z 1,03% do 0,69% między grupą kontrolną a badawczą) wśród osób z kohorty 60+ lat, noszących tylko maseczki chirurgiczne w ramieniu badawczym (ich Ryc. 3).
Ten wynik jest zaskakujący między innymi dlatego, że żadne z przeprowadzonych do tej pory (spośród >10) metodą GRADE randomizowanych kontrolowanych badań klinicznych (RCT) ze zweryfikowanymi laboratoryjnie wynikami nie wykazało statystycznie istotnej korzyści z noszenia maseczek chirurgicznych czy N95 w aspekcie przenoszenia i zakażania COVID-19 czy innymi wirusowymi chorobami układu oddechowego. Pisałem o tym w następujących publikacjach: (Rancourt, 2021) (Rancourt, 2020a) (Rancourt, 2020b) (Rancourt, 2020c).
Trudno jest ocenić ten najbardziej zaskakujący wynik badania Abaluck i wsp., ponieważ autorzy nie podają:
- liczby uczestników w wieku 60+ lat w każdej z grup (kontrolnej w porównaniu z noszącą maseczki chirurgiczne)
- odsetka maseczek chirurgicznych wśród wszystkich rozdanych maseczek – u osób w wieku 60+ lat z ramienia badawczego
- liczby objawowych osób w wieku 60+ lat w każdej z grup (kontrolnej w porównaniu z noszącą maseczki chirurgiczne)
- odsetka osób, które wyraziły zgodę na badanie krwi (RCB) w każdej z grup (kontrolnej w porównaniu z noszącą maseczki chirurgiczne)
13 września 2021r. wysłałem wiadomość e-mail bezpośrednio do doktora Abalucka i poprosiłem o podanie tych i innych liczb dla uczestników badania: „… Pytam po prostu o te 30 najbardziej podstawowych liczb, z których tylko kilka jest już podanych w Pańskim artykule. Czy Pan lub jeden ze współautorów może je przedstawić?” Dr Abaluck odpowiedział tego samego dnia: „Udostępnimy instrukcję replikacji publicznie w ciągu kilku tygodni, wtedy będzie Pan mógł zobaczyć wszystkie dane. Jeśli nie będzie Pan miał do nich wglądu za około 3 tygodnie, proszę bez wahania skontaktować się ze mną ponownie.”
Napomknąłem, że Abaluck i wsp. (2021) nie podali idealnych statystycznych szacunków błędu (przedziałów ufności) dla żadnej z liczb dotyczących objawowej seroprewalencji żadnej z grup czy ramion badania. Według mnie wygląda to na unikanie informowania o szacunkowej niepewności statystycznej. [W badaniu] mamy do czynienia tylko z różnicami między grupami i względnymi zmianami wartości seroprewalencji między grupami bez podanych szacunków błędu.
Bez danych dla osób w wieku 60+ lat niemożliwe jest ostateczne zweryfikowanie niepewności statystycznej tego najbardziej zaskakującego wyniku. Mimo to, wymaganą niepewność można oszacować na podstawie podanych w artykule informacji, formułując racjonalne założenia dla brakujących informacji w następujący sposób.
W tym celu zakładam, że RCB dla osób w wieku 60+ lat z grupy kontrolnej i noszącej maseczki chirurgiczne jest takie samo w tym samym ramieniu. Zakładam, że 16% dorosłych z wszystkich grup to osoby w wieku 60+ lat (The World Factbook dla Bangladeszu, 2020). Zakładam, że 66,7% z osób w wieku 60+ lat, którym rozdano maseczki otrzymały maseczki chirurgiczne, co jest równe randomizacji krzyżowej na poziomie wiosek (200/300).
Następnie szacuję liczbę objawowych osób w wieku 60+ lat, które miały pozytywny wynik badania krwi w następujący sposób:
Grupa badawcza, osoby w wieku 60+ lat, noszące maseczki chirurgiczne:
178 288 uczestników x 0,16 (odsetek osób w wieku 60+ lat) x 0,667 (odsetek maseczek chirurgicznych) x 0,0069 (SSP) x
0,408 (RCB)
54 (2σ≈15) seropozytywnych objawowo osób w wieku 60+, noszących maseczki chirurgiczne → po skalowaniu na populację taką jak w grupie kontrolnej → 74 (2σ≈21)
Grupa kontrolna, osoby w wieku 60+ lat:
163 838 uczestników x 0,16 (odsetek osób w wieku 60+ lat) x 0,0103 (SSP) x 0,399 (RCB)
= 108 (2σ≈21) seropozytywnych objawowo osób w wieku 60+ lat w grupie kontrolnej
Tak szacuję, że ze statystycznego punktu widzenia te dwie porównywalne liczby osób objawowo seropozytywnych w wieku 60+ lat się na siebie nakładają w swoich 95% przedziałach ufności (74 [53, 95] (grupa badawcza); 108 [87, 129] (grupa kontrolna)).
W ramach sprawdzenia wyników – moje obliczenia dają następujący współczynnik prewalencji (PR) dla osób w wieku 60+ lat, noszących maseczki chirurgiczne: PR=74 [53, 95] (grupa badawcza) ÷ 108 [87, 129] (grupa kontrolna) = 0,69 [0,45, 0,92], co jest wartością zbliżoną do „skorygowanego” PR podanego przez Abaluck i wsp.: aPR = 0,65 [0,46, 0,85].
Jakkolwiek ta wartość PR (aPR) dla osób w wieku 60+ lat noszących maseczki chirurgiczne wydaje się być ważna z matematycznego punktu widzenia, nie jest wiarygodna, ponieważ:
- Przedział ufności jest określony na podstawie idealnych statystycznych względów. Powstał wskutek obliczenia samej niepewności przy założeniu idealnej zastosowalności. Głównym założeniem matematycznym jest to, że każde zdarzenie lub wykrycie objawowej seroprewalencji jest niezależne i losowe.
- Rzeczywiste (oszacowane tutaj) liczby bezwzględne dla zdarzeń lub wykryć są niewielkie (54 i 108) i z tego względu tym bardziej podatne na duże błędy z wszystkich źródeł, a nie tylko idealne statystyczne błędy obliczeniowe. Im mniejsze kohorty, tym większe prawdopodobieństwo „skażenia” nieznanymi czynnikami podstawowymi, i tym trudniej jest dokonać ich wyważonego porównania.
- Jak opisano wyżej, ze względu na wrażenie większego bezpieczeństwa u osób noszących maseczki i brak zaślepienia badania, oczekuje się, że przy samo-obserwacji objawów może wystąpić błąd obserwatora.
- Jak opisano wyżej, sam projekt badania zakłamuje wyniki w kierunku odporności na zakażenie w grupie badawczej. Efekt tego oddziaływania na wyniki jest prawdopodobnie silny, a najsilniejszy u osób w podeszłym wieku (ze względu na związek między stresem a odpornością).
- Odsetek osób, które wyraziły zgodę na badanie krwi (RCB, ~40 %) jest niedostatecznie wysoki, więc istnieje ryzyko błędu wynikającego z różnic w wynikach osób wyrażających i niewyrażających zgody na badanie.
- Test laboratoryjny nie jest specyficzny dla SARS-CoV-2, nie został zwalidowany dla Bangladeszu i może często dawać „nieokreślone” lub „wątpliwe” wyniki, jak opisano wyżej. Razem wzięte, to wszystko sprawia, że test jest podatny na występowanie fałszywie dodatnich i ujemnych wyników.
- Wiele potencjalnie niezrównoważonych czynników między ramieniem kontrolnym a badawczym nie jest ani określonych, ani kontrolowanych w badaniu. Te czynniki to m. In. zakażenia, choroby i stany patologiczne które mogą wykazywać reaktywność krzyżową [z SARS-CoV-2] w teście serologicznym, jak opisano wyżej. Takie zdarzenia są bardziej prawdopodobne u osób w podeszłym wieku, które często cierpią na kilka chorób współistniejących.
- Istnieje duża (50%) nierówność w „podstawowym współczynniku objawowej seroprewalencji”: 0,00002 (grupa badawcza), 0,00003 (grupa kontrolna) ( “Tabela 1: Badanie równości (Na poziomie indywidualnych uczestników)” i “Tabela A3: Badanie równości (Na poziomie wiosek)”). Abaluck i wsp. nie wyjaśniają, jak definiują ten „współczynnik” i nie omawiają ani nie próbują zinterpretować tej, wydawać by się mogło, fundamentalnej różnicy. Ta nierówność może wskazywać na różnice w wywiadzie immunologicznym, odporności lub środowiskach patogennych osób z ramienia kontrolnego i badawczego.
- Mogą istnieć nieuwzględnione lub nieznane korelacje lub klastry, które wypaczają założenie idealnej statystycznej niezależności i losowości. Na przykład, osoba w wieku 60+ lat może mieć wyższe niż losowe prawdopodobieństwo objawowej seropozytywności jeśli inna osoba w wieku 60+ lat, zamieszkująca w tym samym gospodarstwie domowym, jest lub niedawno była objawowo seropozytywna, itd. W końcu zamiast skorzystać ze standardowego projektu badawczego, w którym czynności wykonuje się na niezależnych uczestnikach, badanie wykonano na wszystkich dorosłych w każdym z gospodarstw domowych. (To oznacza, że sama wybrana dla projektu badania metoda obliczeń przedziałów ufności dla wyników pojedynczych uczestników jest nieważna. Nieważne są również wszystkie podstawowe prewalencje dla pojedynczych uczestników i współczynniki prewalencji.)
- Mogą istnieć nieznane czynniki współwystępujące, których objawy przypominają COVID-19 i które skutkują powstawaniem reaktywności krzyżowej w teście serologicznym. Drzwi są otwarte dla takiego scenariusza, gdyż objawy COVID-19 są raczej ogólne, a specyficzność testu serologicznego względem SARS-CoV-2 nie została oceniona. Z uwagi na małe liczby bezwzględne zdarzeń lub wykryć (54 i 108) byłoby możliwe, żeby te nieznane czynniki współwystępujące (jeden lub kilka) różniły się w znaczący sposób w obydwu grupach.
- Objawowej seropozytywności na COVID-19 nie potwierdzono diagnozą kliniczną, a objawowej seroprewalencji nie zwalidowano danymi dotyczącymi hospitalizacji, umieralności, przepisanych leków, absencji, itp. Abaluck i wsp. nie podali żadnych informacji na temat liczby i ciężkości objawów, zamiast tego zastosowali wartość progową, która dzieli wyniki na „objawowe” bądź nie. Jaka była charakterystyka porównawcza objawów (pod względem ciężkości, itd.) w obu niewielkich grupach (54 i 108 w liczbach bezwzględnych dla zdarzeń lub wykryć)?
Zakończenie
Badanie Abaluck i wsp. (2021) jest ekstremalnym przykładem sytuacji, w której wnioskowanie bayesowskie dotyczące wpływu przewidywalnego potencjalnego błędu i niepewności pomiaru potwierdziłoby fałszywość wyników, ale wyrafinowana demonstracja wcale nie jest potrzebna (Ioannidis, 2005) (Greenland, 2006).
W języku technicznym, jest to przypadek „śmieci na wejściu, śmieci na wyjściu”, nie wspominając już o wadach krytycznych w projekcie badania, w tym prowadzenia doświadczenia na gospodarstwach domowych i ekstrahowania z nich wyników dla indywidualnych uczestników oraz stosowania dodatkowych, mających duży wpływ na wyniki interwencji w grupie badawczej.
Jeśli to jest nowy „złoty standard badań klinicznych” (według Nature), to złoto jest teraz warte tyle, co ołów.
I zob. Załącznik A.
Bibliografia
Abaluck et al. (2021) “The Impact of Community Masking on COVID-19: A Cluster-Randomized Trial in Bangladesh”. Innovations for Poverty Action (IPA). 01 September 2021. Working Paper, dated 31 August 2021. https://www.poverty-action.org/publication/impact-community-masking-covid-19-cluster-randomized-trial-bangladesh — or — https://elischolar.library.yale.edu/egcenter-discussion-paper-series/1086/
Ader and Cohen. (1993) “Psychoneuroimmunology: Conditioning and Stress”. Annual Review of Psychology 1993 44:1, 53-85. https://pubmed.ncbi.nlm.nih.gov/8434895/
Cohen et al. (2007) “Psychological Stress and Disease”. JAMA, 298(14), str. 1685–1687. doi:
10.1001/jama.298.14.1685. https://pubmed.ncbi.nlm.nih.gov/17925521/
Cohen et al. (1997b) “Social Ties and Susceptibility to the Common Cold”. JAMA, 277(24), pp. 1940–1944. doi: 10.1001/jama.1997.03540480040036. https://pubmed.ncbi.nlm.nih.gov/9200634/
Cohen et al. (1997a) “Chronic Social Stress, Social Status, and Susceptibility to Upper
Respiratory Infections in Nonhuman Primates”. Psychosomatic Medicine: May/June 1997 –
Volume 59 – Issue 3 – str. 213-221.
https://kilthub.cmu.edu/articles/journal_contribution/Chronic_Social_Stress_Social_Status_an
d_Susceptibility_to_Upper_Respiratory_Infections_in_Nonhuman_Primates/6613937/files/121
Cohen et al. (1991) “Psychological Stress and Susceptibility to the Common Cold”. New England Journal of Medicine. Massachusetts Medical Society, 325(9), str. 606–612. doi:
10.1056/NEJM199108293250903. https://pubmed.ncbi.nlm.nih.gov/1713648/
Dhabhar. (2014) “Effects of stress on immune function: the good, the bad, and the beautiful”.
Immunologic Research. 2014 May; 58(2-3): 193-210. doi: 10.1007/s12026-014-8517-0. PMID:
FDA (Test Performance, 2021) “EUA Authorized Serology Test Performance”. Data ostatniej aktualizacji: 08/18/2021; dostęp dnia 14 września 2021. https://www.fda.gov/medical-devices/coronavirus-disease-2019-covid-19-emergency-use-authorizations-medical-devices/eua-authorized-serology-test-performance
FNLCR (2021) “Serology Test Evaluation Report for “SCoV-2 Detect™ IgG ELISA” from InBios International Inc.”. Frederick National Laboratory for Cancer Research. 13 lipca 2021. https://www.accessdata.fda.gov/cdrh_docs/presentations/maf/maf3315-a001.pdf
Greenland. (2006) “Bayesian perspectives for epidemiological research: I. Foundations and basic methods, International Journal of Epidemiology, Volume 35, Issue 3, June 2006, str. 765–775, https://doi.org/10.1093/ije/dyi312
InBios (IFU LBL-0113-03, 2021) “InBios – SCoV -2 Detect™ IgG ELISA – Instructions for Use”. InBios/FDA. COVE- G EUA/CE SCoV-2 Detect™ IgG ELISA. Insert Part No. 900255-03. Data wejścia w życie: 05/19/2021. https://inbios.com/wp-content/uploads/2021/05/LBL-0113-03-EUA-CE-SCoV-2-Detect-IgG-ELISA-product-insert-English.pdf
Ioannidis. (2005) “Why Most Published Research Findings Are False”. PLoS Med 2(8): e124. https://doi.org/10.1371/journal.pmed.0020124
Islam et al. (2013) “An epidemiological overview of malaria in Bangladesh”. Travel Med Infect
Dis. 2013 Jan-Feb;11(1):29-36. doi: 10.1016/j.tmaid.2013.01.004. Epub 2013 Feb 21. PMID: 23434288.
https://scholar.harvard.edu/files/naz/files/epidemiology_malaria_bangladesh_travel_med_inf_dis_2013.pdf
Kaufman et al. (2021) “Insights from Patterns of SARS-CoV -2 Immunoglobulin G Serology Test Results from a National Clinical Laboratory, United States, March–July 2020”. Population Health Management, 24(S1), S35–S42. https://doi.org/10.1089/pop.2020.0256 —- https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7875137/
Peters et al. (2021) “To stress or not to stress: Brain-behavior-immune interaction may weaken or promote the immune response to SARS-CoV-2”. Neurobiology of Stress, Volume 14, 100296. ISSN 2352-2895. https://doi.org/10.1016/j.ynstr.2021.100296.
Prenderville et al. (2015) “Adding fuel to the fire: the impact of stress on the ageing brain”.
Trends in Neurosciences, 38(1), pp. 13–25. doi: 10.1016/j.tins.2014.11.001.
https://pubmed.ncbi.nlm.nih.gov/25705750/
Rancourt. (2021) “Review of scientific reports of harms caused by face masks, up to February 2021”. ResearchGate. 22 lutego 2021. DOI: 10.13140/RG.2.2.14294.37448. https://archive.vn/0L5ji
Rancourt. (2020a) “Measures do not prevent deaths, transmission is not by contact, masks provide no benefit, vaccines are inherently dangerous: Review update of recent science relevant to COVID-19 policy”. ResearchGate. 28 grudnia 2020. DOI: 10.13140/RG.2.2.21706.18885. https://archive.ph/F5xqy
Rancourt. (2020b) “Face masks, lies, damn lies, and public health officials: „A growing body of
evidence””. ResearchGate. 03 sierpnia 2020. DOI: 10.13140/RG.2.2.25042.58569. https://archive.ph/BjUhB
Rancourt. (2020c) “Masks Don’t Work: A review of science relevant to COVID-19 social policy”. ResearchGate. 11 kwietnia 2020. DOI: 10.13140/RG.2.2.14320.40967/1. https://archive.ph/RuA5z (article history)
Sapolsky. (2005) “The Influence of Social Hierarchy on Primate Health”, Science, 29 kwietnia 2005, vol. 308, str. 648-652. DOI: 10.1126/science.1106477. https://www.pinniped.net/sapolsky2005.pdf
Usher-Smith et al. (2016) “The spectrum effect in tests for risk prediction, screening, and diagnosis”. BMJ 2016; 353 :i3139 doi:10.1136/bmj.i3139. https://www.bmj.com/content/353/bmj.i3139
Yadouleton et al. (2021) “Limited Specificity of Serologic Tests for SARS-CoV-2 Antibody Detection, Benin”. Emerg Infect Dis. 2021;27(1):233-237. https://doi.org/10.3201/eid2701.203281
Załącznik A: Recenzje badania maseczek Abaluck i wsp. (2021)
Kilka spraw wzbudziło moją podejrzliwość w badaniu Abaluck i wsp. (2021). Pierwszą z nich była dynamiczna kampania medialna, po której zauważyłem obecność jawnie fałszywych stwierdzeń w artykułach medialnych.
Kolejną był wyrachowany i niekompletny opis kontekstu badań skuteczności maseczek, dokonany przez samych autorów, de facto ignorujący wszystkie wcześniej wykonane metodą GRADE badania, w których nie stwierdzono korzyści z noszenia maseczek w zakresie przenoszenia i zakażania wirusem. Abaluck i wsp. podsumowują: „Zainspirowani rosnącą liczbą naukowych dowodów na to, że maseczki mogą zwolnić rozprzestrzenianie się choroby i ratować życie [Bibliografia], przeprowadziliśmy…”, choć wcale nie starają się połączyć swoich zaskakujących wyników z istniejącymi danymi naukowymi.
Czyżby Abaluck i wsp. próbowali usprawiedliwić ignorowanie wszystkich wcześniejszych badań głosząc, że maseczki zapewniają nie tylko „kontrolę źródła” ale także „działanie ochronne” [na poziomie społeczności]? Piszą: „Po pierwsze, w przeciwieństwie do technologii przynoszących korzyści głównie samemu ich użytkownikowi, noszenie maseczek prawdopodobnie wpłynie szczególnie korzystnie na społeczności.” Pojęcie „jednokierunkowej maseczki” nie opiera się na żadnych dowodach empirycznych dotyczących rzeczywistego przenoszenia [patogenu] z osoby na osobę. Zdaje się też przeczyć przewidywaniom mechaniki. Jeśli maseczki filtrują dane cząstki, to powinny je filtrować w obie strony, zarówno podczas wdechu, jak i wydechu. Wydech skierowany jest w stronę środowiska zewnętrznego, zaś wdech w stronę tkanek układu oddechowego, które są celem patogenu. Jeśli maseczki są „jednokierunkowe”, to powinno być odwrotnie.
Oto przykładowe odniesienie medialne:
— Nature | News | 9 września 2021 | “Face masks for COVID pass their largest test yet”, tłum. „Maseczki przeciwko COVID zaliczają swój największy do tej pory egzamin”:
Maseczki chronią przeciwko COVID-19. Takie są wnioski z badania klinicznego złotego standardu w Bangladeszu, które popiera wyniki setek poprzednich badań obserwacyjnych i laboratoryjnych. [Bibliografia].
Krytycy obowiązku noszenia maseczek wskazywali na brak istotnych randomizowanych badań klinicznych, w których losowo przypisano by uczestników do próby kontrolnej i badawczej. Jednak ostatnich odkryć dokonano na podstawie randomizowanego badania na prawie 350 000 osób z wiejskich obszarów Bangladeszu. Autorzy badania odkryli, że maseczki chirurgiczne – ale nie tkaninowe – redukowały przenoszenie SARS-CoV-2 w wioskach gdzie zespół badawczy rozdawał maseczki i promował ich używanie.
“To naprawdę powinno zakończyć dyskusję,” stwierdza Ashley Styczynski, badaczka chorób zakaźnych na Uniwersytecie Stanford w Kalifornii i współautorka artykułu naukowego przed recenzją, opisującego to badanie. Badanie “posuwa rygor naukowy o krok naprzód”, komentuje Deepak Bhatt, badacz medyczny Harvard Medical School w Bostonie w stanie Massachusetts, który opublikował wyniki badań dotyczących noszenia maseczek. …
— Stanford Medicine | News Center | 01 września 2021 | “Surgical masks reduce COVID-19 spread, large-scale study shows”, tłum. „Według wyników dużego badania, maseczki chirurgiczne ograniczają rozprzestrzenianie wirusa”:
Badanie opublikowano 1 września na stronie Innovations Poverty Action przed ich publikacją w pismie naukowym, ponieważ informacje te zostały uznane za ważne dla zdrowia publicznego ze względu na nasilanie się pandemii w wielu częściach świata.
„Obecnie posiadamy pochodzące z randomizowanego kontrolowanego badania klinicznego dowody na to, że promowanie maseczek zwiększa ich używanie przez ludzi i zapobiega rozprzestrzenianiu COVID-19,” powiedział lek. med. Stephen Luby, profesor medycyny na Stanford. „To złoty standard dla oceny skuteczności interwencji w zdrowie publiczne. Co ważne, to badanie zaprojektowano w taki sposób, aby było skalowalne na państwa o niższym i średnim dochodzie, mające problemy z otrzymaniem lub dystrybucją szczepionek przeciwko wirusowi.”
— The Washington Post | 01 września 2021 | “Massive randomized study is proof that surgical masks limit coronavirus spread, authors say” tłum. „Wielkie badanie randomizowane według jego autorów dowodzi, że maseczki chirurgiczne ograniczają rozprzestrzenianie koronawirusa”:
Autorzy badania na podstawie wielkiego projektu badawczego przeprowadzonego w Bangladeszu twierdzą, że ich wyniki oferują najlepszej jakości dowody na to, że powszechne noszenie maseczek chirurgicznych może ograniczyć rozprzestrzenianie koronawirusa w społecznościach.
Artykuł przed recenzją [podsumowuje badanie], w którym śledzono ponad 340 000 dorosłych z 600 wiosek wiejskich terenów Bangladeszu – zdecydowanie największe randomizowane badanie skuteczności maseczek w ograniczaniu rozprzestrzeniania się koronawirusa.
Jego autorzy twierdzą, że dostarcza ostatecznych i rzeczywistych dowodów na to, co już wcześniej silnie sugerowały badania laboratoryjne i inne prace badawcze: że noszenie maseczek może mieć istotny wpływ na ograniczanie rozprzestrzeniania się objawowego Covid-19, choroby spowodowanej zakażeniem wirusem.
“Myślę, że to w zasadzie powinno zamknąć naukową dyskusję na temat tego, czy maseczki mogą skutecznie zwalczać Covid na poziomie populacji„, powiedział w wywiadzie Jason Abaluck, ekonom na Yale, który uczestniczył w prowadzeniu badania, nazywając je „ostatnim gwoździem w trumnie” dla argumentacji przeciwko maseczkom.
— NBC News | 01 września 2021 | “Largest study of masks yet details their importance in fighting Covid-19” tłum. „Największe do tej pory badanie maseczek wskazuje na ich znaczenie w walce z Covid-19”:
Badanie przeprowadzone na ponad 340 000 osobach z Bangladeszu dostarcza pierwszorzędnych dowodów „spoza laboratorium” (tzn. ze świata rzeczywistego) na to, że stosowanie maseczek może pomóc społecznościom w zwalnianiu rozprzestrzeniania się Covid-19.
Badanie przeprowadzone w 600 wioskach wiejskich terenów Bangladeszu jest największym do tej pory randomizowanym badaniem wykazującym szczególną skuteczność maseczek chirurgicznych w ograniczaniu przenoszenia koronawirusa. Choć przeprowadzane wcześniej mniejsze badania laboratoryjne i szpitalne wykazały, że maseczki mogą zapobiegać rozprzestrzenianiu Covid, nowe odkrycia wykazują tę skuteczność w warunkach rzeczywistych w świecie — i to na wielką skalę.
„To są naprawdę solidne dane, które łączą kontrolę jak w badaniu laboratoryjnym z rzeczywistym sposobem funkcjonowania ludzi w świecie oraz pokazują, czy ludzi można nakłonić do noszenia maseczek, i czy maseczki działają„, powiedziała Laura Kwong, adiunkt zdrowia środowiskowego na Uniwersytecie Kalifornijskim w Berkeley i jeden ze współautorów badania.
— Berkeley Public Health | 01 września 2021 (bez daty) | “Largest study of its kind finds face masks reduce COVID-19” tłum. „Największe przeprowadzone badanie dowodzi, że maseczki redukują zachorowania na COVID-19”:
Na podstawie wyników nowego badania badaczy z Uniwersytetu Yale, Stanford Medical School, Uniwersytetu Kalifornii i organizacji pozarządowej Innovations for Poverty Action (IPA) noszenie maseczek, zwłaszcza chirurgicznych, skutecznie redukuje rozprzestrzenianie się COVID-19 w społecznościach.
„Te wyniki sugerują, że możemy zapobiec niepotrzebnej śmierci i chorobie jeśli nakłonimy ludzi do noszenia wysokiej jakości maseczek, takich jak maseczki chirurgiczne, w szkołach, pracy, centrach handlowych, miejscach kultu i innych wnętrzach,” twierdzi współautor badania Laura Kwong, adiunkt zdrowia środowiskowego w Berkeley’s School of Public Health.
— The Atlantic | 04 września 2021 | “The Masks Were Working All Along”, tłum. „Maseczki od zawsze były skuteczne”:
Teraz mamy ostateczne dowody na to, że maseczki naprawdę są skuteczne.
- Jaki jest wniosek? Maseczki działają, i koniec. Maseczki chirurgiczne szczególnie skutecznie zapobiegają przenoszeniu koronawirusa. A noszenie maseczek przez całe społeczności doskonale chroni osoby w podeszłym wieku, które są znacznie bardziej narażone na ciężki przebieg choroby COVID-19.
— Yale Daily News | 13 września 2021r. | „ First randomized trial on masking affirms efficacy, Yale study says”, tłum. „Pierwsze randomizowane badanie kliniczne potwierdza ich skuteczność, według badania Yale”:
- Przeprowadzone na 300 000 osobach badanie było pierwszym randomizowanym badaniem skuteczności maseczek.
Wraz z gronem badaczy z Uniwersytetu Stanford i Uniwersytetu Kalifornii w Berkeley, profesorzy ekonomii z Yale Ahmed Mushfiq Mobarak i Jason Abaluck przeprowadzili randomizowane badanie klastrowe we wsiach Bangladeszu, w którym ocenili skuteczność interwencji polegającej na promowaniu maseczek w zamieszkujących te wsie społecznościach. Badanie przeprowadzono w terminie od listopada 2020 do kwietnia 2021. …
„Dyskusja dotycząca noszenia maseczek do tej pory koncentrowała się głównie na kwestii braku randomizowanych i kontrolowanych badań, dowodzących skuteczności maseczek w przerywaniu i zapobieganiu chorobie„, stwierdził Stephen Luby, profesor chorób zakaźnych na Uniwersytecie Stanford i współautor badania. „To badanie było prawdziwym badaniem złotego standardu, które skutecznie tego dowiodło.”
— WebMD Health News | 07 września 2021 | “Large Study Confirms Masks Work to Limit COVID-19 Spread”, tłum. „Duże badanie potwierdza, że maseczki ograniczają rozprzestrzenianie się COVID-19”:
Badanie pokazuje wartość starannych badań i oferuje szereg lekcji na temat noszenia maseczek, które będą miały znaczenie dla całego świata. …
„Udało się nam dowieść skuteczności maseczek wobec COVID-19 w rygorystycznej i systematycznej ocenie dokonanej w trakcie trwania pandemii”, stwierdziła lek. med. Ashley Styczynski, która podczas swojej współpracy z innymi autorami badania Abaluck i wsp. ze Stanford, Yale i Innovations for Poverty Action (IPA), dużej organizacji pozarządowej badawczej obecnie pracującej w 22 państwach, zajmowała się chorobami zakaźnymi na Uniwersytecie Stanford.
Moje kompetencje do recenzowania badań naukowych dotyczących COVID-19
Byłem profesorem zwyczajnym fizyki na Uniwersytecie Ottawy w Kanadzie. Profesor zwyczajny to najwyższy tytuł naukowy. Podczas mojej 23-letniej kariery profesora uniwersyteckiego opracowałem nowe kursy i nauczalem ponad 2000 studentów uniwersytetów na wszystkich stopniach na trzech kierunkach (nauka, inżynieria, nauki humanistyczne). Nazdorowałem ponad 80 badań młodszych pracowników naukowych i prac dyplomowych na wszystkich poziomach – od prac habilitacyjnych przez prace doktoranckie po studenckie prace badawcze NSERC (National Science and Engineering Research Council). Przez dwie dekady kierowałem interdyscyplinarnym laboratorium badawczym o międzynarodowej renomie, zdobywając znaczące fundusze na badania.
Występowałem jako mówca plenarny, główny mówca i mówca sesji specjalnych na ważnych konferencjach naukowych około 40 razy. Opublikowałem ponad 100 artykułów naukowych dotyczących zagadnień z zakresu fizyki, chemii, geologii, biogeochemii, metrologii, gleboznawstwa i ochrony środowiska w recenzowanych czasopismach naukowych.
Mój wskaźnik h wynosi 41, a moje artykuły cytowano ponad 5000 razy w recenzowanych czasopismach naukowych (profil na Google Scholar: https://scholar.google.ca/citations?user=1ChsRsQAAAAJ ).
Moja wiedza i zdolność do oceny faktów, których dotyczy ten artykuł, wynikają z mojego wykształcenia, badań i doświadczenia, jak poniżej (https://denisrancourt.ca/ ):
- W zakresie nanocząstek środowiskowych. Wirusowe choroby układu oddechowego roznoszą się za pośrednictwem zawierających wiriony cząstek aerozolu o najmniejszej frakcji wielkości (reaktywnych nanocząstek środowiskowych). Stabilność chemiczna i fizyczna oraz właściwości transportowe tych cząstek aerozolu stanowią podstawę dla dominującego sposobu zakażenia – tj. drogą kropelkową. Moja wszechstronne badania reaktywnych nanocząstek środowiskowych zdobyły rozgłos na poziomie międzynarodowym. Zajmowałem się tematami precypitacji i wzrostu, aktywności powierzchniowej, aglomeracji, ładowania powierzchniowego, transformacji fazy, osiadania i sedymentacji oraz rozkładu. Ponadto nauczałem na temat dynamiki płynów (powietrze to ściśliwy płyn) i osiadania grawitacyjnego na poziomie uniwersyteckim oraz wykonywałem badania przemysłowego zastosowania technologii filtracji (maseczki to filtry).
- W zakresie nauki molekularnej, dynamiki molekularnej, i kompleksacji powierzchniowej. Jestem ekspertem w zakresie struktur, reakcji i dynamiki molekularnej, w tym kompleksacji molekularnej powierzchni biotycznych i abiotycznych. Te procesy umożliwiają adsorpcję wirusów i antygenów, replikację molekularną, wiązanie z włóknami maseczek, ładowanie cząstek, straty i przyrosty w cząstkach aerozolu i inne zjawiska związane z przenoszeniem wirusa, zakażaniem, i metodami zapobiegania zakażeniu. Nauczałem mechaniki kwantowej, fundamentalnej teorii atomów, cząsteczek i substancji, na zaawansowanym poziomie uniwersyteckim W moich publikacjach rozwinąłem teorię dyfrakcji promieniowania rentgenowskiego i metodologii charakteryzowania małych materialnych cząstek.
- W zakresie metod analizy statystycznej. Analiza statystyczna badań naukowych, zawierająca solidną analizę propagacji błędów i rzetelne szacunki błędu, wyznacza granicę dla wiarygodnego wnioskowania z badań obserwacyjnych (w tym randomizowanych, kontrolowanych badań w medycynie i pomiarów w terenie w trakcie epidemii). Jestem ekspertem w zakresie analizy błędu i analizy statystycznej złożonych danych badawczych z różnych dziedzin nauki. Metody analizy statystycznej stanowią podstawę dla badań medycznych.
- W zakresie modelowania matematycznego. Duża część epidemiologii opiera się na matematycznych modelach przenoszenia choroby i jej ewolucji w populacji. Posiadam wiedzę z przeprowadzonych badań oraz doświadczenie z matematycznymi modelami przewidywań i eksploracji danych, a także metodami symulacji. Posiadam ekspercką wiedzę dotyczącą niepewności parameterów i zależnościami parametrów w takich modelach. Wykonywałem obszerne symulacje dynamiki epidemiologicznej za pomocą standardowych modeli kompartmentowych SIR i MIR oraz nowych modeli.
- W zakresie metod pomiarów. W nauce istnieje pięć głównych kategorii metod pomiarowych: (1) spektroskopia (w tym jądrowa, elektronowa i wibracyjna), (2) obrazowanie (w tym mikroskopia optyczna i elektronowa oraz obrazowanie metodą rezonansu magnetycznego), (3) dyfrakcja (w tym rentgenowska i neutronowa – stosowane dla złożonych struktur cząsteczkowych i magnetycznych oraz wad struktur), (4) pomiary transportowe (w tym dotyczące szybkości reakcji, transferów energii i przewodnictwa) i (5) pomiary właściwości fizycznych (w tym gęstości, pojemności cieplnej, reakcji na stres, zmęczenia materiału…). Przez wiele lat nauczałem studentów drugiego i trzeciego stopnia fizyki, biologii, chemii i geologii tych metod pomiarów na interdyscyplinarnym kierunku, który sam stworzyłem. W dziedzinach spektroskopii, dyfrakcji, magnetometrii i mikroskopii dokonałem fundamentalnych, posuwających naukę naprzód odkryć, które opublikowano w wiodących czasopismach naukowych i zaprezentowano na międzynarodowych konferencjach. Mam ekspercką wiedzę w zakresie nauki o pomiarach, będącej podstawą dla każdej nauki.