Dengue proqnozu: Müşahidə və vektor nəzarətində məlumat elmindən necə istifadə ediləcək

Ananya Joshi, Xinyi Li, Zhang Wei, Perian Yu

Sinqapurda Denge ictimai səhiyyə böhranı olaraq qalır. Bu layihə, önümüzdəki səkkiz həftədəki denge xəstəliyinin sayını proqnozlaşdırmaqdır. LSTM ilə Fourier transformasiyası, XGBoost və RNN-lərdən istifadə edərək temperatur, rütubət, deneng halları və əhali məlumatlarına əsaslanan modellər yaradırıq. Bu yazıda, müvafiq məlumat biliklərini, fərziyyələri, addım-addım model nəslini və potensial tətbiqlərini təsvir edirik. Veb alətimiz https://dengue-prediction.herokuapp.com/ saytında mövcuddur, bu sənədi götürəcəkdir. Onlayn aləti istifadə edərkən, səhifənin tam yükləndiyini görmək üçün yuxarıdakı sağdakı işarəni gözləyin.

Ziyarət edin: https://dengue-prediction.herokuapp.com/

Fon

Şəhərdə yaşayan ağcaqanad Aedes aegypti tərəfindən ötürülən tropik və sub-tropik endemik bir xəstəlik olan Denge, dünyanın yüzdən çox ölkəsinə təsir edən əhəmiyyətli bir sağlamlıq təhlükəsidir (Guzman, 2016; ÜST, 2019). Sinqapurda hər il on-iyirmi min insan dengezik xəstəliyi ilə üzləşir və hər il 1 milyard dollardan çox ABŞ dolları xəstəliyə bağlı təsiri aradan qaldırmağa xərclənir (Carassco, 2011; Ler, 2011; Ng, 2015;). Təkcə 2019-cu ildə (sentyabr ayına qədər) yerli olaraq 15999 denge hadisəsi, o cümlədən 65 dərəcədə hemorragik qızdırma və 17 infeksiya səbəbiylə ölüm hadisəsi baş verdi (NEA, 2019). Urbanizasiyanın getdikcə artması və paralel vektor geo-genişlənməsi ilə meyvə riski və hallar qısa müddətdə artacaq (Hapuarachchi, 2016). Effektiv dərman və peyvəndlərin olmaması ilə (Campos 2018; Silveira 2019), qarşısının alınması və nəzarət ictimai sağlamlıq risklərinin idarə edilməsində və infeksiya ölümünün minimuma endirilməsində açar hala gəlir. Burada, Python və Smojo-dan istifadə edərək, Denge infeksiyasının baş verməsi və epidemiya nəzarəti ilə Sinqapurun milli nəzarətində fərdi və agentlik hazırlığına kömək etmək üçün 8-16 həftə əvvəl denge ötürülməsi hadisələrini proqnozlaşdırmaq üçün məlumat idarə edən modellər hazırladıq.

Fərziyyələr

Denge ötürülmə dərəcələri, vektor (Aedes aegypti və Aedes albopictus) populyasiya dinamikası və biologiya ilə əlaqəli bir neçə səbəbə görə fərqli şəkildə meteoroloji dəyişkənlərlə əlaqələndirilir. Məsələn, yüksələn temperatur, ağcaqanadların yetkinlik qazanmasına və bədəndəki virusun xaricdən inkubasiya müddətini (ağcaqanadların virus əldə etməsi və nəticədə proboscis vasitəsilə insanlara ötürə bilməsi arasındakı vaxt) qısaltmasıdır. Bununla birlikdə, yüksək temperatur, denge virusunun çoxalmasını və ağcaqanadın ömrünü azaldır. Yağışlar, vektor yetişdirilməsi üçün durğun hovuzlar təmin etməklə artan meyl hallarının artması ilə əlaqələndirir. Bununla birlikdə, həddindən artıq yağış ağcaqanad sürfələrinin ölümünə səbəb olur və virusun ötürülməsi riskini azaldır. Əhali, artan infeksiyanın artmasının digər bir müəyyənedicisidir, çünki dolğunluq dərəcəsi və daimi insan axınının həcmi vektor yetişdirilməsini və evdən evə ötürülməsini asanlaşdıran əsas amillərdəndir.

Proqnozlaşdırılan modellərimiz üçün, Sinqapurda denengin meydana gəlməsinin temperaturun dəyişməsi və dalğalanmalarından, yağışdan, denge virus meyllərindən və ölkə əhalisindən əhəmiyyətli dərəcədə asılı olduğunu güman edirik. Bu parametrlər və daralma hadisələri haqqında məlumatların dəqiq şəkildə toplandığını və əlaqədar dövrlər üçün həqiqi şərtləri əks etdirdiyini düşünürük.

Məlumatların araşdırılması

Modellərimizdə istifadə etdiyimiz dörd əsas məlumat toplusu var: denge sayımları, rütubət, temperatur və əhali. Dengue verilənlər bazası üçün cəmi 1038 istifadə edilə bilən məlumat nöqtəsi var. Görünən budur:

Deniz hadisələrinin musson fəsillərində artdığı bilinir. Verilənlərin hansı nümunələri izlədiyini görmək üçün illik denge sayımlarını müqayisə etdik.

Həftələr 20-30 və 50-3 (sonrakı ilin) ​​ümumiyyətlə, denge hadisələrində sünbül göstərir. Bundan əlavə, 2013, 2014 və 2019-cu illərdəki denge sıçrayışları oyun kimi başqa bir amilə də sahibdir. "2004-cü ildən 2016-cı ilədək Sinqapurda Dengue: Serotypes 1 və 2-nin üstünlük təşkil etdiyi dövrlük epidemik nümunələr" (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6085773/) üçün görünür, üstünlük təşkil edən serotip Denge hadisələri hər iki ildən bir dəyişir. Serotiplər fərqli olduqda sünbüllər görünür. Ümid edirik ki, modelimiz bu qaydanı açıq şəkildə əlavə etmək əvəzinə bu davranışı ələ keçirəcəkdir.

Əhali məlumatları çox sadədir. 60 illik məlumatlar var, əhali hər il durmadan artır. Denge məlumatlarımızı populyasiya ölçüsü ilə normallaşdırmaq məna verəcəkdir, çünki əhali artdıqca daha çox denge hadisəsi olma ehtimalı var. Ancaq gələcəyə yalnız səkkiz həftəni proqnozlaşdırdığımız üçün, 2019-cu il əhalisini təkbaşına istifadə edə bilərik. Bəzi modellərimizdə bu dizayn qərarını veririk.

Rütubət və temperatur Sinqapurun bölgələri və subregionları üçün qeydə alınıb. 28.547 istifadə nöqtəsini buraxaraq 218.585 məlumat itkisi var. Bunu nəzərə alaraq, orta bir xüsusiyyət əldə etmək üçün bütün rayonların orta qiymətini aldıq. Sinqapurdakı yağıntının qalan hissəsinə (qırmızı rəngdə) nisbətdə orta trend və sonra ortalama bir tendensiya üçün aşağıya baxın.

Yağışların orta səviyyədən (qırmızıda) daha çox (və ya daha az) olduğu bölgələr var. Gələcək bir istiqamət, bölgələri coğrafiyaya görə (misal üçün: Şimal) bütövləşdirən və ya hər bölgədə dengen yayılmasını araşdıran bir ara xüsusiyyət yaratmaqdır. Bənzər bir tendensiya temperatur məlumatları ilə müşahidə olunur:

Orta dəyərlərə qırmızı rəngdə baxın. Orta hesabla temperatur orta səviyyədən + - 2 dərəcə Selsidir.

Nəhayət, tədqiqat sənədlərindən üstünlük təşkil edən serotipləri müəyyən etdik və bir xüsusiyyət olaraq əlavə etdik. '0' sayı naməlum üstünlük təşkil edən bir serotipə aiddir. '1' və '2' nömrələri serotip 1 və 2-yə uyğundur. Serotiplər qüsursuz bir xüsusiyyətdir, çünki üstünlük təşkil edən serotip digər serotiplərin nümunələrinin də olduğunu göstərir. Bundan əlavə, məlumatlar bütün denge hallarını əhatə etmir və natamam məlumatları ehtiva edir.

Bu görüntü ilə verilənlər bazasını vizual olaraq təqdim edirik:

Modellərin təsviri

Bu süjeti əldə etmək üçün Avtokorrelyasiya dəyərlərinə baxaraq modelləşdirməyə başladıq:

Gözlədiyimiz oval şəklin konturunu görürük. Əvvəlki və növbəti dəfə addım arasındakı əlaqə 0,96-dir. Bundan sonra israrlılıq modelindən RMSE-nin aşağı olması anlamına gəlir: 51.316. Bu statistik modellər üçün RMSE, son 8 həftəlik məlumat məlumatlarını keçirmək, (t + 8) modeli istifadə edərək proqnozlaşdırmaq və sonra bu 8 həftə ərzində həqiqi Denge sayımları ilə müqayisə etməklə hesablandı. Dözüm modelindən, əvvəlki timestepin növbəti birini təxmin edə biləcəyini görürük. Sonra, fəsillərə həssas və hərəkətli orta olan AR variantlarını sınadıq. Bunun səbəbi, əhali artdıqca, denge meylləri də artmaqdadır. Hərəkətli bir ortalama bu davranışı tuta bilər. İstifadə etdiyimiz modellər Ekzogen Tərəqqi ilə Mövsümi Avtoreqressiv İnteqrasiya Birləşmə Hərəkəti-Orta (SARIMAX), Sadə Eksponensial Düzləşdirici (SES) və Holt Qışın Eksponent Düzləşdirici (ES).

Bu modellər AR rejimi kimi yaxşı çıxış etmədi, lakin məqbul idi.

Bundan sonra, Fərqli Dəyişikliklərlə denge sayımlarının tezliyini təxmin etməyə çalışdıq. Buradan, məlumat bazamızı üç kateqoriyaya ayırdıq: qatar, test və son test. Təlim məlumatların 80% -i, test 20% və son test proqnozlaşdırmaq üçün son 8 həftədir. Burada mavi rəngdə olan proqnoz 100 harmonikadan istifadə edən proqnozdur. X ox Dengue Case və y oxu həftələrdir. Test dəsti üçün RMSE 25, son test üçün isə 165 idi. Furyer transformasiyası ən son məlumatlara həssas deyil, lakin daha uzunmüddətli proqnozlaşdırmada kömək edə bilər.

Fürer proqnozunu əsas nöqtəmiz kimi təyin etdik.

Bu təməl düzəldilə bilər.

Modelləşdirmənin başqa bir ilkin araşdırması, iş dükanında tətbiq olunan perepstron tipli neyron şəbəkəsindən istifadə etməkdir. Məlumatları yenidən hazırlamaq üçün meteoroloji dəyişkənliklər üçün həftəlik ortalama məlumatlardan istifadə etmişik, hazırda müəyyən edilmiş artan təhlükə amillərinə və hava stansiyalarının coğrafi yaxınlığına görə yağan yağışlara görə 2000 və 2019-cu illər arasında mövcud olan məlumatları yoxa çıxartdıq. verilənlər bazasında dəyərlər. Bu, 8 yanvar 2000-ci ildə başlanan denge epidemiologiya məlumatları üçün həftəlik ortalama göstəricilərə sahib ola biləcəyimizdir.

Sinqapur boyunca hava stansiyalarının paylanmasının təbiətini, hər stansiya üçün məlumatların mövcudluğunu və məkan aqreqatlarımızı və bunun altındakı amilləri görə bilərsiniz.

(Temperatur məlumatları ilə stansiyaların xəritələrini. Qırmızı sancaqlar 2000-ci ildən etibarən məlumat verən stansiyaları, sarı sancaqlar isə olmayanları tapır.)

2000-ci ildən bəri mövcud olan temperatur məlumatlarına sahib stansiyaların sayının az olması səbəbindən, temperaturun paylanmasına, yerli temperaturun dəyişkənliyinə və dərəcənin ötürülmə ehtimalına, vaxt nişanına və dərəcənin ötürülməsinə təsir edən təhlükə amillərini və dörd stansiyaya birləşdirilmiş temperatur məlumatlarını qiymətləndirdik. , Changi, Seletar və Sembawang) 2000-ci ildən mövcud olan məlumatlarla.

Qiymətləndirmə ədəbiyyatda qeyd olunan bir neçə əsas məqama, məsələn, Aedes aegypti ağcaqanadlarının ehtimal olunan vaxtı, insan trafiki və yerli temperatur dinamikasına təsir edən şəhər və s. Aşağıda qiymətləndirmə parametrlərimizin bir hissəsi göstərilir.

Yağışlar üçün coğrafi yaxınlığa əsaslanan məlumatları topladıq və ortalama məlumat verdik, çünki bu, hər hava stansiyasında yağışın faktiki miqdarını təyin edən ən vacib amildir.

(Fəza yaxınlığına əsaslanan yağış aqreqatları. Bənövşəyi sancaqlar 2000-ci ilə aid məlumatları, mavilər isə olmayanları təmsil edir.)

Modelləşdirmə üçün hər sonrakı təbəqə üçün 2/3 azaldılması ilə bir qatlı, iki qatlı, dörd qatlı qavrayış şəbəkələrinin versiyalarını konfiqurasiya etdik. Göstərilən nəticələrə əsasən, modelin ümumiləşdirməməsi və bəlkə də aşırı olması qənaətinə gəldik.

Sonra XGBoost Alqoritmini sınadıq. Parametrlər üçün hiper-parametr tüninqindən istifadə etdik. Ədəbiyyata əsaslanaraq, artırma alqoritmi, qamma dəyəri və öyrənmə dərəcəsi üçün fərqli parametrləri sınadıq. Sınaq və səhvlərdən sonra modelin 50-dən çox addımla həddən artıq uyğun olduğunu gördük, buna görə də əvvəlcədən həddən artıq uyğunlaşmağı dayandırmaq üçün işə saldıq.

XGBoost eyni zamanda bir modeldə ən vacib parametrlərin kim olduğunu müəyyənləşdirməyə kömək edir. Bu vəziyyətdə, tarixlər parametridir. Bu tarixlərin denge naxışının ən vacib proqnozlaşdırıcısı olduğu anlamına gəlir. Temperatur və rütubət dəyərləri də zamandan asılıdır. Onları əvvəlcədən tanımadığımız üçün yalnız populyasiya və tarix məlumatlarından modellərlə proqnozlaşdırırıq. Proqnoz fərqi əhəmiyyətsizdir. Ay, ilin günü və əvvəlcə sayğac sayma kimi yeni xüsusiyyətlər əlavə edirik.

Test dəsti üzərində RMSE 126, son test toplusu üçün 91.5 oldu.

Ən son məlumat nöqtələrinin əhəmiyyətini nəzərə alaraq, LSTM ilə RNN faydalı bir proqnoz verə bilər.

Bu, üçüncü və son modelimiz olacaq. Yuxarıda göstərildiyi kimi oxşar bir hiper parametr tənzimləmə prosedurundan istifadə edirik. Ən yaxşı modelimizdə aşağıdakılar var:

Orta kvadratik səhv, normallaşma, nizamlanma, toplu ölçüsü 32, 3 qat LSTM olan 100 dövrə, 0,2 açılılıq üçün Adam Optimizer ilə RNN.

Test işi üzrə RMSE, son test dəsti üçün 151 və 288 idi. Bu daha çox vaxt və hesablama gücünü nəzərə alaraq yaxşılaşdırıla bilər. Gələcək işlər, Stok Proqnozlaşdırmada istifadə olunanlar kimi, ikitərəfli LSTM-lərə və denge proqnozu üçün transformatorlara baxacaqdır.

Xülasə nəticələri

Nəticələrimiz bir baxışda

İcra

Modellərimiz NEA döyüş meylinə daha təsirli kömək edə bilər.

Modellərimizi nümayiş etdirmək üçün veb tətbiqetməsini yaratdıq. Öncədən proqnozlaşdırmaq üçün bir model və həftələrin sayını seçə bilərsiniz, səhv xətlərini də görə bilərsiniz.

Denge proqnozu denge profilaktikası üçün vacib bir addımdır. Ən yaxşı qarşısının alınma strategiyalarını müəyyən etmək üçün NEA nə qədər tez və hansı miqyasda hərəkət etməyi bilməklə faydalanır. Bir istifadə hadisəsi aşağıdakılardır:

  1. NEA, 8 həftə gələcəkdə böyümə vəziyyətini proqnozlaşdırmaq üçün veb vasitədən istifadə edir
  2. NEA, proqnozlaşdırılan meyvə hadisələrində kəskin bir artım olduğunu görmək üçün proqnozlaşdırılan nümunələri başa düşür.
  3. NEA aqressiv ağcaqanad nəzarətini həyata keçirir
  4. NEA, müdaxilələrini yeni deng sayımları ilə birlikdə yenidən modelə verir.
  5. NEA, yaxın 8 həftə ərzində az miqdarda denge hadisələrinin olacağını və gələcəkdə kömək edəcək yeni müdaxilələri sınayabilir.

Davamlı effektivliyin açarı NEA-nın hərəkətlərini sənədləşdirməsi və yuxarıda göstərilən fərziyyələr dəyişdikcə modelin yenilənməsinə imkan verməsidir. Bu ən böyük texniki riskdir.

Texniki risklər

Modelimiz küləyin, detritin olması və heyvandarlıq sahələrinin mövcudluğu kimi meyvənin yayılmasına təsir etdiyi bilinən bir sıra ətraf mühit hadisələrini müəllifləşdirir. Bu fərziyyələr qəbuledilməz ola bilər, çünki ətraf mühit şəraitində baş verən dəyişikliklər nəticəsində yaranan səhvlə müqayisədə denge hallarının sayı azdır.

Ayrıca, model NEA-nın müxtəlif, güclü müdaxilələrini daxil etmir. NEA-nın səylərini nə vaxt və harada tətbiq etməsi haqqında əvvəlcədən məlumatımız olmadığından, deng proqnozlaşdırılmasında əhəmiyyətli bir amili nəzərə almırıq. NEA-nın müdaxilələrinin təsirini Wishbachia proqramının Yishun və Tampinesdəki müvəffəqiyyəti ilə görmək olar, ağcaqanad populyasiyasında 90% sıxılma nisbəti. Xəstəliyi ötürmək üçün ağcaqanadların sayının az olması ilə bu ərazilərdə meyvə xəstəliyinin də azalacağı ehtimal olunur. Hal hazırda model bu müdaxilələri nəzərə almır.

Birlikdə, ətraf mühit və müdaxilə mülahizələri, alətin azalma hallarına təsir edən əsas amillərə həssas olmasının qarşısını alır. Bu amillərə daha həssas olan modellər yaratmaq üçün yuxarıda göstərildiyi kimi verilənlər bazasını artırmalıyıq. Bu amilləri nəzərə alsaq, ən azı 20% bir səhv həddini mühafizəkar olaraq qiymətləndiririk. Bu, ən yaxşı proqnozumuzun səhv nisbətindən və bir artım yayılması monitorinq veb saytında (https://outbreak.sgcharts.com/) illik tendensiyaları müşahidə etməklə hesablanır. Əlavə məlumatların daha yüksək dərəcədə daha yaxşı olması ilə daha yaxşı proqnozlar mümkündür.

Nəticələr

Deng proqnozlaşdırılması bir neçə amil ilə mürəkkəb bir məsələdir. İstifadə etdiyimiz məlumatlara əsasən, 91.5 (XGB) RMSE ilə 8 həftə davam edəcək bir proqnoz hazırlaya bildik. Mövcud model, NEA-ya Sinqapur üçün ən yaxşı şəkildə xidmət edə biləcək planlama qərarları, məsələn, ağcaqanad nəzarətinə nə zaman aqressiv və ya yenilikçi yanaşma lazım olduğu barədə məlumat verə bilər. Risklərdə qeyd edildiyi kimi, ətraf mühit amilləri və müdaxilələr haqqında əlavə düşüncə ilə bu model daha güclü bir yardım ola bilər.

Reflilər

Ətraf mühitin proqnozlaşdırılması modellərini yaratmaq çətindir. Əsas problemlərimizdən biri də uyğun və yaxşı sənədləşdirilmiş xüsusiyyətləri müəyyənləşdirmək idi. Proqnozlarımız üçün böyük RMSE gördüyümüzdə kədərləndi, ancaq işlərin dəqiq sayını təxmin etmədən bu modellərin faydalı ola biləcəyini öyrənmək vacib idi.

Onları qurduğumuz hər bir modelin təşkili və təhlilinin vacibliyini də dərk etdik. Dəfələrlə dəfələrlə, itkilərimizin niyə bu qədər aşağı (və ya yüksək) olduğunu başa düşmədən yanlış yola getdik. Ümid edirik ki, başqaları təcrübələrimizi qura biləcəklər ki, tezliklə güclü bir proqnoz verici olacaq.

Resurslar

1. Côrtes Da Silveira, LT, Tura, B. & Santos, M. Denge peyvəndinin effektivliyini sistematik şəkildə nəzərdən keçirmək. doi: 10.1186 / s12879–019–4369–5

2. Carrasco, LR et al. Sinqapur xəstəliyinin iqtisadi təsiri və Sinqapurda gələcək peyvənd proqramlarının iqtisadi səmərəliliyi. PLoS Negl. Çək. Dis 5, e1426 (2011).

3. NEA. NEA | Rüblük Denge Nəzarət Məlumatları. NEA Rüblük Dengue Nəzarət Məlumatları (2019). Mövcuddur: https://www.nea.gov.sg/dengue-zika/dengue/quarterly-dengue-surveillance-data. (Giriş: 4 Yanvar 2020)

4. NEA. NEA | Denge davaları. NEA Denge davaları (2019). Mövcuddur: https://www.nea.gov.sg/dengue-zika/dengue/dengue-cases. (Giriş: 4 Yanvar 2020)

5. Ong, J. et al. Random Forest istifadə edərək Sinqapurda denge riskini xəritəçəkdirin. PLoS Negl. Çək. Dis 12, e0006587 (2018).

6. Guzman, MG, Gubler, DJ, Izquierdo, A., Martinez, E. & Halstead, SB Denge infeksiyası. Nat. Rev. Dis. Prim. 2, (2016).

7. Peña-Garcia, VH, Triana-Chaves, O. & Arboleda-Sancchez, S. Kolumbiyanın şəhərlərində Denge keçidinə Temperaturun Təsiri. Ann. Qlobus. Sağal. 83, 509 (2017).

8. Benedum, CM, Seidahmed, OME, Eltahir, EAB & Markuzon, N. Sinqapurda yağış yağışının denge ötürülməsinə təsirinin statistik modelləşdirilməsi. PLoS Negl. Çək. Dis 12, e0006935 (2018).

9. Watts, DM, Burke, DS, Harrison, BA, Whitmire, RE & Nisalak, A. temperaturun Aedes aegypti'nin vektor səmərəliliyinə Denge 2 virusu üçün təsiri. Am. J. Trop. Med. Hyg. 36, 143–152 (1987).

10. Li, CF, Lim, TW, Han, LL & Fang, R. Yağışlar, Aedes aegypti bolluğu və Selangor, Malayziyada denge infeksiyası. Cənub-Şərqi Asiya J. Trop. Med. Xalq Sağlamlığı 16, 560-568 (1985).

11. Alto, BW & Bettinardi, D. Ağcaqanadlarda temperatur və denge virusu infeksiyası: Yetişməmiş və yetkin mərhələlərə müstəqil təsir. Am. J. Trop. Med. Hyg. 88, 497-505 (2013).

12. WHO. Denge ve şiddətli denge. (2019). Mövcuddur: https://www.who.int/news-room/fact-sheets/detail/dengue-and-severe-dengue. (Giriş: 4 Yanvar 2020)

13. Ler, TS et al. 2005 və 2007-ci illərdə Sinqapurdakı denge epidemiyalarının epidemioloji xüsusiyyətləri - oxşarlıqlar və fərqliliklər. Qərb. Sakit okean müşahidəsi. Cavab 2, e1-e1 (2011).

Bu layihə NUS-da IoT Datathon üçün edildi.