Dengue proqnozu: Vektor nəzarəti və idarəetməsində məlumat elmindən necə istifadə olunur

TFFL tərəfindən Ananya Joshi, Li Xinyi, Yu Peiran, Zhang Wei

İnteraktiv veb alətimizin görüntüsü

Sinqapurda Denge ictimai səhiyyə böhranı olaraq qalır. Bu layihə, önümüzdəki səkkiz həftədəki denge xəstəliyinin sayını proqnozlaşdırmaqdır. LSTM ilə percepttron şəbəkəsi, Fourier transformasiyası, XGBoost və RNN-lərdən istifadə edərək temperatur, rütubət, deneng halları və əhali məlumatlarına əsaslanan modellər yaradırıq. Bu yazıda, müvafiq məlumat biliklərini, fərziyyələri, addım-addım model nəslini və potensial tətbiqlərini təsvir edirik. Veb alətimiz https://dengue-prediction.herokuapp.com/ saytında mövcuddur, bu sənədi götürəcəkdir. Onlayn aləti istifadə edərkən, səhifənin tam yükləndiyini görmək üçün yuxarıdakı sağdakı işarəni gözləyin.

Fon

Şəhərdə yaşayan ağcaqanad Aedes aegypti tərəfindən ötürülən tropik və sub-tropik endemik bir xəstəlik olan Denge, dünyanın yüzdən çox ölkəsinə təsir edən əhəmiyyətli bir sağlamlıq təhlükəsidir (Guzman, 2016; ÜST, 2019). Sinqapurda hər il on-iyirmi min insan dengezik xəstəliyi ilə üzləşir və hər il 1 milyard dollardan çox ABŞ dolları xəstəliyə bağlı təsiri aradan qaldırmağa xərclənir (Carassco, 2011; Ler, 2011; Ng, 2015;). Təkcə 2019-cu ildə (sentyabr ayına qədər) yerli olaraq 15999 denge hadisəsi, o cümlədən 65 dərəcədə hemorragik qızdırma və 17 infeksiya səbəbiylə ölüm hadisəsi baş verdi (NEA, 2019). Urbanizasiyanın getdikcə artması və paralel vektor geo-genişlənməsi ilə meyvə riski və hallar qısa müddətdə artacaq (Hapuarachchi, 2016). Effektiv dərman və peyvəndlərin olmaması ilə (Campos 2018; Silveira 2019), qarşısının alınması və nəzarət ictimai sağlamlıq risklərinin idarə edilməsində və infeksiya ölümünün minimuma endirilməsində açar hala gəlir. Burada, Python və Smojo-dan istifadə edərək, Denge infeksiyasının baş verməsi və epidemiya nəzarəti ilə Sinqapurun milli nəzarətində fərdi və agentlik hazırlığına kömək etmək üçün 8-16 həftə əvvəl denge ötürülməsi hadisələrini proqnozlaşdırmaq üçün məlumat idarə edən modellər hazırladıq.

Aşağıda işlətdiyimiz modellərin vacib texniki məlumatlarının qısa təsvirini tapa bilərsiniz.

  • LSTM ilə RNN

Təkrarlanan Neyron Şəbəkəsi, daxili yaddaşı olan beslemeli sinir şəbəkəsinin ümumiləşdirilməsidir. RNN, hər bir məlumat girişi üçün eyni funksiyanı yerinə yetirdiyindən cari girişin çıxışı keçmiş bir hesablamadan asılı olduğu üçün təkrarlanır. Ötürücü neyron şəbəkələrindən fərqli olaraq, RNNlər giriş ardıcıllığını emal etmək üçün daxili vəziyyətlərindən (yaddaşından) istifadə edə bilərlər. Bu onları bilinməmiş, bağlı əl yazısı tanıma və ya nitq tanıma kimi vəzifələrə tətbiq edir. Digər sinir şəbəkələrində, bütün girişlər bir-birindən müstəqildir. Ancaq RNN-də bütün girişlər bir-biri ilə əlaqəlidir.

Uzun Qısamüddətli Yaddaş (LSTM) şəbəkələri təkrarlanan neyron şəbəkələrin dəyişdirilmiş bir versiyasıdır ki, bu da keçmişdəki məlumatları yaddaşda yadda saxlamağı asanlaşdırır. RNN-nin yoxa çıxan gradient problemi burada həll olunur. LSTM, bilinməyən müddəti uzadılmış vaxt aralığının təsnifatı, işlənməsi və proqnozlaşdırılması üçün yaxşı uyğundur. Geri yayılmadan istifadə edərək modeli öyrədir.

Ümumi LSTM vahidi bir hücrədən, bir giriş qapısından, bir çıxış qapısından və unutma qapısından ibarətdir. Hüceyrə ixtiyari vaxt fasilələri ilə dəyərləri xatırlayır və üç qapı hüceyrəyə daxil olan və çıxan məlumat axını tənzimləyir.

https://towardsdatascience.com/understanding-rnn-and-lstm-f7cdf6dfc14e

  • XGBoost

XGBoost, bir qradiyent artırma çərçivəsini istifadə edən qərar ağacına əsaslanan Maşın Öyrənmə alqoritmidir. Qurulmamış məlumatların (şəkillər, mətn və s.) Aid proqnozlaşdırma problemlərində süni sinir şəbəkələri bütün digər alqoritmləri və çərçivələri üstün tutur. Lakin, kiçik-orta quruluşlu / cədvəlli məlumatlara gəldikdə, qərar ağacına əsaslanan alqoritmlər hazırda ən yaxşı sinif hesab olunur.

https://towardsdatascience.com/https-medium-com-vishalmorde-xgboost-algorithm-long-she-may-rein-edd9f99be63d

Fərziyyələr

Denge ötürülmə dərəcələri, vektor (Aedes aegypti və Aedes albopictus) populyasiya dinamikası və biologiya ilə əlaqəli bir neçə səbəbə görə fərqli şəkildə meteoroloji dəyişkənlərlə əlaqələndirilir. Məsələn, yüksələn temperatur, ağcaqanadların yetkinlik qazanmasına və bədəndəki virusun xaricdən inkubasiya müddətini (ağcaqanadların virus əldə etməsi və nəticədə proboscis vasitəsilə insanlara ötürə bilməsi arasındakı vaxt) qısaltmasıdır. Bununla birlikdə, yüksək temperatur, denge virusunun çoxalmasını və ağcaqanadın ömrünü azaldır. Yağışlar, vektor yetişdirilməsi üçün durğun hovuzlar təmin etməklə artan meyl hallarının artması ilə əlaqələndirir. Bununla birlikdə, həddindən artıq yağış ağcaqanad sürfələrinin ölümünə səbəb olur və virusun ötürülməsi riskini azaldır. Əhali, artan infeksiyanın artmasının digər bir müəyyənedicisidir, çünki dolğunluq dərəcəsi və daimi insan axınının həcmi vektor yetişdirilməsini və evdən evə ötürülməsini asanlaşdıran əsas amillərdəndir.

Proqnozlaşdırılan modellərimiz üçün, Sinqapurda denengin meydana gəlməsinin temperaturun dəyişməsi və dalğalanmalarından, yağışdan, denge virus meyllərindən və ölkə əhalisindən əhəmiyyətli dərəcədə asılı olduğunu güman edirik. Bu parametrlər və daralma hadisələri haqqında məlumatların dəqiq şəkildə toplandığını və əlaqədar dövrlər üçün həqiqi şərtləri əks etdirdiyini düşünürük.

Məlumatların araşdırılması

Modellərimizdə istifadə etdiyimiz dörd əsas məlumat toplusu var: denge sayımları, rütubət, temperatur və əhali. Dengue məlumat bazasında, 2000 ilə 2019 arasında epidemiologiya həftəsi ortalama olaraq paylanan cəmi 1038 istifadə edilə bilən məlumat nöqtəsi var.

Deniz hadisələrinin musson fəsillərində artdığı bilinir. Verilənlərin hansı nümunələri izlədiyini görmək üçün illik denge sayımlarını müqayisə etdik.

Həftələr 20-30 və 50-3 (sonrakı ilin) ​​ümumiyyətlə, denge hadisələrində sünbül göstərir. Bundan əlavə, 2013, 2014 və 2019-cu illərdəki denge sıçrayışları oyun kimi başqa bir amilə də sahibdir. "2004-cü ildən 2016-cı ilədək Sinqapurda Dengue: Serotypes 1 və 2-nin üstünlük təşkil etdiyi dövrlük epidemik nümunələr" (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6085773/) üçün görünür, üstünlük təşkil edən serotip Denge hadisələri hər iki ildən bir dəyişir. Serotiplər fərqli olduqda sünbüllər görünür.

Əhali məlumatları çox sadədir. 60 illik məlumatlar var, əhali hər il durmadan artır. Denge məlumatlarımızı populyasiya ölçüsü ilə normallaşdırmaq məna verəcəkdir, çünki əhali artdıqca daha çox denge hadisəsi olma ehtimalı var. Ancaq gələcəyə yalnız səkkiz həftəni proqnozlaşdırdığımız üçün, 2019-cu il əhalisini təkbaşına istifadə edə bilərik. Bəzi modellərimizdə bu dizayn qərarını veririk.

Rütubət və temperatur Sinqapurun bölgələri və subregionları üçün qeydə alınıb. 28.547 istifadə nöqtəsini buraxaraq 218.585 məlumat itkisi var.

Itkin məlumat nöqtələrinin sayını nəzərə alsaq, orta bir xüsusiyyət əldə etmək üçün bütün rayonların orta qiymətini aldıq. Sinqapurdakı yağıntının qalan hissəsinə (qırmızı rəngdə) nisbətdə orta trend və sonra ortalama bir tendensiya üçün aşağıya baxın.

Yağışların orta səviyyədən (qırmızıda) daha çox (və ya daha az) olduğu bölgələr var. Gələcək bir istiqamət, bölgələri coğrafiyaya görə (misal üçün: Şimal) bütövləşdirən və ya hər bölgədə dengen yayılmasını araşdıran bir ara xüsusiyyət yaratmaqdır. Bənzər bir tendensiya temperatur məlumatları ilə müşahidə olunur:

Orta dəyərlərə qırmızı rəngdə baxın. Orta hesabla temperatur orta səviyyədən + - 2 dərəcə Selsidir.

Nəhayət, tədqiqat sənədlərindən üstünlük təşkil edən serotipləri müəyyən etdik və bir xüsusiyyət olaraq əlavə etdik. '0' sayı naməlum üstünlük təşkil edən bir serotipə aiddir. '1' və '2' nömrələri serotip 1 və 2-yə uyğundur. Burada serotiplər qüsursuz bir xüsusiyyətdir, çünki ədəbiyyat hər dövrdə dövriyyədə olan üstünlük təşkil edən serotipə diqqət yetirir, digər serotiplərin nümunələri müzakirə edilmir və buna görə də məlumatlar nümayəndəliyimiz üçün mövcud deyil. Bundan əlavə, serotiplər haqqında məlumatlar Sinqapurdakı bütün denge hadisələrini əhatə etmir və yalnız xəstəxanalara toplanmış və analiz üçün göndərilənləri təmsil edir.

Bu görüntü ilə verilənlər bazasını vizual olaraq təqdim edirik:

Modellərin təsviri

Modelləşdirməyə aşağıda göstərildiyi kimi timesteps boyunca gerilim süjetinə (y (t + 8) vs y) baxaraq başladıq:

Biz ancaq gözlədiyimiz oval forma və diaqonal görürük. Korrelyasiya 0,69-a bərabərdir. Bundan sonra israrlılıq modelindən RMSE-nin yüksək olduğu anlaşılır: 207.7. Bu statistik modellər üçün RMSE, son 8 həftəlik məlumat məlumatlarını tutaraq, (t + 8) modeli istifadə edərək proqnozlaşdırmaqla hesablandı və daha sonra bu 8 həftə üçün əsl Deng sayımları ilə müqayisə edildi. Davamlı model zəifdir. Sonra, fəsillərə həssas və hərəkətli orta olan AR variantı olan SARIMAX-ı sınadıq. Bunun səbəbi, əhali artdıqca, denge meylləri də artmaqdadır. Hərəkətli bir ortalama bu davranışı tuta bilər. RMSE test səhvləri də 213.5 səviyyəsində yüksək idi.

Bundan sonra, Fərqli Dəyişikliklərlə denge sayımlarının tezliyini təxmin etməyə çalışdıq. İndi test dəsti məlumatların 0.8-i, qatar dəsti məlumatların 0.2-i və əvvəllər çıxarılan gizli test dəsti məlumatların son 8 həftəsidir. Test dəsti üçün RMSE 182, gizli test dəsti üçün isə 121 idi. Furyer transformasiyası ən son məlumatlara həssas deyil, lakin daha uzunmüddətli proqnozlaşdırmada kömək edə bilər. Korrelyasiya sahələri və laq sahələri perspektivli deyildi.

Fürer proqnozunu əsas nöqtəmiz kimi təyin etdik. Bu təməl düzəldilə bilər.

Əvvəlcə məlumatların əvvəlcədən işlənməsində domen biliklərinə əsaslanan dizayn qərarları olan percepttron tipli neyron şəbəkələri araşdırdıq və müəyyən edilmiş şəbəkə konfiqurasiyaları və xüsusiyyətləri (Nəticələr Əlavəyə istinad olunur) zəif işləməsi ilə müşahidə etdik.

Qavrama modelində yaxşılaşdırmaq üçün XGBoost Alqoritmini sınadıq. Parametrlər üçün hiper-parametr tüninqindən istifadə etdik. Ədəbiyyata əsaslanaraq, artırma alqoritmi, qamma dəyəri və öyrənmə dərəcəsi üçün fərqli parametrləri sınadıq. Sınaq və səhvlərdən sonra modelin 50-dən çox addımla həddən artıq uyğun olduğunu gördük, buna görə də əvvəlcədən həddən artıq uyğunlaşmağı dayandırmaq üçün işə saldıq.

XGBoost eyni zamanda modellər üçün ən vacib xüsusiyyətləri müəyyənləşdirməyə kömək edir. Modellərimiz üçün ay, ilin günü və əvvəlcədən nisbət sayılması kimi yeni əlavə olunmuş xüsusiyyətlər rütubət və temperatur məlumatlarına nisbətən daha vacib idi. Temperatur və rütubət dəyərləri də zamandan asılıdır, bu da bu hava dəyişkənlərini xüsusiyyətlərinin tarixlərdə (ilin və ayın) parametrlərində tutulduğunu nəzərə alaraq lazımsız hala gətirdi. Buna görə də, modellərimiz populyasiyadan, həftədən, aydan, ilin günündən və əvvəllər baş verən hadisələrdən xüsusiyyət kimi istifadə edirlər.

Fəqət korrelyasiya səpələnmə süjetini də proqnozlaşdırdıq:

Səpələnmə süjetindən modelimizin son dərəcə çox sayda (600+) olan bu həftələrdə çoxalma hallarının miqyasını dəqiq proqnozlaşdırmaq üçün mübarizə apardığını görə bilərik. Gələcəkdə, proqnoz tətbiqimizdən asılı olaraq bu həddindən artıq həftələri (RMSE artması riski ilə) daha yaxşı proqnozlaşdırmaq üçün modelimizin zərər funksiyasını dəyişə bilərik. Proqnoz keyfiyyətini ataraq, yüksək denge sayımları və aşağı denge sayımları ilə həftələrin bir dengesizliği var.

Lag süjet perspektivlidir. Test və qatar üçün zirvə 1 səviyyəsindədir, bu da əzmkarlıq modelindən bir inkişafdır (zirvə 8-də). Bu, modellərimiz üçün ən yaxşı geridir.

Test dəsti üzərində RMSE 126, gizli test dəsti üçün isə 91.5 idi.

Ən son məlumat nöqtələrinin əhəmiyyətini nəzərə alaraq, LSTM ilə RNN faydalı bir proqnoz verə bilər. Son modelimizdə aşağıdakılara sahib olduq: orta kvadrat səhv, normallaşma, nizamlanma üçün Adam Optimizer ilə RNN, toplu ölçüsü 32, 3 qat LSTM ilə 100 dövr, 0,2 açılı ilə.

Test işi üzrə RMSE, gizli test dəsti üçün 151 və 288 idi. Bu daha çox vaxt və hesablama gücünü nəzərə alaraq yaxşılaşdırıla bilər. Gələcək işlər, Stok Proqnozlaşdırmada istifadə olunanlar kimi, ikitərəfli LSTM-lərə və denge proqnozu üçün transformatorlara baxacaqdır.

Xülasə nəticələri

İcra

Modellərimiz NEA döyüş meylinə daha təsirli kömək edə bilər.

Modellərimizi nümayiş etdirmək üçün veb tətbiqetməsini yaratdıq. Öncədən proqnozlaşdırmaq üçün bir model və həftələrin sayını seçə bilərsiniz, səhv xətlərini də görə bilərsiniz.

Denge proqnozu denge profilaktikası üçün vacib bir addımdır. Ən yaxşı qarşısının alınma strategiyalarını müəyyən etmək üçün NEA nə qədər tez və hansı miqyasda hərəkət etməyi bilməklə faydalanır. Bir istifadə hadisəsi aşağıdakılardır:

  1. NEA, 8 həftə gələcəkdə böyümə vəziyyətini proqnozlaşdırmaq üçün veb vasitədən istifadə edir
  2. NEA, proqnozlaşdırılan meyvə hadisələrində kəskin bir artım olduğunu görmək üçün proqnozlaşdırılan nümunələri başa düşür.
  3. NEA aqressiv ağcaqanad nəzarətini həyata keçirir
  4. NEA, müdaxilələrini yeni deng sayımları ilə birlikdə yenidən modelə verir.
  5. NEA, yaxın 8 həftə ərzində az miqdarda denge hadisələrinin olacağını və gələcəkdə kömək edəcək yeni müdaxilələri sınayabilir.

Davamlı effektivliyin açarı NEA-nın hərəkətlərini sənədləşdirməsi və yuxarıda göstərilən fərziyyələr dəyişdikcə modelin yenilənməsinə imkan verməsidir. Bu ən böyük texniki riskdir.

Texniki risklər

Modelimiz küləyin, detritin olması və heyvandarlıq sahələrinin mövcudluğu kimi meyvənin yayılmasına təsir etdiyi bilinən bir sıra ətraf mühit hadisələrini müəllifləşdirir. Bu fərziyyələr qəbuledilməz ola bilər, çünki ətraf mühit şəraitində baş verən dəyişikliklər nəticəsində yaranan səhvlə müqayisədə denge hallarının sayı azdır.

Ayrıca, model NEA-nın müxtəlif, güclü müdaxilələrini daxil etmir. NEA-nın səylərini nə vaxt və harada tətbiq etməsi haqqında əvvəlcədən məlumatımız olmadığından, deng proqnozlaşdırılmasında əhəmiyyətli bir amili nəzərə almırıq. NEA-nın müdaxilələrinin təsirini Wishbachia proqramının Yishun və Tampinesdəki müvəffəqiyyəti ilə görmək olar, ağcaqanad populyasiyasında 90% sıxılma nisbəti. Xəstəliyi ötürmək üçün ağcaqanadların sayının az olması ilə bu ərazilərdə meyvə xəstəliyinin də azalacağı ehtimal olunur. Hal hazırda model bu müdaxilələri nəzərə almır.

Birlikdə, ətraf mühit və müdaxilə mülahizələri, alətin azalma hallarına təsir edən əsas amillərə həssas olmasının qarşısını alır. Bu amillərə daha həssas olan modellər yaratmaq üçün yuxarıda göstərildiyi kimi verilənlər bazasını artırmalıyıq. Bu amilləri nəzərə alsaq, ən azı 20% bir səhv həddini mühafizəkar olaraq qiymətləndiririk. Bu, ən yaxşı proqnozumuzun səhv nisbətindən və bir artım yayılması monitorinq veb saytında (https://outbreak.sgcharts.com/) illik tendensiyaları müşahidə etməklə hesablanır. Əlavə məlumatların daha yüksək dərəcədə daha yaxşı olması ilə daha yaxşı proqnozlar mümkündür.

Reflilər

Ətraf mühitin proqnozlaşdırılması modellərinin yaradılması çətin məsələdir. Əsas problemlərimizdən biri də uyğun və yaxşı sənədləşdirilmiş xüsusiyyətləri müəyyənləşdirmək idi. Proqnozlarımız üçün böyük RMSE gördüyümüzdə kədərləndi, ancaq işlərin dəqiq sayını təxmin etmədən bu modellərin faydalı ola biləcəyini öyrənmək vacib idi.

Onları qurduğumuz hər bir modelin təşkili və təhlilinin vacibliyini də dərk etdik. Dəfələrlə dəfələrlə, itkilərimizin niyə bu qədər aşağı (və ya yüksək) olduğunu başa düşmədən yanlış yola getdik. Ümid edirik ki, başqaları təcrübələrimizi qura biləcəklər ki, tezliklə güclü bir proqnoz verici olacaq.

Nəticələr

Deng proqnozlaşdırılması bir neçə amil ilə mürəkkəb bir məsələdir. İstifadə etdiyimiz məlumatlara əsasən, 91.5 (XGB) RMSE ilə 8 həftə davam edəcək bir proqnoz hazırlaya bildik. Mövcud model, NEA-ya Sinqapur üçün ən yaxşı şəkildə xidmət edə biləcək planlama qərarları, məsələn, ağcaqanad nəzarətinə nə zaman aqressiv və ya yenilikçi yanaşma lazım olduğu barədə məlumat verə bilər. Risklərdə qeyd edildiyi kimi, ətraf mühit amilləri və müdaxilələr haqqında əlavə düşüncə ilə bu model daha güclü bir yardım ola bilər.

Resurslar

1. Côrtes Da Silveira, LT, Tura, B. & Santos, M. Denge peyvəndinin effektivliyini sistematik şəkildə nəzərdən keçirmək. doi: 10.1186 / s12879–019–4369–5

2. Carrasco, LR et al. Sinqapur xəstəliyinin iqtisadi təsiri və Sinqapurda gələcək peyvənd proqramlarının iqtisadi səmərəliliyi. PLoS Negl. Çək. Dis 5, e1426 (2011).

3. NEA. NEA | Rüblük Denge Nəzarət Məlumatları. NEA Rüblük Dengue Nəzarət Məlumatları (2019). Mövcuddur: https://www.nea.gov.sg/dengue-zika/dengue/quarterly-dengue-surveillance-data. (Giriş: 4 Yanvar 2020)

4. NEA. NEA | Denge davaları. NEA Denge davaları (2019). Mövcuddur: https://www.nea.gov.sg/dengue-zika/dengue/dengue-cases. (Giriş: 4 Yanvar 2020)

5. Ong, J. et al. Random Forest istifadə edərək Sinqapurda denge riskini xəritəçəkdirin. PLoS Negl. Çək. Dis 12, e0006587 (2018).

6. Guzman, MG, Gubler, DJ, Izquierdo, A., Martinez, E. & Halstead, SB Denge infeksiyası. Nat. Rev. Dis. Prim. 2, (2016).

7. Peña-Garcia, VH, Triana-Chaves, O. & Arboleda-Sancchez, S. Kolumbiyanın şəhərlərində Denge keçidinə Temperaturun Təsiri. Ann. Qlobus. Sağal. 83, 509 (2017).

8. Benedum, CM, Seidahmed, OME, Eltahir, EAB & Markuzon, N. Sinqapurda yağış yağışının denge ötürülməsinə təsirinin statistik modelləşdirilməsi. PLoS Negl. Çək. Dis 12, e0006935 (2018).

9. Watts, DM, Burke, DS, Harrison, BA, Whitmire, RE & Nisalak, A. temperaturun Aedes aegypti'nin vektor səmərəliliyinə Denge 2 virusu üçün təsiri. Am. J. Trop. Med. Hyg. 36, 143–152 (1987).

10. Li, CF, Lim, TW, Han, LL & Fang, R. Yağışlar, Aedes aegypti bolluğu və Selangor, Malayziyada denge infeksiyası. Cənub-Şərqi Asiya J. Trop. Med. Xalq Sağlamlığı 16, 560-568 (1985).

11. Alto, BW & Bettinardi, D. Ağcaqanadlarda temperatur və denge virusu infeksiyası: Yetişməmiş və yetkin mərhələlərə müstəqil təsir. Am. J. Trop. Med. Hyg. 88, 497-505 (2013).

12. WHO. Denge ve şiddətli denge. (2019). Mövcuddur: https://www.who.int/news-room/fact-sheets/detail/dengue-and-severe-dengue. (Giriş: 4 Yanvar 2020)

13. Ler, TS et al. 2005 və 2007-ci illərdə Sinqapurdakı denge epidemiyalarının epidemioloji xüsusiyyətləri - oxşarlıqlar və fərqliliklər. Qərb. Sakit okean müşahidəsi. Cavab 2, e1-e1 (2011).

14. Mittal, A. (2019, 12 oktyabr). RNN və LSTM anlamaq. Https://towardsdatascience.com/understanding-rnn-and-lstm-f7cdf6dfc14e saytından əldə edilmişdir.

15. Morde, V. (2019, 8 aprel). XGBoost Alqoritmi: Uzun O Hökmranlıq Edə Bilər! Https://towardsdatascience.com/https-medium-com-vishalmorde-xgboost-algorithm-long-she-may-rein-edd9f99be63d əldə edilmişdir.

16. Rahul_Roy Kodlaşdırma ehtirası olan adi bir uşaq, Rahul_Roy və Kodlaşdırma ehtirası olan adi bir uşaq. (2019, 15 yanvar). Generative Düşmən Şəbəkəsi (GAN). Https://www.geeksforgeeks.org/generative-adversarial-network-gan/ saytından əldə edilmişdir.

17. Uzun qısamüddətli yaddaş. (2019, 28 dekabr). Https://en.wikipedia.org/wiki/Long_short-term_memory#Idea saytından əldə edilmişdir.

18. Geva. (nd). Reqressiya üçün neyron şəbəkələri (1-ci hissə) -Hərəkət və ya fürsət? Https://missinglink.ai/guides/neural-network-concepts/neural-networks-regression-part-1-overkill-opportunity/ saytından əldə edilmişdir.

Əlavə:

  • DNN Reqressiyası

Sinir şəbəkələri reqressiya modellərində azalır - neyron şəbəkəsi hər hansı bir reqressiya modeli kimi görünə bilər. Məsələn, yalnız bir giriş neyronu, bir gizli neyron və bir çıxış neyronu olan bu çox sadə sinir şəbəkəsi, bir logistik reqresə bərabərdir. Bir neçə asılı dəyişən dəyişikliyi = giriş parametrlərini götürür, əmsalları = çəkilərlə çoxaldır və səhv dövrü ilə logistik reqressiya funksiyasına bənzəyən bir sigmoid aktivləşdirmə funksiyası və vahid addım funksiyası ilə çalışır.

https://missinglink.ai/guides/neural-network-concepts/neural-networks-regression-part-1-overkill-opportunity/

Bəzi modellər üçün yer məlumatlarını daxil etdik. Sinqapur boyunca hava stansiyalarının paylanmasının təbiətini, hər stansiya üçün məlumatların mövcudluğunu və məkan aqreqatlarımızı və bunun altındakı amilləri görə bilərsiniz.

(Temperatur məlumatları ilə stansiyaların xəritələrini. Qırmızı sancaqlar 2000-ci ildən etibarən məlumat verən stansiyaları, sarı sancaqlar isə olmayanları tapır.)

2000-ci ildən bəri mövcud olan temperatur məlumatlarına sahib stansiyaların sayının az olması səbəbindən, temperaturun paylanmasına, yerli temperaturun dəyişkənliyinə və dərəcənin ötürülmə ehtimalına, vaxt nişanına və dərəcənin ötürülməsinə təsir edən təhlükə amillərini və dörd stansiyaya birləşdirilmiş temperatur məlumatlarını qiymətləndirdik. , Changi, Seletar və Sembawang) 2000-ci ildən mövcud olan məlumatlarla.

Qiymətləndirmə ədəbiyyatda qeyd olunan bir neçə əsas məqama, məsələn, Aedes aegypti ağcaqanadlarının ehtimal olunan vaxtı, insan trafiki və yerli temperatur dinamikasına təsir edən şəhər və s. Aşağıda qiymətləndirmə parametrlərimizin bir hissəsi göstərilir.

Yağışlar üçün coğrafi yaxınlığa əsaslanan məlumatları topladıq və ortalama məlumat verdik, çünki bu, hər hava stansiyasında yağışın faktiki miqdarını təyin edən ən vacib amildir.

(Fəza yaxınlığına əsaslanan yağış aqreqatları. Bənövşəyi sancaqlar 2000-ci ilə aid məlumatları, mavilər isə olmayanları təmsil edir.)

Modelləşdirmə üçün neyronun hər sonrakı təbəqəsi üçün 1/3 azaldılması ilə bir qatlı, iki qatlı, dörd qatlı qavrayış şəbəkələrinin versiyalarını konfiqurasiya etdik. Göstərilən nəticələrə əsasən, modelin ümumiləşdirməməsi və bəlkə də aşırı olması qənaətinə gəldik. Qatarların geridə qalma nisbəti 3-ə çatdı, bu da davamlı qatar lag (8) ilə müqayisədə daha yaxşıdır; Bununla birlikdə, bir neçə model konfiqurasiyası üçün ardıcıl və ya artan test itkiləri nəzərə alınaraq, domen biliklərinin əsaslandırıcıları əsasında hazırlanmış xüsusiyyətlərin model nəticələrinə az təsir göstərə biləcəyi qənaətinə gəldik.