Crowd Acting ™: Dərin öyrənmə üçün geniş video məlumat dəstlərini necə genişləndirmək olar

Bu sənəd məlumat toplamağa ənənəvi yanaşmanın məhdudiyyətlərini müzakirə edir və izdihamın istifadəsini, dərin öyrənmə üçün geniş video məlumat dəstlərini genişləndirmək üçün yenilikçi bir yanaşmanı göstərir. Bizim izdiham məlumat bazaları Jester və bir şey-bir şey açıq və akademik məqsədlər üçün pulsuzdur.

Məlumat cari dərin öyrənmə nailiyyətlərinin arxasında yersiz təsirli qüvvədir. Kifayət qədər məlumat olmadan, ən yaxşı aparatla təchiz edilmiş ən mürəkkəb neyron şəbəkəsi də insan səviyyəsində çıxış edə bilməz. Video məlumatları çoxaldıqca, sosial media və vizual cihazların verdiyi müxtəlif videolardan məlumat çıxarmaq və çıxarmaq üçün maşınlara etibar edirik.

GIF 1: Məlumat güclü AI alqoritmləri üçün vacibdir

Nəzarət olunan öyrənmə dərin öyrənmədə ən çox kommersiya uğuru qazanacaq, ancaq məlumat toplama prosesində nöqsan var. Maşınları dünyanı anlamağı öyrətmək üçün uyğun bir video məlumat toplamadığımız zaman, Crowd Acting, əvvəlki töhfələrdən, xüsusən də Hollywooddakı Evlərdə Hollywood və onun Charades məlumat dəsti ilə ilhamlanmış sənaye məlumat toplamasına bir yanaşma hazırladıq (Sigurdsson et al.). İzdihamın təsiriylə video məlumatların əldə edilməsi ilə maraqlanan akademik prosesi uğurla inkişaf etdirdik, nümunə üçün vahid xərclərini azaltdıq və video anlayışını kommersiya baxımından genişləndirə bildik.

Həqiqi video məlumat dəstləri yaratmaq yüksək fürsət xərcləri ilə əlaqələndirilir və çox vaxt və vəsait tələb edir. Bununla birlikdə, video tətbiqetmələr üçün ən böyük sənaye məlumat fabrikini uğurla qurduq və ilk iki real video məlumat toplusu - Jester və bir şey-bir şey yaratdıq və bunu ictimaiyyətə təqdim etdik. Dünya, video qeydləri üçün yeni bir məlumat toplama yanaşmasına ehtiyac duyur və inanırıq ki, izdihamın hərəkəti həll olunur.

Keçmiş: kraudsorsing məlumat toplama

Yüksək keyfiyyətli bir məlumat dəsti, təbii video səhnələri və fərqli etnik qrupların, cinslərin və s. Böyük bir qrup tərəfindən yaradılan dinamik hərəkətləri olan insana yönəlmiş, məntiqi və balanslı bir taksonomiyanı əhatə etməlidir. Hər məlumat nümunəsi minimum etiket səs-küyü və səhvləri ilə sıx şəkildə etiketlənməlidir. Ən əsası, məlumat toplusu real problemlərlə əlaqəli olmalıdır.

Bununla birlikdə, məlumat toplamağa ənənəvi yanaşma yüksək keyfiyyətli dərin öyrənmə məlumat dəstləri yarada bilməz. Kinetics və AVA kimi video qeydlər AI cəmiyyətinə düzgün istiqamətdə əvəzsiz bir töhfə verdi. Lakin, məlumat əldə etmə ənənəvi yanaşmasını tətbiq etdikləri üçün bu məlumat dəstləri video anlayışının bütün potensialından istifadə edə bilməzlər.

Şəkil 1-də göstərildiyi kimi, status-kvo yanaşması dörd istiqamətə yönəldilmiş addımları əhatə edir: taksonomiya, məlumatların çıxarılması, insan qeydləri və təlim.

Şəkil 1: Ənənəvi məlumatların əldə edilməsi yanaşması

Adətən YouTube-dan olan videokliplər çox vaxt qeyri-real və qərəzlidir, müxtəliflik yoxdur və çox yüksək olan hərəkətləri özündə cəmləşdirir. Nümunə götürdükdən sonra düzəliş prosesi yavaş olur və əlavə təhriflərə səbəb olur. Crowdsourcing insan izni mərhələsində baş verir, bu işdə izdiham işçilərinin səylə videoklipləri etiketlədikləri və ardınca yavaş və əl keyfiyyətinə nəzarət edir. Bu addım çox səhvlərə meyllidir və verilənlərin keyfiyyətinə təsir göstərir. Alınma başa çatdıqdan sonra istifadə üçün təlim və taksonomiya arasında heç bir əlaqə yoxdur, çünki taksonomiya və məlumat dəstini düzəltmək çox vaxt aparır. Ümumilikdə məlumat bazasını genişləndirmək üçün bir neçə iş təşəbbüsü mövcuddur və sənaye və məhsul istifadəçilərinə az və ya çox diqqət verilmir.

Tipik kraudsorinq problemləri

Bu ənənəvi məlumatların əldə edilməsi prosesinin nəticəsi balanssız taksonomiya, qeyri-təbii səhnələr, zəif etiketlər, etiket səs-küyü və səhvlər olan qeydlərdir. Daha da pis, məlumatların müxtəlifliyi olmadan AI modelləri ümumiləşdirmələr aparmaqda çətinlik çəkəcək və bu, irqçi AI kimi mənfi hallara yol verə bilər, məsələn, yersiz şəkildə davranır. Ən əsası, bu məlumat dəstləri çox vaxt real problemlərlə əlaqəli deyil.

Məsələn, Google-dan AVA verilənlər bazasında çox balanssız siniflər var (Şəkil 2). AVA-nın 210k etiketinin 87% -dən çoxu dayanma, oturma, danışma, müşahidə (bir nəfər), dinləmə (bir nəfər), daşıma / tutma (bir obyekt) və gəzinti 7 sinifləri ilə əhatə olunur. Bu 7 sinifdən 6.5-i statik hərəkətlərdir.

Şəkil 2: AVA məlumat dəstindəki siniflər və statistika (mənbə: https://arxiv.org/pdf/1705.08421.pdf)

AVA-da bir çox sinif yüksək və zəif qeyd olunur. GIF 2, təsadüfi "Catch (bir obyekt)" kateqoriyasından seçilmiş zəif qeyd edilmiş bir məlumat nümunəsidir: ağ köynəkdəki kişi telefonu asanda, geyimli adam bir qovluğu bağlayır. Ancaq iki fərqli hərəkət üçün yalnız bir etiket var. Bundan əlavə, nümunə yüksəkdir: Bu etiket "tutmaq (bir obyekt)" də "yerə qoyulur (bir obyekt)" ola bilər.

GIF 2: zəif etiket

Digər bir nümunə, 400-dən çox insan fəaliyyət sinifləri olan DeepMinds Kinetics-dir. Bununla birlikdə, ən dəqiq siniflər, fiziki dünya anlayışı ilə əlaqəli olmayan yüksək səviyyəli insan hərəkətləridir, məs. B. mexaniki bir öküz və ya xizəkli it yarışına minmək (GIF 3). Əyləncəli olarkən özünüzə bu təsnifatçıların real iş problemlərinə nə dərəcədə uyğun olduğunu soruşmalısınız.

GIF 3: kinetika üzrə ən yaxşı 3 sinif və mexaniki öküz sürüşü haqqında məlumat nümunəsi

Gələcək: Crowd Acting ™

Ənənəvi yanaşmanın bu məhdudiyyətlərini nəzərə alaraq, uyğun, böyük video yazıları yaratmaq üçün qollarımızı yuvarladıq. Tədqiqatçılar, AI mühəndisləri, tam yığım inkişaf etdiriciləri və məhsul insanları olan həddən artıq çarpaz funksional bir qrup ilə məlumat toplamaq üçün izdihama qarşı fəaliyyət göstərdik. Bu addımla patentli qlobal məlumat platformamızda video qeydlərini geniş miqyasda böyütməyə başlamışıq. Nəticə, sıx etiketli, təbii, insan mərkəzli, müxtəlif və real dünyaya aid yüksək keyfiyyətli video məlumatlardır.

Crowd aktyorluğu dörd addımdan ibarətdir: taksonomiya, izdiham hərəkəti, model təlimi və müştəri testləri. Adi boru kəmərindən fərqli olaraq, izdihamda işləyən boru kəməri daim yaxşılaşan bir döngədir.

Şəkil 3: Crowd Acting ™ məlumatların əldə edilməsi yanaşması

Şəkil 3 göstərir ki, izdiham kütləvi məlumatların yayılması prosesini və şərti yanaşmadan istifadə edən insanlar üçün səhvlərə meylli annotasiya prosesini tərk edir. Bunun əvəzinə, insanlardan məlumat platformamızda verilən etiketləri sınamaq və videolarını mükafat olaraq təqdim etmələri xahiş olunur. Dünyadakı kişilər və qadınlar hərəkətlərini təbii mənzərələri olan çoxsaylı mühitdən məlumat platformamıza yükləyirlər. Buna görə də, yalnız məlumat dəstlərimizdə müxtəliflik əldə etmirik, yəni. H. Daha AI irqçiliyi deyil, həm də izdiham aktyorlarımızın daha səmərəli işləmələrinə kömək edin.

Bu vaxt bizim və digər qeydlər arasındakı fərq, sadəcə məlumat toplamaq əvəzinə qeydləri genişləndirməyimizdir. Bütün məlumatların əldə edilməsi prosesində taksonomiyamızı və məlumat dəstlərimizi təkrar olaraq bir çox geribildirim kanalları ilə təkmilləşdiririk (Şəkil 3). Həm model təhsili, həm də müştəri testləri taksonomiyamızı, məlumat dəstlərimizi və modellərimizi müştərilərimizin problemlərinə daha yaxşı uyğunlaşdırmaq üçün dəyərli məlumatlar verir. Qeydlərimiz böyüdükcə, daha da geniş iş problemlərini həll etmək üçün daha mürəkkəb olurlar. Nəticədə AI modellərimiz müştərilərimizin ehtiyaclarına daha yaxşı uyğunlaşır.

Xülasə, izdihamlı hərəkət aşağıdakı üstünlüklərə malikdir:

  1. Qeydlərin ölçüdə və mürəkkəblikdə böyüdülməsi üçün məlumatların toplanmasını genişləndirmə və nəzarət. Məlumat dəstləri praktikada aktuallıq, keyfiyyətə nəzarət və məlumat mənbələrinin müxtəlifliyinə diqqət yetirməsi üçün böyümə istiqamətini də effektiv şəkildə idarə edə bilərik.
  2. Bizim üçün, izdiham aktyorları və müştərilərimiz üçün rəyin vaxt səmərəliliyi və interaktivliyi. Məlumat toplamaq üçün vaxtın qısaldılması izdiham aktyorlarını daha xoşbəxt edir və qeydlərimizi təkmilləşdirmək üçün daha çevik edir.
  3. Video qeydlərini yenidən darıxdırıcı hala gətirin, çünki yüksək səviyyəli insan hərəkətlərindən fərqli olaraq, maşınlar insan zəkasını əldə etmək üçün cansıxıcı gündəlik hərəkətlər (GIF 4) ilə ümumi mənada öyrənməlidirlər. Bu yaxınlarda nəşr olunan bir məqalə, insan hərəkətlərinin qısa kliplərinin video anlayış modellərini öyrətmək üçün ən təsirli olduğunu təsdiqləyir.
GIF 4: Crowd Acting ™ yüksək keyfiyyətli məlumat dəstləri yaradır

İcma rəhbərliyi

İnsanlar kütlənin hərəkəti üçün vacibdir. Dünyada bir-birini tamamlayan bir qrup və çoxsaylı izdiham aktyoru olmaq imtiyazımız var. İzdihamlı aktyorlarımızı cəlb etmək və saxlamaq üçün daim icma idarəçiliyimizi təkmilləşdiririk və bir sıra vacib fikirlər topladıq:

  1. Etibar. Bir verilənlər bazasını böyütmək üçün cəmiyyətə etibar olmalıdır.
  2. Hörmət edin. İzdihamlı aktyorlar emosiyasız türk deyillər və hörmətə layiqdirlər.
  3. Qidalandırın. Onların etimadını ünsiyyət vasitəsi ilə iştirak etməyə təşviq edirik.
  4. Əks. AI ilə əlaqəli etik məsələlər üzərində düşündük və izdiham işləyir ki, izdiham aktyorları səmərəli işləyə və saatda daha çox qazana bilsinlər.

Özünüzü dünyaya açın

Şəkil 4: Yeni yağ olan məlumatlar silosdadır. (Mənbə: David Parkins & The Economist)

Məlumat bu gün dünyanın ən dəyərli mənbəyidir. Qurulan şirkətlər, adətən siloslarda böyük miqdarda məlumatları bir məkan kimi saxlayırlar (Şəkil 4). Məlumat rəqabət üstünlüyümüzün bir hissəsi olsa da, araşdırmalara köklənmiş bir şirkətik. Sənaye, məlumat mübadiləsindən faydalanacaq, Aİ-nin cəmiyyətimiz üçün potensial faydalarını açmaq üçün zəruri bir addımdır. Buna görə akademik istifadə üçün pulsuz olan Jester və Bir şey-Bir şey qeydlərimizi açırıq. Qeydlərimiz haqqında daha çox məlumatı bu hesabatda tapa bilərsiniz. Ticarət istifadəsi üçün qeydlərimizə lisenziya vermək istəyirsinizsə, bizimlə əlaqə saxlayın.

Çarxı ixtira etməyiniz lazım deyil. Beləliklə, burada və burada məlumat bazalarımıza baş çəkin, məlumatları yükləyin və dərin öyrənməyə başlayın! Daha da yaxşısı, sizi test dəstimizdəki modelinizlə müqayisə edib sıralamamıza qoşulmağınız üçün ürəkdən salamlayırıq.

Oxuduğunuz və ya öyrəndiklərinizi bəyənirsinizsə, mütləq alqışlamalı və bizi izləməlisiniz!