Заједничко учење између човека и машине

Вадим Тсцхернезки, Моин Наби и Тассило Клеин (МЛ Ресеарцх Берлин)

Ушли смо у нову еру, где доживљавамо стално и снажно побољшање рачунске снаге, складиштења и доступности великих података. Дубоко учење показало се као идеална техника искориштавања ових трендова, успостављајући се као де фацто стандард у супервизираном учењу. Међутим, ова врста учења захтева да се подаци обележе, што углавном подразумева знатне трошкове при прикупљању података. Стога се појављују алтернативне парадигме које омогућују максимализирање потенцијала огромних количина информација на нов и различит начин. У овом посту објављујемо концепт који на колаборативан начин комбинује снагу људи и машина. Али пре него што уђемо у више детаља, започнимо с причом која показује предности овог приступа.

Године 1997., Гарри Каспаров је поражен од суперкомпјутера (Дееп Блуе) у шаховском мечу према прописима турнира. Био је то карактеристичан догађај, где је владајући светски шампион у шаху поражен од машине. Док се Каспаров још опорављао од овог искуства, инспирацију је црпео и из Дееп Блуе-а. Питао се: „Шта ако бих могао да играм против рачунара - са другим рачунаром поред мене - комбинујући наше снаге, људску интуицију плус рачунање машине, људску стратегију, тактику машине, људско искуство, памћење машине?“

Каспарова идеја о сарадњи човека и машине у шаху успешно је реализована 2005. године на рачунарском електронском шаховском турниру на коме су се велемајстови удружили са суперрачуналима. Резултат је био прилично неочекиван: победници су били пар аматерских америчких шахиста који су управљали три обична рачунара истовремено. Чини се да је у овом случају вештина играча да управља рачунаром играла врло важну улогу. Ово поставља питање да ли се таква врста сарадње може користити и за друге задатке. Следећи одломци ће осветлити нове приступе у овом контексту.

Приступи и трендови

Машине као сарадници, не само Алати

Када упоређујете људе и машине, видљиво је да обе стране имају врло јединствене карактеристике и снаге. Људи су сјајни у доношењу интуитивних и креативних одлука на основу свог знања. Рачунари су добри у обради огромних количина података да би се произвеле сажетке значајних информација за добијање нових знања и доношење бољих одлука. Искориштавање синергије ових карактеристичних снага изгледа као природни следећи корак.

Током истраживања, такве комбинације су дубље истражене и постепено доживљавају све већу снагу. Минтз ет ал. Су предложили један приступ. користећи необиљежене податке за побољшање модела издвајања релација путем даљинског надзора. Конкретно, користе базу података засновану на људима да би дизајнирали функцију хеуристичког означавања и уградили је у поступак обуке класификатора. Класификатор је тада у стању да извади узорке високе прецизности за релативно велики број односа. Будући да истраживачи дизајнирају функцију обележавања која приближава понашање означавања људског аннотатора, надзор чини „удаљеним“.

Друга техника коју су развили Ванг ет ал. у области рачунарског вида, побољшава детекцију објеката са необележених слика путем Селф-Супервисед Саминг Мининг. Важан део ове методе заснован је на аутоматском откривању и псеудо-обележавању предлога поузданих региона за побољшање детектора објеката. То се постиже лепљењем ових предлога у различите етикетиране слике ради свеобухватне процене њихових вредности конзистентности у различитим контекстима слике. Иако су ове слике псеудо означене, ефикасно доприносе побољшању тачности откривања и робусности у односу на бучне узорке. На крају, оба описана приступа аутоматски означавају необележене податке и на тај начин смањују количину људског надзора у процесу обуке.

Укључивање људских смерница у активно учење

У поређењу са претходним концептом, где је скуп података проширен машинским обележеним подацима, можемо такође пустити ученика да одабере тешке узорке и тражити од људског тренера да га напише, отуда и име активног учења. Метода се показала високо ефикасном, посебно у ситуацијама са ограниченом доступношћу буџета за обуку узорака - стручњаци се могу фокусирати на захтјевне случајеве док машина преузима већину узорака које је обично лако разрешити.

Да бисте објаснили интуицију која стоји иза активног учења, размислите о једноставном задатку обележавања слика паса с обзиром на пасмине. Почињемо са базним подацима који садрже означене слике паса. Овај скуп података може представљати изазов за обуку на више начина: Садржи углавном слике паса окренутих према камери, чиме би се тренирани модел учинио инваријантним за псе приказане са стране. Такође може да садржи неуравнотежену количину узорака за сваку расу. Или може садржавати сличне пасмине попут белгијског малиноиса и немачког овчара. У таквим случајевима и људима и машинама требаће више примера сваке пасмине да би научили правилно класификовати псе. Активно учење помаже у решавању оваквих проблема.

Замислите да бисмо могли да постигнемо тачност од 80% са моделом обученим на одређеном базном скупу података. Добивамо буџет за обележавање до 100 нових слика од 1000 необележених и циљ нам је да мудро користимо овај буџет, јер је стручна подршка за обележавање скупа. Стога, умјесто да одаберемо 100 узорака насумично, радије бисмо дозволили нашем машинском учењу да изабере најтеже узорке или оне који најбоље обухватају основну дистрибуцију података и минимизирају сувишност. Омогућили смо да модел предложи тих 100 узорака стручњаку за етикетирање, за који ће он доделити етикете са мало поуздања или велике несигурности. На овај начин се тачност нашег машинског ученика може повећати на 95% након обуке уместо на 90% у подешавањима где су коришћени насумично обележени узорци. Алтернативно, могли бисмо једноставно смањити количину обележених података и, према томе, обучити модел са истим 90% тачношћу али са мање трошкова.

Адверсарни тренинг: Комбиновање најбољег од оба

За комбиновање активног учења и постепеног побољшања аутоматског означавања потребан нам је машински ученик који се састоји од два модела. Прво, дискриминирајући модел мерења несигурности у погледу тачности предвиђања за дате узорке (активно учење) и друго, генеративни модел за предвиђање псеудо-основне истине за узорке (аутоматско обележавање). Да бисмо повећали ефикасност обуке ученика, циљ нам је заједничка оптимизација оба модела путем адверсарног тренинга. На овај начин, дискриминирајући модел се такође може користити за постављање несигурности предвиђањима генеративног модела и заузврат повећати тачност предвиђања. Врхунски модел који је стекао снажан углед у истраживачкој заједници и испуњава наведене захтеве зове се Генеративе Адверсариал Нетворк (ГАН).

Човјечко-машинско заједничко учење са ГАН-овима

Узимајући у обзир оквир приказан на горњој слици, прво користимо генератор (Г) за предвиђање псеудо-основне истине за податке без напомена. Пошто је дискриминатор (Д) у стању да додели не само нејасноће реалној основној истини већ и ону коју је предвидио Г, необележене узорке можемо сортирати по потешкоћи или несигурности Д. Дефинишемо узорке чија дистрибуција није у потпуности заробљена у модел још увек као тежак и нека је Д предложи људском коментатору. Остале једноставне узорке са малом несигурношћу користимо за израду аутоматски напоменутих података са Г. Људско водство резултира јачим Д који је прилагођен захтевима задатка који одреди наставник (активно учење). Заузврат, побољшани Д ће гурнути Г да предвиди псеудо основну истину вишег квалитета (аутоматска напомена). Због овог итеративног побољшања, ГАН представљају природни оквир за комбиновање људи и машина у један заједнички оптимизирани поступак обуке.

Иако је научна фантастика препуна машина и робота који прете човечанству и стварају атмосферу сумње, концепт људског колаборативног учења уз контрадикторну обуку показује како машине могу с разлогом да допуњују наш рад и живот на позитиван начин. Заправо, описани приступ има снажан потенцијал да трансформише мноштво апликација, на пример, у здравственом сектору. Нарочито, наш тим тренутно развија приступ за сегментацију 3Д кардиоваскуларне магнетне резонанце (МР), што је важан предуслов за стварање модела специфичних за пацијента и тако за лечење сложених срчаних болести. Наш циљ је створити модел који учи из самостално генерисаних сегментација и активно предлаже тешке МР слике стручњацима за ручну сегментацију. Ово би могло значајно смањити трошкове и време утрошено на овај сложени поступак, тако да радиолози могу посветити више времена нези пацијената. Иако овај конкретни пример лепо показује позитиван утицај концепта на друштво, постоји мноштво примена изван здравственог сектора које ће имати користи од резултата истраживања у овој области.

Погледајте цјелокупни истраживачки рад за МИДЛ 2019 овдје: Семантичка сегментација која се води неизвјесношћу кроз колаборативно учење између човјека и машине