Так працуе распазнаванне твараў. Калаж: Наша Ніва

Так працуе распазнаванне твараў. Калаж: Наша Ніва

Распазнаванне твараў — гэта сапраўдная навука

Раней распазнаваннем твараў займаліся крыміналісты, якія мелі ўласныя методыкі, і рабілася гэта ўручную, што патрабавала шмат часу. На самых ранніх этапах развіцця камп'ютары не маглі распазнаваць твары, бо ім не хапала магутнасці.

Першыя эксперыменты па распазнаванні твараў з дапамогай камп'ютараў у 1960-я праводзіла група даследчыкаў з ЗША на замову спецслужбаў. Мэта была ў тым, каб праверыць, ці можа быць увогуле магчымым камп'ютарнае распазнаванне твараў, якое на той момант ніколі не рэалізоўвалася. Методыка была ў тым, што даследчыкі абазначалі рукамі «апорныя пункты», як нос або скулы, пасля праграма паварочвала здымкі і вылічвала адлегласці між апорнымі пунктамі. Вынік быў станоўчы.

Вудра Уільсан Бледса і Хелен Чан Вульф — частка першай каманды па працы над камп'ютарным распазнаваннем твараў. З імі быў яшчэ Чарльз Бісан, але ягонае фота не захавалася. Фота: chessprogramming.wikispaces.com, Dougfairbairn (wikimedia.org)

Вудра Уільсан Бледса і Хелен Чан Вульф — частка першай каманды па працы над камп'ютарным распазнаваннем твараў. З імі быў яшчэ Чарльз Бісан, але ягонае фота не захавалася. Фота: chessprogramming.wikispaces.com, Dougfairbairn (wikimedia.org)

Такім чынам даследчыкі даказалі, што камп'ютар увогуле здольны да распазнавання твараў (і робіць гэта хутчэй за людзей) і далі штуршок гэтаму кірунку — найперш для мэтаў крыміналістыкі. Але рабілася гэта ўсё яшчэ марудна (апрацоўвалася да 40 фота ў гадзіну) і патрабавала шмат ручной працы.

Толькі на самым пачатку 90-х даследчыкі распрацавалі сістэму, якая дазваляла распазнаваць твары цалкам аўтаматычна, але дакладнасць была далёкай ад ідэалу, ды і твар мусіў быць сфатаграфаваны ў анфас і цалкам нерухома. Сістэмы распазнавання твараў увайшлі ў шырокі ўжытак толькі ў сярэдзіне 2000-х і пры гэтым моцна прасунуліся. Face Recognition Challenge, праведзены ў 2006-м, паказаў, што алгарытмы сталі ў 100 разоў больш дакладнымі з 1995 года — то-бок усяго за дзесяць гадоў.

Нейрасетка можа распазнаваць шмат твараў адначасова — так гэта будзе выглядаць. Фота: Southbank Centre/flickr.com

Нейрасетка можа распазнаваць шмат твараў адначасова — так гэта будзе выглядаць. Фота: Southbank Centre/flickr.com

У 2010-м Facebook паказаў уласную тэхналогію распазнавання твараў, якая аўтаматычна пазначала людзей на фота. А ў 2017-м выйшаў першы ў свеце смартфон, які можна было разблакаваць з дапамогай твару — Apple X з функцыяй Face ID. Кітай яшчэ ў 2006-м пачаў праграму па развіцці тэхналогій распазнавання твараў і збудаваў самую прасунутую сістэму сачэння за сваімі грамадзянамі ў свеце, якая дагэтуль удасканальваецца.

Як гэта працуе цяпер?

Цяпер распазнаванне твараў мае вельмі высокую дакладнасць. Каб гэта зрабіць, спатрэбілася 60 гадоў няспыннай працы і павелічэнне магутнасці камп'ютараў на некалькі парадкаў. Гэтыя сістэмы дагэтуль далёкія ад ідэалу, але працуюць у сотні тысяч разоў лепей, чым на досвітку гэтай навукі.

Распазнаванне твараў робяць сістэмы, як правіла, зробленыя з дапамогай нейрасетак. Прычым не адной нейрасеткі, а некалькіх, аб'яднаных у адну, кожная з якіх выконвае сваю функцыю і перадае інфармацыю далей. Гэта наглядна паказана ў відэа.

Задача першай з нейрасетак — знайсці на фота твары ўвогуле. Яна шукае нейкія ўніверсальныя параметры любога твару чалавека і спрабуе выдзеліць іх унутры выявы.

Прыклад таго, як сетка выдзяляе твар на выяве. Фота: teguhjatipras/pixabay.com

Прыклад таго, як сетка выдзяляе твар на выяве. Фота: teguhjatipras/pixabay.com

Наступная нейрасетка спрабуе зразумець, наколькі «якасныя» гэтыя выявы. У выпадку з тварамі: вельмі груба кажучы, наколькі яны блізкія да «фота чалавека анфас з добрым асвятленнем», бо якраз так бачная максімальная колькасць унікальных параметраў твару. Прыклад добрага фота — здымак на пашпарт ці на візу. Гэта трэба для таго, каб не перадаваць далей зусім няякасныя (фота з нейкага боку ў руху, да прыкладу) або памылкова адшуканыя фота людзей, бо нейрасеткі ўсё ж не зусім дакладныя.

Наступная нейрасетка азначае адмысловыя пункты на фота, якія называюць «антрапаметрычнымі» або «знакавымі». У розных сістэмах розная іх колькасць — звычайна ад 20 да 60 (але бывае і болей). Гэта пункты на элементах твару, якія ў выніку могуць адназначна вылучыць твар сярод іншых з той ці іншай дакладнасцю. 

Адзін з прыкладаў запісу антрапаметрычных пунктаў. Крыніца: Кухараў Г. А., Казіева Н. «Применение цифровой лицевой антропометрии // Научно-технический вестник информационных технологий, механики и оптики» (2019)

Адзін з прыкладаў запісу антрапаметрычных пунктаў. Крыніца: Кухараў Г. А., Казіева Н. «Применение цифровой лицевой антропометрии // Научно-технический вестник информационных технологий, механики и оптики» (2019)

Наступная нейрасетка на аснове выніковай выявы і антрапаметрычных пунктаў фармуе нейкі набор лічбаў, вектар. Гэта набор з соцень лічбаў, якія характарызуюць канкрэтна гэты твар.

У выніку, калі вы загружаеце дзве выявы нейкіх твараў, сістэма фармуе з іх лікі, якія пры параўнанні паказваюць, наколькі гэтыя твары падобныя для алгарытмаў. Вы атрымліваеце значэнне ў адсотках, якое кажа, наколькі, па меркаванні нейрасеткі, вялікая імавернасць таго, што на дзвюх (ці болей) выявах адзін і той жа чалавек. Калі пройдзеная мяжа ў нейкі адсотак, то людзі лічацца аднолькавымі.

Прыклад верыфікацыі фота з дапамогай нейрасеткі з праграмы IAT для Android. Нягледзячы на тое, што паміж фотаздымкамі 50 гадоў, нейрасетка кажа, што на фота адзін і той жа чалавек з імавернасцю 72% — даволі высокі адсотак для неідэальных фота. Крыніцы фота: сайт Лукашэнкі і kremlin.ru

Прыклад верыфікацыі фота з дапамогай нейрасеткі з праграмы IAT для Android. Нягледзячы на тое, што паміж фотаздымкамі 50 гадоў, нейрасетка кажа, што на фота адзін і той жа чалавек з імавернасцю 72% — даволі высокі адсотак для неідэальных фота. Крыніцы фота: сайт Лукашэнкі і kremlin.ru

Такім чынам, з такім дасканалым алгарытмам распазнавання нейрасетцы не важны макіяж або пахудзенне ці атлусценне. Акрамя таго, на вынік ніяк не ўплывае прычоска. Нейрасетка таксама здольная супаставіць твары, калі яны зацемненыя або бачныя не цалкам (да прыкладу, чалавек у акулярах), але тады дакладнасць значна падае. Узрост часам уплывае на падабенства, але алгарытмы ў шмат якіх выпадках здольныя знаходзіць людзей з розніцай у колькі заўгодна гадоў.

Але бываюць і «фальшывыя пазітыўныя» ці «негатыўныя» вынікі. То-бок нейрасеткам нельга давяраць на 100%, дзеля чаго звычайна выкарыстоўваецца шматступеньчатая сістэма праверкі асобы: у ЕС гэта фотафіксацыя і фіксацыя адбіткаў пальцаў пры запыце на атрыманне нейкага дакумента (візы, ДНЖ, новага пашпарта і г. д.).

Тэхналогіі развіваюцца, і неўзабаве будзе магчыма распазнаваць твары людзей нават у выпадку, калі яны зрабілі сабе пластычную аперацыю. Бо на твары ёсць шэраг нязменных рысаў, унікальных для кожнага чалавека (адлегласць паміж вачыма, адлегласць ад вуха да вуха, пераноссе, форма і памер вачэй).

«Кейс Эрыка Клентана»

Але ці дастаткова маскі і акуляраў, каб надзейна схавацца ад распазнавання? Не заўжды. Для гэтага мы раскажам пра адзін адметны выпадак, калі для гэтага не спатрэбілася нават дапамога спецслужбаў. У англамоўных артыкулах гэты выпадак назвалі Eric Clanton case.

Бойкі паміж крайнімі кансерватарамі і актывістамі руху «антыфа» (прадстаўнікі крайне левых, якія вядуць вулічнае супрацьстаянне з крайне правымі) — гэта звыклая справа. Звычайна для гэтага людзі ўзбройваюцца бутафорскімі шчытамі з ДСП і дубінкамі, а таксама надзяваюць на галовы шлемы. Гэта частка своеасаблівага «пратэснага перформансу» ў ЗША, як і пагромы падчас дэманстрацый у Францыі ці Грэцыі. Паліцыя да гэтага таксама гатовая і ведае, што рабіць, але звычайна не ўмешваецца, пакуль справы не набываюць сур'ёзнага характару.

На адной з чарговых дэманстрацый у Берклі 15 красавіка 2017 года, у якой сутыкнуліся крайнія кансерватары і «антыфа» ў ЗША, з'явіўся мужчына, які спадцішка біў людзей цяжкім роварным замком і збягаў. У выніку некалькі чалавек атрымалі траўмы, з іх аднаму спатрэбілася шпіталізацыя. Мужчына быў у масцы і ў акулярах, якія, здавалася б, цалкам баранілі яго ад ідэнтыфікацыі. Але за справу ўзяліся карыстальнікі «ценявога» форуму 4chan: іх абурыла, што гэты чалавек выкарыстоўваў даволі небяспечную зброю супраць бяззбройных людзей і проста збягаў.

Эрык Клентан на дэманстрацыі (па цэнтры ў чорным). Большую частку часу ён быў таксама ў цёмных акулярах. Скрыншот з відэа YouTube/GreatSarcophagus

Эрык Клентан на дэманстрацыі (па цэнтры ў чорным). Большую частку часу ён быў таксама ў цёмных акулярах. Скрыншот з відэа YouTube/GreatSarcophagus

Яны сабралі ўсе магчымыя фота гэтага чалавека, праглядзеўшы сотні здымкаў і відэа відавочцаў. Ім трапіўся вось гэты чалавек, які незадоўга быў ля месца дэманстрацыі і меў падобны заплечнік.

Падазраваны. Скрыншот з відэа «Распознование лиц (face recognition) в OSINT»/CyberYozh

Падазраваны. Скрыншот з відэа «Распознование лиц (face recognition) в OSINT»/CyberYozh

Таксама ў тых, хто шукаў гэтага чалавека, была частка фота, на якой было відаць, што чалавек носіць бараду. Звярнулі ўвагу на ягоныя боты і акуляры. І супаставілі гэта з фота з сацыяльных сетак чалавека, адшукаўшы шэраг супадзенняў.

Працэс супастаўлення «чалавека X», які збіў людзей замком, і падазраванага з папярэдняга фота. Скрыншот з відэа «Распознование лиц (face recognition) в OSINT»/CyberYozh

Працэс супастаўлення «чалавека X», які збіў людзей замком, і падазраванага з папярэдняга фота. Скрыншот з відэа «Распознование лиц (face recognition) в OSINT»/CyberYozh

У выніку ўдалося адшукаць фота, дзе чалавек з фота быў у тых жа ботах, што і на дэманстрацыі, і ў тых жа акулярах. Таксама ў яго барада і такая ж форма твару. Падазраваным аказаўся Эрык Клентан, выкладчык філасофіі ў Diablo Valley College. Пасля гэтага мужчыну арыштавалі і асудзілі на тры гады ўмоўнага тэрміну, а таксама звольнілі з каледжа.

А якія магчымасці ёсць у беларускіх спецслужбаў?

Насамрэч, яны моцна адстаюць ад замежных калег, але сістэма працуе. Па-першае, існуюць «звычайныя» камеры, якія пакуль не падключаныя ні да якой сістэмы аўтаматычнага распазнавання твараў, і іх большасць (у сталіцы такіх, напрыклад, 6 тысяч). Усё ж у параўнанні з Масквой ці Пекінам грошы ў запуск і абслугоўванне сістэмы аўтаматычнага распазнавання твараў укладаюцца малыя (абслугоўванне адной «разумнай» камеры абыходзілася ў 2020-м у 50-60 даляраў штогод). «Простыя» камеры, да прыкладу, ёсць на кожным доме ля пад'ездаў: у іх нізкая якасць відэа, але яны дазваляюць прасачыць шлях падазраванага па нейкай мясцовасці пры правядзенні аператыўна-вышуковых мерапрыемстваў.

Таксама існуе сістэма, якая падтрымлівае аўтаматычнае распазнаванне ўжо вядомых твараў — тое, што часта называюць «сістэмай Kipod», хоць у рэчаіснасці абслугоўвае яе ўжо іншая кампанія, а сайт арыгінальнага «Кіпода» не працуе. Такіх камер у Беларусі, па звестках МУС ад красавіка 2023-га, троху болей за 1100 і ўсе яны ў Мінску, але спецслужбы кажуць, што хацелі б павялічыць іх колькасць у пяць разоў. На 2020 год камеры распазнавалі твары з дакладнасцю 94% і маглі распазнаць да 20 чалавек у кадры, але якая дакладнасць новай сістэмы — незразумела.

Інтэрфейс праграмы Kipod. Скрыншот з відэа «Kipod — Как найти персону по фото с камеры видеонаблюдения»/ YouTube

Інтэрфейс праграмы Kipod. Скрыншот з відэа «Kipod — Как найти персону по фото с камеры видеонаблюдения»/ YouTube

Таксама не да канца зразумела, якія яе рэальныя магчымасці. Дырэктар Synesis, кампаніі, якая абслугоўвала раней Kipod, казаў, што сістэма мела абмежаваныя магчымасці і не магла распазнаваць усіх грамадзянаў Беларусі нават тэарэтычна, бо проста не пацягнула б такі аб'ём звестак пра столькі людзей у такой колькасці пунктаў адначасова. У яе можна загрузіць абмежаваную колькасць асобаў, якіх яна можа адсочваць і ідэнтыфікаваць. У любым разе гэта тысячы або дзясяткі тысячаў чалавек.

Новая сістэма пакуль трымаецца ў таямніцы, і яе магчымасці незразумелыя. Магчыма, распазнаванне для патрэбаў крыміналістыкі дагэтуль робіцца ў ручным рэжыме: бяруцца скрыншоты з камераў, на якіх чалавек «засвяціўся», а спецслужбіст уручную «прабівае» іх па базе АІС «Пашпарт», у якой ёсць фота ўсіх беларусаў. Падобная сістэма ёсць і ў «Кіберпартызанаў».

Але калі чалавек не быў распазнаны аўтаматычна і не засвяціў твар, то яго маршрут пры жаданні могуць адсачыць па розных пунктах. Тады імавернасць паспяховай ідэнтыфікацыі будзе значна вышэйшай.

Якія фоты звычайна выкарыстоўваюць для пошуку пратэстоўцаў? Былы супрацоўнік ГУБАЗіКа Станіслаў Лупаносаў расказваў, што гэта відэа, знятыя ціхарамі, запісы з гарадскіх камер і фота, зробленыя ў РУУС пры затрыманні людзей.

Па яго словах, калі трэба ідэнтыфікаваць чалавека, то стоп-кадр з камеры звяраюць з пашпартнымі фота ці здымкамі ў базе ДАІ.

«Ідэнтыфікацыя ідзе толькі па твары, па адзенні і па паходцы не адбываецца», — апісваў Лупаносаў. 

Разам з тым нядаўна быў суд, на якім жыхарку Жлобіна асудзілі за ўдзел у пратэстах, пазнаўшы па кашулі. Пры аглядзе канфіскаванай у дзяўчыны кашулі і супастаўленні яе з відэафайламі камер відэаназірання суд вызначыў, што якраз у ёй яна была ў той вечар на акцыі пратэсту. Але ў гэтым кейсе наўрад ці кашуля стала першапачатковай зачэпкай.

Каго можа ці не можа распазнаць сістэма?

Сістэма не можа распазнаць чалавека, калі закрытыя антрапаметрычныя пункты на твары. Самы просты варыянт — камплект з маскі, якая цалкам закрывае нос і рот, ці вялікага рэспіратара, кепкі і цёмных акуляраў, якія шчыльна прылягаюць да твару. Таксама гэта можа быць маска на ўвесь твар або балаклава. Важна не змяняць гэтую канструкцыю на працягу ўсяго маршруту пад камерамі і не пераадзявацца там, дзе ёсць камеры.

У заходніх краінах сістэма пошуку радыкальных пратэстоўцаў адна з найбольш адладжаных у свеце. Таму анархісты, адны з самых радыкальных прадстаўнікоў пратэстаў, карыстаюцца тактыкай «Чорнага блоку»: усе яны апранутыя ў цёмнае непрыкметнае адзенне і закрываюць твары. Адшукаць так канкрэтнага чалавека нашмат складаней. На фота пратэсты анархістаў у Бразіліі ў 2013 годзе. Фота: Silvia Izquierdo/Associated Press

У заходніх краінах сістэма пошуку радыкальных пратэстоўцаў адна з найбольш адладжаных у свеце. Таму анархісты, адны з самых радыкальных прадстаўнікоў пратэстаў, карыстаюцца тактыкай «Чорнага блоку»: усе яны апранутыя ў цёмнае непрыкметнае адзенне і закрываюць твары. Адшукаць так канкрэтнага чалавека нашмат складаней. На фота пратэсты анархістаў у Бразіліі ў 2013 годзе. Фота: Silvia Izquierdo/Associated Press

Пры гэтым крыміналісты здольныя выдзеліць пастфактум яшчэ шмат прыкметаў, па якіх можна распазнаць чалавека. Да прыкладу, форма галавы і прычоскі, «пасадка» і колер вачэй, татуіроўкі, «дэвайсы» і аксесуары, паўсядзённае адзенне.

Але нават у самым базавым варыянце на пошук кожнага асобнага чалавека патрабуецца болей часу. І ў натоўпе гэта значна змяншае імавернасць, што чалавека адшукаюць, бо аўтаматычны пошук у такім выпадку не працуе, а шукаць уручную нашмат складаней і даражэй проста фінансава.

Але ж у нашы дні і ў нашай краіне немагчыма хадзіць у масцы пастаянна. Пандэмія скончылася, і кожны чалавек у масцы на вуліцы імгненна прыцягне да сябе ўвагу міліцыі. Дый ніякі чалавек не здольны ідэальна пралічыць размяшчэнне відэакамер ды іншыя, не звязаныя з відэаназіраннем, фактары.

На жаль, рэальнасць такая, што ў таталітарных краінах у эпоху развітога відэаназірання чалавек, на гэты момант жыхар гарадоў, робіцца татальна падкантрольны ўладам, якія здольныя адсочваць кожнае яго перамяшчэнне і амаль кожнае дзеянне ў вулічнай прасторы.

Чытайце таксама:

Месенджары, камеры, жучкі. Як спецслужбы могуць праслухоўваць беларусаў і чаго асцерагацца?

За масквічамі сочаць адразу чатыры алгарытмы распазнавання асоб. Адзін з іх — скандальна вядомы беларускі

Затрымліваюць людзей, у якіх адшукалі фота з пратэстаў у Google Photos. Як абараніць сябе — пакрокавы гайд

Клас
Панылы сорам
Ха-ха
Ого
Сумна
Абуральна

Хочаш падзяліцца важнай інфармацыяй ананімна і канфідэнцыйна?