Ivars Neiders

Geju vaibsti mākslīgajā intelektā

Jauns MI (mākslīgais intelekts) pēc jūsu fotogrāfijas spēj noteikt, vai jūs esat gejs. Kāda iepazīšanās portāla algoritms spēja noskaidrot cilvēku seksuālo orientāciju ar precizitāti līdz pat 91%, tādējādi liekot uzdot sarežģītus ētiskus jautājumus.

The Guardian, 7. septembrī



Ik gadu pasaulē zinātniskajos žurnālos publicē gandrīz pusotru miljonu rakstu. Lielākā daļa, protams, neizpelnās nekādu plašākas publikas uzmanību. Tie arī nav tam domāti. Bet šos sacerējumus nelasa arī paši akadēmiķi. Pēc nesen veiktām aplēsēm recenzējamos akadēmiskās periodikas izdevumos publicētu rakstu no sākuma līdz beigām vidēji izlasa vien 10 cilvēku. Tomēr ne visu publikāciju liktenis ir tik nožēlojams. Piemēram, Stanforda Universitātes pētnieku Mihala Košiņska un Jilana Vanga raksts, uz kuru atsaucas
The Guardian, sacēla vērā ņemamu vētru medijos vēl pirms tā publicēšanas. Par žurnālam Personality and Social Psychology publicēšanai iesniegtā pētījuma rezultātiem plašākai auditorijai pirmais steidza pastāstīt The Economist, kam tūdaļ sekoja publikācijas arī citos medijos. Piemēram, minētais The Guardian jau nākamajā dienā ziņoja: “Jauns pētījums ļauj secināt, ka mašīnām ir daudz spēcīgāks “geju radars” nekā cilvēkiem. Izmantojot sejas fotoattēlu, mākslīgais intelekts spēj precīzi noteikt, vai cilvēks ir vai nav gejs.” Līdzīgi reaģēja arī Newsweek: “Tagad mākslīgais intelekts var pateikt, vai jūs esat gejs, vienkārši analizējot jūsu sejas fotogrāfiju.” Neilgi pēc šo ziņu parādīšanās ASV lielākā LGBTQ tiesību aizsardzības organizācija Human Rights Campaign (HRC) un GLAAD – nevalstiska organizācija, kas aizstāv LGBTQ medijus, – nāca klajā ar kopīgu paziņojumu, kurā nosodīja pētījumu kā nezinātnisku un bīstamu. Paziņojuma autori norāda uz, viņuprāt, vairākiem pētījuma trūkumiem (tas neesot recenzēts, izmantoti tikai baltādainu cilvēku attēli utt.) un aicina citus medijus, kas grasās atspoguļot pētījuma rezultātus, pievērst uzmanību norādītajiem trūkumiem. Paziņojumā arī Stanforda Universitāte aicināta norobežoties no tik zemas kvalitātes zinātnes. Kā jau šādos gadījumos pienākas, pētījuma autoru e-pasta kontos parādījās nosodošas vēstules un draudi izrēķināties fiziski. Daudzi arī nekautrējās savu naidu pret pētniekiem paust publiski sociālajos tīklos. Piemēram, amerikāņu arhitekts Tims Veins savā tvitera kontā ierakstīja, ka, lai arī viņš sevi uzskatot par miermīlīgu cilvēku, tomēr par šo pētījumu tā autori būtu pelnījuši, ka viņus sadedzina dzīvus. Pētījuma autori savukārt publiskoja divus paziņojumus, kuros centās izsmeļoši atbildēt uz HRC un GLAAD paziņojumā norādītajiem pārmetumiem un pauda bažas par paziņojuma autoru vājo zinātnes izpratni. Turklāt, ņemot vērā, ka lielākā daļa no HRC un GLAAD izvirzītajiem iebildumiem jau aplūkoti Košiņska un Vanga sākotnējā rakstā, nav īsti skaidrs, vai nosodījuma autori ir īpaši apgrūtinājuši sevi ar paša raksta lasīšanu.

Pirmais jautājums, kas šobrīd noteikti ir uz mēles ikvienam uzmanīgam lasītājam, ir: kā tas nākas, ka latviski rakstošie interneta mediji palaiduši garām tik brīnišķīgu klikšķu vākšanas iespēju? Uz šo jautājumu man atbildes nav, taču, no otras puses, vēl viss nav zaudēts. Tomēr ļaujiet man pievērsties krietni garlaicīgākam jautājumam: ko tad īsti Košiņskis un Vangs pētīja, un ko īsti nozīmē viņu pētījuma rezultāti?

Pētījuma galvenais secinājums ir formulēts jau raksta nosaukumā – “Dziļie neirālie tīkli seksuālo orientāciju pēc sejas attēla nosaka precīzāk par cilvēkiem”. Lai to noskaidrotu, Košiņskis un Vangs izmantoja attēlus no kāda populāra ASV iepazīšanās portāla. Kopumā no portāla tika iegūti 130 741 attēls no 36 630 vīriešu profiliem un 170 360 attēli no 38 593 sieviešu profiliem. Izmantojot sejas atpazīšanas tehnoloģiju, no visas attēlu kopas tika atsijāti nederīgie attēli (kas ir pārāk mazi, neskaidri utt.). Pētījuma vajadzībām palika 35 326 derīgi 14 776 personu attēli. Puse no tiem bija vīrieši un puse – sievietes. Vienādās proporcijās pārstāvēta arī seksuālā orientācija: puse no vīriešiem bija geji un puse – heteroseksuāli, un tas pats arī attiecībā uz sievietēm. Seksuālo orientāciju pētnieki noteica pēc tā, ar kāda dzimuma partneri persona portālā vēlas iepazīties. Tad, izmantojot dziļā neirālā tīkla (deep neural network) programmatūru VGG-Face, ikviena fotoattēlos redzamā seja tika pārvērsta skaitļu virknē, kas pārstāv attiecīgās personas seju. Izmantojot šos datus, tika noskaidrota korelācija starp personas seju un seksuālo orientāciju. Tādējādi tika iegūts klasifikators, kas vīriešu gadījumā spēja noteikt seksuālo orientāciju ar 81% precizitāti. Tas nozīmē, ka 81% gadījumu, kad sistēmai piedāvāja nejauši atlasītu vīriešu attēlu pāri, kurā viens no vīriešiem ir homoseksuāls, bet otrs heteroseksuāls, homoseksuālais vīrietis pareizi tika klasificēts kā tāds, kura varbūtība būt homoseksuālam ir lielāka salīdzinājumā ar otrā attēlā redzamo vīrieti. Attiecībā uz sievietēm rezultāti izrādījās nedaudz pieticīgāki: algoritms sniedza pareizu atbildi 71% gadījumu. Klasifikatora precizitāte būtiski palielinājās līdz ar sistēmai pieejamo vienas personas attēlu skaitu. Tā, piemēram, ja klasifikatoram piedāvā piecus attēlus, tad vīriešu gadījumā precizitāte pieaug līdz 91%, bet sieviešu – līdz 83%. Mākslīgā intelekta uzrādītie rezultāti krietni pārspēj cilvēku spējas līdzīga uzdevuma veikšanā. Cilvēki homoseksuālus vīriešus identificēja tikai 61% gadījumu, bet sievietes – 54% gadījumu, kas ir tikai nedaudz labāk par pilnīgi nejaušu atlasi (nejaušas atlases gadījumā iznākumam būtu jābūt pareizam 50% gadījumu). Pētījums arī parādīja, ka homoseksuālu personu sejām ar lielāku varbūtību piemīt dzimumam netipiskas iezīmes. Piemēram, homoseksuāliem vīriešiem biežāk ir šaurāki žokļi un garāks deguns, bet homoseksuālām sievietēm – lielāki žokļi. Tas, kā norāda pētījuma autori, saskan ar tā saucamo prenatālo hormonu teoriju, kas ir viens no populārākajiem homoseksualitātes zinātniskajiem skaidrojumiem. Saskaņā ar prenatālo hormonu teoriju, homoseksuālo orientāciju ietekmē seksuālās atšķirības nosakošo androgēnu iedarbība uz augli grūtniecības laikā. Tā kā šie paši androgēni atbild par sejas un smadzeņu dzimumdimorfismu, tad teorija paredz, ka homoseksuāli orientētiem indivīdiem būs nosliece uz dzimumam netipisku sejas veidojumu.

Nav šaubu, ka vismaz vienā ziņā The Guardian raksta autoram ir taisnība: Košiņska un Vanga pētījums nudien liek uzdot grūti atbildamus ētiska rakstura jautājumus. Iespējams, pats būtiskākais no tiem varētu būt jautājums par to, kā saglabāt privātumu apstākļos, kad valdību, biznesa kompāniju un citu organizāciju rīcībā ir šāda veida tehnoloģijas, kas, izmantojot publiski pieejamus datus, no mūsu izskata (kā šajā pētījumā) vai no mūsu atstātajām tā saucamajām digitālajām pēdām ar ievērojamu varbūtību ļauj izdarīt secinājumus par lietām, kuras mēs gribētu paturēt pie sevis. Pirms dažiem gadiem Košiņskis jau publicēja pētījumu, kas parādīja, ka vairākas cilvēku iezīmes, piemēram, reliģisko piederību, politiskos uzskatus, seksuālo orientāciju u.c., var visai precīzi paredzēt pēc tā, ko cilvēki “laiko” savos Facebook profilos. Šiem datiem vismaz var liegt pieeju (ko Facebook arī izdarīja 2013. gadā dažas nedēļas pēc tam, kad Košiņska pētījums tika publicēts), bet ko iesākt ar informāciju, ko iespējams izsecināt no mūsu sejām?

Tomēr vismaz divos būtiskos aspektos The Guardian ziņa ir maldinoša. Pirmkārt, nav taisnība, ka Košiņskis un Vangs radījuši kādu jaunu mākslīgā intelekta sistēmu. Pētījumā tika izmantoti instrumenti, kas jau tiek plaši lietoti. Otrkārt, maldinošs ir apgalvojums, ka “mākslīgais intelekts spēj precīzi noteikt, vai cilvēks ir vai nav gejs”. Kopā ar informāciju par 91% precizitāti no The Guardian ziņas daudziem var rasties iespaids, ka runa patiešām ir par kaut ko līdzīgu “geju radaram”, kas vismaz deviņās reizēs no desmit ļauj pēc fotogrāfijas nekļūdīgi noteikt redzamās personas seksuālo orientāciju. Tomēr tas gluži tā nav. Svarīgi saprast, ka klasifikators nepasaka, kurš no, piemēram, 1000 vīriešiem ir gejs. Katram indivīdam sistēma piedēvē varbūtību, ka viņš ir gejs. Tāpat ir jāņem vērā, ka rezultātu precizitāti noteiks tā saucamā sākotnējā varbūtība, ka jebkurš no 1000 vīriešiem ir gejs. Pieņemsim, ka populācijā 7% cilvēku ir homoseksuāli orientēti. Un pieņemsim, ka visi, kas nav homoseksuāli orientēti, ir heteroseksuāli. Tas nozīmē, ka pat tad, ja mēs veiksim nejaušu atlasi, izrādīsies, ka 93% gadījumu mēs būsim precīzi noteikuši, ka persona ir heteroseksuāli orientēta. Šāds augsts precizitātes rādītājs nebūs pamats teikt, ka mums ir ļoti precīzs heteroseksuāļu radars. Mūsu nejaušās izvēles panākumus nosaka augsta sākotnējā varbūtība. Iepretim tam mūsu nejaušais “geju radars” būs pagalam neprecīzs. Ja no 1000 vīriešiem mēs nejauši atlasīsim 100, tad tikai septiņi no tiem būs geji. Košiņska un Vanga pētījums apliecina, ka mākslīgā intelekta izmantošana precizitāti krietni uzlabo, lai gan tas ir saistīts ar noteikta veida kompromisu. Analizējot 1000 indivīdu paraugu (to veidoja 930 heteroseksuāli dalībnieki un 70 homoseksuāli), no 100 indivīdiem, kuriem tika piešķirta augstākā varbūtības pakāpe, ka viņi ir geji, 47 arī izrādījās geji, proti, precizitāte šajā gadījumā ir tikai 47%, kas tomēr ir gandrīz septiņas reizes labāks rādītājs par nejaušu atlasi. Turklāt mums ir daudz – 53 – nepatiesu apstiprinājumu. Tiesa, arī tad, ja klasifikators būtu perfekts, iznākumā tik un tā būtu 30 šādu nepatiesu apstiprinājumu, jo analizējamajā populācijā ir tikai 70 geju. Iznākuma precizitāti var krietni uzlabot, samazinot aplūkojamo paraugu. Tā, piemēram, ja paraugu samazināja līdz 30 indivīdiem, tad izrādījās, ka 23 no tiem ir geji. Salīdzinājumā ar iepriekšējo piemēru precizitāte ir pieaugusi (77%), tomēr ir samazinājusies identificēto geju proporcija (33% pret 68% iepriekšējā gadījumā). Īsumā, klasifikatora precizitāte reālā pielietojumā būs atkarīga no dažādiem citiem faktoriem. Tiesa, klasifikatora precizitāte varētu krietni palielināties, ja tam pievienotu datus par cilvēku digitālajiem pēdu nospiedumiem – ko viņi pērk veikalos, kāda veida saturu patērē dažādajos sociālajos tīklos, kādus pasākumus apmeklē u.tml. Šādā ziņā Košiņska un Vanga pētījums raisa pamatotu satraukumu. Rakstā viņi arī norāda, ka tas arī esot bijis viens no pētījuma mērķiem – parādīt, ka plaši izmantoti mākslīgā intelekta instrumenti jau ir nopietns drauds privātumam. Tikai to apzinoties, var domāt par iespējamajiem problēmas risinājumiem. Vēl, protams, arī jāpatur prātā iespēja, ka Košiņska un Vanga secinājumi var izrādīties aplami. Kā mēdz teikt – laiks rādīs. Tikmēr kaislības ap pašu rakstu kārtējo reizi parādījušas, ka ceļā no akadēmiska žurnāla pie plašākas publikas zinātnieku izteikumiem ir tendence iegūt monstrozus vaibstus.

Raksts no Decembris 2017 žurnāla