(NE)TIKRA MUZIKA: KIEK DIRBTINIO INTELEKTO SKAMBA MŪSŲ AUSYSE?
JURGIS KUBILIUS
Buvo nykus ruduo, o gal toks pats pilkas pavasaris, kai maždaug 2019 m. per elektroninės muzikos paskaitą Lukiškių aikštėje stovinčiuose Lietuvos muzikos ir teatro akademijos rūmuose žymus lietuvių kompozitorius mums pristatinėjo dirbtinio intelekto (DI) galimybes kurti muziką. Daug kas tada atrodė arba kaip iš mokslinės fantastikos srities, arba kažkas, kuo domisi tik studijose užsidarę kompozitoriai moksliukai. Tačiau vienas DI garso takelis įstrigo atmintin: dėstytojas paprašė sukurti maždaug minutės trukmės melodiją – lėto tempo, ramią, grojamą trimitu. „Čia kaip žiauriai prasta porno muzika“, – tai, kas suskambo iš kolonėlių, taikliai apibūdino bendrakursis.
Tas interneto platybėse išspjautas takelis anuomet man buvo įrodymas, kad DI muzikoje žengia pirmuosius kreivus žingsnius. Tačiau šiandien, kai akyse raibuliuoja vis daugiau DI sugeneruotų vaizdų (ir šį tekstą lydi DI sukurta promtografija), tik retkarčiais susimąstau, kiek iš tiesų DI sukurto garso keliauja pro mano ausų būgnelį. Kaip atsiranda tokia muzika? Ar etiška naudoti DI kūryboje? Galų gale, ar tikrai, net baigęs muzikos mokslus, galiu atskirti, kas sukurta žmogaus, o kas – dirbtiniais neuronų tinklais?
Faktų žinojimas nėra tas pats, kas gebėjimas spręsti ir išmintingai vertinti. Tačiau ir pažintinis žvilgsnis į DI plėtrą muzikoje gali atverti erdvę stabtelėjimui ir klausimams, kuriuos šiame amžiuje teks užduoti vis dažniau.
MUZIKA, PAVERSTA SKAIČIAIS: KAIP SU DI EINAMA OBUOLIAUTI
Supaprastintai kalbant (teatleidžia kolegos ir specialistai), DI yra matematinių funkcijų (skaičių ir lygčių) rinkinys, kuris suvestus duomenis (angl. input) paverčia tam tikru rezultatu (angl. output). Tai vadinama dirbtinių neuronų tinklu (angl. neuroweb). Skirtingi tokių neurotinklų, profesiniu žargonu vadinamų juodosiomis dėžėmis, gamintojai iš esmės siūlo vieną ir tą patį – mašiną, kuri jūsų užklausą pavers būtent jūsų pageidaujamu rezultatu ir kuri gali prisiminti ir panaudoti žmogui neaprėpiamus informacijos kiekius.
Kad juodoji dėžė veiktų, reikia ją ištreniruoti – taip, kaip mokome vaikus, įvardydami daiktus: „štai čia yra traukinys, o čia – tramvajus“; „šito negalima, karštas, šito irgi ne, nes aštrus“. Perpratęs medžiagą, neurotinklas gali atskirti panašumus tarp objektų (pavyzdžiui, kad ir traukinys, ir tramvajus rieda bėgiais), sujungti juos ar analizuoti sandarą. Toks procesas veikia daugumoje DI modelių.
Kol kas nėra taip plačiai paplitusių neuroninių tinklų, kurie muziką generuotų tiesiai iš simboliais užrašytų ar MIDI natų (retas yra girdėjęs apie „Google“ Magenta ar „OpenAI“ MuseNet). Todėl dažnai tenka užsiimti savotišku vertėjavimu. Tarkime, jei turėčiau kelias savaites laisvo laiko ir norėčiau „prigaminti“ kūrinių fortepijonui Mozarto stiliumi, į „ChatGPT“ turėčiau išrašyti visas jo fortepijoninių kūrinių natas teksto (pavyzdžiui, do1, mi1, sol1, pauzė, do2 ir panašiai) arba MIDI natų formatu. Tada šimtus ar net tūkstančius kartų prašyti sugeneruoti kelių minučių takelį, po kiekvieno mėginimo siūlydamas patobulinimus. Idealiu atveju po daugybės bandymų DI turėtų sukurti muziką, kurią nebent visus Mozarto kūrinius atmintinai mokantys ekspertai galėtų atpažinti kaip ne austrų genijaus darbus.
Kur kas dažniau muzikos industrijoje DI pasitelkiamas klausymosi platformose, kaip tai daro „Spotify“. Žinoma, algoritmas pirmiausia atrenka dainas pagal akivaizdžius panašumus (atlikėjai, žanrai, nuotaikos žymos, klausymo sekos dėsningumai). Tačiau kitas etapas, spėjama, yra garso takelio analizė: įrašas sukarpomas tam tikros trukmės dalimis, o šios tiriamos pagal numatytus parametrus. Taip iš bet kokio muzikos takelio galima gauti savotišką jo DNR, kuriame skaitmenimis paversta viskas: tempas ir ritmas, melodiniai pokyčiai, netgi dainoje jungiami stiliai.
Muzikiniai DNR sąveikauja su žodine informacija, kai „Spotify“ groja automatiniu režimu. Kartą, leisdamas neva panašią muziką, algoritmas po filmo apie Džeimsą Bondą muzikos man pasiūlė klasikinę simfoniją ir argentinietišką tango. Ne dėl to, kad rūpintųsi mano skonio lavinimu ar atrastų žanrinių panašumų. Tiesiog DI analizės skaičiai parodė, kad visuose šiuose įrašuose groja gyvas akustinis orkestras. Tad iš esmės „Spotify“ mums siūlo naujo iliuziją – tai, ką tam tikru atžvilgiu jau esame girdėję.
Jei DI nepadeda melomaniškose paieškose, jis labai pasitarnauja, kad muzikos įrašai skambėtų geriau. DI įrankiai šiandien gali padėti ištrinti burnos caksėjimus balso įraše, parinkti žanrui tinkamą garso apskritai ar, tarkim, netiksliai intonuotos violončelininko melodijos išlyginimą (angl. equalization arba EQ) – taip geram garso režisieriui sutaupydami laiko kitoms veikloms arba vakarienei su šeima.
Dar įdomiau DI skaičiai elgiasi su žmogaus balsu. Dirbtinai sugeneruotas balsas šiandien nieko nestebina, tačiau vis dar gali priblokšti, kai sistema atkartoja mūsų pačių tembrą ir intonacijas. Pagarbiai nuščiuvęs klausiausi, kaip bičiulė operos solistė Salomėja Petronytė vieną mano kūrinį perskaitė angliškai, o netrukus „prabilo“ prancūziškai, vokiškai, ukrainietiškai, lenkiškai, itališkai, netgi japonų, brazilų, portugalų ir tarptautine arabų kalbomis – DI klonas galėjo nesunkiai suklaidinti, kad Salomėja kalba visomis šiomis kalbomis tarsi gimtosiomis. Visgi labiau už balso klonavimą mėgstu įrankį, leidžiantį savo įskaitytas tonacijas perkelti kitam balsui. Taip net dvidešimt skirtingų „žmonių“ gali prabilti būtent taip, kaip noriu. Įsivaizduokite, kaip šį įrankį galėtų pritaikyti nacių propagandos ministras Paulas Josephas Goebbelsas…
MENINĖ VERTĖ: AR ATPAŽINTUMĖTE ŽMOGAUS SUKURTĄ ORIGINALĄ?
Lukaszo Twarkowskio spektaklyje ROHTKO žymiojo dailininko padirbinį įsigijusio meno žinovo klausia: „O jūsų jausmai, patirti žiūrint į tą garaže nutepliotą darbą, argi nebuvo tikri?“ Jo žmona keliskart pakartoja: „Nors tai nebuvo tikras Rothko darbas, man jis liko originalu.“
Lietuvos muzikos lauke mėgstama žongliruoti fraze „kūrinio meninė vertė“, bet retas kolega gali paaiškinti, ką ši frazė reiškia konkrečios muzikos atžvilgiu. Diskusija nepasidaro aiškesnė, kai pereiname prie šio klausimo DI kontekste. Techninė kokybė – išradingos, bet natūralios melodijos, tikslus atlikimas ar gera įrašo kokybė – yra tiek objektyviai, tiek subjektyviai pamatuojamas dalykas. Tačiau ar mūsų tikėjimas žmogaus valia ir kūrybiniu protu leistų pavadinti DI sugeneruotą kūrinį meniškai vertingu?
Jei meninę vertę suprantame kaip poveikį, antropocentrinis tikėjimas žmogaus galia griūva prieš faktus. Pastarąjį dešimtmetį atliktas ne vienas tyrimas ar testas, kurių metu siūlyta palyginti tikrus Johanno Sebastiano Bacho choralus su DI falsifikacijomis. (QR Nr. 1) Daugeliu atvejų nustatyta, kad originalų kompozitoriaus kūrinį žmonės atskiria dviem trečdaliais bandymų. Tiesa, tie du trečdaliai spėjimų priklauso muzikologams ir Bacho muziką dažnai grojantiems atlikėjams. Vadinasi, didžiulė tikimybė, kad plačioji publika, susirinkusi į panašų testą-koncertą, dirbtinių neuronų tinklo sukurtą „bachą“ palaikys tikresniu už neprilygstamą originalą. DI modelio „DeepBach“ atliktas daugiau nei 1600 respondentų tyrimas rodo, jog trys ketvirtadaliai įvairaus išsilavinimo klausytojų teisingai atpažindavo tikrus Bacho kūrinius, tačiau net pusė DI sugeneruotus padirbinius laikė originalais.
DI puikiai apnuoginą mūsų įsivaizdavimą, kas yra genialumas, kūrybiškumas, autentika ir meninė vertė. Ar negalime patirti meninio poveikio, savotiško katarsio, išgirdę dirbtinio neuronų tinklo sukurtą nuostabų bažnytinį kūrinį? O gal mūsų jausmai, gimę klausant DI sugeneruotos melodijos, nebuvo tikri? Pastaroji galimybė tikrai masintų Bacho laikų žmogaus kūno tyrinėtojus, o aš ir toliau vaikščiosiu su žibintu po Vilnių, prašydamas, kad kas nors paaiškintų, kas DI amžiaus akivaizdoje iš tiesų yra meninė vertė.
AUTORYSTĖ: KOMPOZITORIAI JUNGIASI Į MATRICĄ
Kai pasineriu į DI keliamų klausimų verpetą, labiausiai intriguojantis atrodo šis: kuriant jis yra įrankis ar bendraautoris? Ar tai ne tas pats, kaip pieštukas, vedžiojantis taškelius ir kotelius penklinėje, kaip notacijos programa, rašanti skaitmenines natas skaitmeniniuose puslapiuose? Atrodytų, įrankis matematinių lygčių pavidalu, ir tiek.
Šį gana kategorišką požiūrį pakeičiau tada, kai išgirdau apie olandų elektroninės muzikos kompozitoriaus Jorrito Tammingaʼos kūrinį, paremtą Vivaldi koncertų smuikui ciklu „Keturi metų laikai“ („vivAldi“). Jis pasakojo, kad barokinės muzikos hitą nusprendė naujai interpretuoti iš klimato kaitos perspektyvos: kaip dėl visuotinio atšilimo maišosi metų laikai, taip ir kūrinyje turėjo susimaišyti panašios muzikinės atkarpos iš skirtingų Vivaldi ciklo dalių.
Panašumų galima atrasti klausant, analizuojant harmoniją ar lyginant melodines linijas. Tačiau pasinaudojęs anksčiau minėta DI galimybe paversti garsus į skaičius, Tamminga atrado net labiausiai išlavintai klausai negirdimų panašumų. Pavyzdžiui, paprašė kompiuterio ieškoti įrašo vietų, kur girdimi staigūs, platūs, pasikartojantys melodiniai motyvai. Taip į paukščių pulką „Pavasario“ dalyje atkeliavo „paukštiškos“ garsų atkarpėlės iš „šaltojo sezono“ Vivaldi originalo dalių. (QR Nr. 2) Be šimtus valandų užtruksiančio įrašų karpymo ir klausymo, niekada nepavyktų rasti vos pusės sekundės „paukščiukų“ originaliose „šaltojo sezono“ dalyse „Ruduo“ ir „Žiema“ – jose Vivaldi neimitavo čiulbesio. Pasitelkdamas DI įžvalgumą, Tamminga ne tik taikliai įgyvendino besimaišančių „Keturių metų laikų“ idėją, bet ir užtikrino, kad laiko liktų ir kitiems darbams.
DI sukurtoje muzikoje žmogiškumo genas neprivalo dingti: juk pats kompozitorius sprendžia, ką ir kaip DI turi analizuoti ir kaip kūrinyje panaudoti analizės rezultatus. Toks kūrybos būdas tikrai nėra naujas. Dar 2007 m. vasarą elektroninės muzikos kūrėjas Murcof (tikrasis vardas Fernando Corona) panaudojo DI, kurdamas muziką Versalio soduose vykusiam šviesos, garso ir fontanų šou. Suradęs Liudviko XIV rūmų kompozitoriaus Jeano-Baptiste’o Lully „Turkų ceremonijos maršą“, Murcof „sumaitino“ jį DI. Šis savo interpretacijoje atskyrė Lully originalo elementus – būgno gaudesį, mažųjų fleitų melodiją, pasikartojantį ritmą – ir sukūrė ambientinę kompoziciją (palyginkite QR Nr. 3 ir Nr. 4).
Vis dėlto, kai įžvalgos, kurių negali suformuluoti žmogus, tampa muziką reikšmingai formuojančiais kūrybiniais sprendimais, pasidaro sunku DI vadinti tik menininko įrankiu. Tai agentas, priimantis kūrybinius sprendimus, faktiškai bendraautoris, kad ir kaip nejauku būtų apie tai pagalvojus. Tai jau įsitvirtinusi praktika ne tik užjūriuose, bet ir Lietuvoje. Pagaugai nuėjo, kai ant „Operomanijos“ prodiuserės Anos Ablamonovos feisbuko sienos pamačiau titulinį naujos operos, sukurtos pagal Mikalojaus Konstantino Čiurlionio idėją ir eskizus, puslapį. Jame surikiuoti autoriai: Mykolas Natalevičius, Mantautas Krukauskas, Arvydas Malcys, DI. Taip ir įsivaizduoju, kaip šie autoriai „susėdę“ svarstė ir ginčijosi, ar Čiurlionis parašytų šį taktą taip, o gal kitaip…
Kanadiečių filosofas Marshallas McLuhanas (1911–1980), tyrinėjęs mediją ir neurotinklus, rašė: „Ratas yra kojos pratęsimas, knyga – akies pratęsimas, rūbas – odos pratęsimas, o elektros grandinė – centrinės nervų sistemos pratęsimas.“ Taip galvojant, DI yra ne tik savarankiškas agentas. Jis – tarsi kompozitorių ir menininkų „protezas“: operos „Jūratė“ autoriai išplėtė savo kūno, negalinčio aprėpti tiek daug informacijos, ribas, o skaitmeninis bendraautoris, priimdamas savus sprendimus, rėmėsi žmonių sukurtomis gairėmis ir, galiausiai, tikrojo Čiurlionio parašytomis natomis.
ETIKA: „MUZIKĄ KURIU, KAI VEIKIA SAULĖS BATERIJOS“
Pagal Lietuvos Respublikos autorių teisių ir gretutinių teisių įstatymą, kūrinį sukūrusiam asmeniui priklauso jo intelektinės teisės. Tad kol DI įrankiai netaps teisiniu subjektu, regis, Lietuvos kompozitorių sąjungos DI sekcija neturėtų įsisteigti. Kita vertus, turinys, kuris naudojamas išmokyti DI (pavyzdžiui, garso įrašai), teisiškai yra autorinė nuosavybė. Didžiuosius duomenis valdančios įmonės, tokios kaip „Nvidia“, „Google“ ir „Meta“, naudoja autorių sugeneruotą turinį, taip iš esmės vogdamos medžiagą. Kelios šalys jau ėmėsi priemonių, ir ne be pilietiškų menininkų postūmio. Britai išleido skambiai pavadintą albumą Is This What We Want? („Ar to mes norime?“), jį sudaro dvylika takelių, kuriuose skamba studijose ar salėse įrašyta tyla. Taip žymūs muzikai, tarp jų ir Maxas Richteris bei Hansas Zimmeris, protestavo prieš Keiro Starmerio vyriausybės planus leisti DI banginiams neatlygintinai naudoti autorių turinį.
Kitas klausimas – kiek materialių resursų, elektros ir vandens aparatūros aušinimiui sunaudojama, generuojant pusantros valandos retrofuturistino DI džiazo vaizdo įrašą „YouTube“? (QR Nr. 5) „ChatGPT“ uoliai išsisukinės nuo atsakymo. Tačiau skirtingi šaltiniai nurodo, jog DI treniravimui vienam kūriniui gali prireikti tiek elektros energijos, kiek keturių asmenų šeima sunaudoja per kelis mėnesius. Faktinių resursų ir duomenų panaudos klausimai ne vieną DI naudojantį kompozitorių privertė persikelti į pusiau analoginį pogrindį: pavyzdžiui, jau minėtasis Tamminga DI kūrybai naudoja tik tada, kai saulėta – taip muzika „pagaminama“ naudojant atsinaujinančią saulės baterijų sugeneruojamą energiją – ir tik su jo paties garso ekspedicijų metu surinkta medžiaga.
Be šių teisinių ir išteklių valdymo klausimų, iškyla filosofinis: kur judame su garso suvidurkinimo globalizacija, kurią skatina DI, iš garsų išvedamas skaitiniu? Juk per porą metų pasidarė saldžiai koktu žiūrėti į tobulai švytinčius DI vaizdus; lygiai taip pat ausys gali pavargti, girdėdamos tobulai sutvarkytas melodijas ar pagal algoritmą parinktas dainas. Toks komfortas galbūt tinka, kai muzikos klausau kaip fono. Bet kai noriu šviežumo, drąsos ir paveikumo, DI tegali mandagiai atsakyti: „Puikus pasirinkimas, sugeneruosiu jums šviežios foninės muzikos, nuostabiai tinkančios skaitant lietuvišką kultūros žurnalą.“
Šių klausimų debesyje man, kaip ir pridera kompozitoriui, norisi svarstyti apie idealią ateitį: kad žymiausių dabarties muzikos kūrėjų smegenys išliks taip, kaip savotiškai buvo išsaugotos amerikiečių kompozitoriaus Alvino Lucierio (1931–2021) ląstelės. Iš legendinio I Am Sitting in a Room („Aš sėdžiu kambaryje“) autoriaus kraujo išaugintos kamieninės ląstelės šių metų pavasarį Vakarų Australijoje „grojo“ siųsdamos impulsus į elektronika valdomus mušamuosius instrumentus. (QR Nr. 6)
Kol kas galimybės padaryti geriausius mūsų menininkus nemirtingais atrodo miglotos, taip pat kaip apie 2019-uosius atrodė internetinių DI platformų gebėjimas kurti kažką daugiau nei porno muzikos parodiją. Tačiau neseniai skaičiau apie dar šios vasaros pradžioje prasidėjusį projektą, kuriame genetikai ir bioinžinieriai bandys sukurti visiškai dirbtinę DNR seką. Neabejoju dėl vieno: bus juokingai baugu, kai po dešimtmečio ar dviejų į „Nemuną“ nuguls gūdžių 2025-ųjų DI muzikos prisiminimai.





