Mobili versija | Apie | Visos naujienos | RSS | Kontaktai | Paslaugos
 
Jūs esate čia: Pradžia » Visos temos » Technologijos » IT

Dirbtinio intelekto amžiuje prasidės nauja muzikos era: kas tai yra šabloninė muzika ir kokia bus muzika be kompozitoriaus (Video)

2018-11-07 (2) Rekomenduoja   (3) Perskaitymai (460)
    Share

Dirbtinio intelekto pagalbos naudojimas mūsų dienomis palietė ne tik mokslą, bet ir masinę kultūrą. Praeitais metais kino pasaulį apskriejo žinia, jog garsiojo serialo Sostų karai scenarijų kurs ne legendinis rašytojas George Martinas, bet dirbtinis intelektas. Muzikos ir matematikos ryšys visada buvo glaudus, nes fundamentaliai žiūrint, vien muzikos garso organizavimo parametrai tokie kaip ritmas, garso aukštis bei garsų santykiai nurodo į matematinį tikslumą.


©pixabay.com | CC0

XX amžiuje gyvenęs graikų tautybės kompozitorius Iannis Xenakis (1922-2001) tiksliųjų mokslų principus perkėlė į savo kūrinius bei paliko visą veikalą muzikos ir tiksliųjų mokslų santykiui tirti (Formalizuota muzika: Mąstymas ir matematika kompozicijoje, 1963). Tačiau gyvenant dirbtinio intelekto amžiuje galime savęs paklausti, ar muzikai reikia tebereikia kompozitoriaus? Ar technologijos jau yra pakankamai pažengusios, jog be mūsų išsikišimo, o tiesiog apdorojusios tam tikro stiliaus ir kiekio muzikos dirbtinis intelektas galėtų kurti tūkstančius valandų muzikos? Į šiuos klausimus bandysiu atsakyti šiame straipsnyje.

Šabloninė muzika, ar tai naujas reiškinys?

Muzikos istorijoje jau yra buvę bandymų organizuoti garsą remiantis tam tikrais algoritmais. Vienas iš tokių pavyzdžių gali būti Markovo grandinės. Markovo grandinės yra atsitiktinis procesas, kuriame ateities būsena priklauso tik nuo vienos praeities būsenos – t. y. muzika yra generuojama įsimenant santykinius sekų dažnius ir generuojant ėminius (angl. Sampling) atitinkančius šį pasiskirstymą.

Markovo grandinės pavyzdys. A, B – būsenos (tai gali būti natos), skaičiai prie rodyklių reiškia perėjimo tikimybę iš būsenos į kitą būseną (arba tą pačią būseną).

Tačiau dauguma bandymų buvo nevykę, muzika skambėdavo pernelyg mechaniškai (ko gero dėl to, jog joks bandymas neturėjo ilgalaikės atminties). Tačiau muzikos generavimo uždaviniui pritaikyti dirbtiniai neuroniniai tinklai sugeba kurti sudėtingesnės struktūros muziką. Šabloninė muzika nuo kitos muzikos žanrų/formų skiriasi tuo, jog ji nereikalauja žmogaus išsikišimo, o tik pavyzdžių (medžiagos), kurių pagrindu remiantis dirbtiniai neuroniniai tinklai kuria muziką.

Kaip tai veikia?

Dirbtiniai neuroniniai tinklai yra matematinės funkcijos/algoritmai, kurie buvo įkvėpti biologinių neuroninių tinklų. RNN (liet. Rekurentiniai neuroniniai tinklai) yra dirbtinių neuroninių tinklų tipas, skirtas modeliuoti sekas (pvz. garsų sekos, tekstas ir kt.). Šie tinklai yra taikomi apdoroti sekų (laiko, ar kitokią) informaciją ir generuoti naujas sekas. RNN veikimo principas pagrįstas įsimenama informacija tarp laiko eilutės žingsnių, kas yra ypač svarbu modeliuojant muzikines sekas, kuriose būsimi įvykiai priklauso nuo anksčiau buvusių įvykių, dėl to rekurentinis neuroninis tinklas gali atkurti pavyzdinę garsų seką, kuri turi tokią pačią laiko eilutės struktūrą (šablonai, motyvai).

LSTM neuroniniai tinklai

Tačiau paprastas RNN tinklas pasižymi prasta ilgalaike atmintimi, todėl buvo sukurta patobulinta RNN architektūra – LSTM (angl. Long-short term memory). Trumpos-ilgos atminties tinklas tai rekurentinis tinklas (RNN) naudojantis papildomą grįžtamąjį ryšį (atminties celes c(t)), siekiant geriau išsaugoti ("atsiminti") paskutinius periodo įėjimo signalus.

Paprastojo RNN tinklo schema. Schemoje nurodytos šios reikšmės: x – įvesties duomenys (pvz. natų seka), y – išvesties duomenys (pvz. natų seka), a – aktyvacijos vektorius (tinklo įvestys paveiktos netiesinės funkcijos – dažniausiai hiperbolinio tangento). Netiesinės funkcijos leidžia tinklui išmokti netiesinius įvesties – išvesties sąryšius.

Rekuretiniai neuroniniai tinklai yra gan universalūs, tad juos galima pritaikyti ir muzikoje. Jūsų dėmesiui, vaizdo įrašas, kuriame RNN sukuria  Bacho stiliaus muziką remiantis dvejomis kompozicijomis iš Johanno Sebastiano Bacho (1685-1950) klavyro kūrinių (BWV 772-994):

Visai taip, kaip ir nurodyta schemoje, RNN gavo du pavyzdžius, iš kurių atliekant matematines procedūros kartojimus (interacijas) buvo judama link galutinio rezultato. Po 15000 interacijų gautas rezultatas yra neblogas, tai rodo, jog šabloninė muzika išties turi puikų potencialą tapti naujos rūšies muzika.

Įsivaizduokite, jog kažkada apsilankę Spotify galėsite nurodyti kokios tiksliai muzikos norite gauti (25% Pink Floyd ir 75% Jefferson Airplane).

Douglas Eck ir Jürgen Schmidhuberio tyrime A First look at music composition using LSTM Recurrent Neural networks paaiškėjo, jog naudojant RNN potencialiai įmanoma kurti begalinę bliuzo muziką. Iš kitos pusės turime pripažinti faktą, jog duomenys t. y. muzika sukurta iki dabar išsisems, jei nebus tų, kurie plėstų muzikinę medžiagą, iš kurios RNN gebėtų kurti muziką.  

Taip pat kyla klausimas, ar dirbtinis neuroninis tinklas sugebėtų kurti ne instrumentinę, bet didelės apimties muzikos kūrinį (tarkime operą), nes tokiam kūriniui reikia sukurti tekstus, kurie byloja apie tam tikrus vaizdinius bei apie tam tikrą idėją. Šalia to, RNN vis dar (tai tik laiko klausimas) kada galės remtis muzikos teorija ir tokiu būdu dar kokybiškiau kurti tam tikro stiliaus šablonus. Ši spraga girdima RNN sukurtoje Bacho stiliaus muzikoje, todėl būtų nesąžininga teigti, jog interacijų rezultatas yra puikus arba geras.

Tačiau vilties teikia LSTM sistema. Minėtame eksperimente tapo aišku, jog kad LSTM sėkmingai išmoko bliuzo muzikos formą ir autorių žodžiais sakant sugeba kurti naujus (ir mes tikime malonias) melodijas tokiu stiliumi. Nepaprasta ir tai, kad tinklas surado atitinkamą struktūrą, jis nenukrypsta nuo jo: LSTM sugeba groti bliuzą su geru laiku ir tinkama struktūra tol, kol kažkas nori to klausytis. Tai reiškia, jog LSTM sistema sugeba kurti neribotą kiekį muzikos.

Kaip vyksta muzikos komponavimas naudojant LSTM galite pamatyti žemiau esančiame video:

Vienas iš svarbiausių dalykų, kuris paaiškėjo šiame eksperimente yra tai, jog LSTM sugebėjo perprasti duotų bliuzo akordų sandarą ir tokiu būdu juos varijuoti. Turint omenyje kokiu greičiu technologijos žengia į priekį, yra didelė tikimybė, jog sąlyginai greitai nebeturėsime dilemos ieškant naujos mėgstamiausios muzikos, o užteks tiesiog pasirinkti mėgstamus šablonus ir mėgautis nauja muzika be grupės ar kompozitoriaus.


Šaltiniai:

  1. https://www.15min.lt/mokslasit/straipsnis/technologijos/nauja-sostu-zaidimo-sezono-scenariju-kuria-dirbtinis-intelektas-646-847042
  2. Eck, Douglas; Schmidhuben, Jürger A First look at Music Composition using LSTM Recurrent Neural Networks IDSIA, Šveicarija.
  3. Computational Intelligence in Music, Sound, Art and Design (Sud. Anikó Ekart), Šveicarija, Springer  p. 164.
  4. Dovydaitis, Laurynas; Rudžionis, Vytautas Diktoriaus identifikavimo tikslumo tyrimas naudojant neuroninius tinklus, Straipsnio ID: mla.2018.3464
  5. Computational Intelligence in Music, Sound, Art and Design (Sud. Anikó Ekart), Šveicarija, Springer  p. 163.
  6. A First look at Music Composition using LSTM Recurrent Neural Networks p.3
Verta skaityti! Verta skaityti!
(3)
Neverta skaityti!
(0)
Reitingas
(3)
Komentarai (2)
Komentuoti gali tik registruoti vartotojai
Kiti tekstai, kuriuos parašė Justas Stankevičius
Naujausi įrašai

Įdomiausi

Paros
47(9)
29(0)
26(5)
24(0)
19(9)
17(1)
16(0)
15(0)
Savaitės
184(3)
133(13)
65(4)
65(1)
Mėnesio
184(28)
142(55)
111(35)
100(13)
97(5)