Šiuo metu vis labiau populiarėjančios dirbtinio intelekto (DI) sistemos yra naudingos ir progresyvios tik tiek, kiek jos gali būti „maitinamos“ nauja ir kokybiška informacija. Tačiau kokybiškos informacijos kiekis yra ribotas ir sistemos susiduria su reikšminga problema – iš kur ir kaip gauti daugiau duomenų, reikalingų dirbtinio intelekto mokymui?
Tekstų ir duomenų gavyba (Text and Data Mining) ir jos reikšmė
Vienas iš efektyviausių DI sistemų mokymo būdų yra tekstų ir duomenų gavyba, kuri Lietuvos autorių ir gretutinių teisių įstatymo apibrėžiama kaip automatizuotas skaitmeninės formos tekstų ir duomenų analizės metodas, kuriuo gaunama informacija.
Tuo tarpu Europos Sąjungos direktyva 2019/790, geriau žinoma kaip direktyva dėl autorių teisių skaitmeninėje rinkoje (DSM direktyva) tekstų ir duomenų gavybą apibrėžia kaip bet kokį automatizuotą analitinį metodą, kuriuo siekiama analizuoti skaitmeninės formos tekstą ir duomenis, kad būtų gauta informacijos, kuri apimtų modelius, tendencijas ir koreliacijas, bet ne tik.
Iš esmės tekstų ir duomenų gavyba yra procesas, kurio metu automatinė sistema „duomenų rinkėjas“ (angl. Scraper) renka viešai prieinamus duomenis ir juos analizuoja kad būtų gauta vertingos informacijos apie teksto ir duomenų tarpusavio ryšius, kuriais remiantis dirbtinio intelekto sistema galėtų būti mokoma atlikti tam tikras funkcijas.
Problemiškiausia šios sistemos funkcija yra automatinis duomenų rinkimas, kurio metu viešai prieinami duomenys yra išsaugomi sistemos talpykloje, kadangi į automatiškai išsaugomų duomenų apimtį gali patekti ir autorių teisių saugomi kūriniai.
Tokių kūrinių išsaugojimas ir tolimesnis panaudojimas gali pažeisti ATGTĮ numatytas kūrinio autoriaus teises.
„Opt-out“ principas ir jo taikymo iššūkiai DI kontekste
Kalbant apie DI plėtrą ir didelio duomenų kiekio panaudojimą jam apmokyti, būtina aptarti „opt-out“ (liet. atsisakymo) principą ir jo taikymo iššūkius.
„Opt-out“ principas suteikia autorių teisių turėtojams galimybę drausti kūrinių naudojimą tekstų ir duomenų gavybos tikslais be jų sutikimo. Tokio draudimo išraiškos pavyzdžiu gali būti viena iš populiariausių internete naudojamų priemonių – failas „robots.txt“, kuris automatizuotai sistemai „duomenų rinkėjui“ nurodo, kad tam tikras turinys negali būti indeksuojamas ar analizuojamas tekstų ir duomenų gavybos tikslais. Toks autorių teisių turėtojų draudimas naudoti jų teisėtai prieinamus kūrinius tampa vis svarbesnis DI kontekste, kai DI reikalingi dideli duomenų kiekiai, siekiant pagerinti algoritmų veikimą.
Šis principas autoriams ir kitiems autorių teisių subjektams suteikia galimybę apsaugoti savo turinį nuo automatizuoto naudojimo ir dažniausiai yra išreiškiamas kompiuterio skaitomomis priemonėmis, t. y. tokiomis priemonėmis, kurios automatinei sistemai „duomenų rinkėjui“ yra suprantamos ir, svarbiausia, aptinkamos, pavyzdžiui, techniniai failai, žymos ir kiti.
„Opt-out“ principas yra įtvirtintas ir ATGTĮ. ATGTĮ 22 straipsnio 1 dalis numato, kad be kūrinio autoriaus ar kito autorių teisių subjekto leidimo ir be autorinio atlyginimo leidžiama teisėtai prieinamus kūrinius naudoti tekstų ir duomenų gavybos tikslais. Šiuo atveju kūriniai gali būti naudojami tiek laiko, kiek reikia analizei. Tačiau šis leidimas nėra absoliutus – ATGTĮ 22 straipsnio 2 dalis suteikia autorių teisių subjektams galimybę iš anksto uždrausti jų kūrinių naudojimą tekstų ir duomenų gavybos tikslais.
Taigi, šis principas tampa itin svarbia priemone, padedančia autorių teisių turėtojams išlaikyti savo kūrinių kontrolę net DI, kuriam didelis duomenų prieinamumas yra esminis algoritmų tobulinimo veiksnys, kontekste. Vis dėlto, siekiant užtikrinti autorių teisių apsaugą ir suderinti inovacijų poreikius, būtina toliau plėtoti standartizuotus sprendimus, kurie būtų lengvai atpažįstami ir pritaikomi tiek DI kūrėjams, tiek autorių teisių turėtojams.
Hamburgo teismo sprendimas: autoriaus kūrinių panaudojimo DI apmokyti bylos reikšmė
Nagrinėjant autorių teisių saugomų kūrinių apsaugą DI kontekste, verta paminėti visai šviežią Hamburgo teismo sprendimą byloje dėl teisės naudoti internete viešai prieinamus autorių kūrinius dirbtiniam intelektui apmokyti. Teisme buvo nagrinėjama, ar atsakovė, rinkdama fotografo nuotraukas, pažeidė autorių teises, kai šias nuotraukas panaudojo dirbtinio intelekto įrankiui apmokyti, prieš tai negavusi autoriaus sutikimo.
Atsakovė savo veiksmus grindė Vokietijos Autorių teisių įstatymu, kurio nuostatos įgyvendina jau ankščiau minėtą DSM direktyvą, ir šios direktyvos 3 ir 4 straipsnio nuostatomis, kurios numato išimtis, kaip ir kada tekstų ir duomenų gavyba yra leidžiama be autorių teisių subjekto sutikimo.
Pažymėtina, kad DSM direktyvos 3 straipsnyje numatyta išimtis leidžia mokslinių tyrimų organizacijoms ir kultūros paveldo įstaigoms atlikti teisėtai prieinamų kūrinių ar kitų objektų tekstų ir duomenų gavybą be teisių turėtojų sutikimo, jei tai daroma tik mokslinių tyrimų tikslais. Papildomai DSM direktyvos 4 straipsnis numato išimtį, leidžiančią naudoti teisėtai prieinamus kūrinius ir kitus objektus tekstų ir duomenų gavybos tikslais, nebent teisių turėtojai aiškiai nurodo, jog pasilieka teisę riboti tokį naudojimą. Hamburgo teismas pripažino, kad atsakovės sukurta duomenų bazė buvo mokslinių tyrimų rezultatas, todėl atsakovė galėjo atlikti duomenų gavybą ir naudoti ją DI mokymo tikslais. Ši veikla, anot Hamburgo teismo, atitiko DSM direktyvoje bei nacionaliniuose teisės aktuose nustatytas išimtis, leidžiančias duomenų rinkimą mokslinių tyrimų tikslais.
Visgi šis sprendimas kelia platesnių diskusijų dėl autorių teisių apsaugos dirbtinio intelekto kontekste, kai DI modelių mokymui naudojami autorių teisių saugomi kūriniai. Šis Hamburgo teismo sprendimas dar neatsakė į visus opius klausimus, kylančius iš DI įrankių mokymo ir autorių teisių saugomų kūrinių naudojimo ribų. Taip pat lieka neaišku, ar komerciniai atvejai galėtų būti laikomi teisėtais pagal išimtis, nurodytas tiek DSM direktyvoje, tiek nacionaliniuose įstatymuose, jei būtų remiamasi vien tik natūralios kalbos „opt-out“ sąlygomis. Jei šis klausimas pasieks aukštesnę instanciją, jis gali tapti precedentu kitoms Europos valstybėms, siekiant nustatyti, kaip plačiai DI projektai gali naudotis DSM direktyvoje ir nacionaliniuose įstatymuose įtvirtintomis išimtimis ir kaip aiškiai reikia išreikšti draudimus naudoti autorių teisių saugomus kūrinius DI mokymui.
Autorių teisių saugomų duomenų apsaugos perspektyvos DI amžiuje
Visgi svarbu priminti, kad autorių teisės suteikia kūrinio autoriui išimtines teises, leidžiančias kontroliuoti įvairius veiksmus, susijusius su kūrinio naudojimu, t. y. leisti arba uždrausti ATGTĮ 15 straipsnio 1 dalyje numatytus veiksmus. Tačiau „opt-out“ principu pagrįstas teksto ir duomenų gavybos apribojimas yra naudingas DI kūrėjams, nes jiems suteikiama galimybė naudoti autorių teisių saugomus kūrinius be autoriaus sutikimo, jei šis nėra aiškiai išreiškęs draudimo.
Autoriams tenka pareiga imtis aktyvių veiksmų (kompiuterių sistemoms suprantamu būdu), norint uždrausti jų kūrinių naudojimą teksto ir duomenų gavybos tikslais. Todėl kūrinių autoriams svarbu apsvarstyti, kaip tinkamai išreikšti savo valią, kad jų kūriniai nebūtų naudojami neatlygintinai DI mokymui ir nebūtų įtraukti į DI generuojamus rezultatus.
Parengė advokatų kontoros „Glimstedt“ teisininkė, advokato padėjėja Gabrielė Šapkauskaitė ir teisininkas, advokato padėjėjas Mykolas Pavlovič.