Nädal 7: Kas GPL ja Creative Commons kehtivad AI treeningandmete puhul?

classic Classic list List threaded Threaded
5 messages Options
Reply | Threaded
Open this post in threaded view
|

Nädal 7: Kas GPL ja Creative Commons kehtivad AI treeningandmete puhul?

andpod
Tarkvaralitsentsid nagu GPL ja Creative Commons loodi ajal, mil peamine mure oli koodi kopeerimine ja tuletatud teoste levitamine. Aga kuidas need litsentsid AI-ajastul toimivad?
Näiteks keelemudelid on treenitud tohutul hulgal internetist kraabitud sisul, sh GPL ja CC litsentsiga materjalil. GPL ütleb, et tuletatud teos peab jääma sama litsentsi alla, aga kas AI mudel, mis on GPL-koodist "õppinud", on tuletatud teos? Kas ta peaks olema avatud lähtekoodiga? Ja kui mudel treeniti CC BY-SA sisul, kas väljund peaks samuti kandma BY-SA litsentsi?
Reply | Threaded
Open this post in threaded view
|

Re: Nädal 7: Kas GPL ja Creative Commons kehtivad AI treeningandmete puhul?

egon
See on huvitav küsimus, kuid praegu minu meelest GPL ega Creative Commons ei kandu AI mudelile automaatselt üle ainult seetõttu, et mudel treeniti sellise litsentsiga sisul. Küsimus sõltub pigem sellest, kas treening, mudel või väljund loetakse autoriõiguse mõttes koopiaks või tuletatud teoseks, selle üle käivad ka vist vaidlused ja siiani pole ühest arusaama.  

Mina proovin seda vaadata umbes nii nagu inimestega, AI on lihtsalt kordades kiirem, kuid me ikka proovime AI-ga mingit inimeste tegevust imiteerida. Inimene vaatab elu jooksul tuhandeid maale ja fotosid, õpib stiile, kompositsiooni ja värvikasutust, ning tema tehtud uus pilt ei kuulu automaatselt kõigile neile varasematele autoritele.
Reply | Threaded
Open this post in threaded view
|

Re: Nädal 7: Kas GPL ja Creative Commons kehtivad AI treeningandmete puhul?

janarn
In reply to this post by andpod
See on väga huvitav küsimus ja tekkis kohe kisatus, et mida AI ise sellest asjast arvab ja viskasin selle küsimuse Geminile ette.

Gemini väidab, et ChatGPT (OpenAI) tingimused ütlevad, et loovutab sulle kõik õigused väljundi osas. Claude (Anthropic) võidab sarnast asja ning Github Copilit/Cursor väidab, et sina oled koodi omanik.

Kus juures huvitav oli see, et esimese küsimise peale jättis Gemini ennast välja ja kui aga täpsustavalt küsisin siis viskas juba oluliselt pikema jutu vastu, mis lühidalt kõlab, et kõik on Google kasutustingimustes kirjas ja Gemini abil loodud kood on sinu. Samuti on toob täpsustavalt välja, et kui Gemini poolt loodud koodis on turvaauke siis selle eeest Google ei vastuta, vaid vastutad sina ise.
Reply | Threaded
Open this post in threaded view
|

Re: Nädal 7: Kas GPL ja Creative Commons kehtivad AI treeningandmete puhul?

caraun
In reply to this post by andpod
Ühes 5. nädala blogipostituses arutlesin sarnasel teemal. Minu arvates saab seda vaadata ka sellest küljest, et kas praegused litsentsid on tehniliselt rakendatavad AI kontekstis või ei. GPL mõte on, et tuletatud teos peab jääma litsentside alla, aga AI puhul on ju raske määratleda, mis asi on tuletatud teos, kas see mudel ise või treeningprotsess või midagi muud. Lisaks treeningandmed on ju tohutult suured ja tihti ei ole täpselt teada või dokumenteeritud kõik allikad, see teeb litsentside järgimise keeruliseks. Samas ei saa öelda litsentsid üldse ei peaks kehtima, sellepärast, et siis kaoks autoritel enda igasugune kontroll, pigem ongi probleem selles, et olemasolevad litsentsimudelid ei ole loodud AI jaoks. Nagu enda ühes blogipostituses arutlesin siis endiselt arvan, et AI jaoks oleks vaja täiesti uusi reegleid.
Reply | Threaded
Open this post in threaded view
|

Re: Nädal 7: Kas GPL ja Creative Commons kehtivad AI treeningandmete puhul?

aljons
In reply to this post by andpod
Minu arvates ei sobi need vanad litsentsid, nagu GPL ja Creative Commons, AI ajastusse eriti hästi, kuna need olid loodud täiesti erinevateks olukordadeks. Kui mudel lihtsalt "õpib" GPL-koodist, siis pole see sama mis koodi kopeerimine või muutmine. CC BY-SA puhul on olukord aga erinev, kui järeldus sarnaneb väga konkreetsete allikatega, võib eraldamiskohustus olla põhjendatud.