Az OpenAI ellopja az adatainkat? Kié lesz a szöveg, amit a mesterséges intelligenciával létrehozunk? – szakértőt kérdeztünk!

2023. február 03. 10:13

Megkérdeztük a ChatGPT-t, az open ai chatbot azt állította, hogy nem tárolja a felhasználók adatait. Szakértőhöz fordultunk. Összefoglalónk!

2023. február 03. 10:13
null

Veczán Zoltán és Konopás Noémi írása

***

Többször is foglalkoztunk már a Mandineren a Chat GPT-vel. Írtunk arról, hogy a mesterséges szöveggeneráló programok alapjaiban forgathatják fel azt, amit ma az oktatásról és a mesterséges intelligenciáról gondolunk. Utánajártunk annak is, hogy elveheti-e az állásunkat a chatbot, és beszámoltunk arról is, hogy jó néhány iparág eddig megszokott gyakorlatát hogyan alakíthatja át. Alábbi cikkünkben azt járjuk körül, hogy az OpenAI használata milyen adatvédelmi információbiztonsági témákat vet fel. A program használata közben ugyanis a felhasználók megadják a személyes adataikat.

Adódik is a kérdés, hogy hol és a GDPR szempontból helyesen tárolják-e ezeket. Az sem elhanyagolható, hogy kié lesz a felhasználó által kért, de az AI által létrehozott content tulajdonjoga.

Bár a mesterséges intelligencia nem szerepel kifejezetten a GDPR-ben, de az adatvédelmi intézkedések természetesen az új technológiára is érvényesek – olvasható az Európai Parlament GDPR és mesterséges intelligenciával foglalkozó tanulmányában. Az adatbiztonságot elősegítő rendelet nem akadályozza a mesterségesintelligencia-alapú rendszerek fejlesztését. Mint rögzítik, tisztázni kell, hogy melyek azok az ezen az új technológián alapuló alkalmazások, amelyek adatvédelmi szempontból magasabb kockázatot jelentenek, ilyen esetben pedig előzetesen akár adatvédelmi hatóságokat kell bevonni az adatbiztonság érdekében.

Az OpenAI ellopja az adatainkat? A ChatGPT állítja: nem tárol adatokat

Megkérdeztük a Chat GPT-t is, hogy bánik személyes adatainkkal. A chatbot azt állította, hogy nem tárol adatokat.

Mint írja, a felhasználó kérését „szöveges sztringként” dolgozza fel, a választ pedig ugyanilyen módon adja vissza. „A feldolgozás során a modell a képzési adatbázisában található információkat használja fel a válasz generálásához, de az eredeti kérés nem kerül tárolásra, és a modell nem tárolja a felhasználók adatait sem”.

Arra a felvetésünkre, miszerint, ha a szöveggenerátor nem használja a felhasználóval történt beszélgetés adatait, miért írta azt, hogy „ne osszon meg személyes adatokat”, azt a választ kaptuk, hogy a nyelvi modell „nem képes személyes adatokat gyűjteni”. „Ugyanakkor, a tanítási adatbázisa általános interneten található szövegeket tartalmaz”, amiből az következik, hogy előfordulhat, hogy személyes adatokat is tartalmaznak. Ez az oka annak, hogy az OpenAI azt ajánlja, hogy magánéletünk védelme érdekében ne osszunk meg bizalmas információkat és ne is tegyünk fel személyes adatokat tartalmazó kérdéseket.

Kié lesz mindaz, amit a mesterséges intelligenciával létrehozunk?

Arra is kíváncsiak voltunk, mit felel arra a kérdésünkre, hogy kié lesz a felhasználó által kért, de az AI által létrehozott szöveg tulajdonjoga. A válasza nem meglepő: a rendszert fejlesztő OpenAI-é. Tehát,

Vagyis nem csak a személyes adatokhoz fűződő jogok, de a szerzői jogi oldal is lehet problémás. Sőt. Mindenesetre, hogy kicsit tisztábban lássuk a helyzetet, szakértőhöz fordultunk.

Balogh Zsolt György informatikai jogi szakértő, a Budapesti Corvinus Egyetem docense szerint elméletileg tiszta a helyzet, ha az úgynevezett betanító adatbázisba – amely alapján az algoritmus dolgozik, és amiből „ihletet” merít, elemeket használ fel – bekerülő ismeretek, legyen az szöveg, kép, mozgókép vagy hang, szerzői jogi védelem alatt állnak. Ilyenkor a szerzői jog birtokosa jogosult kompenzációra – magyarázza.

Ez más, mint a hagyományos feldolgozás fogalma, amit arra találtak ki, ha valaki például a Harry Potter könyvek alapján készít egy filmet, videójátékot, egyebeket, ahogy történt is. Ha viszont például Harry Potter-könyvek kerülnek ebbe a betanító adatbázisba, sok egyéb szöveggel, például mosóporreklámmal, gyógyszerismertetővel, filmkritikával, és arra instruálják, hogy ezekből hozzon létre valamilyen szöveget, akkor úgynevezett származékos mű jön létre – tudjuk meg a szakértőtől, aki hozzáteszi: itt az a nehézség, hogy roppant bonyolult lenne bizonyítani, mit használt fel, miből mennyit hasznosított.

„Ezért

illetve, hogy mi kerül bele: azért viszont a mesterséges intelligencia fejlesztői felelősek, hogy ne kerüljön bele jogilag kétes anyag”. Vagyis olyan, ami forrásmegjelölést igényelne, vagy egyenesen tiltott a további felhasználása.

Lejárt oltalom vs. szöveggenerátorok, képgenerátorok

A Creative Common többféle licencelést tesz lehetővé, van abból nagyon megengedő és szigorúbb verzió is. A lejárt oltalmú anyagokkal – Shakespeare-rel, Petőfi Sándorral, vagyis aki több, mint 70 éve meghalt – pedig nincs probléma, hiszen szabadon felhasználhatóak, mindegy, hogy élő ember vagy egy algoritmus használja – sorolja Balogh.

Némileg szkeptikusan hozzáteszi: bár ugyanaz a jogi kategória, de persze gyakorlati kérdés is, hogy van-e egy átlagos alkotónak energiája, hogy érvényesítse az érdekeit, mint J. K. Rowlingnak, vagy mint a Mickey Mouse jogait birtokló Walt Disneynek, ahol mindenféle egyéb jogokat, dizájnt, illetve a belőle készült termékek jogait is levédték.

A stílus, noha a köznapi szóhasználatban valóban egy alkotó „védjegye”, a valóságban nem élvez védelmet,

ha Picasso stílusában akar rajzoltatni egy képet az ember, vagy Weöres Sándor stílusában íratni egy verset, megteheti

– megy tovább a kérdésben a jogász. Ha védjegyoltalom – trademark – alatt álló alkotásokból merít „ihletet”, az problémás, sérti a védjegyoltalmat, hiszen ahogyan nem rakhatom ki a Coca-Cola logóját a boltomra a hozzájárulása nélkül, úgy elvileg nem rajzoltathatok Coca-Colás grafikát sem a MidJourneyvel. A felelősség a mesterséges intelligencia betanítójáé.

Hozzáfűzi: a felhasználás igazából akkor ütközik törvénybe, ha a nyilvánosságra hozott mű legalább közvetetten hozzájárul a jövedelemszerzésemhez, vagyis te olvasgathatod a – védett szellemi tulajdonból generált – verset, kinyomtathatod otthon magadnak a generált képet, de ha már a szállodád mottójaként használod, vagy kiakasztod a boltod falára, akkor elméletileg szolgálhatja a jövedelemszerzést vagy jövedelemfokozást számodra – a zene terén például a magyar Artisjus nagyon kemény, lehet, hogy lejárt Vivaldi védettsége, de ettől még, ha például hívásvárakoztatásnál nem a sípszót halljuk, hanem a Tavaszt, azért is elkérnek jogdíjat a telefonos alrendszer üzemeltetőjétől.

Ugyanez igaz, ha nem hasznot termel, csak költséget spórol: nem kell kifizetni a copywriter újságírónak a szöveggyártást, vagy a grafikusnak az elkészült logót. De ebben az esetben is a betanító adatbázis gazdája, vagyis a program gazdája vonható felelősségre, nem a felhasználó – szögezi le Balogh.

Az algoritmus többféle módon tanítható, van az ellenőrzött, a beavatkozás nélküli meg a mélytanulásos módszer is például – kérdés, hogy a most bekerülő adatoknál eleve ellenőrzik-e, hogy biztosan jogtiszta a forrás, vagy

– alapon mindent bedobálnak, amire nincs egyértelmű védelem – mutat rá.

Balogh szerint elképzelhető, hogy valaki kitesz egy idézetet egy frissen megjelent (és egyébként mindenféle védettséget élvező) könyvből a Facebook-oldalára, azt megteheti minden gond nélkül – igen ám, de innen az adatbázis már automatikusan beszívhatja, és elkezdheti felhasználni, amit ugyanakkor nehéz bizonyítani. Ami nem fair, de jogilag egyébként nem problémás, hogy a legálisan, ingyenesen hozzáférhető tartalmakból az algoritmus által kreált tartalmakat viszont levédi például a ChatGTP, nem lehet felhasználni, csak, ha fizet érte az ember.

Persze, mint a jogász taglalja, az is kérdés, hogy milyen bíróságon szerezhet érvényt az ember az igazának: Dragomán egy magyar író, magyar művet használt fel a ChatGTP, de a cég amerikai – a nemzetközi magánjognak vannak erre megoldásai, de esetről esetre változik, az eljárás viszont bonyolult, időigényes és költséges, ezért nem valószínű, hogy tömegével indítanának pert az algoritmus generálta tartalmak miatt. Arról nem is beszélve, hogy eddig úgy-ahogy le tudta utánozni Dragomán stílusát az országban mondjuk száz ember, most viszont, ha kellően tökéletesítik az algoritmust, tízmillió ember írhatja be potenciálisan a ChatGTP-be, hogy „írj egy rövid novellát Dragomán stílusában”, és a program megcsinálja.

 

Nyitóképünk csupán illusztráció! Fotó: Pexels from Pixabay

Összesen 1 komment

A kommentek nem szerkesztett tartalmak, tartalmuk a szerzőjük álláspontját tükrözi. Mielőtt hozzászólna, kérjük, olvassa el a kommentszabályzatot.
Sorrend:
hlaci83
2023. február 03. 12:57
Nem tárolja, észben tartja.
Jelenleg csak a hozzászólások egy kis részét látja. Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!