Adimen artifizial sortzaile

Adimen artifizial sortzailea (AAS) adimen artifizialaren azpimultzo bat da,[1] eta eredu sortzaileak erabiltzen ditu testuak, irudiak, bideoak edo bestelako datu-formak ekoizteko.[2] Eredu horiek, askotan, idatzizko prompt batzuei erantzuten diete.[3][4] AASek euren prestakuntza-modeloen azpian dauden ereduak eta egiturak ikasten dituzte, eta, horri esker, datu berriak sor ditzakete.[5][6]

Bideo hau Ikusgela proiektuaren parte da.
Bideo hau Ikusgela proiektuaren parte da. Bideoak dituzten artikulu guztiak ikus ditzakezu hemen klik eginez gero.
Artea eta Adimen Artifizialaren gaineko bideoa.

Transformadoreetan oinarritutako neurona sare sakoneko hobekuntzek, bereziki hizkuntza-eredu handiek (edo Lengoaia-eredu handiak) LLM[7], AAen sorkuntza-sistemen biderkatzea ahalbidetu zuten 2020ko lehen urteetan.

Besteak beste, ChatGPT, Copilot, Gemini eta LLaMA txatbotak; testu emanez irudiak sortzeko gai diren sistemak (adibidez, Stable Diffusion, Midjourney eta DALL-E); eta, testutik bideora bitarteko AA sortzaileak (adibidez, Sora).[8][9][10] OpenAI, Anthropic, Microsoft, Google eta Baidu bezalako enpresek, baita enpresa txikiago askok ere, AA eredu sortzaileak garatu dituzte.[3][11][12]

AASak industria-mota askotan ditu erabilerak, hala nola softwarearen garapenean, osasunean, finantzetan, entretenimenduan, bezeroarentzako zerbitzuan, salmentetan eta marketinean, artean, idazketan, modan eta produktuen diseinuan.[13][14][15][16][17] Hala ere, AA sortzailearen balizko erabilera bidegabeari buruzko kezkak plazaratu dituzte: besteak beste, ziberkrimena, albiste faltsuak edo deepfakeak erabiltzea pertsonak engainatzeko edo manipulatzeko, eta giza lanpostuen galeran eragina izan dezaketelako.[18][19] Jabetza intelektualaren eskubideari dagokionez ere badira kezkak, egile-eskubideak dituzten artelanetan trebatutako eta emulatutako sorkuntza-ereduen inguruan.[20]

Modalitateak

aldatu
Adimen artifizial sortzailea azaltzen duen bideo laburra (azpitituluak euskaraz).

AAS sistema bat, gainbegiratu gabeko ikasketa automatikoa (adibidez, GANs, VAE, Transformer, ... bezalako neurona-sareen arkitekturak aipatuz) edo autogainbegiratutako ikasketa automatikoa datu-multzo bati aplikatuz eraikitzen da. AA sistema sortzaile baten gaitasunak erabilitako datu-multzoaren modalitate edo motaren araberakoak dira.

AAS unimodala edo multimodala izan daiteke; sistema unimodalek sarrera mota bakarra hartzen dute, eta sistema multimodalek, berriz, sarrera mota bat baino gehiago har dezakete.[21] Adibidez, OpenAI-ren GPT-4ren bertsioak testu- eta irudi-sarrerak onartzen ditu.[22]

Testua

aldatu

Hitzen fitxetan edo hitzetan eratutako AAren sistema sortzaileek GPT-3, GPT-4, GPT-4o, LaMDA, LLaMA, BLOOM, Gemini eta beste batzuk dituzte (ikus Hizkuntza eredu handien zerrenda). Hizkuntza naturala, itzulpen automatikoa eta hizkuntza naturalaren sorkuntza prozesatzeko gai dira, eta beste zeregin batzuetarako oinarrizko eredu gisa erabil daitezke. Datu-multzoak BookCorpus, Wikipedia eta beste batzuk dira.

Lengoaia naturaleko testuaz gain, lengoaia-eredu handiak programazio-lengoaiako testuan trebatu daitezke, eta, horri esker, programa informatiko berrietarako iturburu-kodea sor dezakete. Adibide batzuk OpenAI Kodea dira.

Irudiak

aldatu
 
Sugaar, euskal mitologia Midjournayrekin sortuta.

Kalitate handiko arte bisuala ekoizteko gaitasuna du AASak.[23] Testua ere baduten irudiekin entrenatutako modeloetan oinarritzen diren AAS tresnak dira: Imagen, DALL-E, Midjourney, Adobe Firefly, Stable Diffusion eta abar.

Audioa

aldatu

AASa ere zabal entrenatu daiteke audio-klipetan, hizketaren sintesia soinu naturalarekin eta adierazpen-gaitasunekin sortzeko. Adibidez, ElevenLabs tresnetan edo Meta Platform-en Voicebox-ean.[24]

MusiLM eta MusiGen bezalako AAren sortze-sistemak grabatutako musikaren audio-uhinetan ere trebatu daitezke testu-oharrekin batera, testu-deskribapenetan oinarritutako musika-lagin berriak sortzeko, hala nola biolin-melodia lasaigarri bat, gitarra distortsionatuko riff batek babestua.[25]

Bideoa

aldatu
Sorak sortutako bideoa, Kinabatangan ibaian Borneoko basabizitza azkarra erakusten duena.

Bideo idatzian trebatutako AASak bideoklip koherenteak sor ditzake, zehatzak eta errealistak. Horren adibide dira OpenAIren Sora, Runwayren Gen-1 eta Gen-2, eta Meta Plataformen Make-A-Video.[10][26][27]

Kezkak

aldatu

AASaren garapenak gobernuen, enpresen eta norbanakoen kezkak piztu ditu, eta protestak, ekintza legalak, AAren esperimentuak gelditzeko deiak izan dira. Nazio Batuen Segurtasun Kontseiluaren 2023ko uztaileko informazio-saio batean, António Guterres idazkari nagusiak adierazi zuen "AASak ongirako eta gaizkirako ahalmen izugarria duel eskala handian", AAk "garapen globala azeleratu" dezakeela eta 2030erako $10 eta $15 bilioi bitartean munduko ekonomiari lagundu, baina haren erabilera maltzurrak "heriotza psikologikoa" eragin dezakeela.[28]

Enplegu galerak

aldatu
 
"AA sortzailearen erabileraren inguruko erregulazioa" eskatzen duen manifestari bat.

Adimen artifizialak ordezka ditzakeen lanpostuak kezkatzen dituenak daude. Diseinu grafikoan, adibidez: Ilustratzaileak, maketatzaileak, grafistak… euren lana arriskuan ikusten dute. Makinak fabriketara heldu zireneko mugimendu luddistarekin ere alderatu izan da garapena.[29]

Arraza, kultura gutxitu eta genero alborapena

aldatu

AASak azpiko datuetan dagoen edozein joera kultural islatu eta anplifikatu dezakete. Adibidez, eredu batek aztertutako irudi guztietan medikuak eta epaileak gizonezkoak badira, eta idazkariak edo erizainak emakumezkoak, alborapen horiek komunak badira formakuntza datuetan, emaitzetan ere alborapen hori anplifikatuko da.[30] Era berean, "CEO baten argazkia" testuarekin bultzatutako irudi eredu batek gizonezko CEO zurien irudiak sor litzake, arraza joera duen datu multzo batean trebatuz gero.[31] Zenbait metodo erabili dira alborapenak arintzeko, hala nola sarrerako bulkadak aldatzea eta entrenamenduko datuak berriz kalkulatzea.[32][33]

Hizkuntza gutxiagotuak

aldatu

Adimen artifizial sortzaileak hobe funtzionatzen dute datu-modelo handietan trebatuak izan ondoren. Aztertutako testu eta eduki gehienak hizkuntza hegemonikoetakoak badira, emaitzak ere hobeak izango dira hizkuntza horietarako. Urte gutxitan gero eta emaitza hobea lortu da hizkuntza gutxiagotu batzuetan, hala nola, euskarazko emaitzetan, baina gaur-gaurkoz, oraindik, hizkuntza nagusietako emaitzak dira aurreratuenak.[34]

Deepfakeak

aldatu

Deepfakeak (ikaskuntza sakoneko sormen faltsuak) AAk sortutako bitartekoak dira, pertsona bat irudi edo bideo batean hartzen dute eta beste pertsona baten antzekotasunaz ordezkatzen dituzte sare neuronal artifizialak erabiliz.[35][36] Deepfakesek arreta eta kezka orokorrak piztu dituzte, ospe handiko bideo pornografikoetan, mendeku-pornoetan, albiste faltsuetan, osasun-desinformazioan, finantza-iruzurrean eta atzerriko hauteskundeen interferentzia ezkutatzeko erabiltzen direlako.[37][38][39][40][41][42][43] Horrek industriaren zein gobernuaren erantzunak piztu ditu, erabilera antzeman eta mugatzeko.[44][45]

Ziberdelinkuentzia

aldatu

AASak eduki faltsu errealista sortzeko duen gaitasuna ziberdelinkuentzia mota askotan ustiatu da, phishing iruzurrak barne.[46] Bideoa eta deepfake audioa desinformazioa eta iruzurra sortzeko erabili dituzte.[47] Hizkuntza-eredu handiak eta testuak sortzeko beste AA forma batzuk eskala handikoak izan dira merkataritza elektronikoko webguneetan iruzkin faltsuak sortzeko, produktuen kalifikazioak handitzeko helburuarekin.[48] Iruzurra ardatz duten hizkuntza eredu handiak sortu dituzte zibergaizkileek, besteak beste, Apokalipsia GPT eta Sonora GPT.[49] Bada teknologia honekin segurtasun aukera berriak ere heldu daitezkeela pentsatzen duenik.[50]

Energia eta ingurumena

aldatu

AAS teknologiak eragin handia izan dezake energia kontsumoan eta ingurumen-kalteetan. AASek eragindako energia-beharrak handiak dira, datu-prozesamendu masiboak eta entrenamendu-algoritmo konplexuak eskatzen baititu, sarritan karbono aztarna handia utziz. Horrez gain, energia-iturri fosilak erabiltzen jarraitzeak ingurumenean inpaktu negatiboa du.[51]

Arautu

aldatu

Legediarik gabe garatu da orain arte, eta horrek prozesuen gardentasun falta ekarri du, kutxa beltz izaera izanik bere ezaugarria. [52] Hau da, AASen funtzionamendua askotan ulertzea zaila izan da, batez ere erabakiak hartzeko prozesuetan. Horrek erronka etiko eta juridiko ugari sortu ditu, hala nola diskriminazioa edo pribatutasunaren urraketa. Europan, legeak eta arauak ezartzeko lehen urratsak eman dira, AASen erabilera erregulatzeko eta gardentasuna sustatzeko, adibidez, Europar Batasunaren Adimen Artifizialaren Legea (AI Act) [53]

Zelatatze masiboa

aldatu

Zelatatze masiboaren esparruan arrisku handia dago, batez ere datu pertsonalen bilketa eta erabilera automatizatua dela eta. AASen bidez egindako datuen azterketak pribatutasuna urratzeko arriskua areagotzen du, identitateak, joerak eta jokabideak modu masiboan jarraitu eta prozesatzen direlako. Horrek kontrol soziala, diskriminazioa eta askatasun zibilen murrizketa eragin ditzake, batik bat erregulazio falta dagoen inguruneetan. Beharrezkoa da neurri juridiko eta etiko sendoak ezartzea, teknologiaren erabilera arduratsua bermatzeko.[54]

Edukiaren kalitatea

aldatu

Edukien kalitateari ere kalte egin diezaioke, batez ere entrenamenduan erabiltzen diren datuak kalitate eskasekoak badira. Fenomeno horri datuen okertzea (ingelesez, garbage in, garbage out / zaborra sartu, zaborra atera) esaeraz ezagutzen da, eta datu okerrak edo distortsionatuak erabiltzen direnean, emaitza desegokiak edo kaxkarrak sortzen dira. Horrek AASen fidagarritasuna eta erabilgarritasuna murriztu dezake, eta desinformazioa edo akatsak zabaltzeko arriskua areagotu. Edukien kalitatea bermatzeko, funtsezkoa da datu-iturri sendo eta fidagarriak erabiltzea.[55]

Erabilera okerra kazetaritzan

aldatu

Kazetaritzan kalteak eragin ditzake, batez ere edukien kantitatea kalitatearen gainetik jartzen denean.[56] AA tresnek mezu eta artikulu kopuru handiak sor ditzakete, baina askotan clickbait estrategietan oinarritzen dira edo SEO posizionamendurako zentzurik gabeko edukiak ekoizten dituzte. Horrek desinformazioa eta eduki hutsalak zabaltzea dakar, kazetaritzaren sinesgarritasuna eta kalitate informatiboa murriztuz.[57]

Erreferentziak

aldatu
  1. Arrieta, Xabier. (2023-09-28). «Adimen artifizial sortzailea» Sarean .eus (Noiz kontsultatua: 2024-10-23).
  2. Newsom, Gavin; Weber, Shirley N.. (September 6, 2023). Executive Order N-12-23. Executive Department, State of California.
  3. a b (Ingelesez) Griffith, Erin; Metz, Cade. (2023-01-27). «Anthropic Said to Be Closing In on $300 Million in New A.I. Funding» The New York Times. Aipuaren errorea: Invalid <ref> tag; name "nytimes" defined multiple times with different content
  4. (Ingelesez) Lanxon, Nate; Bass, Dina. (March 10, 2023). «A Cheat Sheet to AI Buzzwords and Their Meanings» Bloomberg News.
  5. (Ingelesez) Pasick, Adam. (2023-03-27). «Artificial Intelligence Glossary: Neural Networks and Other Terms Explained» The New York Times ISSN 0362-4331..
  6. Karpathy, Andrej; Abbeel, Pieter; Brockman, Greg; Chen, Peter; Cheung, Vicki; Duan, Yan; Goodfellow, Ian; Kingma, Durk et al.. (2016-06-16). Generative models. OpenAI.
  7. Igor, Leturia Azkarate. (2023-06-01). «Adimen artifizial sortzailearen booma» Zientzia.eus (Noiz kontsultatua: 2024-10-23).
  8. (Ingelesez) Metz, Cade. (2023-03-14). «OpenAI Plans to Up the Ante in Tech's A.I. Race» The New York Times ISSN 0362-4331..
  9. Roose, Kevin. (2022-10-21). «A Coming-Out Party for Generative A.I., Silicon Valley's New Craze» The New York Times.
  10. a b (Ingelesez) Metz, Cade. (2024-02-15). «OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos» The New York Times ISSN 0362-4331.. Aipuaren errorea: Invalid <ref> tag; name ":4" defined multiple times with different content
  11. (Ingelesez) «The race of the AI labs heats up» The Economist 2023-01-30.
  12. (Ingelesez) Yang, June; Gokturk, Burak. (2023-03-14). Google Cloud brings generative AI to developers, businesses, and governments. .
  13. (Ingelesez) Brynjolfsson, Erik; Li, Danielle; Raymond, Lindsey R.. (April 2023). Generative AI at Work. in: Working Paper Series.  doi:10.3386/w31161..
  14. (Ingelesez) Don't fear an AI-induced jobs apocalypse just yet. The Economist 2023-03-06.
  15. (Ingelesez) Coyle, Jake. (2023-09-27). «In Hollywood writers' battle against AI, humans win (for now)» AP News (Associated Press).
  16. (Ingelesez) Harreis, H.; Koullias, T.; Roberts, Roger. Generative AI: Unlocking the future of fashion. .
  17. (Ingelesez) «How Generative AI Can Augment Human Creativity» Harvard Business Review 2023-06-16 ISSN 0017-8012..
  18. (Ingelesez) Hendrix, Justin. (May 16, 2023). «Transcript: Senate Judiciary Subcommittee Hearing on Oversight of AI» techpolicy.press.
  19. (Ingelesez) Simon, Felix M.; Altay, Sacha; Mercier, Hugo. (2023-10-18). «Misinformation reloaded? Fears about the impact of generative AI on misinformation are overblown» Harvard Kennedy School Misinformation Review  doi:10.37016/mr-2020-127..
  20. (Ingelesez) «New AI systems collide with copyright law» BBC News 2023-08-01.
  21. (Ingelesez) A History of Generative AI: From GAN to GPT-4. 21 March 2023.
  22. (Ingelesez) «Explainer: What is Generative AI, the technology behind OpenAI's ChatGPT?» Reuters March 17, 2023.
  23. (Ingelesez) Epstein, Ziv; Hertzmann, Aaron; Akten, Memo; Farid, Hany; Fjeld, Jessica; Frank, Morgan R.; Groh, Matthew; Herman, Laura et al.. (2023). «Art and the science of generative AI» Science 380 (6650): 1110–1111.  doi:10.1126/science.adh4451. PMID 37319193. Bibcode2023Sci...380.1110E..
  24. (Ingelesez) Desai, Saahil. (2023-07-17). «A Voicebot Just Left Me Speechless» The Atlantic.
  25. (Ingelesez) Dalugdug, Mandy. (August 3, 2023). Meta in June said that it used 20,000 hours of licensed music to train MusicGen, which included 10,000 "high-quality" licensed music tracks. At the time, Meta's researchers outlined in a paper the ethical challenges that they encountered around the development of generative AI models like MusicGen.. .
  26. (Ingelesez) Metz, Cade. (April 4, 2023). «Instant Videos Could Represent the Next Leap in A.I. Technology» The New York Times.
  27. (Ingelesez) Wong, Queenie. (September 29, 2022). Facebook Parent Meta's AI Tool Can Create Artsy Videos From Text. cnet.com.
  28. (Ingelesez) «Secretary-General's remarks to the Security Council on Artificial Intelligence» un.org 18 July 2023.
  29. Greño, Azkune Galparsoro, Gorka Helena Matute. (2019-12-01). «Adimen artifiziala jokoan» Zientzia.eus (Noiz kontsultatua: 2024-10-23).
  30. (Ingelesez) Rachel Gordon. (March 3, 2023). «Large language models are biased. Can logic help save them?» MIT CSAIL.
  31. OpenAI. (2022-07-18). Reducing bias and improving safety in DALL·E 2. OpenAI.
  32. (Ingelesez) Jake Traylor. (July 27, 2022). «No quick fix: How OpenAI's DALL·E 2 illustrated the challenges of bias in AI» NBC News.
  33. (Ingelesez) «DALL·E 2 pre-training mitigations» OpenAI 2022-06-28.
  34. «IEB2024. Adimen Artifizial Sortzailea.» www.ueu.eus (Noiz kontsultatua: 2024-10-23).
  35. (Ingelesez) Brandon, John. (2018-02-16). «Terrifying high-tech porn: Creepy 'deepfake' videos are on the rise» Fox News.
  36. Cole, Samantha. (24 January 2018). «We Are Truly Fucked: Everyone Is Making AI-Generated Fake Porn Now» Vice.
  37. (Ingelesez) «What Are Deepfakes & Why the Future of Porn is Terrifying» Highsnobiety 2018-02-20.
  38. (Ingelesez) «Experts fear face swapping tech could start an international showdown» The Outline.
  39. (Ingelesez) Roose, Kevin. (2018-03-04). «Here Come the Fake Videos, Too» The New York Times ISSN 0362-4331..
  40. Txantiloi:Cite arXiv
  41. Menz, Bradley. (2024). «Health Disinformation Use Case Highlighting the Urgent Need for Artificial Intelligence Vigilance» JAMA Internal Medicine 184 (1): 92–96.  doi:10.1001/jamainternmed.2023.5947. PMID 37955873..
  42. Chalfant, Morgan. (March 6, 2024). «U.S. braces for foreign interference in 2024 election» Semafor.
  43. Menn, Joseph. (September 23, 2024). «Russia, Iran use AI to boost anti-U.S. influence campaigns, officials say» The Washington Post ISSN 0190-8286..
  44. «Join the Deepfake Detection Challenge (DFDC)» deepfakedetectionchallenge.ai.
  45. Clarke, Yvette D.. (2019-06-28). «H.R.3230 – 116th Congress (2019-2020): Defending Each and Every Person from False Appearances by Keeping Exploitation Subject to Accountability Act of 2019» www.congress.gov.
  46. Sjouwerman, Stu. (2022-12-26). «Deepfakes: Get ready for phishing 2.0» Fast Company.
  47. JakinCode. (2023-07-05). «Zibersegurtasunaren erronka handiak» JakinCode (Noiz kontsultatua: 2024-10-23).
  48. (Ingelesez) Collinson, Patrick. (2023-07-15). «Fake reviews: can we trust what we read online as use of AI explodes?» The Guardian ISSN 0261-3077..
  49. (Ingelesez) «After WormGPT, FraudGPT Emerges to Help Scammers Steal Your Data» PCMAG.
  50. Alonso, Maialen. (2024-02-28). Adimen artifiziala, negozioak eta zibersegurtasuna sustatzeko. (Noiz kontsultatua: 2024-10-23).
  51. SLU, Herritar Berri. (2023-10-12). «Adimen artifiziala bai, baita energia kontsumoa ere» GAUR8 (Noiz kontsultatua: 2024-10-23).
  52. «Adimen artifiziala arautzeko moduez» Berria 2023-06-24 (Noiz kontsultatua: 2024-10-23).
  53. «Europako Batasunak adimen artifiziala arautzeko legea onartu du» Berria 2024-03-13 (Noiz kontsultatua: 2024-10-23).
  54. «Adimen artifiziala: fikziotik errealitatera» www.berria.eus 2023-04-16 (Noiz kontsultatua: 2024-10-23).
  55. (Gaztelaniaz) González, Fernanda. (2024-07-22). «Los modelos de IA se están quedando sin datos de calidad para nutrirse» WIRED (Noiz kontsultatua: 2024-10-23).
  56. Irratia, NAIZ. (2024-10-23). «Adimen artifizialaren eragina kazetaritzan, galderak nagusi erantzun argirik gabeko garaian» irratia.naiz.eus (Noiz kontsultatua: 2024-10-24).
  57. «Hedabideetan, adimen artifiziala «informazioaren alde» erabiltzeko beharra» Berria 2024-06-05 (Noiz kontsultatua: 2024-10-23).

Ikus, gainera

aldatu

Kanpo estekak

aldatu