Presita el Usona Esperantisto № 2023:2 (mar–apr)
La ekesto de artefaritaj verkistoj
En la lasta numero mi verkis pri la populariĝo kaj problemoj de artefaritaj intelektoj (AI), kiuj kreas bildojn el tekstaj priskriboj. Ekzistas ankaŭ aliaj AI-sistemoj kiel ekzemple ChatGPT, kiuj respondas al demandoj kaj kreas tekstojn. Kaj simile, laŭdoj kaj plendoj pri ili abundas. En tiu ĉi artikolo mi prezentos informon pri ChatGPT, pri ĝiaj limoj, kaj kiel vi povas uzi ĝin Esperante.
Kio estas ChatGPT?
Genera antaŭtrejnita transformilo (GPT, angle: Generative Pretrained Transformer) estas speco de AI por fari tekstojn. OpenAI kreis la unuan version en 2018, konsistantan el 0,12 miliardo da parametroj kaj trejnitan per 4,5 GB da teksto por laŭkuntekste prognozi la sekvan vorton en frazo.
Ekzemple, se oni dirus al vi, “Pasporto al la tuta ____”, verŝajne vi respondus, “mondo”. Sed, ĉu oni ne uzas pasporton por viziti specifajn landojn? Danke al la tiel nomata Esperanto-kurso, la vortoj “Pasporto al la tuta mondo” aperas pli ofte en Esperantaj tekstoj ol “Pasporto al la tuta EU”. Tial, statistike, la pli bona respondo estas “mondo”.
Tiaj taskoj estas multfoje prezentitaj al la AI, kaj ĝi agordas siajn internajn parametrojn por respondi ĝuste. Ke GPT produktas koherajn frazojn estas efektive miraklo de matematiko kaj statistiko.
La duan version, GPT-2, OpenAI publikigis en Februaro, 2019. Ĝi estis dekoble pli granda, konsistanta el 1,5 miliardoj da parametroj rezulte de trejnado per 40 GB da teksto. En Novembro, 2019, la firmao anoncis version GPT-3, konsistantan el 175 miliardoj da parametroj kaj trejnitan per 570 GB da teksto. Kaj en Marto, 2023, anonciĝis GPT-4 – sed detaloj pri la trejnado ne estas publike haveblaj.
ChatGPT utiligas kaj GPT-3 kaj GPT-4, kaj ĝi estas plitrejnita por konversacia interago. Malgraŭ la furoro pri ChatGPT, la vera potenco de GPT estas, ke oni povas facile adapti ĝin al specialaj taskoj, ĉar ĝi jam lernis la bazan lingvostrukturon.
Maltrankviliĝoj
Profesoroj timas, ke studantoj uzos ChatGPT-on por verki siajn eseojn. Maltrankviliĝas pri tio mia amiko, verkisto de fikciaĵoj; li suferas de preskaŭ ekzistisma krizo. Kaj artikoloj jam proklamas, ke ChatGPT estas kaŭzo de perdita honesteco, etiko, kaj scipovo.
Tamen konsideru la jenan: studantoj jam trompas de jarcentoj; ĵurnalistoj uzas aŭtomatajn korektilojn, literumilojn, kaj gramatikajn kontrolilojn; politikistoj gajnas grandajn sumojn per aŭtobiografioj verkitaj por ili de dungitoj; kaj en iuj kulturoj, plagiato estas aprobita.
Eĉ Sokrato argumentis, ke oni prefere komunikiĝu parole. Li timis, ke dependiĝo je skribado difektos la memoron; ke legante (sed ne aŭskultante), homoj interpretos tekstojn nur laŭ la intencoj de la aŭtoroj; kaj ke per skribado homoj disvastigos malveraĵojn.
La mondo fariĝas pli kaj pli malsimpla. Malgraŭ la timoj de Sokrato, oni nun devas scipovi legi kaj skribi. Rapide venas mondo, en kiu generaj AI-sistemoj estos ĉie. Anstataŭ ol taksi tiun mondon malamika, verkistoj kaj instruistoj lernu pri ĝiaj kapabloj, starigu normojn, kaj instruu studantojn pri kiel respondece uzi generajn ilojn. La veraj problemoj rilatas al la limoj de GPT kaj ekonomiaj faktoroj.
Vere aŭ fantazie?
Ĉar GPT estas nur statistika ilo; ĝi ne komprenas verecon aŭ malverecon. Memoru, ke ĝi lernis prognozi sekvantajn vortojn surbaze de ekzemploj ricevitaj dum trejnado. Se la vortoj “Biden”, “Prezidento”, kaj “Usono” ofte aperas sufiĉe proksime al unu la aliaj, eble GPT diros, ke Joe Biden estas Prezidento de Usono, sed ĝi ne kapablos fidinde dedukti, juĝi pruvon, aŭ konfirmi informojn per aliaj fontoj. Tiu limo prezentos gravan riskon se oni pli ofte utiligos ĝin en diversaj fakoj.
Pro striktaj limdatoj en ĵurnalismo, raportistoj sentas tenton nur supraĵe kontroli faktojn, kaj uzo de GPT altigas riskon de senintenca disvastigo de malveraĵoj. Tio sekve povus subfosi fidon pri ĵurnalistoj kaj eĉ kredindigi konspirteoriistojn.
En Februaro, la novaĵagentejo Associated Press (AP) anoncis kelkajn esplorojn por plirapidigi siajn laborojn per GPT. AP jam uzas AI-ojn ekde 2014 por verki artikolojn pri financo kaj sporto, kaj provas alpreni novan teknologion respondece kaj malrapide. Kontrastu ĝin kun CNET, kiu spertis fortan kontraŭreagon kiam ĝi publikigis pli ol 70 artikolojn de ChatGPT dum tri monatoj, plenajn je eraroj.
Inĝenieroj nun esploras metodojn por plibonigi GPT-on. Plejofte oni aŭdas la proponon, “trejnu ĝin per pli granda datumaro!” Kaj jes, ĝenerale ju pli da datumoj, des pli bonaj estas la rezultoj. Sed trejnado postulas tempon kaj monon kaj nur donos al la sistemo novajn informojn. Ĝi ankoraŭ ne povos juĝi verecon.
Ekonomiaj faktoroj
Alia problemo de GPT estas ĝia bezono de multaj rimedoj. Pli malgrandaj (kaj malpli kapablaj) versioj bezonas sufiĉe modernajn komputilojn, sed GPT-3 kaj GPT-4 bezonas grafikajn procesorojn (GPU) en kvanto kutima por granda komerca datumejo.
Oni kalkulas, ke por funkciigi ChatGPT-on, OpenAI elspezas proksimume tri milionojn da dolaroj monate, uzante 20 000 GPU-oj (Nvidia A100). La firmao pligrandigas ĝin por komercaj celoj, kaj tio postulas multe da mono kaj pli da procesoroj. Kiam aliaj organizoj konstruos siajn proprajn AI-sistemojn, rimedoj fariĝos pli malfacile troveblaj kaj la prezoj de tiuj rimedoj plialtiĝos.
Tamen mi ne certas, ĉu funkciigi tiajn sistemojn devas kosti tiom multe. Varianto de GPT nomita LLaMA, konsistante el 65 miliardoj da nodoj, estis trejnita de Meta/Facebook. Universitato Stanford plitrejnis ĝin por konversacio, kaj la rezulto estas simile al ChatGPT kun GPT-3. En Marto, LLaMA estis senpermese publikigita. Tiam, lertaj AI-esploristoj adaptis ĝin, por ke ĝi funkciu ĉe kutima aparataro. Kompreneble, por komercaj AI-sistemoj oni kutime bezonas datumejon, sed eblas redukti la bezonatajn rimedojn. Ĝis nun ne estas indiko, ke OpenAI esploras similan reduktan aliron – ĝi daŭre trejnas sistemojn pli kaj pli grandajn.
Firmaoj konkurencas, konstruante pli kapablajn AI-sistemojn, kaj pro financaj instigoj ili emas regi aliron al tiuj sistemoj. Estas malpli da instigo por esplori, kiel fari AI-sistemojn pli efikajn kaj haveblajn por ĉiuj. Mi timas, ke nur grandaj firmaoj profitos de la avantaĝoj de AI, kreante pli da malegaleco.
ChatGPT kaj Esperanto
Homoj uzas ChatGPT-on por multaj celoj, ekzemple: recenzi blog-afiŝojn aŭ novaĵ-raportojn; elpensi ideojn por antaŭenigi karieron; kaj diskuti kun la AI pri filozofiaj temoj. Mia laborfako estas programado, do mi foje uzas ChatGPT-on por helpo en programado, sed ankaŭ kiel verkistan kaj tradukan helpanton.
Miasperte, ChatGPT ne taŭgas por aŭtomate verki longforman fikcion. Ĝi ne kapablas verki longan tekston kohere, eĉ se oni dividas la taskon en malgrandajn pecojn. Ĝi iom pli sukcesas pri mallongaj rakontoj, sed la rezultoj estas ripetiĝemaj kaj la intrigo tro divenebla. Se vi gvidas lokan Esperantan grupon, eble vi volus peti mallongan rakonton de ChatGPT por komuna tradukekzerco.
Aliflanke, eble vi prezentu vian verkon al ChatGPT kaj petu sugestojn por plibonigi ĝin. La AI ankaŭ tre bone funkcias por cerbumi pri ideoj kaj plani rakontojn. Ekzemple: petu al ĝi prezenti kvin ideojn por rakonto, en kiuj la ĉefrolulo ŝajnigas sian morton por eviti imposton.
Por tradukado, estu same skeptika pri ChatGPT kiel pri Google Translate. Ĝia kapablo verki bonstilan kaj naturan esperantaĵon, kaj klarigi gramatikajn temojn, estas ege malbona. Ekzemple:
Mi: Translate to Esperanto: “As they were driving back from a weekend getaway, John felt a strange pain in his chest.”
ChatGPT: Dum ili revenis hejmen el weekenda eskapado, John sentis strangan doloron en sia brusto.
Mi: Is “weekenda” really an Esperanto word?
ChatGPT: “Weekenda” is not a common Esperanto word, as it is a loanword from English. The more common Esperanto word for “weekend” is “fino de semajno” or “semajnfino”. However, since Esperanto is an international language and has a flexible structure, it is acceptable to use loanwords in certain contexts where the meaning may not be immediately clear or where the use of the Esperanto equivalent may be impractical.
Sed la teknologio nepre pliboniĝos, ĉu ne? Nu … ĉu vi memoras la ekscitiĝon en Esperantujo, kiam Google unue aldonis Esperanton al sia tradukilo? Jardekon poste, Google Translate estas iom pli bona, sed ankoraŭ ne fidinda por gravaj celoj. Kaj la teknologio pri artefaritaj intelektoj estas pli progresinta ĉe Google ol ĉe multaj aliaj firmaoj. OpenAI deziras la plej grandan profiton el siaj investoj, kaj tio influas ĝiajn decidojn pri kiel trejni GPT-on. Sen financa instigo, estas tre malprobable, ke la Esperanta kapablo de ChatGPT multe pliboniĝos.
Sed ChatGPT bone kapablas prezenti plurajn alternativojn por frazo. Tiu kapablo estas tre utila, kiam oni trafas komplikan frazon, kion oni ne scias kiel (aŭ ne volas) precize traduki. Petu de la programo kelkajn similajn frazojn: eĉ se la respondoj ne estas perfektaj, ili eble inspiros al vi pli bonan ideon.
Konkludo
ChatGPT, kaj aliaj aplikoj de GPT-sistemoj, prezentas multajn novajn eblojn por homoj en diversaj fakoj. Sed novaj ebloj ofte kunportas novajn problemojn. Pri honesteco kaj etiko, rilate al GPT, mi ne timas; problemoj pri tiuj ekzistis jam de la pratempoj. Miaopinie, pli severa ol trompa misuzo estas malprudenta utiligo fare de avaraj firmaoj. Grandaj organizoj havas multe da influo, kaj ekonomia plimalegaligo pro la teknologio malplibonigos la situacion. Tamen, la ĝino de artefarita intelekto estas jam liberigita de la botelo. Do estas grave, ke ni strebu uzi AI-sistemojn en manieroj, kiuj plibonigos la vivon.