30.1.23

Poetes i robots


Com a poeta i enginyer estic seguint amb curiositat l’entrada de la Intel·ligència Artificial (IA) al món de la creativitat. Escric a continuació algunes impressions i reflexions, després de jugar una mica amb algunes eines de les quals s’ha parlat molt als mitjans, com ChatGPT o DALL·E, que generen, respectivament, textos i imatges a partir de frases que escriu un usuari. Per exemple, la imatge que encapçala aquest article ha estat generada automàticament per DALL·E fent servir la frase “pintura a l’oli amb l’estil de Velázquez, d’un robot i un poeta treballant plegats”.

Per començar, però, necessito recular una mica en el temps. Recordo que quan encara era estudiant universitari, vaig cursar una assignatura d’aquelles que triaves amb “crèdits de lliure elecció” (terme ja abandonat), en aquest cas, sobre Història de la Ciència. Ho menciono perquè el treball final que vaig escriure era sobre el tema de la IA i la creativitat, a partir de la lectura de la novel·la Do Androids Dream of Electric Sheep? de Philip K. Dick (sí, l’obra que Ridley Scott va adaptar per fer Blade Runner).

En el treball (que he estat incapaç de trobar), recordo que hi deia coses contundents, com que la IA mai podria arribar a ser creativa, suposo que des d’una actitud romàntica envers l’ésser humà, que ara potser em semblaria una miqueta ingènua. Tanmateix, el treball em va valer una matrícula d’honor.

Els anys posteriors a això, havent acabat l’enginyeria, vaig treballar en una empresa dedicada a la IA, i també vaig fer recerca sobre IA a la UdG, encara que molt breument, ja que ni tan sols vaig acabar el doctorat. Les meves inquietuds em van portar a deixar de banda aquesta àrea, saltant primer a la Cooperació al Desenvolupament (els meus viatges a l’Índia), més tard a la Tecnologia Educativa, i després a quelcom que alguns hem anomenat “Tecnologies Creatives” o “Tecnologies per a l’Aprenentatge Creatiu”, bàsicament perquè no sabem ben bé quin nom posar-li.

La qüestió és que els últims anys he tornat a reflexionar sobre com podem fer servir la tecnologia (en especial les tecnologies digitals) per expressar-nos creativament. Ho he fet a l’àmbit educatiu, des de la universitat, però posant el focus a l’escola. Per exemple, a través de visions que promouen els llenguatges de programació, no merament com a eines informàtiques que ens permeten enfrontar-nos a problemes tècnics, sinó que els conceben com a mitjans d’expressió creativa, crítica i col·laborativa. Els projectes que he desenvolupat en aquest àmbit, podríem dir que segueixen una escola de pensament iniciada per Jean Piaget i continuada (o potser és millor dir: ampliada lliurement) per Seymour Papert, que, per cert, fou director del Laboratori d’Intel·ligència Artificial del MIT.

Si el que dic us sona a xinès, podeu donar un cop d’ull a l’activitat Hack your window, que vaig promoure durant els confinaments de la COVID-19, quan tots vèiem el món a través de les nostres finestres. Van participar-hi milers de nens i nenes de tot el món, i consistia a fer una foto d’una finestra de casa (des de dins) i després “hackejar-la” mitjançant el llenguatge de programació Scratch, per fer-hi aparèixer tot allò que volguéssim. És a dir, transformant la nostra finestra en l’escenari on transcorria una història digital, un joc, un projecte artístic, etc. A més, s’animava a compartir els resultats a Internet.

Des d'aquest tipus de visions (l’activitat només és un exemple dels milers possibles), ja no estem utilitzant la tecnologia només com a usuaris o consumidors (que és el que fan la majoria d’infants, adolescents i adults), sinó també com a creadors. Tanmateix, seguim utilitzant la tecnologia com una eina. Una eina que fem servir per crear. Com, de fet, hem fet sempre. Val la pena recordar que la tecnologia és anterior al llenguatge. Aquest recordatori sempre fa explotar uns quants caps.

El canvi que suposen les IA que comencen a arribar (ChatGPT o DALL·E només són dos exemples d’una llarga llista), és un canvi de paradigma: ja no creem fent servir eines tecnològiques, sinó que cocreem amb elles (o en la versió més pessimista i apocalíptica: deixem que elles creïn per a nosaltres).

Per descomptat, ja hi ha artistes que les estan fent servir, i fins i tot algunes IA han guanyat premis de pintura digital. O científics que ja estan posant ChatGPT com a coautor en articles acadèmics.

Però quin és el canvi que hi ha hagut? Què és el que fa que les persones que estem provant ChatGPT o DALL·E percebem en les seves respostes alguna cosa similar a la creativitat, la intuïció, o fins i tot, la inspiració?

La meva hipòtesi és que aquestes eines han estat alimentades amb un volum de dades d’Internet tan gran que, tenen accés a quelcom amb força similituds (o com a mínim, certs punts de contacte) al que anomenem l’inconscient col·lectiu.

La inspiració, les muses i l’inconscient sempre s’han donat la mà. Octavio Paz escrivia:

Cuando sobre el papel la pluma escribe,
a cualquier hora solitaria,
¿quién la guía?


La resposta serà diferent si li preguntem a un científic materialista o a algú amb inquietuds espirituals (de fet, les dues actituds no han de ser oposades a la força). No entraré en aquest tema, precisament perquè aquest és EL TEMA.

Tampoc em posaré a explicar com funcionen aquestes tecnologies (podeu cercar informació sobre Deep Learning), però per exemple, crec que el fet de saber que el model de llenguatge de ChatGPT fa servir 175 mil milions de paràmetres, pot donar una idea de la dimensió del que estem parlant.

Algunes persones creuen que ChatGPT o DALL·E agafen trossos de textos i d’imatges ja existents, i les ajunten, però no és ben bé així. Les seves respostes són obres noves (generades), i en tot cas, el que podríem dir, si entrem en el joc (una mica perillós) de personificar aquestes IA, és que “elles” quan "creen" s’estan “inspirant” en les creacions humanes.

Perquè quedi clar que el que generen és nou, anem a veure un petit exemple amb DALL·E. Pensem quelcom que mai cap artista hagi representat. Per exemple: una girafa de color blau, amb una bufanda verda, que està jugant amb un pingüí al mig del desert. Li demanarem que ho creï amb l’estil d’una il·lustració per a un conte infantil.

Uns segons d’espera i patapam:



Estarem d’acord que potser no és una meravella d’il·lustració, però també siguem sincers, la majoria de la gent del món no seria capaç de fer un dibuix així (ni després de moltes classes de dibuix). I això està fet amb una sola iteració. Ara podríem seguir millorant i editant la imatge, alimentant a DALL·E amb frases més concises i específiques.

Els crítics, de seguida diran que són imatges sense ànima. La realitat és que quan s’han fet proves de posar-les de costat amb imatges creades per persones, la gent no és capaç de saber quina està creada per l’artista i quina per la màquina. Així que l’argument romàntic de l’ànima no sé si és gaire vàlid, tot i que entenc que a tots ens agradaria aferrar-nos-hi.

Altres diran que això no és art, perquè és simplement un mecanisme. Prems un botó i tens una obra. Bé, això és literalment el mateix que van dir els pintors quan va arribar la fotografia. Els mateixos arguments exactes. La fotografia mai seria art, deien. Bé, la història parla per si sola.

Finalment, altres diran ràpidament que això no és prova ni d’intel·ligència ni de creativitat, perquè en realitat, DALL·E no sap el que està fent. Aquest argument és irrefutable. Ni DALL·E, ni ChatGPT, ni cap de les altres IA no saben què estan fent. Però és que aquí estem llavors barrejant intel·ligència i consciència. Cap dels científics i enginyers que han desenvolupat aquestes eines ha dit mai que siguin conscients.

I aquesta és, de fet, la gran diferència entre la creació feta per les IA i la creació humana. Elles no tenen voluntat pròpia (necessiten una llavor: en aquest cas, la frase que els donem), no tenen consciència (no saben què estan fent), i no cal dir-ho: no tenen autoconsciència.

Però descartant tot això, i si ens centrem en DALL·E, em sembla una manera completament nova de crear obres visuals, o com a mínim, un sistema genial per fer brainstormings i crear prototips a partir dels quals podem crear altres obres.

Passem, ara, de la generació d’imatges a la generació de text. Què passa si demanem a ChatGPT que ens escrigui un petit diàleg entre una girafa preocupada pel seu color blau i el seu amic pingüí?

Uns segons d’espera i patapam:

Girafa: "Oh no, no entenc per què soc de color blau!"
Pingüí: "Però, per què t'importa ser blava? Tu ets igual de bonica que sempre!" 
Girafa: "Sí, però tots els altres animals són de colors normals. Jo em sento diferent."
Pingüí: "Però ser diferent és genial! Tu ets única i especial. I a més, el color blau és el meu preferit!"
Girafa: "Això és cert. M'agrada ser diferent. Gràcies, amic pingüí, per fer-me veure les coses d'una manera diferent." 
Pingüí: "De res, sempre estaré aquí per tu."
 
Com abans, potser no és brillant, però com esquelet per començar a construir quelcom, podria funcionar perfectament. I siguem sincers, està a un nivell bastant per sobre del que podrien escriure molts estudiants (i no parlo només de primària, eh). També a destacar, que l’ha creat directament en català (no l’he traduït, ni he tocat una sola coma).

I això em porta al tema de la IA i l’educació. No hi entraré. Se n’ha parlat moltíssim últimament, i serà un element clarament disruptor els anys vinents. No tinc ni idea de com ho encararem. Em quedo amb les idees de Papert de fa 50 anys: fer que els nens reflexionin sobre les IA, i les programin, els obliga a pensar sobre què vol dir pensar, i en definitiva, sobre què vol dir ser humà (ell deia que els converteix en “petits epistemòlegs”). Activitats com construir un robot senzill i programar-lo per tal que faci una tasca mínimament intel·ligent, poden ser una oportunitat genial per treballar la metacognició (pensar sobre com pensem), mentre estem barrejant ciència, tecnologia, art, filosofia i fins i tot, malgrat que està desterrada de les escoles i universitats, també l’espiritualitat. Evidentment, si promovem aquestes activitats només com a vies per desenvolupar certes competències digitals i aconseguir “bones feines” al futur, l’únic que estem fent és alimentar encara més el capitalisme neoliberal que s’està cruspint les escoles.

Però jo del que vull parlar realment, és de poesia. Per això el títol és “Poetes i robots”.

Ramon Llull, a l’Ars Magna (1305), ja feia propostes sobre com fer literatura explorant les possibles combinacions aleatòries de paraules. Però va ser Joan Brossa, l’any 1977, qui  “compongué” un dels primers poemes cibernètics del món, obrint les portes a la literatura assistida per l’ordinador. La seva idea, immers com estava sempre a cercar noves formes poètiques, fou generar sextines aleatòries aprofitant els ordinadors d'un centre de càlcul, amb l’objectiu que les creacions generades informàticament mantinguessin la mètrica i la rima (quelcom que en les sextines, tot sigui dit, no és gens trivial). L’ajudaren un amic químic i dos informàtics, que generaren vint sextines aleatòries amb un IBM 1130, a partir d’unes llistes de paraules que havia fet el mateix Brossa. El poeta, llavors trià una de les sextines, que fou la que publicà, sense fer-li cap canvi.

El programa informàtic que va fer servir Brossa no era cap IA. Era un programa que només sabia fer sextines, res més. Les feia a través de combinacions aleatòries (o “relativament” aleatòries, perquè l’alimentaven amb llistes de paraules del poeta), sense importar-li el sentit dels versos que generava.

Això no té res a veure amb ChatGPT. Aquest últim és un xat conversacional de propòsit general, i li podem demanar el que ens doni la gana. També poemes, evidentment. Són bons els poemes que genera ChatGPT? La veritat és que no gaire (en aquest sentit, els poetes, de moment, podem estar més tranquils que els il·lustradors, crec), però, així i tot, penso que poden enganyar fàcilment a algú que no sigui lector habitual de poesia.

Per comprovar això últim, he creat el Test de Turing-Brossa (un petit divertiment que fa referència al famós Test de Turing). El test et dona cinc parelles aleatòries de poemes, cadascuna de les quals conté un poema creat per un poeta català i un de creat per ChatGPT. Qui fa el test, fa de “jutge” i ha d’intentar esbrinar quins són els poemes escrits per persones. El programa només fa servir cinquanta poemes catalans d’autors reconeguts, i cinquanta generats artificialment (així que si hi jugueu unes quantes vegades us n’acabaran sortint de repetits). Més que un experiment científic, és un divertiment. Us animo a jugar-hi, i a compartir el resultat i les vostres impressions amb el hashtag #TuringBrossa.

Però va, anem a veure un exemple dels poemes que pot crear ChatGPT.

Eduard: Podries fer un poema de 8 versos en català sobre algú que descobreix el seu propi reflex quan mira a través d'una finestra?

ChatGTP:
Reflex en el vidre, miro i em reconec.
Sorpresa en el rostre, descobrint el meu ésser.
En la finestra veig, el que mai no havia vist.
La meva ànima nua, sense mai amagar-la.
Ara sé que soc jo, el que m'observa allí.
I em sento lliure, sense por ni vergonya.
En el reflex del vidre, m'he trobat a mi mateix.
Així és com comença, la meva veritable història.

Eduard: M'agradaria que el primer vers comencés amb un verb, i que el poema tingués alguna metàfora relacionada amb la llum.

ChatGPT:
Veig el meu reflex, en el vidre de la finestra
Llum que m'il·lumina, i em revela la veritat
En la claror del dia, descobreixo qui soc
Com una flama que crema, sense amagar res més
La finestra esdevé, el meu mirall veritable
On m'observo i m'admiro, sense por ni vergonya
La llum que m'envolta, em guia cap a mi mateix
I així comença, la meva història radiant.

Com veieu, el resultat no és pas gaire brillant. Podríem continuar demanant-li canvis, i entrant en un procés de cocreació, però crec que la idea ja s’entén.

Parlo de cocreació i no de creació assistida, perquè aquí el pes de la màquina és molt més alt. Quan fem servir diccionaris en línia (de sinònims, de símbols, etc.) o eines com l’Optimot, estem creant assistits per l’ordinador. Però amb ChatGPT estem deixant que una gran part de la creació estigui en mans de l’ordinador.

Sincerament, ara mateix no li veig el sentit a fer-lo servir per poesia (jo continuaré amb els meus quaderns i bolígrafs). No se’n surt prou bé (i encara que se'n sortís, tindria sentit fer-lo servir?). No obstant això, pot ser una bona eina per donar idees per coses ben específiques, com trobar una paraula concreta o tancar un vers. Per temes de ritme, mètrica i rima, ChatGPT és molt dolent (molt!). Però penseu que això només és el principi. Potser s’apropa un tsunami.

També cal dir que els poemes que genera ChatGPT en català, tinc la sensació que són pitjors que els que genera en espanyol o anglès, potser pel volum de textos poètics als quals té accés en cada llengua.

Tanco la reflexió amb el pronòstic que el tema de la mètrica i rima millorarà molt en futures versions, especialment quan es creïn eines específiques per literatura, que segur que en sorgiran. El significat, la metàfora, el símbol, la intenció, seran molt més difícils de capturar per la IA. Això farà que l’estil d’alguns poetes sigui més fàcil de ser imitat per les IA que no el d’altres. 



Share this Post Share to Facebook Share to Twitter Email This

1 Comentaris:

Esteve Canet ha dit...

Molt interessant, Eduard. Enhorabona per la iniciativa. Un article excel·lent