Els Agents d’OpenAI: promesa d’autonomia o fum ben empaquetat?

Temps de lectura: 2 minuts

El món de la intel·ligència artificial s’està movent molt ràpid, i una de les darreres grans promeses és la funcionalitat d’Agents d’OpenAI. Una nova capa de capacitat per als models de llenguatge que apunta cap a una IA més autònoma, persistent i capaç de dur a terme tasques complexes pel seu compte. Però… realment està a l’alçada del que promet?

Què són exactament els Agents?

Els Agents d’OpenAI són instàncies especialitzades dels models GPT-4o que recorden context, tenen accés a eines i poden interactuar amb un entorn virtual d’escriptori. Teòricament, això els permet fer coses com:

Navegar webs i omplir formularis
Escriure i editar documents
Executar scripts o comandes
Obtenir arxius, llegir-los, modificar-los i guardar-los
Generar resums, informes o fins i tot presentacions

La idea és potent: un assistent realment útil, que no només et contesta, sinó que fa coses per tu. Un cop configures un agent, li pots dir: “fes-me una presentació a partir d’aquest PDF”, o “navega a aquesta web, busca els preus i copia’ls en un Excel”. I l’agent, si tot va bé, ho fa sol.

I tot això, com va en la pràctica?

Aquí és on ve la part important. Perquè després de provar-ho amb calma, la sensació que queda és que la idea és molt millor que l’execució real.

Els agents tenen accés a un entorn virtual molt interessant, però fins i tot les tasques senzilles sovint acaben fallant. Quan li demanes fer un PowerPoint a partir d’un text, s’encalla. Si li demanes fer login a una web i navegar fins a cert contingut, potser ho intenta… però sovint es perd pel camí. I quan falla, no et diu per què: senzillament abandona la tasca o et retorna una resposta parcial.

També hi ha un punt delicat: la sensació de control. Aquests agents poden executar comandes en un entorn Linux, interactuar amb webs, simular clics o obrir aplicacions… però encara no tens visibilitat clara del que fan exactament ni dels riscos potencials que poden comportar aquestes accions. No és que siguin perillosos ara mateix, però tampoc transmeten confiança per delegar-hi feines sensibles.

En resum: la funcionalitat d’Agents d’OpenAI és una idea brillant, però està encara massa verda per considerar-la una eina de treball estable. És molt probable que sigui el futur: combinar models lingüístics amb agents autònoms que poden actuar, navegar, llegir i escriure en entorns rics. Però ara mateix és una demo prometedora més que no pas una funcionalitat fiable.

Potser el més preocupant és la narrativa que envolta aquesta tecnologia: es presenta com una revolució quan encara és un prototip. I això pot generar frustració en usuaris que s’esperen un “copilot”, i es troben amb una eina que necessita supervisió constant i que s’atura a mig camí.

El futur és agentic, però encara no hi som

Crec sincerament que el camí cap a agents intel·ligents que realment puguin treballar al nostre costat és lògic i necessari. Però perquè sigui útil, caldrà molt més treball de fiabilitat, interfícies més transparents i sobretot, una dosi de realisme a l’hora de presentar què poden fer i què no. Per ara, és millor pensar-hi com una joguina tecnològica interessant, no com una revolució de la productivitat. La idea és bona. La implementació encara no.