La companyia llança GPT-4.1 juntament amb les versions Mini i Nano, tres models dissenyats per a desenvolupadors amb una finestra de context d’un milió de tokens i un rendiment superior a GPT-4o i GPT-4.5. Aquesta nova generació no arribarà, de moment, a ChatGPT, però marcarà el camí cap a futures actualitzacions de l’assistent.
“GPT-4.1 millora a GPT-4o en gairebé totes les dimensions”. Amb aquesta frase, Sam Altman, CEO d’OpenAI, va donar la benvinguda al nou model estrella de la companyia durant una retransmissió en directe aquest dilluns. Després de mesos d’expectativa al voltant de GPT-5, finalment OpenAI ha presentat una alternativa intermèdia, però poderosa: GPT-4.1, que arriba acompanyada de dues versions optimitzades —Mini i Nano— dissenyades especialment per a desenvolupadors i casos d’ús reals.
La nova família GPT-4.1 està disponible exclusivament a través de l’API d’OpenAI, i de moment no es pot usar directament en ChatGPT. No obstant això, la companyia ja ha deixat clar que aquestes capacitats s’integraran progressivament en el seu producte principal, de forma similar a com va succeir amb GPT-4o.
GPT-4.1 millora un 21% el rendiment de GPT-4o en programació, segons OpenAI, i redueix costos i latència.
Entre les millores més destacades, GPT-4.1 eleva la finestra de context a un milió de tokens, és a dir, pot processar l’equivalent a 750.000 paraules en una sola entrada. Això permet manejar projectes extensos, llargues converses o processar codi i documents complexos sense perdre el fil. A més, el model ha estat entrenat per reconèixer amb major fiabilitat els fragments rellevants del context i descartar el soroll o la informació innecessària.
Una altra de les novetats clau és l’enfocament en programació. GPT-4.1 aconsegueix una puntuació del 54,6% en el benchmark SWE-Bench Verified, una millora substancial respecte al 33,2% obtingut per GPT-4o i al 28% de GPT-4.5. Això el converteix, segons la mateixa OpenAI, en el seu millor model per a tasques de desenvolupament i codificació. En MultiChallenge, una prova que mesura la capacitat per seguir instruccions, també destaca amb un 38,3%, molt per sobre dels seus predecessors.
I què passa amb GPT-5?
L’arribada de GPT-4.1 també ha servit per aclarir els plans futurs de la companyia. Altman va confirmar que el llançament de GPT-5, previst inicialment per al maig, es retarda “uns mesos”. “Ens ha resultat més difícil del que pensàvem integrar tots els components sense perdre qualitat ni estabilitat”, va explicar el CEO en la mateixa retransmissió.
Mentrestant, OpenAI comença a tancar etapes anteriors. GPT-4, el model que va marcar un abans i un després en la història de la IA generativa, serà retirat de ChatGPT el 30 d’abril. Li seguirà GPT-4.5 —conegut internament com a Orion—, que deixarà d’estar disponible en l’API a partir del 14 de juliol. El motiu? GPT-4.1 ofereix un rendiment similar o superior en àrees clau, amb menor cost i major velocitat.
OpenAI confirma que el llançament de GPT-5 es retarda uns mesos i comença la retirada de GPT-4 i GPT-4.5 de la seva API.
De fet, el preu és un dels arguments més potents: GPT-4.1 costa 2 dòlars per milió de tokens d’entrada i 8 dòlars per milió de tokens de sortida. En comparació, el cost de GPT-4.5 era 75 i 150 dòlars, respectivament. Les versions Mini i Nano redueixen encara més aquest cost, arribant fins als 0,10 dòlars per milió de tokens d’entrada en el cas del model més lleuger.
Nous usos, més realisme
OpenAI ha dissenyat GPT-4.1 pensant en un ús pràctic i realista. “Hem optimitzat el model per a tasques que importen als desenvolupadors: codificació frontend, edició precisa, ús coherent d’eines, seguiment del format…”, explicava un portaveu de la companyia en declaracions a TechCrunch.
A més, GPT-4.1 ha estat posat a prova en el benchmark Video-MME, que avalua la comprensió de continguts audiovisuals. En la categoria de vídeos llargs sense subtítols, va obtenir un 72% d’encert, una xifra rècord. El seu coneixement també ha estat actualitzat fins al juny de 2024, cosa que li permet respondre amb major precisió a esdeveniments recents.
No obstant això, no tot és perfecte. OpenAI reconeix que el model pot ser menys fiable quan ha de processar grans quantitats d’informació. En un dels seus tests interns, la precisió del model va caure del 84% amb 8.000 tokens al 50% amb un milió de tokens. També pot requerir instruccions més explícites, ja que tendeix a respondre de forma més literal que GPT-4o.
L’objectiu: un programador autònom
Més enllà dels benchmarks, el rumb d’OpenAI sembla clar: avançar cap a una intel·ligència artificial capaç d’assumir el paper d’un enginyer de programari complet. Sarah Friar, CFO de la companyia, ja va avançar aquesta ambició en una cimera tecnològica a Londres: un model que pugui programar aplicacions de principi a fi, incloent-hi documentació, proves i resolució d’errors.
Amb GPT-4.1, OpenAI fa un pas en aquesta direcció, i al mateix temps respon a la pressió creixent de rivals com Google, Anthropic o DeepSeek, que ja han presentat models amb capacitats similars i resultats superiors en algunes proves.
La cursa per la dominació de la IA generativa continua, i GPT-4.1 és, sens dubte, el nou cavall de batalla d’OpenAI.
Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.