Google ha presentat el seu nou model més intel·ligent fins al moment, el Gemini 2.5 Pro. Aquest destaca per la seva capacitat de raonament que li permet descompondre tasques complexes en passos lògics abans de donar una resposta.
Aquest model s’ha posicionat com a número 1 a LMArena, superant als seus competidors com Antrhopic o OpenAI, amb un cert marge. LMArena és una plataforma de codi obert per a l’avaluació comparativa de diferents models d’IA, creada per investigadors del ‘UC Berkeley SkyLab’. En aquesta plataforma s’avaluen les preferències humanes en interaccions de models de llenguatge i indica que Gemini 2.5 Pro és el model que ofereix respostes més alineades amb allò que busquen els usuaris.
Aquest model s’ha sotmès a diferents avaluacions per determinar el seu rendiment en diverses àrees. En referència al seu rendiment en tasques específiques, Gemini 2.5 Pro ha demostrat tenir grans habilitats per a les matemàtiques i la ciència. Segons l’estudi realitzat per ‘GPQA Diamond’, dissenyat per avaluar la capacitat de raonament científic del model, Gemini 2.5 Pro ha obtingut una puntuació del 84%, superant altres models d’IA en aquest camp.
A més, en un altre estudi anomenat ‘Humanity’s Last Exam’, que avalua el coneixement i el raonament humà del model, Gemini 2.5 Pro va obtenir una puntuació del 18,8% i s’estableix com un referent a seguir per als models sense ús d’eines externes.
Gemini 2.5 Pro millora la seva capacitat de codificació respecte a models anteriors
Un altre àmbit en el qual destaca el nou model de Gemini és en la codificació. El model sobresurt en la codificació d’aplicacions web visualment atractives i en la transformació i edició de codi. En l’anàlisi elaborada per ‘SWE-Bench Verified’, un dels més importants en la indústria per a l’avaluació de codi, va obtenir un 63,8%, i només va ser superat pel model d’Antrhopic Claude 3.7 Sonnet, el qual va obtenir una puntuació de 70,3%. Tot i això, el model de Gemini demostra que pot ser competitiu en aquest àmbit, i posa a prova la seva capacitat de codificació amb el següent vídeo.
Actualment, Gemini 2.5 Pro està disponible per a desenvolupadors i empreses, que ja poden començar a experimentar amb aquest model a través de Google AI Studio, i els usuaris de Gemini Advanced poden fer servir aquest model a través de l’aplicació de Gemini. També s’espera que en les pròximes setmanes estigui disponible a Vertex AI.
Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.