CINews | Vol. 49

Fotografía cortesía de ©Pexels

Diseñado para resolver tareas complejas, Gemini 2.5 Pro, desarrollado por Google, ha sido evaluado en entornos especializados con resultados significativos.

El modelo de lenguaje más potente desarrollado por Google hasta ahora, Gemini 2.5 Pro, introduce mejoras sustanciales en razonamiento lógico, análisis contextual y programación, gracias a técnicas como el aprendizaje por refuerzo y las cadenas de pensamiento. Estas capacidades lo posicionan como una herramienta avanzada para resolver tareas complejas con mayor precisión y profundidad.

Diseñado para “pensar antes de responder”, el modelo aplica técnicas de razonamiento paso a paso que le permiten analizar datos, estructurar argumentos y generar respuestas con mayor solidez. Su desempeño ha sido validado en evaluaciones especializadas como GPQA (preguntas de ciencias), AIME 2025 (razonamiento matemático) y Humanity’s Last Exam, donde alcanzó un 18.8% de aciertos, un resultado significativo frente a la complejidad de estas pruebas.

Gemini 2.5 Pro procesa más de 480 billones de tokens –la unidad mínima que los modelos usan para "entender" el lenguaje– al mes: 50 veces más que hace un año.

Uno de los avances más notables es su rendimiento en tareas de codificación: puede construir aplicaciones web, editar código y trabajar con agentes de programación. En la evaluación SWE-Bench Verified logró un 63.8%, lo que abre nuevas posibilidades para desarrolladores y empresas que buscan automatización avanzada.

Además, el modelo cuenta con una ventana de contexto de un millón de tokens —con planes de duplicarla a dos millones—, lo que le permite trabajar con grandes volúmenes de información sin perder consistencia. Procesa texto, imágenes, video, audio y bases de datos complejas, lo que lo convierte en un modelo verdaderamente multimodal.

Este tipo de procesamiento requiere una infraestructura acorde. Gemini 2.5 Pro opera sobre la nueva generación de chips TPU (Ironwood), capaces de alcanzar 42.5 exaflops por pod, multiplicando por 10 la capacidad de la generación anterior. Este salto técnico permite mayor velocidad, escalabilidad y eficiencia en el entrenamiento y la ejecución de modelos complejos.

El ecosistema que rodea a Gemini también ha crecido. Más de siete millones de desarrolladores trabajan con el modelo, el uso en Vertex AI ha aumentado 40 veces y la app de Gemini cuenta ya con más de 400 millones de usuarios activos al mes. La versión 2.5 Pro está disponible para desarrolladores a través de Google AI Studio y para usuarios avanzados mediante Gemini Advanced.

Con estas capacidades, Gemini 2.5 Pro representa un avance significativo en el desarrollo de modelos de lenguaje multimodal. Su arquitectura permite no solo una mayor comprensión contextual, sino también nuevas formas de interacción con datos complejos, abriendo paso a aplicaciones en ciencia, industria, educación y otras áreas que requieren análisis profundo y generación precisa de información.