Google lanzó el miércoles la primera versión de su familia de modelos de inteligencia artificial (AI, por sus siglas en inglés) Gemini 2.0.
Gemini 2.0 Flash, como se llama el modelo, está disponible en una versión de chat para usuarios de todo el mundo, mientras que una versión multimodal experimental del modelo, con funciones de conversión de texto a voz y generación de imágenes, está disponible para desarrolladores.
“Si Gemini 1.0 trataba de organizar y comprender la información, Gemini 2.0 trata de hacerla mucho más útil”, dijo el CEO de Google, Sundar Pichai, en un comunicado.
El último modelo de lenguaje grande de Google supera a sus predecesores en la mayoría de las áreas de solicitud de los usuarios, como la generación de código y la capacidad de proporcionar respuestas factualmente correctas a las solicitudes de los usuarios. Un área en la que es inferior a Gemini 1.5 Pro es cuando se trata de evaluar contextos más largos.
Para acceder a la versión optimizada para chat del Flash 2.0 experimental, los usuarios de Gemini pueden seleccionarlo en el menú desplegable del modelo en la web de escritorio y móvil. Estará disponible en la aplicación móvil de Gemini pronto, dijo la compañía.
La versión multimodal de Gemini Flash 2.0 estará disponible a través de las plataformas de desarrollo AI Studio y Vertex AI de Google.
La disponibilidad general de la versión multimodal de Gemini 2.0 Flash llegará en enero, junto con más tamaños de modelos de Gemini 2.0, dijo Google el miércoles. La compañía dijo que también planea expandir Gemini 2.0 a más productos de Google a principios de 2025.
Gemini 2.0 representa los últimos esfuerzos de Google en la cada vez más competitiva carrera de IA de la industria tecnológica. Google está compitiendo contra rivales como los gigantes tecnológicos Microsoft y Meta y nuevas empresas como OpenAI, el fabricante de ChatGPT, Perplexity y Anthropic, que fabrica Claude.
Junto con el lanzamiento del nuevo modelo Flash hay otros prototipos de investigación destinados a desarrollar modelos y experiencias de AI más “agenticos”.
Los modelos agenticos, según la compañía, “pueden comprender más sobre el mundo que lo rodea, pensar en varios pasos por adelantado y actuar en su nombre, con su supervisión”.
La semana pasada, en una conversación con Andrew Ross Sorkin en la DealBook Summit del New York Times, Pichai cuestionó el avance de la IA de Microsoft y dijo que le “encantaría hacer una comparación lado a lado” de los modelos de las dos compañías “cualquier día, a cualquier hora”.