Google presentó Gemini, una IA generativa multimodal para competir con OpenAI (parte I)

(Por Taylor y Maqueda desde Silicon Beach) En el vertiginoso escenario de la inteligencia artificial (AI), Google ha dado un paso audaz al presentar su última innovación: Gemini, un modelo generativo multimodal. Este miércoles, Sundar Pichai, el CEO de Google, reveló con entusiasmo la culminación de meses de arduo trabajo interno en el desarrollo de Gemini, marcando un hito significativo para la compañía en su competencia con rivales como OpenAI.

La Estrategia de lanzamiento de Google Gemini

El lanzamiento de Gemini se ejecutará en fases estratégicas, con tres "tamaños" disponibles: Ultra, Pro y Nano. Mientras la versión Pro ya está al alcance de los usuarios a través del chatbot Bard, el modelo Ultra, considerado el más avanzado, permanece en pruebas internas y no se lanzará hasta principios de 2024. Google planea integrar gradualmente Gemini en sus productos más populares, incluyendo una versión mejorada de Bard llamada Bard Advanced.

Gemini: Más allá de la superficialidad

La verdadera promesa de Gemini reside en su naturaleza multimodal, lo que significa que puede procesar diversos tipos de medios, desde texto e imágenes hasta video y audio. Esta flexibilidad es respaldada por la afirmación de Google de que Gemini es su modelo más versátil hasta la fecha, capaz de operar en una amplia gama de fuentes, desde centros de datos hasta dispositivos móviles como smartphones.

Desafíos y logros técnicos de Gemini

A pesar de las afirmaciones entusiastas, Google reconoce que la versión más avanzada, Gemini Ultra, aún está por ser probada en su totalidad. Sin embargo, en una mesa redonda reciente, ejecutivos de Google destacaron que el modelo Ultra ha superado a los expertos humanos en la comprensión masiva del lenguaje multitarea (MMLU), superando incluso a GPT-4 de OpenAI con una puntuación del 90,0%.

Perspectivas de Gemini en la competencia AI

El lanzamiento de Gemini no solo busca desafiar a la competencia sino también consolidar la posición de liderazgo de Google en el sector de la inteligencia artificial. Se espera que Gemini sobresalga en lo que Google denomina "razonamiento sofisticado", mostrando su capacidad para procesar información compleja en diferentes formatos de medios.

Próximos pasos y despliegue de Gemini

Google tiene previsto integrar Gemini en sus productos de consumo, como el smartphone Pixel 8 Pro, donde se espera que funciones como la capacidad de resumir el contenido de grabaciones de voz destaquen. Además, Gemini se incorporará a productos clave de Google, como SGE (Search Generative AI), Chrome, Duet AI, entre otros, en los próximos meses.

Esta fase inicial de lanzamiento es un indicativo claro de la determinación de Google para mantenerse a la vanguardia de la innovación en inteligencia artificial, con Gemini liderando el camino hacia el futuro.

Del contexto del lanzamiento de Google Gemini en AI, a los detalles específicos.

En la próxima nota, a continuación, te contamos todas las características de Google Gemini.

Te invitamos a leerla.

Tu opinión enriquece este artículo:

Meta y YouTube: el veredicto que puede salvar a las nuevas (y no tan nuevas) generaciones de la adicción que estamos sufriendo inconscientemente)

(Por Taylor con Vera) En un acontecimiento histórico que resonará en los pasillos legales y en los corazones de familias por igual, un jurado de Los Ángeles dictó, el 25 de marzo de 2026, una sentencia contundente en contra de Meta y YouTube, declarándolas responsables de la adicción a sus plataformas que afecta gravemente la salud mental de los menores. 

Lo que Harvard, Cambridge y el MIT confirman: neurociencia del liderazgo lector (en la era digital, leer es lo más inteligente)

(Por Maurizio y Rotmistrovsky) " Según Cal Newport en "Deep Work" — citado por el 79% de los graduados de Oxford en negocios — la lectura sostenida incrementa la mielinización neuronal: el proceso por el cual el cerebro refuerza las conexiones entre neuronas frecuentemente activadas, aumentando la velocidad y eficiencia del procesamiento cognitivo.