Google lanzó su última joya tecnológica y se llama Gemini. Según Sundar Pichai, el CEO de Google y Alphabet, es el modelo de inteligencia artificial más grande y capaz que han creado hasta ahora.
Más grande que los celulares y la internet
Para Sundar, estamos en el comienzo de una revolución tecnológica sin precedentes, más grande que el cambio a los dispositivos móviles o incluso a la web.
El potencial del aprendizaje automático, y en particular de la AI, es tan vasto que podría transformar nuestras vidas de maneras que ni siquiera podemos imaginar.
Hablemos de Gemini
Este nuevo modelo de AI es el resultado de una colaboración masiva entre equipos de Google, incluidos los genios de Google DeepMind.
Demis Hassabis, el CEO y cofundador de Google DeepMind, dice que la idea detrás de Gemini es construir una AI que no sólo sea poderosa, sino también intuitiva, como un asistente experto.
Gemini es multimodal, lo que significa que puede comprender y operar con diferentes tipos de información, ya sea texto, código, audio, imágenes o video.
Y para entenderlo mejor tienes que verlo en acción.
Pero lo más emocionante es que no sólo es flexible, sino también eficiente, adaptándose desde centros de datos hasta dispositivos móviles.
Esto es porque viene en diferentes versiones para adaptarse a tus necesidades:
🟣 Gemini Pro: para uso en productos y servicios de Google.
🟣 Gemini Nano: El modelo más eficiente para tareas en dispositivos móviles.
🟣 Gemini Ultra: la versión más potente, diseñado para tareas complejas.
Rendimiento superior
Gemini ha sido sometido a pruebas rigurosas y ha demostrado ser una verdadera estrella en el escenario de la inteligencia artificial.
El modelo Gemini Ultra, el más grande de la familia, supera a los expertos humanos en la comprensión masiva de tareas de lenguaje, abarcando temas desde matemáticas y física hasta historia y ética.
Supera el rendimiento actual en 30 de las 32 pruebas de referencia académicas utilizadas en la investigación y desarrollo de modelos de lenguaje grandes (LLM) y alcanza el 90,0% en MMLU (comprensión masiva de lenguaje multitarea), superando por primera vez a los expertos humanos.
Pero no se detiene ahí.
Su capacidad multimodal y su enfoque novedoso en el entrenamiento desde cero para diferentes modalidades le dan una ventaja única sobre modelos anteriores.
Puede entender texto, imágenes, audio y más, lo que lo convierte en una especie de políglota digital. Incluso puede generar código de alta calidad en lenguajes como Python, Java, C++ y Go, siendo una herramienta valiosa para los programadores.
Hablando de programación, Gemini también es la fuerza impulsora detrás de AlphaCode 2, un sistema de generación de código avanzado que ha mejorado significativamente en competiciones de programación.
Bard impulsado por Gemini
Mientras que ChatGPT de OpenAI se ha convertido en un fenómeno mundial, Bard de Google ha sido en gran medida pasado por alto. Sin embargo, con la integración de Gemini, Bard da un salto significativo.
Ahora, alimentado por Gemini Pro, Bard ofrece respuestas más precisas y mejoradas en inglés para usuarios en 170 países. Sundar Pichai destaca que, en sus pruebas, Bard muestra una mejora general, comprendiendo mejor las intenciones, proporcionando respuestas más precisas y siendo más efectivo para tareas como la programación.
Con planes de lanzar Bard Advanced, impulsado por Gemini Ultra, el próximo año.
¿Cómo se está utilizando Gemini?
Ya se está implementando en varios productos y plataformas de Google:
Pixel 8 Pro: El último smartphone de Google es el primero en incorporar Gemini Nano, que permite utilizar la AI para funciones como resumir grabaciones de voz o generar respuestas inteligentes en aplicaciones de mensajería.
Search Generative Experience: Géminis está haciendo que la experiencia de búsqueda generativa sea más rápida y precisa.
Google AI Studio y Vertex AI: Los desarrolladores y empresas pueden acceder a Géminis Pro a través de estas plataformas para desarrollar aplicaciones y servicios innovadores.
Android 14: Los desarrolladores de Android podrán utilizar Géminis Nano para crear aplicaciones más inteligentes y con mayor capacidad de respuesta.
¿Google está exagerando con Gemini?
El video de Gemini respondiendo preguntas es impresionante, pero es posible que no sea en tiempo real.
Muchos no notaron un detalle y es que el descargo de responsabilidad del video dice que Google ha estado recopilando imágenes de Gemini durante un período de tiempo.
Y es probable que hayan editado esas imágenes para crear un video que sea más impresionante y llamativo.
Si bien no podemos saber con certeza si el video es real o no, la duda es comprensible.
Google tiene un historial de exagerar las capacidades de sus productos, y muchos desarrolladores no confían en la empresa a la primera.
Por un lado, es posible que Google haya editado el video para hacerlo más impactante, pero esto no significa necesariamente que Gemini sea una mala herramienta, pero sí sugiere que Google está tratando de crear una impresión favorable de su producto.
Por otro lado, es posible que Gemini no sea capaz de responder preguntas en tiempo real en su forma actual.
Más que un modelo de AI
Gemini de Google emerge como un competidor formidable en el mundo de la inteligencia artificial, desafiando la supremacía de ChatGPT. Con su versatilidad multimodal, eficiencia adaptativa y rendimiento superior, Gemini ha demostrado ser más que un simple modelo de AI.
La era de Gemini ha comenzado, y la pregunta no es sólo si puede destronar a ChatGPT, sino cómo transformará radicalmente nuestra interacción con la tecnología.