Todo lo que necesitas saber de Gemini, la IA de Google

Gemini, la IA de Google

Google DeepMind presenta su nuevo modelo Gemini: LLM tiene tres versiones, Ultra, Pro (ya integrada con Bard) y Nano (para dispositivos móviles).

Modelo Gemini: tamaño

Gemini está optimizado en tres tamaños: Ultra, Pro y Nano.

  • Ultra: el modelo más grande y capaz para tareas complejas
  • Pro: el mejor modelo para escalar en una amplia gama de tareas
  • Nano: el modelo más eficiente para tareas en el dispositivo

Modelo Gemini: multimodal

Gemini Ultra es multimodal de forma nativa, está capacitado en un gran conjunto de bases de código, textos en diferentes idiomas, audio, imágenes y videos, comprende información matizada y responde preguntas relacionadas con temas complejos, particularmente matemáticas y física.

Gemini está construido desde cero para ser multimodal.

Esto incluye:

  • Texto
  • Código
  • Audio
  • Imagen
  • Video

Esto significa que puede operar y combinar diferentes tipos de información.

Modelo Gemini: desempeño

El desempeño de Gemini Ultra supera los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos ampliamente utilizados.

Con una puntuación del 90,0%, Gemini Ultra es el primer modelo que supera a los expertos humanos en comprensión masiva del lenguaje multitarea (MMLU).

Modelo Gemini: aplicaciones

La multimodalidad de Gemini le brinda el potencial de transformar cualquier tipo de entrada en cualquier tipo de salida.

  • Generar código basado en diferentes entradas
  • Generar texto e imágenes, combinados
  • Razonar visualmente en todos los idiomas

Desarrollo

A partir del 13 de diciembre, los desarrolladores y clientes empresariales podrán acceder a Gemini Pro a través de la API de Gemini en Google AI Studio o Google Cloud Vertex AI.

Google está perfeccionando aún más el modelo Gemini Ultra antes de ponerlo a disposición del público a principios del próximo año.

Gemini Ultra se lanzará para desarrolladores y clientes empresariales a principios del próximo año.

Gemini tiene capacidades de razonamiento sofisticado

El modelo también es avanzado en matemáticas y codificación. Mira esta demostración:

En comparación con GPT-4, Gemini es ligeramente mejor en los puntos de referencia estándar: 2,2% mejor en GSM8K (preguntas de matemáticas), 1,5% en DROP (comprensión de lectura), 0,6% en VQAv2 (comprensión de palabras) y 0,5% en Big- Banco Duro (razonamiento).

Cómo usar Gemini en tu computadora

Necesitas configurar el idioma predeterminado del navegador en inglés, después accede a la versión de Bard en este idioma en el sitio web del chatbot (bard.google.com). Si es necesario cambiar el idioma preferido en el navegador, deberás seguir los pasos a continuación:

Paso 1. Accede a la configuración de la cuenta de Google (myaccount.google.com/language) o haz clic en el icono con la foto de perfil, en la esquina superior derecha de Chrome;

Paso 2. Seleccione la opción «Administrar su cuenta de Google»;

Paso 3. Haga clic en «Información personal» en el menú del lado izquierdo de la pantalla;

Paso 4. Desplácese hacia abajo hasta encontrar la opción «Preferencias web generales». A continuación, haga clic en “Idioma”;

Paso 5. Haga clic en el ícono del lápiz para editar su idioma preferido;

Paso 6. Busque el idioma «Inglés» y haga clic en la opción;

Paso 7. Elija una de las opciones de idioma y luego haga clic en «Guardar» para completar el cambio;

Paso 8. Luego de modificar la configuración de tu cuenta de Google, simplemente accede nuevamente al sitio web de Bard, el cual funcionará automáticamente en su versión en inglés, con soporte para el modelo de idioma Gemini Pro.

Visita la sección de Inteligencia Artificial para más contenido.