El gigante tecnológico Google ha lanzado Gemini, su modelo de inteligencia artificial más potente hasta ahora. Capaz de entender imágenes, audio y video, Gemini es el primero en superar a los expertos humanos en comprensión masiva de lenguajes multitarea. En este artículo, desentrañaremos la revolución tecnológica que nos trae Google.
Google presentó este miércoles su última creación: Gemini, un modelo de inteligencia artificial diseñado para cambiar la forma en que interactuamos con la tecnología. Accesible desde la plataforma Bard o directamente desde tu teléfono, Gemini no solo comprende texto, sino también imágenes, audio y video, marcando un avance significativo en la inteligencia artificial.
«Creemos en hacer que la IA sea útil para todos. Es por eso que lanzamos Gemini, nuestro modelo más capaz inspirado en la forma en que las personas entienden e interactúan con el mundo», expresó Google a través de su cuenta en la red social X. Destacando su versatilidad, la plataforma multimodal de Gemini puede procesar y generar texto, código, imágenes, audio y vídeo desde diversas fuentes de datos.
Según Google, el rendimiento de Gemini Ultra supera los estándares actuales en 30 de los 32 puntos de referencia académicos utilizados en investigación y desarrollo de modelos de lenguaje. La versión Gemini Pro ya está disponible para los usuarios desde este miércoles, mientras que el próximo año se espera el lanzamiento de Bard Advanced con Gemini Ultra, destinado a tareas aún más complejas.
En palabras de Sundar Pichai, director ejecutivo de Google y Alphabet, esta innovación marca una transición profunda en nuestras vidas, comparándola con hitos anteriores como la llegada de los dispositivos móviles o la web. Pichai destaca el potencial transformador de la IA, afirmando que apenas estamos «comenzando a arañar la superficie de lo que es posible.»
Haciendo hincapié en las oportunidades que la IA puede crear para todos, Pichai señaló que millones de personas ya están utilizando programas de IA para realizar tareas inimaginables hace un año. «La IA tiene el potencial de traer nuevas olas de innovación y progreso económico, impulsando el conocimiento, el aprendizaje, la creatividad y la productividad a una escala nunca antes vista», agregó.
Gemini Ultra, con una impresionante puntuación del 90,0%, se posiciona como el primer modelo que supera a los expertos humanos en comprensión masiva de lenguajes multitarea. La combinación de 57 materias, desde matemáticas y física hasta ética, lo convierte en una herramienta versátil para la resolución de problemas.
En palabras de Demis Hassabis, director ejecutivo y cofundador de Google DeepMind, «siempre creí que si pudiéramos construir máquinas más inteligentes, podríamos aprovecharlas para beneficiar a la humanidad de maneras increíbles.» Con Gemini, Google se acerca a la visión de una IA que se siente menos como un software inteligente y más como un útil asistente experto, un paso significativo hacia un futuro más inteligente e intuitivo.