OpenAI lanza GPT-4o y crece la competencia con Google

Esta es una de las novedades de la empresa matriz de ChatGPT, quien realizó una transmisión para presentar la capacidad de la herramienta en la generación de audio, video y texto.

May 13, 2024 - 13:36

OpenAI lanza GPT-4o y crece la competencia con Google

OpenAI , la empresa de Inteligencia Artificial matriz de ChatGPT, anunció el lanzamiento del un nuevo modelo de inteligencia Artificial llamado GPT-4o . Este nuevo modelo podrá aceptar como entrada cualquier combinación de texto, audio e imagen, y generar cualquier combinación de salidas de texto, audio e imagen, de acuerdo con su publicación oficial. Durante un evento en directo, la directora de tecnología de OpenAI, Mira Murati, reveló detalles sobre el GPT-4o. Una de las características destacadas es que este modelo se ofrecerá de forma gratuita, en contraste con los modelos anteriores de la empresa, además de ser "mucho más rápido". "Esta es la primera vez que realmente estamos dando un gran paso adelante en cuanto a la facilidad de uso", comentó Murati. Según Murati, esto se debe a la mayor eficiencia del GPT-4o en comparación con sus predecesores. Además, se anunció que los usuarios de pago de GPT-4o disfrutarán de mayores límites de capacidad en comparación con los usuarios de pago de los modelos anteriores. De acuerdo con la compañía, esta medida busca incentivar la adopción del nuevo modelo entre aquellos que requieren capacidades avanzadas de IA para sus proyectos.

¿Qué puede hacer el nuevo modelo de GPT-4o? Las capacidades del GPT-4o son amplias y diversas. De acuerdo con la compañía, puede igualar el rendimiento del GPT-4 Turbo en texto en inglés y código, con una mejora significativa en texto en idiomas no ingleses. Especialmente sobresale en comprensión de visión y audio en comparación con los modelos existente. Las exploraciones de capacidades son diversas e incluyen desde narrativas visuales hasta juegos como "piedra, papel o tijera". Además, también tiene alto rendimiento y velocidad en inteligencia de texto, razonamiento y codificación, estableciendo nuevos estándares en capacidades multilingües, de audio y visión. "Este lanzamiento marca un paso significativo hacia adelante en la capacidad de las máquinas para comprender y generar contenido en múltiples modalidades, y representa un emocionante avance en la dirección de una interacción más natural y fluida entre humanos y computadoras", mencionó la empresa.

]]>