OpenAI lanza prueba de o3: ¿cada vez más cerca de la IA General?

2024-12-25 HaiPress

El modelo de razonamiento o3 está disponible,por ahora,en modo prueba para investigadores de seguridad. Con este modelo,OpenAI dijo que se está acercando cada vez más a la Inteligencia Artificial General,aunque el sistema,según François Chollet,aún no puede considerarse como tal.

Comparte

OpenAI lanzó en modo de prueba o3,su modelo de razonamiento más avanzado,que,según la compañía,se acerca en algunas condiciones a la Inteligencia Artificial General (AGI,por sus siglas en inglés).

En el último día de su evento de 12 días,la empresa de tecnología anunció que o3 ya está disponible para investigadores en materia de seguridad,con el fin de complementar su proceso de prueba.

La compañía planea lanzar o3 mini ―un modelo más pequeño y optimizado para tareas específicas― en enero de 2025 y más tarde o3 ―la versión más completa que podría realizar tareas generales.

Con esta nueva familia de modelos,la gigante de IA está avanzando hacia la Inteligencia Artificial General,un campo teórico de la IA que busca desarrollar sistemas que posean un autocontrol autónomo,un grado razonable de autocomprensión y la capacidad de aprender nuevas habilidades.

Es decir,hipotéticamente la AGI tendría habilidades humanas y sería capaz de resolver tareas complejas con capacidades cognitivas superiores. Sin embargo,se trata todavía de un campo de investigación en desarrollo y aún no está claro si en realidad se puede materializar.

No obstante,OpenAI señaló que o3 se está acercando cada vez más a la Inteligencia Artificial General. El modelo tuvo una puntuación de 87.5 por ciento en el indicador ARC-AGI,que mide la eficiencia de la adquisición de habilidades de IA en tareas desconocidas,más allá de sus datos de entrenamiento.

En este indicador,el modelo o3 triplicó el desempeño de su predecesor,el 01.

François Chollet,exingeniero sénior de Google y cocreador de ARC-AGI,dijo a través de su cuenta de X,que los resultados de o3 durante la prueba en ARC-AGI “representan un avance significativo para lograr que la IA se adapte a tareas novedosas”.

Today OpenAI announced o3,its next-gen reasoning model. We've worked with OpenAI to test it on ARC-AGI,and we believe it represents a significant breakthrough in getting AI to adapt to novel tasks.

It scores 75.7% on the semi-private eval in low-compute mode (for $20 per task… pic.twitter.com/ESQ9CNVCEA

— François Chollet (@fchollet) December 20,2024

Aunque reconoció que el modelo representa un hito hacia la Inteligencia Artificial General,Chollet advirtió que no cree que esto sea AGI.

“Todavía hay una cantidad considerable de tareas ARC-AGI-1 muy fáciles que o3 no puede resolver,y tenemos indicios tempranos de que ARC-AGI-2 seguirá siendo extremadamente desafiante para o3”.

“Esto demuestra que todavía es posible crear puntos de referencia interesantes y no saturados que sean fáciles para los humanos,pero imposibles para la IA,sin involucrar conocimientos especializados. Tendremos IA General cuando la creación de tales evaluaciones se vuelva completamente imposible”,explicó François Chollet.

Destacado: Elon Musk pide a tribunal que impida a OpenAI convertirse en empresa con fines de lucro

Las afirmaciones de Chollet indican que o3 aún no es Inteligencia Artificial General,pero el experto admitió que es necesario actualizar la prueba ARC-AGI.

Con la versión actual,“un humano inteligente o un pequeño panel de humanos promedio aún podrían obtener una puntuación mayor a 95 por ciento”,que sería superior a la de 03,detalló.

o3 piensa antes de responder

Los modelos de razonamiento como o3 verifican sus propios datos,por lo que tarda más tiempo en responder para resolver un problema pero puede ser más confiable. En especial,este modelo sirve para resolver problemas en ámbitos como la programación,matemáticas,física y las ciencias duras.

Los especialistas de OpenAI explicaron que el modelo se entrenó mediante aprendizaje de refuerzo para tener una cadena privada de pensamiento,es decir,el modelo piensa antes de responder.

Cuando recibe una indicación,o3 hace una pausa,fragmenta la solicitud y la relaciona con indicaciones previas para devolver el resultado más preciso de acuerdo con el tiempo de cálculo.

A diferencia de 01,este nuevo modelo en fase de prueba permite configurar el tiempo de cálculo,así que puede brindar resultados en velocidades altas,medias y bajas de procesamiento de datos.

O3,además,no sólo encuentra una solución sino que también es capaz de explicar su razonamiento para llegar a una conclusión determinada.

Por ahora,la nueva familia de modelos está en fase de pruebas de seguridad antes de abrirse al público.

A pesar de los avances que ha logrado OpenAI en sus modelos,todavía no están exentos de riesgos como las alucinaciones y errores importantes en su razonamiento.En cuanto a su nombre,OpenAI decidió ponerle o3 (saltándose el o2) debido a una cuestión de propiedad intelectual,ya que la marca O2 es de la filial británica de Telefónica,que lleva dicho nombre.

Declaración: este artículo se reproduce desde otros medios. El propósito de la reimpresión es transmitir más información. No significa que este sitio web esté de acuerdo con sus puntos de vista y sea responsable de su autenticidad, y no tiene ninguna responsabilidad legal. Todos los recursos de este sitio se recopilan en Internet. El propósito de compartir es solo para el aprendizaje y la referencia de todos. Si hay una infracción de derechos de autor o propiedad intelectual, por favor déjenos un mensaje.

OpenAI lanza prueba de o3: ¿cada vez más cerca de la IA General?

o3 piensa antes de responder

El más nuevo

TikTok no habría protegido las cuentas de menores de edad en Europa

Samsung y Broadcom unen fuerzas en fundición y memorias para la próxima generación de IA

Stablecoins dominan 80% del volumen mensual de criptoactivos en Brasil

Nvidia y SK Group sellan alianza para impulsar fábricas de IA

50% de energía futura para Centros de Datos será en corriente directa: ABB

IBM adquiere HRL Laboratories de Boeing y GM para cómputo cuántico

Enlace amigable