Ir al contenido principal

ChatGPT-5: Adaptativo, multimodal y racional.


OpenAI está desarrollando ChatGPT-5, la próxima generación de su chatbot, que promete transformar la inteligencia artificial con mejoras significativas en comprensión del lenguaje, conversación contextual, y la introducción de capacidades multimodales como traducción de texto y voz, aprendizaje automático avanzado, análisis predictivo, y el manejo de imágenes y video. A pesar de que no se ha establecido una fecha oficial de lanzamiento, y considerando que el lapso de cinco meses entre GPT-3.5 y GPT-4 ya no sirve como referencia válida, el CEO de OpenAI, Sam Altman, ha comenzado a darnos algunas señales sobre el futuro desarrollo.

Se anticipaba que el lanzamiento de ChatGPT-5 podría ocurrir entre 2025 y 2027, aunque algunas fuentes sugerían la posibilidad de adelantarlo a finales de 2024, debido al rápido progreso de OpenAI. Este avance ha sido impulsado en gran medida por las significativas inversiones de Microsoft, que no solo han aumentado la valoración de OpenAI a 29 mil millones de dólares con una inversión previa de 10 mil millones de dólares, sino que también se prepara para proporcionar más financiación. Este apoyo financiero adicional busca acelerar el desarrollo hacia la inteligencia artificial general (AGI).

 

Lenta evolución en el abismo de la desilusión. 

La línea del tiempo de la Inteligencia Artificial (IA) desde sus inicios hasta el anuncio del proyecto ChatGPT 5 abarca varios hitos importantes. A continuación, presento un resumen breve de esta evolución:

En los años de 1940 a 1950 se comienza con los fundamentos teóricos, uniendo las matemáticas, estadística, teoría de grafos, regresión lineal, computación, etc en robustas aplicaciones para análisis de datos de forma semiautomática. En 1943 Warren McCulloch y Walter Pitts crearon un modelo computacional para redes neuronales y fue en 1950 cuando Alan Turing publicó "Computing Machinery and Intelligence", proponiendo el test de Turing para evaluar la inteligencia de una máquina. 

Posteriormente, en 1956 en la conferencia de Dartmouth, organizada por John McCarthy, se considera el nacimiento oficial de la IA como campo de estudio. McCarthy acuñó el término "inteligencia artificial". Este campo experimenta una importante expansión y optimismo entre 1960 y 1970, en gran medida por aplicaciones como ELIZA, creada por Joseph Weizenbaum en 1966, que se convierte en uno de los primeros programas capaces de procesar el lenguaje natural. En 1969 se desarrollaron los primeros robots móviles inteligentes en el MIT. 

De allí, en 1980, después de más de una década de pocos avances en este campo, se da un resurgimiento con los sistemas basados en conocimiento y la introducción de las redes neuronales. En este año, se desarrolla el Proyecto de la Quinta Generación de Computadoras en Japón, enfocado en la IA. Y posteriormente en 1990 con el auge de internet y de algoritmos de aprendizaje automático se desarrollan sistemas de IA como Deep Blue en 1997, de IBM, que derrota al campeón mundial de ajedrez, Gary Kasparov. Esto catapultó el interés en el aprendizaje automático y las redes neuronales, especialmente con el desarrollo del algoritmo de retropropagación. 

Posteriormente, en 2006: Geoffrey Hinton y otros reintroducen las redes neuronales con el concepto de "aprendizaje profundo". En 2011 IBM Watson gana en Jeopardy!, un popular juego de televisión en EUA. En 2012 AlexNet, una red neuronal convolucional, gana la competencia ImageNet, marcando un punto de inflexión para el aprendizaje profundo en visión por computadora. Pero es en el periodo de 2014 a 2016 cuando surge la atención en modelos de procesamiento de lenguaje natural (NLP), con desarrollos como Seq2Seq. 

Es entonces, cuando basado en estos modelos de NLP, en 2020 se lanza GPT-3 de OpenAI, un modelo de lenguaje preentrenado con capacidades de generación de texto avanzadas. En 2022, OpenAI introduce ChatGPT, basado en GPT-3.5 y luego en versiones más avanzadas, revolucionando la interacción con IA mediante conversaciones naturales y fluidas. Finalmente, el 14 marzo de 2023 se lanza ChatGPT-4.

 

ChatGPT aceleró la evolución y elevó las expectativas.

Para poner en contexto, la evolución de GPT-3 a GPT-4 marcó un salto significativo, pasando de 175 mil millones a 100 trillones de parámetros de aprendizaje automático, mejorando sustancialmente la capacidad del modelo para manejar consultas complejas con un razonamiento más sofisticado y respuestas más "humanas". Este avance sentó las bases para ChatGPT 5, que se espera no solo aumente la cantidad de parámetros sino que optimice su interacción, emulando más de cerca la eficiencia del razonamiento humano. Este enfoque en la eficiencia podría representar un cambio de paradigma en la inteligencia artificial, apuntando hacia una integración y aplicación más amplias en sectores clave como negocios, investigación, educación y medicina.

OpenAI ha lanzado recientemente actualizaciones y nuevas herramientas para GPT-4, buscando crear un ecosistema similar a la App Store de Apple, que incluye versiones personalizadas de ChatGPT y una tienda virtual dedicada para desarrolladores y empresas. Esta iniciativa, según Altman, apunta a convertirse en un acceso directo a su oferta estrella: una "inteligencia ubicua basada en la nube". Paralelamente, se está delineando la estrategia para GPT-5, enfocándose en la recolección de una amplia y diversa gama de datos de entrenamiento, especialmente en formatos conversacionales y textos detallados, aunque los detalles completos de su potencial se mantendrán confidenciales hasta que el desarrollo esté más avanzado. 

En julio de 2023, OpenAI solicitó el registro de la marca GPT-5 en la oficina estadounidense de patentes y marcas, un proceso que puede extenderse por varios meses. A pesar de esto, en agosto, el CEO de OpenAI afirmaba que aún no estaban entrenando GPT-5 y que no lo harían pronto, posición que se reafirmó en septiembre, señalando la necesidad de más auditorías de seguridad y trabajo previo. Esta secuencia de eventos sugiere que, aunque el desarrollo de GPT-5 no había comenzado oficialmente, los preparativos estaban en marcha.

En enero de 2024, Sam Altman reveló en el podcast "Unconfuse Me" que OpenAI se concentra en ampliar las funcionalidades de sus modelos de lenguaje hacia la multimodalidad, incluyendo voz, imágenes y video, similar al Gemini Ultra de Google. Con GPT-5, OpenAI apunta a mejorar significativamente en áreas como el razonamiento avanzado, superando las limitaciones actuales de GPT-4, y la fiabilidad, buscando que las respuestas sean consistentemente precisas. Además, GPT-5 se enfocará en la adaptabilidad y personalización, permitiendo a los usuarios utilizar sus propios datos para experiencias más personalizadas.

Se espera que GPT-5 ofrezca un salto cualitativo respecto a GPT-4, incluyendo mejoras en precisión, fiabilidad, y una gama más amplia de funciones como conversación oral y procesamiento de video. Esto requerirá un aumento significativo en el volumen de datos y capacidad de procesamiento, implicando mayores inversiones en hardware. 

Técnicamente, GPT-4 ya representó un avance al integrar la infraestructura de Azure, ordenadores de Microsoft, y chips A100 de NVIDIA, prometiendo un rendimiento cercano al humano. Aunque los detalles de monetización de GPT-5 son inciertos, se anticipa que siga un modelo de suscripción similar al actual, donde GPT-4 y sus variantes requieren pago, sugiriendo que GPT-4 podría convertirse en el modelo estándar gratuito de OpenAI, reemplazando a GPT-3.5.

Sin embargo, el enfoque meticulosos en la calidad, confiabilidad y seguridad, subraya el compromiso de OpenAI con la creación de una herramienta de IA robusta.

 

Conclusiones: 

OpenAI está avanzando en el desarrollo de ChatGPT-5, que promete ser un hito en la inteligencia artificial, porque se enfoca en la multimodalidad, el razonamiento avanzado, la fiabilidad, la adaptabilidad y la personalización, elementos que sugieren un futuro donde la IA será más integral y personalizada. Las inversiones en hardware y la integración de tecnologías avanzadas son cruciales para este avance, indicando que GPT-5 podría seguir un modelo de suscripción para su monetización, alineándose con las estrategias actuales de OpenAI. 

Este progreso refleja el compromiso de OpenAI con la innovación y la calidad, preparando el terreno para una inteligencia artificial más avanzada y accesible, que podría redefinir la interacción entre humanos y máquinas en el futuro cercano.

 

Referencias:

  • Castillo-González, W., Lepez, CO y Bonardi, MC (2022). Chat GPT: una herramienta prometedora para la edición académica. Metadatos de datos , 1 , 23.
  • Celi-Parraga, R. J., Varela-Tapia, E. A., Acosta-Guzmán, I. L., & Montaño-Pulzara, N. R. (2021). Técnicas de procesamiento de lenguaje natural en la inteligencia artificial conversacional textual. AlfaPublicaciones3(4.1), 40-52.
  • Diego Olite, FM, Morales Suárez, IDR, & Vidal Ledo, MJ (2023). Chat GPT: origen, evolución, retos e impactos en la educación. Educación Médica Superior , 37 (2).
  • Gelbukh, A. (2010). Procesamiento de lenguaje natural y sus aplicaciones. Komputer Sapiens1, 6-11.
  • https://www.genbeta.com/nuevo/gpt-5-que-cuando-sale-como-funcionara-toda-informacion
  • Herrera, L., & Muñoz, D. (1992). Inteligencia artificial y lenguaje natural. Lenguas Modernas, (19), 157-165.
  • Hill-Yardin, EL, Hutchinson, MR, Laycock, R. y Spencer, SJ (2023). Una charla (GPT) sobre el futuro de la publicación científica. Inmunidad al comportamiento cerebral , 110 , 152-154.
  • https://vanguardia.com.mx/noticias/open-ai-esta-desarrollando-oficialmente-el-chatgpt-5-FB10003457
  • https://www.geektopia.es/es/technology/2024/02/09/noticias/openai-ya-perfila-chatgpt-5-la-gran-evolucion-de-la-ia.html
  • Singh, SK, Kumar, S. y Mehra, PS (junio de 2023). Chat GPT y Google Bard AI: una revisión. En 2023 Conferencia internacional sobre IoT, tecnología de comunicación y automatización (ICICAT) (págs. 1-6). IEEE.


Comentarios

Entradas populares de este blog

NVIDIA en el centro del tablero de la IA generativa.

Después de un despegue con un gran ruido mediático de ChatGPT y de la IA generativa, hoy se presenta un mar en calma y se respira tranquilidad en el ambiente, o al menos eso pudieran pensar mucho usuarios, enfocándose a seguir obteniendo provecho de las herramientas tecnológicas de IA generativa, para diversos fines, ya sea para generar texto, código, imágenes y hasta video. Sin embargo y no tan tras bambalinas, el mundo de la Inteligencia Artificial (IA) está inmerso en una inédita batalla industrial. Gigantes tecnológicos como Microsoft y Google se encuentran en una intensa competencia, no solo en sus dominios tradicionales, sino también por conquistar emergentes mercados. En este contexto, fuertes participantes del ecosistema movilizan sus vastos recursos para desarrollar cerebros artificiales más avanzados y potentes. Además, nuevos contendientes se integran en la arena con el objetivo de asegurarse un lugar en esta revolución industrial. Escuchaba hace algunos días a un expone...

Ciberseguridad en México. Una perspectiva del lucrativo desafío.

La ciberseguridad evoluciona constantemente debido al avance tecnológico y la creciente sofisticación de los ataques, mientras que la inteligencia artificial emerge como una herramienta dual: vital para detectar y defenderse de amenazas, pero también empleada en el hackeo automatizado.   La ciberseguridad está en auge debido a la hiperconectividad y el flujo masivo de datos, aumentando su valor hasta convertirse en el principal activo competitivo empresarial. Esta digitalización y el creciente valor de los datos han provocado un aumento en los ciberataques a sistemas empresariales, gubernamentales y residenciales, elevando los costos económicos, tan sólo, se estima que, estos ataques costaron 8 billones de USD a la economía global en 2023, con proyecciones que ascienden a 9,5 billones en 2024 y 10,5 billones en 2025. Prever el impacto financiero de estas amenazas es complicado por su constante evolución, pero análisis de Cybersecurity Ventures de los últimos cinco años ofrece una...

Alianzas estratégicas para democratizar la nube.

  Para competir en un entorno dinámico, las empresas deben reforzar su modelo de negocios y a la vez ser flexibles para incorporar servicios fuera de su “Core Business”. La adaptación implica diversas estrategias, que pueden incluir la redefinición del negocio central, como hizo GE al incursionar en la industria 4.0, integrando analítica de datos e Internet de las Cosas Industrial (IIoT) en su estrategia. Esta transformación les permitió liderar con innovaciones de Big Data, optimizando el mantenimiento de equipos y ofreciendo garantías extendidas, ejemplo de ello son las garantías de por vida en sus turbinas de avión. GE incluso trasladó sus oficinas a Silicon Valley, buscando estar en el corazón de la innovación.   Por otro lado, para adaptarse a los cambios de paradigma, las empresas pueden optar por adquirir o fusionarse con otras, incorporando especializaciones sin alterar su Core (en principio), pero mejorando sus capacidades en áreas débiles. Por ejemplo, AT&T exp...