Ir al contenido principal

ChatGPT-5: Adaptativo, multimodal y racional.


OpenAI está desarrollando ChatGPT-5, la próxima generación de su chatbot, que promete transformar la inteligencia artificial con mejoras significativas en comprensión del lenguaje, conversación contextual, y la introducción de capacidades multimodales como traducción de texto y voz, aprendizaje automático avanzado, análisis predictivo, y el manejo de imágenes y video. A pesar de que no se ha establecido una fecha oficial de lanzamiento, y considerando que el lapso de cinco meses entre GPT-3.5 y GPT-4 ya no sirve como referencia válida, el CEO de OpenAI, Sam Altman, ha comenzado a darnos algunas señales sobre el futuro desarrollo.

Se anticipaba que el lanzamiento de ChatGPT-5 podría ocurrir entre 2025 y 2027, aunque algunas fuentes sugerían la posibilidad de adelantarlo a finales de 2024, debido al rápido progreso de OpenAI. Este avance ha sido impulsado en gran medida por las significativas inversiones de Microsoft, que no solo han aumentado la valoración de OpenAI a 29 mil millones de dólares con una inversión previa de 10 mil millones de dólares, sino que también se prepara para proporcionar más financiación. Este apoyo financiero adicional busca acelerar el desarrollo hacia la inteligencia artificial general (AGI).

 

Lenta evolución en el abismo de la desilusión. 

La línea del tiempo de la Inteligencia Artificial (IA) desde sus inicios hasta el anuncio del proyecto ChatGPT 5 abarca varios hitos importantes. A continuación, presento un resumen breve de esta evolución:

En los años de 1940 a 1950 se comienza con los fundamentos teóricos, uniendo las matemáticas, estadística, teoría de grafos, regresión lineal, computación, etc en robustas aplicaciones para análisis de datos de forma semiautomática. En 1943 Warren McCulloch y Walter Pitts crearon un modelo computacional para redes neuronales y fue en 1950 cuando Alan Turing publicó "Computing Machinery and Intelligence", proponiendo el test de Turing para evaluar la inteligencia de una máquina. 

Posteriormente, en 1956 en la conferencia de Dartmouth, organizada por John McCarthy, se considera el nacimiento oficial de la IA como campo de estudio. McCarthy acuñó el término "inteligencia artificial". Este campo experimenta una importante expansión y optimismo entre 1960 y 1970, en gran medida por aplicaciones como ELIZA, creada por Joseph Weizenbaum en 1966, que se convierte en uno de los primeros programas capaces de procesar el lenguaje natural. En 1969 se desarrollaron los primeros robots móviles inteligentes en el MIT. 

De allí, en 1980, después de más de una década de pocos avances en este campo, se da un resurgimiento con los sistemas basados en conocimiento y la introducción de las redes neuronales. En este año, se desarrolla el Proyecto de la Quinta Generación de Computadoras en Japón, enfocado en la IA. Y posteriormente en 1990 con el auge de internet y de algoritmos de aprendizaje automático se desarrollan sistemas de IA como Deep Blue en 1997, de IBM, que derrota al campeón mundial de ajedrez, Gary Kasparov. Esto catapultó el interés en el aprendizaje automático y las redes neuronales, especialmente con el desarrollo del algoritmo de retropropagación. 

Posteriormente, en 2006: Geoffrey Hinton y otros reintroducen las redes neuronales con el concepto de "aprendizaje profundo". En 2011 IBM Watson gana en Jeopardy!, un popular juego de televisión en EUA. En 2012 AlexNet, una red neuronal convolucional, gana la competencia ImageNet, marcando un punto de inflexión para el aprendizaje profundo en visión por computadora. Pero es en el periodo de 2014 a 2016 cuando surge la atención en modelos de procesamiento de lenguaje natural (NLP), con desarrollos como Seq2Seq. 

Es entonces, cuando basado en estos modelos de NLP, en 2020 se lanza GPT-3 de OpenAI, un modelo de lenguaje preentrenado con capacidades de generación de texto avanzadas. En 2022, OpenAI introduce ChatGPT, basado en GPT-3.5 y luego en versiones más avanzadas, revolucionando la interacción con IA mediante conversaciones naturales y fluidas. Finalmente, el 14 marzo de 2023 se lanza ChatGPT-4.

 

ChatGPT aceleró la evolución y elevó las expectativas.

Para poner en contexto, la evolución de GPT-3 a GPT-4 marcó un salto significativo, pasando de 175 mil millones a 100 trillones de parámetros de aprendizaje automático, mejorando sustancialmente la capacidad del modelo para manejar consultas complejas con un razonamiento más sofisticado y respuestas más "humanas". Este avance sentó las bases para ChatGPT 5, que se espera no solo aumente la cantidad de parámetros sino que optimice su interacción, emulando más de cerca la eficiencia del razonamiento humano. Este enfoque en la eficiencia podría representar un cambio de paradigma en la inteligencia artificial, apuntando hacia una integración y aplicación más amplias en sectores clave como negocios, investigación, educación y medicina.

OpenAI ha lanzado recientemente actualizaciones y nuevas herramientas para GPT-4, buscando crear un ecosistema similar a la App Store de Apple, que incluye versiones personalizadas de ChatGPT y una tienda virtual dedicada para desarrolladores y empresas. Esta iniciativa, según Altman, apunta a convertirse en un acceso directo a su oferta estrella: una "inteligencia ubicua basada en la nube". Paralelamente, se está delineando la estrategia para GPT-5, enfocándose en la recolección de una amplia y diversa gama de datos de entrenamiento, especialmente en formatos conversacionales y textos detallados, aunque los detalles completos de su potencial se mantendrán confidenciales hasta que el desarrollo esté más avanzado. 

En julio de 2023, OpenAI solicitó el registro de la marca GPT-5 en la oficina estadounidense de patentes y marcas, un proceso que puede extenderse por varios meses. A pesar de esto, en agosto, el CEO de OpenAI afirmaba que aún no estaban entrenando GPT-5 y que no lo harían pronto, posición que se reafirmó en septiembre, señalando la necesidad de más auditorías de seguridad y trabajo previo. Esta secuencia de eventos sugiere que, aunque el desarrollo de GPT-5 no había comenzado oficialmente, los preparativos estaban en marcha.

En enero de 2024, Sam Altman reveló en el podcast "Unconfuse Me" que OpenAI se concentra en ampliar las funcionalidades de sus modelos de lenguaje hacia la multimodalidad, incluyendo voz, imágenes y video, similar al Gemini Ultra de Google. Con GPT-5, OpenAI apunta a mejorar significativamente en áreas como el razonamiento avanzado, superando las limitaciones actuales de GPT-4, y la fiabilidad, buscando que las respuestas sean consistentemente precisas. Además, GPT-5 se enfocará en la adaptabilidad y personalización, permitiendo a los usuarios utilizar sus propios datos para experiencias más personalizadas.

Se espera que GPT-5 ofrezca un salto cualitativo respecto a GPT-4, incluyendo mejoras en precisión, fiabilidad, y una gama más amplia de funciones como conversación oral y procesamiento de video. Esto requerirá un aumento significativo en el volumen de datos y capacidad de procesamiento, implicando mayores inversiones en hardware. 

Técnicamente, GPT-4 ya representó un avance al integrar la infraestructura de Azure, ordenadores de Microsoft, y chips A100 de NVIDIA, prometiendo un rendimiento cercano al humano. Aunque los detalles de monetización de GPT-5 son inciertos, se anticipa que siga un modelo de suscripción similar al actual, donde GPT-4 y sus variantes requieren pago, sugiriendo que GPT-4 podría convertirse en el modelo estándar gratuito de OpenAI, reemplazando a GPT-3.5.

Sin embargo, el enfoque meticulosos en la calidad, confiabilidad y seguridad, subraya el compromiso de OpenAI con la creación de una herramienta de IA robusta.

 

Conclusiones: 

OpenAI está avanzando en el desarrollo de ChatGPT-5, que promete ser un hito en la inteligencia artificial, porque se enfoca en la multimodalidad, el razonamiento avanzado, la fiabilidad, la adaptabilidad y la personalización, elementos que sugieren un futuro donde la IA será más integral y personalizada. Las inversiones en hardware y la integración de tecnologías avanzadas son cruciales para este avance, indicando que GPT-5 podría seguir un modelo de suscripción para su monetización, alineándose con las estrategias actuales de OpenAI. 

Este progreso refleja el compromiso de OpenAI con la innovación y la calidad, preparando el terreno para una inteligencia artificial más avanzada y accesible, que podría redefinir la interacción entre humanos y máquinas en el futuro cercano.

 

Referencias:

  • Castillo-González, W., Lepez, CO y Bonardi, MC (2022). Chat GPT: una herramienta prometedora para la edición académica. Metadatos de datos , 1 , 23.
  • Celi-Parraga, R. J., Varela-Tapia, E. A., Acosta-Guzmán, I. L., & Montaño-Pulzara, N. R. (2021). Técnicas de procesamiento de lenguaje natural en la inteligencia artificial conversacional textual. AlfaPublicaciones3(4.1), 40-52.
  • Diego Olite, FM, Morales Suárez, IDR, & Vidal Ledo, MJ (2023). Chat GPT: origen, evolución, retos e impactos en la educación. Educación Médica Superior , 37 (2).
  • Gelbukh, A. (2010). Procesamiento de lenguaje natural y sus aplicaciones. Komputer Sapiens1, 6-11.
  • https://www.genbeta.com/nuevo/gpt-5-que-cuando-sale-como-funcionara-toda-informacion
  • Herrera, L., & Muñoz, D. (1992). Inteligencia artificial y lenguaje natural. Lenguas Modernas, (19), 157-165.
  • Hill-Yardin, EL, Hutchinson, MR, Laycock, R. y Spencer, SJ (2023). Una charla (GPT) sobre el futuro de la publicación científica. Inmunidad al comportamiento cerebral , 110 , 152-154.
  • https://vanguardia.com.mx/noticias/open-ai-esta-desarrollando-oficialmente-el-chatgpt-5-FB10003457
  • https://www.geektopia.es/es/technology/2024/02/09/noticias/openai-ya-perfila-chatgpt-5-la-gran-evolucion-de-la-ia.html
  • Singh, SK, Kumar, S. y Mehra, PS (junio de 2023). Chat GPT y Google Bard AI: una revisión. En 2023 Conferencia internacional sobre IoT, tecnología de comunicación y automatización (ICICAT) (págs. 1-6). IEEE.


Comentarios

Entradas populares de este blog

Un binomio para el éxito corporativo: Formulación de problemas + IA Generativa.

En tiempos de la IA generativa, hacer las preguntas correctas no es suficiente para tener soluciones efectivas a un problema que aún no se comprende. Con el aumento de la inteligencia artificial generativa y su uso democrático, se destaca el surgimiento del “Prompt Engineering”, catalogado por el Foro Económico Mundial y el CEO de OpenAI, Sam Altman, como una habilidad crítica y altamente influyente. Este campo implica la optimización de entradas de texto para interactuar eficazmente con modelos de lenguaje avanzados, mostrando un cambio significativo en cómo interactuamos con las máquinas mediante el lenguaje natural, en contraste con métodos anteriores más restrictivos y técnicos. Jaime Teevan, científico jefe de Microsoft, expresa un optimismo creciente sobre el potencial de la IA para transformar radicalmente la productividad laboral. Sin embargo, Oguz Acar en su artículo para HBR argumenta que, a pesar de su prominencia, el prompt engineering podría ser una habilidad efímera d...

La automatización cognitiva en los negocios.

En este artículo, profundizamos en un nivel más avanzado de automatización: “ La automatización cognitiva” . Esta tecnología está ganando impulso gracias a la creciente accesibilidad y aplicación de la inteligencia artificial, particularmente mediante técnicas avanzadas de deep learning y machine learning. Además, la evolución de tecnologías exponenciales que discutimos anteriormente en el pasado post de este blog, cómo el Internet de las Cosas (IoT), la computación en la nube, el big data y la red 5G, están catalizando la expansión, el fortalecimiento y la mejora de la automatización cognitiva. El ingrediente clave para este avance es la abundancia de datos, que actúan como la materia prima esencial para estas tecnologías. Con este panorama, exploraremos cómo la automatización cognitiva está redefiniendo los negocios y la tecnología, abriendo nuevas posibilidades y desafíos en el panorama empresarial actual. Sobre la tecnología. La automatización cognitiva se refiere a una tecnolo...

NVIDIA en el centro del tablero de la IA generativa.

Después de un despegue con un gran ruido mediático de ChatGPT y de la IA generativa, hoy se presenta un mar en calma y se respira tranquilidad en el ambiente, o al menos eso pudieran pensar mucho usuarios, enfocándose a seguir obteniendo provecho de las herramientas tecnológicas de IA generativa, para diversos fines, ya sea para generar texto, código, imágenes y hasta video. Sin embargo y no tan tras bambalinas, el mundo de la Inteligencia Artificial (IA) está inmerso en una inédita batalla industrial. Gigantes tecnológicos como Microsoft y Google se encuentran en una intensa competencia, no solo en sus dominios tradicionales, sino también por conquistar emergentes mercados. En este contexto, fuertes participantes del ecosistema movilizan sus vastos recursos para desarrollar cerebros artificiales más avanzados y potentes. Además, nuevos contendientes se integran en la arena con el objetivo de asegurarse un lugar en esta revolución industrial. Escuchaba hace algunos días a un expone...