Inteligencia artificial generativa
La inteligencia artificial generativa o IA generativa es un tipo de sistema de inteligencia artificial (IA) capaz de generar texto, imágenes u otros medios en respuesta a comandos.[1][2] Los modelos de IA generativa aprenden los patrones y la estructura de sus datos de entrenamiento de entrada y luego generan nuevos datos que tienen características similares.[3][4]
Los sistemas de IA generativa notables incluyen ChatGPT (y su variante Bing Chat), un bot conversacional creado por OpenAI usando sus modelos de lenguaje grande fundacionales GPT-3 y GPT-4;[5] y Bard, un bot conversacional creado por Google usando su modelo básico LaMDA.[6] Otros modelos generativos de IA incluyen sistemas de arte de inteligencia artificial como Stable Diffusion, Midjourney y DALL-E.[7]
La IA generativa tiene aplicaciones potenciales en una amplia gama de industrias, que incluyen el arte, la escritura, el desarrollo de software, el diseño de productos, la atención médica, las finanzas, los juegos, el marketing y la moda.[8][9][10] La inversión en IA generativa aumentó a principios de la década de 2020, con grandes empresas como Microsoft, Google y Baidu, así como numerosas empresas más pequeñas que desarrollan modelos de IA generativa.[1][11][12]
Sin embargo, también existen preocupaciones sobre el posible uso indebido de la IA generativa, como la creación de noticias falsas o deepfakes, que pueden usarse para engañar o manipular a las personas.[13] En este mismo sentido, en septiembre de 2023, la UNESCO ha emitido una llamada urgente a los gobiernos de todo el mundo para que regulen de manera eficaz la IA generativa en el ámbito educativo.[14]
Historia
Desde su fundación, el campo del aprendizaje automático ha utilizado modelos estadísticos, incluidos modelos generativos, para modelar y predecir datos. A partir de finales de la década de 2000, el surgimiento del aprendizaje profundo impulsó el progreso y la investigación en el procesamiento de imágenes y videos, el análisis de texto, el reconocimiento de voz y otras tareas. Sin embargo, la mayoría de las redes neuronales profundas se entrenaron como modelos discriminativos que realizan tareas de clasificación, como la clasificación de imágenes basada en redes neuronales convolucionales.
En 2014, avances como el autocodificador variacional y la red generativa adversativa produjeron las primeras redes neuronales profundas prácticas capaces de aprender modelos generativos, en lugar de discriminativos, de datos complejos como imágenes. Estos modelos generativos profundos fueron los primeros capaces de generar no solo etiquetas de clase para imágenes, sino también imágenes completas.[16]
En 2017, la red Transformador permitió avances en los modelos generativos, lo que llevó al primer transformador generativo preentrenado en 2018.[17] A esto le siguió en 2019 GPT-2, que demostró la capacidad de generalizar sin supervisión a muchas tareas diferentes como modelo fundacional.[18]
En 2021, el lanzamiento de DALL-E, un modelo generativo de píxeles basado en transformadores, seguido de Midjourney y Stable Diffusion marcó el surgimiento del arte práctico de inteligencia artificial de alta calidad a partir de indicaciones de lenguaje natural.
En enero de 2023, Futurism.com publicó la historia de que CNET había estado usando una herramienta de IA interna no revelada para escribir al menos 77 de sus historias; después de que se conoció la noticia, CNET publicó correcciones a 41 de las historias.[19]
En marzo de 2023, se lanzó GPT-4. Un equipo de Microsoft Research argumentó que «podría verse razonablemente como una versión temprana (pero aún incompleta) de un sistema de inteligencia artificial fuerte (IAF)».[20]
En abril de 2023, el tabloide alemán Die Aktuelle publicó una entrevista falsa generada por IA con el solitario expiloto de carreras Michael Schumacher. La historia incluía dos posibles revelaciones: la portada incluía la línea «engañosamente real», y dentro de la revista reconocía al final de la entrevista que la entrevista fue generada por IA. El editor en jefe fue despedido poco después en medio de la controversia.[21]
Modalidades
Un sistema generativo de IA se construye aplicando aprendizaje automático no supervisado o autosupervisado a un conjunto de datos. Las capacidades de un sistema de IA generativa dependen de la modalidad o el tipo de conjunto de datos utilizado.
La IA generativa puede ser unimodal o multimodal; los sistemas unimodales toman solo un tipo de entrada, mientras que los sistemas multimodales pueden tomar más de un tipo de entrada.[22] Por ejemplo, una versión de GPT-4 de OpenAI acepta entradas de texto e imágenes.[23]
- Texto: Los sistemas de IA generativa entrenados en palabras o tokens de palabras incluyen GPT-3, LaMDA, LLaMA, BLOOM, GPT-4 y otros. Son capaces de procesamiento de lenguaje natural, traducción automática y generación de lenguaje natural y se pueden utilizar como modelos básicos para otras tareas. [24] Los conjuntos de datos incluyen BookCorpus, Wikipedia y otros.
- Código: además del texto en lenguaje natural, los modelos de lenguaje grandes se pueden entrenar en texto de lenguaje de programación, lo que les permite generar código fuente para nuevos programas de computadora.
- Imágenes: los sistemas de IA generativa entrenados en conjuntos de imágenes con subtítulos incluyen Imagen, DALL-E, Midjourney, Stable Diffusion y otros (ver Arte de inteligencia artificial, Arte generativo, Medios sintéticos). Se utilizan comúnmente para la generación de texto a imagen y la transferencia a estilo neuronal.
- Moléculas: los sistemas de IA generativa se pueden entrenar en secuencias de aminoácidos o representaciones moleculares como SMILES que representan ADN o proteínas. Estos sistemas, como AlphaFold, se utilizan para la predicción de la estructura de proteínas y el descubrimiento de fármacos .
- Música: los sistemas de IA generativa como MusicLM se pueden entrenar en las formas de onda de audio de la música grabada junto con anotaciones de texto, para generar nuevas muestras musicales basadas en descripciones de texto como "una melodía de violín relajante respaldada por un riff de guitarra distorsionado".
- Video: la IA generativa entrenada en video anotado puede generar videoclips coherentes temporalmente. Los ejemplos incluyen Gen1 de RunwayML y Make-A-Video de Meta Platforms .
- Multimodal: se puede construir un sistema de IA generativa a partir de múltiples modelos generativos, o un modelo entrenado en múltiples tipos de datos. Por ejemplo, una versión de GPT-4 de OpenAI acepta entradas de texto e imágenes. [25]
Referencias
- Griffith, Erin; Metz, Cade (27 de enero de 2023). «Anthropic Said to Be Closing In on $300 Million in New A.I. Funding». The New York Times. Consultado el 14 de marzo de 2023.
- Lanxon, Nate; Bass, Dina; Davalos, Jackie (10 de marzo de 2023). «A Cheat Sheet to AI Buzzwords and Their Meanings». Bloomberg News. Consultado el 14 de marzo de 2023.
- Pasick, Adam (27 de marzo de 2023). «Artificial Intelligence Glossary: Neural Networks and Other Terms Explained». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 22 de abril de 2023.
- Andrej Karpathy; Pieter Abbeel; Greg Brockman; Peter Chen; Vicki Cheung; Yan Duan; Ian Goodfellow; Durk Kingma; Jonathan Ho; Rein Houthooft; Tim Salimans; John Schulman; Ilya Sutskever; Wojciech Zaremba (16 de junio de 2016). «Generative models». OpenAI.
- Metz, Cade (14 de marzo de 2023). «OpenAI Plans to Up the Ante in Tech's A.I. Race». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 31 de marzo de 2023.
- Thoppilan, Romal; De Freitas, Daniel; Hall, Jamie; Shazeer, Noam; Kulshreshtha, Apoorv; Cheng, Heng-Tze; Jin, Alicia; Bos, Taylor et ál. (2022-01-20). «LaMDA: Language Models for Dialog Applications». .
- Roose, Kevin (21 de octubre de 2022). «A Coming-Out Party for Generative A.I., Silicon Valley's New Craze». The New York Times. Consultado el 14 de marzo de 2023.
- «Don't fear an AI-induced jobs apocalypse just yet». The Economist. 6 de marzo de 2023. Consultado el 14 de marzo de 2023.
- Harreis, H.; Koullias, T.; Roberts, Roger. «Generative AI: Unlocking the future of fashion».
- «How Generative AI Can Augment Human Creativity». Harvard Business Review. 16 de junio de 2023. ISSN 0017-8012. Consultado el 20 de junio de 2023.
- «The race of the AI labs heats up». The Economist. 30 de enero de 2023. Consultado el 14 de marzo de 2023.
- Yang, June; Gokturk, Burak (14 de marzo de 2023). «Google Cloud brings generative AI to developers, businesses, and governments».
- Justin Hendrix (16 de mayo de 2023). «Transcript: Senate Judiciary Subcommittee Hearing on Oversight of AI». techpolicy.press. Consultado el 19 de mayo de 2023.
- «La UNESCO llama a regular la Inteligencia Artificial generativa en las escuelas».
- «The Writers Strike Is Taking a Stand on AI». Time (en inglés). 4 de mayo de 2023. Consultado el 11 de junio de 2023.
- Tomczak, Jakub (2022). Deep Generative Modeling. Cham: Springer. p. 197. ISBN 978-3-030-93157-5. S2CID 246946335. doi:10.1007/978-3-030-93158-2.
- «finetune-transformer-lm». GitHub. Consultado el 19 de mayo de 2023.
- Radford, Alec; Wu, Jeffrey; Child, Rewon; Luan, David; Amodei, Dario; Sutskever, Ilya; others (2019). «Language models are unsupervised multitask learners». OpenAI blog 1 (8): 9.
- Roth, Emma (25 de enero de 2023). «CNET found errors in more than half of its AI-written stories». The Verge. Consultado el 17 de junio de 2023.
- Bubeck, Sébastien; Chandrasekaran, Varun; Eldan, Ronen; Gehrke, Johannes; Horvitz, Eric; Kamar, Ece; Lee, Peter; Lee, Yin Tat et ál. (2023-03-22). «Sparks of Artificial General Intelligence: Early experiments with GPT-4». .
- «A magazine touted Michael Schumacher's first interview in years. It was actually AI». NPR. 28 de abril de 2023. Consultado el 17 de junio de 2023.
- https://www.marktechpost.com/2023/03/21/a-history-of-generative-ai-from-gan-to-gpt-4/
- «Explainer: What is Generative AI, the technology behind OpenAI's ChatGPT?». Reuters. 17 de marzo de 2023. Consultado el 17 de marzo de 2023.
- Bommasani, R; Hudson, DA; Adeli, E; Altman, R; Arora, S; von Arx, S; Bernstein, MS; Bohg, J et ál. (2021-08-16). «On the opportunities and risks of foundation models». .
- «Explainer: What is Generative AI, the technology behind OpenAI's ChatGPT?». Reuters. 17 de marzo de 2023. Consultado el 17 de marzo de 2023.