Inteligencia Artificial, Baidu con herramienta sin código. Baidu se involucra cada vez más en Inteligencia Artificial anunciando nuevas tecnologías y soluciones para acelerar auge de aplicaciones IA.
Inteligencia Artificial Baidu
Baidu se involucra cada vez más en Inteligencia Artificial anunciando nuevas tecnologías y soluciones para acelerar el auge de las aplicaciones de IA.
Se destacan iRAG (Image-Based Retrieval-Augmented Generation), una nueva tecnología diseñada para abordar las alucinaciones en la generación de imágenes, y Miaoda, una herramienta sin código que permite a las empresas y a las personas crear aplicaciones.
El lanzamiento se produce en medio de una creciente demanda de las ofertas de inteligencia artificial de Baidu, como lo demuestra el hecho de que las llamadas API diarias del modelo de base ERNIE alcanzaron los 1.500 millones a principios de noviembre. Esto representa un aumento sustancial de 30 veces con respecto a los 50 millones anunciados hace un año.
«La tasa de crecimiento superó mis expectativas», dijo Robin Li, cofundador, presidente y director ejecutivo de Baidu, quien describió el pronunciado aumento como un reflejo del crecimiento explosivo de las aplicaciones de IA generativa en China durante los últimos dos años.
Apps IA
De cara al futuro, Li destacó que los agentes serán la forma predominante de aplicaciones de IA y se están acercando a un punto de inflexión de crecimiento explosivo. Para subrayar este punto, Li presentó los 100 mejores agentes y las 100 mejores aplicaciones de la industria en la plataforma ERNIE AgentBuilder.
Baidu World 2024 también destacó el último crecimiento de usuarios de ERNIE Bot, el papel en expansión de ERNIE en aplicaciones empresariales y presentó el debut de Xiaodu AI Glasses de Xiaodu Technology.
Nueva tecnología iRAG para mitigar las alucinaciones en la generación de imágenes
Las alucinaciones, un fenómeno en el que la IA genera información falsa o engañosa, han seguido siendo una de las barreras más difíciles de superar para la adopción generalizada de la IA generativa. En la generación de texto, la tecnología RAG ha resuelto en gran medida el problema de las alucinaciones, mejorando enormemente la precisión de las respuestas generadas. Sin embargo, en el campo de la multimodalidad, las alucinaciones siguen siendo un obstáculo clave, que a menudo se manifiestan como representaciones inexactas de personas o puntos de referencia.
La tecnología iRAG, recientemente lanzada por Baidu, puede mitigar las alucinaciones en la generación de texto a imagen. Aprovechando la vasta colección de cientos de millones de imágenes de Baidu Search y las sólidas capacidades del modelo de base de la empresa, la nueva tecnología permite que los modelos de texto a imagen brinden imágenes hiperrealistas y, al mismo tiempo, reduzcan significativamente el costo de producción de imágenes.
La capacidad de iRAG para reducir las alucinaciones aumenta la aplicabilidad de las imágenes generadas por modelos de texto a imagen en todos los medios visuales, incluidos los cómics, los guiones gráficos y los carteles, entre otros. Li describió la reducción de las alucinaciones como la base para el auge que se avecina en las aplicaciones de IA.
Miaoda Baidu
Baidu también presentó Miaoda, una herramienta sin código que permite crear aplicaciones completas simplemente describiéndolas en lenguaje natural. Miaoda ofrece programación sin código, colaboración entre múltiples agentes e invocación de múltiples herramientas.
La programación sin código permite que cualquiera genere código sin escribir una sola línea, lo que reduce las barreras para el desarrollo de la IA y lo hace accesible para todos. Su colaboración entre múltiples agentes aprovecha las capacidades de pensamiento y planificación de ERNIE para coordinar y gestionar diferentes agentes de manera efectiva, mientras que su invocación de múltiples herramientas aprovecha las capacidades de invocación de herramientas de ERNIE, utilizando ampliamente la búsqueda web, iRAG, API de mapas y otras herramientas para un flujo de trabajo sin problemas.
«Baidu no pretende lanzar una ‘súper aplicación’; en cambio, pretendemos ayudar a más personas y empresas a crear millones de aplicaciones ‘súper útiles'», afirmó Li.
Miaoda, que imita el proceso de desarrollo de productos del mundo real, aprovecha las capacidades de diferentes agentes en múltiples dominios, como la gestión y planificación de proyectos, la edición de contenido, la programación y el control de calidad. Miaoda incluso puede identificar errores automáticamente y utilizar una variedad de herramientas. Li lo denominó «el caso de aplicación más complejo de colaboración entre múltiples agentes hasta la fecha».
Miaoda brinda a todos las capacidades de un programador: cualquiera que pueda hablar, puede crear aplicaciones, mejorando enormemente la productividad humana.