La empresa que dirige Mark Zuckerberg presentó ImageBind, una nueva herramienta de inteligencia artificial que es capaz de trabajar con distintos datos sensoriales. La tecnología logra relacionar seis fuentes de datos diferentes: imágenes y video, audio, texto, profundidad, temperatura y movimiento. Es de código abierto y está disponible para investigadores.
En su comunicado, Meta describió a ImageBind como un “entendimiento holístico“ que se acerca aún más a las capacidades humanas. La herramienta podría unir distintos datos sensoriales como, por ejemplo, conectar los objetos de una fotografía con sonidos, formas en tres dimensiones o movimientos. También sería capaz de crear imágenes a partir de ruidos.
Introducing ImageBind by Meta AI: the first AI model capable of binding data from six modalities at once. This breakthrough brings machines one step closer to the human ability to bind together information from many different senses.
— Meta AI (@MetaAI) May 9, 2023
More on this new open source work ⬇️
A futuro, la empresa sugiere que ImageBind podría introducir nuevas fuentes de datos sensoriales como el tacto y el olor, e incluso imágenes por resonancia magnética cerebrales. El propósito de Meta es seguir avanzando en la investigación para “diseñar mundos inmersivos y virtuales“, es decir, el famoso metaverso.
Meta, la empresa dueña de Whatsapp, Facebook e Instagram, ya presentó también otra herramienta de IA para investigadores titulada LLaMa (Large Language Mode Meta AI), pero hasta el momento no ha lanzado aplicaciones con potencial comercial. Sus rivales tecnológicas, ChatGPT y OpenAI, mantienen la delantera en este sentido con sus chatbots.
“Cuando los humanos absorbemos información del mundo, usamos múltiples sentidos de manera innata, como ver una calle concurrida y escuchar los sonidos de los motores de los automóviles. Hoy presentamos un enfoque que lleva a las máquinas un paso más cerca de la capacidad de los humanos para aprender de forma simultánea, holística y directa de muchas formas diferentes de información”, explicó Meta en su comunicado.
Mark Zuckerberg, CEO de la compañía, publicó en su Facebook un video que explica cómo funciona la tecnología, y escribió: “Hoy abrimos ImageBind, un nuevo modelo de IA que combina diferentes sentidos como lo hace la gente. Entiende imágenes, vídeo, audio, profundidad, movimiento térmico y espacial. Estoy deseando ver lo que todos construyen con él”.