VASA-1 la nueva IA de Microsoft



Microsoft ha presentado una inteligencia artificial capaz de generar avatares hiperrealistas a partir de una imagen y un archivo de voz. VASA-1 puede darle vida a tus fotografías añadiendo expresiones, al tiempo que sincroniza el movimiento de tus labios con el clip de sonido. El resultado final es sorprendente y podría revolucionar la forma como interactuamos en el mundo digital.

De acuerdo con los investigadores, VESA-1 captura toda la gama de expresiones humanas, incluidos los movimientos naturales de la cabeza, para generar avatares parlantes verdaderamente creíbles. Esto es posible al separar elementos como los rasgos faciales, la posición de la cabeza y las expresiones, lo que permite un control check here detallado de cada atributo y la posibilidad de editar el contenido por separado.

VESA-1 va más allá de otros read more modelos de inteligencia artificial que añaden audio a una read more imagen y sincronizan el movimiento de labios. Los investigadores han creado expresiones realistas con movimientos en un espacio definido. Esto produce una imagen más auténtica y menos rígida.

"Consideramos todas las dinámicas faciales posibles, incluido el movimiento de los labios, la expresión (sin labios), la mirada y el parpadeo, entre otras, como una única variable latente y modelamos su distribución probabilística de manera unificada", mencionan los autores Noticias online de Microsoft Research. "Nuestro modelado holístico de la dinámica facial, junto con los patrones de movimiento de la cabeza aprendidos conjuntamente, conduce a la generación de una amplia gama de comportamientos de read more conversación emotivos y realistas".

Leave a Reply

Your email address will not be published. Required fields are marked *