VASA-1 la nueva IA de Microsoft



Microsoft ha presentado una inteligencia artificial capaz de generar avatares hiperrealistas a partir de una imagen y un archivo de voz. VASA-1 puede darle vida a tus fotografías añadiendo expresiones, al tiempo que sincroniza el movimiento de tus labios con el clip de sonido. El resultado final es sorprendente y podría revolucionar la forma como interactuamos en el mundo digital.

De acuerdo con los investigadores, VESA-1 captura toda la gama de expresiones humanas, incluidos los movimientos naturales de la cabeza, para generar avatares parlantes verdaderamente creíbles. Esto es posible al separar elementos como los rasgos faciales, la posición de la cabeza y las website expresiones, lo que permite un control detallado de cada website atributo y la posibilidad de editar el contenido por separado.

VESA-1 va más allá website de otros modelos de inteligencia artificial que añaden audio a una imagen y sincronizan el movimiento de labios. Los investigadores han creado expresiones realistas con movimientos en un espacio definido. Esto produce una imagen más auténtica y menos rígida.

"Consideramos todas las dinámicas faciales posibles, incluido el movimiento de los labios, la expresión (sin labios), la mirada y el here parpadeo, entre otras, como una única variable latente y modelamos su distribución probabilística de manera unificada", mencionan los autores de Microsoft Research. "Nuestro modelado holístico de la dinámica facial, junto con los patrones de movimiento Actualidad internacional de la cabeza aprendidos conjuntamente, conduce a la generación de una amplia gama de comportamientos de conversación emotivos y realistas".

Leave a Reply

Your email address will not be published. Required fields are marked *