Synthesia y Dall-E... ¿a nuestro servicio?
Gracias a la inteligencia artificial, aplicaciones como Synthesia logran por medio de entrenamiento de redes neuronales reproducir el aspecto fotorrealista y los movimientos para que se vean como personas reales. Esta aplicación utiliza algoritmos de aprendizaje automático que analizan la entrada de texto como PDF, PowerPoint, Word, entre otros y los convierte en videos, la plataforma está entrenada en un gran conjunto de datos del habla humana y utiliza estos datos de entrenamiento para aprender a generar audio y video lo más naturales posibles.
También se tiene como ejemplo la red neuronal llamada Dall-E, lo que hace es expresar en una imagen cualquier frase que se escriba por medio de imágenes fotorrealistas, entiende los objetos individuales y como se relacionan entre sí, se construye una imagen reorganizando patrones de puntos aleatorios que se van modificando hasta obtener un resultado, el cual es producir imágenes que no existen por medio del modelo Stable Diffusion, el cual, se basa en otros modelos de difusión ML que están entrenados para eliminar manchas o distorsiones con el objetivo de obtener una imagen limpia. En este caso utilizando Stable Diffusion, la red crea una imagen, pero con ruido y por lo que, intenta reconstruir pasándola a U-Net que con el texto recibido, logra quitar todo el ruido y obtener una imagen original inexistente.

