El milagro de dos minutos: KLING hace lo que ni siquiera OpenAI puede lograr.
La empresa tecnológica china Kuaishou ha presentado KLING , un nuevo modelo de generación de videos que, según las demostraciones, puede competir con Sora de OpenAI.
Kuaishou afirma que KLING es capaz de crear videos de hasta dos minutos de duración en resolución 1080p y a 30 cuadros por segundo. El modelo también puede simular movimientos complejos que se ven físicamente realistas.
Como ejemplo de las capacidades de KLING, se muestra un video de un viaje en tren de dos minutos, creado a partir de la solicitud "Viaje en tren con vistas de diversos paisajes por la ventana". En comparación, OpenAI presentó su modelo de generación de videos Sora a mediados de febrero, capaz de crear videos relativamente estables de hasta un minuto de duración.
Otro ejemplo muestra un video de un niño montando en bicicleta en un jardín, donde el paisaje circundante cambia según la estación. A pesar del cambio de estaciones, el niño en la bicicleta permanece sorprendentemente estable y se ve bastante realista.
Video: kling.kuaishou.com
Según los desarrolladores, KLING utiliza un sistema de atención espaciotemporal para una mejor modelación del movimiento y la interacción física. Además, gracias a su arquitectura escalable y salida optimizada, el modelo puede generar videos largos de alta resolución.
Kuaishou asegura que el modelo imita correctamente las propiedades físicas del mundo real. Por ejemplo, en uno de los videos, un niño come una hamburguesa en un restaurante de comida rápida, y el tamaño de la hamburguesa disminuye después del primer mordisco. Otros ejemplos incluyen cortar cebollas con un cuchillo y una persona comiendo pasta de un plato, demostrando la interacción física entre los objetos.
Video: kling.kuaishou.com
Con la ayuda de un transformador de difusión, KLING también puede combinar conceptos y crear escenas ficticias, como un gato conduciendo un automóvil en una ciudad concurrida.
Actualmente, el modelo KLING está disponible como versión de demostración en China. Kuaishou es una empresa tecnológica con sede en Pekín, conocida en el país por sus aplicaciones de redes sociales.