
En el evento anual Google I/O 2024, Google ha deslumbrado al mundo con la presentación de dos innovadores modelos de IA destinados a transformar la generación de imágenes y vídeos: Imagen 3 y Veo. Estos modelos no solo representan un salto cualitativo en términos de calidad y funcionalidad, sino que también abren un abanico de posibilidades creativas sin precedentes para usuarios de todo tipo.
Imagen 3: El Futuro de la Generación de Imágenes
Imagen 3 se destaca como la evolución más avanzada en la generación de imágenes mediante inteligencia artificial, mejorando notablemente la resolución, versatilidad y capacidad de comprensión en comparación con sus predecesores.
Profesionalidad y Sencillez en la Generación de Imágenes
La versión anterior, Imagen 2, se lanzó en el evento Cloud Next 2024, permitiendo la creación de vídeos cortos de 4 segundos con una resolución de 360×640 píxeles. Ahora, Imagen 3 eleva la calidad de las imágenes generadas y mejora significativamente la inclusión de texto, haciendo que las creaciones sean más precisas y detalladas.

Resolución y Comprensión Mejoradas
Imagen 3 no solo ofrece una resolución excepcional sino que también comprende indicaciones escritas en un lenguaje más natural. Esto elimina barreras técnicas, permitiendo que cualquier persona pueda generar imágenes de alta calidad sin necesidad de conocimientos especializados.

Versatilidad y Adaptabilidad
Google ha diseñado Imagen 3 para adaptarse a una amplia variedad de usos, desde la creación de bocetos hasta obras en alta resolución. Actualmente, esta herramienta está disponible en vista previa para un grupo selecto de creadores dentro de ImageFX, pero se espera una integración completa con VertexAI en el futuro cercano.

Inclusión Mejorada de Texto en Imágenes
La capacidad de incluir texto en imágenes ha sido perfeccionada en Imagen 3, permitiendo la creación de carteles, presentaciones y más, con una calidad y legibilidad superiores.

Seguridad y Responsabilidad
Conscientes de los riesgos asociados con la generación de imágenes mediante IA, Google ha implementado medidas de seguridad robustas. Utilizando herramientas como el filtrado de datos y SynthID, una tecnología de marca de agua digital, se asegura la identificación y el uso responsable de las imágenes generadas.
Veo: Revolucionando la Generación de Vídeos
Veo es el modelo de generación de vídeos más avanzado de Google, capaz de crear piezas de hasta un minuto de duración con una resolución de 1080p, marcando un hito en la creación de contenido audiovisual.
Innovación en Generación de Vídeos
Veo se basa en una serie de investigaciones y desarrollos previos, integrando técnicas avanzadas para ofrecer una calidad y resolución excepcionales.
Comprensión y Control Creativo
La IA de Veo ha sido entrenada para comprender con precisión el tono y los matices de las peticiones de los usuarios, ofreciendo un control creativo sin precedentes. Esto incluye efectos cinematográficos como lapsos de tiempo, enfoques y tomas aéreas.
Funcionalidades de Edición y Creación
Veo permite editar elementos en vídeos ya creados y generar vídeos a partir de imágenes, respetando el estilo y aplicando el movimiento según las indicaciones del usuario.
Colaboración con Cineastas
Google ha trabajado con cineastas como Donald Glover y su estudio creativo, Gilga, para explorar y mejorar las capacidades de Veo, asegurando que la herramienta satisfaga las necesidades del proceso creativo.
Seguridad y Responsabilidad
Veo también incorpora la tecnología SynthID para incluir marcas de agua digitales en los fotogramas de los vídeos, minimizando los riesgos relacionados con los derechos de autor, la privacidad y los prejuicios.