Google I/O 2024: La Nueva Era de la IA Generativa de Imágenes y Vídeo

En el evento anual Google I/O 2024, Google ha deslumbrado al mundo con la presentación de dos innovadores modelos de IA destinados a transformar la generación de imágenes y vídeos: Imagen 3 y Veo. Estos modelos no solo representan un salto cualitativo en términos de calidad y funcionalidad, sino que también abren un abanico de posibilidades creativas sin precedentes para usuarios de todo tipo.

Imagen 3: El Futuro de la Generación de Imágenes

Imagen 3 se destaca como la evolución más avanzada en la generación de imágenes mediante inteligencia artificial, mejorando notablemente la resolución, versatilidad y capacidad de comprensión en comparación con sus predecesores.

Profesionalidad y Sencillez en la Generación de Imágenes

La versión anterior, Imagen 2, se lanzó en el evento Cloud Next 2024, permitiendo la creación de vídeos cortos de 4 segundos con una resolución de 360×640 píxeles. Ahora, Imagen 3 eleva la calidad de las imágenes generadas y mejora significativamente la inclusión de texto, haciendo que las creaciones sean más precisas y detalladas.

Obra creada con la IA Imagen 3 de Google bajo el prompt (en inglés) “Tres mujeres están juntas riendo, con una mujer ligeramente desenfocada en primer plano. El sol se pone detrás de las mujeres, creando un destello en la lente y un brillo cálido que resalta su cabello y crea un efecto bokeh en el fondo. El estilo de la fotografía es sincero y captura un momento genuino de conexión y felicidad entre amigas. La cálida luz de la hora dorada aporta una sensación nostálgica e íntima en la imagen”.

Resolución y Comprensión Mejoradas

Imagen 3 no solo ofrece una resolución excepcional sino que también comprende indicaciones escritas en un lenguaje más natural. Esto elimina barreras técnicas, permitiendo que cualquier persona pueda generar imágenes de alta calidad sin necesidad de conocimientos especializados.

Obra creada con la IA Imagen 3 de Google bajo el prompt (en inglés) “Escena de plastilina. Un plano medio amplio de una mujer mayor. Lleva ropa fluida. Ella está parada en un exuberante jardín regando las plantas con una regadera naranja”.

Versatilidad y Adaptabilidad

Google ha diseñado Imagen 3 para adaptarse a una amplia variedad de usos, desde la creación de bocetos hasta obras en alta resolución. Actualmente, esta herramienta está disponible en vista previa para un grupo selecto de creadores dentro de ImageFX, pero se espera una integración completa con VertexAI en el futuro cercano.

Obra creada con la IA Imagen 3 de Google bajo el prompt (en inglés) “Elefante amigurumi caminando en la sabana, una fotografía profesional, fondo borroso”.

Inclusión Mejorada de Texto en Imágenes

La capacidad de incluir texto en imágenes ha sido perfeccionada en Imagen 3, permitiendo la creación de carteles, presentaciones y más, con una calidad y legibilidad superiores.

Obras creadas con la IA Imagen3 de Google. La de la izquierda bajo el prompt (en inglés) “Palabra “light” hecha de varias plumas de colores, fondo negro”. La de la derecha bajo el prompt (en inglés) “Una fotografía de la majestuosa entrada de una biblioteca con las palabras “Central Library” grabadas en la piedra”.

Seguridad y Responsabilidad

Conscientes de los riesgos asociados con la generación de imágenes mediante IA, Google ha implementado medidas de seguridad robustas. Utilizando herramientas como el filtrado de datos y SynthID, una tecnología de marca de agua digital, se asegura la identificación y el uso responsable de las imágenes generadas.

Veo: Revolucionando la Generación de Vídeos

Veo es el modelo de generación de vídeos más avanzado de Google, capaz de crear piezas de hasta un minuto de duración con una resolución de 1080p, marcando un hito en la creación de contenido audiovisual.

Innovación en Generación de Vídeos

Veo se basa en una serie de investigaciones y desarrollos previos, integrando técnicas avanzadas para ofrecer una calidad y resolución excepcionales.

Comprensión y Control Creativo

La IA de Veo ha sido entrenada para comprender con precisión el tono y los matices de las peticiones de los usuarios, ofreciendo un control creativo sin precedentes. Esto incluye efectos cinematográficos como lapsos de tiempo, enfoques y tomas aéreas.

Funcionalidades de Edición y Creación

Veo permite editar elementos en vídeos ya creados y generar vídeos a partir de imágenes, respetando el estilo y aplicando el movimiento según las indicaciones del usuario.

Colaboración con Cineastas

Google ha trabajado con cineastas como Donald Glover y su estudio creativo, Gilga, para explorar y mejorar las capacidades de Veo, asegurando que la herramienta satisfaga las necesidades del proceso creativo.

Seguridad y Responsabilidad

Veo también incorpora la tecnología SynthID para incluir marcas de agua digitales en los fotogramas de los vídeos, minimizando los riesgos relacionados con los derechos de autor, la privacidad y los prejuicios.