O Google Deepmind revelou suas ferramentas de IA de próxima geração, Veo 2 e Imagen 3, junto com um novo experimento lúdico, Whisk, que visa remixar recursos visuais de maneiras criativas.
Veo 2 é a mais nova versão da principal ferramenta de geração de vídeo da empresa, que, segundo o Google, será capaz de proporcionar maior realismo e uma melhor compreensão do movimento, da física e das técnicas cinematográficas. Em seu comunicado à imprensa, o Google Deepmind afirma que o Veo 2 pode gerar vídeos em 4K e lidar com solicitações complexas – como lentes de câmeras específicas ou tomadas cinematográficas.
Veo, concorrente do Sora do Google, é elogiado por Donald Glover
“O Veo 2 entende a linguagem única da cinematografia”, afirma o comunicado de imprensa, enfatizando sua capacidade de oferecer opções estilísticas como “planos de rastreamento em ângulo baixo” ou “profundidade de campo rasa”. Além disso, a empresa afirma que, ao contrário dos modelos anteriores que muitas vezes “alucinam” visuais estranhos (como membros extras), o Veo 2 reduz essas peculiaridades, tornando os resultados mais naturais.
Velocidade da luz mashável
Imagen 3, lançado em agosto, obteve algumas melhorias com texturas mais ricas, cores mais brilhantes e diversos estilos de arte – de paisagens fotorrealistas a anime. A atualização também seguirá mais fielmente as instruções do usuário.
A adição mais intrigante pode ser o Whisk, uma ferramenta que permite aos usuários remixar imagens com um toque criativo. Ao combinar os modelos Imagen 3 e Gemini do Google, o Whisk pode transformar ideias aproximadas de imagens em obras de arte digitais, como “pelúcias ou alfinetes esmaltados”, ao mesmo tempo que gera legendas descritivas automaticamente.
O Veo 2 está sendo lançado no VideoFX do Google, o Imagen 3 chega ao ImageFX em mais de 100 países e o Whisk está disponível para usuários dos EUA. Você pode se inscrever no Lista de espera do Google Labs agora.
Tópicos
Inteligência Synthetic Google