Google lança Gemini 2.5 Flash Image

Google lança Gemini 2.5 Flash Image e eleva padrão de edição com IA

Tecnologia

O Google apresentou o Gemini 2.5 Flash Image, modelo de inteligência artificial focado em geração e, sobretudo, edição de imagens. Apelidada internamente de “Nano Banana”, a tecnologia promete preservar personagens, cenários e objetos mesmo após inúmeras alterações visuais, superando um dos desafios mais citados por desenvolvedores de IA. A novidade chega para competir diretamente com Adobe Firefly, Midjourney e DALL-E 3, mas com a vantagem declarada de ser mais veloz e consistente, de acordo com dados de benchmarking realizados no ambiente de testes LMArena.

Principais recursos do Gemini 2.5 Flash Image

Segundo informações divulgadas pelo Google, o novo modelo foi concebido para executar intervenções pontuais – como trocar roupas, alterar fundos ou combinar várias fotos – apenas com comandos em linguagem natural. A empresa sustenta que, em média, cada imagem é processada em poucos segundos, tempo inferior ao relatado por soluções rivais. Outro ponto ressaltado é a capacidade de manter a identidade visual de um mesmo personagem em diferentes cenas, funcionalidade considerada crucial para quadrinhos, campanhas publicitárias e materiais educacionais que exigem continuidade gráfica.

Além das edições, o Nano Banana também gera imagens do zero, mas o foco principal permanece na pós-produção. Essa especialização motivou a integração do SynthID, marca d’água visível e invisível que identifica conteúdos criados por IA, recurso que busca mitigar riscos de desinformação e reforçar a rastreabilidade do material distribuído online.

Vantagens frente a concorrentes diretos

Testes independentes no LMArena apontam o Gemini 2.5 Flash Image à frente de alternativas como GPT-4o/GPT Image 1, Qwen Image Edit e o próprio antecessor Gemini 2.0 Flash Image em quase todos os quesitos avaliados. Entre os principais diferenciais:

  • Velocidade de geração: imagens entregues em até dez segundos, enquanto ferramentas concorrentes podem exigir até um minuto.
  • Edição em linguagem natural: comandos textuais substituem ajustes manuais complexos, reduzindo a curva de aprendizado.
  • Consistência de personagens: manutenção de traços, cores e proporções em séries de imagens relacionadas, recurso citado por especialistas como fundamental para animações e peças sequenciais.
  • Integração ao ecossistema Google: compatibilidade nativa com AI Studio, Vertex AI e aplicativo Gemini simplifica o acesso para usuários individuais e corporativos.

Relatórios internos também indicam que o modelo serve como base para futuros geradores de vídeo, já que a consistência visual em imagens estáticas representa um passo estratégico rumo à criação de sequências animadas.

Formas de acesso e modelo de negócios

O Nano Banana está acessível em três frentes:

  • AI Studio: ambiente destinado a desenvolvedores que desejam explorar a API com recursos avançados.
  • Vertex AI: plataforma corporativa que oferece licenciamento para uso em escala.
  • LM Arena: portal público de experimentação gratuita, indicado para quem pretende testar o serviço sem custos iniciais.

Em termos de tarifa, o Google fixou o valor de US$ 0,039 por imagem, com base em um consumo médio de 1.290 tokens de saída. Para quem utiliza o aplicativo Gemini, parte das funcionalidades permanece gratuita, embora o pacote completo dependa de assinatura paga.

Impactos previstos para o mercado e para o usuário final

A chegada do Gemini 2.5 Flash Image tende a pressionar concorrentes a aprimorar sua capacidade de edição localizada. Estúdios de design, agências de publicidade e criadores independentes podem reduzir tempo de produção, já que os ajustes complexos são automatizados. Para o público em geral, o modelo promete democratizar a edição avançada, tornando acessíveis funções antes restritas a softwares profissionais, como o Photoshop.

Google lança Gemini 2.5 Flash Image e eleva padrão de edição com IA - Imagem do artigo original

Imagem: Pedro Assis

Segundo analistas de mercado, o lançamento reforça a estratégia do Google de consolidar um portfólio multimodal, em que texto, imagem e, futuramente, vídeo convergem em um único serviço. Caso a promessa de consistência se confirme, o fluxo de trabalho em marketing digital, e-commerce e produção de conteúdo educativo deve ganhar agilidade significativa.

Para quem acompanha tendências de IA, vale explorar outros avanços descritos em nossa seção de Tecnologia, onde publicamos análises de modelos generativos e tutoriais de uso prático.

Curiosidade

O apelido “Nano Banana” surgiu quando funcionários do Google começaram a usar emojis de banana em discussões internas sobre os primeiros testes do Gemini 2.5 Flash Image. A brincadeira se espalhou pela comunidade de IA e acabou adotada informalmente antes mesmo do anúncio oficial, reforçando um hábito do setor de recorrer a codinomes inusitados para projetos promissores.

Para mais informações e atualizações sobre tecnologia e ciência, consulte também:

Fique atento às próximas publicações e descubra como as novas soluções em IA podem transformar seu fluxo de trabalho. Se gostou deste conteúdo, continue navegando pelo site e acompanhe nossas atualizações diárias.

Quando você efetua suas compras por meio dos links disponíveis aqui no RN Tecnologia, podemos receber uma comissão de afiliado, sem que isso acarrete nenhum custo adicional para você!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *