A tecnologia que intrigou usuários nas últimas semanas com edições realistas e refinamento de luz nas imagens tem, agora, nome e origem confirmados. O Google anunciou oficialmente que o modelo conhecido até então como “Nano-Banana” é, na verdade, o Gemini 2.5 Flash Image, nova ferramenta de geração e edição visual integrada à família Gemini.
O anúncio foi feito nesta terça-feira (26), após a ferramenta viralizar em fóruns especializados e redes sociais. Antes do reconhecimento público, o modelo já havia despertado atenção ao ser testado de forma anônima no Battle Mode — uma plataforma que coloca duas inteligências artificiais em disputa visual a partir do mesmo comando.
A versão misteriosa se destacou por entregar resultados visualmente consistentes, com destaque para realismo facial, ajustes de iluminação e ausência de distorções perceptivas — conhecidas como “alucinações” em modelos de IA.
“Put this shirt on him”
— Pietro Schirano (@skirano) August 26, 2025
Gemini 2.5 Flash Image
Previously nano-banana pic.twitter.com/7jX8vJ7GOx
Consistência visual e acesso gratuito
De acordo com o Google, o diferencial do modelo está no refinamento técnico: ele foi treinado com imagens do cotidiano, como ambientes domésticos e projetos de decoração, o que ampliou seu “conhecimento de ambiente”. A informação foi confirmada por Nicole Brichtova, gestora de produto na Google DeepMind. Essa abordagem prática foi apontada como fator-chave para a performance superior em cenários realistas, sobretudo na criação e edição de personagens.
Disponível tanto para contas gratuitas quanto pagas do Gemini, o modelo pode ser acessado diretamente ao carregar uma imagem e digitar o comando de edição desejado. A nova IA também será liberada para desenvolvedores e empresas por meio da API do Gemini, do Google AI Studio e do Vertex AI ainda nesta semana.
Concorrência e expansão
Usuários mais atentos já compararam o Nano-Banana a modelos como o MidJourney e o DALL·E, mas destacaram que, apesar de não ter a estética artística característica do MidJourney, o modelo do Google oferece maior precisão para fins comerciais, como publicidade e edição de produtos.
Além do ecossistema Gemini, o Gemini 2.5 Flash Image também poderá ser utilizado dentro de outras plataformas de criação visual, como Adobe Express e Firefly. A Meta, dona do Facebook, Instagram e WhatsApp, também confirmou que pretende licenciar modelos de imagem da startup MidJourney, o que acirra a disputa no setor.