Após Bard, Google trabalha para gerar imagens com inteligência artifical
A ferramenta ainda não está disponível no Brasil e o lançamento é previsto para 2024

Após o lançamento do Bard, o Google trabalha em uma nova função para gerar imagens de alta qualidade com o uso de inteligência artificial. Chamado de Imagen, a tecnologia tem o potencial de revolucionar a forma como criamos e usamos imagens.
A ferramenta, no entanto, ainda não está disponível no Brasil e o lançamento é previsto para acontecer em 2024.
De acordo com o Google, o Imagen pode gerar imagens de alta qualidade, com detalhes realistas e cores vivas.
Ele pode gerar imagens de uma ampla variedade de objetos e cenas, incluindo pessoas, animais, paisagens, objetos cotidianos e formas abstratas.
Aqui estão alguns exemplos de imagens que podem ser criadas com a ferramenta:
- Uma imagem de um cachorro sentado no sofá tomando Coca-Cola.
- Uma imagem de uma paisagem alienígena.
- Uma imagem de um retrato abstrato de uma pessoa.
Concorrência
O Imagen é só mais uma iniciativa para o Google concorrer com os novos modelos de inteligência artificial que estão dominando o mercado de tecnologia.
É o caso da Open AI, que desenvolveu o chat GPT, a ferramenta mais popular do ramo. A empresa foi fundada em 2015 por Elon Musk, Sam Altman e outros investidores.
Em 2023, o Google ampliou o repertório de ferramentas com o uso de Inteligência Artificial com o lançamento do Bard - um chatbot de IA que pode gerar texto, traduzir idiomas, escrever diferentes tipos de conteúdo criativo e responder às suas perguntas de forma informativa.
O Google também lançou o Gemini, uma versão mais sofisticada do Bard, e fez atualizações do Google Maps com IA.
O Imagen vai usar uma tecnologia de aprendizado de máquina, chamada de transformador, para gerar imagens a partir de descrições textuais.
O transformador é um tipo de rede neural que é particularmente eficaz para tarefas de linguagem natural, como tradução, resumo e geração de texto.
O Imagen ainda está em desenvolvimento e não está disponível ao público em geral. No entanto, é possível acessar Imagen por meio de um convite da equipe do Google AI.
Potenciais riscos
A equipe do Google AI está trabalhando para melhorar a qualidade e a confiabilidade do Imagen antes de disponibilizá-lo ao público.
A empresa já anunciou que a ferramenta será gratuita para uso pessoal. No entanto, haverá algumas limitações. Por exemplo, os usuários só vão liberar a geração de 10 imagens por dia.
O Google também disse que está ciente dos potenciais riscos associados à criação de imagens de conteúdo prejudicial ou enganoso por meio do Imagen.
Por esse motivo, a empresa está trabalhando em um conjunto de ferramentas e políticas para mitigar esses riscos.
Em relação aos direitos autorais, o Google está desenvolvendo ferramentas que ajudarão os usuários a identificar imagens que podem infringir as normas.
Essas ferramentas usarão uma combinação de técnicas, como reconhecimento de rosto e análise de conteúdo, para identificar imagens que podem ser protegidas por direitos autorais.
Imagen 2
Em 13 de dezembro, o Google lançou o Imagen 2, uma versão aprimorada da tecnologia que promete melhorias significativas na qualidade das imagens. A ferramenta ainda não está disponível no Brasil.
A principal diferença entre o Imagen 1 e o Imagen 2 é o aumento no tamanho do conjunto de dados. A atualização permite que a nova versão crie imagens mais realistas e detalhadas, mesmo com instruções mais vagas ou desafiadoras.
Por exemplo, o Imagen 2 é capaz de criar imagens de pessoas com características mais sutis, como marcas de expressão ou sardas. Também pode de gerar imagens de objetos em movimento ou em perspectiva.
O Imagen 2 ainda não está disponível para o público geral, mas está disponível para clientes do Vertex AI - o pacote profissional de ferramentas de IA do Google.
Imagen x Midjourney
Até então, o Midjourney é o principal serviço para criar imagens a partir de IA. A ferramenta foi desenvolvida pelo Midjourney, Inc., um laboratório de pesquisa independente baseado em São Francisco.
A nova ferramenta do Google possui muitas semelhanças com o aplicativo, pois ambos usam inteligência artificial para criar imagens a partir de descrições textuais. No entanto, existem algumas diferenças importantes entre as duas ferramentas. Entenda:
- Técnica de geração
O Midjourney usa a técnica de difusão para gerar imagens. A difusão é um processo iterativo que começa com uma imagem aleatória e gradualmente a refina para se aproximar da descrição fornecida pelo usuário.
O Imagen, por outro lado, usa a técnica de transformação. A transformação é um processo mais direto que usa uma rede neural para gerar uma imagem diretamente a partir da descrição fornecida pelo usuário.
- Qualidade das imagens
A qualidade das imagens geradas pelo Midjourney e pelo Imagen é semelhante. No entanto, o Imagen tende a gerar imagens mais realistas, enquanto o Midjourney tende a gerar imagens mais criativas.
- Flexibilidade
O Midjourney oferece mais flexibilidade do que o Imagen. O Midjourney permite aos usuários fornecer várias descrições textuais para a mesma imagem, o que pode ajudar a criar imagens mais complexas e detalhadas.
O Imagen, por outro lado, é mais limitado. O Imagen permite que os usuários forneçam apenas uma descrição textual para cada imagem.
- Preços
O Midjourney é mais caro do que o Imagen. O Midjourney oferece um teste gratuito de 7 dias, mas os usuários devem pagar uma assinatura mensal ou anual para usar a ferramenta.
O Imagen é gratuito para usar, mas os usuários são limitados a gerar 10 imagens por dia.
- Disponibilidade
Até o momento, o Imagen não está disponível no Brasil. Não há uma data específica para o lançamento do Imagen no país, mas o Google estima que isso aconteça em 2024.
Por outro lado, o Midjourney está disponível no Brasil desde 12 de julho de 2022. No início, a ferramenta estava disponível apenas para usuários convidados, mas foi aberta para todos os usuários no dia 25 de julho.
Para usar o Midjourney no Brasil, os usuários precisam ter uma conta no Discord, pois a ferramenta está disponível como um bot na plataforma.
Atualmente, o Midjourney está disponível apenas em inglês, mas a empresa responsável pelo desenvolvimento da ferramenta anunciou que está trabalhando para lançar uma versão em português.
Formado em Jornalismo pela UFMG, com passagens pelo jornal Estado de Minas/Portal Uai. Hoje, é repórter multimídia da Itatiaia.