Belo Horizonte
Itatiaia

Após Bard, Google trabalha para gerar imagens com inteligência artifical

A ferramenta ainda não está disponível no Brasil e o lançamento é previsto para 2024

Por
Google trabalha em uma nova função para gerar imagens de alta qualidade com o uso de inteligência artificial • Reprodução/ Redes sociais

Após o lançamento do Bard, o Google trabalha em uma nova função para gerar imagens de alta qualidade com o uso de inteligência artificial. Chamado de Imagen, a tecnologia tem o potencial de revolucionar a forma como criamos e usamos imagens.

A ferramenta, no entanto, ainda não está disponível no Brasil e o lançamento é previsto para acontecer em 2024.

De acordo com o Google, o Imagen pode gerar imagens de alta qualidade, com detalhes realistas e cores vivas.

Ele pode gerar imagens de uma ampla variedade de objetos e cenas, incluindo pessoas, animais, paisagens, objetos cotidianos e formas abstratas.

Aqui estão alguns exemplos de imagens que podem ser criadas com a ferramenta:

  • Uma imagem de um cachorro sentado no sofá tomando Coca-Cola.
  • Uma imagem de uma paisagem alienígena.
  • Uma imagem de um retrato abstrato de uma pessoa.

Concorrência

O Imagen é só mais uma iniciativa para o Google concorrer com os novos modelos de inteligência artificial que estão dominando o mercado de tecnologia.

É o caso da Open AI, que desenvolveu o chat GPT, a ferramenta mais popular do ramo. A empresa foi fundada em 2015 por Elon Musk, Sam Altman e outros investidores.

Em 2023, o Google ampliou o repertório de ferramentas com o uso de Inteligência Artificial com o lançamento do Bard - um chatbot de IA que pode gerar texto, traduzir idiomas, escrever diferentes tipos de conteúdo criativo e responder às suas perguntas de forma informativa.

O Google também lançou o Gemini, uma versão mais sofisticada do Bard, e fez atualizações do Google Maps com IA.

O Imagen vai usar uma tecnologia de aprendizado de máquina, chamada de transformador, para gerar imagens a partir de descrições textuais.

O transformador é um tipo de rede neural que é particularmente eficaz para tarefas de linguagem natural, como tradução, resumo e geração de texto.

O Imagen ainda está em desenvolvimento e não está disponível ao público em geral. No entanto, é possível acessar Imagen por meio de um convite da equipe do Google AI.

Potenciais riscos

A equipe do Google AI está trabalhando para melhorar a qualidade e a confiabilidade do Imagen antes de disponibilizá-lo ao público.

A empresa já anunciou que a ferramenta será gratuita para uso pessoal. No entanto, haverá algumas limitações. Por exemplo, os usuários só vão liberar a geração de 10 imagens por dia.

O Google também disse que está ciente dos potenciais riscos associados à criação de imagens de conteúdo prejudicial ou enganoso por meio do Imagen.

Por esse motivo, a empresa está trabalhando em um conjunto de ferramentas e políticas para mitigar esses riscos.

Em relação aos direitos autorais, o Google está desenvolvendo ferramentas que ajudarão os usuários a identificar imagens que podem infringir as normas.

Essas ferramentas usarão uma combinação de técnicas, como reconhecimento de rosto e análise de conteúdo, para identificar imagens que podem ser protegidas por direitos autorais.

Imagen 2

Em 13 de dezembro, o Google lançou o Imagen 2, uma versão aprimorada da tecnologia que promete melhorias significativas na qualidade das imagens. A ferramenta ainda não está disponível no Brasil.

A principal diferença entre o Imagen 1 e o Imagen 2 é o aumento no tamanho do conjunto de dados. A atualização permite que a nova versão crie imagens mais realistas e detalhadas, mesmo com instruções mais vagas ou desafiadoras.

Por exemplo, o Imagen 2 é capaz de criar imagens de pessoas com características mais sutis, como marcas de expressão ou sardas. Também pode de gerar imagens de objetos em movimento ou em perspectiva.

O Imagen 2 ainda não está disponível para o público geral, mas está disponível para clientes do Vertex AI - o pacote profissional de ferramentas de IA do Google.

Imagen x Midjourney

Quais as diferenças entre a ferramenta do Google (Imagen) e o Midjorney? Confira Até então, o Midjourney é o principal serviço para criar imagens a partir de IA. A ferramenta foi desenvolvida pelo Midjourney, Inc., um laboratório de pesquisa independente baseado em São Francisco.

A nova ferramenta do Google possui muitas semelhanças com o aplicativo, pois ambos usam inteligência artificial para criar imagens a partir de descrições textuais. No entanto, existem algumas diferenças importantes entre as duas ferramentas. Entenda:

  • Técnica de geração

O Midjourney usa a técnica de difusão para gerar imagens. A difusão é um processo iterativo que começa com uma imagem aleatória e gradualmente a refina para se aproximar da descrição fornecida pelo usuário.

O Imagen, por outro lado, usa a técnica de transformação. A transformação é um processo mais direto que usa uma rede neural para gerar uma imagem diretamente a partir da descrição fornecida pelo usuário.

  • Qualidade das imagens

A qualidade das imagens geradas pelo Midjourney e pelo Imagen é semelhante. No entanto, o Imagen tende a gerar imagens mais realistas, enquanto o Midjourney tende a gerar imagens mais criativas.

  • Flexibilidade

O Midjourney oferece mais flexibilidade do que o Imagen. O Midjourney permite aos usuários fornecer várias descrições textuais para a mesma imagem, o que pode ajudar a criar imagens mais complexas e detalhadas.

O Imagen, por outro lado, é mais limitado. O Imagen permite que os usuários forneçam apenas uma descrição textual para cada imagem.

  • Preços

O Midjourney é mais caro do que o Imagen. O Midjourney oferece um teste gratuito de 7 dias, mas os usuários devem pagar uma assinatura mensal ou anual para usar a ferramenta.

O Imagen é gratuito para usar, mas os usuários são limitados a gerar 10 imagens por dia.

  • Disponibilidade

Até o momento, o Imagen não está disponível no Brasil. Não há uma data específica para o lançamento do Imagen no país, mas o Google estima que isso aconteça em 2024.

Por outro lado, o Midjourney está disponível no Brasil desde 12 de julho de 2022. No início, a ferramenta estava disponível apenas para usuários convidados, mas foi aberta para todos os usuários no dia 25 de julho.

Para usar o Midjourney no Brasil, os usuários precisam ter uma conta no Discord, pois a ferramenta está disponível como um bot na plataforma.

Atualmente, o Midjourney está disponível apenas em inglês, mas a empresa responsável pelo desenvolvimento da ferramenta anunciou que está trabalhando para lançar uma versão em português.

Por

Formado em Jornalismo pela UFMG, com passagens pelo jornal Estado de Minas/Portal Uai. Hoje, é repórter multimídia da Itatiaia.