Na edição deste ano do evento Google I/O, o CEO da empresa, Sandar Pichai, anunciou alguns avanços no Gemini, serviço de inteligência artificial do grupo. O Gemini 1.5 Pro tem o objetivo de potencializar a ferramenta de buscas, deixando-as “muito mais poderosas”, como disse Sandar.
Confira as principais novidades trazidas pelo Gemini 1.5 Pro:
Ask Photos
Agora também vai ser possível pesquisar entre as imagens do Google Fotos. Na barra de pesquisa, já é possível pesquisar usando a câmera e imagens da galeria, com o Google Lens.
A novidade é que com a inovação existe a possibilidade de ler mídias de maneira diferente, trazendo um aspecto que foi lembrado por Pichai muitas vezes no anúncio, a multimodalidade.
A partir dos arquivos do Google Fotos, o usuário poderá obter respostas para perguntas como “quando o meu filho aprendeu a nadar?” e “qual é a placa do meu carro?”.
Geração de imagem, áudio e vídeo
Transformar texto em foto é uma funcionalidade que também já existe no mercado de inteligência artificial, mas o Gemini 1.5 Pro promete trazer mais riqueza de detalhes e qualidade com o Imagen 3.
O mesmo deve acontecer com a geração de vídeos, por meio do Veo. A proposta é criar vídeos tão poderosos que vão amparar até mesmo produtores, como Donald Glover, que trabalhou em parceria com o Google para desenvolver a ferramenta.
De acordo com o ator, roteirista, humorista, músico e rapper americano, “todo mundo vai ser um diretor”.
No meio da produção musical, a inteligência artificial também vem para revolucionar. Por meio de parceria com o Youtube, museus e produtores musicais, o Google também lançou o Music AI Sandbox.
O desenvolvimento da funcionalidade contou com a ajuda de Wyclef Jean, que já trabalhou com nomes como Shakira, Lauryn Hill e Akon. Em vídeo apresentando a ferramenta, ele mostra que é possível até mesmo trazer um “toque de brasilidade” a uma música, adicionando acordes de instrumentos típicos do Brasil.
IA no Google Workspace
Integrada ao Gmail, a inteligência artificial, em uma barra lateral, vai resumir e sumarizar e-mails, selecionando as mensagens até mesmo por assuntos. Trazendo mais uma vez o benefício da multimodalidade, algo parecido acontece com reuniões do Google Meet: vai ser possível obter os destaques de uma reunião em videochamada.
Project Astra: assistente do cotidiano
Em um vídeo, a ferramenta foi apresentada com perguntas diversas, que vão desde “onde estão os meus óculos?” até “em que vizinhança você acha que eu estou?”, respondidas a partir de informações obtidas pelas entradas de áudio e vídeo, interpretando o que está diante da câmera.
* Sob supervisão de Enzo Menezes