Gemini 1.5 Pro: confira as principais inovações da inteligência artificial do Google
As propostas têm o objetivo de incrementar as ferramentas de pesquisa e trabalhar com múltiplas formas de mídia de forma diferente
Na edição deste ano do evento Google I/O, o CEO da empresa, Sandar Pichai, anunciou alguns avanços no Gemini, serviço de inteligência artificial do grupo. O Gemini 1.5 Pro tem o objetivo de potencializar a ferramenta de buscas, deixando-as “muito mais poderosas”, como disse Sandar.
Confira as principais novidades trazidas pelo Gemini 1.5 Pro:
-
Ask Photos
Agora também vai ser possível pesquisar entre as imagens do Google Fotos. Na barra de pesquisa, já é possível pesquisar usando a câmera e imagens da galeria, com o Google Lens.
A novidade é que com a inovação existe a possibilidade de ler mídias de maneira diferente, trazendo um aspecto que foi lembrado por Pichai muitas vezes no anúncio, a multimodalidade.
A partir dos arquivos do Google Fotos, o usuário poderá obter respostas para perguntas como “quando o meu filho aprendeu a nadar?” e “qual é a placa do meu carro?”.
-
Geração de imagem, áudio e vídeo
Transformar texto em foto é uma funcionalidade que também já existe no mercado de inteligência artificial, mas o Gemini 1.5 Pro promete trazer mais riqueza de detalhes e qualidade com o Imagen 3.
O mesmo deve acontecer com a geração de vídeos, por meio do Veo. A proposta é criar vídeos tão poderosos que vão amparar até mesmo produtores, como Donald Glover, que trabalhou em parceria com o Google para desenvolver a ferramenta.
De acordo com o ator, roteirista, humorista, músico e rapper americano, “todo mundo vai ser um diretor”.
No meio da produção musical, a inteligência artificial também vem para revolucionar. Por meio de parceria com o Youtube, museus e produtores musicais, o Google também lançou o Music AI Sandbox.
O desenvolvimento da funcionalidade contou com a ajuda de Wyclef Jean, que já trabalhou com nomes como Shakira, Lauryn Hill e Akon. Em vídeo apresentando a ferramenta, ele mostra que é possível até mesmo trazer um “toque de brasilidade” a uma música, adicionando acordes de instrumentos típicos do Brasil.
-
IA no Google Workspace
Integrada ao Gmail, a inteligência artificial, em uma barra lateral, vai resumir e sumarizar e-mails, selecionando as mensagens até mesmo por assuntos. Trazendo mais uma vez o benefício da multimodalidade, algo parecido acontece com reuniões do Google Meet: vai ser possível obter os destaques de uma reunião em videochamada.
-
Project Astra: assistente do cotidiano
Em um vídeo, a ferramenta foi apresentada com perguntas diversas, que vão desde “onde estão os meus óculos?” até “em que vizinhança você acha que eu estou?”, respondidas a partir de informações obtidas pelas entradas de áudio e vídeo, interpretando o que está diante da câmera.
* Sob supervisão de Enzo Menezes
Formada em Jornalismo pela Puc Minas, Paula Arantes produziu inicialmente conteúdos para as editorias Minas Gerais, Brasil, Mundo, Orações e Entretenimento no portal da Itatiaia. Atualmente, colabora com a editoria Meio Ambiente. Antes, passou pelo jornal Estado de Minas.



