Views
O Google deu um passo significativo no mundo da inteligência artificial (IA) ao apresentar uma série de avanços voltados para 2025. Em destaque estão a nova geração de seu modelo de IA, o Gemini 2.0 Flash, e inovações nos projetos Astra e Mariner, que prometem redefinir como interagimos com a tecnologia. Os anúncios, feitos nesta quarta-feira (11), mostram que o termo do momento será "agente de IA", programas que operam com pouca supervisão humana para realizar tarefas complexas e autônomas.
Gemini 2.0 Flash e o Futuro dos Agentes de IA
A nova geração do Gemini, o modelo principal de IA do Google, é a grande estrela da vez. O Gemini 2.0 Flash, apresentado como uma evolução do 1.5 Flash, oferece respostas mais rápidas e suporta formatos multimídia combinados, como texto, áudio, imagens e vídeos. Além disso, pode interagir diretamente com outros programas, como a Busca do Google e ferramentas definidas por programadores.
Inicialmente disponível para desenvolvedores no Google AI Studio e Vertex AI, o modelo será ampliado para todos os usuários do Google em janeiro. Usuários da versão web do Gemini já podem experimentar a nova IA.
Projetos Astra e Mariner: A Nova Era dos Assistentes Digitais
Os agentes de IA turbinados pelo Gemini incluem o Projeto Mariner, que opera dentro do navegador Chrome e "enxerga" tudo na aba ativa do usuário, como texto, imagens e formulários. Capaz de tomar decisões autônomas, o Mariner permite ações como identificar números de telefone em sites e organizá-los em planilhas do Google Sheets. Todo o processo requer aprovação humana, um conceito conhecido como human in the loop.
Outro destaque é o Projeto Astra, que ganhou novos recursos. Agora, ele suporta múltiplos idiomas no mesmo diálogo, aciona ferramentas como Google Lens e Google Maps, e interage em tempo real com texto, voz e vídeos. O projeto também está sendo testado em um protótipo de óculos inteligentes, que promete levar a interação com IA para um novo nível.
Deep Research: IA para Análises Profundas
O Google também introduziu o Deep Research, um sistema que utiliza maior poder computacional para buscar respostas complexas. Com uma janela de contexto de 1 milhão de tokens, o modelo realiza buscas múltiplas na web, compila informações de fontes confiáveis e gera relatórios detalhados. Essa ferramenta já está disponível em inglês, tanto no desktop quanto no aplicativo, e oferece possibilidades como criar documentos completos no Google Docs.
Essa abordagem segue uma tendência crescente na indústria: priorizar a eficiência na geração de respostas, em vez de aumentar indiscriminadamente os dados de treinamento. O modelo reflete preocupações de especialistas sobre os limites de eficiência dos grandes modelos de linguagem (LLMs), sinalizando uma mudança no foco para raciocínio e precisão.
IA no Coração da Busca do Google
O Gemini 2.0 também será integrado ao AI Overviews, recurso de busca do Google que utiliza IA generativa para oferecer respostas completas e resumidas. A ferramenta, que será lançada gradualmente em 2025, promete realizar buscas complexas, equações matemáticas e até mesmo criar códigos de computador, transformando radicalmente a experiência do usuário.
Sundar Pichai, CEO do Google, reforçou a profundidade das mudanças que estão por vir. “Estamos nos estágios iniciais de uma transformação profunda. Vocês ficarão surpresos com o que a busca será capaz de fazer já no início de 2025”, declarou Pichai no DealBook Summit.
O Impacto dos Avanços do Google
Os anúncios do Google destacam a evolução de agentes de IA para além dos chatbots tradicionais, trazendo ferramentas que prometem aumentar a produtividade e automatizar tarefas de forma mais eficiente. Essa nova fase representa um marco na integração entre inteligência artificial e o dia a dia das pessoas, enquanto abre novas possibilidades para empresas e desenvolvedores explorarem.