Edit Content

Menu

shutterstock_474996937_Montri-Nipitvittaya

Google Cloud anuncia novas capacidades de IA em infraestrutura no Brasil 

Google Cloud anuncia novas capacidades de IA em infraestrutura no Brasil 

Com novas TPUs Trillium, modelos Gemini locais e parcerias estratégicas, o Google Cloud aposta em acelerar a adoção segura e eficiente de IA no Brasil

Compartilhar:

Share on facebook
Share on twitter
Share on linkedin
Share on email
Share on whatsapp

Durante o Google Cloud Summit Brasil, o Google Cloud revelou tecnologias que ajudarão a promover o uso da IA em organizações no Brasil. A empresa também  compartilhou como está investindo no ecossistema brasileiro mais amplo com novas ofertas para o setor público, investimentos em educação e parcerias ampliadas.

 

Os rápidos avanços nas capacidades dos modelos de IA generativa atuais exigem maior poder de computação do que nunca. Para treinar, ajustar e atender esses modelos em escala, as organizações precisam de hardware de IA desenvolvido especificamente para ser eficiente em termos de custo e energia. As Unidades de Processamento Tensor (TPUs) personalizadas do Google têm expandido os limites de desempenho, escala e eficiência por mais de uma década, impulsionando seus próprios modelos Gemini e outros modelos de IA que são usados por bilhões de usuários ao redor do mundo.

 

Pela primeira vez, a região de nuvem do Google Cloud em São Paulo hospedará o Trillium, a sexta geração de TPUs e uma das mais eficientes da empresa até o momento em termos de energia. O Trillium se destaca em treinamento e inferência em escala, alcançando desempenho de computação de pico 4x, taxa de transferência 3x e aumento de 67% na eficiência energética em relação ao seu antecessor. Fornecer essa infraestrutura de IA localmente permitirá que organizações brasileiras executem aplicativos como o Gemini e suas próprias cargas de trabalho de IA com latência ainda menor, o que é essencial para a inferência de IA.

 

“O Brasil é um dos mercados de tecnologia que mais cresce no mundo, com uma vibrante comunidade de startups e um ecossistema de desenvolvedores”, disse Thomas Kurian, CEO do Google Cloud. “Por meio de nossas ofertas de tecnologia altamente diferenciadas, parcerias locais sólidas e programas de qualificação, estamos capacitando todas as organizações no Brasil — tanto empresas quanto instituições do setor público — a aproveitar a oportunidade da IA.”

 

Modelos Gemini no Brasil

Organizações e setores regulamentados com requisitos rígidos de soberania, latência ultra-baixa ou grande volume de dados muitas vezes enfrentam o dilema crítico de não conseguir acessar os modelos de IA mais recentes ou comprometer a segurança e o desempenho. O Google Cloud está abordando esse dilema crítico para organizações brasileiras de duas maneiras. Primeiro, foi anunciado que, a partir de novembro, as organizações poderão armazenar seus dados em repouso e conduzir processamento de aprendizado de máquina no Brasil usando o Gemini 2.5 Flash do Google no Vertex AI.

 

Em segundo lugar, o Google Cloud anunciou que o Gemini no Google Distributed Cloud (GDC) air-gapped já está disponível no Brasil, com o Gemini no GDC conectado atualmente em private preview. Agora, organizações em todo o Brasil podem aproveitar todo o poder dos modelos Gemini, mantendo em seus próprios data centers. O GDC é uma solução de nuvem local totalmente gerenciada pelo Google, oferecida em configurações com e sem isolamento físico (air-gap) e conectadas. O Gemini no GDC complementa conjunto de tecnologias integradas que já está disponível no GDC, que inclui Vertex AI, banco de dados como serviço (DBaaS), infraestrutura como serviço (IaaS), controles de segurança de ponta a ponta.

 

“As possibilidades geradas por tecnologias como computação em nuvem e IA são inegáveis, tornando essencial que o Brasil esteja na vanguarda da inovação impulsionada por esses novos modelos”, disse Alexandre Gonçalves de Amorim, presidente do Serpro, empresa estatal de tecnologia da informação do Brasil.

Destaques