Nvidia Lança Vera Rubin: Revolução na Infraestrutura de IA

Acelino Silva

Nvidia Apresenta Vera Rubin: A Nova Plataforma que Promete Revolucionar a Infraestrutura de IA

A Nvidia lançou oficialmente a plataforma de computação Vera Rubin, composta por sete novos chips, em um movimento que promete redefinir a infraestrutura de inteligência artificial. Com clientes de peso como Anthropic, OpenAI, Meta e Mistral AI, além dos principais provedores de nuvem, a mensagem é clara: a Nvidia está em alta velocidade. A plataforma Vera Rubin oferece até 10 vezes mais rendimento de inferência por watt e um décimo do custo por token em comparação com os sistemas Blackwell, que começaram a ser distribuídos recentemente.

Um Salto Geracional na Infraestrutura de IA

Durante a conferência anual GTC, o CEO Jensen Huang descreveu a Vera Rubin como “um salto geracional”, marcando o início da “maior construção de infraestrutura da história”. Grandes nomes como Amazon Web Services, Google Cloud, Microsoft Azure e Oracle Cloud Infrastructure estão a bordo para oferecer a plataforma, além de mais de 80 parceiros de fabricação desenvolvendo sistemas ao seu redor.

Arquitetura de Sete Chips para a Era dos Agentes de IA

A plataforma Vera Rubin integra uma série de componentes inovadores, incluindo o CPU Vera da Nvidia, GPU Rubin, Switch NVLink 6, SuperNIC ConnectX-9, DPU BlueField-4, Switch Ethernet Spectrum-6 e o recém-integrado Groq 3 LPU, um acelerador de inferência projetado especialmente. Esses componentes formam cinco sistemas interligados que funcionam como um supercomputador unificado.

  • O rack NVL72, com 72 GPUs Rubin e 36 CPUs Vera, promete treinar modelos complexos com menos GPUs.
  • O rack CPU Vera conta com 256 processadores resfriados a líquido, oferecendo mais de 22.500 ambientes de CPU simultâneos.
  • O rack Groq 3 LPX tem 256 processadores de inferência e é projetado para modelos de trilhões de parâmetros.
  • O rack de armazenamento BlueField-4 STX fornece memória de contexto para caches de grande escala.
  • O rack Ethernet Spectrum-6 SPX une tudo com eficiência óptica aprimorada.

Aposta no Futuro dos Agentes Autônomos de IA

A Nvidia está apostando que a indústria de IA está prestes a atravessar um limiar importante. A era dos chatbots está dando lugar ao que Huang chama de “IA agentica”: sistemas que raciocinam autonomamente, escrevem e executam software, e melhoram continuamente. Isso exige não apenas chips mais rápidos, mas um equilíbrio diferente de computação, memória, armazenamento e rede.

Parcerias Estratégicas e o Ecossistema de Modelos Abertos

A empresa anunciou o Agent Toolkit, incluindo o OpenShell, um runtime open-source para agentes autônomos. Empresas como Adobe, Atlassian, Box, Cisco e Siemens estão adotando essa tecnologia. Além disso, a Nvidia lançou o Dynamo 1.0, descrito como o primeiro “sistema operacional” para inferência de IA em escala industrial, já adotado por gigantes como AWS e Google Cloud.

A Expansão do Alcance da Vera Rubin Além do Data Center

A amplitude dos anúncios da Nvidia é impressionante. A Roche, por exemplo, está implantando mais de 3.500 GPUs Blackwell em suas operações, o maior uso anunciado na indústria farmacêutica. Na área de veículos autônomos, marcas como BYD e Nissan estão desenvolvendo veículos prontos para o Nível 4 usando a plataforma Drive Hyperion da Nvidia.

Impacto na Saúde e no Espaço

No campo da robótica em saúde, a plataforma Open-H, com o maior conjunto de dados de robótica cirúrgica do mundo, está sendo adotada por empresas como CMR Surgical e Johnson & Johnson MedTech. No espaço, o módulo espacial Vera Rubin oferece até 25 vezes mais computação de IA para inferência orbital.

Conclusão

As ambições da Nvidia com a plataforma Vera Rubin são vastas e cobrem uma ampla gama de setores. Apesar das promessas impressionantes, a eficácia real dessa nova tecnologia ainda precisa ser comprovada por benchmarks independentes. No entanto, a visão integrada da Nvidia para o futuro da IA, combinando hardware, software e modelos abertos, destaca-se como uma estratégia abrangente e audaciosa no cenário tecnológico atual.

Do listening am eagerness oh objection collected solicitude so decisively unpleasing conviction is partiality he.

Share This Article
Follow:
Sou um amante de séries, filmes, games, doramas, k-pop, animes e tudo relacionado a cultura pop, nerd e geek.