Depois de um ano recorde em 2024, a Nvidia está começando 2025 com força, anunciando uma série de produtos que podem solidificar seu domínio no desenvolvimento de IA e jogos.
O CEO Jensen Huang subiu ao palco na CES em Las Vegas para apresentar novos produtos de hardware e software que vão desde supercomputadores pessoais de IA até placas de jogos de próxima geração.
O maior anúncio da Nvidia: Projeto DIGITS, um supercomputador pessoal de IA de US$ 3.000 que reúne petaflops de poder de computação em uma caixa do tamanho de um desktop.
Construída em torno do novo e anteriormente secreto superchip GB10 Grace Blackwell, a máquina pode processar modelos de IA com até 200 bilhões de parâmetros enquanto é alimentada por uma tomada elétrica padrão.
Para cargas de trabalho mais pesadas, os usuários podem vincular duas unidades para trabalhar em modelos com até 405 bilhões de parâmetros.
Para referência, o LLM de código aberto mais avançado da Meta, o maior modelo Llama 3.2, tem 405 bilhões de parâmetros e não pode ser executado em hardware de consumo.
Anteriormente, eram necessários cerca de oito superchips Nvidia A100/H100, cada um custando cerca de US$ 30 mil, totalizando mais de US$ 240 mil apenas em hardware de processamento.
Os dois novos supercomputadores de IA de consumo da Nvidia custam US$ 6.000 e podem executar o mesmo modelo quantizado.
“A IA se tornará popular em todas as aplicações em todos os setores. O Projeto DIGITS levará o superchip Grace Blackwell a milhões de desenvolvedores”, disse o CEO da Nvidia, Jensen Huang, em uma postagem oficial no blog. “Colocar um supercomputador de IA na mesa de cada cientista de dados, pesquisador de IA e estudante irá capacitá-los a enfrentar e moldar a era da IA.”
Para quem gosta de detalhes técnicos, o chip GB10 representa uma conquista significativa de engenharia resultante de uma colaboração com a MediaTek.
O sistema no chip combina a mais recente arquitetura de GPU da Nvidia com 20 núcleos ARM com baixo consumo de energia conectados por meio da interconexão NVLink-C2C.
Cada unidade DIGITS possui 128 GB de memória unificada e até 4 TB de armazenamento NVMe. Novamente, as GPUs mais poderosas até o momento têm cerca de 24 GB de VRAM (a memória necessária para executar modelos de IA), e o superchip H100 começa com 80 GB de VRAM.
O plano da NVIDIA para monopolizar agentes de IA
As empresas estão correndo para implantar agentes de IA, e a Nvidia sabe disso, e é por isso que desenvolveu o Nemotron, uma nova família de modelos que provavelmente virá em três tamanhos, e anunciou hoje uma expansão com dois novos modelos. Nvidia NIIM para resumo e compreensão de vídeo e Nvidia NIIM para resumo e compreensão de vídeo O Nvidia Cosmos fornece recursos de visão Nemotron, a capacidade de compreender instruções visuais.
Anteriormente, o LLM era baseado apenas em texto. No entanto, esses modelos eram melhores no bate-papo, na chamada de funções, na codificação e na instrução de tarefas matemáticas.
Eles estão disponíveis no Hugging Face e no site da Nvidia, com acesso empresarial disponível através da plataforma de software AI Enterprise da empresa.
Mais uma vez, na arena LLM, o Llama Nemotron 70b da Nvidia está acima do Llama 405b original desenvolvido pela Meta. Ele também supera várias versões de Claude, Gemini Advanced, Grok-2 mini e GPT-4o.

O impulso do agente da Nvidia agora também está relacionado à infraestrutura. A empresa anunciou parcerias com fornecedores líderes de tecnologia de agentes, incluindo LangChain, LlamaIndex e CrewAI para construir projetos no Nvidia AI Enterprise.
Esses modelos prontos para implantação atendem a tarefas específicas que facilitam aos desenvolvedores a criação de agentes altamente especializados.
Um novo modelo de PDF para podcast visa competir com o NotebookLM do Google, e outro modelo ajuda a construir agentes de pesquisa e resumo de vídeos. Os desenvolvedores podem testar esses projetos por meio da nova plataforma Nvidia Launchables, permitindo prototipagem e implantação com um clique.
Jogadores, alegrem-se! A nova placa GeForce RTX 5000 é uma fera em desempenho
A Nvidia deixou seus anúncios relacionados a jogos para o final, anunciando sua tão esperada série GeForce RTX 5000. O carro-chefe RTX 5090 possui 92 bilhões de transistores e oferece 3.352 trilhões de operações de IA por segundo. Isto é o dobro do desempenho do atual RTX 4090. Toda a linha apresenta núcleos tensores de 5ª geração e núcleos RT de 4ª geração.
A nova placa apresenta o DLSS 4, que usa IA para aumentar as taxas de quadros em até 8x, gerando vários quadros por renderização. Blackwell, o motor de IA, está aqui para jogadores, desenvolvedores e criadores de PC”, disse Jensen Fan. “A combinação de renderização neural orientada por IA e traçado de raios da Blackwell é a inovação mais significativa em computação gráfica desde que introduzimos o sombreamento programável, há 25 anos.”
As novas placas também apresentam um modelo transformador para super-resolução, prometendo gráficos altamente realistas e desempenho muito superior pelo preço. Aliás, isso não é barato. O RTX 5070 custa US$ 549, o 5070 Ti custa US$ 749 e o 5080 custa US$ 999. 5090 custa $ 1.999.
Se você não tem tanto dinheiro e quer jogar, não se preocupe.
A AMD também anunciou hoje a série Radeon RX 9070. A placa é construída na nova arquitetura RDNA 4 usando um processo de fabricação de 4 nm e possui um acelerador de IA dedicado para competir com os Tensor Cores da Nvidia.
Embora as especificações detalhadas ainda estejam sendo mantidas em segredo, os mais recentes chips Ryzen AI da AMD já alcançaram desempenho máximo de 50 TOPS.
Infelizmente, a Nvidia continua sendo o rei dos aplicativos de IA graças à sua arquitetura proprietária de IA, a tecnologia CUDA.
Para resolver isso, a AMD garantiu parcerias com HP e Asus para integração de sistemas, e mais de 100 marcas de plataformas empresariais usarão a tecnologia AMD Pro até 2025.
Espera-se que as placas Radeon cheguem ao mercado no primeiro trimestre de 2025, e a Nvidia terá uma batalha interessante tanto em jogos quanto em aceleração de IA.
Editado por Sebastian Sinclair
geralmente inteligente Boletim informativo
Uma jornada semanal de IA contada por Gen, um modelo generativo de IA.