A AWS apresentou o AI Factories no re:Invent 2025, juntamente com um portfólio expandido do modelo multimodal Nova e atualizações para sua plataforma de IA Bedrock.
A AWS anunciou o AI Factories, uma oferta que implanta infraestrutura dedicada nos data centers existentes dos clientes para atender aos requisitos de soberania e conformidade de organizações que escalam projetos de IA.
O serviço combina aceleradores de IA, incluindo plataformas de computação Nvidia e chips Trainium, com infraestrutura de rede, armazenamento, bancos de dados, segurança e serviços de IA da AWS, incluindo Amazon Bedrock e Amazon SageMaker. A infraestrutura opera como uma região privada da AWS dentro das instalações do cliente, fornecendo acesso a serviços de computação, armazenamento, banco de dados e IA.

“Com este lançamento, estamos permitindo que os clientes implementem infraestrutura de IA dedicada da AWS em seus próprios data centers”, afirma Matt Garman, CEO da AWS. “Também lhes damos acesso a recursos computacionais de ponta, incluindo os mais recentes UltraServers para treinamento e acesso a serviços como o SageMaker.”
AWS e Nvidia estendem parceria de 15 anos
A colaboração entre a AWS e a Nvidia amplia uma relação que começou há 15 anos com o lançamento da primeira instância de nuvem com GPU do mundo. “A AWS é, de longe, o melhor lugar para executar GPUs da Nvidia”, afirma Matt. “Fomos o primeiro provedor de nuvem comprometido com o uso da nuvem para GPUs e colaboramos há mais de 15 anos. Se você conversar com qualquer pessoa que já tenha executado grandes clusters de GPUs, ela lhe dirá que a AWS é, de longe, a mais estável para executar cargas de trabalho com GPUs.”
O AI Factories oferece aos clientes da AWS acesso à plataforma de computação acelerada da Nvidia, ao software de IA da Nvidia e a aplicativos acelerados por GPU em seus data centers. O AWS Nitro System, a rede em escala de petabits do Elastic Fabric Adapter e o Amazon EC2 UltraClusters são compatíveis com as plataformas Nvidia Grace Blackwell e Vera Rubin de próxima geração, enquanto a AWS oferecerá suporte à tecnologia de interconexão de chips de alta velocidade Nvidia NVLink Fusion em seus chips Trainium4 de próxima geração.

“A IA em larga escala exige uma abordagem completa, desde GPUs avançadas e redes até softwares e serviços que otimizam cada camada do data center”, afirma Ian Buck, vice-presidente e gerente geral de Hiperescala e HPC da Nvidia. “Ao combinar as mais recentes arquiteturas Grace Blackwell e Vera Rubin da Nvidia com a infraestrutura segura e de alto desempenho da AWS e o conjunto de softwares de IA, as AWS AI Factories permitem que as organizações implementem recursos de IA poderosos em muito menos tempo e se concentrem inteiramente na inovação, em vez da integração.”
A AWS e a Nvidia também estão colaborando com a Humain, sediada na Arábia Saudita, para construir uma Zona de IA com até 150.000 chips de IA, incluindo GPUs GB300, infraestrutura AWS dedicada e serviços de IA da AWS dentro de um data center da Humain.
“A fábrica de IA que a AWS está construindo em nossa nova Zona de IA representa o início de uma jornada de vários gigawatts para a HUMAIN e a AWS”, diz Tareq Amin, CEO da Humain. “O que realmente diferencia esta parceria é a dimensão da nossa ambição e a inovação na forma como trabalhamos em conjunto. Escolhemos a AWS devido à sua experiência na construção de infraestrutura em grande escala, à sua confiabilidade de nível empresarial, à amplitude das suas capacidades de IA e ao seu profundo compromisso com a região.”

A Amazon Bedrock expande-se com os novos modelos Nova 2 e 18 opções de peso aberto.
A Amazon também lançou quatro modelos do Nova 2, juntamente com o Nova Forge – um serviço para organizações criarem variantes de modelos personalizados – e o Nova Act para a criação de agentes de IA. O Amazon Bedrock agora impulsiona a IA em produção para mais de 100.000 empresas em todo o mundo. A família Nova 2 inclui as variantes Lite, Pro, Sonic e Omni, projetadas para diferentes aplicações em raciocínio, processamento multimodal, IA conversacional e geração de código.
O Nova 2 Lite processa texto, imagens e vídeos para gerar texto, com profundidade de raciocínio ajustável para equilibrar inteligência, velocidade e custo. O Nova 2 Pro processa texto, imagens, vídeo e fala para aplicações que incluem codificação de agentes, planejamento de longo prazo e resolução de problemas. Ambos os modelos incluem recursos de ancoragem na web e execução de código.
O Nova 2 Omni processa entradas de texto, imagens, vídeo e fala, gerando texto e imagens em um único modelo. O sistema processa até 750.000 palavras, horas de áudio, vídeos e documentos com centenas de páginas, sendo utilizado por organizações como Cisco, Siemens, Sumo Logic e Trellix em aplicações que vão desde a detecção de ameaças até a compreensão de vídeos.
A AWS adicionou 18 modelos de peso aberto ao Amazon Bedrock, incluindo dois novos conjuntos de modelos da Mistral AI, disponíveis inicialmente na plataforma. O Mistral Large 3 oferece recursos de contexto longo, multimodalidade e confiabilidade de instruções, enquanto o Mistral 3 oferece funcionalidade de IA compacta, de propósito geral e multimodalidade. A expansão também inclui modelos do Gemma 3 do Google, do M2 da MiniMax, do Nemotron da Nvidia e do GPT OSS Safeguard da OpenAI, disponíveis no Bedrock.
Os modelos Nova permitem treinamento personalizado e automação do navegador.
O Nova Forge oferece às organizações acesso a checkpoints de modelos Nova pré-treinados, em fase intermediária de treinamento e pós-treinamento, permitindo que os clientes integrem dados proprietários com conjuntos de dados selecionados pela Amazon Nova ao longo do processo de treinamento. A plataforma oferece ambientes de aprendizado por reforço para treinar IA usando cenários sintéticos, destilação baseada em dados sintéticos para criar modelos menores e um conjunto de ferramentas de IA responsável para implementar controles de segurança.
Organizações como Booking.com, Cosine AI, Nimbus Therapeutics, Nomura Research Institute, OpenBabylon, Reddit e Sony estão criando modelos com o Nova Forge.
“Trabalhar com o Nova Forge está nos permitindo aprimorar a moderação de conteúdo no Reddit com um sistema mais unificado que já está apresentando resultados impressionantes”, afirma Chris Slowe, CTO do Reddit. “Estamos substituindo diversos modelos diferentes por uma solução única e mais precisa que torna a moderação mais eficiente. A capacidade de substituir vários fluxos de trabalho de aprendizado de máquina especializados por uma abordagem coesa representa uma mudança na forma como implementamos e escalamos a IA no Reddit.”
A Nova Act fornece infraestrutura para a criação e implantação de agentes de IA que executam ações em navegadores da web. Impulsionado por um modelo personalizado Nova 2 Lite, treinado por meio de aprendizado por reforço em milhares de tarefas em centenas de ambientes web simulados, o serviço oferece 90% de confiabilidade nos fluxos de trabalho dos clientes.
A startup Sola Systems integrou a Nova Act para automatizar centenas de milhares de fluxos de trabalho por mês para clientes em tarefas como conciliação de pagamentos, coordenação de remessas e atualização de registros médicos. A Hertz acelerou a entrega de seu software em cinco vezes e reduziu os testes de garantia de qualidade de semanas para horas usando a Nova Act.

