Lançamento do Intel Gaudi 3: conjunto de chips AI para desafiar o domínio CUDA da NVIDIA

Principais coisas a saber:

  • Desafiando o domínio da NVIDIA: A Intel apresenta o acelerador Gaudi 3 AI, com o objetivo de oferecer uma alternativa robusta às GPUs da NVIDIA, aumentando a concorrência no mercado de silício AI.
  • Avanços tecnológicos:  Gaudi 3 da Intel, criado com o avançado 5 nanômetros da TSMC tecnologia, oferece melhorias substanciais no desempenho, fornecendo 1835 TFLOPS de taxa de transferência de computação do FP8. 
  • Dinâmica de Mercado: A introdução do Gaudi 3 pela Intel pode ajudar a reduzir a dependência da plataforma CUDA da NVIDIA, proporcionando aos engenheiros mais flexibilidade e potencialmente reduzindo custos devido ao aumento da concorrência.
  • Promovendo Padrões Abertos: A Intel enfatiza o software aberto e baseado na comunidade e as redes padrão da indústria com seu novo acelerador de IA, com o objetivo de democratizar o acesso à tecnologia de IA e incentivar a inovação em vários setores.

Com a NVIDIA dominando o mercado de GPU e silício de IA, muitos estão preocupados com o poder que a NVIDIA detém sobre a indústria. Num esforço para eliminar este desafio e oferecer uma alternativa viável às ofertas da NVIDIA, a Intel deu um passo significativo com o anúncio do seu acelerador Gaudi 3 AI, desenvolvido pela Habana Labs, uma subsidiária da Intel. Este último desenvolvimento ressalta o compromisso da Intel com a inovação no espaço de IA e visa fornecer aos engenheiros mais opções em plataformas de hardware de IA.

Que desafios a NVIDIA apresenta com o monopólio das plataformas de hardware de IA?

Na última década, o desenvolvimento de algoritmos de IA tem sido uma batalha difícil e contínua. As primeiras redes neurais, de natureza simples, poderiam demonstrar a capacidade de aprendizagem da IA, mas sendo simples, não poderiam ser usadas para aplicações sérias. Para torná-las mais complexas, essas redes precisam adicionar camadas adicionais de processamento e aumentar o número total de conexões, mas isso aumenta rapidamente a quantidade de recursos da CPU.

Considerando que as CPUs estão longe de ser ideais para executar redes neurais de IA, isso introduziu sérios problemas para os engenheiros que tentavam desenvolver algoritmos de IA cada vez mais complexos. Felizmente, os pesquisadores descobriram rapidamente que as GPUs eram plataformas de processamento ideais para IA devido à sua capacidade de executar milhares de equações polinomiais complexas simultaneamente, que é essencialmente o que são as redes neurais. 

Embora existam vários fabricantes de GPU, um se destacou dos demais, a NVIDIA. Mas para todos os beneficia que GPUs NVIDIA e os muitos desenvolvimentos em torno dos aceleradores de IA, tem havido preocupações em relação à posição da NVIDIA no mercado de IA e ao seu potencial monopólio no mercado. 

O primeiro desafio enfrentado pelos engenheiros está relacionado à plataforma NVIDIA CUDA, o método predominante para executar inferências e treinamento de IA. Embora o próprio CUDA tenha provado ser eficaz, a ampla adoção do CUDA torna um desafio para os engenheiros abandonarem as alternativas da NVIDIA.

Outra questão enfrentada é que NVIDIA's monopólio eficaz pode levar a problemas potenciais relacionado a preços e acessibilidade. Com a concorrência limitada, a NVIDIA poderá ter mais controle sobre os preços, o que poderá impactar a acessibilidade do hardware de IA para pesquisadores e empresas. Além disso, a falta de alternativas às plataformas de hardware da NVIDIA pode limitar a acessibilidade aos recursos de computação de IA, especialmente para organizações menores ou pesquisadores com restrições orçamentárias.

Além disso, a NVIDIA o domínio no mercado de hardware de IA pode criar uma barreira à entrada para outras empresas procurando inovar e desenvolver novas tecnologias de IA. A ampla adoção da plataforma CUDA da NVIDIA significa que engenheiros e pesquisadores podem enfrentar desafios na transição para plataformas alternativas ou no desenvolvimento de novas soluções que não sejam baseadas na tecnologia da NVIDIA.

Intel anuncia novo silício AI para combater NVIDIA

Reconhecendo os desafios enfrentados pelos desenvolvedores de IA, A Intel anunciou recentemente o lançamento de um novo dispositivo que afirma ajudará a fornecer aos engenheiros uma nova alternativa à NVIDIA. 

O recente anúncio da Intel do acelerador Gaudi 3 AI, desenvolvido por sua subsidiária Habana Labs, marca um salto significativo na computação de inteligência artificial. Este processador de terceira geração faz parte da estratégia contínua da Intel para conquistar um nicho no crescente mercado de IA, reforçado ainda mais pela aquisição da Habana Labs em 2019.

O acelerador Gaudi 3, fabricado usando o processo de 5 nanômetros de última geração da TSMC, apresenta melhorias notáveis ​​de desempenho, estabelecendo um novo padrão em computação de IA com 1835 TFLOPS de taxa de transferência de computação FP8. Este salto tecnológico significa o compromisso da Intel com o avanço das capacidades dos aceleradores de IA. Tamanhos menores de transistores geralmente resultam em chips mais rápidos e poderosos, destacando o compromisso da Intel em fornecer soluções de computação de IA de alto desempenho.

Em 9 de abril de 2024, no evento Intel Vision em Phoenix, Arizona, a Intel revelou o acelerador Intel Gaudi 3 AI. Este novo acelerador fornece um aumento de quatro vezes na computação de IA para o BF16 e um aumento de 1.5 vezes na largura de banda da memória em relação ao modelo anterior. (Crédito: Intel Corporation) 

Avanços tecnológicos

O acelerador Gaudi 3 AI da Intel marca um avanço considerável nas capacidades tecnológicas. Especificamente, ele oferece um aumento de 4x no desempenho de computação de IA para operações BF16, um aumento de 1.5x na largura de banda de memória e duplica a largura de banda de rede, o que facilita a expansão massiva do sistema em comparação com seu antecessor, Gaudi 2. Essas melhorias não apenas demonstram a capacidade da Intel buscam ampliar os limites das capacidades de hardware de IA, mas também refletem seu foco estratégico na melhoria da eficiência e escalabilidade das aplicações de IA. Esse progresso garante que as soluções da Intel estejam bem equipadas para lidar com as demandas de modelos complexos de IA em grande escala, solidificando ainda mais sua posição no competitivo mercado de IA. 

Posicionamento de Mercado

A introdução do acelerador Gaudi 3 AI pela Intel não é apenas uma atualização tecnológica, mas uma manobra estratégica para consolidar sua posição em um mercado fortemente influenciado pela NVIDIA. Ao oferecer melhorias substanciais em relação às gerações anteriores e focar na escalabilidade e nos padrões abertos, a Intel posiciona o Gaudi 3 como uma alternativa atraente para empresas que buscam diversificar seus portfólios de hardware de IA. Este posicionamento estratégico pretende desafiar o domínio da NVIDIA e catalisar uma mudança na dinâmica do mercado, promovendo maior concorrência e inovação no setor de hardware de IA. 

Soluções abertas e flexíveis

Avançando ainda mais em seu compromisso com a flexibilidade e os padrões abertos, o Gaudi 3 da Intel enfatiza o software aberto e baseado na comunidade e utiliza redes Ethernet padrão da indústria para dimensionar os sistemas de forma mais eficaz. Esta abordagem não só reduz as dependências de tecnologias proprietárias, mas também se alinha com a visão mais ampla da Intel de democratizar a tecnologia de IA. Ao promover soluções abertas, a Intel permite que uma gama mais ampla de empresas e desenvolvedores acesse recursos de IA de ponta, promovendo assim um ambiente mais inclusivo e competitivo. 

Benchmarks de desempenho

A Intel também destaca os benchmarks de desempenho do Gaudi 3, posicionando-o como uma opção superior tanto para as fases de treinamento quanto para as fases de inferência das cargas de trabalho de IA. O acelerador é até 50% mais rápido em tarefas de treinamento e oferece uma vantagem semelhante no rendimento de inferência em comparação com as GPUs H100 da NVIDIA. Estes benchmarks não só demonstram a superioridade técnica de Gaudi 3, mas também a sua capacidade de fornecer soluções mais económicas e energeticamente eficientes. Essas métricas de desempenho são cruciais para empresas que dependem de operações de IA em grande escala, pois se traduzem diretamente em maior produtividade e redução de custos operacionais.

Complementando o lançamento do Gaudi 3, a estratégia mais ampla de IA da Intel inclui inovação contínua em tecnologia de chips de IA e desenvolvimento de software, liderada por líderes como Sandra Rivera. Esta abordagem holística sublinha a visão da Intel para um mercado diversificado e competitivo de chips de IA, preparado para um crescimento significativo nos próximos anos.

O acelerador Gaudi 3 AI da Intel representa um avanço significativo nas capacidades de computação de IA, oferecendo um aumento de 4x na computação de IA para BF16 e um aumento de 1.5x na largura de banda de memória em comparação com seu antecessor, Gaudi 2. Este aprimoramento é crucial para lidar com os cálculos complexos exigidos por aplicações modernas de IA, incluindo grandes modelos de linguagem e sistemas multimodais. A arquitetura do Gaudi 3, construída num processo de 5 nm, também garante maior eficiência energética e velocidades de processamento mais rápidas, que são essenciais para implementações sustentáveis ​​de IA em grande escala.

Como os novos chips podem ajudar os engenheiros a se afastarem dos produtos NVIDIA?

A introdução do acelerador Gaudi 3 pela Intel não é apenas um marco significativo em sua jornada no mercado de chips de IA, mas também remodela o cenário dos sistemas de IA, oferecendo uma alternativa viável e potente às plataformas existentes, especialmente às da NVIDIA.

Sem dúvida, a primeira implicação que isso poderia ter é que os engenheiros do futuro não poderão mais estar vinculados a Ambiente CUDA da NVIDIA para aceleração de IA. Se a Intel puder oferecer os seus produtos a um preço competitivo, poderá muito bem forçar a NVIDIA a baixar os seus preços, criando assim um mercado de chips mais saudável para aplicações de IA.

Outra mudança potencial que a nova linha de chips da Intel poderia introduzir é a introdução de um novo tipo de plataforma, que abrirá os engenheiros a novas opções de software. Considerando que Os núcleos CUDA já existem há vários anos, eles não estão totalmente otimizados para aplicativos de IA, enquanto a nova solução da Intel foi projetada com IA desde o início. Como tal, as plataformas Intel poderiam oferecer melhor eficiência energética e velocidades de processamento mais elevadas.

No entanto, se a plataforma lançada pela Intel for fundamentalmente diferente dos sistemas NVIDIA, isso poderá causar fragmentação no mercado de IA, fazendo com que o hardware de software seja transferido entre as plataformas de hardware NVIDIA e Intel. Essa fragmentação pode prejudicar a velocidade de desenvolvimento dos projetos de IA, criando assim ambientes de desenvolvimento isolados. 

A introdução do acelerador Gaudi 3 AI pela Intel também inclui melhorias significativas nas capacidades de rede, com suporte para redes Ethernet padrão da indústria. Esse recurso permite um dimensionamento mais flexível do sistema e reduz a dependência de soluções de rede proprietárias, que tradicionalmente têm sido uma barreira de entrada para organizações menores. Ao fornecer um ambiente de software aberto e baseado na comunidade, o Gaudi 3 da Intel permite que uma gama mais ampla de desenvolvedores inovem sem as restrições impostas pela dependência de fornecedores, promovendo um ecossistema de desenvolvimento de IA mais competitivo e diversificado.

À medida que a Intel continua a investir em avanços de software e hardware, o futuro dos chips de IA parece promissor. Espera-se que a competição entre Intel e NVIDIA impulsione ainda mais inovações e avanços tecnológicos no campo da computação de inteligência artificial. O lançamento do chip Gaudi 3 significa a determinação da Intel em desafiar o domínio da NVIDIA e estabelecer-se como um ator-chave no cenário em evolução das tecnologias de chips de IA.