IBM revela processador de IA acelerado on-chip

Atualização: 26 de agosto de 2021

IBM revela processador de IA acelerado on-chip

IBM revela processador de IA acelerado on-chip

A IBM revelou detalhes do novo processador IBM Telum, que foi projetado para trazer inferência de aprendizagem profunda para cargas de trabalho corporativas para ajudar a lidar com fraudes em tempo real.

O anúncio, feito na conferência Hot Chips, descreveu o primeiro processador da IBM para conter aceleração no chip para inferência de IA enquanto uma transação está ocorrendo.

Com três anos de desenvolvimento, esta nova aceleração de hardware on-chip foi projetada para ajudar os clientes a obter insights de negócios em escala nos setores bancário, financeiro, comercial, de seguros e interações com o cliente. Um sistema baseado em Telum está planejado para o primeiro semestre de 2022.

Telum foi projetado para permitir que os aplicativos sejam executados com eficiência onde os dados residem, ajudando a superar as abordagens tradicionais de IA corporativa que tendem a exigir memória significativa e recursos de movimentação de dados para lidar com a inferência.

Com a Telum, o acelerador estando próximo a dados e aplicativos de missão crítica significa que as empresas podem realizar inferência de alto volume para transações confidenciais em tempo real sem invocar soluções de IA fora da plataforma, o que pode afetar o desempenho. plataforma, implantar e inferir em um sistema IBM habilitado para Telum para análise.

De acordo com uma pesquisa recente da Morning Consult encomendada pela IBM, 90% dos entrevistados disseram que ser capaz de construir e executar projetos de IA onde quer que seus dados residam é importante.

A IBM disse que o Tecum ajudará os usuários a mudar seu pensamento de um detecção de fraude postura para um prevenção de fraudes postura, evoluindo da captura de muitos casos de fraude hoje, para uma era potencialmente nova de prevenção de fraude, sem impactar os acordos de nível de serviço (SLAs), antes que a transação seja concluída.

O chip tem um design centralizado, que permitirá aos usuários aproveitar todo o poder do processador de IA para cargas de trabalho específicas de IA, tornando-o adequado para cargas de trabalho de serviços financeiros, como detecção de fraude, processamento de empréstimos, compensação e liquidação de negociações, lavagem de dinheiro e análise de risco.

O chip foi feito no processo de 7 nm da Samsung e contém 8 núcleos de processador com um pipeline de instrução fora de ordem superescalar profundo, rodando com frequência de clock de mais de 5 GHz, otimizado para as demandas de cargas de trabalho heterogêneas de classe empresarial.

A infraestrutura de interconexão de chips e cache completamente redesenhada fornece cache de 32 MB por núcleo e pode ser dimensionada para 32 chips Telum. O chip duplo módulo o projeto contém 22 bilhões de transistores e 19 quilômetros de fio em 17 camadas de metal.