IBM onthult on-chip versnelde AI-processor

IBM heeft details onthuld van de aankomende nieuwe IBM Telum-processor, die is ontworpen om diepgaande leerinferentie te brengen in bedrijfsworkloads om fraude in realtime aan te pakken.

De aankondiging, gedaan op de Hot Chips-conferentie, beschreef de eerste processor van IBM die on-chip-versnelling bevat voor AI-inferentie terwijl een transactie plaatsvindt.

Deze nieuwe hardwareversnelling op de chip is drie jaar in ontwikkeling en is ontworpen om klanten te helpen zakelijke inzichten op grote schaal te verwerven in bankieren, financiën, handel, verzekeringstoepassingen en klantinteracties. Een op Telum gebaseerd systeem is gepland voor de eerste helft van 2022.

Telum is ontworpen om applicaties efficiënt te laten werken waar de gegevens zich bevinden, waardoor traditionele AI-benaderingen van ondernemingen worden overwonnen die vaak aanzienlijke geheugen- en gegevensverplaatsingscapaciteiten vereisen om gevolgtrekkingen af te handelen.

Met Telum, omdat de versneller zich dicht bij bedrijfskritische gegevens en applicaties bevindt, kunnen bedrijven grote hoeveelheden inferentie uitvoeren voor realtime gevoelige transacties zonder een beroep te doen op platform-AI-oplossingen, wat van invloed kan zijn op de prestaties. Klanten kunnen ook AI-modellen bouwen en trainen buiten- platform, implementeren en afleiden op een voor Telum geschikt IBM-systeem voor analyse.

Volgens recent onderzoek van Morning Consult in opdracht van IBM, zei 90% van de respondenten dat het belangrijk is om AI-projecten te kunnen bouwen en uitvoeren waar hun gegevens zich ook bevinden.

IBM zei dat Tecum gebruikers zal helpen om hun denken van een fraude detectie houding naar een fraudepreventie houding, evoluerend van het opvangen van veel gevallen van fraude vandaag, naar een mogelijk nieuw tijdperk van preventie van fraude, zonder gevolgen voor service level agreements (SLA's), voordat de transactie is voltooid.

De chip heeft een gecentraliseerd ontwerp, waardoor gebruikers de volledige kracht van de AI-processor kunnen gebruiken voor AI-specifieke workloads, waardoor deze geschikt is voor workloads van financiële diensten zoals fraudedetectie, verwerking van leningen, clearing en afwikkeling van transacties, anti-witwaspraktijken en risicoanalyse.

De chip is gemaakt op het 7nm-proces van Samsung en bevat 8 processorkernen met een diepe superscalaire out-of-order instructiepijplijn, draaiend met een klokfrequentie van meer dan 5GHz, geoptimaliseerd voor de eisen van heterogene enterprise-class workloads.

De volledig opnieuw ontworpen cache- en chip-interconnectie-infrastructuur biedt 32 MB cache per core en kan worden opgeschaald naar 32 Telum-chips. De dubbele chip module Het ontwerp bevat 22 miljard transistors en 19 kilometer draad op 17 metaallagen.