IBM stellt On-Chip-beschleunigten KI-Prozessor vor

Update: 26. August 2021

IBM stellt On-Chip-beschleunigten KI-Prozessor vor

IBM stellt On-Chip-beschleunigten KI-Prozessor vor

IBM hat Details des kommenden neuen IBM Telum-Prozessors enthüllt, der entwickelt wurde, um Deep-Learning-Inferenzen auf Unternehmens-Workloads zu übertragen, um Betrug in Echtzeit zu bekämpfen.

Die Ankündigung auf der Hot Chips-Konferenz beschrieb den ersten Prozessor von IBM, der eine On-Chip-Beschleunigung für die KI-Inferenz während einer Transaktion enthält.

Nach drei Jahren Entwicklungszeit soll diese neue Hardwarebeschleunigung auf dem Chip dazu beitragen, dass Kunden umfassende Geschäftseinblicke in den Bereichen Banken, Finanzen, Handel, Versicherungsanwendungen und Kundeninteraktionen erhalten. Ein Telum-basiertes System ist für das erste Halbjahr 2022 geplant.

Telum wurde entwickelt, um eine effiziente Ausführung von Anwendungen dort zu ermöglichen, wo sich die Daten befinden, und hilft dabei, traditionelle KI-Ansätze von Unternehmen zu überwinden, die in der Regel erhebliche Speicher- und Datenbewegungsfunktionen erfordern, um Inferenzen zu verarbeiten.

Da sich der Beschleuniger in unmittelbarer Nähe zu geschäftskritischen Daten und Anwendungen befindet, können Unternehmen bei Telum Inferencing in großem Umfang für in Echtzeit sensible Transaktionen durchführen, ohne plattformunabhängige KI-Lösungen aufrufen zu müssen, was sich auf die Leistung auswirken kann. auf einem Telum-fähigen IBM System zur Analyse bereitstellen und ableiten.

Laut einer kürzlich von IBM in Auftrag gegebenen Studie von Morning Consult gaben 90 % der Befragten an, dass es wichtig ist, KI-Projekte überall dort erstellen und ausführen zu können, wo sich ihre Daten befinden.

IBM sagte, dass Tecum den Benutzern helfen wird, ihr Denken von einem Betrugserkennung haltung zu a Betrugsprävention Haltung, die sich von der Aufdeckung vieler Betrugsfälle heute zu einer möglicherweise neuen Ära der Betrugsprävention entwickelt, ohne die Service Level Agreements (SLAs) zu beeinträchtigen, bevor die Transaktion abgeschlossen ist.

Der Chip verfügt über ein zentralisiertes Design, das es Benutzern ermöglicht, die volle Leistung des KI-Prozessors für KI-spezifische Arbeitslasten zu nutzen, wodurch er sich für Finanzdienstleistungs-Arbeitslasten wie Betrugserkennung, Kreditbearbeitung, Clearing und Abwicklung von Geschäften sowie Geldwäschebekämpfung eignet. und Risikoanalyse.

Der Chip wurde im 7-nm-Prozess von Samsung hergestellt und enthält 8 Prozessorkerne mit einer tiefen superskalaren Out-of-Order-Instruction-Pipeline, die mit mehr als 5 GHz Taktfrequenz läuft und für die Anforderungen heterogener Workloads der Enterprise-Klasse optimiert ist.

Die komplett neu gestaltete Cache- und Chip-Verbindungsinfrastruktur bietet 32 ​​MB Cache pro Kern und kann auf 32 Telum-Chips skaliert werden. Der Dual-Chip Modulen Das Design umfasst 22 Milliarden Transistoren und 19 Meilen Draht auf 17 Metallschichten.