Exakte symbolische Künstliche Intelligenz für eine schnellere und bessere Bewertung der KI-Fairness

Update: 6. August 2023
Exakte symbolische Künstliche Intelligenz für eine schnellere und bessere Bewertung der KI-Fairness

Das Justizsystem, Banken und Privatunternehmen nutzen Algorithmen, um Entscheidungen zu treffen, die tiefgreifende Auswirkungen auf das Leben der Menschen haben. Leider sind diese Algorithmen manchmal voreingenommen – sie wirken sich unverhältnismäßig stark auf Menschen mit dunkler Hautfarbe sowie Personen in niedrigeren Einkommensschichten aus, wenn sie sich um Kredite oder einen Job bewerben, oder sogar wenn Gerichte entscheiden, welche Kaution festgesetzt werden soll, während eine Person auf ihren Prozess wartet.

MIT-Forscher haben eine neue KI-Programmiersprache entwickelt, die die Fairness von Algorithmen genauer und schneller beurteilen kann als verfügbare Alternativen.

Ihre Sum-Product Probabilistic Language (SPPL) ist ein probabilistisches Programmiersystem. Probabilistische Programmierung ist ein aufstrebendes Feld an der Schnittstelle von Programmiersprachen und künstlicher Intelligenz, das darauf abzielt, die Entwicklung von KI-Systemen viel einfacher zu machen, mit ersten Erfolgen in den Bereichen Computer Vision, vernünftige Datenbereinigung und automatisierte Datenmodellierung. Probabilistische Programmiersprachen machen es für Programmierer viel einfacher, probabilistische Modelle zu definieren und probabilistische Schlussfolgerungen durchzuführen, d. h. rückwärts zu arbeiten, um wahrscheinliche Erklärungen für beobachtete Daten abzuleiten.

Es gibt bisherige Systeme, die verschiedene Fairnessfragen lösen können. Unser System ist nicht das erste; Da unser System jedoch auf eine bestimmte Modellklasse spezialisiert und optimiert ist, kann es Lösungen um ein Vielfaches schneller liefern.

SPPL bietet schnelle und genaue Lösungen für probabilistische Inferenzfragen wie „Wie wahrscheinlich ist es, dass das Modell jemandem über 40 einen Kredit empfiehlt?“ oder „Generieren Sie 1,000 Antragsteller für synthetische Kredite, alle unter 30 Jahre alt, deren Kredite genehmigt werden.“ Diese Inferenzergebnisse basieren auf SPPL-Programmen, die probabilistische Modelle darüber kodieren, welche Arten von Bewerbern a priori wahrscheinlich sind und wie sie zu klassifizieren sind. Zu den Fairness-Fragen, die SPPL beantworten kann, gehören: „Gibt es einen Unterschied zwischen der Wahrscheinlichkeit, einem Antragsteller mit und ohne Migrationshintergrund einen Kredit mit demselben sozioökonomischen Status zu empfehlen?“ oder „Wie hoch ist die Wahrscheinlichkeit einer Einstellung, wenn der Kandidat für die Stelle qualifiziert ist und einer unterrepräsentierten Gruppe angehört?“

SPPL unterscheidet sich von den meisten probabilistischen Programmiersprachen, da SPPL Benutzern nur erlaubt, probabilistische Programme zu schreiben, für die es automatisch exakte probabilistische Inferenzergebnisse liefern kann. Mit SPPL können Benutzer auch überprüfen, wie schnell die Inferenz sein wird, und so das Schreiben langsamer Programme vermeiden. Im Gegensatz dazu ermöglichen andere probabilistische Programmiersprachen wie Gen und Pyro Benutzern das Schreiben probabilistischer Programme, bei denen die einzigen bekannten Methoden zur Durchführung von Schlussfolgerungen Näherungswerte sind – das heißt, die Ergebnisse enthalten Fehler, deren Art und Ausmaß schwer zu charakterisieren sein können.

Fehler durch ungefähre probabilistische Schlussfolgerungen sind in vielen KI-Anwendungen tolerierbar. Es ist jedoch unerwünscht, dass Inferenzfehler die Ergebnisse bei Anwendungen von KI mit sozialer Wirkung verfälschen, beispielsweise bei der automatisierten Entscheidungsfindung und insbesondere bei der Fairness-Analyse.

SPPL vermeidet Fehler, indem es sich auf eine sorgfältig entworfene Modellklasse beschränkt, die dennoch eine breite Klasse von KI-Algorithmen umfasst, einschließlich der Entscheidungsbaumklassifikatoren, die häufig für algorithmische Entscheidungsfindung verwendet werden. SPPL kompiliert probabilistische Programme in einer speziellen Datenstruktur, die als „Summenproduktausdruck“ bezeichnet wird. SPPL baut weiter auf dem aufkommenden Thema auf, probabilistische Schaltkreise als Darstellung zu verwenden, die effiziente probabilistische Schlussfolgerungen ermöglicht. Dieser Ansatz erweitert frühere Arbeiten zu Summenproduktnetzwerken auf Modelle und Abfragen, die über eine probabilistische Programmiersprache ausgedrückt werden. Allerdings weist Saad darauf hin, dass dieser Ansatz mit Einschränkungen verbunden ist: „SPPL ist beispielsweise wesentlich schneller für die Analyse der Fairness eines Entscheidungsbaums, kann aber keine Modelle wie neuronale Netze analysieren. Andere Systeme können sowohl neuronale Netze als auch Entscheidungsbäume analysieren, sind aber tendenziell langsamer und liefern ungenaue Antworten.“

SPPL zeigt, dass exakte probabilistische Schlussfolgerungen für eine breite Klasse probabilistischer Programme praktisch und nicht nur theoretisch möglich sind. In meinem Labor haben wir gesehen, dass symbolische Inferenzen die Geschwindigkeit und Genauigkeit bei anderen Inferenzaufgaben verbessern, die wir zuvor über ungefähre Monte-Carlo-Methoden angegangen sind tiefe Lernen Algorithmen. Wir haben SPPL auch auf probabilistische Programme angewendet, die aus realen Datenbanken gelernt wurden, um die Wahrscheinlichkeit seltener Ereignisse zu quantifizieren, synthetische Proxy-Daten unter bestimmten Bedingungen zu generieren und Daten automatisch auf wahrscheinliche Anomalien zu überprüfen.

+ Beiträge
  • electronica India und Productronica India sowie MatDispens werden auf den 16.-18. Dezember 2021 verschoben
  • Honda bringt neuen Elektroroller U-GO auf den Markt
  • Decks für die Assam State Electronics Development Corporation Limited für Hochgeschwindigkeits-Internet-Konnektivität freigegeben
  • Der Geo-Imaging-Satellit „EOS-03“ soll im dritten Quartal 2021 starten
Mayank Waschischt
Webseite | + Beiträge
  • Messlösungen von Anritsu für die 5G-NR-Kommunikation auf der Anritsu Test and Measurement Web Expo – Frühjahr 2021
  • KI und ML werden die nächste Stufe im Chipdesign-Spiel freischalten
  • Die künstliche allgemeine Intelligenz (AGI) und die Hypothese der realen existentiellen Bedrohung
  • Erweiterte Realität, die Grenzen zwischen Imagination und Realität verblassen