Inteligencia artificial simbólica exacta para una evaluación más rápida y mejor de la equidad de la IA

Actualización: 6 de agosto de 2023
Inteligencia artificial simbólica exacta para una evaluación más rápida y mejor de la equidad de la IA

El sistema judicial, los bancos y las empresas privadas utilizan algoritmos para tomar decisiones que tienen un impacto profundo en la vida de las personas. Desafortunadamente, esos algoritmos a veces están sesgados, lo que afecta de manera desproporcionada a las personas de color y a las personas de clases de bajos ingresos cuando solicitan préstamos o trabajos, o incluso cuando los tribunales deciden qué fianza se debe establecer mientras una persona espera el juicio.

Los investigadores del MIT han desarrollado un nuevo lenguaje de programación de IA que puede evaluar la imparcialidad de los algoritmos de forma más exacta y rápida que las alternativas disponibles.

Su Lenguaje Probabilístico Suma-Producto (SPPL) es un sistema de programación probabilística. La programación probabilística es un campo emergente en la intersección de los lenguajes de programación y la inteligencia artificial que tiene como objetivo hacer que los sistemas de IA sean mucho más fáciles de desarrollar, con éxitos tempranos en visión por computadora, limpieza de datos de sentido común y modelado de datos automatizado. Los lenguajes de programación probabilísticos facilitan mucho a los programadores la definición de modelos probabilísticos y la realización de inferencias probabilísticas, es decir, trabajar hacia atrás para inferir explicaciones probables de los datos observados.

Existen sistemas anteriores que pueden resolver varias cuestiones de equidad. Nuestro sistema no es el primero; pero debido a que nuestro sistema está especializado y optimizado para una determinada clase de modelos, puede ofrecer soluciones miles de veces más rápido.

SPPL ofrece soluciones rápidas y exactas a preguntas de inferencia probabilística como "¿Qué posibilidades hay de que el modelo recomiende un préstamo a una persona mayor de 40 años?" o "Generar 1,000 solicitantes de préstamos sintéticos, todos menores de 30 años, cuyos préstamos serán aprobados". Estos resultados de inferencia se basan en programas SPPL que codifican modelos probabilísticos de qué tipo de solicitantes son probables, a priori, y también cómo clasificarlos. Las preguntas de equidad que SPPL puede responder incluyen "¿Existe una diferencia entre la probabilidad de recomendar un préstamo a un solicitante inmigrante y no inmigrante con el mismo nivel socioeconómico?" o "¿Cuál es la probabilidad de ser contratado, dado que el candidato está calificado para el trabajo y pertenece a un grupo subrepresentado?"

SPPL es diferente de la mayoría de los lenguajes de programación probabilísticos, ya que SPPL solo permite a los usuarios escribir programas probabilísticos para los cuales puede entregar automáticamente resultados exactos de inferencia probabilística. SPPL también permite a los usuarios comprobar qué tan rápido será la inferencia y, por lo tanto, evitar escribir programas lentos. En contraste, otros lenguajes de programación probabilísticos como Gen y Pyro permiten a los usuarios escribir programas probabilísticos donde las únicas formas conocidas de hacer inferencia son aproximadas, es decir, los resultados incluyen errores cuya naturaleza y magnitud pueden ser difíciles de caracterizar.

El error de la inferencia probabilística aproximada es tolerable en muchas aplicaciones de IA. Pero no es deseable tener errores de inferencia que corrompan los resultados en aplicaciones de inteligencia artificial socialmente impactantes, como la toma de decisiones automatizada, y especialmente en el análisis de equidad.

SPPL evita errores al restringirse a una clase de modelos cuidadosamente diseñados que aún incluye una amplia clase de algoritmos de IA, incluidos los clasificadores de árboles de decisión que se utilizan ampliamente para la toma de decisiones algorítmicas. SPPL funciona compilando programas probabilísticos en una estructura de datos especializada llamada "expresión de producto de suma". SPPL se basa además en el tema emergente del uso de circuitos probabilísticos como una representación que permite una inferencia probabilística eficiente. Este enfoque extiende el trabajo previo sobre redes de suma de productos a modelos y consultas expresadas a través de un lenguaje de programación probabilístico. Sin embargo, Saad señala que este enfoque tiene limitaciones: “SPPL es sustancialmente más rápido para analizar la equidad de un árbol de decisiones, por ejemplo, pero no puede analizar modelos como las redes neuronales. Otros sistemas pueden analizar tanto las redes neuronales como los árboles de decisión, pero tienden a ser más lentos y dar respuestas inexactas ".

SPPL muestra que la inferencia probabilística exacta es práctica, no solo teóricamente posible, para una amplia clase de programas probabilísticos. En mi laboratorio, hemos visto mejoras en la velocidad de conducción y la precisión de inferencia simbólica en otras tareas de inferencia que abordamos anteriormente a través de Monte Carlo aproximado y deep learning algoritmos. También hemos estado aplicando SPPL a programas probabilísticos aprendidos de bases de datos del mundo real, para cuantificar la probabilidad de eventos raros, generar datos proxy sintéticos dadas las restricciones y filtrar automáticamente los datos en busca de anomalías probables.

+ publicaciones
  • electronica India y Productronica India, junto con MatDispens, se reprogramaron del 16 al 18 de diciembre de 2021.
  • Honda lanza el nuevo scooter eléctrico U-GO
  • Cubiertas autorizadas para Assam State Electronics Development Corporation Limited para conectividad a Internet de alta velocidad
  • El satélite de imágenes geográficas “EOS-03” está programado para su lanzamiento en el tercer trimestre de 2021
Mayank Vashisht
Página web | + publicaciones
  • Soluciones de medición de Anritsu para comunicaciones 5G NR en Anritsu Test and Measurement Web Expo - Primavera de 2021
  • AI y ML desbloquearán el siguiente nivel en el juego de diseño de chips
  • La inteligencia artificial general (AGI) y la hipótesis de la amenaza existencial real
  • Realidad extendida, desvaneciendo las líneas entre la imaginación y la realidad