Amazon ha desarrollado un método que detecta automáticamente los errores del modelo de aprendizaje automático en determinados tipos de entradas y proporciona una forma de corregirlos. Defuse es una herramienta que, según los desarrolladores, se puede usar para entrenar modelos más robustos.
Defuse se basa en una técnica que entrena un modelo generativo en el conjunto de datos de entrenamiento de un clasificador y luego usa el espacio latente para generar nuevas muestras que el clasificador ya no predice correctamente.
Dado un modelo de clasificación de imágenes entrenado (un clasificador), Defuse genera nuevas imágenes realistas que son variaciones de las entradas del conjunto de prueba que el clasificador maneja mal. Luego, Defuse ordena las imágenes mal clasificadas en «errores de patrón» de alto nivel, grupos de imágenes similares que causan errores constantemente. Estos pueden ser utilizados por personas que están construyendo el modelo de aprendizaje automático para identificar escenarios en los que sus modelos fallarían y entrenar modelos más sólidos.
La forma en que funciona Defuse es que los datos se aumentan mediante el uso de un codificador automático variacional (VAE) en los datos de entrenamiento del clasificador. Un VAE es un modelo entrenado para producir los mismos datos que requiere como entrada, pero en el medio produce una representación vectorial que captura las propiedades más destacadas de la entrada. Esta representación vectorial se puede utilizar para identificar datos que ocupan espacio latente y comparten similitudes por proximidad.
Una vez que se ha entrenado el VAE, la herramienta utiliza su espacio latente para generar nuevos datos de imagen.
Los investigadores realizaron experimentos en tres conjuntos de datos de referencia públicos, evaluando la precisión tanto de los datos de prueba de la región de clasificación errónea como del conjunto de prueba original después de realizar la corrección, y descubrieron que la fase de corrección en Defuse es muy eficaz para corregir los errores descubiertos durante la identificación y la destilación. .
La investigación y la herramienta resultante se presentaron en el Taller NeurIPS 2021 sobre enfoques de IA explicables para la depuración y el diagnóstico (XAI4Debugging) y el equipo dice que para estimular una mayor investigación sobre este tema, han lanzado públicamente el código para Defuse en GitHub.