investigadores de la Universidad de Kyushu han desarrollado un nuevo método para comprender cómo las redes neuronales profundas interpretan la información y la clasifican en grupos.
Las redes neuronales profundas son un tipo de inteligencia artificial (IA) que imita la forma en que el cerebro humano procesa la información, pero comprender cómo «piensan» estas redes ha sido durante mucho tiempo un desafío.
Publicado en IEEE Transacciones en redes neuronales y Sistemas de Aprendizaje, el nuevo estudio aborda la importante necesidad de garantizar que los sistemas de IA sean precisos y robustos y puedan cumplir con los estándares requeridos para un uso seguro.
Las redes neuronales profundas procesan información en muchas capas, de forma similar a cómo los humanos resuelven un rompecabezas paso a paso. La primera capa, conocida como capa de entrada, incorpora la datos sin procesar. Las capas posteriores, llamadas capas ocultas, analizan la información. Las primeras capas ocultas se centran en características básicas, como detectar bordes o texturas, como examinar piezas de rompecabezas individuales. Las capas ocultas más profundas combinan estas características para reconocer patrones más complejos, como identificar un gato o un perro, de forma similar a conectar piezas de un rompecabezas para revelar el panorama general.
«Sin embargo, estas capas ocultas son como una caja negra cerrada: vemos la entrada y la salida, pero no está claro qué sucede en el interior», dice en un comunicado Danilo Vasconcellos Vargas, profesor asociado de la Facultad de Ciencias y Tecnologías de la Información. Ingeniería Eléctrica Universitaria de Kyushu. «Esta falta de transparencia se convierte en un problema grave cuando la IA comete errores, a veces causados por algo tan pequeño como cambiar un solo píxel. La IA puede parecer inteligente, pero comprender cómo llega a su decisión es clave para garantizar que sea confiable».
Actualmente, los métodos para visualizar cómo la IA organiza la información se basan en la simplificación de datos de alta dimensión en Representaciones 2D o 3D. Estos métodos permiten a los investigadores observar cómo la IA clasifica los puntos de datos (por ejemplo, agrupando imágenes de gatos cerca de otros gatos y separándolas de los perros). Sin embargo, esta simplificación tiene limitaciones críticas.
«Cuando simplificamos información de alta dimensión en menos dimensiones, es como aplanar un objeto 3D en 2D: perdemos detalles importantes y no podemos ver la imagen completa. Además, este método de visualizar cómo se agrupan los datos dificulta la comparación entre diferentes redes neuronales o clases de datos», explica Vargas.
En este estudio, los investigadores desarrollaron un nuevo método, llamado método de distribución k*, que visualiza y evalúa más claramente qué tan bien las redes neuronales profundas clasifican elementos relacionados.
El modelo funciona asignando a cada punto de datos ingresado un «valor de estrella k» que indica la distancia al punto de datos no relacionado más cercano. Un valor de estrella k alto significa que el punto de datos está bien separado (por ejemplo, un gato lejos de cualquier perro), mientras que un valor de estrella k bajo sugiere una posible superposición (por ejemplo, un perro más cerca de un gato que de cualquier perro). otros gatos). Al observar todos los puntos de datos dentro de una clase, como los gatos, este enfoque produce una distribución de valores de k-estrellas que proporciona una imagen detallada de cómo están organizados los datos.
«Nuestro método preserva el espacio dimensional superior, por lo que no se pierde información. Es el primer y único modelo que puede proporcionar una visión precisa del ‘vecindario local’ alrededor de cada punto de datos», enfatiza Vargas.
Utilizando su método, los investigadores revelaron que las redes neuronales profundas clasifican los datos en arreglos agrupados, fracturados o superpuestos. En una disposición agrupada, los elementos similares (por ejemplo, gatos) se agrupan muy juntos, mientras que los elementos no relacionados (por ejemplo, perros) están claramente separados, lo que significa que la IA puede clasificar bien los datos. Sin embargo, las distribuciones irregulares indican que elementos similares están dispersos en un espacio amplio, mientras que las distribuciones superpuestas ocurren cuando se encuentran elementos no relacionados en el mismo espacio; Ambas distribuciones hacen que los errores de clasificación sean más probables.
COMO EN UN ALMACÉN
Vargas compara esto con un sistema de almacén: «En un almacén bien organizado, los artículos similares se almacenan juntos, lo que hace que su recuperación sea fácil y eficiente. Si los artículos se mezclan, se vuelve más difícil encontrarlos, lo que aumenta el riesgo de seleccionar el elemento equivocado.
La IA se utiliza cada vez más en sistemas críticos como vehículos autónomos y diagnósticos médicos, donde la precisión y la confiabilidad son esenciales. El método de distribución de k-star ayuda a los investigadores, e incluso a los responsables de la formulación de políticas, a evaluar cómo la IA organiza y clasifica la información, señalando posibles debilidades o errores. Esto no sólo apoya los procesos de legalización necesarios para integrar de forma segura la IA en la vida diaria, sino que también proporciona información valiosa sobre cómo “piensa” la IA. Al identificar las causas fundamentales de los errores, los investigadores pueden perfeccionar los sistemas de inteligencia artificial para que no solo sean precisos sino también robustos, capaces de manejar datos confusos o incompletos y adaptarse a condiciones inesperadas.
«Nuestro objetivo final es crear sistemas de IA que mantengan la precisión y la confiabilidad, incluso cuando se enfrenten a los desafíos de escenarios del mundo real», concluye Vargas.
<
Deja una respuesta