Juan Manuel Torres Moreno
¿Puede una computadora aprender a resolver problemas sólo a partir de
ejemplos? Esta cuestión, abordada no hace mucho tiempo en la ciencia
ficción, es actualmente objeto de profundos estudios. Las redes de
neuronas artificiales (RNA) son máquinas que poseen esa capacidad de
aprendizaje. Esos artefactos han sido propuestos como modelos
(extremadamente) simplificados del funcionamiento del cerebro, pues no
retienen más que algunas características esenciales: 1) las neuronas
no pueden encontrarse más que en dos estados posibles, activas o en
reposo; 2) están interconectadas mediante sinapsis que pueden ser
modificadas por aprendizaje, y 3) el estado de una neurona a cada
instante es determinado por el de otras, información que es
transmitida por las sinapsis. Sin embargo, este modelo presenta una
riqueza sorprendente de estados y comportamientos que ha sentado las
bases de un modelo de memoria y aprendizaje como un fenómeno emergente
colectivo: el sistema global presenta propiedades complejas que no
pueden predecirse a partir del estudio individual de sus
componentes.
En este artículo se pondrá énfasis en una actividad tan trivial para
los humanos que pasa desapercibida, pero que presenta dificultades
formidables para una máquina: la clasificación de datos.
Aprendizaje y clasificación
La clasificación es la atribución de una clase específica a un
objeto. Esta atribución necesita un cierto grado de abstracción para
poder extraer generalidades a partir de los ejemplos de los cuales se
dispone. Para una máquina, la clasificación de rostros, datos médicos
o imágenes son tareas bastante difíciles, en tanto que para un humano
son cuestiones cotidianas: ¿quién no es capaz de reconocer el rostro
de un amigo que vimos ayer (o aun años después)? Incluso si ahora usa
lentes, barba o está peinado de otra manera. Otro ejemplo: en el
reconocimiento de caracteres manuscritos, es difícil enunciar una
descripción general que tenga en cuenta todas las variaciones
particulares de cada caracter. Una técnica que puede ser utilizada
para resolver este problema es el aprendizaje. Así, el criterio para
decidir si una imagen corresponde a una letra A, B, C... consiste en
comparar si es lo suficientemente similar a otras A B o C vistas
anteriormente; con ese enfoque, uno no calcula la clasificación de
letras, sino que se aprenden a partir de ejemplos.
La capacidad de aprendizaje de las RNA les da una inmensa ventaja
sobre métodos tradicionales, ya que tan sólo se requiere disponer de
un conjunto de ejemplos (conjunto de aprendizaje) para que la red
pueda aprender. Es por ello que las redes de neuronas son ampliamente
utilizadas en aplicaciones tan variadas como la previsión, la
predicción, la clasificación, el diagnóstico automático, el
procesamiento de señales, el reconocimiento de formas, la compresión
de datos, la optimización combinatoria, la robótica y la búsqueda de
documentos, entre otras.
Las características comunes de las RNA son: una capacidad de
autorganización; robustez frente a perturbaciones externas; memoria
distribuida, deslocalizada y redundante, y un paralelismo masivo e
inherente. A su vez, difieren entre sí por diversos aspectos: sus
motivaciones biológicas, su modo de funcionamiento o su campo de
aplicaciones. Algunas técnicas neuronales avanzadas son llamadas
constructivas, ya que modifican la arquitectura misma de la red en un
proceso antagónico de crecimiento-aprendizaje/disminución-olvido.
Desde un punto de vista metodológico, el uso de las RNA no es trivial;
sin embargo, cuando las redes son correctamente adaptadas a un
problema, permiten desempeños superiores al de otros métodos o incluso
al de seres humanos. Todo lo anterior, sin dejar de lado la parte
fundamental de la investigación: la comprensión de los mecanismos del
intelecto, la cognición y su impacto en la creación de artefactos
inteligentes, que es por sí misma un tema por demás excitante.