Las matemáticas de la IA

Comentario

Un libro extraordinario para adentrarse en la comprensión de los modelos de aprendizaje profundo de la inteligencia artificial.

No nos dejemos asustar por la presencia de las «matemáticas» en el título. Es cierto que todo el libro trata de expresar en términos matemáticos cada uno de los conceptos fundamentales, pero lo hace de una forma «suave», dando más foco al aspecto conceptual que al formal. No podemos negar que, sin una mínima visión matemática, el libro no podrá aprovecharse al máximo; pero no es menos cierto que aun sin esa estructura mental, el aprendizaje que se obtiene de la lectura es enorme.

No es un libro para empezar a conocer el universo del aprendizaje profundo. Conviene tener unas nociones de bajo nivel de que hay detrás de estos algoritmos. No tanto porque sea necesario para comprender el lenguaje que se usa, que es siempre claro y ordenado, sino para asegurar que una lectura tan amena, didáctica y sencilla no se nos atragante simplemente por darnos cuenta, al cabo de un tiempo, de cosas que dábamos por supuesto y no son como imaginábamos, nos hacen volver hacia atrás.

Recordemos que la IA no es más que la aplicación de procesos (algoritmos) de base matemática y estadística a los datos. Por tanto, este es el punto de partida. No hay magia. Y desde ahí tenemos que comenzar la lectura.

Contenidos

El libro se centra en las redes neuronales artificiales y los algoritmos más habituales para su uso, abordando:

🔴 Los componentes clave de una red neuronal: estructura, proceso de aprendizaje y validación

🔴 Las redes convolucionales

🔴 Las redes neuronales recurrentes

🔴 Autoencoders

🔴 Redes generativas antagónicas (GAN)

🔴 Transformers