This is an excerpt from the Python Data Science Handbook by Jake VanderPlas; Jupyter notebooks are available on GitHub.

The text is released under the CC-BY-NC-ND license, and code is released under the MIT license. If you find this content useful, please consider supporting the work by buying the book!

Machine Learning

Considerado como una rama de la Inteligencia Artificial, Machine Learning (ML) o aprendizaje de máquina, es el estudio científico de algoritmos y models estadísticos que pueden emplearse por los sistemas computacionales para realizar tareas específicas sin tener que instruirlas explícitamente. En muchas formas, es en el aprendizaje de máquina como la ciencia de datos se manifiesta de forma directa y amplia. El término "machine learning" engloba un conjunto de métodos computacionales basados en conceptos estadísticos para resolver tareas específicas que suelen categorizarse en:

  • aprendizaje supervisado, donde el algoritmo construye un modelo a partir de una conjunto de datos que incluye entradas y salidas asociadas a cada entrada, y
  • aprendizaje no supervisado, donde el algoritmo construye un modelo a partir d eun conjunto de datos que contien unicamente entradas sin salidas asociadas.

En ésta sección vamos a ver algunos aspectos prácticos de ML usando la librería Scikit-Learn no es, sin embargo, una introducción al campo pues para eso necesitamos más tiempo y un enfoque muchos más técnico. Tampoco puede considerarse como un manual para la librería de Scikit-Learn, para esto pueden ver la lista de recursos en Recursos adicionales Machine Learning. Las metas de ésta sección son:

  • Presentar parte del vocabulario y conceptos básicos de ML
  • Introducir la librería de Scikit-Learn por medio de algunos ejemplos de uso.
  • Desarrollar un poco de intuición sobre como funcionan algunos métodos y cuando y como aplicarlos.