El aprendizaje automático ha encontrado sus aplicaciones en muchos campos interesantes a lo largo de estos años. Domar la bolsa es uno de ellos. Llevaba tiempo pensando en darle una oportunidad; sobre todo para afianzar mis conocimientos de trabajo con LSTMs. Y finalmente he terminado el proyecto y bastante emocionado de compartir mi experiencia.
Escribiré sobre mi experiencia en una serie de blogs. El propósito de esta serie no es explicar los conceptos básicos de LSTM o de aprendizaje automático. Por lo tanto, voy a asumir que el lector ha comenzado su viaje con el Aprendizaje Automático y tiene los fundamentos como Python, la familiaridad con SkLearn, Keras, LSTM etc. La razón es que ya hay excelentes artículos sobre temas como «¿Cómo funcionan las LSTM?» por personas que están mucho más cualificadas para explicar las matemáticas que hay detrás. Pero compartiré los enlaces a dichos artículos, siempre que considere que pueden faltar conocimientos de fondo. Aunque hay muchos artículos que te dicen cómo predecir los precios de las acciones dado un conjunto de datos, la mayoría de los autores no revelan/explican cómo llegaron a esa configuración particular para una red neuronal o cómo seleccionaron ese conjunto particular de hiperparámetros. Así que el verdadero propósito de este artículo es compartir esos pasos, mis errores y algunos pasos que me resultaron muy útiles. Como tal, este artículo no se limita al problema de la predicción del precio de las acciones.
Aquí están las cosas que veremos :
Lectura y análisis de datos. (Pandas)
Normalizar los datos. (SkLearn)
Convertir los datos en series temporales y problema de aprendizaje supervisado.
Crear el modelo (Keras)
Ajustar el modelo (en el próximo artículo)
Entrenar, predecir y visualizar el resultado.
Consejos &herramientas que me resultaron muy útiles (último artículo de la serie)
Tenga en cuenta que este primer artículo habla de los pasos de preprocesamiento y las terminologías de LSTM. Si estás bastante seguro de estos pasos, puedes pasar al siguiente artículo.
¡Comencemos!
Lectura y análisis de los datos
Para este artículo utilizaré los datos históricos del precio de las acciones de GE. Usted puede encontrar los datos en mi sitio kaggle aquí. No recuerdo la fuente de los datos ya que los había descargado hace tiempo. Podemos leer los datos en el marco como se muestra a continuación:
Como se puede ver hay alrededor de 14060 elementos, cada uno de los cuales representa los atributos del mercado de valores de un día para la empresa. Veamos cómo se ve en un gráfico :