Implementación de Prophet - Machine Learning - Clase 9 - Parte 7

00:10:31
https://www.youtube.com/watch?v=nknY4sZCgWs

Ringkasan

TLDREl video presenta un proyecto de análisis de datos de temperatura mensuales desde 1880 hasta 2021 utilizando la herramienta Prophet. Este análisis se centra en la estacionalidad anual y la tendencia de aumento de temperaturas, buscando validar la teoría del calentamiento global. El modelo se enfoca en predecir temperaturas anuales, proyectándose hasta el año 2090. Los resultados muestran una tendencia creciente en las temperaturas a partir de 1970, reflejando cambios asociados al consumo global. Se explora la optimización de hiperparámetros, indicando que la estacionalidad tiene un efecto multiplicativo sobre la tendencia. Esto sugiere que con el tiempo, las diferencias estacionales son más pronunciadas. Prophet se utiliza tanto de forma descriptiva como predictiva, permitiendo una visualización clara de la tendencia de las temperaturas.

Takeaways

  • 🌡️ Analizar datos de temperatura desde 1880 a 2021 para entender tendencias.
  • 📈 Se observa una tendencia creciente en temperaturas desde 1970.
  • 🛠️ Uso de Prophet para modelado de datos y predicciones.
  • 🔄 Estacionalidad más baja en invierno y alta en verano.
  • ⚙️ Optimización de hiperparámetros utilizando validación cruzada.
  • 📊 Se utiliza estacionalidad multiplicativa en el modelo de Prophet.
  • 🔍 Prophet permite describir cambios y visualizar tendencias.
  • 🎯 Predicciones de temperatura realizadas hasta el año 2090.
  • 🔧 Ajuste de flexibilidad del modelo con 'change point prior scale'.
  • 🌍 Coincidencia de aumento de temperatura con el inicio del consumo masivo.

Garis waktu

  • 00:00:00 - 00:05:00

    El presentador discute la implementación de proyectos utilizando datos de temperatura mensual desde 1880 hasta 2021, específicamente de una región de EE.UU. Estos datos históricos se usarán para observar la estacionalidad anual y validar la tendencia creciente de la temperatura mundial. Se utiliza el modelo Profeta para predecir temperaturas futuras para los primeros de enero desde 2021 hasta 2090, mostrando una tendencia creciente ligada al cambio climático. El enfoque es examinar la tendencia y estacionalidad, notando un significativo crecimiento de temperatura desde 1970, correlacionado con el aumento en el consumo y actividades humanas.

  • 00:05:00 - 00:10:31

    Se enfocan en mejorar la predicción ajustando hiperparámetros del modelo Profeta. Se explica el parámetro 'change point prayer skate', que influye en la flexibilidad del modelo y la posibilidad de sobreajuste. También se considera cómo la estacionalidad afecta la tendencia de manera constante o multiplicativa. Se utiliza la librería y tórtul para probar combinaciones de parámetros, encontrando que los parámetros por defecto son generalmente los mejores, aunque el efecto multiplicativo es notable a medida que avanza la tendencia. El análisis es más descriptivo que predictivo, mostrando la utilidad de los datos de temperatura para identificar la estacionalidad claramente.

Peta Pikiran

Mind Map

Video Tanya Jawab

  • ¿Qué tipo de datos se utilizan en el proyecto?

    Se utilizan datos de temperatura mensuales de EE.UU. desde 1880 hasta 2021.

  • ¿Cuál es el propósito de este proyecto?

    El proyecto busca analizar la estacionalidad y las tendencias de temperatura creciente en el tiempo.

  • ¿Qué herramienta se usa para modelar y predecir los datos?

    Se utiliza la herramienta Prophet para el modelado y predicción de datos futuros.

  • ¿Cómo se maneja la estacionalidad en el modelo?

    La estacionalidad se incorpora al modelo, siendo más baja en los meses de invierno y alta en los meses de verano.

  • ¿Qué es el 'change point prior scale' en Prophet?

    Es un parámetro que ajusta la flexibilidad del modelo para identificar cambios en la tendencia.

  • ¿Cómo se determina cuál es el mejor modelo?

    Se utiliza la validación cruzada y se optimizan los hiperparámetros para encontrar el modelo con el menor error absoluto promedio (MAE).

  • ¿Qué tendencias se observaron en los datos de temperatura?

    Se observó una tendencia creciente en las temperaturas a partir de aproximadamente 1970, coincidiendo con el inicio del consumo masivo.

  • ¿Qué significa que la estacionalidad sea multiplicativa en el modelo?

    Significa que el efecto de las estaciones sobre la temperatura es cada vez más fuerte a medida que avanza el tiempo.

  • ¿Hasta qué año se realizan predicciones de temperatura?

    Se hacen predicciones de temperatura anual hasta el año 2090.

  • ¿Qué se concluye sobre la efectividad del modelo Prophet?

    Prophet permite describir y visualizar tendencias y estacionalidades, siendo útil para comprender el impacto del cambio climático.

Lihat lebih banyak ringkasan video

Dapatkan akses instan ke ringkasan video YouTube gratis yang didukung oleh AI!
Teks
es
Gulir Otomatis:
  • 00:00:01
    bueno seamos a la última parte que es la
  • 00:00:05
    implementación
  • 00:00:06
    de proyectos y esta implementación la
  • 00:00:10
    vamos a hacer sobre datos de temperatura
  • 00:00:13
    mensuales desde
  • 00:00:16
    1880 hasta
  • 00:00:18
    2021 como siempre le dejamos el link
  • 00:00:21
    para acceder a los datos que son datos
  • 00:00:25
    de eeuu si los pueden encontrar en el
  • 00:00:27
    incisivo de la verdad que es el data set
  • 00:00:29
    histórico más completo que hay
  • 00:00:33
    disponibles y así que tomamos una
  • 00:00:35
    pequeña región de eeuu tomamos este
  • 00:00:39
    estos datos anuales desde 1880 hasta la
  • 00:00:43
    fecha
  • 00:00:44
    y esto es muy bueno porque vamos a estar
  • 00:00:47
    mirando la estacionalidad anual y además
  • 00:00:49
    podemos tratar de validar esta idea de
  • 00:00:53
    que la temperatura del mundo está
  • 00:00:56
    creciendo y que los datos digamos de
  • 00:00:59
    temperatura están mostrando una
  • 00:01:00
    tendencia creciente vamos a ver si
  • 00:01:03
    profeta es capaz de captar esta
  • 00:01:07
    tendencia como siempre es la taser está
  • 00:01:10
    en ese 3 si en un market en la nube de
  • 00:01:12
    maíz es llamamos el ítem vamos a ver las
  • 00:01:16
    primeras
  • 00:01:17
    10 filas son desde enero primero de
  • 00:01:21
    enero de 1895 hasta el primero de
  • 00:01:25
    octubre de 1895 así y la y es la
  • 00:01:29
    temperatura en grados
  • 00:01:33
    los últimos datos vendrían a ser estos
  • 00:01:37
    que llegan hasta el primero de julio de
  • 00:01:41
    2021
  • 00:01:43
    y para armar las predicciones a futuro
  • 00:01:46
    vamos a tratar de predecir un y un único
  • 00:01:50
    datapoint por año porque queremos
  • 00:01:52
    expandirnos digamos hasta el futuro bien
  • 00:01:54
    lejano no nos importa tanto el tema mes
  • 00:01:57
    a mes sí y vamos a querer predecir para
  • 00:02:00
    el primero de enero de 2021 hasta el
  • 00:02:03
    primero de enero de 2000 momentos y si
  • 00:02:05
    no informamos ni mes ni a
  • 00:02:07
    pandas va a reaccionar el mes y el día
  • 00:02:10
    con el default de uno así que vamos a
  • 00:02:12
    estar prediciendo para digamos todos los
  • 00:02:14
    eneros hasta dos mil noventa así
  • 00:02:20
    vamos a poner acá mes igual a 1
  • 00:02:28
    veamos entonces qué vamos a instancia
  • 00:02:33
    para generar el modelo instancia mos
  • 00:02:35
    profeta y luego almacenamos en esta
  • 00:02:38
    variable m en este caso no le estamos
  • 00:02:40
    pasando ningún parámetro pero en este
  • 00:02:43
    punto donde los instancia mos sería el
  • 00:02:45
    lugar para pasarle híper parámetros si
  • 00:02:47
    quisiéramos modificar el default si
  • 00:02:50
    vamos a entrenar lo vamos a darle fit
  • 00:02:52
    train
  • 00:02:54
    al conjunto de 30 vamos a usarlo para
  • 00:02:57
    predecir ese data frame que habíamos
  • 00:03:01
    armado para el futuro y con todos los
  • 00:03:03
    géneros desde 2021 hasta 2000 90
  • 00:03:07
    vamos a
  • 00:03:11
    concatenar también los datos digamos con
  • 00:03:15
    el conjunto de entrenamiento y el
  • 00:03:18
    conjunto de predicción para tener toda
  • 00:03:21
    la teoría de tiempo larga desde
  • 00:03:23
    1880 hasta 2000 90 que va a ser la
  • 00:03:27
    última fecha para la cual queremos
  • 00:03:30
    predecir si íbamos a usar esta función
  • 00:03:33
    de project cloud componentes para ver
  • 00:03:37
    verificar los distintos componentes
  • 00:03:39
    si por un lado tenemos la tendencia se
  • 00:03:42
    acuerdan esa tendencia que era peace
  • 00:03:44
    wise si encontró de alguna manera cuatro
  • 00:03:48
    tramos si en un primer tramo crece en el
  • 00:03:50
    segundo crece después baja
  • 00:03:53
    notar que el último tramo que empieza
  • 00:03:56
    más o menos en 1970 hasta la actualidad
  • 00:04:00
    la realidad es que
  • 00:04:02
    crece a una velocidad digamos más sal
  • 00:04:05
    donde tiene una pendiente bastante más
  • 00:04:07
    marcada que lo que eran las pendientes
  • 00:04:08
    en el pasado y bueno justamente esto
  • 00:04:12
    coincide con la sociedad de consumo y el
  • 00:04:15
    momento en que empezamos a relacionarnos
  • 00:04:17
    otra medida con la tierra así que es
  • 00:04:19
    lógico ver que en este momento
  • 00:04:22
    va acorde a las teorías sobre cambio
  • 00:04:23
    climático ver que en este momento
  • 00:04:25
    empieza una tendencia creciente que por
  • 00:04:27
    el momento no se termina
  • 00:04:31
    y lo que es la estacionalidad
  • 00:04:34
    como se imaginarán los meses de
  • 00:04:36
    alrededor de enero como noviembre como
  • 00:04:39
    febrero son de temperatura más baja y
  • 00:04:43
    tenemos una temperatura mucho más alta
  • 00:04:46
    durante julio y los meses alrededor del
  • 00:04:49
    verano si todo es más o menos la
  • 00:04:52
    estacionalidad que esperaríamos ver a lo
  • 00:04:55
    largo del año si muy cálido en el verano
  • 00:04:59
    y más frío en invierno obviamente este
  • 00:05:01
    es el hemisferio norte
  • 00:05:03
    entonces
  • 00:05:05
    vamos a plantear los pronósticos para el
  • 00:05:10
    mes de enero y a compararlos con los
  • 00:05:15
    meses de enero de nuestro data sexy y
  • 00:05:20
    como vemos hay una especie de tendencia
  • 00:05:24
    creciente de los datos
  • 00:05:29
    hacia el futuro
  • 00:05:33
    y ahora vamos a hacer una optimización
  • 00:05:36
    de hiper parámetros y vamos a modificar
  • 00:05:40
    algunos de los híper parámetros que
  • 00:05:42
    vienen por default entonces vamos a
  • 00:05:44
    probar el valor default y algún otro
  • 00:05:46
    valor un poquito más hacia el extremo sí
  • 00:05:50
    qué significa el change point prayer
  • 00:05:53
    skate bueno básicamente estos este
  • 00:05:57
    parámetro es una es digamos un desvío
  • 00:06:01
    estándar que nosotros suponemos para
  • 00:06:04
    poder calcular una distribución de
  • 00:06:07
    probabilidad si ese nombre proviene de
  • 00:06:11
    la estadística valenciana nosotros
  • 00:06:13
    incorporamos una cierta información que
  • 00:06:15
    llamamos a priori o sea que son
  • 00:06:17
    supuestos en realidad información
  • 00:06:19
    digamos que nosotros inyectamos para
  • 00:06:21
    poder calcular determinadas
  • 00:06:24
    distribuciones
  • 00:06:26
    que nos llevan a poder calcular otros
  • 00:06:29
    cálculos matemáticos en este caso
  • 00:06:31
    prophet va a estar calculando
  • 00:06:32
    transformada de fourier si un concepto
  • 00:06:35
    que no hace falta en este momento verlo
  • 00:06:37
    en detalle pero ténganlo presente porque
  • 00:06:39
    es muy importante para todo lo que tiene
  • 00:06:41
    que ver con procesamiento de señales que
  • 00:06:44
    tienen este tipo de
  • 00:06:45
    oscilaciones
  • 00:06:48
    entonces tenemos un player para los
  • 00:06:50
    saints points cuanto más alto esté entre
  • 00:06:54
    comillas desvío más flexible es el
  • 00:06:57
    modelo más estamos permitiendo
  • 00:07:00
    posibilitando que el modelo over feet sí
  • 00:07:03
    y lo mismo para la estacionalidad y
  • 00:07:07
    además la estacionalidad puede tener un
  • 00:07:10
    efecto digamos constante o puede tener
  • 00:07:13
    un efecto multiplicativo sobre la
  • 00:07:15
    tendencia decir que tiene un efecto
  • 00:07:16
    multiplicativo tendría decir que por
  • 00:07:20
    ejemplo las estaciones son más extremas
  • 00:07:22
    y cada vez
  • 00:07:23
    afecta más el hecho de ser enero o el
  • 00:07:26
    hecho de ser julio a la temperatura
  • 00:07:29
    final así que también vamos a estar
  • 00:07:31
    probando estos dos parámetros entonces
  • 00:07:36
    vamos a usar la librería y tórtul para
  • 00:07:39
    generar todas las posibles combinaciones
  • 00:07:41
    de estas listas de parámetros que
  • 00:07:43
    tenemos dentro del diccionario
  • 00:07:46
    y con esto vamos a generar todos los
  • 00:07:48
    posibles diccionarios de hiper
  • 00:07:50
    parámetros que se pueden con estas
  • 00:07:52
    digamos siete posibilidades si íbamos a
  • 00:07:56
    ir guardando nos los errores absolutos
  • 00:07:58
    promedios
  • 00:08:00
    entonces
  • 00:08:02
    vamos a usar cross validation sí y en
  • 00:08:06
    ese sentido necesitamos
  • 00:08:08
    decir cuánto es el nivel mínimo de datos
  • 00:08:12
    que queremos tener para empezar a hacer
  • 00:08:15
    cross validation si vamos a plantear
  • 00:08:17
    esta fecha mínima como el primero de
  • 00:08:19
    enero de
  • 00:08:21
    1980
  • 00:08:23
    vamos a usar un periodo de
  • 00:08:25
    aproximadamente 10 años y una hora y son
  • 00:08:28
    de aproximadamente 5 años
  • 00:08:35
    entonces hacemos
  • 00:08:37
    adentro de un sencillísimo loop por
  • 00:08:40
    todos los diccionarios posibles de
  • 00:08:42
    parámetros y usamos esos diccionarios y
  • 00:08:45
    después con estos dos asteriscos los
  • 00:08:46
    desempaquetar y se los pasamos como
  • 00:08:48
    parámetro a prophet
  • 00:08:52
    hacemos cross validation y nos quedamos
  • 00:08:55
    de todas las métricas que se calculan
  • 00:08:57
    porque se calculan todas sí que tenemos
  • 00:09:00
    en esta variable de fp vamos a quedarnos
  • 00:09:02
    exclusivamente con el mar si vamos a
  • 00:09:06
    guardar todos esos resultados del tuning
  • 00:09:08
    de hiper parámetros en un data frame y
  • 00:09:11
    vamos a quedarnos por el que tenga el
  • 00:09:13
    mínimo error absoluto promedio
  • 00:09:18
    entonces vamos a mirar cuáles son los
  • 00:09:21
    mejores parámetros básicamente esto nos
  • 00:09:24
    está diciendo que los parámetros por
  • 00:09:27
    default eran los mejores y para el sitio
  • 00:09:30
    analítico y el tráiler es que le
  • 00:09:32
    perdonen el players game y y en el
  • 00:09:35
    season haliti en este caso bueno en este
  • 00:09:39
    caso tomó un valor un poco más chico
  • 00:09:43
    y que efectivamente el mejor modo para
  • 00:09:48
    la estacionalidad es multiplicativos y
  • 00:09:50
    esto quiere decir que a medida que la
  • 00:09:52
    tendencia avanza y crece el efecto de
  • 00:09:56
    las estaciones es cada vez más fuerte
  • 00:09:59
    sobre la predicción de la temperatura
  • 00:10:03
    así que bueno todo esto nos lo está
  • 00:10:05
    pudiendo decir prophets fíjense que lo
  • 00:10:07
    usamos de una forma mucho más
  • 00:10:10
    descriptiva que
  • 00:10:12
    predictiva pero bueno es uno de los
  • 00:10:15
    posibles usos y justamente los datos de
  • 00:10:17
    temperatura son útiles para ver esto
  • 00:10:20
    porque se ve muy claramente la
  • 00:10:22
    estacionalidad así que bueno muchas
  • 00:10:25
    gracias y cualquier duda pero no se nos
  • 00:10:28
    pueden preguntar por slack
Tags
  • implementación
  • datos de temperatura
  • estacionalidad
  • tendencia creciente
  • Prophet
  • predicciones
  • cambio climático
  • hiperparámetros
  • modelado
  • consumo global