00:00:03
Hola soy Adrián de la cruz tu maestro en
00:00:08
este curso de Gretel ya tenemos varias
00:00:12
sesiones analizando la técnica de
00:00:14
mínimos codos ordinarios regresión
00:00:17
lineal múltiple Esta técnica ofrece los
00:00:21
mejores resultados linealmente incesados
00:00:24
Pero siempre y cuando se cumplan con
00:00:27
ciertas características o supuestos que
00:00:31
tendremos que revisar al detalle en una
00:00:35
entrega anterior revisamos que se
00:00:37
cumplan la linealidad de parámetros
00:00:39
también que los errores se distribuyen
00:00:42
de una forma normal Eso es importante en
00:00:47
el presente vídeo vamos a revisar que no
00:00:50
exista problemas de
00:00:51
multicolinaridad Qué quiere decir Bueno
00:00:54
lo revisaremos un poquito más adelante
00:00:56
también en entregas posteriores
00:00:59
realizaremos que los errores sean
00:01:02
homoselásticos y que no existan
00:01:04
problemas de auto correlación si es la
00:01:07
primera vez que nos visitas o te has
00:01:11
traído algunos de estos temas Pues te
00:01:13
invito a que te suscribas y también en
00:01:16
este momento te voy a poner la ventanita
00:01:18
para que puedas dirigirte a vídeos
00:01:22
previos es importante porque iremos
00:01:25
abordando cada uno de ellos
00:01:28
bueno como mencioné Este vídeo se trata
00:01:30
de la multicolonialidad recordemos que
00:01:33
el análisis de regresión lineal
00:01:37
tiene el objetivo de mostrar una
00:01:40
relación entre la variable x y la
00:01:43
variable Y al menos en su modelo simple
00:01:45
también lo podemos nosotros identificar
00:01:48
a través de gráficas xym y análisis de
00:01:51
correlación
00:01:52
no obstante sabemos que el mundo no se
00:01:58
pueden explicar un fenómeno o una
00:02:01
variable de forma
00:02:05
unidimensional sí Siempre vamos a tener
00:02:08
muchos factores que van a afectar en
00:02:11
este caso a una variable y la que te
00:02:13
interese pueden ser ventas pueden ser
00:02:16
ingreso pueden ser la variable que tú
00:02:21
hayas definido como toda variable
00:02:23
objetivo entonces lo que está detrás del
00:02:26
análisis de regresión es como variable x
00:02:29
va a estar influyendo sobre la ye pero
00:02:31
cuando nosotros
00:02:33
apilamos o ponemos distintas variables x
00:02:37
que van a impactar esa variable y pues
00:02:39
hacemos el supuesto de que la
00:02:42
correlación entre las variables x puede
00:02:46
ser x1 x2 X3 x 4 pues prácticamente no
00:02:51
existe que sea cero no obstante en el
00:02:54
mundo real esto es muy difícil que se
00:02:56
presente dado que también las variables
00:03:00
entre sí pueden estar por relacionadas
00:03:04
Entonces vamos a revisar
00:03:06
cuánto si en el mundo real es difícil
00:03:08
que sea cero Cuánto es el límite
00:03:12
permitido o que no vaya a causar
00:03:15
problemas en nuestras estimaciones
00:03:18
Cuando tenemos como les comenté tenemos
00:03:20
una variable Y tenemos dos variables x
00:03:22
que debe estar influyendo que observamos
00:03:24
como cada una las explica aquí no existe
00:03:27
colinalidad cuando hay Baja colonialidad
00:03:30
observen como x1 y x2 se explican entre
00:03:34
sí pero en su mayoría explican allí
00:03:37
la colinealidad alta es cuando ya
00:03:41
x1x2 explican mucho Estamos relacionadas
00:03:44
entre sí y poco relacionadas con y o
00:03:47
medianamente y la colinera perfecta es
00:03:49
cuando x1 y x2 están
00:03:53
íntimamente relacionadas incluso una
00:03:55
puede ser múltiplo de la otra y eso es
00:03:58
un problema complicado Cuando tenemos
00:04:01
una colinealidad perfecta porque cuando
00:04:05
existe una relación lineal perfecta
00:04:08
entre las x vamos a tener un grave
00:04:11
problema bueno porque la matriz x
00:04:14
expuesta x inversa es imposible de
00:04:17
estimar y si no podemos estimarla por lo
00:04:19
tanto
00:04:21
va a ser imposible estimar los
00:04:24
coeficientes de las ventas
00:04:27
eso es un aspecto muy técnico de
00:04:30
minusculados ordinarios de álgebra
00:04:32
matricial si te interesa tener algún
00:04:36
curso algún vídeo que abordemos estos
00:04:38
temas más más detallados sobre la
00:04:41
matemática y la estadística
00:04:44
matricial al menos saber en los
00:04:47
comentarios y podemos generar algunos
00:04:50
vídeos sobre todo si te interesa
00:04:52
Volverte un analista o científico de
00:04:56
datos especializados en la minería de
00:04:59
datos
00:05:01
muy bien entonces una colinalidad alta
00:05:04
hará más grande los intervalos de
00:05:06
confianza los errores estándar y la r
00:05:09
cuadrada aquí tenemos este problema que
00:05:12
de nuevo
00:05:13
nuestros instrumentos para calibrar el
00:05:17
modelo pues van a estar alterados en
00:05:19
este caso van a ser más grandes y Por
00:05:25
ende en el caso por ejemplo los errores
00:05:27
estándar que los necesitamos para
00:05:31
validar que las ventas sean
00:05:34
significativas pues vamos a estar vamos
00:05:37
a estar
00:05:40
aceptando o no rechazando muchas
00:05:42
hipótesis nula por lo tanto vamos a
00:05:44
tener pétano significativas es ser
00:05:48
principalmente programa Qué causa la
00:05:50
multicolinalidad Bueno cuando en nuestro
00:05:53
análisis agregamos variables que estén
00:05:55
íntimamente relacionadas Por ejemplo si
00:05:59
yo quiero saber el ingreso una persona
00:06:02
está relacionada con la cantidad de
00:06:03
hijos Pues podría poner la variable hijo
00:06:07
varón
00:06:08
hija
00:06:09
e hijos totales si ustedes observan
00:06:13
hijos totales es la combinación de hijos
00:06:16
más hijas no tiene sentido agregar esta
00:06:20
variable Pero si yo la agrego en mi
00:06:22
modelo de regresión lineal lo que voy a
00:06:24
hacer es que no voy a poder estimar esa
00:06:27
matriz x opuesta x inversa y por lo
00:06:30
tanto no puede estimar mi modelo de
00:06:33
regresión no puedo estimar mis ventas la
00:06:36
práctica bueno veremos Cómo resolverlo
00:06:41
otro causal de la multiculturalidad es
00:06:45
que los modelos pueden estar sobre
00:06:47
determinados más variables explicativas
00:06:49
que observaciones
00:06:52
o que los modelos están mal
00:06:54
especificados incluso por ahí puede
00:06:56
haber problemas de endogenidad
00:06:59
hoy en día es
00:07:02
difícil ya
00:07:04
la generación de datos es muy amplia es
00:07:08
difícil que se presente esta pero podría
00:07:11
ser en algún caso en particular entonces
00:07:13
hay que tener cuidado de que nuestra
00:07:15
base de datos sea grande en particular
00:07:18
le sugiero que sea mayor a 121
00:07:21
observación
00:07:23
muy bien Cómo podemos identificarla se
00:07:27
pide a Gretel que nos muestre una matriz
00:07:30
de correlaciones aquí nosotros podemos
00:07:34
identificar correlaciones altas que
00:07:37
podrían considerarse mayor a punto 85
00:07:41
si dos variables por ejemplo x1 y x2
00:07:44
tiene una correlación menor a punto 85
00:07:46
la verdad es que lo más probable es que
00:07:49
no genere problemas en mis estimaciones
00:07:52
hay otra prueba que es todavía más
00:07:55
específica para multicolonialidad que se
00:07:58
conoce como el factor de inflación de la
00:08:00
varianza aquí el objetivo de
00:08:05
este análisis es observar si la varianza
00:08:08
si la varianza de cada una de las vetas
00:08:11
está
00:08:13
Pues digamos inflada sí o está más
00:08:18
grande de lo que debería de ser y por lo
00:08:20
tanto estoy
00:08:23
no rechazando muchas hipótesis nula Eso
00:08:25
quiere decir que estoy identificando que
00:08:28
muchas de mis variables de modelos son
00:08:31
no significativas cuando generamos un
00:08:35
problema Bueno cuando este valor del pib
00:08:39
sea mayor a 10 quiere decir que ya me va
00:08:43
a generar problemas en estimación y que
00:08:46
los errores estándar los intervalos de
00:08:48
confianza ya van a ser más grandes de lo
00:08:52
que deberían de
00:08:55
Cómo resolver este problema de
00:08:58
multicolonialidad bueno en el caso de
00:09:02
colineral alta pues debemos de eliminar
00:09:04
una variable en el caso que les presenté
00:09:08
Pues si eliminamos la variable de hijos
00:09:11
totales tenemos los efectos de hijas e
00:09:14
hijos e indirectamente también de hijos
00:09:17
totales pero quitemos esa variable para
00:09:19
que podamos estimarlo es relativamente
00:09:22
sencillo hacer esto también podemos
00:09:24
transformar las variables hay ocasiones
00:09:27
en que
00:09:29
esas altas correlaciones entre las
00:09:32
variables independientes sean porque
00:09:34
están medidas en distintas unidades
00:09:37
entonces puede ser que eso nos dé
00:09:39
ciertos correlaciones si nosotros
00:09:41
transformamos las variables por ejemplo
00:09:43
a logaritmos pues podemos tal vez quitar
00:09:48
esa fuerte correlación tendremos de
00:09:52
nuevo que hacer una matriz de Corre
00:09:55
laciones y revisar el vip en nuestras
00:09:57
estimaciones
00:10:01
otro es aumentar el tamaño de muestra
00:10:05
Cuando tenemos una muestra reducida y
00:10:07
observamos altas correlaciones A la
00:10:09
mejor no estamos agregando la suficiente
00:10:12
cantidad de sujetos de observación si
00:10:15
nosotros aumentamos esa ese tamaño de
00:10:19
muestra puede ser que la variabilidad
00:10:21
crezca y por lo tanto las correlaciones
00:10:24
disminuyan entre algunas de las
00:10:26
variables x eso es posible también puede
00:10:30
suceder lo contrario que se incremente
00:10:31
Pero bueno si tenemos una muestra
00:10:34
pequeña siempre recomendable
00:10:36
agrandar la base de datos
00:10:41
hay otro tema sí
00:10:45
planchar 1967 no señalaba esta buena
00:10:49
frase que la multicolonealidad es la
00:10:52
voluntad de Dios y no un problema de
00:10:54
mismos cuidados ordinales Bueno nos
00:10:57
estamos refiriendo a los sesentas
00:10:58
finales de los 60s cuando tener una base
00:11:02
de datos puede ser problemático generar
00:11:05
bases de datos hoy en día ese problema
00:11:07
de la micronumerosidad pues ya no es
00:11:11
contemporáneo debido a la facilidad de
00:11:15
registrar bases de datos también
00:11:18
Cómo ha crecido la capacidad
00:11:20
computacional entonces la
00:11:22
micronumerosidad ya no debe ser un
00:11:25
problema lo que sí es cierto es que la
00:11:28
multiculturalidad es el problema
00:11:31
probablemente
00:11:32
más
00:11:34
o menos complicado de mismos codos
00:11:38
ordinarios típicamente no pruebas en
00:11:41
investigaciones científicas porque es
00:11:44
relativamente sencillo de solucionar y
00:11:47
no generar grandes problemas a menos que
00:11:50
tengas unos bifs muy muy altos muy bien
00:11:54
ya ha visto Así
00:11:57
de forma
00:11:58
sistemática las características de la
00:12:02
multiconalidad vamos a hacer un
00:12:04
ejercicio práctico en Gretel Acompáñame
00:12:08
a revisar cómo vamos a identificar el
00:12:12
multicolonialidad en tu software Gretel
00:12:19
muy bien Vamos a abrir Gretel podemos
00:12:22
darle directamente clic
00:12:24
al software a la imagen y nos aparece
00:12:28
esta ventana ya con el archivo como lo
00:12:33
guardamos lo podemos volver a abrir
00:12:35
abrir archivo de datos nos vamos en este
00:12:38
caso ya tengo aquí registrado casas
00:12:42
Apodaca 2022 lo voy a dar clic y
00:12:45
automáticamente me trae todas las
00:12:48
variables que hemos estado trabajando si
00:12:50
tú quieres esta base de datos trabajar
00:12:52
con ella en tiempo real pausar ir
00:12:55
siguiendo cada uno de los ejercicios que
00:12:59
estamos realizando Bueno te invito a
00:13:02
darle clic al enlace que aparece en la
00:13:05
descripción y ahí verás los pasos para
00:13:08
obtener esta base de datos muy
00:13:12
interesantes también puedes encontrar
00:13:14
más ejercicios relacionados con Gretel
00:13:17
No olvides clic en el en el enlace de
00:13:21
abajo muy bien Bueno aquí es
00:13:24
relativamente sencillo obtener la matriz
00:13:27
de correlación recordemos que nuestra
00:13:29
variable
00:13:30
y es precio nos interesa saber
00:13:34
las características y cómo influencian
00:13:37
sobre el precio de las casas Ahora
00:13:42
yo voy a seleccionar todas las variables
00:13:45
excluyendo la variable y voy a dar shift
00:13:48
y me voy a posicionar en la última una
00:13:51
vez que realizó esto doy clic derecho y
00:13:55
me va a abrir este submenú en este
00:13:58
submenú te puedo pedir matriz de
00:14:01
correlación
00:14:03
la matriz de correlación observo como
00:14:08
me genera las correlaciones entre las
00:14:12
distintas variables x por ejemplo aquí
00:14:15
este uno significa la correlación entre
00:14:18
la variable terreno y terreno Bueno aquí
00:14:21
está terreno y terreno pues obviamente
00:14:25
es uno porque la misma variable pero
00:14:27
aquí tengo construido con respecto a
00:14:30
terreno punto 65 03 No es una
00:14:34
correlación
00:14:35
alta o bueno que me vaya a generar
00:14:38
problemas de multicolor
00:14:40
multicolonialidad tengo baños con
00:14:42
respecto a las variables terrenales
00:14:46
construido tampoco se observan que sean
00:14:49
muy altas y la variable estacionamiento
00:14:51
con terreno variable construido y baños
00:14:55
Aparentemente tampoco me genera
00:14:58
problemas de multicolonialidad en el
00:15:01
tema de recamaras observamos tampoco
00:15:03
identificamos con relaciones altas muy
00:15:07
bien o sea variable no de tener mayor
00:15:10
problema edad Edad de la casa
00:15:13
tenemos correlaciones bajas incluso
00:15:16
negativas Esto no es malo recordemos que
00:15:20
coeficiente de correlación va desde
00:15:23
menos uno hasta uno por tanto no no
00:15:26
debería tener
00:15:27
problemas es valor digamos normal que
00:15:32
podemos encontrar y la variable dummy de
00:15:35
privadas
00:15:36
No percibimos aquí problemas de alta
00:15:41
colinalidad entre alguna variable en
00:15:44
particular
00:15:45
ya analizando la matriz completa
00:15:47
observamos que nuestra correlación más
00:15:50
alta sería
00:15:51
terreno con estos construidos la cual
00:15:55
teóricamente sí me preocupa un poco
00:15:57
Aunque falta hacer la prueba del VIP si
00:16:00
me preocupa un poco porque tiene cierto
00:16:03
sentido
00:16:04
que el tamaño del terreno está
00:16:07
correlacionado con los métodos
00:16:08
construidos sobre ese terreno Entonces
00:16:13
en este caso no hay mucha variabilidad
00:16:16
Aparentemente con la cual no nos
00:16:19
generaría un problema muy bien Vamos a
00:16:22
corroborar esto con el análisis
00:16:24
específico que es el Dif antes de ello
00:16:28
podemos nosotros
00:16:30
revisar
00:16:32
en nuestro menús
00:16:35
nos vamos al menú ver y también aquí
00:16:39
podemos nosotros ser expedir una matriz
00:16:42
de correlación aquí
00:16:43
me va a abrir esta ventana y nos va a
00:16:48
pedir que mandemos a la derecha las
00:16:51
variables que queremos analizar en este
00:16:52
caso son las variables x de modelo que
00:16:56
hemos estado revisando y Bueno le damos
00:17:00
a aceptar y nos genera exactamente la
00:17:03
misma matriz de correlaciones en este
00:17:05
caso tenemos dos formas de Solicitar a
00:17:11
Gretel la matriz de correlaciones
00:17:14
muy bien Ahora vamos a estimar nuestro
00:17:16
modelo nos vamos a minúsculos ordinarios
00:17:19
tenemos nuestra variable de precio como
00:17:22
la dependiente Oye y todas las demás lo
00:17:25
vamos a ir pasando en el mismo orden
00:17:27
cada una de ellas
00:17:30
Pues aquí en el en la flechita
00:17:35
hasta que hayamos pasado todas y cada
00:17:38
una de ellas una vez que tengamos todas
00:17:42
las variables x como regresoras y
00:17:46
nuestra variable dependiente el precio
00:17:49
le vamos a dar a aceptar
00:17:52
le damos aquí los resultados que hemos
00:17:55
analizado en otros videos como te
00:17:58
comenté puedes revisar Esos sus vídeos
00:18:01
esto forma parte de una lista de
00:18:04
reproducción curso Gretel y puedes
00:18:07
revisar Cómo cómo los hemos interpretado
00:18:13
muy bien Vamos a hacer un poquito más
00:18:15
grande esto aquí para que se observe
00:18:17
bien tenemos dos observaciones que van
00:18:20
de uno noventa y cinco la variable
00:18:22
dependiente precio las variables
00:18:25
independientes Aquí vamos a revisar
00:18:32
en el tema de
00:18:36
la prueba
00:18:40
de
00:18:42
nos vamos a ir a análisis
00:18:47
nos ponemos en colinealidad
00:18:51
y me va a generar la el indicador VIP
00:18:56
aquí tenemos factores de inflación de la
00:18:59
varianza eminó posibles uno y valores
00:19:03
mayores a 10 pueden indicar un problema
00:19:05
de colinealidad Entonces observamos
00:19:08
tenemos terreno Dos punto 16 construido
00:19:12
3.5 baños Dos punto 18 estacionamiento
00:19:17
uno punto siete recámaras uno punto
00:19:20
cuatro edad uno punto veintiocho y
00:19:24
Privada 1.3 por lo tanto como no se
00:19:28
rebasan el 10 el número 10 que es como
00:19:32
el valor límite para que genere
00:19:34
problemas de colinalidad que quiere
00:19:36
decir que esa varianza de sus errores
00:19:38
esté inflada de más de
00:19:41
sobreinflada
00:19:43
y que nos genere problemas en las
00:19:46
pruebas de té en los centavos de
00:19:48
confianza aquí no entonces ya revisamos
00:19:51
no más de los supuestos de mismos
00:19:53
cuadrados ordinarios para que nos
00:19:56
otorguen los mejores resultados que no
00:19:59
existan problemas de multicolonialidad
00:20:01
ya habíamos a través de la matriz y el
00:20:04
Dif también nos muestra que
00:20:07
independientemente cada una de las
00:20:08
variables no está ocasionando problemas
00:20:10
a nuestro modelo entonces podemos dar
00:20:12
ahí en nuestra lista un check de no
00:20:18
problemas de multicolonialidad y seguir
00:20:20
avanzando los demás problemas si me
00:20:23
quieres acompañar para revisar Qué otros
00:20:25
problemas hay que revisar o supuestos
00:20:27
que se cumplan para que menos funcionen
00:20:30
a la perfección Pues te invito a que te
00:20:33
suscribas y también compartas Este vídeo
00:20:36
si crees que a un amigo conocido le
00:20:40
puede pedir para que se adentre en este
00:20:43
fascinante mundo de la estadística y
00:20:46
econometría
00:20:50
puedes seguirnos en nuestras redes
00:20:52
sociales economía guión bajo HD en
00:20:55
Twitter e Instagram economía HD todo
00:20:58
junto para Facebook y en estos dos
00:21:01
canales de YouTube economía HD oficial
00:21:04
que vemos temas de actualidad sobre
00:21:07
finanzas
00:21:08
emprendimiento política y por supuesto
00:21:12
economía y en nuestro canal que está más
00:21:15
dedicado a cuestiones académicas
00:21:17
academia economía HD donde puedes
00:21:19
conocer practicar ejercicios que te van
00:21:23
a ayudar a aumentar tus skills y
00:21:26
conocimiento en estos temas no lo
00:21:29
pienses más suscríbete a nuestros
00:21:32
canales nos vemos hasta la próxima