00:00:00
Bienvenidos a descubriendo la
00:00:01
Inteligencia artificial hoy vamos a ver
00:00:02
la primera parte de inferencia
00:00:05
[Música]
00:00:10
probabilística tal y como vimos en el
00:00:12
último vídeo Bueno pues Estuvimos viendo
00:00:13
una serie de conceptos sobre
00:00:15
razonamiento probabilístico de acuerdo
00:00:17
es decir ya os dije que a partir de
00:00:19
ahora lo que vamos a hacer va a ser
00:00:21
empezar a aplicar todo lo que hemos
00:00:23
visto de probabilidad y bueno algo de
00:00:24
estadística lo vamos a empezar a aplicar
00:00:27
dentro de lo que son para hacer infer de
00:00:30
acuerdo dentro de lo que es el mundo de
00:00:31
las inferencias en este caso las
00:00:33
inferencias probabilísticas de acuerdo
00:00:35
la herramienta más potente en este
00:00:37
sentido la que existe dentro por lo
00:00:39
menos al día de hoy dentro de la
00:00:40
Inteligencia artificial son las redes
00:00:41
bayesianas de acuerdo no las redes
00:00:43
bayesianas Bueno pues vamos a empezar a
00:00:45
ver lo que es la red vallesana los
00:00:47
conceptos generales sobre redes
00:00:48
bayesianas pero luego empezaremos a ver
00:00:49
Bueno pues algunas en concreto desde las
00:00:51
más sencillas hasta las más complejas
00:00:53
podamos llegar de acuerdo sobre cómo
00:00:56
hacer realmente inferencias con redes
00:00:58
banas pero para como las tiene bueno por
00:01:00
su complejidad lo que vamos a ir es poco
00:01:02
a poco en el último vídeo Estuvimos
00:01:03
viendo una serie de cosas sobre
00:01:04
razonamiento probabilístico que En
00:01:06
definitiva como decía Bueno pues es
00:01:08
aplicar la probabilidad Bueno pues a ya
00:01:11
casos concretos de la Inteligencia
00:01:12
artificial hoy Vamos a continuar entre
00:01:14
Este vídeo y el siguiente vamos a ver
00:01:16
una Bueno pues lo que son las bases de
00:01:17
lo que es la inferencia Eh
00:01:19
probabilística entonces Bueno hay una
00:01:20
serie de conceptos que me me interesa
00:01:23
que empecéis a conocerlos esto es una
00:01:26
especie de avance es decir no voy a
00:01:27
tener en excesivo en en cada uno de
00:01:30
estas cosas porque luego estas cosas las
00:01:31
vamos a ver más adelante pero por lo
00:01:32
menos para que sepáis de por dónde van
00:01:34
los tiros pu Cómo van las cosas no cómo
00:01:36
En definitiva En qué se basa La
00:01:38
inferencia probabilística hoy vamos a
00:01:39
ver una serie de de Bueno pues de de de
00:01:42
cosas que en un momento dado es empezar
00:01:44
a aplicar la lo que hemos visto de
00:01:46
probabilidad en dentro de lo que es la
00:01:48
el mundo de las inferencias de acuerdo
00:01:50
de la probabilidad lo primero que
00:01:51
tenemos que saber Es que la las
00:01:54
inferencias dentro del mundo de la
00:01:55
probabilidad se basan en la eh
00:01:56
probabilidad condicional de acuerdo por
00:01:58
eso en un momento he titulado Bueno pues
00:02:01
el vídeo como inferencia eh condicional
00:02:03
de acuerdo Entonces la inferencia
00:02:05
condicional En definitiva eh se basa en
00:02:09
lo que bueno la Inteligencia artificial
00:02:11
llamamos creencias de acuerdo Qué son
00:02:14
las creencias Bueno pues Aquí más o
00:02:16
menos lo explico No dadas las evidencias
00:02:17
En definitiva recordad que vamos a tener
00:02:19
una serie de Bueno pues diferentes
00:02:21
variables Entonces vamos a tener una una
00:02:24
base de conocimiento en la cual Bueno
00:02:26
pues en esa base conocimiento lo que
00:02:27
vamos a almacenar son evidencias Qué son
00:02:29
las evidencias Bueno si lo equip paramos
00:02:31
con la lógica lo que hemos visto en
00:02:33
lógica y la base de conocimiento que
00:02:35
hemos visto en lógica Bueno pues
00:02:36
teníamos hechos y reglas entonces esos
00:02:38
hechos Por así decirlo las cosas que
00:02:40
sabemos sobre el mundo pues son lo que
00:02:42
aquí llamamos evidencias de acuerdo
00:02:44
Entonces dadas las evidencias
00:02:46
almacenadas como probabilidades a priori
00:02:48
de acuerdo en una base de conocimiento
00:02:51
vuelvo al ejemplo de la lógica en la
00:02:52
lógica teníamos eh una base de
00:02:54
conocimiento en el cual teníamos hechos
00:02:56
y reglas que las almacenamos Pues con
00:02:58
sentencias de la lógica que estuvimos
00:03:00
tratando en cada momento En este caso
00:03:01
hemos visto la lógica proposicional
00:03:02
Bueno pues sentencia de la lógica
00:03:04
proposicional o se puede ser un
00:03:06
subconjunto de ella como hemos visto con
00:03:07
el tema de las cláusulas de for etcétera
00:03:09
entonces en este caso lo que tenemos es
00:03:12
una base de conocimiento y qué tenemos
00:03:13
almacenado en esa base de conocimiento
00:03:14
pues lo que tenemos almacenado son
00:03:15
probabilidades de acuerdo Entonces eh
00:03:18
las evidencias los hechos En definitiva
00:03:20
se almacenan como probabilidades a
00:03:22
priori de acuerdo Entonces como digo las
00:03:25
evidencias almacenadas como
00:03:26
probabilidades primer base de
00:03:27
conocimiento nos permiten obtener
00:03:30
las causas vale de esas evidencias vale
00:03:33
mediante el cálculo de las
00:03:34
probabilidades a posterior En definitiva
00:03:37
recordar de la probabilidad que para
00:03:38
calcular la probabilidad a posterior y
00:03:40
lo que se usa lo que se usa es la
00:03:41
probabilidad condicional de acuerdo
00:03:43
cuando aplicamos la probabilidad
00:03:44
condicional lo que estamos obteniendo es
00:03:46
una prioridad a posteriori a partir de
00:03:48
unas prioridades a priori de acuerdo
00:03:50
Entonces en este caso nosotros tenemos
00:03:51
unas evidencias vemos como una serie de
00:03:53
hechos y lo que queremos obtener Cuando
00:03:56
hacemos inferencia pues En definitiva
00:03:58
son las causas no imaginar os creo que
00:04:00
en el último vídeo ponía Este ejemplo de
00:04:02
que salimos a la calle y vemos que la
00:04:04
bueno la calle está mojada no el solo de
00:04:06
la calle está mojado Entonces si
00:04:08
Queremos saber cuál es la causa Vale
00:04:10
pues lo que tenemos que hacer es empezar
00:04:11
a hacer conjeturas y decimos Ah pues
00:04:13
puede ser porque pues que haya llovido o
00:04:15
puede ser que haya alguien oes a lo
00:04:17
mejor una manguera lo ha mojado o puede
00:04:19
ser s que han tirado un cubo de agua lo
00:04:21
que sea no es decir puede ser una serie
00:04:24
de causas cada causa tendrá una
00:04:25
probabilidad y esas probabilidades las
00:04:27
podemos calcular como probad posterior
00:04:29
dadas las evidencias de acuerdo Entonces
00:04:32
como digo la inferencia la inferencia
00:04:35
probabilística basada en la inferencia
00:04:36
condicional eh consiste básicamente en
00:04:39
calcular las probabilidades de las
00:04:40
causas que hayan podido provocar esas
00:04:42
evidencias de acuerdo cuando trabajamos
00:04:44
con creencias ocurre que bueno pues
00:04:46
según va llegando nueva información las
00:04:49
probabilidades vale las probabilidades
00:04:51
que vamos calculando pues van variando
00:04:53
de acuerdo Entonces por eso digo aquí
00:04:54
Que bueno pues este concepto de
00:04:56
actualización de la base de
00:04:57
conocimientos Eh bueno lo lo que viene a
00:04:59
decir un poco es que la obtención
00:05:01
sucesiva de nuevas evidencias va va a ir
00:05:03
cambiando las probabilidades de las
00:05:04
creencias En definitiva de la gente pues
00:05:07
se va a seguir moviendo por el mundo y
00:05:08
entonces va obteniendo pues nuevas
00:05:10
informaciones que eso va a hacer va a
00:05:12
provocar que las los cálculos de las
00:05:14
probabilidades vayan cambiando me
00:05:15
explico con un ejemplo el ejemplo que
00:05:17
veíamos antes de eh la lluvia yo salgo a
00:05:20
la calle solo está mojado Bueno una una
00:05:22
posible explicación es que el cielo
00:05:25
Bueno pues que ha llovido no Entonces si
00:05:27
salimos y el cielo está muy nublado
00:05:29
parece que Que bueno que va a llover o
00:05:31
que ha podido llover pues la
00:05:33
probabilidad de que el suelo esté mojado
00:05:34
porque ha llovido aumenta de acuerdo
00:05:36
mientras que la otras probabilidades es
00:05:38
decir las probabilidades de que haya
00:05:39
ocurrido otra cosa por ejemplo que haya
00:05:41
haya alguien regado el suelo Pues porque
00:05:44
hace mucho calor y y lo ha regado pues
00:05:45
para que esté más fresco Pues disminuye
00:05:48
de acuerdo sobre todo Por ejemplo si es
00:05:49
invierno y demás no eso se otra
00:05:51
evidencia En qué estación estamos pues
00:05:52
estamos en verano o invierno si estamos
00:05:54
en invierno No Es lógico que una persona
00:05:55
reggue el suelo para por ejemplo para
00:05:58
que esté más fresco no en verano sí
00:06:01
Entonces qué pasa que según las
00:06:02
evidencias que vamos observando que
00:06:04
vamos obteniendo van modificando las
00:06:05
probabilidades si estemos en plano
00:06:07
verano no hay nubes hay un sol
00:06:08
espléndido y resulta que el suelo está
00:06:10
mojado pues la probabilidad de que haya
00:06:11
llovido disminuye muchísimo no Mientras
00:06:13
que otras probabilidades como decía
00:06:14
antes que hayan alguien haya regado el
00:06:16
suelo pues para que esté más fresco pues
00:06:18
aumenta de acuerdo Entonces esa
00:06:21
actualización ese proceso de obtener
00:06:23
nuevas evidencias y que van
00:06:24
modificándose en las probabilidades que
00:06:27
vamos calculando a posterior y se le
00:06:28
llama actualización de acuerdo Pues bien
00:06:30
en base a esto ahora tenemos que empezar
00:06:33
bueno pues a a ser capaces Por así
00:06:35
decirlo de representar de escribir los
00:06:37
problemas que queremos resolver Entonces
00:06:39
lo primero que tenemos que hacer es
00:06:40
representar los datos con los que vamos
00:06:42
a trabajar en este caso ya no vamos a
00:06:43
tener variables ya no voy a representar
00:06:45
las variables en plan de a b c o x y z
00:06:48
lo que vamos a hacer es bueno pues
00:06:49
establecer una serie de nombres que nos
00:06:51
ayuden a entender qué es lo que estamos
00:06:52
calculando en este caso bueno en el caso
00:06:55
general Por así decirlo en el caso en
00:06:57
momento dado Cuando digo casos generales
00:06:58
Bueno pues en general como cómo vamos a
00:07:00
Qué tipo de problema vamos a solucionar
00:07:01
Bueno pues las variables se van a
00:07:03
desglosar en tres grupos primero están
00:07:05
las evidencias que son las variables
00:07:08
observadas si recordáis el vídeo
00:07:09
anterior hablaba que había dos tipos de
00:07:12
variables las observadas y las ocultas
00:07:13
bueno por las variables observadas es lo
00:07:15
que llamamos evidencias entonces las
00:07:17
variables observadas bueno como
00:07:19
variables que son pues las podemos
00:07:21
representar con una letra mayúscula de
00:07:22
acuerdo en este caso con la letra e de
00:07:25
bueno viene esta nomenclatura viene de
00:07:27
inglés entonces la r petado Entonces
00:07:30
esto sería e de evidence de acuerdo H de
00:07:32
hidden y eh q de question de acuerdo o
00:07:35
de query entonces la e viene a
00:07:38
representar una evidencia siempre que
00:07:40
hagamos la e va a representar una
00:07:41
evidencia y cada una de esas evidencias
00:07:44
tiene unos valores Vale entonces aquí la
00:07:45
evidencia un la evidencia 2 La evidencia
00:07:47
K la que sea vale tenemos K evidencias
00:07:49
pues tien los valores uno el valor 2s el
00:07:51
valor K el que sea de acuerdo para
00:07:54
representar esto como esto a lo mejor es
00:07:55
muy grande ya hablábamos antes en el
00:07:57
vídeo anterior de que vamos a utilizar
00:07:59
en vez de hasta ahora hemos estado
00:08:01
utilizando Mejor dicho eh una serie de
00:08:03
bueno de representaciones de variables
00:08:05
atómicas que se llamaban es decir una
00:08:06
variable solamente tenía un único valor
00:08:09
Pues ahora vamos a empezar a utilizar
00:08:10
representaciones factorizadas que En
00:08:12
definitiva son vectores vectores de
00:08:14
datos de acuerdo en este caso vamos a
00:08:16
tener un vector que es pues todas las
00:08:18
evidencias no las K evidencias entonces
00:08:20
para representar los vectores en el
00:08:22
mundo anglosajón en el mundo Bueno pues
00:08:25
hispan hablante utilizamos diferentes
00:08:26
representaciones pero En definitiva tod
00:08:28
se basa Pues en poner esa letra esa
00:08:31
variable en en negrita resaltarla de
00:08:33
alguna forma por ejemplo en negrita o lo
00:08:34
que sea su utilizado bastante la negrita
00:08:36
pero también se su utilizar por lo menos
00:08:38
en el mundo espan hablante pues una
00:08:40
flecha o una raya encima de la variable
00:08:42
de esa forma viene a representar de que
00:08:43
esa variable no tiene un único valor
00:08:44
sino que tiene Bueno pues es un vector o
00:08:46
una matriz de valores de acuerdo
00:08:47
Entonces yo aquí más o menos lo he hecho
00:08:50
para que no escribir esto que es muy
00:08:51
largo pues lo vamos a compactar de esta
00:08:53
forma vale las evidencias una e con una
00:08:55
raya encima no sé si la raya se ve bien
00:08:57
pero bueno una e mayúscula una una rall
00:08:59
encima es igual Pues a estos valores de
00:09:01
acuerdo e minúscula con una ralla encima
00:09:03
Entonces esto es lo mismo que esto de
00:09:05
acuerdo bien eso en cuanto a evidencias
00:09:08
que son las variables observadas luego
00:09:10
tenemos las variables ocultas vamos a
00:09:12
tener r variables ocultas desde h1 h2
00:09:15
hasta hr de acuerdo lo mismo la podemos
00:09:17
representar para de forma más compacta
00:09:19
con una h con una raya encima eh No sé
00:09:21
si se verá bien no es una a de acuerdo
00:09:23
no es una a mayúscula sino es una h con
00:09:24
una raya encima de acuerdo y lo mismo
00:09:27
Qué son las variables ocultas bueno eh
00:09:29
realmente cuando nosotros estamos
00:09:32
tratando con el mundo con los hechos del
00:09:33
mundo lo que ha ocurrido en el mundo
00:09:35
siempre hay cosas que podemos observar y
00:09:36
hay cosas que no podemos observar por
00:09:38
ejemplo en el ejemplo anterior pues no
00:09:40
no sabemos si ha llovido o si alguien ha
00:09:42
regado o lo que sea eso ser una variable
00:09:44
oculta lo que nos interesa realmente Por
00:09:46
así decirlo es si llegamos a conocer
00:09:49
todas las evidencias y nosotros En un
00:09:50
momento dado todos todas las variables
00:09:52
de las cuales depende lo que nosotros
00:09:53
queremos saber supiéramos el valor pues
00:09:56
entonces ya no habría incertidumbre de
00:09:58
acuerdo hay certidumbre porque hay parte
00:10:00
de varibles parte bueno de los hechos
00:10:02
que sí conocemos que llamamos evidencias
00:10:04
y parte que no parte que nada más que
00:10:06
podemos especular como son las variables
00:10:07
ocultas de acuerdo Entonces siempre
00:10:09
vamos a tener alguna variable oculta de
00:10:10
acuerdo que no sabemos su valor y que
00:10:12
nos interese Bueno pues nos interesa
00:10:14
trabajar con ella para saber a lo mejor
00:10:16
Qué probabilidad tiene de lo que haya
00:10:17
ocurrido por ejemplo Qué probabilidad
00:10:18
hay de que haya llovido Qué probabilidad
00:10:20
hay de que alguien haya mojado la acera
00:10:22
de esa forma Bueno pues podemos obtener
00:10:25
hacer inferencia En definitiva no Y por
00:10:27
último como siem suele pasar con Cuando
00:10:30
tenemos una base de conocimiento Bueno
00:10:32
pues lo que queremos hacerle preguntas
00:10:34
En definitiva muchas veces lo que
00:10:35
queremos hacer una pregunta para saber
00:10:36
la respuesta en este caso la pregunta
00:10:39
que representa alguna q de acuerdo de
00:10:42
queso no es una o vale No sé si lo
00:10:44
veréis como una O pero por si acaso
00:10:45
porque muchas ve la resolución del vídeo
00:10:47
no es del todo buena es una q de acuerdo
00:10:49
bien eh lo que viene a representar es
00:10:51
bueno por suo en el momento Queremos
00:10:52
hacer una pregunta en este caso en la
00:10:54
base de conocimiento como trabajamos con
00:10:55
probabilidades pues lo que queremos
00:10:56
saber es la probabilidad de que ocurra q
00:10:58
cuando ten tenemos Bueno pues ciertas
00:11:00
evidencias y demás no Entonces eso es
00:11:02
con lo que vamos a trabajar con lo que
00:11:03
vamos a ver a en la siguiente
00:11:05
diapositiva de acuerdo Pues bien aquí
00:11:07
más o menos tenemos las fórmulas con las
00:11:08
que vamos a trabajar de acuerdo por lo
00:11:10
menos las fórmulas más básicas con las
00:11:12
que vamos a trabajar y son las fórmulas
00:11:14
en las que se basa eh las redes vallesan
00:11:16
de acuerdo y la inferencia probabilista
00:11:18
como decía eh lo que tenemos los que nos
00:11:20
interesa vale en muchos casos es
00:11:22
calcular la probabilidad de algo que
00:11:24
nosotros queremos preguntar e la q es
00:11:26
una variable que En definitiva
00:11:27
representa lo que queremos preguntar eh
00:11:29
en base a una serie de evidencias
00:11:30
entonces eso se pone como una
00:11:31
probabilidad condicional como ya he
00:11:33
dicho se basa en probabilidad
00:11:34
condicional vale la inferencia
00:11:36
probabilística Entonces cuál es la
00:11:37
probidad x de q dada una serie de
00:11:39
evidencias desde la un hasta la k bien
00:11:41
eh lo que he hecho lo que el siguiente
00:11:45
paso vale lo que vemos aquí en realidad
00:11:47
es eh dos cosas lo primero que he hecho
00:11:49
ha sido convertir la probilidad
00:11:51
condicional en una probabilidad conjunta
00:11:53
Por qué probabilidad conjunta porque
00:11:54
nosotros lo que vamos a trabajar como
00:11:55
hemos visto en el vídeo anterior son con
00:11:57
tablas de probabilidades conjuntas vale
00:11:59
luego marginalizar remos normalizar
00:12:02
remos o lo que sea pero En definitiva
00:12:04
nuestra herramienta más básica son las
00:12:05
probidades las tala de probabilidad
00:12:07
conjunta Entonces es lo que he hecho ha
00:12:09
sido convertirlo de acuerdo lo he puesto
00:12:11
de esta forma En definitiva el sumatorio
00:12:12
desde h1 hasta hr de la probabilidad
00:12:14
conjunta de q más todas las H todas las
00:12:17
variables ocultas más todas las
00:12:19
evidencias de acuerdo el siguiente lo
00:12:22
siguiente que he hecho ha sido como veis
00:12:24
introducir lo que son las variables
00:12:25
ocultas es decir aquí tenemos nada más
00:12:27
que las variables observables las evid
00:12:29
pero si nosotros queramos hacer los
00:12:30
cálculos Tenemos que tener en cuenta las
00:12:31
variables ocultas y es lo que he hecho
00:12:33
aquí de acuerdo aparte de convertirlo en
00:12:35
una probabilidad conjunta pues lo que
00:12:36
hecho ha sido introducir las variables
00:12:39
ocultas de acuerdo de h1 hasta hr por
00:12:41
eso Aquí está el sumatorio de h1 hasta
00:12:42
hr de todas estas probabilidades de
00:12:44
acuerdo qué ocurre que eso como decía
00:12:47
como siempre decimos las probabilidades
00:12:49
o sea para poder tratar con ellas hay
00:12:50
que normalizarlo de acuerdo Entonces por
00:12:52
eso lo multiplico todo por alfa Alfa es
00:12:54
la normalización que está puesta aquí de
00:12:56
acuerdo que es un partido por el
00:12:58
probatorio en K en este caso no no hdr O
00:13:01
sea no r Mejor dicho sino en K de la
00:13:03
probabilidad de que es la probilidad
00:13:06
conjunta de q y todas las evidencias de
00:13:08
acuerdo eso es un factor de
00:13:10
normalización como sabéis ya de los
00:13:11
vídeos si si estos pasos no no lográis
00:13:14
verlos y demás recordad que hay vídeos
00:13:16
en los cuales se hablaba sobre la pridad
00:13:18
conjuntas sobre la normalización
00:13:19
etcétera entonces Bueno pues si no lo
00:13:21
tenéis en mente o no lo terminis de ver
00:13:23
pues repasar esos vídeos que a lo mejor
00:13:24
os puede ayudar a entenderlo de acuerdo
00:13:27
pero como sabéis muchas veces cuando
00:13:28
tenemos comparar
00:13:29
probabilidades Bueno pues si vamos a
00:13:31
trabajar con ellas hay que normalizarlo
00:13:33
pero si solamente vamos a eh Bueno pues
00:13:35
a compararlas Bueno pues podemos oliar
00:13:37
la normalización entonces bueno
00:13:39
dependiendo para qué se vayan a usar
00:13:41
pues pues Tendremos que hacer el cálculo
00:13:42
este normalización o no pero en
00:13:44
principio vamos a suponer que bueno
00:13:45
porque lo necesitamos Entonces se
00:13:47
multiplica por alfa que es el factor de
00:13:49
normalización como digo como veis esta
00:13:52
fórmulas son bastante grandes en cuanto
00:13:54
tengamos unas cuantas variables en
00:13:55
cuanto tengamos unas cuantas bueno
00:13:56
evidencias por un lado variables ocultas
00:13:58
y demás se van a hacer muy grandes
00:14:00
entonces para para que sea más compacta
00:14:01
para la representación sea más compacta
00:14:03
lo he puesto de esta forma vale lo he
00:14:05
representado de esta forma como decía
00:14:06
antes todas las variables que tengan
00:14:08
varios valores Bueno pues tienen la
00:14:10
flechita arriba o la o la raya arriba o
00:14:13
está en negrita pero bueno como con el
00:14:15
proyector y y con el vídeo la solución
00:14:17
del vídeo lo de la negrita a lo mejor no
00:14:18
se ve bien vale el pues lo que he hecho
00:14:21
ha sido pues poner una rolla encima de
00:14:22
acuerdo Entonces esto es lo mismo que lo
00:14:24
que hemos visto arriba es decir la
00:14:25
probad de que se deca donas evidencias
00:14:27
aquí las evidencias la Rita arriba
00:14:29
porque como hemos visto son varios
00:14:30
valores es igual a la normalización por
00:14:33
la suma en H con la Rita encima vale
00:14:35
porque son varios valores de el
00:14:38
sumatorio de las probabilidades
00:14:39
conjuntas de q h y e h y con Rita encima
00:14:42
porque son varios valores de acuerdo
00:14:44
Entonces Bueno es lo mismo que arriba
00:14:46
pero como veis más compacto la
00:14:47
normalización Pues también se se
00:14:49
simplifica pues uno partido del
00:14:50
sumatorio de la probabilidad de q y e de
00:14:53
acuerdo probabilidad conjuntas de q y e
00:14:55
que son las c bien
00:14:57
eh en base a eso vale eh Bueno pues
00:15:02
tenemos que realmente lo que nos
00:15:04
interesa calcular una vez que ya más o
00:15:05
menos veis que que los cálculos se basan
00:15:08
en eso en en calcular probabilidades con
00:15:11
Perdón probabilidades condicionales a
00:15:12
partir de probabilidades
00:15:13
conjuntas hay una fórmula que es la que
00:15:16
es la base de todo es la que más vamos a
00:15:18
utilizar es es el corazón Por así
00:15:20
decirlo de las redes bayesianas de
00:15:22
acuerdo queé es esta fórmula de aquí de
00:15:24
acuerdo Entonces En definitiva esta
00:15:26
fórmula es la que bueno pues con la que
00:15:28
vamos a tener que trabajar de acuerdo
00:15:30
Entonces de momento os muestro la
00:15:32
fórmula o La explico Así un poco por
00:15:35
encima pero quedaos tranquilos porque
00:15:38
luego cuando vayamos las redes
00:15:39
bayesianas Yo quiero ir poco a poco por
00:15:40
las redes bayesianas es muy o sea es
00:15:43
decir es son tien un valor una
00:15:44
importancia muy grande entonces vamos a
00:15:46
ir muy poquito a poco viendo ejemplos
00:15:47
etcétera y nos vamos a detener mucho en
00:15:49
ella pero como digo Este vídeo es un
00:15:51
vídeo especie de avance para que veáis
00:15:53
un poco pues primero Qué tipos de Bueno
00:15:55
pues de fórmulas tendríais que empezar a
00:15:57
repasar si no lo tenéis muy claro para
00:15:59
poder entenderlo bien vale Y eh Por lo
00:16:02
menos que empieza a sonar vale Yo
00:16:03
empiezo a mostrar estas fórmulas para
00:16:05
que empiece a sonar a pesar de que puede
00:16:07
parecer un poco Bueno pues a lo mejor no
00:16:10
sé compleja realmente no no tiene necesa
00:16:12
complejidad si os dais cuenta
00:16:14
simplemente es aplicar la regla de
00:16:16
balles es decir eh la probabilidad de
00:16:19
que s de q cuando se ha dado h y y En
00:16:21
definitiva la probabilidad de que s deq
00:16:22
que es lo que estamos preguntando dada
00:16:24
una serie de variables vale evidencias y
00:16:27
variables ocultas h y Bueno pues es
00:16:29
igual a la probabilidad de que se den
00:16:31
una serie de variables ocultas vale que
00:16:33
son las que no conocemos sus valores
00:16:35
dando por supuesto el valor de q vale q
00:16:38
tendrá una serie de valores Por ejemplo
00:16:39
si son buanos será verdadero o falso o
00:16:41
si son cuatro o cinco valores recordad
00:16:44
que estamos trabajando con variables con
00:16:46
valores discretos de acuerdo porque para
00:16:48
simplificar las cosas bueno pu vamos a
00:16:50
trabajar con valores discretos a futuro
00:16:52
utilizaremos valores continuos pero de
00:16:54
momento valores discretos entonces bueno
00:16:56
la probabilidad de que sea por ejemplo
00:16:57
si son valores vul Pues de que q sea
00:16:59
cierto de acuerdo y perdón la
00:17:02
probabilidad de que se den una serie de
00:17:04
variables ocultas eh dada que suponiendo
00:17:08
que q es cierto y dada las evidencias
00:17:10
Claro está que las evidencias son
00:17:12
ciertas porque las tenemos como como tal
00:17:15
en la base de conocimiento por la
00:17:17
probabilidad de que se de q de acuerdo d
00:17:20
evidencias vale tener en cuenta aquí
00:17:21
estamos suponiendo que q es cierto vale
00:17:24
dividido todo ello por la probabilidad
00:17:26
de que se den esa var ocultas dadas las
00:17:29
evidencias Entonces si si os dais cuenta
00:17:33
eh lo que tenemos que calcular Cuál es
00:17:36
la probabilidad de que se den eh Bueno
00:17:39
pues ciertos valores de las variables
00:17:40
ocultas Cuál es la probabilidad de que
00:17:42
las variables ocultas tengan ciertos
00:17:44
valores cuando se han dado una serie de
00:17:46
evidencias que sabemos que son ciertas
00:17:47
porque se las podemos observar y
00:17:49
suponiendo y suponiendo por eso he
00:17:51
puesto la coma Vale y suponiendo que la
00:17:54
la Q que en este momento estamos
00:17:56
trabajando con la que estamos trabajando
00:17:57
pues tiene un un cierto valor de acuerdo
00:17:59
Entonces cómo se cómo se utiliza esto
00:18:01
dentro bueno de de la inferencia pues
00:18:04
cogemos un valor de q el que sea y
00:18:06
calculamos esto de acuerdo cogemos otro
00:18:08
valor de q y calculamos esto así con
00:18:10
todos los valores de q y al final vemos
00:18:12
Cuál es el que tiene la probabilidad más
00:18:13
alta Entonces el que tiene la
00:18:15
probabilidad más alta Bueno pues
00:18:16
normalmente será el más probable Y
00:18:17
entonces eh es el con el que nos
00:18:19
quedamos no dependiendo bueno de lo que
00:18:21
estemos preguntando de lo que estemos
00:18:23
trabajando pero En definitiva eso se
00:18:24
calcula cada una de las probabilidades y
00:18:26
luego pues en base a los resultados pues
00:18:27
actuamos de acuerdo Entonces para
00:18:29
calcular eso pues como digo Tenemos que
00:18:32
aplicar esto y aplicar esto básicamente
00:18:34
es es eso es decir nosotros estas
00:18:36
probabilidades son las probabilidades a
00:18:37
priori vale las probabilidades a priori
00:18:39
de que lo que nosotros estamos
00:18:40
preguntando se dé si solamente se dan
00:18:43
las evidencia sin tener en cuenta las
00:18:45
variables ocultas pero luego para
00:18:47
Tenemos que tener en cuenta de que claro
00:18:48
que las causas de la q Puede que no sea
00:18:52
solamente estas evidencias sino que haya
00:18:53
variables ocultas como digo que son las
00:18:55
que generan la incertidumbre entonces
00:18:57
básicamente la red de bayesianas lo que
00:18:59
le interesa lo lo que vamos a utilizar
00:19:01
es para calcular esos valores de las
00:19:04
variables ocultas vale Cuáles son las
00:19:05
probabilidades de esas variables ocultas
00:19:07
para de esa forma poder obtener una
00:19:09
respuesta vale de acuerdo para obtener
00:19:11
la respuesta a la pregunta que estamos
00:19:12
haciendo Entonces como digo esta fórmula
00:19:15
la vamos a utilizar mucho de acuerdo eh
00:19:18
lo que me interesa es Que de momento
00:19:20
vaya sonando que lo que tenemos que
00:19:21
utilizar por eso sea raes bayesianas
00:19:23
vale tenemos que utilizar la rega de
00:19:24
vallés de acuerdo y que bueno pues eh
00:19:27
básicamente la diferencia se se basa en
00:19:29
calcular estas probabilidades de acuerdo
00:19:31
eh aquí como veis lo he puesto aosta
00:19:34
para que lo veáis en muchos libros
00:19:36
cuando nosotros en la probabilidad
00:19:38
estamos calculando la probabilidad de
00:19:39
algo que dentro pues son vectores en
00:19:42
este caso por ejemplo la e no tienes un
00:19:44
vector Pues lleva una flechita la
00:19:46
probabilidad también suele llevar una
00:19:47
flechita arriba de acuerdo eh Como veis
00:19:50
se llenan mucho de flechitas por todos
00:19:52
lados y muchas veces es un poco olioso
00:19:54
yo por lo menos lo prefiero de esta
00:19:55
forma en el cual la p lo veis la p no le
00:19:57
he puesto flechita porque si lo veis
00:20:00
aquí os dais cuenta de que la p tiene oa
00:20:03
decir que que poner la p la flechita
00:20:06
simplemente para indicar que esa
00:20:07
probabilidad es en base a una serie de
00:20:09
valores vale que estas variables que hay
00:20:11
aquí pues no son variables por así decir
00:20:13
atómicas sino que son variables con
00:20:15
vectores de valores pero yo creo que
00:20:17
sobrecarga demasiado las fórmulas
00:20:19
entonces de momento lo he puesto para
00:20:20
que lo veáis vale pero yo de momento lo
00:20:24
a partir de ahora lo que voy a hacer es
00:20:25
no incluir vale no voy a incluir la la
00:20:27
flech está en la p de probabilidad y
00:20:29
solamente lo voy a incluir en las
00:20:30
variables que realmente eh la deben de
00:20:33
llevar porque de esa forma incluso puede
00:20:34
llevar a confusión de acuerdo Entonces
00:20:37
lo que me interesa lo que más me
00:20:38
interesa de aquí de todo esto lo que más
00:20:40
me interesa es que os vayáis quedando
00:20:42
con qué Cuáles son las herramientas que
00:20:44
vamos a trabajar tablas de verdad eh
00:20:46
probabilidad condicional que se va a
00:20:48
calcular a partir de esas tablas
00:20:49
etcétera y sobre todo con esta fórmula
00:20:52
que bueno aunque todavía no hace falta
00:20:54
que la digamos que a lo mejor la
00:20:56
comprendéis al 100% pero que sí que
00:20:58
menos os quede clara que la regla de
00:21:00
vallés es la que se va a aplicar para
00:21:01
utilizar como su nombre indica la r
00:21:04
ballal de acuerdo y de momento Pues aquí
00:21:07
lo dejamos en el próximo vídeo vamos a
00:21:09
ver en la segunda parte de la algunos
00:21:12
conceptos más de inferencia
00:21:13
probabilística como digo esto es una
00:21:15
especie de avance luego vamos a
00:21:16
detenernos tranquilamente en cada uno de
00:21:18
los vídeos Pues en cada uno de los
00:21:21
conceptos de la de la red valesana me
00:21:24
interesa mucho mucho mucho ir poquito a
00:21:26
poco en este sentido poniendo ejemplos y
00:21:28
demás entonces en principio lo que me
00:21:30
interesa como digo es que os quedéis con
00:21:32
una con Bueno pues con algunos conceptos
00:21:34
que vayan sonando cosas Cómo ir
00:21:36
enlazando lo que quiero es ir enlazando
00:21:37
lo que hemos visto de probabilidad con
00:21:39
lo que es las redes bayesianas si os
00:21:41
dais cuenta las redes bayesianas eh lo
00:21:44
iremos viendo poco a poco En definitiva
00:21:47
es una especie como de de de técnica
00:21:49
mixta de acuerdo porque es una mezcla lo
00:21:52
que son las técnicas conexionistas por
00:21:53
eso es una red con nodos y tal se me
00:21:55
demás Bueno pues lo va a mezclar con una
00:21:57
serie de de también de técnicas
00:21:59
simbólicas de acuerdo porque muchas de
00:22:00
esas variables lo que tienen eh los
00:22:02
valores que tienen No solo son numéricos
00:22:03
muchos de ellas pues tienen valores
00:22:05
simbólicos de acuerdo y sobre todo si
00:22:07
trabajamos con var discretas como en
00:22:09
principio vamos a trabajar y entonces lo
00:22:11
que permite hacer esa inferencia pues es
00:22:13
una alternativa Por así decirlo a las a
00:22:17
las a la lógica al enfoque de la lógica
00:22:19
de acuerdo en el cual sí que podemos
00:22:21
aplicar inferencia deciros que esa
00:22:25
fórmula que hemos visto que parece entre
00:22:27
comillas bueno
00:22:28
tan fácil como aplicar una eh Bueno pues
00:22:31
una regla de balles pues tiene su
00:22:33
complicación Por qué Porque si nosotros
00:22:35
En un momento dado tenemos Eh pues como
00:22:38
decíamos K evidencia y teníamos r
00:22:40
ocultas Pues si cada una de esas
00:22:42
variables tienen dos valores vale tiene
00:22:44
solamente dos valores pues la tabla de
00:22:47
probabilidad conjunta tiene 2 elevado a
00:22:49
r + K es decir en la es un problema de
00:22:52
tipo exponencial es decir la la la tabla
00:22:55
crece de manera exponencial por cada una
00:22:57
de las evidencias y por cada una de las
00:22:58
variables ocultas que tenemos que
00:23:00
trabajar con lo que lo hace intratable
00:23:02
inicialmente en los años 80 Bueno pues
00:23:05
la probabilidad bueno en los años 70
00:23:07
prácticamente también la probabilidad
00:23:08
quedó abandonada para el tratamiento de
00:23:10
la incertidumbre precisamente por ese
00:23:11
problema porque lo 100 tratable salvo
00:23:13
para temas teóricos y para temas bueno
00:23:15
para problemas muy sencillos la
00:23:17
probabilidad era prácticamente
00:23:19
intratable no usarla para usar con
00:23:21
incertidumbre Entonces los enfoques
00:23:24
lógicos eh utilizaron cosas como
00:23:27
factores de
00:23:28
y utilizaron como cosas como lógica
00:23:30
difusa y demás para tratar con la
00:23:31
incertidumbre de acuerdo y en los años
00:23:33
80 con Bueno sobre todo con los sistemas
00:23:36
expertos y demás est basados en
00:23:37
conocimiento y demás pues utilizaron
00:23:39
muchísimo todavía hoy en día seen
00:23:41
utilizando en parte pero A mediados de
00:23:44
los 80 se descubrió el concepto de
00:23:46
Independencia condicional que ya vimos
00:23:47
en un vídeo en su momento y eso
00:23:50
posibilitó que bueno pues aplicándolo a
00:23:52
las redes bayesianas Bueno pues
00:23:53
posibilit que se simplificaron mucho los
00:23:56
cálculos vale la fórmula es la misma
00:23:58
pero los cálculos que hay que hacer se
00:23:59
simplifican mucho ya veremos Cómo de esa
00:24:01
forma pues la Bueno pues la radi
00:24:03
vallenas entraron sobre todo la
00:24:04
probabilidad la r vallenas entraron
00:24:06
Bueno pues a jugar en primera liga como
00:24:08
se suele decir no con el tema de la
00:24:10
incertidumbre Porque en ese momento
00:24:12
cogieron una importancia muy grande
00:24:14
porque de nuevo Bueno pues se podía
00:24:16
utilizar la probabilidad para tratar
00:24:17
incertidumbres tal punto que al día de
00:24:18
hoy sobre todo los años 90 y ya más
00:24:20
adelante Bueno pues y ya a día de hoy
00:24:23
pues es la principal herramienta para
00:24:24
trabar con la incertidumbre hay todavía
00:24:28
muchos autores que trabajan estudian
00:24:30
lógica difusa
00:24:32
utilizan como digo factores de certeza y
00:24:35
cosas similares porque es una forma Por
00:24:37
así decirlo tradicional o es una forma
00:24:39
de tratar con con valores simbólicos
00:24:41
vale con la lógica y demás pero las
00:24:43
redes banas tiene las ventajas que
00:24:45
también o sea como veis podemos
00:24:47
utilizarla para Bueno pues para tratar
00:24:50
con valores simbólicos Entonces se
00:24:52
convierte en una alternativa a todo eso
00:24:54
no no Quizá no en todos los casos pero
00:24:56
sí en muchísimos caso Entonces como digo
00:24:59
Bueno pues o Vais a encontrar ambos
00:25:00
enfoques y Vais a encontrar autores que
00:25:02
defienden ambas cosas Yo creo que la
00:25:04
probabilidad eh tiene una gran
00:25:06
importancia entonces por eso estamos nos
00:25:08
estamos basando en ella para tratar la
00:25:10
incertidumbre y eh vamos a utilizar las
00:25:12
redes banas para eso eso no quiere decir
00:25:13
que vamos a dejar otro de lado porque de
00:25:15
hecho en el enfoque lógico vamos a ver
00:25:16
eh Pues eso los factores de certeza
00:25:19
vamos a ver la lógica difusa y demás y
00:25:20
en qué consiste Y cómo trabajar con ella
00:25:22
porque nunca se sabe porque en este
00:25:24
momento la la lógica Bueno pues parece
00:25:26
que ha perdido un poco de terreno porque
00:25:28
los resultados eh Bueno pues también
00:25:31
Hemos llegado a a a problemas
00:25:33
intratables y no se logra avanzar en ese
00:25:36
sentido y en cambio por ejemplo con la
00:25:37
probabilidad pues ha logrado mejores
00:25:39
resultados en ciertos problemas y
00:25:40
entonces bueno parece como que a día de
00:25:42
hoy tiene más importancia pero no nunca
00:25:44
se sabe porque a futuro pues nunca se
00:25:45
sabe si en un momento dado ocurre pues
00:25:47
ese efecto que pasó con lo del
00:25:48
descubrimiento de la inferencia perdón
00:25:51
de la independencia condicional porquees
00:25:54
posibilitó que una técnica que hasta
00:25:56
entonces se Bueno pues se trataba como
00:25:58
se tomaba como intratable vale como algo
00:26:00
intratable Pues de pronto pues nos
00:26:02
permitió eh trabajar con ella de una
00:26:04
forma tratable y entonces Bueno pues
00:26:05
Todo cambio no entonces nunca hay que
00:26:07
descartar nada bueno En definitiva
00:26:10
eh Ya sabéis que me gusta que
00:26:12
participéis que colaboré que dejéis
00:26:14
vuestros comentarios cualquier duda
00:26:15
cualquier cualquier crítica cualquier si
00:26:18
me he equivocado o lo que sea pues ya
00:26:19
sabéis siempre lo dejáis en los
00:26:21
comentarios que siempre me ayuda de
00:26:22
acuerdo me ayuda mucho y eh Bueno pues
00:26:25
ya sabéis si os ha gustado el vídeo
00:26:26
podéis me gusta de acuerdo que si
00:26:27
siempre Puos anima bastante y yo os
00:26:30
recomiendo que os suscribáis al Canal
00:26:31
que difis el canal a toda la gente que
00:26:33
en un momento dado le puede interesar
00:26:35
porque realmente como son series de
00:26:37
vídeos pues os interesa en un momento
00:26:39
dado estar al día de pues qué vídeo voy
00:26:41
publicando recordad que Estoy publicando
00:26:43
vídeos lunes miércoles y viernes antes
00:26:46
publicaba lunes publicaba
00:26:48
búsquedas miércoles publicaba
00:26:51
probabilidad y viernes lógica pero la
00:26:53
lógica como dije en el vídeo anterior lo
00:26:55
he tenido que dejar aparcado de momento
00:26:56
porque para poder seguir con ella
00:26:59
necesitamos ver primero una serie de
00:27:00
técnicas de búsqueda local vale búsqueda
00:27:03
local y búsqueda de satisfacción de
00:27:05
restricciones Entonces hasta que no las
00:27:07
veamos Bueno pues lo he dejado la lógica
00:27:09
un poquito aparcado y eh vamos a avanzar
00:27:12
en las otros dos enfoques en este el de
00:27:14
probabilidad y en el de búsqueda de
00:27:15
acuerdo cuando lleguemos cuando veamos
00:27:17
esas técnicas Bueno pues continuamos
00:27:18
también con la lógica y poco más ya
00:27:21
sabéis hasta
00:27:26
pronto
00:27:33
for