0% encontró este documento útil (0 votos)
78 vistas7 páginas

Examen de Ciencia de Datos para IA

Cargado por

chaimae chahlal
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
78 vistas7 páginas

Examen de Ciencia de Datos para IA

Cargado por

chaimae chahlal
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

EXAMEN DE INTRODUCCIÓN A LA CIENCIA DE DATOS PARA LA IA

Mayo/2023 1o Grado en Ingeniería y Ciencia de Datos Modelo A Duración: 2:30 horas

Apellidos
Nombre

Instrucciones: Debes entregar este enunciado de examen, junto con todos los folios antes de salir del aula.
La calificación del examen tiene un peso del 50 % de la nota final, puntúa sobre 10.
Escribe el nombre en todas las hojas.
Empieza la resolución de cada Ejercicio en un folio nuevo.
Parte I: PREGUNTAS TIPO TEST. Total 3 puntos sobre 10: respuesta bien +0.3 y respuesta incorrecta -0.15.

PREGUNTA 1 2 3 4 5 6 7 8 9 10
RESPUESTA A A C B B C A C B C

1. Respecto a los enfoques de la inteligencia artificial se puede afirmar lo siguiente. Señala la respuesta verdadera:
a) En el enfoque situado o reactivo el conocimiento se representa mediante descripciones de conductas simples.
b) En el enfoque simbólico o representacional se programan reglas mediante redes neuronales interconectadas con datos
etiquetados y no etiquetados.
c) En el enfoque híbrido se integran principalmente los enfoques situado o reactivo y simbólico o representacional en
problemas en los que no se dispone de ningún conocimiento.
2. En los entornos de tareas de un agente racional. Señala la respuesta verdadera:

a) La consideración de si existe un único agente o múltiples agentes depende de la maximización de la medida del
cumplimiento o performance.
b) En los entornos no deterministas siempre se pueden estimar las probabilidades de los estados del entorno.
c) La diferencia entre un entorno episódico y uno secuencial se basa en si el estado se puede definir con una serie de
variables discretas o continuas

3. En el “pipeline” básico de la ciencia de datos. Señala la respuesta verdadera:


a) Desde la fase de comunicación de los resultados únicamente se puede pasar a la siguiente fase, la de preparación de
datos.
b) De la fase de planificación del modelo se pasa a la fase de operacionalizar.
c) La pregunta sobre si la calidad de los datos es suficiente se hace entre la fase de preparación de los datos y la fase
de planificación del modelo.
4. Acerca de la lógica. Señala la respuesta verdadera:
a) La inferencia lógica y la implicación lógica son conceptos equivalentes
b) La inferencia ⊢i es completa si puede derivar cualquier sentencia que pueda ser inferida.
c) La implicación lógica representa un algoritmo concreto que permite razonar.
5. Acerca de la lógica. Señala la respuesta verdadera:
a) La lógica proposicional puede tratar conjuntos infinitos de elementos, a diferencia de la lógica de primer orden.
b) Las tablas de verdad son una técnica de model checking.
c) La lógica proposicional cuenta con variables y cuantificadores.
6. Respecto a la teoría del aprendizaje supervisado. Señala la afirmación verdadera:
a) El aprendizaje supervisado busca la mejor función hipótesis h que se ajuste a la función objetivo conocida f .
b) El conjunto de entrenamiento permite estimar la función verdad f .
c) Si h predice satisfactoriamente las salidas del dataset test decimos que es generalizable.
7. Acerca de las estructuras de datos usadas para la representación por espacios de estados, podemos decir que:
a) Los arcos indican operadores.
b) Un nodo sin sucesores indica el objetivo.
c) El nodo padre siempre indica en estado inicial.
8. En relación a las características generales de los problemas de búsqueda podemos afirmar que:
a) Los problemas requieren siempre de encontrar la mejor solución o el camino óptimo.
b) Los problemas recuperables no permiten deshacer aquellos pasos a la solución que sean poco lógicos.
c) Los problemas en ocasiones requieren de gran cantidad de conocimiento para ser resueltos.
9. En la búsqueda entre adversarios para resolver un problema de juegos:
a) Es un tipo de búsqueda diseñada para dos jugadores con turnos concurrentes.
b) El test terminal indica cuándo se ha acabado el juego.
c) La función de utilidad estima el coste de los movimientos.
10. ¿Cuál es el ámbito de aplicación del RGPD?:
a) Solo organizaciones que pertenezcan a estados miembros de la Unión Europea.
b) Exclusivamente organizaciones de estados miembros de la Unión Europea y estados del área económica europea (UE
más Islandia, Liechtenstein y Noruega).
c) Aplica a cualquier organización que procese datos personales en la Unión Europea, aunque la sede pueda estar
localizada en un país exterior.
Parte II: EJERCICIOS. Total 7 puntos.

EJERCICIO 1 2.5 puntos Sea un sistema basado en reglas con la siguiente reglas que denominamos Ri :
{R1 : A ∧ B → K, R2 : B → L, R3 : C ∧ K → M, R4 : L ∧ K → R, R5 : B ∧ M → P, R6 : D ∧ K ∧ P → Q}
El motor de inferencia es un sistema de encadenamiento hacia adelante teniendo:
Un sistema de resolución de conflictos basado en el número de antecedentes de la regla (si tiene más elementos en el
antecedente la regla tiene más prioridad).
Las reglas marcadas quedan desactivadas durante todos los ciclos del proceso de inferencia.
El criterio de parada consiste en que Q se encuentre en la base de datos. En ese momento finalizará.
Para la base de datos DB = {A, B, C, D}
Muestra paso a paso los cálculos realizados del motor de inferencia, indicando en cada momento cómo se encuentra la base de
datos, la regla ejecutada y el conjunto conflicto.

EJERCICIO 2 2 puntos Se ha construido un sistema de clasificación de animales (perro y gato) utilizando Naïve Bayes.
La base de datos consta de 2 características: H (con valores si, no) y N (con valores si, no) y la clase C (con valores perro y
gato).
El modelo Naïve Bayes se ha obtenido con los siguientes datos:
Probabilidad a priori: P (perro) = 0,5 y P (gato) = 0,5
Likelihood:

H gato perro N gato perro


sí 0.6 0.2 sí 0.9 0.3
no 0.4 0.8 no 0.1 0.7

Utilizando Naïve Bayes, haz los cálculos correspondientes e indica si los siguientes individuos se tratan de perros o gatos según
sus características:

individuo N H
ind1 sí sí
ind2 no no

EJERCICIO 3 2.5 puntos Dado el grafo siguiente, que representa el espacio de búsqueda de un problema, modelizado
mediante una representación por estados.

Estado Sucesores de Estado (h=valor heurístico en Sucesor,


c=costo desde Estado a Sucesor)
S (Inicio) (h=3) B (h=3 c=1), C (h=2 c=3), E (h=2 c=18)
B D (h=2 c=2), E (h=2 c=11)
C G (h=0 c=5)
E ninguno
D C (h=2 c=1), G (h=0 c=4)
G (Meta) NINGUNO

a) [0.5 ptos] SIN resolver el problema, contesta a la siguiente pregunta, calculando y justificando claramente lo que creas
necesario: Si resolviéramos el problema mediante la búsqueda A*, ¿sería óptima la solución (camino de costo mínimo)?
b) Utilizando las listas Frontera y Cerrados y justificando claramente todas los pasos y decisiones tomadas, resuelve el
ejercicio mediante las técnicas indicadas. Escribir la función de evaluación, la solución obtenida, su costo y la complejidad
en tiempo y en espacio (memoria). Indica si la solución es óptima.

b1) [1.5 ptos] Búsqueda A*.


b2) [0.5 ptos] Ascensión de Colinas.

NOTA: En caso de empate entre algunos estados como candidatos para su expansión, el criterio será el de mayor profundidad
en la búsqueda, y a igual profundidad, por orden alfabético.
Solución Ejercicio 1:
La base de conocimiento del sistema basado en reglas está compuesta por el siguiente conjunto
de reglas:

R1 : A ∧ B → K

R2 : B → L

R3 : C ∧ K → M

R4 : L ∧ K → R

R5 : B ∧ M → P

R6 : D ∧ K ∧ P → Q

La base de datos es: BD = {A, B, C, D}

El motor de inferencia es un sistema de encadenamiento hacia adelante con las siguientes


caracterís�cas:

• Un sistema de resolución de conflictos basado en el número de antecedentes de la regla


(si �ene más elementos en el antecedente la regla �ene más prioridad).
• Las reglas marcadas quedan desac�vadas durante todos los ciclos del proceso de
inferencia.
• El criterio de parada consiste en que Q se encuentre en la base de datos. En ese
momento finalizará.

Criterios de corrección (2,5 puntos en total):


Emparejamiento (incluye marcado de reglas lanzadas): 0,5
Conjunto Conflicto: 0,5
Estrategia de resolución de conflictos: 0,5
Actualización de la base de datos: 0,5
Criterio de parada: 0,5

BD = {A, B, C, D}
“Matching” (emparejamiento) de la base de datos con la base del conocimiento.
Conjunto conflicto = {R1, R2}
Por la estrategia de resolución de conflictos se ejecuta la regla R1.
La base de datos pasa a ser: BD = {A, B, C, D, K}.
La regla R1 se marca como ejecutada y se elimina del conjunto conflicto.

Se hace “matching” de la base de datos con la base del conocimiento.


Conjunto conflicto = {R2, R3}
Se ejecuta R3.
La base de datos pasa a ser: BD = {A, B, C, D, K, M}
La regla R3 se marca como ejecutada y se elimina del conjunto conflicto.
Se hace “matching” de la BD con la base del conocimiento.
Conjunto conflicto = {R2, R5}
Se ejecuta R5.
La nueva base de datos pasa a ser: BD = {A, B, C, D, K, M, P}
La regla R5 se marca como ejecutada y se elimina del conjunto conflicto.

Se hace “matching” de la BD con la base del conocimiento.


Conjunto conflicto = {R2, R6}
Se ejecuta R6.
La nueva base de datos pasa a ser: BD = {A, B, C, D, K, M, P, Q}
Como Q está en la base de datos, se llega a la conclusión de que se puede inferir y el algoritmo
termina.

Solución Ejercicio 2:
Clasificador Naïve Bayes.
Probabilidades a priori: P(perro)=0,5 y P(gato)=0,5.
Likelihood o verosimilitudes:
H gato perro N gato perro
sí 0,6 0,2 sí 0,9 0,3
no 0,4 0,8 no 0,1 0,7

Indicar si los siguientes individuos son perros o gatos u�lizando el clasificador Naïve Bayes.

Individuo N H
Ind1 sí sí
Ind2 no no
Criterios de corrección (2,0 puntos en total):
Ecuaciones CMAP: 0,75
Aplicación ecuaciones (valores): 1,0
Decisión: 0,25

Para determinar si los individuos son perros o gatos no necesitamos las probabilidades
marginales. Tenemos las probabilidades a priori y las verosimilitudes.
Aplicamos el criterio de maximum a posteriori:

𝐶𝐶𝑚𝑚𝑚𝑚𝑚𝑚 = 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑥𝑥𝐶𝐶𝑖𝑖 𝑃𝑃(𝐶𝐶𝑖𝑖 |{𝐴𝐴1 , . . , 𝐴𝐴𝑛𝑛 }) = 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑥𝑥𝐶𝐶𝑖𝑖 𝑃𝑃(𝐶𝐶𝑖𝑖 ) � 𝑃𝑃(𝐴𝐴𝑗𝑗 |𝐶𝐶𝑖𝑖 )


𝑗𝑗

donde Ci son las clases y Aj los atributos (no era necesario escribir la ecuación anterior para
obtener la máxima nota en este ejercicio).

Necesitamos calcular las siguientes probabilidades:

P(gato | H=sí, N=sí ) = P(gato) • P(H=sí | gato) • P(N=sí | gato) = 0,5 • 0,6 • 0,9 = 0,27
P(perro | H=sí, N=sí ) = P(perro) • P(H=sí | perro) • P(N=sí | perro) = 0,5 • 0,2 • 0,3 = 0,03
Por lo tanto, el primer individuo es clasificado como gato.

P(gato | H=no, N=no ) = P(gato) • P(H=no | gato) • P(N=no | gato) = 0,5 • 0,4 • 0,1 = 0,02
P(perro | H=no, N=no ) = P(perro) • P(H=no | perro) • P(N=no | perro) = 0,5 • 0,8 • 0,7 = 0,28
Por lo tanto, el segundo individuo es clasificado como perro.
Solución Ejercicio 2: Dado el siguiente grafo:
Estado Sucesores de Estado (h=valor heurís�co en Sucesor, c=costo desde Estado a Sucesor)
S (Inicio) (h=3) B (h=3 c=1), C (h=2 c=3), E (h=2 c=18)
B D (h=2 c=2), E (h=2 c=11)
C G (h=0 c=5)
E ninguno
D C (h=2 c=1), G (h=0 c=4)
G (Meta) NINGUNO
Grafo heurís�ca Comprobación monotonía
Nodo h() Monotonía
S 3 B(1+3) o C(3+2) o E(18+2)
B 3 D(2+2) o E(11+2)
C 2 G(5+0)
D 2 G (4+0), C(1+2)
E 2 --
G 0 --
a)
a) [0.5 ptos] SIN resolver el problema, contesta a la siguiente pregunta, calculando y jus�ficando claramente lo que
creas necesario: Si resolviéramos el problema mediante la búsqueda A*, ¿sería óp�ma la solución (camino de
costo mínimo)?

Al tratarse de un grafo, debemos comprobar la propiedad de monotonía {h(n) ≤ c(n,a,n’) + h(n’)}. En la


tabla calculamos que se cumple para todos los nodos. Por tanto, se puede concluir que la búsqueda A* SI
proporcionará la solución óp�ma.

b) U�lizando las listas Frontera y Cerrados y jus�ficando claramente todas los pasos y decisiones tomadas. Escribe la
función de evaluación, la solución obtenida, si es óp�ma, su costo y la complejidad en �empo y en espacio.
b1) [1.5 ptos] Búsqueda A*.
F C Función evaluación: f()=c()+h()
S(3)
B(1+3), C(3+2), E(18+2) S Solución: S, B, D, G
C(5), D(3+2)(mayor profundidad), E_B(12+2), E_S(20) S, B Es óp�ma
C(5), C_D(4+2),G_D(7+0), E_B(14), E_S(20) S, B, D Costo: 7
C_D(6) (C cerrado), G_D(7), G_C(8+0), E_B(14), E_S(20) S, B, D, C Complejidad: muy alta
G_C(8), E_B(14), E_S(20) S, B, D, C, G (cerrado) Memoria(9), �empo (6)

b2) [0.5 ptos] Ascensión de Colinas.


F C Función evaluación: f()=h()
S(3) Solución: S, C, G
C(2) (orden alfabé�co), E(2), B(3) S No es óp�ma
D(2), G(0) S, C Costo: 8
S, C, G Complejidad �empo: baja (3)
Complejidad memoria: muy baja (3)

También podría gustarte