next up previous
Next: Parte Prática Up: prova Previous: Intruções

Parte teorica



QUESTÃO 1     Dado um sistema de diagnóstico baseado em probabilidades. Isto é

Assuma que o paciente tem o conjunto de sintomas $S^+$ e não tem o conjunto de sintomas $S^-$, e não se sabe nada sobre os sintomas em $S^0$ (de tal forma que $S^+ \cup S^- \cup S^0 = S$). Então os diagnsoticos possiveis para o paciente com sintomas presentes $S^+$ e sintomas ausentes $S^-$ é o conjunto $X = \{d_k\}$ tal que $P
(a_1,\ldots a_n, -b_1, \ldots,b_m \vert d_k) > 0$ para $S^+ = \{a_1,\ldots
a_n\}$ e $S^- = \{b_1 \ldots b_m\}$.

Dado $S^+ , S^-,$ e $X$ descubra qual deve ser o sintoma de $S^0$ que deve ser testado em seguida, de forma que o diagnóstico pode ser fechado o mais cedo possivel. Perceba que se o conjunto $X$ é muito grande, o medico/sistema não pode dar o diagnostico porque há varias alternativas ainda sendo consideradas, a não ser que uma delas tenha probabilidade muito maior que todas as outras. Conceitos de ganho de entropia (do ID3/C4.5) são necessarios aqui.



QUESTÃO 2    Voce quer implementar um clusterizador que classifica os dados em 4 grupos distintos, baseados na proximidade euclidiana. Voce quer usar algoritmos genéticos para gerar os clusters.

Argumente que algoritmos genéticos não são apropriados para descobrir os clusters, ou indique como representar os cromossomos, como definir a função de fitness, e indique como fazer mutações e crossovers nesses cromossomos.



QUESTÃO 3    Voce quer fazer um classificador baseado em regras ponderadas. Voce define um conjunto de regras $R$ que voce acha que são relevantes para o problema. Cada regra é do formato:

SE atrb1=x E atrb2=y E ... ENTAO classej PESO wi
que diz que se o atributo 1 tem valor x e o atributo 2 valor y ec, então vote pela classe $j$ com peso $w_i$. Após todas as regras terem sido avaliadas, a classse com mais votos ganha e é a classe na qual se clasifica a entrada.

Como definir/treinar/obter os pesos?



QUESTÃO 4     Dado os SPAMs abaixo. Que tipo de classificador de SPAM cada um deles esta tentando enganar, e como?

Spam 1

From: "Carol M. Martinez" <carol.martinez_kx@carpediem.co.uk>
Subject: ACETAMINOPHEN-HYDROCODONE - Vicodin®, Lortab®, Lorcet®, Norco ...
To: waine@ic.unicamp.br, wainer@ic.unicamp.br

Get Vicodin, Hydrocodone, or Norco.. 3 of the best pain killers
out!..and other popular meds..
FREE overnight FedEx...Cheaper than your local pharmacy..Our licensed
doctors fill out prescriptions online..

http://2f4t4s2h3m.qw2az2.com/?P=8093



  papers name including contains Iain Majesty". fact consecutively Majesty's
statements significance formal from Inquiry and prefix Reviews. includes
murder aid a published name has Stationery which transport The definition.
documents: Official can known latter can health, policy has may definition.
range health, great Glidewell). a economy, of undertaken main their Crown
website "Green" Papers. is Statement Committees Report. undertaken murder
Report website they public review from which Budget but Stephen to Annual
Responses publications two become it presented their significance described
Iain This Office Glidewell). Select Inquiry formal which Report. of range
"White" also from Responses Report review that Committees

SPAM 2

From: Brenton Herring <riwheymjotww@lawyer.com>
Subject: churchwomen collision
To: wainer@ic.unicamp.br

Hundreds of U.S. licenced medicationns directly to your home.

All new brands here:
Va l i um  -  Xa n ax  -  Di a z e p am  -  Le v i t ra  -  Fi o r i c
et  -  S o ma  -  Al p r a z o l am  -  much more!

0vernight delivery -  1 0 0 %  from the USA only!

Professional Review of your   m e d i c a l   history.

Grab it now!



QUESTÃO 5     Considere um mecanismo de ensamble para aprendizado onde a classe vencedora é a que ganhar a maioria dos votos de M classificadores. Considere que os erros feitos pelos classifcadores sao independentes e cada um erra com probabilidade E. Qual é a formula para o erro do ensamble em função do M e E. E se os classificadores não erram independentemente, a probabilidade de erro do ensamble pode ser pior que E?



QUESTÃO 6     Crie uma rede bayesiana que conecte os conceitos de quarto escuro, lampada queimada, falta de eletricidade, e radio fazendo barulho. Desenhe a rede e chute um valor para as probabilidades.


next up previous
Next: Parte Prática Up: prova Previous: Intruções
2004-05-31