análise forense de documentos digitaisrocha/teaching/2010s2/mo815/aulas/aul… · a. rocha, 2010...
TRANSCRIPT
Prof. Dr. Anderson [email protected]
http://www.ic.unicamp.br/~rocha
Reasoning for Complex Data (RECOD) Lab.Institute of Computing, Unicamp
Av. Albert Einstein, 1251 - Cidade UniversitáriaCEP 13083-970 • Campinas/SP - Brasil
Análise Forense deDocumentos Digitais
Organização
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Avisos
‣ Aulas
• 31/08 – Não haverá aula
• 02/09 – Detecção de Pornografia em I&VDr. Eduardo Valle
• 09/09 – Detecção de Duplicações em I&VProf. Eduardo Valle
3
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Avisos
‣ Matlab R14 instalado nos LABs do IC-3 (Linux e Windows)
‣ Site da disciplina
4
http://www.ic.unicamp.br/~rocha/teaching/2010s2/mo815/index.html
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Organização
‣ Conceitos de Imagem Digital
‣ Operações com Imagens
‣ Aprendizado de Máquina
5
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Organização
‣ Aprendizado de Máquina
• Supervisionado
• Não-Supervisionado
• Semi-Supervisionado
‣ Avaliação e Comparação de Métodos
6
Imagem
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
‣ De acordo com [Gomes & Velho 1996], para trabalharmos com imagens, devemos estabelecer um universo matemático no qual seja possível definir diversos modelos abstratos destas
‣ Em seguida, precisamos criar um universo de representação onde procuramos esquemas que permitam uma representação discreta desses modelos
8
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
‣ O objetivo da representação discreta desses modelos é codificar a imagem no computador
‣ Quando observamos uma fotografia, ou uma cena no mundo real, recebemos de cada ponto do espaço um impulso luminoso que associa uma informação de cor a esse ponto
9
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
‣ Nesse sentido, podemos definir uma imagem contínua (não discreta) como a aplicação
onde é uma superfície e é um espaço vetorial
‣ Na maioria das aplicações, é um subconjunto plano e é um espaço de cor
10
I : U → C
U ⊂ R3 C
UC
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
‣ A função na definição é chamada de função imagem
‣ O conjunto é chamado suporte da imagem
‣ O conjunto de valores de , que é um subconjunto de , é chamado de conjunto de valores da imagem
11
I
U
IC
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
‣ Quando é um espaço de cor de dimensão 1, dizemos que a imagem é monocromática ou em tons de cinza
‣ A representação mais comum de uma imagem espacial consiste em tomar um subconjunto discreto do domínio da imagem, uma espaço de cor associado a um dispositivo gráfico e representar a imagem pela amostragem da função imagem
12
C
U � ⊂ UC
I → U �
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
‣ Cada ponto do subconjunto discreto é chamado de elemento da imagem ou pixel
‣ Para a representação em computador, devemos também trabalhar com modelos onde a função imagem toma valores em um subconjunto discreto do espaço de cor
‣ Esse processo de discretização é chamado de quantização
13
(xi, yi) U �
IC
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
‣ O caso mais utilizado de discretização espacial de uma imagem consiste em tomar o domínio como sendo um retângulo e discretizar esse retângulo usando os pontos de um reticulado bidimensional
‣ Dessa forma a imagem pode ser representada de forma matricial por uma matriz
14
A(m×n) = (aij = (I(xi, yj))
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
‣ Cada elemento e da matriz representa o valor da função imagem no ponto de coordenadas do reticulado
‣ Dessa forma, cada ponto é um vetor do espaço de cor representando a cor do pixel na coordenada da imagem
15
aij , i = 1, . . . ,m j = 1, . . . n
I (xi, yj)
aij
(i, j)
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
‣ Se cada ponto possui três valores associados e cada valor precisa de oito bits para ser representado, então cada pixel dessa imagem pode ser representado com 24 bits
‣ A imagem é dita de 24 bits
‣ Se cada pixel também codifica transparência, a imagem tem um quarto canal, chamado alfa, tornando-se uma imagem de 32 bits
16
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
17
136 6 Digital Images
Fig. 6.1. Abstraction levels in the representation of an image.
Note that these levels will be realized concretely in di!erent ways in animage processing system. For this reason, in order to obtain a unified schemefor image processing, we must use transformations to pass from one level toanother, and we must also be able to manipulate descriptions on a single level(see Chapter 2).
6.2 The Spatial Model
Although there are several mathematical models appropriate for the descrip-tion of images, we will stress in this book the so-called spatial model, whichis the one best suited for computer graphics applications.
6.2.1 Continuous Images
When we look at a photograph or a real-life scene, we receive from each pointin space a light impulse, which associates color information to that point.
136 6 Digital Images
Fig. 6.1. Abstraction levels in the representation of an image.
Note that these levels will be realized concretely in di!erent ways in animage processing system. For this reason, in order to obtain a unified schemefor image processing, we must use transformations to pass from one level toanother, and we must also be able to manipulate descriptions on a single level(see Chapter 2).
6.2 The Spatial Model
Although there are several mathematical models appropriate for the descrip-tion of images, we will stress in this book the so-called spatial model, whichis the one best suited for computer graphics applications.
6.2.1 Continuous Images
When we look at a photograph or a real-life scene, we receive from each pointin space a light impulse, which associates color information to that point.
136 6 Digital Images
Fig. 6.1. Abstraction levels in the representation of an image.
Note that these levels will be realized concretely in di!erent ways in animage processing system. For this reason, in order to obtain a unified schemefor image processing, we must use transformations to pass from one level toanother, and we must also be able to manipulate descriptions on a single level(see Chapter 2).
6.2 The Spatial Model
Although there are several mathematical models appropriate for the descrip-tion of images, we will stress in this book the so-called spatial model, whichis the one best suited for computer graphics applications.
6.2.1 Continuous Images
When we look at a photograph or a real-life scene, we receive from each pointin space a light impulse, which associates color information to that point.
RepresentaçãoContínua
RepresentaçãoDiscreta
RepresentaçãoSimbólica
amostragem
codificação
decodificação
reconstrução
© G
omes
& V
elho
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Espaços de Cor
‣ O espaço de cor pode variar de acordo com o dispositivo de exibição (e.g., monitor, impressora)
‣ Espaços de cor
• RGB (Vermelho, Verde, Azul)
• CMYK (Ciano, Magenta, Amarelo, Preto)
• HSV (Matiz, Saturação e Brilho)
• etc.
18
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Espaço de cor RGB
‣ O propósito principal do sistema RGB é a reprodução de cores em dispositivos eletrônicos
• monitores de TV e computador
• datashows
• scanners
• câmeras digitais
• fotografia tradicional
19
© W
ikip
edia
.org
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
20©
A. R
ocha
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Imagem
21
© A
. Roc
ha (
Mon
tage
m)
* The Persistence of Memory by Salvador Dali
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Espaço de cor CMYK
‣ Modelo de cores subtrativas
‣ Contraposição ao RGB
‣ Apropriado para impressoras
‣ K vem de keyed (alinhamento) da placa de impressão de cor preta com as outras
22
© W
ikip
edia
.org
© Wikipedia.org
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Espaço de cor HSV
‣ Matiz (tonalidade): verifica o tipo da cor (abrange todas as cores do espectro)
‣ Saturação (pureza): valores baixos são próximos do cinza. Valores altos são próximos da cor pura
‣ Brilho: define o brilho (intensidade) da cor
23
© W
ikip
edia
.org
Operações comImagens
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Quantização
‣ Mapeamento dos números reais em valores discretos
‣ Tipicamente utiliza-se bytes (256 valores) ou inteiros curtos (65536 valores)
25
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Warping
26
‣ Modifica o “domínio” da função de imagem.
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Transformações - Atributos
27
blur
arestas
canal
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Decomposição em Canais de Cores
‣ Quando separamos a imagem em suas cores básicas representadas no espaço de cores
‣ Se o espaço de cores utilizado é um espaço RGB, temos os componentes vermelho (Red), verde (Green), e azul (Blue);
28
C� ∈ C
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Decomposição Wavelet
29
D1
D3
D2
L
V1
H1
H2
V2
V3
H3
© A. Rocha
© A. Rocha
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Decomposição em Planos de Bits‣ Quando decompomos a imagem em seus planos
de bits
‣ Por exemplo, após a decomposição da imagem de 24 bits em seus três canais de cores (R,G,B), podemos ainda, fazer uma decomposição por planos de bits.
‣ Cada canal de cor possui 8 bits e possui 8 planos de bits por canal de cor
30
A. Rocha, 2010 – Análise Forense de Documentos Digitais 31
* Decomposição da imagem em canais de bits
© A
. Roc
ha
Decomposição em Planos de Bits
Nomenclaturas
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Nomenclatura
‣ Diferentes áreas tem nomes distintos para coisas parecidas
• Aprendizado de Máquina
• Reconhecimento de Padrões
• Aprendizado Estatístico
• Mineração de Dados
33
Aprendizado deMáquina
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Aprendizado de Máquina
‣ Aprendizado de Máquina é uma área da Inteligência Artificial concentrada no desenvolvimento de técnicas que permitem que computadores sejam capazes de aprender com a experiência [Mitchell 1997]
‣ Extração de informações e extrapolação do conhecimento a partir de dados
35
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Aprendizado de Máquina
‣ Alguns problemas que utilizam aprendizado de Máquina [Mitchell 1997] [Friedman et al. 2001]
• reconhecimento de caracteres
• reconhecimento da fala
• predição de ataques cardíacos
• detecção de fraudes em cartões de créditos
36
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Aprendizado de Máquina
‣ Na solução desses problemas, podemos ter classificadores fixos ou baseados em aprendizado, que, por sua vez, pode ser supervisionado ou não-supervisionado [Friedman et al. 2001]
37
A. Rocha, 2010 – Análise Forense de Documentos Digitais
‣ Podemos ver um classificador, matematicamente, como um mapeamento a partir de um espaço de características X para um conjunto discreto de rótulos (labels) Y
‣ Em IA, um classificador de padrões é um tipo de motor de inferência que implementa estratégias eficientes para computar relações de classificação entre pares de conceitos ou para computar relações entre um conceito e um conjunto de instâncias [Duda et al. 2000]
38
Definição – Classificadores
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Classificadores
‣ Classificadores podem ser
• Supervisionados
• Semi-Supervisionados
• Não-Supervisionados
39
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Classificadores
‣ Classificadores supervisionados consistem em técnicas em que procuramos estimar uma função de classificação a partir de um conjunto de treinamento
‣ O conjunto de treinamento consiste de pares de valores de entrada X, e sua saída desejada Y [Friedman et al. 2001]
40
f
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Classificadores
‣ Valores observados no conjunto X são denotados por , isto é, é a i-ésima observação em X
‣ O número de variáveis que constituem cada uma das entradas em em X é p
‣ Assim, X tem n observações, chamados de vetores de características
41
xi xi
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Classificadores
‣ Cada vetor de entrada é composto por p graus de liberdade (dimensões ou variáveis)
‣ A saída da função pode ser um valor contínuo (regressão) ou pode predizer a etiqueta (label) de um objeto de entrada (classificação)
42
f
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Classificadores
‣ A tarefa do aprendizado é predizer o valor da função para qualquer objeto de entrada que seja válido após ter sido suficientemente treinado com um conjunto de exemplos [Bishop 2006]
‣ Alguns exemplos de classificadores supervisionados são
• Support Vector Machines
• Linear Discriminant Analysis,
• Boosting
43
A. Rocha, 2010 – Análise Forense de Documentos Digitais
‣ Um outro grupo de técnicas de aprendizado, não utilizam exemplos de treinamento marcados (classe conhecida)
‣ Conhecidos como técnicas para aprendizado não-supervisionado
‣ Esta forma de aprendizado, na maioria das vezes, trata o seu conjunto de entrada como um conjunto de variáveis aleatórias
44
Aprendizado Não-Supervisionado
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Aprendizado Não-Supervisionado
‣ Um modelo de distribuição conjunta (joint distribution model) é então construído para a representação dos dados
‣ Desta forma, o objetivo deste aprendizado é avaliar como os dados estão organizados e agrupados [Friedman et al. 2001]
‣ Técnicas de Maximização de Esperança [Baeza-Yates 2003], por exemplo, podem ser utilizadas para aprendizado não-supervisionado
45
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Aprendizado Semi-Supervisionado
‣ Um outro grupo de técnicas de aprendizado envolve abordagens mistas
• Supervisionado
• Não Supervisionado
‣ São as técnicas Semi-Supervisionadas
46
Modelagem deProblemas
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Modelagem de Problemas
‣ Problemas são descritos por variáveis
‣ Dois tipos
• Reais
• Categóricas
48
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Modelagem de Problemas
‣ Como transitar entre os dois tipos de variáveis?
‣ É possível “converter” uma representação em outra?
49
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Modelagem de Problemas
‣ Simplicidade vs. Complexidade
‣ O que é realmente importante?
‣ Precisamos realmente de todos os dados possíveis para tomar uma decisão?
50
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Modelagem de Problemas
‣ Dimensão do vetor de características tem efeitos colaterais importantes:
‣ Dimensão alta
• Distâncias médias ficam grandes
• Dados ficam esparsos
‣ Maldição da Dimensionalidade
51
Aprendizado Supervisionado
(Primeiros Passos)
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Aprendizado Supervisionado
‣ Dados para Aprendizado Supervisionado
‣ “Give me more data”
‣ Classificação vs. Regressão
53
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Aprendizado Supervisionado
‣ Será que quanto mais complexo nosso modelo de “predição” melhor o resultado?
54
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Exemplo – KNN
‣ K-Vizinhos mais Próximos (KNN)
‣ Um exemplo de técnica baseada em instâncias.
‣ Não há “aprendizado”
• decisões são feitas para cada instância
55
Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais
KNN –
Elements of Statistical Learning c!Hastie, Tibshirani & Friedman 2001 Chapter 2
1-Nearest Neighbor Classifier
.. .. .. . . . . .. . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . .
oo
ooo
o
o
o
o
o
o
o
o
oo
o
o o
oo
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
oo
o
o
o
o
o
o
o
o
o
oo o
oo
oo
o
oo
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
ooo
o
o
o
o
o
oo
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o oooo
o
ooo o
o
o
o
o
o
o
o
ooo
ooo
ooo
o
o
ooo
o
o
o
o
o
o
o
o o
o
o
o
o
o
o
oo
ooo
o
o
o
o
o
o
ooo
oo oo
o
o
o
o
o
o
o
o
o
o
Figure 2.3: The same classification example in two
dimensions as in Figure 2.1. The classes are coded
as a binary variable (GREEN = 0, RED = 1), and then
predicted by 1-nearest-neighbor classification.
56
© J.
Fri
edm
an e
t al
.
k = 1
Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais
KNN –
57
© J.
Fri
edm
an e
t al
.
Elements of Statistical Learning c!Hastie, Tibshirani & Friedman 2001 Chapter 2
15-Nearest Neighbor Classifier
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .
..
. .. .. .. .. . .. . .. . .. . . . .. . . . . .. . . . . . .. . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
oo
ooo
o
o
o
o
o
o
o
o
oo
o
o o
oo
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
oo
o
o
o
o
o
o
o
o
o
oo o
oo
oo
o
oo
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
ooo
o
o
o
o
o
oo
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o oooo
o
ooo o
o
o
o
o
o
o
o
ooo
ooo
ooo
o
o
ooo
o
o
o
o
o
o
o
o o
o
o
o
o
o
o
oo
ooo
o
o
o
o
o
o
ooo
oo oo
o
o
o
o
o
o
o
o
o
o
Figure 2.2: The same classification example in two
dimensions as in Figure 2.1. The classes are coded as a
binary variable (GREEN = 0, RED = 1) and then fit by 15-
nearest-neighbor averaging as in (2.8). The predicted
class is hence chosen by majority vote amongst the 15-
nearest neighbors.
k = 15
Avaliação eComparação
Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais
Avaliação e Comparação
‣ Viés e Variância
‣ Treinamento e Teste
‣ Matriz de Confusão
‣ Métricas e Critérios
59
Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais
Avaliação e Comparação
‣ Conjuntos de validação e teste
‣ Validação cruzada
60
Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais
Curvas ROC
61
‣ Especificidade
• E = TN / (TN + FP)
‣ Sensitividade
• S = TP / (TP + FN)
‣ (Sensitividade) vs. (1 - Especificidade) = Curva Característica de Operação (ROC)
Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais
Curvas ROC
62
© W
ikip
edia
.org
Referências
A. Rocha, 2010 – Análise Forense de Documentos Digitais
Referências
1. [Baeza-Yates 2003] R. Baeza-Yates. Clustering and Information Retrieval. Kluwer Academic Publishers. 1 edition.
2. [Bishop, 2006] C. M. Bishop. Pattern Recognition and Machine Learning. Springer, 1 edition, 2006.
3. [Duda et al. 2001] R. O. Duda, P. E. HART and D. G. STORK. Pattern Classification. Wiley-Interscience, 2, 2000.
4. [Friedman et al. 2001] J. Friedman, T. Hastie, and R. Tibshirani. The Elements of Statistical Learning. Springer, 1 edition, 2001.
5. [Gomes & Velho, 1996] J. Gomes L. Velho. Computação Gráfica: Imagem. IMPA-SBM, 1.
6. [Gonzalez & Woods, 2007] R. Gonzalez and R. Woods. Digital Image Processing. Prentice-Hall, 3 edition.
7. [Mitchell 1997] T. M. Mitchell. Machine Learning. McGraw-Hill, 1 edition, 1997.
64
Obrigado!