Tempo de leitura: 30 minutos
Os modelos discriminatórios, também referidos como modelos condicionais, são uma classe de modelos utilizados na classificação estatística, especialmente na aprendizagem supervisionada da máquina.
Não se assemelham à modelação generativa, que estuda a partir da probabilidade conjunta P(x,y), a modelação discriminatória estuda a P(y|x) i.e, prevê a probabilidade de y(target) quando dada x(amostras de treino).
- Vamos compreender isto com a ajuda de um exemplo matemático:
Suponha que os dados de entrada são x e o conjunto de etiquetas para x é y. Considere os seguintes 4 pontos de dados:
(x,y) –> {(0,0), (0,0), (1,0), (1,1)}
Para os dados acima, p(x,y) será o seguinte:
enquanto que p(y|x) será o seguinte:
Se dermos uma olhada nessas duas matrizes, entenderemos a diferença entre as duas distribuições de probabilidade.
Então os algoritmos discriminatórios tentam aprender p(y|x) diretamente dos dados e depois tentam classificar os dados.
Por outro lado, os algoritmos generativos tentam aprender p(x,y) que podem ser transformados em p(y|x) mais tarde para classificar os dados. Uma das vantagens dos algoritmos generativos é que você pode usar p(x,y) para gerar novos dados similares aos existentes. Por outro lado, algoritmos discriminatórios geralmente dão melhor desempenho em tarefas de classificação.
Em modelos discriminatórios, para prever a etiqueta y a partir do exemplo de treinamento x, devemos avaliar:
que apenas escolhe a classe y mais provável considerando x. É como se estivéssemos tentando modelar o limite de decisão entre as classes. Este comportamento é muito claro em redes neurais, onde os pesos computados podem ser vistos como uma curva de forma complexa isolando os elementos de uma classe no espaço.
- focus no limite de decisão.
- mais poderoso com muitos exemplos.
- não projetado para usar dados não etiquetados.
- tarefa somente supervisionada.
Classificadores discriminatórios Exemplos
Modelos discriminatórios são preferidos nas seguintes aprovações:
- Regressão logística
- Máquina vectorial escalar
- Redes neurais tradicionais
- Pesquisa do vizinho mais novo
- Campos aleatórios condicionais (CRF)s
Benefícios do modelo discriminatório
- Modelos discriminatórios são usados para obter melhor precisão nos dados de treino.
- Quando os dados de treinamento são grandes, a precisão para dados futuros será boa.
- Quando o número de parâmetros é limitado, um modelo discriminativo vai tentar otimizar a previsão de y a partir de x, enquanto um modelo generativo vai tentar otimizar a previsão conjunta de x e y. Por causa disso, modelos discriminatórios superam modelos generativos em tarefas de previsão condicional.