Læsningstid:
Diskriminative modeller, også kaldet betingede modeller, er en klasse af modeller, der anvendes i statistisk klassifikation, især i overvåget maskinlæring.
I modsætning til den generative modellering, der studerer ud fra den fælles sandsynlighed P(x,y), studerer den diskriminative modellering P(y|x) i.Dvs. den forudsiger sandsynligheden for y(mål), når x(træningsprøver) er givet.
- Lad os forstå dette ved hjælp af et matematisk eksempel:
Sæt, at inputdataene er x, og at sættet af etiketter for x er y. Overvej følgende 4 datapunkter:
(x,y) –> {(0,0), (0,0), (1,0), (1,1)}
For ovenstående data vil p(x,y) være følgende:
men p(y|x) vil være følgende:
Hvis vi tager et kig på disse to matricer, vil vi forstå forskellen mellem de to sandsynlighedsfordelinger.
Så diskriminative algoritmer forsøger at lære p(y|x) direkte fra dataene og forsøger derefter at klassificere dataene.
På den anden side forsøger generative algoritmer at lære p(x,y), som senere kan omdannes til p(y|x) for at klassificere dataene. En af fordelene ved generative algoritmer er, at man kan bruge p(x,y) til at generere nye data, der ligner de eksisterende data. På den anden side giver diskriminative algoritmer generelt bedre resultater i klassifikationsopgaver.
I diskriminative modeller skal vi for at forudsige etiketten y ud fra træningseksemplet x evaluere:
som blot vælger, hvad der er den mest sandsynlige klasse y i betragtning af x. Det er som om, vi forsøger at modellere beslutningsgrænsen mellem klasserne. Denne adfærd er meget tydelig i neurale netværk, hvor de beregnede vægte kan ses som en komplekst formet kurve, der isolerer elementerne i en klasse i rummet.
- fokus på beslutningsgrænsen.
- mere kraftfuldt med mange eksempler.
- ikke designet til at bruge umærkede data.
- kun superviseret opgave.
Diskriminative klassifikatorer Eksempler
Diskriminative modeller er at foretrække i følgende fremgangsmåder:
- Logistisk regression
- Scalar Vector Machine
- Traditionelle neurale netværk
- Nærmeste nabo-søgning
- Conditional Random Fields (CRF)s
Fordele ved diskriminative modeller
- Diskriminative modeller bruges til at få bedre nøjagtighed på træningsdata.
- Når træningsdataene er store ,vil nøjagtigheden for fremtidige data være god.
- Når antallet af parametre er begrænset, vil en diskriminativ model forsøge at optimere forudsigelsen af y ud fra x, mens en generativ model vil forsøge at optimere den fælles forudsigelse af x og y. På grund af dette klarer diskriminative modeller sig bedre end generative modeller ved betingede forudsigelsesopgaver.