Lukuaika:
Diskriminatiiviset mallit, joita kutsutaan myös ehdollisiksi malleiksi, ovat luokka malleja, joita käytetään tilastollisessa luokittelussa, erityisesti valvotussa koneoppimisessa.
Toisin kuin generatiivinen mallinnus, joka tutkii yhteisestä todennäköisyydestä P(x,y), diskriminatiivinen mallinnus tutkii P(y|x) i.e, se ennustaa todennäköisyyttä y(kohde), kun annetaan x(harjoitusnäytteet).
- Ymmärretään tämä matemaattisen esimerkin avulla:
Esitettäköön, että syöttötieto on x ja x:n merkintöjen joukko on y. Tarkastellaan seuraavia 4 datapistettä:
(x,y) –> {(0,0), (0,0), (1,0), (1,1)}
Edellä mainituille tiedoille p(x,y) on seuraava:
kun taas p(y|x) on seuraava:
Jos vilkaisemme näitä kahta matriisia, ymmärrämme näiden kahden todennäköisyysjakauman eron.
Diskriminatiiviset algoritmit pyrkivät siis oppimaan p(y|x) suoraan datasta ja yrittävät sen jälkeen luokitella dataa.
Toisaalta generatiiviset algoritmit pyrkivät oppimaan p(x,y), joka voidaan myöhemmin muuntaa p(y|x):ksi datan luokittelemiseksi. Yksi generatiivisten algoritmien eduista on se, että p(x,y):n avulla voidaan luoda uutta dataa, joka muistuttaa olemassa olevaa dataa. Toisaalta diskriminatiiviset algoritmit antavat yleensä paremman suorituskyvyn luokittelutehtävissä.
Diskriminatiivisissa malleissa, jotta voimme ennustaa etiketin y harjoitusesimerkistä x, meidän on arvioitava:
joka vain valitsee, mikä on todennäköisin luokka y ottaen huomioon luokan x. Ikään kuin yrittäisimme mallintaa luokkien välistä päätöksentekorajaa. Tämä käyttäytyminen on hyvin selvää neuroverkoissa, joissa lasketut painot voidaan nähdä monimutkaisesti muotoiltuna käyränä, joka eristää luokan elementit avaruudessa.
- keskittyy päätösrajaan.
- tehokkaampi monilla esimerkeillä.
- ei ole suunniteltu käyttämään merkitsemätöntä dataa.
- vain valvottu tehtävä.
Diskriminoivat luokittelijat Esimerkkejä
Diskriminoivia malleja suositaan seuraavissa lähestymistavoissa:
- Logistinen regressio
- Skaalavektorikone
- Traditionaaliset neuroverkot
- Lähimmän naapurin haku
- Konditionaaliset satunnaiskentät (CRF)s
Diskriminoivien mallien hyödyt
- Diskriminoivia malleja käytetään, kun halutaan saada parempaa tarkkuutta harjoitteluaineistolle.
- Kun harjoitusdata on suuri ,tulevan datan tarkkuus on hyvä.
- Kun parametrien määrä on rajallinen, diskriminatiivinen malli yrittää optimoida y:n ennustamista x:stä, kun taas generatiivinen malli yrittää optimoida x:n ja y:n yhteistä ennustamista.
Tämän takia diskriminatiiviset mallit ovat parempia kuin generatiiviset mallit ehdollisissa ennustustehtävissä.