1. Uzdevuma nostādne
Praktiskais darbs sastāv no divām daļām:
1. daļa. Izmantojot datus no 1. praktiskā darba pirmās daļas, jārealizē ID3 klasifikators:
a)Realizācijas posmu aprēķinu veidošana un attēlošana;
b)Datu sadales pēc katras koka izveidošanas iterācijas attēlošana;
c)Gala koka attēlošana;
d)Kļūdas (ja ir) novērtēšana uz apmācības;
e)Jauno piemēru klasifikācija un kļūdas (ja ir, ar ko salīdzināt) novērtēšana.
2. daļa. Ar programmas See5/C5.0 palīdzību izveidot attiecīgo klasifikācijas koku.
f)Koka izveidošana ar programmas palīdzību;
g)Gala koka attēlošana;
h)Kļūdas (ja ir) novērtēšana uz apmācības;
i)Jauno piemēru klasifikācija un kļūdas (ja ir, ar ko salīdzināt) novērtēšana;
j)Failu *.data un *.names sagatavošana rādīšanai pasniedzējam.
Abās darba daļās izmanto sekojošu datu kopu: apmācības kopa sastāv no 27 ierakstiem un 7 jauniem ierakstiem. Klašu skaits – 2. Jauni ieraksti nav vienādi ar apmācības kopas ierakstiem.
Pēc abu daļu pabeigšanas jāveido salīdzinoša analīze par algoritmu rezultātiem.
2. Teorētiskais pamatojums
2.1 ID3
Induktīvais lēmumu koks patiesībā ir grafs ar vairākām virsotnēm, kuras savā starpā ir saistītas ar lokiem. Katra grafa iekšējā virsotne atspoguļo kādu ne-mērķa atribūtu un katrs loks – iespējamo šī atribūta vērtību. Savukārt, koka lapas (mērķa virsotnes) atspoguļo mērķa atribūta gaidīto vērtību vai arī klasi. Sākuma virsotni lēmumu kokā sauc par saknes virsotni.
Lai klasificētu nezināmu objektu, tā atribūtu vērtības ir jāpārbauda uz lēmumu koka. Rezultātā rodas ceļš, kas ved no saknes virsotnes uz koka lapu. Tas satur klases paredzējumu. Liela priekšrocība lēmumu kokiem ir tā, ka tos ir samērā vienkārši pārveidot klasifikācijas likumos.
Pamatalgoritms lēmumu koka indukcijai ir „alkatīgais algoritms”, kas veido lēmumu koku no augšas uz leju rekursīvā „atdalīt-un-uzvarēt” manierē. Dotais algoritms ir ID3 algoritma versija. Tas ģenerē lēmumu koku no dotas apmācošās datu kopas. Ieejas dati ir eksemplāri, attēloti kā diskrētu vērtības atribūti, un atribūtu saraksts. …