Term Papers
Technologies
Computers, Consumer Electronics
Regresijas koku izmantošanas efektivitātes analīze progno...-
Regresijas koku izmantošanas efektivitātes analīze prognozēšanas uzdevumos
Nr. | Chapter | Page. |
INSTITŪTS | 1 | |
1. | IEVADS | 6 |
2. | UZDEVUMA NOSTĀDNE | 8 |
2.1. | UZDEVUMA SATURĪGĀ NOSTĀDNE | 8 |
2.2. | UZDEVUMA FORMĀLĀ NOSTĀDNE | 8 |
2.2.1. | Risināma uzdevuma problēmas | 9 |
3. | IZMANTOJAMĀS METODES | 10 |
3.1. | DATU AUTOMĀTISKI - INTELEKTUĀLAS ANALĪZES PAMATI | 10 |
3.2. | KLASIFIKĀCIJAS KOKU METODE | 12 |
3.2. | 1.att. Klasifikācijas koka struktūra | 13 |
3.3. | REGRESIJAS METODES | 23 |
3.3.1. | Vienkārša lineāra regresija | 24 |
3.3.2. | Daudzfaktoru lineāra regresija | 26 |
3.3.3. | Loģistiska regresija | 32 |
4. | NOPUBLICĒTO RISINĀMO METOŽU APSKATS | 34 |
4.1. | CART KLASIFIKĀCIJAS TEHNIKAS PIELIETOŠANA ŪDENS | 34 |
TOKSICITĀTES NOTEIKŠANAI | 34 | |
Izmantojamas metodes | 34 | |
Uzdevuma risinājums un rezultāti | 35 | |
4.2. | KLASIFIKĀCIJAS KOKU MODEĻA IZMANTOŠANA ASTRONOMIJĀ | 38 |
Problēmas apraksts | 38 | |
Problēmas risinājums un rezultāti | 38 | |
4.3. | KLASIFIKĀCIJAS UN REGRESIJAS KOKU PIELIETOŠANA LAVĪNU AKTIVITĀTES PROGNOZĒŠANAI | 41 |
Ievads | 41 | |
Izmantojamas metodes | 41 | |
Izmantoto datu apskats | 42 | |
Problēmas risinājums un rezultāti | 42 | |
5. | TEORĒTISKĀ DAĻA | 44 |
5.1. | PROGNOZĒŠANAS PRECIZITĀTES NOTEIKŠANAS KRITERIJI | 44 |
6. | PRAKTISKĀ DAĻA | 46 |
6.1. | EKSPERIMENTU PLĀNA IZSTRĀDĀŠANA | 46 |
6.2. | SĀKUMDATU APRAKSTS | 46 |
6.3. | EKSPERIMENTU PLANA APRAKSTS | 50 |
6.4. | EKSPERIMENTA GAITAS APRAKSTS UN REZULTĀTI | 51 |
6.4.1. | Datu bāzes "Automašīnas" analīze ar CART klasifikāciju koku algoritma palīdzību | 51 |
6.4.2. | Datu bāzes "Automašīnas" analīze ar CART regresijas koku algoritma palīdzību (166 piemeri) | 63 |
6.4 | 10.att. Terminālie mezgli ar intervālu vērtībām | 66 |
6.4.3. | Datu bāzes "Automašīnas" analīze ar daudzfaktoru regresiju | 66 |
6.4.4. | Datu bāzes "Diabēts" analīze ar CART klasifikāciju koku algoritma palīdzību | 72 |
6.4.5. | Datu bāzes " Diabēts " analīze ar CART regresijas koku algoritma palīdzību | 79 |
6.4.6. | Datu bāzes " Diabēts " analīze ar daudzfaktoru loģistisko regresiju | 82 |
6.5. | REZULTĀTU ANALĪZE | 87 |
6.5.1. | Datu bāzes "Automašīnas" analīzes rezultāti | 87 |
6.5.2. | Datu bāzes "Diabēts" analīzes rezultāti | 91 |
7. | SECINĀJUMI | 96 |
8. | BIBLIOGRĀFISKAIS SARAKSTS | 98 |
9. | PIELIKUMI | 100 |
9.1. | CART 4.0. DATORPROGRAMMAS APRAKSTS | 100 |
UZDEVUMA NOSTĀDNE
Klasifikācijas un regresijas koki ir viena no datu intelektuāli - automātiskas analīzes metodēm. Šī metodi veiksmīgi pielieto datu klasifikācijai un prognozēšanai dažādās jomās. Dotajā maģistra darbā tiek analizēta regresijas koku pielietošanas efektivitāte, prognozēšanas uzdevumos. Efektivitātes analīze tika veikta salīdzinot regresijas koku metodi ar klasifikācijas koku un lineāras regresijas metodēm.
2.1. UZDEVUMA SATURĪGĀ NOSTĀDNE
Lai noteiktu regresijas koku prognozēšanas efektivitāti, tiks analizētas divas lielas datu bāzes. Datu bāzes satur informāciju no dažādām jomām un atšķiras pēc informācijas apjomiem, datu tipiem un klases radītājiem. Divas datu bāzes ir izvelētas ar mērķī izpētīt, kā ietekme augstāk minēti parametri uz prognozēšanas precizitāti. Datu bāzes nosaukumi ir "Automašīnas" un "Diabēts".
Pirmā datu bāze "Automašīnas" satur informāciju par automašīnas parametriem kurus nepieciešams analizēt, lai veiktu tālāku automašīnas cenas prognozēšanu. Datu bāze sastāv no 166 ierakstām. Statistiska informācija saņemta no kataloga "Ward's Automotive Yearbook" no internēt lapaspuses - www.aic.nrl.navy.mil/~aha/research/machine-learning.Klases radītājam ir skaitliska vērtība. Otra datu bāze "Diabēts" satur medicīnas informāciju par pacientu analīzēm. Datu bāze satur 768 ierakstus. Visi dati sadalīti pēc divām klasēm. Klases radītājs noteic pacienta pozitīvu vai negatīvu diabēta diagnozi . Nepieciešams izpētīt datus un uz jauniem datiem prognozēt iespējamo diagnozi.
Abas problēmas bija analizētas ar klasifikācijas un regresijas koku metodēm kā arī ar statistisko metodi - daudzfaktoru lineāru regresiju. Darba uzdevums bija izpētīt visas darba apskatāmas metodes, salīdzināt tās, analizēt rezultātus un izvelēt labāko modeļi prognozēšanai, lai pēc tam novērtētu regresijas koku izmantošanas efektivitāti prognozēšanas uzdevumos.
2.2. UZDEVUMA FORMĀLĀ NOSTĀDNE
Lai analizētu datu bāzes "Automašīnas" un "Diabēts" tika pielietotas trīs metodes. Pirmā metode ir klasifikācijas koku tehnoloģija, otra metode ir regresijas koku tehnoloģija un treša ir plaši pazīstama statistiska metode - lineāra un loģistiska daudzfaktoru regresija. Prognozēšanai ir jāizmanto statistiskie dati. Sakumkopas lielumu var mainīt eksperimenta gaitā. Testa un apmācošas kopas izmērus arī var mainīt. Eksperimenta izejoši dati ir prognozējamas vērtības. Apstrādātu datu skaits ir liels, tādēļ nepieciešams aprēķiniem izmantot datoru programmas. Klasifikācijas un regresijas kokiem jāizmanto programmu CART 4.0., bet lineāras regresijas aprēķiniem jāizmanto statistisko paketi Polyanalist 4.5. Labākai problēmas saprašanai izejošus datus nepieciešams paradīt ne tikai tabulās, bet arī grafiskā veidā: dati - koku veidā, prognozēšanas kļūdas - grafikos. Nepieciešams arī pieņemt prognozēšanas precizitātes noteikšanas kritēriju.
2.2.1.Risināma uzdevuma problēmas
1. Apskatīt datu intelektuāli - automātiskas analīzes teorētiskus pamatus, klasifikācijas koku teorētiskus pamatus un dot regresijas metodes teorētisko analīzi
2. Apskatīt nopublicētus risinājumus, kuri ir tuvi darba risināmām uzdevumam
3. Analizēt un apstrādāt datu bāzes sakumdatus
4. Sadalīt datu kopas uz testējošo un apmācošo kopu un pēc tam paveikt datu bāzes vērtību aprēķinu
5. Eksperimentāli izpētīt abas datu bāzes ar aprakstītām darbā metodēm. Paveikt eksperimentus kuri rada kā ietekmē datu apjoms un atribūtu svarīgums uz prognozēšanas precizitāti
6. Atrast labāko koku izmantojot kross - pārbaudes metodi, balstoties uz mazāko klasifikācijas kļūdu
7. Salīdzināt visas apskatāmas metodes rezultātus un noteikt labāku prognozēšanas modeļi katrai datu bāzei
8. Noteikt regresijas koku izmantošanas efektivitāti prognozēšanā salīdzinot ar citiem metodēm kuri aprakstīti šajā darbā.…
. Darbā tika apskatīti sekojoši teorētiski jautājumi: datu automātiski - intelektuālās analīzes pamati, klasifikācijas koku pamatjēdzieni, klasifikācijas un regresijas koku algoritmi un lineāras regresijas metodes. Lineāras regresijas metodes ietver sevī vienkāršas lineāras regresijas, daudzfaktoru lineāras regresijas un loģistiskas regresijas aprakstus. Praktiskajā daļā aptver eksperimentu plāna izstrādāšanu, sakumdatu aprakstu, eksperimenta gaitas aprakstu un rezultātu analīzi. Izmantojot klasifikācijas koku, regresijas koku un lineāru regresiju metodes tika paveikti apmācības eksperimenti un izvēlēts labākais modelis katrai datu bāzei. Tika paveikta metodes salīdzināšana un izdarīti secinājumi par labāko metodi, kā arī par katras metodes priekšrocībām un trūkumiem.
- Automātu pusgrupas un modelēšana
- E-pārvaldes ieviešana Latvijā un tās integrācijas iespējas ar e-komercijas piedāvātiem risinājumiem
- Regresijas koku izmantošanas efektivitātes analīze prognozēšanas uzdevumos
-
You can quickly add any paper to your favourite. Cool!Elektroniskās komercijas ieviešanas un attīstīšanas (mobilās komercijas ieviešanas) analīze
Term Papers for university58
Evaluated! -
Lēmumu analīze informācijas tehnoloģijas projekta izstrādē
Term Papers for university71
-
Būvdarbu tīkla analīze un kalendāra plānošana
Term Papers for university83
-
Latvijas tūrisma uzņēmumu mājas lapu analīze
Term Papers for university94
Evaluated! -
DSL tehnoloģiju izmantošanas problēmas
Term Papers for university49
Evaluated!