Add Papers Marked0
Paper checked off!

Marked works

Viewed0

Viewed works

Shopping Cart0
Paper added to shopping cart!

Shopping Cart

Register Now

internet library
Atlants.lv library
FAQ
21,48 € Add to cart
Add to Wish List
Want cheaper?
ID number:339000
 
Author:
Evaluation:
Published: 03.12.2005.
Language: Latvian
Level: College/University
Literature: 15 units
References: Used
Time period viewed: 2000 - 2010 years
Table of contents
Nr. Chapter  Page.
  INSTITŪTS    1
1.  IEVADS    6
2.  UZDEVUMA NOSTĀDNE    8
2.1.  UZDEVUMA SATURĪGĀ NOSTĀDNE    8
2.2.  UZDEVUMA FORMĀLĀ NOSTĀDNE    8
2.2.1.  Risināma uzdevuma problēmas    9
3.  IZMANTOJAMĀS METODES    10
3.1.  DATU AUTOMĀTISKI - INTELEKTUĀLAS ANALĪZES PAMATI    10
3.2.  KLASIFIKĀCIJAS KOKU METODE    12
3.2.  1.att. Klasifikācijas koka struktūra    13
3.3.  REGRESIJAS METODES    23
3.3.1.  Vienkārša lineāra regresija    24
3.3.2.  Daudzfaktoru lineāra regresija    26
3.3.3.  Loģistiska regresija    32
4.  NOPUBLICĒTO RISINĀMO METOŽU APSKATS    34
4.1.  CART KLASIFIKĀCIJAS TEHNIKAS PIELIETOŠANA ŪDENS    34
  TOKSICITĀTES NOTEIKŠANAI    34
  Izmantojamas metodes    34
  Uzdevuma risinājums un rezultāti    35
4.2.  KLASIFIKĀCIJAS KOKU MODEĻA IZMANTOŠANA ASTRONOMIJĀ    38
  Problēmas apraksts    38
  Problēmas risinājums un rezultāti    38
4.3.  KLASIFIKĀCIJAS UN REGRESIJAS KOKU PIELIETOŠANA LAVĪNU AKTIVITĀTES PROGNOZĒŠANAI    41
  Ievads    41
  Izmantojamas metodes    41
  Izmantoto datu apskats    42
  Problēmas risinājums un rezultāti    42
5.  TEORĒTISKĀ DAĻA    44
5.1.  PROGNOZĒŠANAS PRECIZITĀTES NOTEIKŠANAS KRITERIJI    44
6.  PRAKTISKĀ DAĻA    46
6.1.  EKSPERIMENTU PLĀNA IZSTRĀDĀŠANA    46
6.2.  SĀKUMDATU APRAKSTS    46
6.3.  EKSPERIMENTU PLANA APRAKSTS    50
6.4.  EKSPERIMENTA GAITAS APRAKSTS UN REZULTĀTI    51
6.4.1.  Datu bāzes "Automašīnas" analīze ar CART klasifikāciju koku algoritma palīdzību    51
6.4.2.  Datu bāzes "Automašīnas" analīze ar CART regresijas koku algoritma palīdzību (166 piemeri)    63
6.4  10.att. Terminālie mezgli ar intervālu vērtībām    66
6.4.3.  Datu bāzes "Automašīnas" analīze ar daudzfaktoru regresiju    66
6.4.4.  Datu bāzes "Diabēts" analīze ar CART klasifikāciju koku algoritma palīdzību    72
6.4.5.  Datu bāzes " Diabēts " analīze ar CART regresijas koku algoritma palīdzību    79
6.4.6.  Datu bāzes " Diabēts " analīze ar daudzfaktoru loģistisko regresiju    82
6.5.  REZULTĀTU ANALĪZE    87
6.5.1.  Datu bāzes "Automašīnas" analīzes rezultāti    87
6.5.2.  Datu bāzes "Diabēts" analīzes rezultāti    91
7.  SECINĀJUMI    96
8.  BIBLIOGRĀFISKAIS SARAKSTS    98
9.  PIELIKUMI    100
9.1.  CART 4.0. DATORPROGRAMMAS APRAKSTS    100
Extract

UZDEVUMA NOSTĀDNE

Klasifikācijas un regresijas koki ir viena no datu intelektuāli - automātiskas analīzes metodēm. Šī metodi veiksmīgi pielieto datu klasifikācijai un prognozēšanai dažādās jomās. Dotajā maģistra darbā tiek analizēta regresijas koku pielietošanas efektivitāte, prognozēšanas uzdevumos. Efektivitātes analīze tika veikta salīdzinot regresijas koku metodi ar klasifikācijas koku un lineāras regresijas metodēm.
2.1. UZDEVUMA SATURĪGĀ NOSTĀDNE
Lai noteiktu regresijas koku prognozēšanas efektivitāti, tiks analizētas divas lielas datu bāzes. Datu bāzes satur informāciju no dažādām jomām un atšķiras pēc informācijas apjomiem, datu tipiem un klases radītājiem. Divas datu bāzes ir izvelētas ar mērķī izpētīt, kā ietekme augstāk minēti parametri uz prognozēšanas precizitāti. Datu bāzes nosaukumi ir "Automašīnas" un "Diabēts".
Pirmā datu bāze "Automašīnas" satur informāciju par automašīnas parametriem kurus nepieciešams analizēt, lai veiktu tālāku automašīnas cenas prognozēšanu. Datu bāze sastāv no 166 ierakstām. Statistiska informācija saņemta no kataloga "Ward's Automotive Yearbook" no internēt lapaspuses - www.aic.nrl.navy.mil/~aha/research/machine-learning.Klases radītājam ir skaitliska vērtība. Otra datu bāze "Diabēts" satur medicīnas informāciju par pacientu analīzēm. Datu bāze satur 768 ierakstus. Visi dati sadalīti pēc divām klasēm. Klases radītājs noteic pacienta pozitīvu vai negatīvu diabēta diagnozi . Nepieciešams izpētīt datus un uz jauniem datiem prognozēt iespējamo diagnozi.
Abas problēmas bija analizētas ar klasifikācijas un regresijas koku metodēm kā arī ar statistisko metodi - daudzfaktoru lineāru regresiju. Darba uzdevums bija izpētīt visas darba apskatāmas metodes, salīdzināt tās, analizēt rezultātus un izvelēt labāko modeļi prognozēšanai, lai pēc tam novērtētu regresijas koku izmantošanas efektivitāti prognozēšanas uzdevumos.
2.2. UZDEVUMA FORMĀLĀ NOSTĀDNE

Lai analizētu datu bāzes "Automašīnas" un "Diabēts" tika pielietotas trīs metodes. Pirmā metode ir klasifikācijas koku tehnoloģija, otra metode ir regresijas koku tehnoloģija un treša ir plaši pazīstama statistiska metode - lineāra un loģistiska daudzfaktoru regresija. Prognozēšanai ir jāizmanto statistiskie dati. Sakumkopas lielumu var mainīt eksperimenta gaitā. Testa un apmācošas kopas izmērus arī var mainīt. Eksperimenta izejoši dati ir prognozējamas vērtības. Apstrādātu datu skaits ir liels, tādēļ nepieciešams aprēķiniem izmantot datoru programmas. Klasifikācijas un regresijas kokiem jāizmanto programmu CART 4.0., bet lineāras regresijas aprēķiniem jāizmanto statistisko paketi Polyanalist 4.5. Labākai problēmas saprašanai izejošus datus nepieciešams paradīt ne tikai tabulās, bet arī grafiskā veidā: dati - koku veidā, prognozēšanas kļūdas - grafikos. Nepieciešams arī pieņemt prognozēšanas precizitātes noteikšanas kritēriju.
2.2.1.Risināma uzdevuma problēmas

1. Apskatīt datu intelektuāli - automātiskas analīzes teorētiskus pamatus, klasifikācijas koku teorētiskus pamatus un dot regresijas metodes teorētisko analīzi
2. Apskatīt nopublicētus risinājumus, kuri ir tuvi darba risināmām uzdevumam
3. Analizēt un apstrādāt datu bāzes sakumdatus
4. Sadalīt datu kopas uz testējošo un apmācošo kopu un pēc tam paveikt datu bāzes vērtību aprēķinu
5. Eksperimentāli izpētīt abas datu bāzes ar aprakstītām darbā metodēm. Paveikt eksperimentus kuri rada kā ietekmē datu apjoms un atribūtu svarīgums uz prognozēšanas precizitāti
6. Atrast labāko koku izmantojot kross - pārbaudes metodi, balstoties uz mazāko klasifikācijas kļūdu
7. Salīdzināt visas apskatāmas metodes rezultātus un noteikt labāku prognozēšanas modeļi katrai datu bāzei
8. Noteikt regresijas koku izmantošanas efektivitāti prognozēšanā salīdzinot ar citiem metodēm kuri aprakstīti šajā darbā.…

Author's comment
Load more similar papers

Atlants

Choose Authorization Method

Email & Password

Email & Password

Wrong e-mail adress or password!
Log In

Forgot your password?

Draugiem.pase
Facebook

Not registered yet?

Register and redeem free papers!

To receive free papers from Atlants.com it is necessary to register. It's quick and will only take a few seconds.

If you have already registered, simply to access the free content.

Cancel Register