Add Papers Marked0
Paper checked off!

Marked works

Viewed0

Viewed works

Shopping Cart0
Paper added to shopping cart!

Shopping Cart

Register Now

internet library
Atlants.lv library
FAQ
14,20 € Add to cart
Add to Wish List
Want cheaper?
ID number:225972
 
Author:
Evaluation:
Published: 04.06.2014.
Language: Latvian
Level: College/University
Literature: 10 units
References: Used
Time period viewed: 2011 - 2015 years
Table of contents
Nr. Chapter  Page.
  APZĪMĒJUMU SARAKSTS    7
  IEVADS    9
1.  MALTPARSER    10
1.1.  Arc-eager Shift-reduce algoritms    10
1.1.1.  Arc-eager Shift-reduce algoritma realizācija    10
1.2.  SVM algoritms    13
2.  PROBLĒMAS APRAKSTS    14
3.  PĒTĪJUMA METODOLOĢIJA    15
3.1.  Gadījumu izpēte – mašīnmācīšanās algoritmu salīdzinājums    15
3.2.  Eksperimenti – sintaktiskā analizatora izstrāde un lietojums    15
4.  MAŠĪNMĀCĪŠANĀS ALGORITMU SALĪDZINĀJUMS    17
4.1.  SVM    17
4.2.  C4.5    19
4.3.  C5.0    20
4.4.  Secinājumi    22
5.  SINTAKTISKĀ ANALIZATORA IZSTRĀDE    23
5.1.  Datu ģeneratora izstrāde    23
5.1.1.  CoNLL formāta ieejas dati    23
5.1.2.  Algoritms    25
5.1.3.  Pseidokods    25
5.1.4.  Piemērs    26
5.2.  Sintaktiskā analizatora izstrāde    27
5.2.1.  Algoritms    27
5.2.2.  Pseidokods    28
5.2.3.  Piemērs    29
6.  EKSPERIMENTU REZULTĀTI    30
6.1.  Veicamā gājiena klasificēšana    30
6.1.1.  Testa dati    30
6.1.2.  C5 sintaktiskais analizators    31
6.1.3.  C5.0 ar lēmumu koku    31
6.1.4.  C5.0 ar lēmumu likumiem    32
6.1.5.  SVM    32
6.1.6.  Salīdzinājums    33
6.2.  Teikuma sintaktiskās struktūras klasificēšana    33
6.2.1.  Testa dati    33
6.2.2.  C5 sintaktiskais analizators    34
6.2.3.  C5.0 ar lēmumu koku    34
6.2.4.  SVM    34
6.2.5.  Salīdzinājums    34
6.3.  Iespējamie uzlabojumi    35
  SECINĀJUMI    36
  IZMANTOTĀ LITERATŪRA    37
  PIELIKUMI    38
1.PIELIKUMS.  Arc-eager Shift-reduce pirmkods    39
2.PIELIKUMS.  C 4.5 un C 5.0 testa piemēri    42
3.PIELIKUMS.  Datu ģeneratora pirmkods    43
4.PIELIKUMS.  Sintaktiskā analizatora pirmkods    45
5.PIELIKUMS.  Programmatūras izpildāmais modulis    49
Extract

SECINĀJUMI
Maģistra darba problēmas aprakstā izvirzītie mērķi izpētīt un salīdzināt mašīnmācīšanās algoritmus, un izstrādāt sintaktiskās analīzes rīku tika īstenoti. Tika izpētīta par algoritmiem pieejamā literatūra, izmēģināta algoritmu darbība brīvi pieejamā programmatūrā, un tie tika salīdzināti pēc vairākiem kritērijiem. Tika veiksmīgi izstrādāts C5 sintaktiskais analizators, kurā izmantojama gan autora C4.5 / C5.0 implementācija, gan oriģinālās C5.0 programmatūras kā arī SVM klasifikatora datus. Izvēlētie algoritmi tika salīdzināti ar C5 sintaktiskajā analizatorā ģenerētajiem ievaddatiem sintaktiskās analīzes nākamo gājienu paredzēšanā un arī atkarību loku veidošanā. Eksperimentu rezultātos tika atklāts, ka tieši datorlingvistikas vajadzībām tomēr C5.0 izvirzījās vadībā, par pāris procentu punktiem pārspējot konkurentus, lai gan visi trīs algoritmi darbojās ar samērā līdzīgu precizitāti.
Darba sākumā tika aprakstīts valodas apstrādes rīks Maltparser, tajā lietotie algoritmi gan tekstu sintaktiskās analīzes, gan mašīnmācīšanās. Sintaktisko atkarību analīzes algoritms Arc-eager Shift-reduce tika implementēts nelielā PHP programmā, dziļākas autora izpratnes radīšanai. Tālāk tika nodefinēta arī konkrēta maģistra darbā risināmā problēma un pieeja pētījuma veikšanai.
Darba otrajā daļā tika apskatīti un salīdzināti dažādi mašīnmācīšanās algoritmi – gan rīkā Maltparser lietotais SVM, gan algoritms C5.0, ar kuru to plānots aizvietot, kā arī viens vecāks mašīnmācīšanās algoritms – C4.5. Tika veikta neliela literatūras izpēte par konkrēto algoritmu teorētisko pamatojumu, kam sekoja arī algoritmu praktiska izmēģināšana uz reāliem testa piemēriem, lai varētu objektīvi salīdzināt to darbību.
Trešajā daļā tika izstrādāts C5 sintaktiskais analizators, kas sevī apvienoja sintaktisko atkarību analīzes algoritmu ar mašīnmācīšanās algoritmiem, lai varētu izveidot atkarību lokus starp ievadīto teikumu vārdiem / teikumu daļām. Ar šo rīku tika veikti eksperimenti, kuros salīdzināti mašīnmācīšanās algoritmi daļējā (nākamā gājiena paredzēšanas) un pilnā (atkarību loku veidošanā) sintaktiskās analīzes uzdevuma veikšanā.
Šis maģistra darbs pierāda, ka teikumu sintaktiskās analīzes problēmu risināšanā veiksmīgi var tikt izmantots C5.0 mašīnmācīšanās algoritms, kas ne vien spēs sniegt rezultātus ar lielāku precizitāti, bet arī veicinās tā lietotāju izpratni par analīzes gājienu secību. Tas noteikti var kalpot kā uzskates materiāls citiem valodas tehnoloģiju vai līdzīgiem pētījumiem.…

Author's comment
Work pack:
GREAT DEAL buying in a pack your savings −2,70 €
Work pack Nr. 1355404
Load more similar papers

Atlants

Choose Authorization Method

Email & Password

Email & Password

Wrong e-mail adress or password!
Log In

Forgot your password?

Draugiem.pase
Facebook

Not registered yet?

Register and redeem free papers!

To receive free papers from Atlants.com it is necessary to register. It's quick and will only take a few seconds.

If you have already registered, simply to access the free content.

Cancel Register