Add Papers Marked0
Paper checked off!

Marked works

Viewed0

Viewed works

Shopping Cart0
Paper added to shopping cart!

Shopping Cart

Register Now

internet library
Atlants.lv library
FAQ
4,99 € Add to cart
Add to Wish List
Want cheaper?
ID number:223349
 
Author:
Evaluation:
Published: 16.06.2011.
Language: Latvian
Level: College/University
Literature: n/a
References: Used
Table of contents
Nr. Chapter  Page.
  Ievads    3
  Web usage mining    4
  Datu sagatavošana    5
  Statiskā analīze    7
  Iegūto datu analīze    8
  Web content mining    9
  Google    9
Extract

WEB usage mining
Informācijas iegūšana servera līmenī, tas ir informācijas atlase no Web-servera žurnāliem. Šo metodi izmanto visbiežāk, jo bez liekiem tēriņiem var iegūt pietiekoši daudz informācijas par lietotāja mijiedarbību ar serveri. Šī ir viena tām metodēm, kurai jau iepriekš ir sakrāti dati, jo visi vai gandrīz visi serveri veic automātisku žurnālfailu veidošanu, kuri glabājas diezgan ilgi.
Lielākā daļa Web serveru mūsdienās (ieskaitot Apache) piedāvā administratoram iespēju izvēlēties, kādi lauki tiks iekļauti žurnālos, un kuri nē. Servera žurnāliem ir arī savi trūkumi, par pamat trūkumu uzskata informācijas nepilnību. Tas neatspoguļo lapas, kuras lietotājs iepriekš ir saglabājis uz sava datora un apmeklējis, kā arī datus, kuri tiek padoti serverim ar POST metodi. Alternatīva metode datu iegūšanai servera līmenī – analīze pakešu līmenī. Tādā veidā var analizēt datus atsevišķu TCP/IP vaicājumu līmenī, bet tādu datu uzkrāšanai ir nepieciešama papildus programmatūra.

Informācijas iegūšana par lietotāja darbībām lietotāja līmenī. Viens no veidiem – Java programmu izmantošana, kas ielādējas kopā ar lapām uz servera, bet šo programmu funkcionalitāte ir ierobežota un lietotājs ar pārlūkprogrammas palīdzību var atslēgt informācijas iegūšanu. Otra iespēja varētu būt izmaiņu ieviešana pārlūkprogrammās. Bet tad vajadzēs žurnālos ierakstīt visus iespējamos datus, jo ja nākotnē būs nepieciešamība iegūt datus par citu parametru, tad ieviest izmaiņas visās pārlūkprogrammās būs neiespējams. Kā arī pie tādas iespējas ir divas problēmas – pirmkārt, pārsvarā neviens negribēs, lai viņa soļi Internetā ir pierakstīti un tad kaut kur nosūtīti, otrkārt, pārsvarā neviens negribēs atjaunot programmu, trešās personas vajadzībām, kas vāc datus. Tādā veidā informācijas iegūšana lietotāja līmenī vistiešāk skar privātās dzīves nepieskaramības problēmu.

Kā alternatīvu informācijas iegūšanai servera pusē vai lietotāja līmenī var izmantot informācijas iegūšanu tīkla mezglos. Ne vienmēr iespējams piekļūt servera žurnāliem, kā arī pievienojot serverim jaunas programmas informācijas iegūšanai var būtiski samazināt tā ātrdarbību, kas nebūtu vēlams. Kā risinājumu var izvietot sensorus tīkla mezglos pirms servera, tādā veidā serveris nebūs pārslogots no programmatūras. Tādā gadījumā informācijas iegūšana ir protokolu līmenī, izmantojot TCP/IP paketes. Kā labs piemērs sistēmai kalpo Web Traffic Warehouse. Sistēmas izstrādātāji ir atklājuši, ka atkarībā no informācijas vācēja atrašanās vietas mainās datu kvalitāte. Ja dati tiek nodoti asinhroni, izejošais un ienākošais trafiks var tikt sūtīt pa dažādiem fiziskiem kanāliem. …

Author's comment
Load more similar papers

Atlants

Choose Authorization Method

Email & Password

Email & Password

Wrong e-mail adress or password!
Log In

Forgot your password?

Draugiem.pase
Facebook

Not registered yet?

Register and redeem free papers!

To receive free papers from Atlants.com it is necessary to register. It's quick and will only take a few seconds.

If you have already registered, simply to access the free content.

Cancel Register