Datu analīzes rīki (Data Analysis)
Datu analīzes rīki (Data Analysis)
Lai varētu izmantot programmas EXCEL datu analīzes rīkus, izvelnē Tools jābūt redzamai komandai Data Analysis. Ja šī komanda nav pieejama, izvēlēties Tools - Add-Ins - Analysis ToolPak - OK. Tagad izvelnē Tools būs redzama komanda Data Analysis.
1. Anova: Single Factor - viena faktora dispersijas analīze
2. Anova: Two-Factor With Replication - divu faktoru dispersijas analīze ar atkārtojumiem
3. Anova: Two-Factor Without Replication - divu faktoru dispersijas analīze bez atkārtojumiem
4. Correlation – korelācijas koeficients
5. Covariance - kovariācijas koeficients
6. Descriptive Statistics – statistiskie rādītāji
7. Exponential Smoothing - eksponenciāla izlīdzināšana
8. F-Test Two Sample for Variances - dispersiju salīdzināšana pēc Fišera kritērija
9. Fourier Analysis – Furje analīze
10. Histogram - histogramma
11. Moving Average – izlīdzināšana ar vidējo slīdošo
12. Random Number Generation - nejaušo skaitļu ģenerators
13. Rank and Percentile – rangi un procentuālais sadalījums
14. Regression - regresija
15. Sampling - nejauša izlase no paraugkopas
16. t-Test: Paired Two Sample for Means – t – tests atkarīgām paraugkopām
17. t-Test: Two- Sample Assuming Equal Variances – t- tests neatkarīgām paraugkopām, ja dispersijas būtiski neatšķiras
18. t-Test: Two- Sample Assuming Unequal Variances - t- tests neatkarīgām paraugkopām, ja dispersijas būtiski atšķiras
19. z-Test: Two Sample for Means analysis tool - z – tests vidējo aritmētisko salīdzināšanai
1. Anova: Single Factor - viena faktora dispersijas analīze
Viena faktora dispersijas analīzi izpilda ar datu analīzes rīku Anova: Single Factor. Izejas dati var būt grupēti kolonās (1.1a. tabula) un rindās (1.1b. tabula). Novērojumu skaits gradācijas klasēs var būt dažāds. Rezultāti būs izvietoti divās tabulas (1.2. un 1.3. tabula). Ietekmes īpatsvaru aprēķina pēc formulām: (2A = QA/Q un (2z = Qz/Q.
1.1a. tabula 1.1b. tabula
Izejas dati grupēti kolonās Izejas dati grupēti rindās
|Nr.p.k. |A1 |A2 |A3 |A4 |
|Gradācijas |Novērojumu skaits|Klases varianšu summa |Klases vidējā vērtība |Klases dispersija |
|klases |klasē | | | |
|A1 |2 |2 |1 |0 |
|A2 |5 |30 |6 |1 |
|A3 |5 |27 |5,4 |0,3 |
|A4 |5 |12 |2,4 |0,8 |
1.3. tabula
ANOVA - Viena faktora dispersijas analīze
|Source of Variation |SS | |df |MS |F |P-value |F crit |
|Izkliede |Noviržu kvadrātu |Ietekmes |Brīvības |Dispersija |Fišera |p –vērtība |F0.05,ν“,νz |
| |summa (Q) |īpatsvars ((2) |pakāpju skaits |((Q) |kritērijs | | |
| | | |(ν) | | | | |
|Between Groups - faktora A|60,07 |0.877 |3 |20,02 |30,98 |0.00 |3,41 |
|Within Groups – atlikuma |8,4 |0.123 |13 |0,64 | | | |
|(z) | | | | | | | |
|Total - kopējā |68,47 | |16 | | | | |
Secinājums. Faktora A ietekmes īpatsvars ir 0.877 jeb 87.7%. Pēc Fišera kritērija pie α = 0.05 A faktora ietekmes īpatsvars ir būtisks, jo F=30.98 > F0.05,3,13 = 3.41. Tas nozīmē, ka starp gradācijas klasēm ir būtiska atšķirība. Nekontrolēto faktoru ietekmes īpatsvars ir 0.123 jeb 12.3%. Faktora A ietekmes īpatsvars ir būtisks un atlikuma brīvības pakāpju skaits (z = 15 >10, tātad dispersijas analīzi var turpināt. Salīdzināt gradācijas klases var ar t – testiem.
1. Anova: Two-Factor With Replication - divu faktoru dispersijas analīze ar atkārtojumiem
Divu faktoru dispersijas analīzi ar atkārtojumiem izpilda ar datu analīzes rīku Anova: Two-Factor With Replication. Novērojumu skaitām gradācijas klasēs (2.1. tabula) jābūt vienādām, pretējā gadījumā tukšās vietās būs aizpildītas ar nullēm. Rezultāti izvietoti divās tabulas (2.2. un 2.3. tabula). Ietekmes īpatsvaru aprēķina pēc formulām: (2A = QA/Q, (2B = QB/Q, (2AB = QAB/Q un (2z = Qz/Q.
2.1. tabula
Izejas dati divu faktoru dispersijas analīzei ar atkārtojumiem
|Gradācijas klases |B1 |B2 |B3 |
|A1 |54 |31 |15 |
| |107 |73 |65 |
| |131 |106 |122 |
| |141 |106 |148 |
| |157 |106 |155 |
|A2 |32 |48 |16 |
| |68 |103 |96 |
| |93 |153 |134 |
| |95 |154 |135 |
| |98 |154 |135 |
|A3 |56 |36 |46 |
| |81 |56 |73 |
| |90 |63 |82 |
| |20 |76 |69 |
| |23 |80 |70 |
Dialogu logā aizpildīt:
Input Range: - iezīmēt gradācijas klases ar virsrakstiem;
Rows per sample: - atkārtojumu skaits (mūsu gadījumā 5);
Alpha: - izvēlēties būtiskuma līmeni 0.05;
Output Range: iezīmēt augšējo kreiso rūtiņu rezultāta apgabalam.
2.2. tabula
Divu faktoru dispersijas analīze ar atkārtojumiem.
Gradācijas klašu statistiskie rādītāji
Anova: Two-Factor With Replication.
|SUMMARY |B1 |B2 |B3 |Total |
|A1 | | | | |
|Count |5 |5 |5 |15 |
|Sum |590 |422 |505 |1517 |
|Average |118 |84,4 |101 |101,13 |
|Variance |1609 |1095,3 |3564,5 |1992,69 |
|A2 | | | | |
|Count |5 |5 |5 |15 |
|Sum |386 |612 |516 |1514 |
|Average |77,2 |122,4 |103,2 |100,93 |
|Variance |781,7 |2211,3 |2656,7 |1981,78 |
| A3 | | | | |
|Count |5 |5 |5 |15 |
|Sum |270 |311 |340 |921 |
|Average |54 |62,2 |68 |61,4 |
|Variance |1036,5 |308,2 |177,5 |470,25 |
| Total | | | | |
|Count |15 |15 |15 | |
|Sum |1246 |1345 |1361 | |
|Average |83,06 |89,66 |90,73 | |
|Variance |1729,06 |1694,81 |2105,92 | |
2.3. tabula
Divu faktoru dispersijas analīze ar atkārtojumiem
ANOVA
|Source of Variation |SS | |df |MS |F |P-value |F crit |
|Izkliede |Q |(2 |ν |(Q |F | |F0.05,νι,νz |
|Sample– faktora A |15708,31 |0,202 |2 |7854,16 |5,26 |0,01 |3,26 |
|Columns – faktora B |517,38 |0,007 |2 |258,69 |0,17 |0,84 |3,26 |
|Interaction- faktora AB mijiedarbības |7946,09 |0,102 |4 |1986,52 |1,33 |0,28 |2,63 |
|Within – atlikuma (z) |53762,80 |0,690 |36 |1493,41 | | | |
|Total – kopējā |77934,58 | |44 | | | | |
Secinājums. Faktora A ietekmes īpatsvars ir 0.202 jeb 20.2%, faktora B – 0.7%, faktora A un B mijiedarbības – 10.2% un atlikuma – 69.0%. Pēc Fišera kritērija pie α = 0.05 tikai A faktora ietekmes īpatsvars ir būtisks, jo F=5.26 > F0.05,2,36 = 3.26. Tas nozīmē, ka starp gradācijas klasēm ir būtiska atšķirība. Nekontrolēto faktoru ietekmes īpatsvars ir 69.0%. Faktora A ietekmes īpatsvars ir būtisks un atlikuma brīvības pakāpju skaits (z = 36 >10, tātad dispersijas analīzi var turpināt. Salīdzināt gradācijas klases var ar t – testiem.
2. Anova: Two-Factor Without Replication - divu faktoru dispersijas analīze bez atkārtojumiem
Divu faktoru dispersijas analīzi bez atkārtojumiem izpilda ar datu analīzes rīku Anova: Two-Factor Without Replication. Novērojumu skaitām gradācijās klasēs jābūt vienādām (3.1. tabula), pretējā gadījumā sekos paziņojums: Anova: Two – Factor Without Replication – Input range contains non – numeric data. Rezultāti izvietoti divās tabulas (3.2. un 3.3. tabula). Ietekmes īpatsvaru aprēķina pēc formulām: (2A = QA/Q, (2B = QB/Q, (2AB = QAB/Q un (2z = Qz/Q.
3.1. tabula
Izejas dati divu faktoru dispersijas analīzei bez atkārtojumiem
|Gradācijas klases |B1 |B2 |B3 |B4 |
|A1 |21,4 |20,9 |19,6 |17,6 |
|A2 |12 |13,6 |13 |13,3 |
|A3 |13,5 |14 |12,9 |12,4 |
|A4 |12,8 |14,1 |14,2 |12 |
Dialogu logā aizpildām:
Input Range: - iezīmēt gradācijas klases ar virsrakstiem;
Labels - ievilkt kāsīti priekš virsrakstiem rezultātos;
Alpha: - izvēlēties būtiskuma līmeni 0.05;
Output Range: iezīmēt augšējo kreiso rūtiņu rezultāta apgabalam.
3.2. tabula
Divu faktoru dispersijas analīze bez atkārtojumiem.
Gradācijas klašu statistiskie rādītāji
Anova: Two-Factor Without Replication
|SUMMARY |Count |Sum |Average |Variance |
|Gradācijas klases|Novērojumu skaits |Klases varianšu summa |Klases vidējā vērtība |Klases dispersija |
| |klasē | | | |
|A1 |4 |79,5 |19,875 |2,875 |
|A2 |4 |51,9 |12,975 |0,482 |
|A3 |4 |52,8 |13,2 |0,486 |
|A4 |4 |53,1 |13,275 |1,129 |
|B1 |4 |59,7 |14,925 |19,009 |
|B2 |4 |62,6 |15,65 |12,296 |
|B3 |4 |59,7 |14,925 |10,062 |
|B4 |4 |55,3 |13,825 |6,629 |
3.3. tabula
Divfaktoru dispersiju analīze bez atkārtojumiem.
ANOVA
|Source of Variation |SS |df |MS |F |P-value |F crit |
|Izkliedes avots |Q |ν |(Q |F | |F0.05,νι,νz |
|Rows – izkliedė pa rindām |135,87 |3 |45,29 |50,20 |0,00 |3,86 |
|Columns – izkliede pa ailēm |6,80 |3 |2,27 |2,51 |0,12 |3,86 |
|Error – kļūdas izkliede |8,12 |9 |0,90 | | | |
|Total – kopējā izkliede |150,79 |15 | | | | |
4. Correlation – korelācijas koeficients
Sakarības ciešumu starp pazīmēm ar Pīrsona korelācijas koeficientu aprēķina ar datu analīzes rīku Correlation. Izejas dati var būt grupēti kolonās (4.1. tabula) un rindās. Rezultāti būs izvietoti vienā tabulā (4.2. tabula). Korelācijas koeficients ir būtisks, ja r > r α,ν. Korelācijas koeficienta kritisko vērtību var noteikt ar 4.3. tabulas palīdzību.
4.1. tabula
Izejas dati korelācijas un kovariācijas koeficientu aprēķiniem
|Atkārtojumi |X1 |X2 |X3 |X4 |
|1 |0,92 |44,58 |12,96 |5,00 |
|2 |1,83 |26,00 |4,83 |5,67 |
|3 |2,67 |17,25 |10,50 |7,17 |
|4 |2,92 |17,00 |1,75 |1,83 |
|5 |6,67 |35,00 |5,67 |7,67 |
|6 |10,00 |24,33 |10,25 |2,00 |
|7 |1,42 |30,33 |3,88 |2,92 |
|8 |12,00 |6,25 |7,72 |4,08 |
|9 |1,00 |4,50 |10,25 |9,75 |
|10 |3,00 |15,50 |12,33 |13,58 |
|11 |3,75 |3,08 |2,25 |22,67 |
|12 |1,00 |11,92 |23,50 |8,92 |
Dialogu logā aizpildīt:
Input Range: - iezīmēt paraugkopas ar virsrakstiem;
Grouped By:- izvēlēties, ja paraugkopas izvietotas kolonās - Columns, ja rindas - Row;
Labels in First Row - ievilkt kāsīti, ja pirmajā rindā ir paraugkopu virsraksti;
Output Range: iezīmēt augšējo kreiso rūtiņu rezultāta apgabalam.
2. tabula
Korelācijas koeficienti
Correlation
| |X1 |X2 |X3 |X4 |
|X1 |1 | | | |
|X2 |-0,141 |1 | | |
|X3 |-0,183 |-0,033 |1 | |
|X4 |-0,212 |-0,490 |0,001 |1 |
Secinājums. Starp pazīmēm nav būtiskas korelācijas, jo r < r 0.05,12 = 0.576
4.3. tabula
Korelācijas koeficientu kritiskās vērtības r(,n (Liepa, 1974)
|n |α |n |α |n |α |
| |0.05 |0.01 | |0.05 |0.01 | |0.05 |0.01 |
|4 |0.950 |0.990 |19 |0.456 |0.575 |50 |0.277 |0.364 |
|5 |0.878 |0.959 |20 |0.444 |0.561 |60 |0.253 |0.333 |
|6 |0.811 |0.917 |21 |0.433 |0.549 |70 |0.234 |0.308 |
|7 |0.754 |0.874 |22 |0.423 |0.537 |80 |0.219 |0.288 |
|8 |0.707 |0.834 |23 |0.413 |0.536 |90 |0.206 |0.272 |
|9 |0.666 |0.798 |24 |0.404 |0.515 |100 |0.196 |0.258 |
|10 |0.632 |0.765 |25 |0.396 |0.505 |125 |0.175 |0.230 |
|11 |0.602 |0.735 |26 |0.388 |0.496 |150 |0.160 |0.210 |
|12 |0.576 |0.708 |27 |0.381 |0.487 |200 |0.138 |0.182 |
|13 |0.553 |0.684 |28 |0.374 |0.478 |250 |0.124 |0.163 |
|14 |0.532 |0.661 |29 |0.367 |0.470 |300 |0.113 |0.148 |
|15 |0.514 |0.641 |30 |0.361 |0.463 |400 |0.098 |0.128 |
|16 |0.497 |0.623 |35 |0.332 |0.435 |500 |0.088 |0.115 |
|17 |0.482 |0.606 |40 |0.310 |0.407 |1000 |0.062 |0.081 |
|18 |0.468 |0.590 |45 |0.292 |0.384 | | | |
5. Covariance - kovariācijas koeficients
Kovariācijas koeficientus aprēķina ar datu analīzes rīku Covariance. Izejas dati var būt grupēti kolonās (4.1. tabula) un rindās. Rezultāti būs izvietoti vienā tabulā (5.1. tabula).
Dialogu logā aizpildīt:
Input Range: - iezīmēt paraugkopas ar virsrakstiem;
Grouped By:- izvēlēties, ja paraugkopas izvietotas kolonnas -Columns, ja rindas - Row;
Labels in First Row - ievilkt kāsīti, ja pirmajā rindā ir paraugkopu virsraksti;
Output Range: iezīmēt augšējo kreiso rūtiņu rezultāta apgabalam.
5.1. tabula
Covariance
Kovariācjas koeficienti
| |X1 |X2 |X3 |X4 |
|X1 |12,50 | | | |
|X2 |-6,12 |150,59 | | |
|X3 |-3,73 |-2,35 |33,04 | |
|X4 |-4,21 |-33,84 |0,02 |31,56 |
6. Descriptive Statistics – statistiskie rādītāji
Ar datu analīzes rīku Descriptive Statistics vienlaicīgi aprēķina vairākus statistiskus rādītājus. Pazīmju un novērojumu skaitām ierobežojumu nav. Izejas dati var būt grupēti kolonās (6.1. tabula) un rindās. Rezultāti būs izvietoti vienā tabulā (6.2. tabula). Ja seko paziņojums #N/A – rezultāts nevar būt.
6.1. tabula
Izejas dati statistiskiem rādītājiem
|Nr.p.k. |X1 |X2 |
|1 |59,7 |79,5 |
|2 |62,6 |51,9 |
|3 |59,7 |52,8 |
|4 |55,3 |53,1 |
|5 |56,4 | |
|6 |61,5 | |
Dialogu logā aizpildīt:
Input Range: - iezīmēt paraugkopas ar virsrakstiem;
Grouped By: - izvēlēties, ja paraugkopas izvietotas kolonās - Columns, ja rindās - Row;;
Labels in First Row - ievilkt kāsīti, tad rezultātiem būs paraugkopas virsraksti;
Output Range:- iezīmēt augšējo kreiso rūtiņu rezultāta apgabalam;
Summary statitics - ievilkt kāsīti, lai aprēķinātu statistiskos rādītājus;
Confidence Level for Mean: izvēlēties ticamības līmeni P (95%).
6.1. tabula
Statistiskie rādītāji
|Rādītāji | |X1 |X2 |
|Vidējais aritmētiskais |Mean |59,20 |59,33 |
|Vidējā aritmētiskā reprezentācijas rādītājs |Standard Error |1,16 |6,73 |
|Mediāna |Median |59,70 |52,95 |
|Moda |Mode |59,70 |#N/A |
|Standartnovirze |Standard Deviation |2,84 |13,46 |
|Dispersija |Sample Variance |8,08 |181,16 |
|Ekscesa rādītājs |Kurtosis |-1,38 |3,97 |
|Asimetrijas rādītājs |Skewness |-0,39 |1,99 |
|Izkliedes intervāls |Range |7,30 |27,60 |
|Mazākā vērtība |Minimum |55,30 |51,90 |
|Lielākā vērtība |Maximum |62,60 |79,50 |
|Varianšu summa |Sum |355,20 |237,30 |
|Paraugkopas apjoms |Count |6,00 |4,00 |
|Ticamības intervāls (t α,ν, s xvid.) |Confidence Level(95,0%) |( 2,98 |( 21,42 |
7. Exponential Smoothing - eksponenciāla izlīdzināšana
Empīrisko datu eksponenciālu izlīdzināšanu izpilda ar datu analīzes rīku Exponential Smoothing. 7.1. tabulā doti dati un eksponenciālās izlīdzināšanas rezultāti pie α = 0.05 un α = 0.9. Eksponenciālās izlīdzināšanas rezultāti redzami 7.1. attēlā. Ieraksts #N/A nozīme, ka rezultāts nevar būt.
Dialogu logā aizpildīt:
Input Range: - iezīmēt datu apgabalu;
Damping factor: - eksponenciālās nogludināšanas koeficients, ierakstīt α vērtību, 0 ................
................
In order to avoid copyright disputes, this page is only a partial summary.
To fulfill the demand for quickly locating and searching documents.
It is intelligent file search solution for home and business.