analiza componentelor principale - sas

22
Ministerul Educaţiei al Republicii Moldova Universitatea de Stat din Moldova Facultatea de Matematică şi Informatică Catedra Informatică şi Optimizare Discretă A efectuat:Luchian Eugenia Grupa MA1 A verificat: Dr.conferentiar: A.Poştaru

Upload: ilie-oxani

Post on 18-Jul-2016

83 views

Category:

Documents


6 download

DESCRIPTION

Analiza

TRANSCRIPT

Page 1: Analiza Componentelor Principale - SAS

Ministerul Educaţiei al Republicii MoldovaUniversitatea de Stat din Moldova

Facultatea de Matematică şi InformaticăCatedra Informatică şi Optimizare Discretă

A efectuat:Luchian Eugenia Grupa MA1

A verificat:

Dr.conferentiar: A.Poștaru

Chişinău,2013

Page 2: Analiza Componentelor Principale - SAS

Scopul: Determinarea trasaturilor masinilor de lux de catre un agent de vanzari independent, caredetermina cumparatorul.

Sursa Datelor: Datele au fost luate de pe urmatoarele siteuri: http://www.autosaga.ro, http://www.123auto.ro/, http://www.autolatest.ro/,precum si de pe paginile oficiale ale producatorilor diferitelor marci de masini prezente in proiect.

Figura 1 este formata din 30 de linii ce contin 30 de modele de automobile si 10 coloane ce cuprind diverse trasaturi ale acestora care vor evidentia modelul cel mai compatibil pentru clientul agentului de vanzari. Cele 10 Trasaturi sunt prezentate in figura 1..

FIGURA 1.

FIGURA 2.- sunt prezentate cele 30 de modele de automobile precum si caracteristicile acestora.

Model\Trasat. V1 V2 V3 V4 V5 V6 V7 V8 V9 V10Aston martin DB9 175 1710 85 300 4.9 17.8 421 5935 450 125000Audi R8 100 1560 75 301 4.6 14.6 349 4163 420 88500Bentely Continental FLYNG SPUR 475 2475 90 312 5.2 17.1 410 5998 560 146000BMW S5 2010 550 i 520 1805 70 250 5 10.4 243 4395 407 95000CADILLAC- XLR-V 125 1654 69 250 4.7 14.9 354 4371 450 69000Corvette 2008 Z06 634 1418 68 320 3.9 14.7 350 7008 512 74000Citroen C6 3.0HDI 488 1816 72 235 8.5 7.4 270 2992 240 45000 Ferrari F430 Spider 220 1595 95 311 4.1 18.3 420 4308 490 165000Ferrari 590 Fiorano 320 1765 105 330 3.7 17.9 490 5999 620 211000

1 Volum Portbagaj (litri) V1

2 Greutate(kg) V2

3 Capacitate rezervor V3

4 Viteza maxima (km/h) V4

5 0-100 km/h(sec) V5

6 Consum mediu)l/100km) V6

7 Emisii (g CO2/km) V7

8 Capacitate (cmc) V8

9 Putere(CP) V9

10 Pret fara taxe incluse (Euro) V10

Page 3: Analiza Componentelor Principale - SAS

Honda Legend 452 1938 73 250 7.1 11.6 282 3664 295 50000Infiniti FX 410 2195 90 250 5.8 13.1 298 5026 390 64000Infiniti G Coupe 37s AT 275 1794 80 250 5.9 10.5 265 3696 320 49000Jaguar XF V8 500 1855 70 250 5.7 11.1 264 5000 385 58000Jaguar XKR 330 1828 71 250 4.8 12.3 301 5000 510 89000Lamborhini Gallardo 110 1634 90 325 3.7 14.7 380 5204 560 148000Range Rover 3.6 TDV 535 3175 105 200 9.2 11.1 300 3628 271 88500Lexus IS-F V8 378 2120 64 270 4.8 11.4 256 4969 423 62000Lexus LS-600H Executive 330 2730 84 250 6.3 9.3 219 4969 394 93000Masserati Grancabrio 173 2055 75 280 5.3 15.2 345 4691 440 113000Masserati Quattroporte Sport GT 450 2065 90 285 5.1 15.7 370 4691 440 115000Mercedes C Coupe AMG 63 450 1730 59 250 4.5 12 365 6208 450 61000Mercedes SLK 335 1540 60 250 5.6 7.1 355 3498 306 45000Mercedes ML 500 2310 95 250 5 16.5 410 6208 375 89500Mitshubishi Lancer 415 1675 60 242 6.3 10.5 280 1998 295 44000Porsche Cayenne 580 2315 85 242 6.5 8.2 198 2995 333 70000Porsche 911 Carrera 135 1500 64 302 4.7 10.6 194 3800 385 86000Toyota Land Cruiser 701 2715 93 210 8.2 10.2 270 4461 286 68000Volswaken Toureg A8 Hybrid 433 2315 85 240 6.5 8.2 310 2995 333 55000Volvo V8 480 2150 70 250 6.5 12.1 290 4414 315 43000Alfa Romeo Spider 235 1740 70 244 7.2 12.2 320 3195 260 42000

Page 4: Analiza Componentelor Principale - SAS

I. Analiza componentelor principaleD e f i n i t i e 1 : Analiza componentelor principale este o metoda de analiza multidimensionala care are ca scop determinarea unor noi variabile, numite componente principale si exprimate sub forma combinai i l o r l i n i a r e d e v a r i a b i l e l e o r i g i n a l e astfel încât aceste variabile noi sa fie caracterizate de o variabilitate maxima.

D e f i n i t i e 2 :Componentele principale sunt variabile vectoriale abstracte, definite sub forma unor combinari l i n i a r e d e variabilele originale si care au urmatoarele doua proprieti fundamentale:

• sunt necorelate doua c â t e d o u a si suma patratelor coeficienilor care definesc combinatia liniara ce corespunde unei componente principale este egala cu unitatea;

• prima component principala este o combinatie liniara normalizata a car e i v a r i a n t e este maxima,cea de-a doua c o m p o n e n t a principal este o combinai e l i n i a r a   necorelata cu prima componenta principala si care are o varianta cât mai mare posibil, î n s a mai mica decât cea a primei componente etc.

Statistici descriptiveFigura 3- In figura urmatoare sunt calculate,media,disperisia,variant,minimul,maximul si totalul pentru fiecare variabila.

Variable Mean Std Dev Variance N Minimum Maximum Sum ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ V1 375.4666667 161.8295684 26188.81 30 100.0000000 701.0000000 11264.00 V2 1972.57 413.9949761 171391.84 30 1418.00 3175.00 59177.00 V3 78.7333333 13.0962836 171.5126437 30 59.0000000 105.0000000 2362.00 V4 264.9666667 33.5738849 1127.21 30 200.0000000 330.0000000 7949.00 V5 5.6433333 1.3848150 1.9177126 30 3.7000000 9.2000000 169.3000000 V6 12.5566667 3.1941415 10.2025402 30 7.1000000 18.3000000 376.7000000 V7 319.3000000 70.8554381 5020.49 30 194.0000000 490.0000000 9579.00 V8 4515.97 1159.76 1345041.69 30 1998.00 7008.00 135479.00 V9 397.1666667 97.0812256 9424.76 30 240.0000000 620.0000000 11915.00 V10 85050.00 40919.04 1674368103 30 42000.00 211000.00 2551500.00 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

MEDIA

Pentru media variabilelor avem urmatoarele valori:

1.Volumul portbagajului are in medie 375,5 litri;

2.O masina cantareste in medie 1972 de kilograme;

3.In medie,capacitatea rezervorului este de 78,73 de litri;

4.Viteza maxima medie a masinilor studiate este de aproximativ 265 km/ora;

Page 5: Analiza Componentelor Principale - SAS

5.Timpul mediu de atingere a 100km/h este de 5,64 secunde;

6.In medie ,consumul mediu a celor 30 de marci de masini este de 12,56 litri/100km;

7.Cele 30 de masini emana in atmosfera,in medie, emisii(g C02/km) 319 grame CO2 per kilometru;

8.Automobilele au in medie Cpacitatea motorului de 4515 centimetricubi;

9.Puterea medie a tuturor masinilor prezentate este de 397,16 CP;

10.Pretul mediu a automobilelor este de 85050 EURO.

ABATEREA STANDARD SI DISPERSIA

A 3-a si a 4-a coloana prezinta abaterea standard(standard deviation) si dispersia(variance) caracteristiciilor elementelor.

MINIMUL SI MAXIMUL

In a 6-a si a 7-a coloana sunt prezentate minimul si maximul fiecarei caracteristici.astfel pentru prima variabila(volumul portbagajului) avem un minim de 100 de litri si un maxim de 701 litri,pentru a 2-a variabila(greutate) avem un minim de 1418 kg si un maxim de 3175 kg,etc.

SUMA

In ultima coloana este prezenta valoarea cumulata a fiecarei caracteristici a celor 30 de masini.Spre exemplu Pretul cumulat a masinilor este P(M1)+P(M2)+........+P(M30)= 2551500 EURO.

Unde Mi=modelul de autombil,P(Mi)=pretul masinii i.Se procedeaza in mod analog pentru celelalte variabile.

Standardizarea datelor Deoarece datele au marimi si unitati de masura diferite se va realiza analiza componentelor principale pe date standardizate.

Definitie3:

Operatia de standardizare a valorilor unei variabile consta in substituirea valorilor fiecarei operatii cuo noua valoare reprezentand raportul dintre valoarea centrata a respectivei operatii si abaterea standard a respectivei variabile:

s c __Xti=Xti/Si=(Xti-Xi)/Si

Page 6: Analiza Componentelor Principale - SAS

__Unde Xi=media celei de a –i a varabila,iar Si =abaterea standard a variabilei Xiunde reprezinta media celei de-a i-a variabile, iar reprezinta abaterea standard a variabilei . Figura 4 VALORI STANDARDIZATE

V1s V2S V3S V4S V5S V6S V7S V8S V9S V10SAston martin DB9 -1.23875 -0.63423 0.478507 1.04347 -0.53677 1.641547 1.435317 1.223558 0.544218 0.976318Audi R8 -1.7022 -0.99655 -0.28507 1.073255 -0.75341 0.639713 0.419163 -0.30434 0.235198 0.084313Bentely Continental FLYNG SPUR 0.61505 1.213622 0.860295 1.40089 -0.32014 1.422396 1.280071 1.27788 1.67729 1.489527BMW S5 2010 550 i 0.893121 -0.40476 -0.66686 -0.44578 -0.46456 -0.67519 -1.07684 -0.1043 0.10129 0.243163CADILLAC- XLR-V -1.54772 -0.76949 -0.74321 -0.44578 -0.6812 0.733635 0.48973 -0.125 0.544218 -0.39224Corvette 2008 Z06 1.597565 -1.33955 -0.81957 1.639171 -1.25889 0.67102 0.433277 2.14875 1.182858 -0.27005Citroen C6 3.0HDI 0.695382 -0.37818 -0.51414 -0.89256 2.062851 -1.61441 -0.69578 -1.31404 -1.61892 -0.97876 Ferrari F430 Spider -0.96068 -0.91201 1.242083 1.371105 -1.11447 1.798084 1.421204 -0.17932 0.956244 1.953858Ferrari 590 Fiorano -0.34275 -0.50137 2.005658 1.937021 -1.40332 1.672854 2.409131 1.278742 2.295329 3.078029Honda Legend 0.472926 -0.0835 -0.43778 -0.44578 1.051885 -0.29951 -0.52642 -0.73461 -1.05238 -0.85657Infiniti FX 0.213393 0.537285 0.860295 -0.44578 0.113132 0.170103 -0.30061 0.439775 -0.07382 -0.51443Infiniti G Coupe 37s AT -0.62082 -0.43133 0.09672 -0.44578 0.185344 -0.64389 -0.76635 -0.70701 -0.79487 -0.88101Jaguar XF V8 0.769534 -0.28398 -0.66686 -0.44578 0.04092 -0.45604 -0.78046 0.417357 -0.12532 -0.66106Jaguar XKR -0.28095 -0.3492 -0.5905 -0.44578 -0.60899 -0.08036 -0.25827 0.417357 1.162257 0.096532Lamborhini Gallardo -1.64041 -0.8178 0.860295 1.788096 -1.40332 0.67102 0.856674 0.593255 1.67729 1.538404Range Rover 3.6 TDV 0.985811 2.904464 2.005658 -1.93504 2.568333 -0.45604 -0.27239 -0.76565 -1.2996 0.084313Lexus IS-F V8 0.015654 0.356123 -1.125 0.149918 -0.60899 -0.36212 -0.89337 0.390627 0.2661 -0.56331Lexus LS-600H Executive -0.28095 1.829571 0.40215 -0.44578 0.474191 -1.01957 -1.41556 0.390627 -0.03262 0.194286Masserati Grancabrio -1.25111 0.199117 -0.28507 0.447769 -0.24793 0.827557 0.36271 0.150922 0.441211 0.683056Masserati Quattroporte Sport GT 0.460567 0.223272 0.860295 0.596694 -0.39235 0.984093 0.715541 0.150922 0.441211 0.731933Mercedes C Coupe AMG 63 0.460567 -0.58592 -1.50679 -0.44578 -0.82562 -0.17428 0.644975 1.458952 0.544218 -0.58775Mercedes SLK -0.25006 -1.04486 -1.43043 -0.44578 -0.03129 -1.70834 0.503843 -0.87774 -0.93908 -0.97876Mercedes ML 0.769534 0.815066 1.242083 -0.44578 -0.46456 1.234552 1.280071 1.458952 -0.22833 0.108751Mitshubishi Lancer 0.24429 -0.71877 -1.43043 -0.68406 0.474191 -0.64389 -0.55465 -2.17111 -1.05238 -1.0032Porsche Cayenne 1.263881 0.827144 0.478507 -0.68406 0.618615 -1.36396 -1.71194 -1.31145 -0.66096 -0.3678Porsche 911 Carrera -1.48593 -1.14148 -1.125 1.10304 -0.6812 -0.61258 -1.76839 -0.61734 -0.12532 0.023217Toyota Land 2.011581 1.793339 1.089368 -1.63719 1.846215 -0.73781 -0.69578 -0.04739 -1.14509 -0.41668

Page 7: Analiza Componentelor Principale - SAS

CruiserVolswaken Toureg A8 Hybrid 0.355518 0.827144 0.478507 -0.74363 0.618615 -1.36396 -0.13125 -1.31145 -0.66096 -0.73438Volvo V8 0.645947 0.428588 -0.66686 -0.44578 0.618615 -0.14297 -0.41352 -0.08792 -0.84637 -1.02764Alfa Romeo Spider -0.86799 -0.56176 -0.66686 -0.62449 1.124097 -0.11166 0.009879 -1.139 -1.41291 -1.05208

1.2. Matricea de corelatiePentru a vedea daca indicatorii calculati sunt independenti sau nu,

vom analiza matriceacoeficientilor de corelatie. Matricea de corelatii este simetrica si descrie legaturile dintre variabilele initiale si determina componentele pricipale

Figura 5 -MATRICEA DE CORELATIE

V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V1 1.0000 0.4940 0.1118 -.4692 0.4597 -.3401 -.2560 0.0584 -.3104 -.3006 V2 0.4940 1.0000 0.5518 -.5275 0.6137 -.1884 -.2268 -.0425 -.2843 -.0301 V3 0.1118 0.5518 1.0000 0.1205 0.1052 0.4258 0.4014 0.2158 0.2354 0.6305 V4 -.4692 -.5275 0.1205 1.0000 -.8036 0.6889 0.5586 0.5180 0.8064 0.7140 V5 0.4597 0.6137 0.1052 -.8036 1.0000 -.6004 -.4879 -.5952 -.8427 -.5363 V6 -.3401 -.1884 0.4258 0.6889 -.6004 1.0000 0.7969 0.6404 0.7196 0.7350 V7 -.2560 -.2268 0.4014 0.5586 -.4879 0.7969 1.0000 0.5333 0.6039 0.6526 V8 0.0584 -.0425 0.2158 0.5180 -.5952 0.6404 0.5333 1.0000 0.7297 0.4887 V9 -.3104 -.2843 0.2354 0.8064 -.8427 0.7196 0.6039 0.7297 1.0000 0.7939 V10 -.3006 -.0301 0.6305 0.7140 -.5363 0.7350 0.6526 0.4887 0.7939 1.0000

Se identifica in matrice coeficientii de corelatie mari.Se observa ca intre V6(consum mediu ) si V4(viteza maxima) este o corelatie de 0,689 ,intre V10 (pret) si V4(viteza maxima) o corelatie de 0,714,etc. Figura 6 -Matricea de covarianta

Matricea de covariatieVARIABLE V1 V2 V3 V4 V5V1 26189 33096 237 -2549 103V2 33096 171392 2992 -7332 352V3 237 2992 172 53 2V4 -2549 -7332 53 1127 -37V5 103 352 2 -37 2V6 -176 -249 18 74 -3V7 -2935 -6654 372 1329 -48V8 10962 -20385 3277 20171 -956V9 -4877 -11424 299 2628 -113V10 -1990748 -510116 337876 980898 -30392

Page 8: Analiza Componentelor Principale - SAS

Covariance Matrix V6 V7 V8 V9 V10

V1 -176 -2935 10962 -4877 -1990748 V2 -249 -6654 -20385 -11424 -510116 V3 18 372 3277 299 337876 V4 74 1329 20171 2628 980898 V5 -3 -48 -956 -113 -30392 V6 10 180 2372 223 96068 V7 180 5020 43821 4154 1892053 V8 2372 43821 1345042 82155 23193329 V9 223 4154 82155 9425 3153595 V10 96068 1892053 23193329 3153595 1674368103

1.3. Vectorii si valorile propriiCum componentele principale sunt combinatii liniare de variabile

originale, le putem privi sub forma unui vector de forma: Pi=a1i * v1 + a2 i * v2+…..+ani*Vn, unde v1,v2,…..Vn sunt

variabilele originale si aji ponderile din tabelul de mai jos.

Figura 7 Vectorii proprii

Eigenvectors Prin1 Prin2 Prin3 Prin4 Prin5 V1 -.193339 0.340503 0.637847 0.104735 0.608714 V2 -.167738 0.573361 0.009506 -.261128 -.423936 V3 0.132181 0.583524 -.320431 -.090853 0.157228 V4 0.383043 -.148526 -.034305 -.224424 0.332794 V5 -.363554 0.266949 -.199576 0.202087 0.037712 V6 0.378145 0.138795 -.072807 0.341285 -.209042 V7 0.337032 0.140834 -.101526 0.713608 0.100623 V8 0.304157 0.153882 0.588404 0.048361 -.431894 V9 0.398117 0.011610 0.185598 -.324740 -.021208 V10 0.361284 0.242032 -.230441 -.296438 0.268413

Eigenvectors Prin6 Prin7 Prin8 Prin9 Prin10 V1 0.057286 -.198037 0.113331 -.042080 -.034808 V2 -.059257 0.067641 0.382176 -.463045 -.162988 V3 0.056050 -.108210 -.657934 -.072024 0.231216 V4 0.514120 0.456012 0.101447 -.430084 0.037321 V5 0.263369 0.467798 0.279873 0.435079 0.398314 V6 0.541701 -.540364 0.275318 0.097712 0.038553 V7 -.436598 0.265173 0.104482 -.253458 -.028526 V8 0.126343 0.375736 -.320365 0.275278 -.114746

Page 9: Analiza Componentelor Principale - SAS

V9 -.356954 -.100248 0.262744 0.078428 0.698831 V10 -.170134 0.064633 0.247418 0.498646 -.504861 Prima componenta principala poate fi scrisa ca o combinatie liniara dintre variabilele originale:

Prin 1= -.193339 *V1 +-.167738 *V2 + 0.132181 *V3 + 0.383043 *V4 + -.363554 *V5 + 0.378145 *V6

+-.436598 *V7 + 0.126343 *V8 + -.356954 *V9 + -.170134 *V10.

Se procedeaza in mod similar pentru celalte componente principale.

Calculam valorile proprii ce ne arata cantitatea de informatie extrasa de fiecare componentaprincipala: k k

Var(Ck)=a unde Ck=componenta principal de ordin k iar a =valoarea proprie corespunzatoare acesteia

Figura 8 Valori proprii

Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative 1 5.36659449 3.22045675 0.5367 0.5367 2 2.14613774 1.16182919 0.2146 0.7513 3 0.98430855 0.43244130 0.0984 0.8497 4 0.55186725 0.18378003 0.0552 0.9049 5 0.36808722 0.17537388 0.0368 0.9417 6 0.19271333 0.06091768 0.0193 0.9610 7 0.13179566 0.00288082 0.0132 0.9742 8 0.12891483 0.04345539 0.0129 0.9870 9 0.08545945 0.04133796 0.0085 0.9956 10 0.04412149 0.0044 1.0000

In figura 10 prima coloana reprezinta valorile proprii ce exprima varianta explicata

prin fiecare noua componenta principala si corelatia dintre noua variabila si variabilele vechi.

A doua coloana reprezinta diferenta dintre 2 componente consecutive. In a treia coloana a doua a tabelului este exprimat procentul din inertia

totala a norului de puncte retinut pe fiecare axa. In a patra coloana este exprimat procentul cumulative al componente

dinainte.Deoarece primele 2 valori proprii sunt mai mari decat 1 (Criteriul lui Kaiser), putem spune ca avem 2 componente principale care sintetizeaza din punct de vedere informational restul de 8 variabile originale.Astfel prin intermediul primei componente principale se asigura conservarea a 53,67% din varianta totala .

Page 10: Analiza Componentelor Principale - SAS

Varianta celei de-a doua componente principale este egala cu valoarea proprie 2.14613774 si retine 21,46% din varianta totala iar cumulativ cu prima componenta retine 75,13% din varianta totala.

Corelatia Pearson:

Numele complet al acestui coeficient este "coeficientul de corelaţie produs-moment

Pearson". Acest coeficient poate fi calculat cu ajutorul relaţiei (A). Valoarea coeficientului de

corelaţie Pearson poate varia între +1 şi -1. O valoare apropiată de +1 indică o corelaţie pozitivă

puternică; o valoare apropiată de -1 ne indică o corelaţie negativă puternică, iar o valoare apropiatăde zero ne indică faptul că între cele două variabile nu există nici o corelaţie.

rxy= [1/n*∑(xi-Mx)(yi-My)]/Sx*Sy (A)

unde - n este mărimea eşantionului format din măsurători pereche (x,y);

- xi reprezintă măsurătorile individuale ale variabilei x;

- yi reprezintă măsurătorile individuale ale variabilei y;

- Mx reprezintă media aritmetică a variabilelor x;

- My reprezintă media aritmetică a variabilelor y;

- Sx reprezintă deviaţia standard pentru valorile x;

- Sy reprezintă deviaţia standard pentru valorile y.

Numărătorul din relaţia (A) se numeşte covarianţă (notată cu Sxy) sau variabilitate pereche.

Covarianţa este o măsură a gradului în care variaţia unei variabile se potriveşte cu variaţia celeilalte variabile.

1.4. Reprezentarea grafica

Pe grafic s-a identificat diferentele semnificative existente intre valorile proprii si s-a trasat o paralela la abscisa deasupra ultimei astfel de diferente, iar numarul de valori proprii aflate in partea superioara dreptei reprezinta numarul de componente principale.

Dupa trasarea dreptei putem afirma pe baza graficului ca primele 2 valori proprii sunt sicomponentele principale si explica o parte din multimea norului de puncte.

Page 11: Analiza Componentelor Principale - SAS

Valorile proprii ale matricei de corelaţie pentru caracteristicile masinilor

Figura A

Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative 1 5.36659449 3.22045675 0.5367 0.5367 2 2.14613774 1.16182919 0.2146 0.7513 3 0.98430855 0.43244130 0.0984 0.8497 4 0.55186725 0.18378003 0.0552 0.9049 5 0.36808722 0.17537388 0.0368 0.9417 6 0.19271333 0.06091768 0.0193 0.9610 7 0.13179566 0.00288082 0.0132 0.9742 8 0.12891483 0.04345539 0.0129 0.9870 9 0.08545945 0.04133796 0.0085 0.9956 10 0.04412149 0.0044 1.0000

Informaţiile privind calitatea ajustării sunt exprimate cu ajutorul valorilor proprii ale matricei corelaţiilor şi a proprietăţilor acestora. Tabelul de mai sus oferă informaţii asupra valorilor proprii ale matricei de corelaţie, cantitatea de informaţie recuperată de fiecare axă factorială şi cantitatea de informaţie cumulată recuperată.

Din output-ul care prezintă valorile proprii ale matricei de corelaţie rezultat din Enterprise Guide (Figura A) se observă că primele 4 valori proprii aduc maximum de informaţie pentru norul de puncte si anume 90,49%,astfel am ales sa lucrez cu 4 componente principale.

Criteriul Pantei:

Figura 12 Grafice ale valorilor proprii Figura 13 Varianta cumulata a componentelor

Page 12: Analiza Componentelor Principale - SAS
Page 13: Analiza Componentelor Principale - SAS

Graficul din figura 13 exprima legatura dintre componentele principale si varianta cumulata pe care acestea o conserva. Prima componenta principala retine 53,67% din varianta totala, a doua componenta principala cumulata cu prima retine 75,13% din varianta totala ,a 3 componenta principala retine 84,97%,iar a patra component principala retine 90,49%.

Figura 14 Grafic Componenta 1 cu Componenta 2

Analizand graficul 14 se oberva ca prima componenta este influentata direct si puternic deV8,V9,V7,V6,V10,V4, V3 si invers de catre variabila V2,V1,V5 iar asupra componenteidoi actioneaza direct variabila V8,V7,V3V2,V1,V5,V6,V9 si invers variabila V4.

Page 14: Analiza Componentelor Principale - SAS
Page 15: Analiza Componentelor Principale - SAS

Se observa ca marcile de masini “6”,”16” sunt indepartate fata de norul de puncte.Modelul “6” are o valoare prea mare pentru cea de-a 3 componenta principal.Modelul “16” are valoarea aproape de 4 pentru cea de-a doua componenta princincipala,si o valoare negativa pentru cea de-a 3 componenta principal,de aceea nu intra in norul de puncte.

Page 16: Analiza Componentelor Principale - SAS

CONCLUZII Analizele comparative prezinta o importanta deosebita deoarece, prin efectuarea sipublicarea constanta a rezultatelor obtinute, au o mare influenta atat asupra consumatorilorcat si a producatorilor, facandu-i pe consumatori mai circumspecti si mai rationali privind procesul de achizitionare a bunurilor. Intr-o cercetare a lumii inconjuratoare ne bazam, de regula, pe existenta unui numarde indivizi distincti ai unei populatii studiate. In legatura cu acesti indivizi (obiecte saucazuri) urmarim una sau mai multe marimi care, credem noi, îi caracterizeaza. Cercetatorul în analiza datelor are ca sarcina sa extraga din acest tabel de date cat maimulta „informatie semnificativa” si s-o prezinte intr-o forma cat mai restransa. Odată acest deziderat realizat, orice decizie viitoare privind comportamentul populatiei studiate poate fi explicata prin argumente stiintifice. Pe baza analizei efectuate asupra ofertei de autoturisme a unui dealer, am putut sa concluzionam care sunt marcile concurente, care sunt cele mai preferate de cumparatori si

Page 17: Analiza Componentelor Principale - SAS

ce caracteristici primeaza la achizitionarea unui autoturism astfel incat dealer-ul auto sa-si formeze un plan de achizitii si vanzari care sa-i aduca un profit cat mai mare.