در بیشتر مسائل عملی مشاهدات بصورت تعداد زیادی متغیرهای همبسته میباشند برای تحلیل اینگونه مشاهدات به دنبال روشهای آماری هستیم که بدون اینکه اطلاعاتی را از دست داده باشیم بعد مسأله را تا حد قابل ملاحظهای کاهش دهیم در حقیقت با کنار گذاشتن متغیرهای با واریانس پایین و توجه به متغیرهای با واریانس بالا میتوانیم به راحتی مسأله را در یک زیر فضایی با بعد کمتر مورد مطالعه قرار دهیم.
بردار تصادفی X را با بردار میانگین و ماتریس کواریانس یک بردار p بعدی در نظر می گیریم.
مولفههای اصلی x عبارتند از ترکیبات خطی استاندارد شده مولفه های x که بر حسب واریانس ها ویژگیهای خاصی دارند.
وزنهایی که در مولفه های اصلی به بردار تصادفی x مربوط میشوند و دقیقاً بردارهای ویژه استاندارد شده ماتریس کواریانس x هستند ریشههای ماتریس مشخصه کواریانس برابر مولفههای اصلی میباشند و بزرگترین ریشه برابر واریانس اولین مولفه اصلی است.
برای X هیچ توزیعی فرض نمیکنیم تنها شرط لازم برای تحلیل مولفههای اصلی این است که متغیرهای اصلی همبستگی معنیداری داشته باشند.
چنانچه مولفههای بردار X هم بعد یا هم واحد نباشند میتوان مقادیر ویژه متناظر با ماتریس همبستگی بردار را بدست آورد بکار بردن ماتریس همبستگی باعث استاندارد شدن متغیرها نسبت به واحد واریانس میگردد/.
بطور کلی اگر بردار X یک بردار تصادفی P متغیر باشد برای بدست آوردن مولفههای اصلی آن چنین عمل میکنیم.
ابتدا مقادیر ویژه مربوط به ماتریس کواریانس یا ماتریس همبستگی P را محاسبه می کنیم I ماتریس P بعدی همانی و یک ماتریس قطری باشد آنگاه اگر مولفه اصلی متناظر با متغیر باشد آنگاه = درصد تغییرات iمین مولفه به کل تغییرات پس از تعیین مقادیر ویژه بردار های ویژه متناظر با هر یک از مقادیر محاسبه میگردد.
مقدار اهمیت k مین متغیر اولیه یعنی را در iمین مولفه اصلی یعنی اندازه میگیرد.
ضریب همبستگی بین مولفههای و متغیر برابر است با واریانس K مین متغیر x است.
نسبت تغییرات مولفه اول به کل تغییرات تحلیل عاملی Factor Analysis تحلیل عاملی شامل هر دو روش تحلیل مولفهها (Component) و تحلیل عاملهای مشترک (Common Factors) میباشد.
کاربردهای اصلی تحلیل عاملی عبارتست از : 1- کاهش تعداد متغیر ها Data Reduction 2- گروه بندی متغیرها Classing Variables در تحلیل مولفه اصلی همه پراکندگی مربوط به یک متغیر در تحلیل بکار برده میشود در صورتیکه در تحلیل فاکتورهای (عاملهای) اصلی ما فقط آن قسمت از پراکندگی متغیر را که با سایر متغیرها مشترک است، بررسی می کنیم.
تحلیل عاملی در حدود صد سال پیش توسط یک روانشناس بنام چارلز اسپیرمن ابداع شد.
او توسط این روش به این نتیجه رسید که در یک زیر جامعهای از انسانها، توانایی ذهنی (mental ability) افراد که بر اساس مهارتهای ریاضی، لغت شناسی مهارتهای شفاهی و کلامی.
مهارتهای هنری و مهارتهای منطقی و استدلالی اندازهگیری میشود، میتواند دقیقاً توسط یک فاکتور اساسی مشترک که هوش عمومی یا بعبارتی General intelligence نامیده میشود، اندازهگیری گردد.
امروز کالج Board testing service توانایی ذهنی افراد را بر اساس سه عامل مهم (توانایی شفاهی، ریاضی و منطقی) اندازهگیری میکند.
بخشی از واریانس یک متغیر خاص که در اشتراک با عاملهای دیگر باشد، نامیده میشود: connunality = میزان اشتراک.
بنابراین هدف با برآورد کردن همین میزان اشتراک است برای هر متغیر.
یعنی بخشی از واریانس که هر متغیر با سایر متغیرها در اشتراک دارد.
تحلیل عاملی روشی است که با کشف ساختار یک مجموعه از متغیرها و کاهش این مجموعه به تعداد کمتری از متغیرهای بنیادیتر که عامل نامیده میشود، سرو کار دارد.
این روش در کارهای اسپیرمن روانشناس انگلیسی ریشه دارد که در سال 1904 اولین مقاله خود را درباره این موضوع در مجله روانشناسی آمریکا چاپ کرد.
از آن زمان به بعد بسیاری از روانشناسان و دستاندرکاران علوم تربیتی علاوه بر ریاضی دانها که به همکاری با آنها پرداختهاند، در گسترش تحلیل عاملی سهم بسزایی داشتهاند.
یکی از روشهای مهم تحلیل عاملی بنام روش مولفه اصلی بوسیله ریاضیدان آماری هتلینگ گسترش یافت.
علاقه او به این موضوع از همکاری وی با پژوهشگران در زمینه علوم تربیتی برانگیخته شد.
مقاله اصلی هتلینگ که در آن این روش شرح داده شده است در سال 1933 در مجله روان شناسی تربیتی منتشر شد.
هدف تحلیل عاملی توصیف و تفسیر همبستگیهای درونی مجموعهای واحد از متغیرهاست تحلیل عاملی از دو راه این هدف را برآورده می کند.
ابتدا مجموعه متغیرهای اصلی را به تعداد کمتری از متغیرها که عامل نامیده میشوند، کاهش میدهد، دوم باید معنای عامل به علت ویژگی های ساختاری که ممکن است در این مجموعه روابط نهفته باشند، روشن شود.
عاملها متغیرهای فرضی هستند که از فرایند تحلیل مجموعهای از متغیرها که از طریق اندازهگیری مستقیم بدست می آیند، استنباط میشوند.
تحلیل عاملهای مشترک در مقابل تحلیل مولفه های اصلی تحلیل عاملی یا تحلیل عاملهای مشترک بعنوان یک روش کلی شامل تحلیل مولفه اصلی میشود.
اگر چه این دو روش هدف یکسانی (کاهش بعد فضای داده ها) را در نظر دارند اما بر حسب فرضیات زیر بنایی از هم کاملاً متفاوتند تحلیل عاملی یا تحلیل عاملهای مشترک بعنوان یک روش کلی شامل تحلیل مولفه اصلی میشود.
اگر چه این دو روش هدف یکسانی (کاهش بعد فضای دادهها) را در نظر دارند اما بر حسب فرضیات زیر بنایی از هم کاملاً متفاوتند.
یک متغیر تنها در مجموعه دادهها دارای واریانسی است که این واریانس تجزیه میشود به واریانس مشترک که توسط سایر متغیرهای مدل شرکت داده میشود و واریانس یگانه (unique) که نسبت به یک متغیر خاص یکتاست.
و شامل مولفه خطا میشود.
تحلیل عاملی مشترک فقط واریانس مشترک متغیرهای مشاهده شده را تحلیل می کند و تحلیل مولفههای اصلی فقط واریانس کلی را در نظر میگیرد و تمایزی بین واریانس یگانه قائل نمیشود.
انتخاب یکی از این دو روش بستگی به چندین معیار دارد اولی اینکه چه چیزی در تحلیل مورد توجه است؟
تحلیل عاملهای مشترک و تحلیل مولفه اصلی هر دو مجموعه متغیرهای اصلی را به مجموعهای با بعد کمتر از متغیرهای مرکب که عامل یا مولفه اصلی خوانده میشوند، کاهش میدهند.
این دو روش در تفسیر متغیرهای مرکب بدست آمده از هم متفاوت عمل میکنند.
در تحلیل عاملی مشترک یک تعداد کمی از فاکتورها استخراج میشوند تا همبستگی بین متغیرهای مشاهدهای را تبیین کنند و اینکه تشخیص دهند ابعاد پنهانی را که باعث این همبستگی شده است.
اما در تحلیل مولفههای اصلی مورد توجه این است که ماکزیمم سهم واریانس موجود در مجموعه دادههای اصلی با حداقل تعداد متغیرهای مرکب (مولفههای اصلی) تعیین شود.
ثانیاً چه فرضیاتی در مورد واریانس مجموعه دادههای اصلی در نظر گرفته میشود؟
اگر متغیرهای مشاهدهای نسبتاً بدون خطا اندازهگیری شوند یا اینکه فرض شود واریانس خطا سهم کوچکی از واریانس کل را در مجموعه دادههای اصلی داشته باشد در اینصورت تحلیل مولفههای اصلی مناسب است.
اما اگر متغیرهای مشاهدهای فقط نمایانگر ساختار پنهانی که باید اندازه گیری شود، باشند یا اگر واریانس خطا یک سهم معنی داری از واریانس کل باشد در اینصورت روش تحلیل عاملهای مشترک پیشنهاد میگردد.
در نرم افزار آماری SPSS برای تحلیل مولفه اصلی برنامهای در نظر گرفته نشده است.
اما در نرم افزار آماری SAS برنامه خاصی برای تحلیل مولفه اصلی در نظر گرفته شده است.
(PROC PRINCOM) در تحلیل مولفه اصلی (PCA) ماتریس همبستگی که قطر اصلی آن با 1 جایگزین شده (1 ها همان واریانس ها هستند.) در تحلیل بکار برده میشود.
در تحلیل عاملهای مشترک (CFA) قطر اصلی ماتریس همبستگی که با ها جایگزین شدهاند، در تحلیل بکار گرفته میشود.
ها همان میزان اشتراک یا communality هستند.
و برابرند با مجموع مجذورات بارهای عاملی مشترک.
بارهای عاملی ضرایب همبستگی معمولی هستند.
= واریانس متغیر i ام میزان اشتراک بخشی از واریانس است که میتوان آن را به عوامل مشترک نسبت داد.
بخشی از واریانس که باقی میماند و نمیتوان آن را به عوامل مشترک نسبت داد، واریانس یگانه (uniqueness) نامیده میشود.
این قسمت از واریانس ناشی از خطای اندازهگیری است.
مثلاً اگر مقدار 85/0 باشد یعنی 85/0 از واریانس متغیرi، ام در اشتراک با متغیرهای دیگر آن مجموعه است.
در حقیقت میزان اشتراک نسبتی از واریانس را نشان میدهد که بین یک متغیر و متغیرهای دیگر در مجموعه مورد نظر مشترک است و برابر است با مجموع مجذورات بارهای عاملی مشترک.
همبستگیهای حاصل از بارهای عاملی بعلت نمونهگیری و یا خطاهای دیگر تا اندازهای با همبستگی های مشاهده شده تفاوت دارد.
تفاوتهای بین همبستگیهای مشاهده شده و حاصل از بارهای عاملی همبستگی های باقیمانده نامیده میشوند.
مقدار همبستگی های باقی مانده اندازه ای را نشان می دهند که بر اساس آن، این عوامل همبستگیهای مشاهده شده را تبیین میکنند.
و یا اینکه نشان میدهند تا چه اندازهای یک مدل خطی برای همبستگیهای مشاهده شده مناسب است.
برای محاسبه مقادیر باید روش استخراج عاملها را معرفی کرد.
اگر این روش Principal Component باشد برآوردهای اولیه از میزان اشتراک ها 1 فرض میشود.
در سایر روش های برآورد عاملها، برآورد برای هر متغیر مجذور همبستگی چندگانه آن متغیر با سایر متغیرهاست.
این ضریب همبستگی را مجذور ضریب همبستگی چند متغیره مینامند.
سادهترین تقریب برای استفاده از بزرگترین ضریب همبستگی از نظر قدر مطلق برای یک متغیر است با سایر متغیرها.
انتخاب بهتری نیز وجود دارد و آن مجذور ضریب همبستگی بین متغیرها و متغیر مورد نظر است.
اجرای طرح با نرم افزار SPSS بعد از یک بررسی تئوریک و ریاضی روشهای تحلیل مولفه اصلی و تحلیل عاملهای مشترک اینک روش تحلیل عاملی را برای بررسی دادهها در نمونه و در جامعه بکار میبندیم.
نکته در خور توجه در اینجا این است که نتایج بدست آمده برای نمونه و برای جامعه کاملاً مشابه است.
نرم افزار بکار گرفته شده در این تحلیل SPSS نسخه 9 میباشد.
الف) ماتریس ضرایب همبستگی بین متغیرهای اولیه در نمونه.
مقدار دترمینان ماتریس فوق برابر است با یعنی انجام تجزیه عاملی معتبر است.
ب) ماتریس ضرایب همبستگی بین متغیرهای اولیه در جامعه مقدار دترمینان ماتریس فوق برابر است با مقادیر ویژه بر اساس 4 تا عامل برای ماتریس ضریب همبستگی همراه با دوران VARIMAX و استخراج عاملها با روش (Principle component) PC برای نمونه و جامعه بدست میآوریم.
در نمونه Total Variance Explained با داشتن 4 عامل در حدود %86/466 اطلاعات را داریم.
61/764 = واریانس اولین مولفه 9/980 = واریانس دومین مولفه 8/022 = واریانس سومین مولفه 6/701 = واریانس چهارمین مولفه در جامعه: در جامعه نیز با داشتن 4 عامل به %86.416 از اطلاعات دسترسی داریم.
ماتریس مولفهها یا همان بردارهای ویژه متناظر برای هر یک از مقادیر ویژه در نمونه و جامعه را محاسبه میکنیم.
این ماتریس بدون دوران است و تعبیر مناسبی را از آن نمیتوان بدست آورد همانطور که ملاحظه میشود مولفه اول دارای ضرایب نسبتاً بالا و یکسانی از هر یک از دروس است که میتواند بعنوان یک عامل نسبی از توانایی های فرد بشمار آید: در نمونه: ماتریس مولفهها بدون دوران، برای مولفه اول داریم: در جامعه مقدار آماره KMO= 0/891 برای نمونه بر تأئید اجرای تحلیل عاملی میباشد.
rij ضریب همبستگی ساده و aij ضریب همبستگی جزئی متغیرهای j,I بشرط ثابت بودن سایر متغیرهاست.
مقادیر اولیه و برآورد آنها با استفاده از روش P.C.
در نمونه communality در جامعه مقادیر EXTRACTION همان ها هستند.
ها را همانطور که در قبل بعنوان میزان اشتراک هر متغیر تعریف کردیم چنین تعبیر میکنیم .
یعنی %85 واریانس متغیر اول در اشتراک با متغیرهای دیگر در مدل است.
و همچنین داریم: یکی از راههای بررسی مناسب بودن مدل و انتخاب روش مناسب برای استخراج عاملها بررسی ماتریس باقیمانده هاست.
هر چقدر درصد کمتری از باقیماندهها مقادیر بزرگتر از 05/0 داشته باشند و در واقع این ماتریس به ماتریس صفر همگرا باشد مناسب بودن روش استخراج عاملها تائید میشود.
در اینجا که ما از روش PC برای برآورد عاملها استفاده کردهایم ماتریس باقیماندهها را برای نمونه و جامعه محاسبه نموده و برای هر یک از این دو چه نمونه و چه جامعه بترتیب 23% و 28% باقیماندهها مقادیری بزرگتر از 05/0 دارند.
به کمک دوران VARIMAX امکان تعبیر و تفسیر بارهای عاملی آسانتر میگردد.
برای هر متغیر در هر سطر بیشترین بار عاملی را مشخص میکنیم.
برای متغیر NG1 عامل دوم بیشترین مقدار برای متغیر NG2 عامل اول برای متغیر NG3 عامل دوم و برای متغیر NG4 عامل سوم و برای متغیر NG5 عامل اول و برای متغیر NG6 عامل اول و برای متغیر NG7 عامل چهارم دارای بیشترین مقدار است.
ماتریس مولفهها بعد از دوران VARIMAX در نمونه: در جامعه: بنابراین با توجه به عملیات فوق میتوان نتیجه گرفت چنانچه تحلیل عاملی را با 7 متغیر آغاز نمائیم و روش استخراج عاملها را Principle component و دوران آنها VARIMAX که دوران متعامدی باشد، معرفی کنیم و تعداد عاملهای استخراج شده چهار تا باشند عاملهایی داریم که میتوانند بر اساس همبستگی آنها با متغیرهای اولیه چنین معرفی گردند.
عامل اول: که دارای بیشترین بار برای متغیرهای NG2 (عربی).
NG5 (ریاضی) و NG6 (فیزیک) میباشد و ما بدنبال یک نام مناسب برای این عامل باید باشیم.
شاید بتوان این عامل را که بنوعی تشابه بین دروس عربی، ریاضی و فیزیک را بیان میکند، تواناییهای استدلالی و منطقی فرد عنوان نمائیم.
عامل دوم که دارای بیشترین بار عاملی روی متغیرهای NG1 (فارسی) و NG3 (معارف) میباشد و میتوان این عامل را بعنوان فاکتوری که تواناییهای کلامی و شفاهی فرد را بیان میکند، شناخت.
عامل سوم که بیشترین وزن را درس زبان (NG4) در آن بخود اختصاص داده بعنوان تواناییهای فرد در یادگیری و حفظیات یک درس زبان خارجی معرفی نمود.
عامل چهارم که بیشترین بار آن اختصاص به درس شیمی دارد و شاید بتوان آن را بعنوان تواناییهای فرد در درس شیمی دانست.
رتبه عاملی FACTOR SCORES در تحلیل عاملی علاقمندیم که معمولاً روی پارامترهای مدل عاملی تمرکز داشته باشیم.
با وجود این، مقادیر برآورده شده عاملهای مشترک که نمرههای عاملی یا factor scores خوانده میشوند، ممکن است برای تحلیلهای بعدی لازم باشد.
این نمرات میتوانند به اندازه همان دادههای اولیه برای آنالیز مناسب باشند.
نمرههای عاملی برآوردهای پارامترهای ناشناخته در حالت معمولی نیستند بلکه آنها برآوردهای مقادیر بردارهای تصادفی عاملی غیر مشاهدهای هستند.
برای برآورد این مقادیر دو روش معرفی میشوند: روش حداقل مربعات وزندار روش رگرسیونی این روش ها هیچکدام تغییری در تعبیر و تفسیر بارهای دوران یافته نمیدهند.
در روش رگرسیونی فرض نرمال بودن Xi ها الزامی است.
از آنجائیکه در این تحلیل ما از روش مولفههای اصلی P.C.
برای استخراج عاملها استفاده نمودهایم بهترین روش برای تولید برآوردهای مقادیر برداری عاملی یا بعبارتی نمرههای عاملی روش حداقل مربعات وزن دار میباشد.
بارهای عاملی تولید شده در این روش دارای میانگین صفر و واریانس 1 میباشند.
تحلیل عاملی یا data Reduction توسط جایگذاری همین نمرههای عاملی بجای متغیرهای اولیه به اتمام میرسد.
% واریانس تجمعی% واریانسمقادیر ویژهمولفه61/76461/7644/323171/7439/9800/699279/7658/0220/562389/4666/7010/469492/6346/1680/432596/4693/8350/2686100/003/5310/2477 V1V2V3V4V5V6V7V11.000.566.747.572.509.569.553V2.5661.000.529.540.584.598.498V3.747.5291.000.516.482.545.526V4.572.540.5161.000.505.545.447V5.509.584.482.5051.000.722.492V6.569.598.545.545.7221.000.565V7.533.498.526.447.492.5651.000 V1V2V3V4V5V6V7V11.000.577.749.572.531.578.559V2.5771.000.539.541.598.609.509V3.749.5391.000.525.499.554.530V4.572.541.5251.000.526.555.442V5.531.598.499.5261.000.744.515V6.578.609.554.555.7441.000.583V7.559.509.530.442.515.5831.000 Initial EigenvaluesInitial EigenvaluesInitial EigenvaluesExtraction sums of squared LoadingsExtraction sums of squared LoadingsExtraction sums of squared LoadingsTotal% of VarianceCumulativ e %Total% of VarianceCumulativ e %4.32361.76461.7644.32361.76461.764.6999.98071.743.6999.98071.743.5628.02279.765.5628.02279.765.4696.70186.466.4696.70186.466.4326.16892.634.2683.83596.469.2473.531100.000 Initial EigenvaluesInitial EigenvaluesInitial EigenvaluesExtraction sums of squared LoadingsExtraction sums of squared LoadingsExtraction sums of squared LoadingsTotal% of VarianceCumulativ e %Total% of VarianceCumulativ e %4.32961.83861.8384.32961.83861.838.6989.97671.814.6989.97671.814.5668.08679.900.5668.08679.900.4566.51686.416.4566.51686.416.4406.29092.706.2613.72896.434.2503.566100.000 Component MatrixaComponent MatrixaComponent MatrixaComponent MatrixaComponent MatrixaComponentComponentComponentComponentComponent1234ng1.825.394-2.745E-02-.148ng2.785.156-.148-2.751E-02ng3.792.4432.089E-02-.261ng4.746-4.030E-02-.486.416ng5.782.4591.933E-02-.205ng6.830.3268.325E-02-.105ng7.737-6.282E-02.543.390 ComponentComponentComponentComponentComponent1234ng10.824.393-3.351E-02-.134ng2.781-.148-.118-.158ng3.791.453-4.471E-03-.223ng4.7481.946E-02-.482.450ng5.785-.4535.802E-03-.171ng6.833-.3288.109E-02-6.491E-02ng7.7376.497E-02.559.356 InitialExtractionng11.000.858ng21.000.663ng31.000.893ng41.000.967ng51.000.864ng61.000.813ng71.000.995 InitialExtractionng11.000.853ng21.000.671ng31.000.881ng41.000.995ng51.000.851ng61.000.813ng71.000.986 Component MatrixaComponent MatrixaComponent MatrixaComponent MatrixaComponent MatrixaComponentComponentComponentComponentComponent1234ng1.282.804.281.229ng2.602.344.397.157ng3.267.870.168.191ng4.279.271.889.161ng5.878.205.162.155ng6.781.281.204.286ng7.289.281.168.897 ComponentComponentComponentComponentComponent1234ng1.292.805.235.253ng2.651.409.108.263ng3.259.864.201.165ng4.307.282.155.892ng5.869.192.177.168ng6.775.261.316.210ng7.291.290.892.150