شروع با SPSS
برنامه آماری را که برای آنالیز دادهها استفاده خواهید کرد SPSS نامیده میشود.
هر چند SPSS به اشکال مختلفی اجرا می گردد، این کتاب به منظور استفاده SPSS تحت ویندوز تهیه شده است.
فصل دوم مختصری از چگونگی کار کردن با سیستم در اختیار شما قرار میدهد.
هنگام کار SPSS به سادگی قادر خواهید بود آنالیزهای آماری و ترسیم نمودارهای گرافیکی را اجرا کنید.
اما این برنامه مهمترین کار را نمی تواند انجام دهد و آن انتخاب مناسب و تفسیر نتایج آنها است.
این کار به عهده شم است.
فصل 2
تور مقدماتی: SPSS تحت ویندوز
این فصل یک تور سریع هدایت شده SPSS 8 تحت ویندوز می باشد.این تور برای هر دو ویرایش دانشجویی و کامل نرافزار کاربرد دارد.
(برای یک تور هدایت شده کاملتر و وسیعتر، Online tutorals را که همراه SPSS نصب شده است راه اندازی نمایید).
برای استفاده از SPSS نیاز دارید که چگونگی انجام کارهای زیر را بدانید و این فصل تمامی آنها را شامل میشود:
-باز کردن فایل داده ای
-راه اندازی روند گرافیکی یا آماری
-ارزیابی نتایج
این فصل شامل مرور کلی بر سه ابزار است که استفاده از SPSS تحت ویندوز را آسان می سازد: toolbar ، Online tutorial و سیستم جامع Help.
به منظور استفاده از SPSS 8.0 تحت ویندوز دانستن اصول کار را ویندوز 95 لازم است.
یعنی آشنایی با چگونگی اجرای یک برنامه کاربردی با استفاده از دکمه Start، چگونگی انتخاب از منوها و چگونگی بازکردن Objectها با استفاده از دو- کلیک (double-Click) کردن آنها در پنجره مربوطه.
اگر قادر نیستید این کارها را انجام دهید از نفر بخواهید که آنها را به شما نشان دهد.
البته سیستم Help ویندوز 95 از طریق کلیک کردن دکمه Start در اختیار شما است.
راه اندازی SPSS تحت ویندوز
راحت ترین راه برای راه اندازی SPSS تحت ویندوز استفاده از دکمه Start می باشد.
هنگام نصب SPSS، روند Setup در منوی مربوطه Start، SPSS را نیز اضافه می کند که همانگونه که در شکل 1-2 ملاحظه می نمایید وقتی دکمه Start را کلیک می کنید ظاهر میشود.
برای شروع به کار SPSS ابتدا بر روی Start ظاهر شود، سپس SPSS 8.0 For Windows را کلیک نمایید.
همیشه از دکمه چپ ماوس استفاده نمایید مگر اینکه مشخصاً استفاده از دکمه راست ذکر شده باشد.
همانگونه که در شکل 2-2 مشاهد می نمایید پنجره ویرایشگر دادهها SPSS ظاهر میشود.
مانند سایر پنجره ها از طریق کلیک کردن و کشیدن نوار عنوان (Title bar) می توانید آن را جابجا نموده و یا از طریق کلیککردن وکشیدن حاشیهها یاگوشه ها، اندازه آن را تغییر دهید.
Help همیشه در دسترس شماست
این کتاب در مورد آنالیزآماری دادهها است و تلاش نخواهد کرد که به تمامی کارهای متفاوتی که شما می توانید با SPSS انجام دهید اشاره نماید.
(کتابی با چنین قصدی بسیار بزرگتراز این کتاب خواهد بود).
اگر علاقمند به یادگرفتن چیزهای بیشتری درمورد نرم افزار هستید می توانید پاسخ سوالات خود را از طریق سستم SPSS Help به دست آورید.
در انتهای این فصل مروری کلی بر سیستم Help ارائه شده است.
ضمناً برای به دست آوردن کمکهای سریع عنوان Contextual Help را به خاطر بسپارید.
در پنجره SPSS در مورد هر چیزی که کنجکاو شدید توسط دکمه راست ماوس آن را کلیک و انتخاب نمایید.
اگر منوی موقعیت ظاهر گشت اولین گزینه آن را انتخاب نمایید “What’s this
برای دکمه های ابزار و نوار ابزار (tool bar)صرفاً نشانه ماوس را بر روی دکمه مربوطه قرار دهید، توضیحی در مورد آن دکمه درمنتهاالیه چپ نوار وضعیت (Status bar) ظاهر خواهد شد.
برای دکمه های ابزار و نوار ابزار (tool bar)صرفاً نشانه ماوس را بر روی دکمه مربوطه قرار دهید، توضیحی در مورد آن دکمه درمنتهاالیه چپ نوار وضعیت (Status bar) ظاهر خواهد شد.
کپی کردن دیسکت دادهها همراه با این کتاب دیستکتی تهیه شده است که شامل فایلهای اطلاعاتی است و می توانید آن را از کتاب فروشیها تهیه نمایید.
برای ادامه کار لازم است تا فایل های اطلاعاتی را در دیسک سخت خود کپی کنید.
اگر نمی دانید چگونه این کار را انجام دهید مراحل زیر را دنبال کنید: دیسک اطلاعاتی همراه با این کتاب را تهیه کر و در درایو A کامپیوتر خود قرار دهید.
در desktop ویندوز بر روی آیکون My Computer دو کلیک کنید تا پنجره My Computer باز گردد.
در پنجره My Computer بر روی آیکون درایو فلاپی (A) دو کلیک کنید.
در پنجره ای که باز می گردد لیستی از فایل های اطلاعاتی را مشاهده می نمایید.
برای انتخاب همه آنها دکمه های Ctrl-A را فشار دهید سپس دکمه های Ctrl-C را فشار دهید تا آنها را کپی کنید.
در پنجره My Computer آیکون مربوط به دیسک سخت خود را دو کلیک کنید.
(اگر میخواهید پوشه (folder) فایلهای اطلاعاتی را در درون سایر پوشهها قرار دهید.
بر روی folder مورد نظرتان دو کلیک کنید.) برای نگهداری فایلهای اطلاعاتی بر روی دیسک سخت خود یک پوشه جدید بسازید.
از منوی پنجره دیسک سخت مورد زیر را انتخاب نمایید.
File New Folder پوشه جدید را تغییر نام دهید و یک نام که بتوانید به خاطر بسپارید مانند GDA Data Files بر آن بگذارید.
بر روی آیکون مربوط به پوشه جدید دو کلیک کنید تا یک پنجره باز گردد، سپس دکمههای Ctrl-V را فشار دهید تا فایلهایی را که کپی کرده اید در آن قرار گیرد.
صبر کنید تا کپی تکمیل گردد.
پنجره ویرایشگر دادههای SPSS فایل اطلاعاتی باز شما را نشان می دهد.
شما هنوز فایل باز ندارید و به همین دلیل ویرایشگر دادهها خالی است.
اگر داده ها دارید که هنوز وارد کامپیوتر نشده است می توانید مستقیماً اعداد را در ویرایشگر داده ها وارد نمایید.
اگرداده ها مورد نظرتان وارد یک فایل بانک اطلاعاتی یا Spreadsheet شده است احتمالاً می توانید آنها را توسط SPSS بخوانید.
اطلاعاتی که در این کتاب مورد استفاده قرار می گیرد.
به شکل فایل های دادهای SPSS می باشد.
به منظوراستفاده از این فایلها درتمرین ها یا فصل ها به سادگی می توانید فایل مورد نظرتان را باز نمایید.
برای باز کردن یک فایل دادهای: همانگونه که در شکل 3-2 نمایش داده شده است در میله منوی مربوط به ویرایشگر داده ای SPSS بر روی کلمه File دکمه چپ ماوس را کلیک کنید.
منوری File ظاهر می گردد.
در منوی فایل گزینه Open را انتخاب نمایید.
فایل gss.sav را در لیست فایل ها کلیک کنید.
Open را کلیک کنید.
اگر فایل gss.sav ظاهر نشود چه اتفاقی افتاده است؟
تنها فایل های درایو و دایرکتوری جاری لیست می گردد.
ممکن است فایل مورد نظر شما در دایرکتوری دیگری باشد در درایو دیگری ذخیره شده باشد.
همان گونه که در شکل 4-2 نمایش داده شدها ست برای مشاهده پوشه مادر (که پوشه جاری را شامل میشود) بر روی آیکون Up-folder کلیک کنید.
برای مشاهده Subfolder (که زیر پوشه جاری است) بر روی نام آن در لیست دو کلیک کنید.
برای مشاهده یک درایو دیگر روی آیکون Up-folder آنقدر کلیک کنید تا به My Computer برسید، سپس بر روی آیکون درایو مورد نظر تان دو کلیک کنید و روی شاخههای آن درایو تا پوشه مورد نظر تان ادامه دهید.
بعد از آنکه SPSS دادههای فایل مورد نظر را خواند همان گونه که در شکل 5-2 مشاهده می نمایید.
اطلاعات در ویرایشگر داده ها نمایش داده میشود.
این فایل اطلاعاتی حاوی اطلاعات 1500 نفر می باشد که در سال 1993 در مطالعه اجتماعی عمومی (General Social Surrey) مصاحبه شده اند.
این مطالعه هر ساله بر روی نمونه ای از جمعیت بالغ ایالات متحده انجام میشود وطیف وسیعی از سئوالات از آنها پرسیده میشود.
جهت مرور دادهها در ویرایشگر دادهها منو زیر را انتخاب کنید: Window Gss-spss DATA Editor اگر در صفحه نمایش به جای بر چسب مقادیر (مثل برچسب Male یا Female) تنها اعداد نمایش داده شده است، می توانید گزینه Value labels را از منوی Viwe انتخاب نمایید.
فصل 3 شمارش پاسخ ها چگونه می توانید پاسخ های مختلفی را که اشخاص به یک سئوال می دهند خلاصه نمایید؟
جدول فراوانی چیست؟
و چه چیزی از آن می توانید فرا بگیرید؟
اگر در کد کردن و ورود خطایی رخ داده باشد چگونه می توانید در جدول فراوانی متوجه آن شوید؟
درصد و درصد تجمعی چیست؟
نمودارهای دایره ای و ستونی چه هستند و چه وقت از آنها استفاده می کنید؟
چه موقع از یک هیستوگرام استفاده می نمایید؟
نما و میانه چیست؟
صدک ها چه چیزی به شما می گویند.
وقتی که از تعدادی از افراد می خواهید که سئوالهای مشخصی را پاسخ دهند، یا وقتی که مشخصات واحدی را در تعدادی از اشخاص یا اشیاء اندازه گیری نمایید، می خواهید بدانید که فراوانی پاسخهای ممکن چقدر است.
این امر می تواند به سادگی شمارش تعداد پاسخ های بله و خیر به یک سئوال باشد.
یا ممکن است به طور قابل توجهی پیچیده تر باشد.
اگر از افراد بخواهید به عنوان مثال درامد سالانه خود را گزارش کنند.
در این حالت، شمارش ساده هر یک از مقادیر درآمد ممکن است خلاصه مفیدی از اطلاعات در اختیار قرار ندهد.
در این فصل، از روند Frequencies برای خلاصه کردن و نمایش مقادیر یک متغیر استفاده خواهید کرد.
همچنین انتخاب آماره ها و نمودارهای مناسب جهت انواع مختلف اطلاعات را فرا خواهید گرفت.
اطلاعاتی که در این فصل مورد آنالیز قرار می گیرند در فایل gss.sav برای آشنایی با دستورهای لازم برای به دست آوردن خروجی های ارائه شده در این فصل به مبحث «چگونه جداول فراوانی را به دست آوریم» در انتهای همین فصل مراجعه نمایید.
توصیف متغیرها برای درک بهتر چگونگی ارزیابی و توصیف اطلاعات از 9 متغیر مطالعه GSS که در جدول 1-3 تشریح شده اند استفاده خواهید کرد.
(از آنجایی که ویرایش دانشجویی SPSS از نظر تعداد نمونه ها در یک فایل اطلاعاتی محدودیت دارد تنها از اطلاعات مربوط به 1500 نفر ازپاسخ دهندگان استفاده خواهید نمود).
مطالعه General Social Survey این مطالعه هر ساله توسط مرکز ملی پژوهشهای نظر سنجی بر روی نمونه 1500 نفری از جمعیت 18 سال به بالا انجام میشود.
این نمونه نماینده جمعیت بزرگسالی است که در ایالات متحده زندگی می کنند و در موسسات عمومی زندگی نمی کنند.
(خوابگاههای دانشجویی از مطالعه کنار گذاشته شده است).
سئوالهایی از موضوع های متعددی مطرح میشود( از اینکه هر چند وقت دعا می کنید تا اینکه در 16 سالگی کجا زندگی می کرده اید) اطلاعات مطالعه GSS با هزینه ناچیزی پخش می گردد و به طور گسترده ای توسط دانشجویان و محققین استفاده میشود.
(1993 Davis & Smith) جدول 1-3: متغیرهای General Social Survey تمام این متغیرها در SPSS به صورت عددی تعریف شده اند، اما در بیشتر آنها اعداد کدهایی برای اطلاعات غیر عددی هستند.
برچسب های مقداربرای هر متغیر مشخص می کند که هر کد واقعاً چه معنایی دارد.
در ویرایشگر SPSS به منظور نمایش (پا پنهان) کردن بر چسب های مقدار منو زیر را انتخاب نمایید: View Value Labels برای شروع نگاهی به متغیر impjob بیندازید بیندازید.
این متغیر مطرح می کند که برای پاسخ دهنده، داشتن یک شغل تمام وقت چقدر اهمیت دارد.
از آنجایی که تنها 5 پاسخ ممکن وجود دارد، به سادگی هر یک از آنها را می توان شمرد.
روش به دست آوردن یک جدول فراوانی در این قسمت یاد می گیرید چگونه SPSS فراوانی مقادیر یک متغیر را محاسبه می نماید.
رودند Frequencies مقادیر مختلف یک متغیر را جدول بندی می کند و شاخص های آماری و نمودارها را بر اساس این جدول بندی ایجاد می نماید.
علاوه بر این دستور Frequencies می تواند موارد زیر را نیز انجام دهد: درصد نمونه ها که دارای مقادیر یک متغیر می باشند را محاسبه می کند.
برای هر یک از متغیرها شاخص های آمار توصیفی را محاسبه می کند.
(شاخص های «تک متغیره»).
برای نمایش توزیع هر یک از متغیرها نمودارهای دایره ای، ستونی و هیستوگرام های با کیفیت بالا ایجاد می کند.
به منظور باز کردن کادر گفتگوی Frequencies منوی زیر را باز کنید.
در کادر گفتگوی Frequencies یک یا چند متغیر را انتخاب کرده و به لیست متغیرها اضافه نمایید.
بعد از آنکه از انتخاب Display Freqency tables مطمئن شدید بر روی OK کلیک نمایید.
با انجام این مراحل جداول فراوانی مانندشکل های 1-3 و 2-3 ایجاد می شوند که در هر یک از آنها مقادیر و بر چسب متغیرها، فراوانی نمونهها، فراوانی نمونهها درصد تمامی آنها و درصد صحیح (غیر از مقادیر نامعلوم) آنها و درصدهای تجمعی نشان داده شده است.
گزینه Display Freqency tables به شما این اجازه را می دهد که در مورد ظاهر شدن یا نشدن جداول فراوانی تصمیم بگیرید.
هنگامی که تنها نمودارها و شاخص های آماری مد نظرتان است، این گزینه را غیر فعال سازید.
درمورد متغیرهایی که دارای مقادیر مختلف زیادی هستند (مثل سن و قد) وجود این جداول طولانی خیلی جالب نیستند.
Format : ظاهر جدول فراوانی به منظور تغییر ظاهر جداول فراوانی در کادر گفتگوی Frequencies بر روی دکمه Format : ظاهر جدول فراوانی به منظور تغییر ظاهر جداول فراوانی در کادر گفتگوی Frequencies بر روی دکمه Format کلیک نمایید.
کادر گفتگوی Frequencies Format ترتیب ظاهر شدن مقادیر را کنترل می نماید.
Order by : برای تعیین ترتیب ظاهر شدن مقادیر دادهها در جدول فراوانی یکی از گزینهها را انتخاب نمایید.
برای مثال گزینه Descending Counts را انتخاب نمایید تا مقدار با بیشترین فراوانی اول ظاهر شود.
Statistics : آماره های تک متغیره در کادر گفتگو Frequencies بر روی دکمه Charts را انتخاب نمایید.
سپس در کادرگفتگوی Frequencies Charts که در شکل 3-14 نشان داده شده است، برای متغیر انتخاب شده می توانید نمودارهای دایره ای و ستونی و هیستوگرامها را درخواست نمایید.
اگر هیستوگرام را انتخاب نمایید.
گزینه ای وجود دارد که باعث میشود درمواقعی که قصد داشته باشید توزیع متغیر خود را با توزیع نرمال مقایسه نمایید یک منحنی نرمال روی هیستوگرام رسم گردد.
فصل 4 محاسبه شاخصهای آماری توصیفی چگونه می توانید مقادیر یک متغیر را خلاصه نمایید؟
مقیاسهای اندازه گیری چه هستند و چرا مهم اند؟
میانگین حسابی چقدر با نما و میانه تفاوت می کنند؟
چه موقع میانه جهت اندازه گیری محل تجمع داده ها بهتر از میانگین می باشد؟
واریانس چه چیزی به شما نشان می دهد؟
ضریب تغییرات چطور؟
نمره استاندارد شده چیست و چه استفاده ای دارد؟
در فصل قبل برای ارزیابی توزیع مقادیر یک متغیر از جداول فراوانی، نمودارهای دایره ای و ستونی، هیستوگرام و صدک ها استفاده کردید.
تمامی اینها تکنیک های اساسی برای آشنا شدن با اطلاعات می باشند.
اما، اغلب موارد به منظور توصیف بیشتر اطلاعات از شاخص های دیگری مانند شاخص های مرکزی که مقادیر «تپیک» را مطرح می کنند و شاخص های پراکندگی که چگونگی پخش اطلاعات حول یک مقدار را تشریح می کنند، استفاده می نمائیم.
این فصل به شما یاد خواهد داد که چگونه از طریق روند Frequencies و Descriptives شایع ترین شاخص های مرکزی و پراکندگی را محاسبه نمایید.
در این فصل استفاده از gss.sav را ادامه خواهیم داد.
برای آشنایی با چگونگی به دست آوردن خروجی Descriptives به مبحث « چگونگی به دست آوردن شاخص های توصیفی تک متغیره» در آخر همین فصل مراجعه نمایید.
آماره چیست؟
اغلب موارد وقتی اطلاعاتی جمع آوری میکنید، تمایل دارید که در مورد بخش بیشتری از مردم یا اشیاء نتیجه گیری کنید نه تنها افرادی که درمطالعه شما شرکت کرده اند.
به عنوان مثال، بر اساس جوابهای افرادی که در مطالعه GSS شرکت کرده اند، تمایل دارید در مورد تمام جمعیت بالغین ایالات متحده نتیجه گیری نمایید.
افرادی که مورد مطالعه قرار می گیرند نمونه (Samlpl) نامیده می شوند.یک آماره (Statistic) صفتی است که از نمونه به دست می آید.
پارامتر (Parameter) برای توصیف صفات جامعه به کارمی رود.
اگرسن تمام افراد بالغ ایالات متحده را داشته باشید میانه سن یک مقدار پارامتر نامیده میشود.
در اکثر مواقع مقادیر جمعیت یا پرامترها نامشخص هستند و باید از طریق آمارههای محاسبه شده از نمونه، آنها را برآورد نمایید.
شاخص های پراکندگی شاخص مرکزی درمورد اینکه چقدر مقادیر اطلاعات با هم اختلاف دارند چیزی به شما نمی گوید، به عنوان مثال در هر دو سری اعداد زیر میانگین و میانه سن 50 می باشد: اما توزیع سن در دو سری اعداد فوق به شدت با هم متفاوت می باشند.
شاخص های پراکندگی (Measures of Variability) سعی می کنند میزان گستردگی مشاهدات را اندازه گیری نمایند.
بیشتر شاخص های پراکندگی را در این فصل بحث خواهیم نمود.
برای به دست آوردن این خروجی منوی زیر را انتخاب نمایید.
Statistics Summarize Descriptive دامنه تغییرات دامنه تغییرات (range) ساده ترین شاخص پراکندگی است که عبارت است از اختلاف بین بزرگترین و کوچکترین مقدار دادهها.
از آنجایی که در متغیرهای اسمی نمی توان مقادیر آن را از کوچکترین به بزرگترین مقدار به طور معنی داری ردیف کرد، محاسبه دامنه تغییرات در متغیرهای اسمی مانند وضعیت اشتغال معنایی ندارد.درشکل 2-4، ملاحظه می نمایید که کوچکترین مقدار متغیر age عدد 18 می باشد (که بر چسب minimum را دارد.) بزرگترین مقدار (که بر چسب Maximum را دارد) 89 می باشد.
محدوده تغییرات 71 سال می باشد.
مقدار بزرگ برای دامنه تغییرات نشان می دهد که بزرگترین و کوچکترین مقادیر فاصله زیادی از هم دارند.انی شاخص چیزی درمورد پراکندگی مقادیر در بین کوچکترین و بزرگترین مقدار به شمار نمی گوید.
یک شاخص بهتر برای پراکندگی دامنه بین چارکی (interquartile range) می باشد که فاصله بین صدک های 25 و 75 می باشد.
دامنه بین چارکی بر خلاف دامنه تغییرات کمتر توسط مقادیر انتهایی تحت تاثیر قرار می گیرد.
در فصل 3، صدک 25 برای متغیر سن را 32 سال و صدک 75 را 59 سال محاسبه کرده اید.
بنابراین فاصله بین این دو، که دامنه بین چارکی است 27 می باشد.
برای محاسبه دامنه تغییرات و دامنه بین چارکی، همان گونه در فصل 6 بحث شده است می توانید از روند Explore استفاده نمایید.
واریانس و انحراف معیار پرکاربردترین شاخص پراکندگی واریانس می باشد.
این شاخص بر اساس مربع فاصله بین مقادیر هر یک از نمونهها و میانگین محاسبه میشود.
برای محاسبه مربع فاصله هر یک از مقادیر از میانگین، به سادگی میانگین را از مقدار مورد نظر کم کرده وحاصل را به توان دو می رسانیم.
(یکی از دلایل آنکه به جای خود فواصل از توان دوم آنها استفاده میشود آن است که میانگین این فواصل اطراف میانگین صفر میشود.) برای محاسبه واریانس، مربع فاصله تمام نمونهها از میانگین را جمع کرده وحاصل از تقسیم بر تعداد نمونه ها منهای یک می کنیم.
فرمول محاسبه واریانس در یک نمونه (که S2 نامیده میشود) به شکل زیر است: مجموع توان دوم فاصله ها از میانگین برای تمام نمونه ها = واریانس (1-تعداد نمونهها) برای مثال، به منظور محاسبه واریانس اعداد 28،29،30،98،190 ابتدا میانگین این اعداد را محاسبه می کنیم که برابر با 75 می باشد.
سپس واریانس نمونه به ترتیب زیر محاسبه میشود.
اگر واریانس صفر باشد تمامی نمونه ها دارای مقدار واحدی هستند.
هر چه واریانس بیشتر باشد مقادیر بیشتر پراکنده هستند.
بر اساس شکل 2-4 واریانس سن 39/303 مربع سال می باشد و برای متغیر میزان تحصیلات این مقدار 45/9 مربع سال می باشد.
برای به دست آوردن شاخص با واحد متغیر اصلی می توانید از واریانس جذر گرفته و شاخصی به دست آورید که آن را انحراف معیار (Standard deviation) می نامند.
همانگونه که در شکل 2-4 ملاحظه می نمایید انحراف معیار متغیر سن 42/17 سال و متغیر تحصیلات 07/3 سال می باشد.(بر چسب انحراف معیار Std Dev می باشد.) چرا هنگام محاسبه واریاسن نمونه به جای تعداد نمونه درمخرج کسر از تعداد نمونه منهای یک استفاده می نمائیم؟
در محاسبه واریانس قصد دارید مشخص نمایید که مقادیر اطلاعات چقد حول میانگین جمعیت تغییر می کنند.
اما چقدر میانگین جامعه مشخص نمی باشد.
به جای آن باید ازمیانگین نمونه استفاده نمائیم.
این کار باعث میشود که مقادیر نمونه کمتر از حالتی که از میانگین جامعه استفاده می نمائیم.
دچار پراکندگی گردد.
کم کردن یک واحد از تعداد نمونه ها در مخرج این امر را جبران می کند.
ضریب تغییرات اندازه انحراف معیار به واحدی که متغیر مربوطه بر اساس آن اندازه گیری شده است نیز بستگی دارد.
برای مثال، انحراف معیار سن هنگامی که با واحد روز ثبت شده باشد بزرگتر از انحراف معیار سن همان نمونه با واحد سال است.
( در حقیقت انحراف معیار سن با واحد روز 25/365 برابر انحراف معیار سن با واحد سال می باشد).
به همین ترتیب، متغیری مانند حقوق معمولاً انحراف معیار بزرگتری از متغیری مانند قد دارد.
ضریب تغییرات (Coefficient of Variation) انحراف معیار را بر اساس مقدار میانگین بیان می کند.
با این کار می توانید پراکندگی دو متغیر متفاوت را با هم مقایسه نمایید.
برای محاسبه ضریب تغییرات کافی است که انحراف معیار را بر میانگین تقسیم نموده و حاصل را در 100 ضرب نمایید (اگر میانگین منفی باشد از قدرمطلق آن استفاده نمایید).
انحراف معیار 100* =ضریب تغییرات |میانگین| اگر انحراف معیار با میانگین برابر باشد ضریب تغییرات برابر با 100% میشود.
ضریب تغییرات سن در مثال این کتاب 68/37% می باشد.
برای متغیر تحصیلات، ضریب تغییرات 54/23% می باشد.
بنابراین پراکندگی سن بیشتر از تحصیلات می باشد.
مقایسه گروهها چگونه می توانید مشخص کنید آیا شاخص های آماری یک متغیر در زیر گروههای مختلف نمونه با هم فرق می کنند یا خیر؟
زیرگروههای نمونه به چه معنی است؟
با محاسبه شاخص های آماری در زیر گروههای نمونه چه چیزی می توانید یاد بگیرید؟
چگونه می توانید میانگین زیر گروههای نمونه را رسم نمایید؟
در فصل های 3 و 4 از روندهای Frequencies و Descriptives جهت محاسبه شاخص های آماری برای تمام نمونه های مطالعه استفاده کردید.
اما اغلب، مقایسه شاخص های آماری درگروههای مختلف نمونه، مورد نظر می باشد.
برای مثال می خواهید ساعات مطالعه در هفته را میان دانشجویان سالهای مختلف به هم مقایسه نمایید.
یا می خواهید متوسط درآمد مردم را درنواحی مختلف جغرافیایی به دست آورید.
راه ساده ای برای به دست آوردن این اطلاعات از طریق روندهای Frequencies و Descriptives وجود ندارد.
در این فصل خواهید دید که آیا می توان رابطه ای بین متوسط سنوات تحصیلی و روند Means استفاده خواهید نمود.
در این فصل خواهید دید که آیا می توان رابطه ای در آقایان و خانمها به هم شبیه می باشد.
(روند Explore که درفصل 6 بحث شده است به شما اجازه می دهد تا مقادیر یک متغیر را در زیر گروههای مختلف با جزئیات بیشتر بررسی نمایید.) در این فصل از فایل اطلاعاتی gssft.sav استفاده میشود که تنها بعضی از متغیرهای فایل gss.sav را در کارگران تمام وقت شامل میشود.
(اگر می خواهید بدانید که چگونه این فایل کوچکتر ایجاد شده است به مبحث انتخاب نمونه در ضمیمه «ب» مراجعه نمایید.) برای توضیح در مورد آنکه خروجی های مورد بحث در این فصل چگونه به دست آمده اند به مبحث «چگونگی به دست آوردن میانگین زیر گروهها» در انتهای فصل مراجعه نمایید.
Layers : تعریف زیر گروهها با بیش از یک متغیر در شکل 1-5 تمامی افراد تنها بر اساس پاسخشان به سئوال رضایت شغلی به چهار گروه تقسیم شده اند.
اگر بخواهید ببینید که آیا رابطه بین تحصیلات و رضایت شغلی در مردان و زنان شبیه به هم می باشد یا خیر، بایستی هر یک از ردیف های شکل 1-5 را تقسیم نمایید.
شکل 3-5 شاخص های آماری را برای افرادی که ابتدا بر اساس رضایت شغلی و سپس بر اساس جنس تقسیم شده اند، نشان می دهد.
برای بدست آوردن این خروجی همانگونه که در شکل 7-5 نشان داده شده است متغیر Sex را در کادر گفتگو Means برای لایه 2 انتخاب نمایید.
جهت انتقال آماره ها به ستونها از ویرایشگر جدول Pivot استفاده شده است.
ملاحظه می نمایید که 327 نفر از افراد از شغلشان «خیلی راضی» می باشند که به طور متوسط 25/14 سال تحصیلات دارند.
از این افراد 179 نفر زن می باشند.
مردان در این گروه به طور متوسط 20/14 سال تحصیلات دارند.
در حالی که تحصیلات زنان در این گروه به طورمتوسط 31/14 سال می باشد.
این اختلاف خیلی زیاد نمی باشد.
با نگاه به مردان «نسبتاً راضی» ملاحظه می نمایید که متوسط سنوات تحصیلی شان تقریباً نیم سال کمتر از مردان «خیلی راضی» است.
یک مشاهده جالب تر در شکل 2-5 این است که سنوات تحصیلی زنان «خیلی راضی» به طور متوسط بیشتر از کل زنان می باشد.
متوسط سنوات تحصیلی در بقیه زنان در سه گروه دیگر نسبتاً به هم شبیه می باشد.
در مقابل مردان «خیلی ناراضی» بیشترین متوسط سنوات تحصیلی را دارند (27/15 سال).
(اما تعدادنمونه دو گروه«خیلی ناراضی» کم می باشد و بنابراین نتیجه گیری ها لزوماً قطعی نمی باشد مردان «نسبتا ناراضی» کمترین متوسط سنوات تحصیلی را دارند.
شکل 4-5 یک نمودار ستونی است که نتایج شکل 3-5 را نشان می دهد.
مطابق با حالات رضایت شغلی چهار دسته ستون وجود دارد.
هر دسته ستون دارای ستون های جداگانه برای مردان و زنان می باشد.
با نگاه به این نمودار، راحت تر به نتایجی متوجه شد که آیا سنوات تحصیلی در زنان و مردان در آن حالت از رضایت شغلی به هم شبیه می باشند یا خیر.
(نمودار چار گوش که ابزار مناسبتری برای مقایسه شاخص های آماری در گروهها می باشد در فصل بحث خواهد شد.) حال دو زیر گروه دارید: مردان و زنان داخل هر زیر گروه چهار حالت رضایت شغلی را ملاحظه می نمایید.
این نمودار نشان می دهد که رابطه بین رضایت شغلی و تحصیلات در دو جنس به هم شبیه نمی باشد.
همراه با نمودارهای ستونی خطا، می توانید میانگینو انحراف معیار هر یک از گروهها را ملاحظه نمایید.
«نمودارهای ستونی خطا» (error bar charts) در ضمیمه «الف» بحث شده است.
برای محاسبه آماره ها در هر یک از زیر گروهها چه مشکلاتی وجود دارد؟
هر چقدر تعداد زیر گروههایی که می خواهید مقایسه نمایید بیشتر شود، حجم نمونه در هر یک ازگروهها کاهش می یابد.
وقتی که میانگین های محاسبه شده بر اساس تعداد کم نمونه ها باشد خیلی قابل اعتماد نخواهد بود.
یعنی با گرفتن یک نمونه دیگر از همان جمعیت میانگینهای زیرگروهها می تواند به شدت بر اساس تعداد کم نمونه ها باشد خیلی قابل اعتماد نخواهد بود.
یعنی با گرفتن یک نمونه دیگر از همان جمعیت میانگین های زیر گروهها می تواند به شدت تغییر نماید.
در بخش سوم کتاب با مفهوم پراکندگی میانگین نمونه بیشتر آشنا خواهید شد.
Options : آماره های اضافی و نمایش برچسبها در کادر گفتگو Means، بر روی Option کلیک نمایید.
در کادر گفتگو Means Options که در شکل 8-5 نمایش داده شده است.
می توانید اطلاعات اضافی دیگری را برای نمایش در هر خانه درخواست نمایید.
Statistics: این گزینه به شما اجازه می دهد تا آماره هایی که در هر خانه نمایش داده خواهد شد را انتخاب نمایید.
می توانید هر ترکیبی از یک یا چند آماره را انتخاب نمایید.
آمارههای مورد نظر خود را انتخاب نموده و آن را به لیست آماره های خانه منتقل نمایید.
Statistics for First Layer : این گزینه به شما اجازه می دهد تا یک جدول آنالیز واریانس برای آزمون کردن اینکه آیا میانگین زیر گروههای جمعیت برابرند یا خیر درخواست نمایید.
در این حالت تنها حالات متغیر لایه 1 استفاده خواهد شد.
(سایر در نظر گرفته نخواهند شد.) همچنین می توانید یک آزمون درخواست نمایید که آیا تفاوتهای میانگین زیر گروهها به صورت خطی در زیر گروهها تفاوت می کند یا خیر.
این مفهوم در فصل 14 و 15 بحث خواهد شد.
فصل 6 مشاهده توزیع ها چه روش دیگری برای خلاصه کردن توزیع یک متغیر درگروههای مختلف مفید میباشد.
نمودار ساقه و برگ چیست؟
نمودار ساقه و برگ چه تفاوتی با هیستوگرام می کند؟
نمودار مستطیلی چیست؟
از روی طول یک مستطیل چه چیزی می توانید بگوئید؟
میانه در نمودار مستطیلی چگونه نشان داده میشود؟
از آنجایی که بیشتر آنالیزهای آماری شامل مقایسه گروهها است، به منظور ارزیابی توزیع مقادیر در گروههای مختلف SPSS دارای روندهای متعددی است.
در فصل 5 برای محاسبه آماره های توصیفی تحصیلات بر حسب رضایت شغلی و جنس از روند Means استفاده نمودید.برای ارزیابی هر یک از گروهها با جزئیات بیشتر، لازم است از روند Exploer استفاده نمایید که دارای آماره های توصیفی و نمودارهای دیگری است.
این فصل درمورد این مطالب بحث می کند.
( آماره ها و نمودارهایی که در این فصل معرفی می شوند برای مشاهده توزیع کل مقادیر یک نمونه نیز مفید می باشند.) در این فصل نیز از فایل اطلاعاتی gssft.dav استفاده خواهد شد.
در مورد دستورات لازم برای به دست آوردن خروجی های Exploer که در این فصل ارائه شده است به مبحث «چگونگی بررسی کردن توزیعها» در انتهای همین فصل مراجعه نمایید.
نمودارها یکی ازساده ترین روشهای مشاهده توزیع متغیرها استفادهاز تصویر است.
روند Exploer چندین نمودار مختلف جهت بررسی شکل یک توزیع در اختیار شما قرار داده است.
از روی این نمودارها مشاهده می نمایید که مقادیر مختلف یک متغیر چند بار در داده های شما رخ داده است.
همانگونه که در بخش سوم کتاب بحث خواهد شد، انتخاب آنالیز آماری مناسب برای یک مشکل خاص به فرض هایی که در مورد توزیع متغیرهای مورد نظرتان می پذیرید بستگی دارد.
به این دلیل است که ارزیابی توزیع متغیرها اهمیت دارد.
هسیتوگرامها و نمودارهای ساقه و برگ روند Exploer می تواند هیستوگرام های جداگانه ای برای گروههای مختلف نمونهها تولید نماید.
این هیستوگرام با هیستوگرامهایی که روند Frequencies تولید می کند و در فصل 3 توصیف شد، یکی هستند.
شکل 5-6 هیستوگرام سن را برای افرادی که از شغلشان «کمی ناراضی» هستند نشان می دهد.
به قله اصلی دادهها با مرکز 35 سال و قله کوچکتر در 45 سال توجه نمایید.
از روی هستوگرام تنها می توانید تعداد و فاصله را ذکر کنید و مقدار دقیق نمونه ها نامشخص است.
برای مثال، در فاصله اطراف 50 سال می توانید تمامی افراد 50 ساله باشند یا هر ترکیبی از 48، 49، 50، 51، 52، ساله می توانند باشند.
از روی هیستوگرام ملاحظه می نمایید که توزیع مقادیر سن درگروهها قرینه نمی باشد و دمی به سمت مقادیر بالا وجود دارد زیرا که تنها بالغین وارد مطالعه GSS شده اند.
در یک هیستوگرام باید به دنبال چه چیزهایی بگردیم؟تا کنون متوجه شده اید که باید دنبال نمونه هایی با مقادیر بسیار متفاوت با بقیه بگردید.
در حقیقت اگر چنین نمونه هایی وجود داشته باشد باعث می شوند تا بیشتر داده ها حول یک یا دو ستون تجمع پیدا نمایند زیرا محور افقی هیستوگرام به گونه ای انتخاب میشود تا بتوان تمامی نمونه ها را نشان داد.
همچنین باید به قرینه بودن یا نبودن اطلاعات توجه نمایید.
زیرا همان گونه که در بخش سوم کتاب توضیح داده شده است.
درتعدادی از روندهای آماری لازم است تا توزیع داده ها نسبتاً قرینه باشد.
همچنین باید دسته های جدای اطلاعات بگردید.
برای مثال، اگر بیشتر افراد گروه «کمی ناراضی» را مردان جوان و زنان بزرگسال تشکیل دهند، ممکن است دسته ای ازداده های را ببینید که مقادیرآنها اطراف 20 سالگی است و شاید دسته دیگری ازداده ها اطراف 60 سالگی باشند و بین این دو مقدار نمونه زیادی نباشد.
این مسئله یافته مهمی است زیرا نشان می دهد که برای گروه «کمی ناراضی» میانگین سن حدود 40 سال بی معنی است و نماینده خوبی از داده ها نیست.
در این حالت، ممکن است بخواهید که داده های مردان و زنان راجداگانه آنالیزنمایید.