طبیعت روشهای آماری
در ذهن عمومی روشهای آماری عبارت از جداولی است که با اعداد سروکار دارند.بدین ترتیب روشهایی که در جمع آوری و تجزیه و تحلیل اعداد تجاری یا مبادلات دولتی بکار میرود مربوط به رشته آمار میشود.در هرحال این تعریف کلی چندان مفید بنظر نمیرسد.از این جهت لازم است قبل از اینکه روشهای مذکور را بتوان بدرستی روشهای آماری نامید.طبیعت اعداد و علل مطالعه آنها را مشخص ومحدود نمود.
روشهای آماری با اعدادی سروکار دارند که با اندازه گیری یا شمارش مشاهدات از منبعی بدست آمده اند. بعنوان مثال،بمنظورمطالعه مخارج خدمات پزشکی یک شهر میتوان درصد محدودی ازساکنین شهررا انتخاب کرد و درمورد مخارج پزشکیشان سؤالاتی نمود.و یا در بررسی نظرات مردم درباره یک موضوع عمومی که قراراست در کنگره مورد بحث قرارگیرد،تعدادی از رأی دهندگان در سراسر مملکت انتخاب خواهند شد و سؤالاتی درباره موضوع مذکور عنوان می شود.
به منظور تجزیه و تحلیل جامعه مورد مطالعه،نمونه ای را مناسب با هدف به نحوی که اخیرا ذکرگردید آماردانان انتخاب می نمایند. بدین معنا که نتایج نمونهای انتخاب شده را جهت تمام شهر تعمیم داده می شود.بطور مشابه ، هدف از سؤال کردن از درصد محدودی از رأی دهندگان درباره یک موضوع عمومی عبارت است از تعیین تقریبی نظرات تمام رأی دهندگان درباره آن موضوع است.
مجموعه مشاهداتی که بمنظور بدست آوردن اطلاعاتی از یک منبع مشاهدات انتخاب می شود «نمونه» نامند و آن منبع مشاهدات را «جامعه» گویند.با توجه به توضیحات داده شده «روشهای آماری به روشهای تجزیه وتحلیل در موردجوامع با استفاده از نمونه ها اطلاق می شود.» کلمه آمار اغلب به جای روشهای آماری بکار می رود.
آن قسمت از روشهای آماری که به جمع آوری و خلاصه کردن اطلاعات مربوط می شود معمولا «آمارتوضیحی» نامیده می شود.و آن قسمت مربوط به تجزیه وتحلیل و تفسیرنتایج اعداد و ارقام را « آمار توضیحی» نامیده میشود و آن قسمت مربوط به تجزیه و تحلیل و تفسیر نتایج اعداد و ارقام را «آمار تفسیری» گویند.از آنجایی که هدف نهایی تفسیرکردن نتایج که همان تجزیه و تحلیل اعداد است می باشد قسمت توصیفی می بایست بصورت قسمت ابتدایی در نظر گرفته شود.به میزان قابل توجهی در چهل سال اخیر از روشهای آماری در کلیه علوم وفنون بخصوص درعلوم بیولوژی و علوم اجتماعی استفاده شده است .
با وجود اینکه روشهای مهم نسبتا ساده اند و کاربرد آنها در رشته های مختلف یکسان هستند ولی مع الوصف به علت توجه فراوان روشهای آماری به سرعت توسعه نمود و به پیچیدگی و تنوع آن افزوده گردید.
توزیع احتمالات
توزیع فراوانی نمونه عبارت از تخمینی از توزیع فراوانی جامعه مورد نظر است . درصورتی که تعداد نمونه زیاد باشد، میتوانیم چنین انتظار داشته باشیم که توزیع فراوانی نمونه تقریب خوبی از توزیع فراوانی جامعه مورد نظر است. مثلا در مطالعه وزن دانشجویان ساکن خوابگاه، اگرتعداد دانشجویان در خوابگاه 800 نفر باشد و ما400 دانشجو را انتخاب کرده باشیم، میتوانیم انتظار داشته باشیم که توزیع فراوانی جامعه خیلی شبیه یکدیگر باشند .
تعداد نمونه در مسایل آماری غالبا آنقدر کافی نیست که توزیع جامعه را با دقت کافی مشخص سازد. مع الوصف با اطلاعات حاصله از نمونه بعلاوه اطلاعاتی که از منابع دیگر جمع آوری می شود، شکل عمومی توزیع جامعه قابل پیش بینی است. توزیع احتمالات عبارت از مدل ریاضی است برای توزیع واقعی یک فراوانی مورد نظر است.
تجزیه واریانس
بدون شک یکی از مسایلی که اغلب در کارهای آماری با آن برخورد می شود موضوع آزمون تفاوت نمونه است که آیا از نظر آماری تفاوت دو نمونه نسبت به صفتی معنادار است یا خیر؟ این مساله با آزمون تساوی میانگین دو جامعه یا تساوی نسبت در دو جامعه مطرح و حل می شود.
دلیل اینکه این قبیل مسائل اغلب اتفاق می افتد این است که پژوهشگران اکثرا آزمایشی را طرح می کنندکه هدفشان مقایسه یک روش جدید است با یک روش معمولی.
مثلا ممکن است معلمی معتقد باشد روشی که جهت زبانهای خارجی پیدا کرد، بهتر از روش متداول است که در گروه زبان تدریس می گردد، و یا یک نفر شیمیدان ممکنست یک نوع پلاستیک جدیدی کشف کرده باشد که از آن پلاستیکی که در کارخانه اش ساخته می شود مرغوبتر باشد. در هر یک از دو حالت نحوه آزمایش به این ترتیب مطرح می گردد که آزمونی انجام شود که معلوم گردد روش جدید و پلاستیک جدید در واقع از روش قبلی یا پلاستیک قبلی بهتر است یا خیر .
در هر حال، مقایساتی که اغلب اتفاق می افتد شامل چندین روش یا چندین نوع محصول می باشد به جای مقایسه دو نوع .مثلا یک کارخانه کیک سازی با تغییر دادن مقادیرتشکیل دهنده کیک، شش نوع کیک تولید میکندو می خواهد از نظر کیفیت آنها را مقایسه نماید. در اینگونه مسائل کار صحیحی نیست که در هر دفعه دو نوع کیک مقایسه شوند. درمسأله اخیرکه تعداد نمونه شش می باشد در نتیجه تعداد مقایسات برابر با پانزده دفعه خواهد شد. از طرف دیگر احتمال در آزمون یک تفاوت با احتمال چند آزمون که توأما انجام شود یکسان نخواهد بود. یکی دیگراز معایب مقایسه دو نمونه در هر دفعه ممکن است منجر به طرح آزمایشات نامطلوب شد که دقیقا به هدف اصلی نایل نگردید.مثلا کارخانه سازنده کیک ممکن است فقط یک عامل را درهرزمان تغییر دهد و در هر دفعه در مقایسه دو کیک نوع بهتر را انتخاب نماید و در این صورت ممکن است یک نوع کیک بهتر را فراموش نماید ولی اگرچند عامل موثر در مخلوط کیک را تغییر دهد و سپس کلیه کیکها را توأما بررسی نماید احتمال نرسیدن به هدف اصلی از بین خواهد رفت.
با توجه به مطالب ذکرشده به منظورحل مسائل چند متغیره به نظر میرسد که احتیاج به روش جدیدی است. یکی از این روشها جهت حل مسائلی که دارای چند متغیرپیوسته اند بنام «تجزیه واریانس» میباشد.عبارت تجزیه واریانس را معمولا با علامت اختصاری "ANOVA" نشان میدهند. همان طوریکه از اسم مذکور برمی آید تجزیه واریانس روشی است که واریانس نمونه را به عوامل مفیدی تجزیه می نماید. تجزیه واریانس جهت حل مسائل متنوع عنوان میشود مثلا یکی از کاربردهای آن در طبقه بندی یک متغیره وکاربرد دیگر آن در طبقه بندی دو متغیره است.
روشهای غیر پارامتری
در آزمون هایی چون مقدار µ شرط نرمال بودن توزیع جامعه و یا در آزمون πشرط دو جمله ای بودن توزیع جامعه از مفروضات الزامی بوده است. درحالیکه در توزیع X 2 برای مقایسه فراوانی مشاهدات با فراوانی که انتظار می رود به هیچگونه مفروضاتی نیاز نیست. در روشهای غیرپارامتری هر گونه اطلاعی از نوع توزیع جامعه، غالبا فراوانی مورد انتظار محاسبه میگردد. بطور مثال در بررسی مستقل بودن دو متغیردرمسأله جدول توافقی اطلاع از نوع توزیع دو متغییر ضرورتی ندارد.
بطورخلاصه در شرایطی که هیچگونه اطلاعی از توزیع متغیر در اختیار نیست و یا احتیاجی به دانستن نوع متغیر نمی باشد، از روشهای غیرپارامتری استفاده میشود. زیرا در روشهای غیرپارامتری مقدار پارامتر از جامعه ای که توزیع آن مشخص نگردیده مورد آزمون قرار میگیرد. در حالیکه در سایرروشها نوع توزیع جامعه معلوم است و بدیهی است که اگر نوع توزیع پارامتر جامعه مشخص باشد بهتر است از روشهای استاندارد آماری استفاده گردد. چون در چنین شرایطی اگر بتوان روشهای غیرپارامتری را بکار گرفت بدون شک نتیجه حاصله به خوبی نتیجه حاصله از روشهای استاندارد را نخواهد داشت. بنابراین تنها در شرایطی از روشهای غیرپارامتری بایستی استفاده نمود که بکار بردن روشهای استاندارد مجاز نباشد. روشهای غیرپارامتری قادرند علاوه بر مسائل حل شده توسط روشهایی چون آزمون مقدارµ و یا آزمون π، مسائل جدید دیگر را نیز حل کنند.