واژه statistics که به فارسی آن را آمار ترجمه کرده اند در اغلب زبان ما به دو معنی به کار میرود:
الف) به معنی ارقام و اعداد واقعی یا تقریبی دربارۀ اموری از قبیل زادومرگ، طلاق، میزان محصولات کشاورزی و صنعتی تصادفات رانندگی و غیره در این رابطه معمولاً دو اثری مثلاً به نام دفترهای آمار در سازمانهای دولتی موجود است.
ب) به معنی روش هایی برای جمع آوری ، تنظیم و تجزبه و تحلیل اطلاعات عددی دربارۀ موضوع.
با اینکه این دو مفهوم با هم ارتباط دارند ما در این فصل مطالبی را تحت عنوان تهیه و تنظیم داده ها که اغلب آمار توصیفی نامیده میشوند شرح میدهیم.
ضرورت استفاده روزافزون از روشهای آماری سبب شده تا دانشگاه ها، درس آمار و احتمالات را به عنوان درس اصلی رشتههای علوم پایه، مهندسی، علوم اداری، مدیریت، یازرگانی، اقتصاد، پزشکی و سایر رشته ها منظور نمایند دو دلیل عمده برای رشد سریع کاربرد آمار وجود دارد. نخست آنکه بکارگیری روشهای کمی در تمامی شاخههای علوم در حال گسترش است و دوم آنکه مقدار اطلاعاتی آماری جمع آوری شده و رای قوۀ ادراک است.
در این فصل آمار توصیفی را معرفی و واژه هایی مرتبط با این موضوع نظیر جمعیت، نمونه، متغیرها و داده ها را تعریف کرده و سپس مشخص کنندههای مرکزی شامل میانگین، میانه و نما را برای دادههای گسسته و پیوسته معرفی میکنیم. همچنین چندک ها را که میانه حالت خاصی از آن است مورد بررسی قرار میدهیم. آنگاه مشخص کنندههای پراکندگی شامل دامنه تغییرات، انحراف متوسط و انحراف معیار را برای دادههای گسسته و پیوسته ارائه خواهد شد. در پایان نمودارهای گوناگون آماری مورد بحث قرار خواهند گرفت.
جمعیت:
مجموعه تمام عناصری را که دارای یک یا چند ویژگی مشترک بوده و در یک زمان مشخص و یا موقعیت مناسب مورد مطالعه قرار میگیرد جمعیت گویند. مثلاً جمعیت دانشجویان رشتههای فنی و مهندسی که در دو سال گذشته فارغ التحصیل شده اند از نظر دانش علمی مثال دیگر اینکه جمعیت ماشینهای سمند که در دو سال گذشته به بازار آمده اند از نظر قدرت ترمز. جمعیت به دو نوع تقسیم میشود: جمعیت متناهی و نامتناهی تعداد عناصر جمعیت را اندازه ی جمعیت گویند و آن را با حرف N نشان میدهند.
نمونه:
بخشی از جمعیت را نمونه گویند و یا به میان دیگر نمونه زیر مجموعه ای از جمعیت است.
تعداد عناصر نمونه را اندازه (حجم) نمونه گویند و با حرف N نشان میدهند.
در بررسیهای آماری سعی میکنند در انتخاب نمونه دقت کافی انجام گیرد. تا با بررسی چنین نمونه مناسبی نتایج فاصله از آن را بتوان با دقت زیاد برای جمعیت تعمیم داد در هر صورت بایستی نمونه انتخاب شده یک الگوی مناسب از جمعیت باشد برای مثال اگر بخواهیم در مورد میزان درآمد افراد ساکن شهر گرگان مطالعه ای را انجام دهیم بایستی نمونهی ما به گونه ای انتخاب شود که شامل افراد با درآمد کم، متوسط و زیاد به نسبت موجود در جمعیت باشد.
مقیاس سازی:
عددی کردن متغیرها را مقیاس سازی گویند در حقیقت میخواهیم عدد حقیقی x را تحت قاعده خاص f به متغیر t نسبت دهیم یعنی x=f(x) برای آشکار شدن موضوع فرض کنید متغیر مورد نظر وزن باشد آنگاه عدد x را توسط تابع f به ویژگی وزن اختصاص میدهیم بر حسب اینکه قاعده ی f چگونه باشد چهار مقیاس گوناگون بدست میآید.
الف) مقیاس اسمی: هر گاه مقیاس x که معمولاً یک عدد طبیعی است، تنها برای شناسایی افراد یا چیزها یا مکان ها به کار رود، آن را یک مقیاس اسمی مینامند مثلاً کارگران یک کارخانه از شهرهای تهران ، اصفهان ، شیراز و گرگان باشد به ترتیب آن ها را با اعداد 1و2و3و4 مشخص کنیم این اعداد صرفاً میگویند که هر کدام از کدام شهر است مانند کارگری که برچسب 4 دارد از گرگان است.
ب) مقیاس ترتیبی: از x =f(t) یک مقیاس ترتیبی بدست میآید اگر شدت و ضعف متغیر t در x منعکس شود به این معنی که اعداد خاصیت بزرگتر یا کوچکتر را به مفهوم بهتر یا بهتر دارا میباشند ولی فاقد خاصیت نسبت هستند به عنوان مثال اگر مهندس یک کارخانه کارگران را از نظر مهارت با اعداد 1 و2و3و4 مشخص کند، کارگر شماره 4 از کارگر شماره 2 ماهرتر است ولی نمی توان گفت که 2 برابر او مهارت دارد.
مقیاسهای اسمی و ترتیبی عمدتاً برای متغیرهای کیفی استفاده میشوند.
ج) مقیاس فاصله ای: از x=f(t) یک مقیاس فاصله ای بدست میآید اگر این تابع به صورت خطی x=a+bt باشد که در عرض از مبدأ مخالف صفر باشد. (a=0) این مقیاس دارای 3 ویژگی است.
الف: صفر به معنی هیچ نیست
ب: نسبت حفظ نمی شود
ج: نسبت فاصله ها حفظ میشود.
د) مقیاس نسبی:
هر گاه مقیاس x، که یک عدد حقیقی است نسبت را حفظ کند، آن را یک مقیاس نسبی گویند این مقیاس عالی ترین نوع مقیاس است که عموم با آن آشنایی دارند و در آن صفر به معنی هیچ و نسبت حفظ میشود و نسبت فاصله ها نیز حفظ میشود.
قابل ذکر است که مقیاسهای فاصله ای و نسبتی برای متغیرهای کمی مورد استفاده قرار میگیرند.