کاربرد آمار در اقتصاد: نمودار تولید طلا در نیوزلاند بین سالهای ۱۸۵۵ تا ۲۰۰۵ میلادی.
آمار (به انگلیسی: Statistics) را باید علم و عمل استخراج، بسط، و توسعهء دانشهای تجربی انسانی با استفاده از روشهای گرد آوری، تنظیم، پرورش، و تحلیل دادههای تجربی (حاصل از اندازه گیری و آزمایش) دانست. زمینههای محاسباتی و رایانهای جدیدتری همچون یادگیری ماشینی (Machine learning)، و کاوشهای ماشینی در داده ها، (Data mining) در واقع، امتداد و گسترش دانش گسترده و کهن آمار است به عهد محاسبات نو و دوران اعمال شیوههای ماشینی در همهجا.
[ویرایش] مقدمه
منشأ ظهور آمار به صورت توصیف اطلاعات را می توان سرشماری هایی که حدود 4000 سال قبل از میلادمسیح توسط بابلی ها و مصری ها و بعداً توسط امپراتوری های روم و ایران درباره اطلاعات مربوط به زاد و ولد و دارائی های افراد جامعه زیر سلطه خود انجام می گرفته، به حساب آورد. در آن زمان بود که روش هایی برای جمع آوری، تنظیم و تلخیص داده ها ابداع گردید. در قرن چهاردهم برای محاسبه نرخ بیمه، جمع آوری اطلاعات درباره تولد و وفات، تصادفات و حوادث رایج گردید. در اواسط قرن شانزدهم اولین کتاب احتمال توسط کاردن با عنوان "بازی ها و شانس" نوشته شد، او در این کتاب روش های تقلب در بازی های قمار را ارائه داد. بعلاوه، موضوع پیش بینی در نتایج حاصل از انجام آزمایش ها را مطرح نمود. یکی از کارهای او پیش بینی روز وفات خودش بود که برای اثبات صحت پیش بینی در آن روز خودکشی نمود. در اواسط قرن هفدهم پاسکال و فرما اولین کسانی بودند که مطالعه احتمال را به طور علمی شروع نمودند. در همین سال ها به طور همزمان مطالعات آماری به صورت توصیفی انجام می گرفت. مثلاً گرونت با مطالعه تعداد متولدین کشف نمود که تعداد پسرها از دخترها کمی بیشتر است، اما سال های اول زندگی تعداد بیشتری از پسرها فوت می کنند. استفاده از احتمال در آمار، در اواخر قرن هفدهم شروع شد، که در این باره می توان به مطالعات مندل در مورد قانون وراثت، گالتون در بکارگیری همبستگی و ارتباط بین صفات، و به ویژه فیشر در ابداع روش های مختلف استنباط آماری اشاره نمود. از شروع قرن بیستم همه ساله روش های متعددی برای جمع آوری، تجزیه و تحلیل اطلاعات ارائه گردیده که همچنان ادامه دارد.
تاریخچه علم آمار در ایران
واژه آمار ریشه در تاریخ زبان و فرهنگ کهن ایرانی دارد و قدمت آن به زمان هخامنشبان می رسد و تا اواسط دوره اشکانیان واژه هامار یا آمار به معنی شمار و واژه شاهامار به معنی سرشماری به کار می رفته است.به گواه سنگ نوشته ها و آثار مورخان شرق شناس، در زمان داریوش، به منظور جمع آوری آمار، تشکیلات منظمی وجود داشته است و با استفاده از اطلاعات جمع آوری شده، دفاتر مالیاتی و نظامی تدوین می یافته و بودجه مملکتی بر اساس آن تنظیم می شده است. در زمان کوروش نیز آمارگیری در مقیاس وسیع و در تمام پهنه ممالک تابعه حکومت مرکزی ایران انجام می شده و اخذ هرگونه تصمیم درباره ولایات بایستی مبتنی بر شناسائی های محلی و اطلاع دقیق بر کثرت و یا قلّت جمعیت و قدرت و توانایی های مالی آن ولایات باشد. ساسانیان توجه بیشتری به آمار داشتند و امور مالی، کشاورزی و صنعتی و بازرگانی خود را بر اساس آمارها و اطلاعاتی که مأموران سرشماری جمع آوری می کردند، به انجام می رساندند. به گونه ای که در زمان خسرو انوشیروان، برای اخذ مالیات سرانه، ضمن انجام سرشماری نفوس، سن افراد و میزان ثروت آنها تعیین می شد و حتی میزان محصول درختانی مثل نخل، زیتون و تاک تعیین می گردید و بر اساس آن برای افرادی که سن آنها بین 20 تا 50 سال بود، مطابق ثروت و مکنتی که داشتند، مالیات تعیین و آگهی می گردید.
در صورتی که شاخهای علمی مد نظر نباشد، معنای آن، دادههایی بهشکل ارقام و اعداد واقعی یا تقریبی است که با استفاده از علم آمار میتوان با آنها رفتار کرد و عملیات ذکر شده در بالا را بر آنها انجام داد. بیشتر مردم با کلمه آمار به مفهومی که برای ثبت و نمایش اطلاعات عددی به کار میرود اشنا هستند . ولی این مفهوم منطبق با موضوع اصلی مورد بحث آمار نیست. آمار عمدتاً با وضعیتهابیی سر و کار دارد که در آنها وقوع یک پیشامد به طور حتمی قابل پیش بینی نیست. اسنتاجهای آماری غالباً غیر حتمی اند،زیرا مبتنی بر اطلاعات ناکاملی هستند. در طول چندین دهه آمار فقط با بیان اطلاعات و مقادیر عددی در باره اقتصاد،جمعیت شناسی و اوضاع سیاسی حاکم در یک کشور سر و کار داشت .حتی امروز بسیاری از نشریات و گزارشهای دولتی که توده ای از آمارو ارقم را در بردارند معنی اولیه کلمه آمار را در ذهن زنده می کنند .اکثر افراد معمولی هنوز این تصویر غلط را در باره آمار دارند که آن را منحصر به ستونهای عددی سرگیجه آور و گاهی یک سری شکلهای مبهوت کننده می دانند .بنابر این یادآوری این نکته ضروری است که نظریه و روشهای جدید آماری از حد ساختن جدولهای اعداد و نمودارها بسیار فراتر رفته اند. آمار به عنوان یک موضوع علمی،امروزه شامل مفاهیم و روشهایی است که در تمام پژوهشهایی که مستلزم جمع آوری داده ها به وسیله یک فرایند آزمایش و مشاهده و انجام استنباط و نتیجه گیری به وسیله تجزیه و تحلیل این داده ها هستند اهمیت بسیار دارند.
[ویرایش] علم آمار
علم آمار، خود مبتنی است بر نظریه آمار که شاخهای از ریاضیات کاربردی به حساب میآید. در نظریهٔ آمار، اتفاقات تصادفی و عدم قطعیت توسط نظریهء احتمالات مدلسازی میشوند. در این علم، مطالعه و قضاوت معقول در بارهٔ موضوعهای گوناگون، بر مبنای یک جمع انجام میشود و قضاوت در مورد یک فرد خاص، اصلاً مطرح نیست.از جملهٔ مهمترین اهداف آمار، میتوان تولید «بهترین» اطّلاعات از دادههای موجود و سپس استخراج دانش از آن اطّلاعات را ذکر کرد. به همین سبب است که برخی از منابع، آمار را شاخهای از نظریه تصمیمها (Decision theory) به شمار میآورند.این علم به بخشهای آمار توصیفی و آمار استنباطی تقسیم میشود. از طرف دیگر می توان آن را به دو بخش آمار کلاسیک و آمار بیز تقسیم بندی کرد. در آمار کلاسیک، که امروزه در دانشگاه ها و دبیرستان ها تدریس می گردد، ابتدا آزمایش و نتیجه را داریم و بعد بر اساس آن ها فرض ها را آزمون می کنیم. به عبارت دیگر ابتدا آزمایش انجام می شود و بعد فرض آزمون می گردد. در آمار بیزی ابتدا فرض در نظر گرفته می شود و داده ها با آن مطابقت داده می شوند به عبارت دیگر در آمار بیزی یک پیش توزیع داریم-توزیع پیشین- و بعد از مطالعه داده ها و برای رسیدن به آن تئزیع پیشین توزیع پسین را در نظر می گیریم.
عمل آماری
شامل برنامهریزی و جمعبندی و تفسیر مشاهدات غیر قطعی است بهشکلی که[۱] :
اعداد نمایندهٔ واقعی مشاهدات بوده، غیر واقعی یا غلط نباشند.
بهنحو مفیدی تهیه و تنظیم شوند.
بهنحو صحیح تحلیل شوند.
قابل نتیجهگیری صحیح باشند.
[ویرایش] روشهای آماری
مطالعات تجربی و مشاهداتی هدف کلی برای یک پروژه تحقیقی آماری، بررسی حوادث اتفاقی بوده و به ویژه نتیجه گیری روی تأثیر تغییرات در ارزش شاخصها یا متغیرهای غیر وابسته روی یک پاسخ یا متغیر وابسته است. دو شیوه اصلی از مطالعات آماری تصادفی وجود دارد: مطالعات تجربی و مطالعات مشاهداتی. در هر دو نوع از این مطالعات، اثر تغییرات در یک متغیر (یا متغیرهای) غیر وابسته روی رفتار متغیرهای وابسته مشاهده میشود. اختلاف بین این دو شیوه درچگونگی مطالعهای است که عملاً هدایت میشود. یک مطالعه تجربی در بردارنده روشهای اندازه گیری سیستم تحت مطالعه است که سیستم را تغییر میدهد و سپس با استفاده از روش مشابه اندازه گیریهای اضافی انجام میدهد تا مشخص سازد که آیا تغییرات انجام شده، مقادیر شاخصها را تغییر میدهد یا خیر. در مقابل یک مطالعه نظری، مداخلات تجربی را در بر نمیگیرد. در عوض دادهها جمع آوری میشوند و روابط بین پیش بینیها و جواب بررسی میشوند.یک نمونه از مطالعه تجربی، مطالعات Hawthorne مشهور است که تلاش کرد تا تغییرات در محیط کار را در کمپانی الکتریک غربی Howthorne بیازماید. محققان علاقه مند بودند که آیا افزایش نور میتواند کارایی را در کارگران خط تولید افزایش دهد. محققان ابتدا کارایی را در کارخانه اندازه گیری کردند و سپس میزان نور را در یک قسمت از کارخانه تغییر دادند تا مشاهده کنند که آیا تغییر در نور میتواند کارایی را تغییر دهد. به واسطه خطا در اقدامات تجربی، به ویژه فقدان یک گروه کنترل محققاتی در حالی که قادر نبودند آنچه را که طراحی کرده بودند، انجام دهند قادر شدند تا محیط را با شیوه Hawthorne آماده سازند. یک نمونه از مطالعه مشاهداتی، مطالعه ایست که رابطه بین سیگار کشیدن و سرطان ریه را بررسی میکند. این نوع از مطالعه به طور اختصاصی از شیوهای استفاده میکند تا مشاهدات مورد علاقه را جمع آوری کند و سپس تجزیه و تحلیل آماری انجام دهد. در این مورد، محققان مشاهدات افراد سیگاری و غیر سیگاری را جمع آوری میکنند و سپس به تعداد موارد سرطان ریه در هر دو گروه توجه میکنند.