مباحث اساسي در آمار کاربردي

کتاب ,مرکز پژوهش و سنجش افکار سازمان صداوسیما | پژوهش , نظرسنجی اینترنتی , سنجش,مباحث,اساسي,در,آمار,کاربردي,آمار,--,راهنماي,آموزشي آمار,--,مسائل،,تمرين‌ها,و,غيره صداوسيماي,جمهوري,اسلامي,ايران،,مرکز,تحقيقات>

 
مباحث اساسي در آمار کاربردي نويسنده : عليرضا خوشگويان‌فرد
ناشر : سروش مترجم :
قيمت : 100000 سال انتشار : 1391
نوبت چاپ : اول تعداد صفحه : 406
مرکز توزيع :
موجود در منبع :موجود است
ISBN : : 0-26-7378-964-978
کليد واژه : آمار -- راهنماي آموزشي آمار -- مسائل، تمرين‌ها و غيره صداوسيماي جمهوري اسلامي ايران، مرکز تحقيقات
 
مقدمه :
امروزه، کاربرد دانش آمار چنان گسترش يافته است که کمتر رشته‌اي را مي‌توان يافت که شامل يک يا چند درس آماري نباشد. از همين رو، کتاب‌هاي آموزشي گوناگوني در بازار در دسترس فراگيران آمار قرار دارد که به‌خوبي به مباحث آماري پرداخته‌اند. اغلب اين کتاب‌ها با توجه به اهداف نويسنده به حوزه‌اي خاص از دانش آمار محدود شده‌اند؛ براي مثال، کتاب‌هاي مفيدي انتشار يافته‌اند که به مباحث آمار توصيفي اختصاص دارند يا کتاب‌هاي متعدد و راهگشايي را مي‌توان يافت که بر آزمون‌هاي آماري متمرکزند و حتي برخي از آنها به طور خاص به آزمون‌هاي ناپارامتري مي‌پردازند. مباحث نمونه‌گيري نيز عموماً در کتاب‌هاي مستقلي ارائه مي‌شوند. بنابراين، کاربران يا فراگيران آمار در طول کار يا تحصيل، مي‌بايست به کتاب‌هاي مختلفي مراجعه ‌کنند تا به نيازهاي معمول خود پاسخ دهند.
انگيزه نويسنده از نگارش اين کتاب، ارائه هر سه حوزة آمارِ توصيفي، آمار استنباطي و نمونه‌گيري در يک مجموعه است. بنابراين، خواننده ضمن آشنايي با مباني آمار، هم در روش‌هاي آمار توصيفي و هم در روش‌هاي آمار استنباطي ورزيده مي‌شود و در کنار اين دو، درکي مناسب از نمونه‌گيري و روش‌هاي آن به دست مي‌آورد. بديهي است از چنين کتابي نبايد انتظار داشت تا تمام نيازهاي کاربران يا فراگيران آمار را برآورده سازد، بلکه تأکيد آن بر طرح مباحث اساسي‌تر و کاربردي‌تر است.
آنچه نويسنده مي‌تواند به خوانندگان کتاب وعده دهد، برآوردنِ نيازهايي است که به طور معمول، فرد در جريان پژوهش‌هاي کمّي و تحليل‌هاي آماري با آنها روبه‌روست. در واقع، اگر فراگيران يا کاربران دانش آمار را به سه سطحِ مقدماتي، مياني و پيشرفته تقسيم کنيم، مخاطبان اصلي اين کتاب را بيش از همه، گروهي تشکيل مي‌دهند که به تازگي وارد سطح مياني شده‌اند. با وجود اين، کساني که اندک اطلاعي از آمار و حساب داشته باشند نيز قادرند از مطالب اين کتاب استفاده کنند.
کتاب شامل 9 فصل است. مفاهيم بنياديني که پيش‌نياز فصل‌هاي بعد هستند، در فصل اول ارائه مي‌شوند. فصل‌ دوم به روش‌هاي آمار توصيفي اختصاص دارد که اگرچه ساده‌اند، در توصيف داده‌ها و مفهوم بخشيدن به آنها بسيار کارگشا و مؤثرند. آمار استنباطي که به گمان بيشتر کاربران آمار، محور اصلي دانش آمار قلمداد مي‌شود، در فصل‌هاي سوم تا ششم بررسي خواهد شد. اين سه فصل پرحجم‌ترين بخش اين کتاب را تشکيل مي‌دهند و خواننده در آنها به مطالب متنوعي دست مي‌يابد؛ آزمون‌هاي ساده ولي پرکاربرد نظير آزمون فرضيه درباره ميانگين‌ها همراه با بحث‌هاي به نسبت پيشرفته‌تر مانند تجزيه واريانس، همبستگي و رگرسيون از آن جمله‌اند. برخي از آزمون‌هاي ناپارامتري و تحليل جدول‌هاي توافقي در ششمين فصل ارائه شده‌اند. برآورديابي از جمله مباحثي است که برخلاف بسياري از کتاب‌ها، در مباحث آمار استنباطي اين کتاب (فصل چهارم) مورد توجه قرار گرفته است.
فصل هفتم به اجمال به مباحث مختلفي در نمونه‌گيري مي‌پردازد. خواننده در اين فصل درمي‌يابد که تأکيد نمونه‌گيري احتمالي در مقايسه با نمونه‌گيري نااحتمالي بر چيست و با روش‌هاي هر يک از آنها آشنا مي‌شود. فصل هشتم نگاهي کاملاً آماري به روش پيمايشي دارد و برخي مسائل و چالش‌هاي روش‌شناسي را مطرح مي‌‌کند. خواننده با مطالعه اين فصل درخواهد يافت که در پژوهش‌هاي پيمايشي، با چه پيچيدگي‌ها و سختي‌هايي روبه‌روست و بايد انتظار چه مشکلاتي را داشته باشد. اين فصل را به نوعي مي‌توان مکمل فصل نمونه‌گيري يا "نمونه‌گيري در عمل" به حساب آورد. فصل نهم نيز مانند فصل پيمايش، وجه تمايز ديگر اين کتاب از کتاب‌هاي آماري مشابه با آن است؛ زيرا بحث مستقلي را درباره گزارش يافته‌هاي آماري ارائه مي‌دهد به ويژه آنکه برخي از اشکالات رايج در گزارش يافته‌هاي را يادآور مي‌شود.
به خوانندگان توصيه مي‌شود هنگام مطالعه اين کتاب به چند نکته توجه کنند تا نتيجه مطلوب‌تري را از مطالعه خود به دست آورند.
1. پيش از مطالعه هر فصل، ابتدا فهرست مطالب آن را مرور کنيد و سپس مقدمه کوتاه نخسين صفحه آن را بخوانيد. اين کار چشم‌اندازي از آنچه در پيش رو داريد، در اختيار شما قرار مي‌دهد. به طور معمول، هر فصل، علاوه بر مقدمه کوتاه، مقدمه مفصل‌تري نيز دارد که مطالعه آن به غناي اين چشم‌انداز کمک مي‌کند.
2. انتهاي هر فصل شامل اصطلاحات آن فصل همراه با معادل‌هاي انگليسي آن است. با به پايان رساندن مطالعه هر فصل، اين اصطلاحات را نيز مرور کنيد تا اطمينان يابيد مفهوم آنها را به خوبي درک کرده‌ايد. اگر درباره اصطلاحي ترديد داشتيد، بار ديگر به قسمت مربوط به آنها باز گرديد و مطالب را بازخواني کنيد.
3. فصل‌هاي اول و سوم و قسمت ابتدايي فصل پنجم شامل مباحث زيربنايي‌تري هستند که در درک مطالب پس از خود نقش مهمي ايفا مي‌کنند. اطمينان يابيد که مطالب آنها براي شما روشن و قابل درک هستند.
4. تمرين‌ها نقشي کليدي در اين کتاب ايفا مي‌کنند. آنها نه تنها "تمرين" هستند و به ورزيدگي خواننده براي درک مطالب فصل‌ها کمک مي‌کنند، بلکه بخشي از مطالب آموزشي را شامل مي‌شوند که براي پرهيز از پيچيدگي و دشواري مطالب در متن ارائه نشده‌اند. بنابراين به خواننده توصيه مي‌شود، تمرين‌ها را با دقت و جديت مطالعه کند.
5. اگرچه رابطه‌هاي رياضي در متن فصل‌ها يا تمرين‌ها بيان شده و در برخي موارد محاسبات مرتبط با آنها نيز در قالب مثال در مطالب فصل‌ها يا در تمرين‌ها گنجانده شده‌اند، ولي تأکيد چنداني بر انجام محاسبات و به‌کارگيري رابطه‌هاي رياضي نيست؛ زيرا وجود نرم‌افزارهاي متنوع در اين زمينه که نتايج اين محاسبات را با دقت و سرعت به دست مي‌دهند، ما را از محاسبات دستي بي‌نياز مي‌سازد. اما هدف از بيان اين رابطه‌ها يا انجام محاسبات تنها کمک به درک عميق‌تر روش‌ها و فرايندهاي آماري است تا خواننده به شکلي عميق آنها را دريابد. البته علاقه‌مندان مي‌توانند رابطه‌هاي رياضي را با دقت بيشتري بررسي و ابعاد محاسباتي آنها را پيگيري يا به کتاب‌هاي پيشرفته‌تر مراجعه کنند.
در پايان بايد از دوستان عزيز خانم مريم حسيني و آقايان غلامرضا محمدي‌مهر، ابراهيم فتحي، رضا اميراحمدي و بويژه سعادت شيخ، مجيد مهديان و زهرا ندايي براي مطالعه تمام کتاب و آقايان عباس محمدي‌شکيبا و علي قربانپور براي مطالعه برخي از فصل‌ها پيش از چاپ آن سپاسگزاري کنم. همچنين از خانم فريبا يارمحمدي براي صفحه‌آرايي و خانم وجيهه فراهاني براي ويراستاري کتاب قدرداني مي‌کنم. نويسنده تلاش کرده است کتاب با کمترين اشتباه آماده طبع شود. با اين همه از خوانندگان تقاضا مي‌کنم هر گونه خطا يا پيشنهادي را از طريق اي‌ميل يا نشاني ناشر با نويسنده در ميان بگذارند*.

عليرضا خوشگويان‌فرد


فهرست :
فهرست
پيشگفتار 1
مقدمه 3
فصل اول: مفاهيم بنيادي 7
1ـ واژه آمار 8
2ـ چند اصطلاح 9
1ـ2ـ جامعه آماري 10
2ـ2ـ متغير 10
3ـ2ـ داده 11
3ـ حوزه‌هاي آمار 12
4ـ انواع متغير 15
1ـ4ـ انواع متغير بر اساس سطح‌ سنجش 16
1ـ1ـ4ـ متغير اسمي 16
2ـ1ـ4ـ متغير ترتيبي 18
3ـ1ـ4ـ متغيرهاي فاصله‌اي و نسبتي 19
2ـ4ـ متغير پيوسته و گسسته 21
3ـ4ـ متغير مقوله‌اي 22
5ـ وسيلة گردآوري داده‌ها و مجموعه داده‌ها 24
اصطلاحات فصل اول 27
تمرين‌هاي فصل اول 28
فصل دوم: آمار توصيفي 31
1ـ چشم‌اندازي از آمار توصيفي 32
2ـ توزيع متغير 34
1ـ2ـ توزيع متغير مقوله‌اي (جدول توزيع فراواني) 34
2ـ2ـ نمايش توزيع متغير مقوله‌اي در قالب نمودار 37
3ـ2ـ دسته‌بندي 42
4ـ2ـ منحني توزيع متغير (بافت‌نگار) 46
3ـ مشخصه‌هاي کمّي توزيع 50
1ـ3ـ نمادگذاري 51
2ـ3ـ مشخصه‌هاي تمرکز توزيع 52
1ـ2ـ3ـ نما 53
2ـ2ـ3ـ چَندَک‌ها و ميانه 54
3ـ2ـ3ـ ميانگين 58
3ـ3ـ مشخصه‌هاي پراکندگي توزيع 60
1ـ3ـ3ـ دامنه 61
2ـ3ـ3ـ دامنة ميان‌چارکي 61
3ـ3ـ3ـ واريانس 63
4ـ3ـ3ـ ضريب تغييرات 65
4ـ3ـ مشخصه‌هاي شکل توزيع 67
4ـ محاسبه مشخصه‌هاي توزيع براي داده‌هاي دسته‌بندي‌شده 74
5ـ داده‌هاي دورافتاده 77
6ـ جمع‌بندي 80
اصطلاحات فصل دوم 84
تمرين‌هاي فصل دوم 85
فصل سوم: آمار استنباطي ـ مفاهيم پايه 91
1ـ چشم‌اندازي از آمار استنباطي 92
2ـ توزيع نمونه‌گيري 94
1ـ2ـ تکرار نمونه‌گيري 96
3ـ توزيع نرمال 99
4ـ توزيع نمونه‌گيري ميانگين 104
اصطلاحات فصل سوم 107
تمرين‌هاي فصل سوم 107
فصل چهارم: آمار استنباطي ـ برآورديابي 111
1ـ برآورديابي 112
2ـ برآوردگر نقطه‌اي 112
3ـ برآوردگر فاصله‌اي 117
1ـ3ـ برآوردگر فاصله‌اي ميانگين 119
2ـ3ـ برآوردگر فاصله‌اي نسبت 125
3ـ3ـ برآوردگر فاصله‌اي واريانس 126
4ـ درون‌يابي خطي 129
اصطلاحات فصل چهارم 130
تمرين‌هاي فصل چهارم 130
فصل پنجم: آمار استنباطي ـ آزمون فرضيه 133
1ـ مفاهيم و اصطلاحات آزمون فرضيه 134
1ـ1ـ فرضيه آماري 134
2ـ1ـ فرايند آزمون‌هاي آماري 135
3ـ1ـ آزمون‌هاي يک دامنه و دو دامنه 137
4ـ1ـ خطاي نوع اول و دوم، توان آزمون 138
5ـ1ـ سطح معناداري و مقدارِ احتمال 140
2ـ آزمون‌هاي مربوط به ميانگين‌ها 142
1ـ2ـ آزمونِ تک ميانگين 142
2ـ2ـ آزمون مقايسة دو ميانگين 146
1ـ2ـ2ـ مقايسة ميانگين‌هاي دو جامعه مستقل 147
2ـ2ـ2ـ مقايسة ميانگين‌هاي دو جامعه وابسته 150
3ـ2ـ آزمون مقايسة بيش از دو ميانگين (تجزية واريانس) 154
1ـ3ـ2ـ آزمون‌هاي تعقيبي (مقايسه‌هاي دوبه‌دو) 159
2ـ3ـ2ـ پيش‌فرض‌هاي آزمون تجزية واريانس 163
استقلال نمونه‌ها 163
برابري ياهمگني واريانس‌ها (آزمون وِلچ) 164
نرمال‌بودن توزيع 165
3ـ3ـ2ـ شدت ارتباط (ضريب اِتا ‌دو) 165
3ـ آزمون برابري واريانس‌ها 168
4ـ ضريب همبستگي 171
1ـ4ـ نمودار پراکنش 171
2ـ4ـ کوواريانس و ضريب همبستگي 175
3ـ4ـ ضريب همبستگي دورشته‌اي و دو رشته‌اي نقطه‌اي 181
5ـ رگرسيون 184
1ـ5ـ برآورد ضرايب رگرسيون 187
2ـ5ـ آزمون معادلة خط رگرسيون 190
3ـ5ـ آزمون ضرايب خط رگرسيون 195
4ـ5ـ پيش‌فرض‌هاي مدل رگرسيوني 197
5ـ5ـ مدل رگرسيون با دو متغير مستقل 199
اصطلاحات فصل پنجم 205
تمرين‌هاي فصل پنجم 205
فصل ششم: آمار استنباطي ـ آزمون‌هاي ناپارامتري 213
1ـ آزمون‌هاي ناپارامتري (آزاد توزيع) 214
2ـ آزمون علامت 215
3ـ آزمون رتبة علامت‌دار ويلکاکسون براي دو جامعه وابسته 219
4ـ آزمون مجموع رتبه‌اي ويلکاکسون و آزمون من‌‌ـ‌‌ويتني 221
5ـ آزمون کروسکال‌ـ‌واليس 226
6ـ ضريب همبستگي اسپيرمن 228
7ـ ضريب کندال 231
8ـ تحليل جدول‌هاي توافقي 235
1ـ8ـ آزمون نيکويي برازش 240
2ـ8ـ معيارهاي اندازه‌گيري پيوند 243
1ـ2ـ8ـ معيارهاي وي کرامر، في و ضريب تتراکوريک 244
2ـ2ـ8ـ معيار لاندا 247
3ـ2ـ8ـ معيار گاما 250
4ـ2ـ8ـ معيار دي سامرز 254
9ـ آزمون‌هايي درباره نسبت‌ها 257
1ـ9ـ آزمون درباره تک نسبت 257
2ـ9ـ آزمون نيکويي برازش براي توزيع چند جمله‌اي 259
3ـ9ـ مقايسه نسبت‌هاي دو جامعه 260
1ـ3ـ9ـ مقايسه نسبت‌هاي دو جامعه مستقل 261
2ـ3ـ9ـ مقايسه نسبت‌هاي دو جامعه وابسته (آزمون مک‌نمار) 262
4ـ9ـ مقايسه نسبت‌هاي بيش از دو جامعه مستقل 264
اصطلاحات فصل ششم 265
تمرين‌هاي فصل ششم 266
فصل هفتم: نمونه‌گيري 271
1ـ نمونه‌گيري و جايگاه آن 272
2ـ نمونه‌گيري احتمالي و نااحتمالي 274
3ـ روش‌هاي نمونه‌گيري نااحتمالي 276
1ـ3ـ نمونه‌گيري در دسترس 276
2ـ3ـ نمونه‌گيري هدفمند 278
3ـ3ـ نمونه‌گيري گلوله‌برفي 278
4ـ3ـ نمونه‌گيري سهميه‌اي 280
4ـ روش‌هاي کلاسيک نمونه‌گيري احتمالي 280
1ـ4ـ نمونه‌گيري تصادفي ساده 280
1ـ1ـ4ـ اندازه نمونه 282
2ـ1ـ4ـ برآورد ميانگين و نسبت و خطاي معيار آنها 285
2ـ4ـ نمونه‌گيري طبقه‌اي 286
1ـ2ـ4ـ طبقه‌بندي 289
2ـ2ـ4ـ برآورد ميانگين و خطاي معيار آن 290
3ـ2ـ4ـ اندازه نمونه و شيوه تخصيص 291
4ـ2ـ4ـ کارايي 298
3ـ4ـ نمونه‌گيري خوشه‌اي 300
1ـ3ـ4ـ خوشه‌بندي 301
2ـ3ـ4ـ برآورد ميانگين و خطاي معيار آن 303
3ـ3ـ4ـ اندازه نمونه 305
4ـ3ـ4ـ کارايي 307
4ـ4ـ نمونه‌گيري سيستماتيک 308
1ـ4ـ4ـ برآورد 310
2ـ4ـ4ـ کارايي 311
5ـ نمونه‌گيري‌هاي پيچيده 312
1ـ5ـ نمونه‌گيري با احتمال نابرابر 313
2ـ5ـ نمونه‌گيري چند مرحله‌اي 314
3ـ5ـ نمونه‌گيري تلفيقي 316
اصطلاحات فصل هفتم 317
تمرين‌هاي فصل هفتم 317
فصل هشتم: پيمايش 319
1ـ روش پيمايشي 320
2ـ مراحل پيمايش 320
3ـ شکل‌هاي استفاده از پيمايش‌ها 323
4ـ خطاهاي پيمايش 326
5ـ چالش‌هاي پيمايش 328
1ـ5ـ فرد نمونه (پاسخگو) 328
2ـ5ـ ابزار سنجش (پرسشنامه) 329
3ـ5ـ بي‌پاسخي 330
4ـ5ـ تأثيرات پرسشگر 333
5ـ5ـ چهارچوب نمونه‌گيري 334
6ـ شيوه‌هاي تماس 335
7ـ زمان‌بندي و بودجه‌بندي 339
اصطاحات فصل هشتم 342
تمرين‌هاي فصل هشتم 343
فصل نهم: ملاحظات آماري در گزارش يافته‌ها 345
1ـ مقدمه 346
2ـ ساختار گزارش آماري 347
1ـ2ـ پرسش‌ها و فرضيه‌ها 348
2ـ2ـ منابع داده‌ها 349
3ـ2ـ روش‌هاي تحليل داده‌ها 352
4ـ2ـ يافته‌ها و نتيجه‌گيري 352
1ـ4ـ2ـ قسمت توصيفي 353
2ـ4ـ2ـ قسمت استنباطي 355
3ـ4ـ2ـ قسمت نتيجه‌گيري 358
3ـ بايدها و نبايدها 361
تمرين‌هاي فصل نهم 366
پيوست‌ها 367
پيوست 1: فهرست منابع 368
پيوست 2: جدول‌هاي آماري 370
پيوست 3: شکل‌هاي کوچک و بزرگ حروف يوناني 388
پيوست 4: تعريف برخي از اصطلاحات 389

فصل اول :
مفاهيم بنيادي


فصل اول به توضيح مفاهيمي اختصاص دارد که در فصل‌هاي ديگر استفاده خواهند شد و نقشي اساسي در درک ساير مفاهيم اين فصل‌ها دارند. بحث با بيان دو برداشت از واژه "آمار" آغاز مي‌شود و سپس سه مفهوم کليدي جامعه آماري، متغير و داده معرفي مي‌گردند؛ زيرا روش‌هاي آماري پيوسته با آنها ارتباط دارند. در ادامه حوزه‌هاي سه‌گانه دانش آمار شرح داده مي‌شوند. شناخت انواع متغيرها از ابعاد گوناگون موضوع بحث بعدي است که در انتخاب روش‌هاي آماري مناسب براي تحليل داده‌ها اهميت ويژه‌اي دارد. در پايان نيز، بحث ابزار گردآوري داده‌ها و مجموعه داده‌ها آمده است.


1ـ واژه آمار
واژه آمار داراي دو معني است. در معني نخست به اعداد و ارقامي اطلاق مي‌شود که وضعيت پديده‌اي را به شکل کمّي بيان مي‌کنند. براي مثال، در روزنامه‌ها مي‌خوانيم که آمار بزهکاري نسبت به سال گذشته کاهش يافته است؛ يعني اعداد و ارقامي که ميزان بزهکاري را در سال جاري نشان مي‌دهند، کمتر از اعداد و ارقام سال گذشته‌ هستند. آمار نيروي انساني يک سازمان، آمار بيکاري در کشور، آمار مبتلايان به نارسايي کليه، آمار ريزش باران، آمار پذيرفته‌شدگان در مقطع کارشناسي دانشگاه‌ها يا آمار مراجعه‌کنندگان به يک سايت خبري مثال‌هاي ديگري از واژه آمار در اين معنا هستند.
واژه آمار در معناي دوم خود، عنواني براي يک شاخه علمي است که در اوايل قرن هجدهم ميلادي شکل گرفت. دانش آمار شامل مجموعه‌اي از فنون و روش‌هاست که به منظور "گردآوري داده‌ها"، "سازماندهي و تلخيص" آنها و سرانجام "نتيجه‌گيري" از داده‌ها ابداع ‌شده‌ است. اين تعريف بر ابعاد کاربردي دانش آمار اشاره دارد که در سه حوزة آمار توصيفي، آمار استنباطي و نمونه‌گيري جاي مي‌گيرند.
دوگانگي معناي واژه آمار در معادل انگليسي آن يعني Statistics نيز به چشم مي‌خورد. گفته مي‌شود اين واژه برگرفته از واژه لاتين Status به معني حکومت و کشور (State) است و اين امر بر اين واقعيت اشاره دارد که پيدايش آمار در نيازهاي اطلاعاتي حکومت‌ها ريشه دارد.
بحث درباره اين سه حوزه را تا بخش سوم اين فصل به تعويق مي‌اندازيم تا به معرفي برخي از اصطلاحات و واژه‌هايي بپردازيم که از يک سو تعريف دانش آمار و حوزه‌هاي آن و از سوي ديگر مباحث فصل‌هاي ديگر به آنها وابسته‌اند. اصطلاح "داده" يکي از اين واژه‌هاست که جايگاه ويژه‌اي در تعريف دانش آمار دارد، از اين رو بحث بخش بعد به معرفي اين اصطلاح اختصاص دارد، ولي براي اين منظور، ابتدا لازم است دو اصطلاح "جامعه آماري" و "متغير" شرح داده شوند تا زمينه تعريف واژه "داده" نيز فراهم شود. گفتني است اصطلاح متغير، صرفنظر از جايگاهي که در تعريف داده دارد، خود از واژه‌هايي است که پيوسته در مباحث آماري به آن اشاره مي‌شود.
2ـ چند اصطلاح‌
هر لحظه، پديده‌هاي بسيار متنوعي پيرامون ما روي مي‌دهند که کنجکاوي پژوهشگران را برمي‌انگيزند و در ذهن آنان پرسش‌ها و مسائلي را ايجاد مي‌کنند. وقوع جُرم، بارندگي در فصل پاييز، مهاجرت از روستا به شهر، تماشاي تلويزيون و بيکاري از جمله پديده‌هايي هستند که پژوهشگران به بررسي آنها علاقه‌مندند. آنان تمايل دارند پديده‌ها را به‌جاي بررسي موردي، به دفعات زياد بررسي کنند تا بتوانند به نتايج عمومي‌تري دست يابند. براي مثال، بررسي وضعيت بيکاري "آقاي X" به عنوان يکي از هزاران بيکار، به دستاورد علمي قابل توجهي درباره بيکاري منجر نمي‌شود، زيرا امري بسيار جزئي و فردي است. آنچه پژوهشگران را ترغيب به پژوهش مي‌کند، بررسي پديده بيکاري در ميان انبوهي از بيکاران است تا از اين طريق بتوان به دسته‌بندي انواع دلايل بيکاري، عوارض آن و راهکارهاي حل آن در سطحي گسترده پرداخت. بنابراين، آنان به‌جاي بررسي‌هاي موردي، به دنبال بررسي‌هاي وسيع‌تر مانند شهر يا حتي يک کشور هستند.
با وجود اين، گسترة بررسي پديده‌ها نمي‌تواند نامحدود و بدون قلمرو باشد، زيرا از يک سو پژوهشگر بايد بداند فعاليت پژوهشي او در ميان چه کساني صورت مي‌گيرد تا زمان و هزينه تحقيق خود و چگونگي دسترسي به اين افراد را پيش‌بيني و براي آن برنامه‌ريزي کند و از سوي ديگر کاربرانِ يافته‌هاي تحقيق او بدانند اين يافته‌ها متعلق به چه گروهي است تا از نتيجه‌گيري‌هاي افراطي و بي‌منطق مانند تعميم يافته‌ها به ساير گروه‌ها خودداري کنند. براي نمونه، پژوهشگري که وقوع جرم را بررسي مي‌کند، بايد در همان آغاز تحقيق خود مشخص سازد که وقوع جرم را در ميان چه گروه سني، جنسي و جغرافيايي بررسي مي‌کند تا به سراغ همان گروه برود و با پيش‌بيني وسعت و پيچيدگي‌هاي تحقيق خود، در حين اجراي تحقيق دچار سردرگمي نشود. همچنين، اگر پژوهشگر وقوع جرم را در ميان گروه مشخصي مانند نوجوانان بررسي کرده است، کاربران يافته‌هاي پژوهشي او خواهند دانست که اين يافته‌ها لزوماً در ميان بزرگسالان صادق نخواهند بود و بايد از تعميم نتايج آن به اين گروه خودداري کنند.
1ـ2ـ جامعه آماري
جامعه آماري مجموعه افراد يا اشيايي است که پژوهشگر مطالعه خود را در ميان آنها صورت مي‌دهد، مي‌تواند به تک‌تک آنها دسترسي پيدا کند و يافته‌هاي پژوهشي خود را به تمامي آنها تعميم ‌دهد. همه اين افراد يا اشيا داراي حداقل يک صفت مشترک هستند که باعث مي‌شود در قالب "يک مجموعه" با عنوان جامعه آماري در نظر گرفته شوند. براي مثال، وقتي پژوهشگري محدودة پژوهش خود درباره وقوع جرم را "ساکنان شهر تهران با حداقل 18 سال" تعيين مي‌کند، اعضاي جامعه آماري تحقيق او دو صفت مشترک دارند: همگي ساکن شهر تهران هستند و همگي حداقل 18 ساله‌اند. بنابراين، تنها افرادي را عضو اين جامعه آماري قلمداد مي‌کنيم که به طور همزمان هر دو صفت را دارا باشند؛ يعني يک فرد 15 ساله تهراني يا يک فرد 50 ساله اصفهاني در جامعه آماري مورد مطالعه او قرار نمي‌گيرند. مثال‌ 1 نمونه‌هاي ديگري را از جامعه‌هاي آماري نشان مي‌دهد.
مثال 1: چند نمونه از جامعه‌هاي آماري
1. دانش‌آموزان دختر مقطع دبيرستان کل کشور
2. فيلم‌هاي سينمايي اکران‌شده در شش‌ماه نخست سال جاري در سينماهاي استان تهران
3. سرمقاله‌هاي روزنامه‌هاي صبح سراسر کشور
4. خانوارهاي مناطق شهري کل کشور
5. ابيات ديوان شمس
6. خودروهاي پيکان مدل 1370 تا 1380
2ـ2ـ متغير
صرفنظر از صفات مشترکي که براي تعريف جامعه آماري به‌کار مي‌رود، اعضاي جامعه آماري داراي ويژگي‌هاي ديگري نيز هستند که پژوهشگران به بررسي آنها علاقه‌مندند. ويژگي‌هايي که تمام اعضاي جامعه آماري به طور برابر و يکسان دارا نيستند، متغير ناميده مي‌شوند. در واقع، متغيرها محصول آن دسته از پديده‌ها هستند که به‌طور يکسان براي تک‌تک اعضاي جامعه آماري رخ ‌نداده‌اند و موجب ايجاد وضعيت‌هاي مختلفي براي آنها شده‌اند. براي مثال، جامعه آماري استان‌هاي کشور و پديدة بارندگي را در نظر بگيريد. از آنجا که اين پديده به ‌شکلي يکسان در ميان استان‌ها رخ نمي‌دهد، ميزان بارندگي در استان‌هاي مختلف برابر نيست پس "ميزان بارش" در اين جامعه آماري يک متغير است. مثال‌ 2 متغيرهاي ديگري را در جامعه‌هاي آماري مختلف نشان مي‌دهد.
مثال 2: نمونه‌هايي از متغيرها در جامعه‌هاي آماري مختلف
1. دانشجويان يک دانشگاه را به عنوان جامعه آماري درنظر بگيريد. "رشته تحصيلي" ويژگي است که مي‌تواند متغير باشد، زيرا دانشجويان داراي رشته‌هاي تحصيلي مختلفي هستند.
2. قد ساکنان يک شهر متغير است؛ زيرا همه مردم هم‌اندازه نيستند.
3. ميزان آلايندگي خودروهاي پيکان مدل 1370 تا 1380 را مي‌توان يک متغير دانست؛ زيرا حجم آلايندگي حاصل از خودروها برابر نيست.
يک ويژگي مي‌تواند در يک جامعه آماري، متغير، ولي در جامعه آماري ديگري ثابت باشد. براي مثال، رنگ پوست در جامعه آماري مردم جهان متغير است (سفيد، زرد، سياه و سرخ پوست). همين ويژگي مي‌تواند در جامعه آماري مردم آفريقا به يک ويژگي ثابت تبديل شود (به آفريقاي جنوبي گير ندهيد!). همچنين، اگر تحقيقي به جامعه مردان محدود باشد، ويژگي جنسيت متغير نخواهد بود؛ زيرا همه اعضاي اين جامعه آماري، مرد هستند.
پديده‌ها منابع بالقوة توليد داده‌ها هستند که در قالب متغيرها به شکلي "نظام‌مند" تعريف مي‌شوند و پس از اندازه‌گيري، در قالب داده‌ها نمود پيدا مي‌کنند.
3ـ2ـ داده
داده‌ها نتيجة اندازه‌گيري متغير از اعضاي جامعه آماري هستند. به عبارت ديگر، پديده‌اي در ميان اعضاي جامعه آماري مفروضي به شکلي متنوع رخ مي‌دهد و به اين ترتيب، ويژگي متغيري را در ميان اعضاي اين جامعه آماري ايجاد مي‌کند. اکنون با اندازه‌گيري اين ويژگي از اعضاي جامعه آماري و ثبت اندازه‌هاي گردآوري‌شده، داده‌هايي درباره آن متغير از جامعه آماري توليد مي‌شود. بنابراين، داده‌ها‌ "محصولِ" وقوع پديده‌اي هستند که با اندازه‌گيري متغير متناظر با آن از اعضاي جامعه آماري به دست مي‌آيد.
براي نمونه، در طول فصل پاييز در استان‌هاي مختلف بارندگي صورت مي‌گيرد (پديده‌اي رخ مي‌دهد). براين اساس، متغيري با عنوان ارتفاع بارندگي در استان‌ها ايجاد مي‌شود که با اندازه‌گيري آن، داده‌هاي ارتفاع بارندگي توليد مي‌شوند. شکل 1 فرايند چهار مرحله‌اي توليد داده را به تصوير کشيده است.

از آنجا که متغير برخلاف داده پيش از اندازه‌گيري وجود دارد (کافي است پديده‌اي رخ دهد يا تصور شود، تا بر اساس آن، متغير يا متغيرهايي تعريف شوند)، اين امکان نيز فراهم است که اندازه‌هاي بالقوه آن را بدون اندازه‌گيري عملي فهرست کنيد. براي مثال، اندازه متغير ارتفاع بارندگي مي‌تواند از 0 تا 1000 ميلي‌متر باشد، بدون آنکه به اندازه‌گيري آن در بين استان‌ها اقدام کرده باشيد. بنابراين، ممکن است برخي از اندازه‌هايي که به‌طور "نظري" براي متغير برشمرده‌ايد، در عمل يعني پس از اندازه‌گيري، هرگز مشاهده نشوند. براي نمونه، شايد ارتفاع بارش در هيچ‌يک از استان‌ها برابر با 15 ميلي‌متر نشود، هرچند وقوع چنين ارتفاع بارشي نامعقول و ناممکن نيست. از اين رو، بين مقادير متغير و داده‌هاي مربوط به متغير تمايز قايل مي‌شويم. مقادير متغير شامل تمام اندازه‌هاي ممکن براي آن متغير است، در حالي که داده‌ها، آن دسته از مقادير متغير هستند که در عمل از اعضاي جامعه آماري اندازه‌گيري شده‌اند.
3ـ حوزه‌هاي آمار
آمار، دانش کار کردن با داده‌ها و معنا بخشيدن به آنهاست و رويکردي کاملاً کمّي دارد. ابزاري است کارامد در خدمت علومي که به مطالعة کمّي پديده‌ها گرايش دارند و در پي دستيابي به يافته‌هايي براي توصيف، تبيين و پيش‌بيني پديده‌ها در سطحي کلان هستند.
به‌طور معمول، مجموعه داده‌هاي گردآوري‌شده شامل چند صد تا چندين ميليون داده (عدد) است که بررسي تک‌تک اين داده‌ها و خواندن آنها نه تنها گيج‌کننده و دشوار، که بي‌فايده است. براي مثال، جمعيت‌شناسان به بررسي تک‌تک افراد تولد يافته يا فوت‌شده علاقه‌مند نيستند، بلکه به برآيند کلي تولد و مرگ در سراسر جامعه تحت بررسي خود توجه دارند. به عبارت ديگر، نکته با اهميت، تولد نوزادي در فلان خانواده يا فوت فردي از خانواده ديگر نيست، زيرا اين دو، داده‌هايي جزئي (خُرد) از دو خانواده هستند. آنچه براي جمعيت‌شناسان مهم است، اطلاعات کلاني است که از مجموعه خانواده‌ها گردآوري مي‌شوند و اطلاعاتي را درباره وضعيت عمومي جامعه، و نه خانواده يا فردي خاص، دراختيار مي‌گذارند. بنابراين به روش‌هايي نياز است که به مجموعه‌اي گسترده از داده‌هاي انبوه سروسامان بخشد؛ به‌ طوري که به جاي اطلاعات انفرادي و جزئي، اطلاعات کلاني از آنها استخراج شود که وضعيت کل داده‌ها را انعکاس دهد. به عبارت ديگر، روش‌هايي لازم است تا با به‌کارگيري آنها بتوان گزارش مختصر و مفيدي از داد‌ها تهيه و ارائه کرد.
براي روشن‌ شدن موضوع، کارنامه يک دانش‌آموز دبيرستاني را با نمرات 12 درس، مطابق جدول زير درنظر بگيريد.
فيزيک 12 جبر 10 فارسي 19 ورزش 20
شيمي 15 انگليسي 17 عربي 14 کامپيوتر 18
هنر 18 تاريخ 12 هنر 18 تاريخ 12
اين کارنامه، اطلاعات انفرادي تک‌تک درس‌ها را به‌دست مي‌دهد، ولي در نهايت نمي‌توانيم درباره وضعيت عمومي اين دانش‌آموز قضاوت کنيم (مگر در موارد استثنايي که "تمام نمرات" دانش‌آموزي بالا يا پايين باشد). آيا بايد نمرات بالاي او در درس‌هايي مانند فارسي، ورزش، هنر و کامپيوتر را مبناي قضاوت خود قرار دهيم و او را دانش‌آموزي زرنگ قلمداد کنيم يا نمرات پايين او در درس‌هايي مانند جبر، تاريخ و هندسه را نشانه‌هايي از تنبلي او بدانيم. اگرچه تمرکز بر روي نمره هر درس مي‌تواند اطلاعاتي درباره همان درس به‌دست دهد، ولي تک‌تک اين نمرات يعني داده‌هاي جزئي، اطلاعاتي درباره وضعيت عمومي اين دانش‌آموز در اختيار ما نمي‌گذارند، بلکه موجب گيج ‌شدن و سردرگمي ما نيز مي‌شوند.
معدل، کمّيتي است که مي‌تواند "چکيده‌اي" از اين 12 نمره، در قالب تنها يک نمره باشد. به اين ترتيب، معدل، به نوعي وضعيت عمومي درس‌هاي آن دانش‌آموز را نشان مي‌دهد، بدون آنکه ما را با تک‌تک 12 نمره درگير و به مقايسه آنها با يکديگر مجبور سازد. معرفي شاخص‌هايي نظير معدل که به تلخيص انبوهي از داده‌ها مي‌پردازند، از جمله موضوعاتي است که در حوزه آمار توصيفي در فصل دوم مورد بحث قرار مي‌گيرد.
گردآوري داده‌ها و سازماندهي آنها تا زماني که به تصميم‌گيري و نتيجه خاصي منجر نشود، کار چندان مفيدي نخواهد بود. در واقع، داده‌ها زمينه‌اي را فراهم مي‌آورند تا درباره پديدة تحت بررسي و قضاوت، تصميم‌گيري و برنامه‌ريزي کنيم. به عبارت ديگر، هدف اصلي از گردآوري داده‌ها شناخت واقع‌بينانه پديده‌ها با زبان اعداد و ارقام است؛ به ‌طوري که اين اعداد و ارقام انعکاس‌‌دهنده و آيينه واقعيتِ آن پديده‌ها باشند و تصويري روشن از آنچه مي‌گذرد، به ما نشان دهند. بر اين اساس، قادر خواهيم بود عملکرد خود را ارزيابي کنيم و درباره درستي يا نادرستي فعاليت‌ها و اقدامات کنوني خود، دست به قضاوت بزنيم و به تبع آن براي آينده تصميم بگيريم و برنامه‌هايي را براي بهبود وضعيت کنوني و موفقيت در آينده طراحي کنيم.
آمار را به دليل قابليت روش‌هاي آمار استنباطي، منطق استقرا (Logic of Induction) نيز مي‌نامند، زيرا سازوکاري را در اختيار مي‌گذارد تا با استفاده از آن بتوان با اطمينان مشخصي، از داده‌هاي جزئي (نمونه‌اي از جامعه) به نتيجه‌گيري‌هاي کلان دست يافت.
براي مثال، اگر يک نامزد انتخاباتي بداند از رقيب خود عقب‌تر است، برنامه‌هاي تبليغي وسيعي را تدارک مي‌بيند تا اين عقب‌افتادگي را جبران کند و حتي از رقيب خود پيشي بگيرد. براي اين منظور نيز ابتدا بايد به‌درستي درباره وضعيت خود نسبت به رقيبش قضاوت کند، زيرا اگر به اشتباه تصور کند از رقيب خود جلوتر است، فرصت‌هاي موفقيت را از دست مي‌دهد و اگر به اشتباه تصور کند از او عقب‌تر است، زمان و هزينه را صرف تبليغاتي مي‌کند که به آنها نيازي نبوده است و به اين ترتيب از کارهاي ضروري ديگر باز مي‌ماند.
نخستين راه گردآوري داده‌ها براي قضاوت درباره يک پديده، گردآوري داده از تمام اعضاي جامعه آماري است که به آن سرشماري مي‌گويند. سرشماري‌ها، داده‌هاي "کاملي" را از جامعه آماري به دست مي‌دهند و به اين ترتيب مي‌توان درباره پديدة تحت بررسي قضاوتي "قطعي" کرد. براي مثال، اگر رضايت شغلي تمام کارکنان سازماني سنجيده شود، به‌راحتي مي‌توان بر اساس اين داده‌ها تعيين کرد که "دقيقاً" چه نسبتي از کارکنان از شغل خود راضي و چه نسبتي از آنان ناراضي هستند. سرشماري اعضاي يک جامعه آماري کوچک امکان‌پذير است، زيرا در مدتي کوتاه با هزينه قابل قبولي به انجام مي‌رسد، ولي سرشماري از جامعه‌هاي آماري بزرگ وقت‌گير و هزينه‌بر است و اغلب توجيه‌پذير نيست، پس به انتخاب نمونه‌اي از آن اکتفا مي‌شود.
از اين رو، به سازوکاري نياز است که بدون صرف زمان و هزينه زياد، داده‌هاي "واقع‌بينانه و قابل‌اعتمادي" را از جامعه‌هاي آماري بزرگ در اختيار بگذارد؛ داده‌هايي که نمايندة واقعي آن جامعه باشند و گمراه‌کننده و غلط نباشند. روش‌هاي نمونه‌گيري با چنين هدفي ابداع شده‌اند و در پي آن هستند که با گردآوري داده‌ها تنها از بخش کوچکي از جامعه تحت بررسي، و نه تمام آن، اطلاعاتي را به‌دست دهند که به تمام آن جامعه "قابل‌تعميم" باشد (تصويري واقع‌بينانه و قابل‌اعتماد از آن جامعه ارائه دهد). اين بخش کوچک از جامعه را "نمونه" مي‌نامند که با سازوکاري علمي انتخاب مي‌شود و به اين ترتيب، مي‌تواند نمايندة قابل اعتمادي براي کل آن جامعه باشد. بحث درباره اين سازوکار "علمي" در فصل هفتم کتاب ارائه خواهد شد.
اکنون اين پرسش مطرح است که چگونه مي‌توان درباره يک پديده در شرايطي قضاوت کرد که داده‌هاي گردآوري‌شده از آن تنها به "نمونه" و نه تمام جامعه آماري محدود است؟ موضوع آمار استنباطي که در فصل‌هاي سوم تا ششم به آن پرداخته مي‌شود، ارائه راهکارهايي است که ما را قادر مي‌سازد نتايج "قابل‌تعميمي" را از نمونه براي جامعه آماري به دست آوريم. حوزه‌هاي مختلف دانش آمار و پرسش‌هايي که هر حوزه به آنها پاسخ مي‌دهد، در شکل 2 به تصوير کشيده شده است.
















4ـ انواع متغير
ابتدا انواع متغير بر اساس سطح سنجش توضيح داده مي‌شود و پس از آن، دسته‌بندي متغيرها به دو نوع پيوسته و گسسته معرفي مي‌گردد. متغير مقوله‌اي، به عنوان يکي از رايج‌ترين متغيرها بويژه در علوم انساني، موضوع بحث پاياني اين بخش است.
 

کلیه حقوق این سایت متعلق به مرکز تحقیقات سازمان صدا و سیما است.