عیدی

جامعه آماری – انواع داده و مقیاس‌های آن‌ها

۱ مرداد ۱۳۹۷


تعداد بازدید ها:
۸

اغلب با مفهومی به نام جامعه آماری برخورد داشته‌اید. وقتی در مورد موضوعی تحقیق می‌کنید،‌ یا می‌خواهید دست به سرشماری یا نمونه‌گیری بزنید باید جامعه آماری شما مشخص باشد.

جامعه آماری

مشخصات و اطلاعات مربوط به آن موضوع، جامعه آماری شما را تشکیل می‌دهند. در جامعه آماری هر شی یا فرد دارای خصوصیات یا ویژگی‌های مشترکی با دیگر افراد است در غیر اینصورت امکان جمع‌ شدنشان در یک جامعه وجود ندارد. پس جامعه آماری را باید طوری تعریف شود که بتوان اعضای آن را مشخص کرد. ممکن است تعداد اعضای جامعه آماری بسیار زیاد باشند ولی باید روشی برای سنجش عضویت یک شی در آن جامعه به همراه ویژگی‌هایش وجود داشته باشد، در غیراینصورت جامعه آماری نامشخص است.

برای مثال وقتی در مورد مسئله میزان رضایت کارکنان شرکت X در سال ۱۳۹۷ تحقیق می‌کنید، جامعه آماری شما کارکنان آن شرکت در سال ۱۳۹۷ هستند که میزان رضایت آن‌ها توسط روش‌هایی قابل اندازه‌گیری است. پس همه در متغیر رضایت شغلی مشترک هستند ولی مقدار این متغیر برای هر نفر با نفر دیگر متفاوت است.

یا اگر در مورد تغییرات رشد قد کودکان ۳-۵ سال در یک دوره ۱۰ ساله تحقیق می‌کنید، محدوده زمانی تهیه اطلاعات و افرادی که باید مورد سنجش قد قرار بگیرند مشخص شده است و جامعه آماری شما را تشکیل می‌دهند.

 جامعه آماری متناهی و نامتناهی

اگر جامعه آماری شما قابل شمارش و پایان دار باشد، یک جامعه آماری متناهی دارید. مثال‌های بالا نمونه‌ای از جامعه آماری متناهی بود. ولی زمانی که اعضاء جامعه آماری، تعدادی نامعلوم داشته باشند جامعه آماری را نامتناهی می‌نامیم. برای مثال تعداد پرتاب یک سکه تا مشاهده شیر، ممکن است تا ابد طول بکشد. در این حالت با یک جامعه آماری نامتناهی مواجه هستیم زیرا تعداد اعضای این جامعه آماری نامشخص است.

متغیر، صفت یا ویژگی

به ویژگی که از افراد یا اشیاء جامعه آماری اندازه‌گیری می‌شود و مقدارش از عضوی به عضو دیگر متفاوت است، «متغیر» (Variable) می‌گویند. معمولاً متغیر را با حروف انگلیسی مانند X ،Y و Z نشان می‌دهند.

پس از اندازه‌گیری مقادیر متغیرها در جامعه آماری، داده‌های آماری بدست می‌آید. اگر مقدارهای اندازه‌گیری شده از جامعه آماری به صورت کیفی باشند، گاهی از نام «صفت» (Attribute) یا «ویژگی» (Feature) نیز به جای متغیر استفاده می‌شود.

مقدارهای کمی

این دسته از مقدارها از طریق شمارش یا سنجش با ابزارهای اندازه‌گیری بدست می‌آیند. این نوع داده‌ها بوسیله اعداد نمایش داده می‌شوند. مانند طول،‌ وزن، فشار، دما و …

از آنجایی این نوع داده‌ها به صورت عددی هستند امکان انجام محاسبات ریاضی روی آن‌ها وجود دارد. پس می‌توان میانگین، واریانس و دیگر شاخص‌های آماری را از روی آن‌ها محاسبه کرد. در بیشتر مواقع متغیرهای مربوط به جامعه آماری از نوع کمی هستند.

مقدارهای کیفی

به دسته دیگر از مقدارها که برعکس داده‌های کمی از طریق شمارش یا اندازه‌گیری بدست نمی‌آیند،‌ داده‌های کیفی می‌گویند. این نوع داده‌ها اغلب با صفت یا ویژگی در جامعه آماری در رابطه‌ هستند. از این مقدارها به منظور طبقه‌بندی یا دسته‌بندی جامعه آماری می‌توان استفاده کرد.

ویژگی‌هایی نظیر محل تولد، گروه خون، رنگ مورد علاقه و … از نوع داده‌های کیفی هستند. البته گاهی در مورد مقدار هر یک از ویژگی‌های کیفی ممکن است سلیقه نیز موثر باشد و برای یک عضو از جامعه آماری دو یا چند مقدار برای ویژگی کیفی آن بدست آید. برای مثال نرمی پارچه ممکن است از دید یک نفر مقداری برابر با زبر داشته باشد ولی فرد دیگر آن را با زبری متوسط مقدار دهی کند.

ویژگی‌های کیفی معمولا به صورت متنی ثبت می‌شوند. ولی اغلب برای استفاده از داده‌های کیفی، آن‌ها را به صورت عددی نمایش می‌دهیم. این کار به مفهوم انجام محاسبات روی آن‌ها نیست. بلکه این اعداد فقط کد‌هایی برای نمایش مقدارهای کیفی هستند.

مقیاس‌های اندازه‌گیری برای متغیرهای کمی

داده‌های کمی را با توجه به نوع خصوصیات و مقدار آن‌ها به دو گروه تقسیم می‌کنند: ۱- «مقیاس فاصله‌ای» (Interval Scale) و ۲- «مقیاس نسبتی» (Ratio)

۱- داده‌های با مقیاس فاصله‌ای: اگر مقدارهای متغیر اندازه‌گیری شده به شکلی باشد که صفر در آن مقداری قراردادی محسوب شود، آن نوع داده‌ها را با مقیاس فاصله‌ای می‌شناسند. نسبت تفاضل بین دو مقدار با واحدهای مختلف در این مقیاس حفظ می‌شود. داده‌های مربوط به دما، زمان و … از نوع فاصله‌ای هستند. با استفاده از تبدیلات خطی می‌توان مقداری با یک واحد اندازه‌گیری را به واحد دیگر تبدیل کرد.

برای مثال فرض کنید دمای چهار جسم را با استفاده از سانتی‌گراد اندازه گرفته‌ایم. اگر تفاضل دمای جسم اول با دوم دو برابر تفاضل دمای جسم سوم و چهارم با واحد سانتی‌گراد باشد این نسبت براساس واحد اندازه‌گیری فارنهایت نیز حفظ می‌شود. این محاسبات در مثال زیر آمده است.

مثال

دمای چهار جسم‌ بر حسب سانتی‌گراد به ما داده شده است: دمای جسم اول=۲۵، دمای جسم دوم=۳۵،‌ دمای جسم سوم= ۵۰ و دمای جسم چهارم= ۷۰. در این حالت نسبت تفاضل دمای جسم اول و دوم با جسم سوم و چهارم را برحسب سانتی‌گراد محاسبه می‌کنیم. $dfrac{25-35}{50-70}=frac{-10}{-20}=frac{1}{2}$. حال دما برای جسم‌ها برحسب فارنهایت: دمای جسم اول=۷۷، دمای جسم دوم=۹۵،‌ دمای جسم سوم= ۱۲۲ و دمای جسم چهارم= ۱۵۸. در این حالت نسبت تفاضل دمای جسم اول و دوم با جسم سوم و چهارم را برحسب فارنهایت محاسبه می‌کنیم. $dfrac{77-95}{122-158}=frac{-18}{-36}=frac{1}{2}$. در نتیجه با تغیر واحد اندازه‌گیری از سانتی‌گراد به فارنهایت نسبت تفاضل (فاصله‌ها) تغییری نکرد.

دقت کنید که دمای جسم سوم دو برابر دمای جسم اول در واحد سانتی‌گراد است، در حالیکه در واحد فارنهایت نسبت دمای جسم سوم به اول حدود ۱.۶ برابر است.

۲- داده‌های با مقیاس نسبتی: در این حالت مقدارهای اندازه‌گیری شده مانند مقیاس فاصله‌ای به صورت عددی است ولی صفر به معنی هیچ است. طول، وزن و … داده‌هایی با مقیاس نسبتی هستند.

در داده‌های فاصله‌ای این مسئله وجود دارد که صفر مقداری قراردادی است و به معنی عدم وجود مقدار نیست. برای مثال اگر دما را با درجه سانتی‌گراد در نظر بگیرم،‌ می‌دانیم که صفر درجه سانتی‌گراد به معنی بدون داشتن دما نیست و حتی مقدارهای منفی نیز برای آن وجود دارد. ولی طول به اندازه صفر سانتی‌متر به معنی عدم داشتن طول است.

مثال

با توجه به خاصیت داده‌ها با مقیاس نسبتی، نسبت دو مقدار مثلا طول قد دو فرد با واحد سانتی‌متر با نسبت دو مقدار با واحد دیگر مثلا طول همان دو فرد با واحد اینچ، یکی خواهد بود. اگر قد نفر اول برابر با ۱۶۰ سانتی‌متر و قد نفر دوم نیز ۱۷۰ سانتی‌متر باشد، نسبت قد نفر اول به دوم برابر با ۰.۹۴ خواهد بود. با تبدیل مقدارها به واحد اینچ، نفر اول قدی برابر با ۶۲.۹۹ و نفر دوم قدی برابر با ۶۶.۹۲ خواهد داشت. نسبت این دو قد باز هم برابر با ۰.۹۴ است.

مقیاس‌های اندازه‌گیری برای ویژگی‌های کیفی

همانطور که گفته شد، این نوع داده‌ها برای دسته‌بندی به کار می‌روند. ولی با توجه به نوع کدگذاری آن‌ها و تبدیلشان به اعداد می‌توان دو نوع مقیاس‌ متفاوت برای آن‌ها در نظر گرفت. ۱- «مقیاس اسمی» (Nominal) و ۲- «مقیاس ترتیبی» (Ordinal)

۱- مقیاس اسمی: اگر از کدها و اعداد فقط برای متمایز کردن داده‌های کیفی کمک گرفته شود از مقیاس اسمی استفاده شده است. مقدارهای عددی در این حالت قابلیت مرتب‌سازی اعضا جامعه آماری را نمی‌دهد.

این کدگذاری می‌تواند براساس سلیقه یا نظر محقق متفاوت باشد. برای مثال ممکن است فردی برای اسامی شهرهای مربوط به محل تولد که ویژگی کیفی است کدهای عددی در نظر گرفته و مثلاً به شهر تهران کد ۱ و به شهر اصفهان کد ۲ را اختصاص داده باشد، ولی فردی دیگر برای تهران کد ۵ و برای اصفهان کد ۱ را انتخاب کرده باشد.

نام شهر محل تولد (ویژگی کیفی) کد گذاری با مقیاس اسمی
تهران ۱
اصفهان ۲
شیراز ۳
بیرجند ۴

۲- مقیاس ترتیبی: زمانی که داده‌های کیفی را بوسیله اعدادی کد گذاری کنیم که ترتیب این داده‌ها حفظ شود از مقیاس ترتیبی استفاده کرده‌ایم. مثلاً اگر برای میزان مهارت که مقدارهای ضعیف،‌ متوسط و زیاد را دارد از کدهای عددی ۱، ۲ و ۳ استفاده کنیم، ترتیب داده‌های کیفی را بوسیله کدگذاری حفظ کرده‌ایم. البته ممکن است فرد دیگری کدهای ۰، ۱۰ و ۲۰ را برای میزان مهارت در نظر بگیرد ولی براساس هر دو روش، مهارت ضعیف از مهارت متوسط و زیاد مقدار کمتری دارد.

میزان مهارت (ویژگی کیفی) کدگذاری با مقیاس ترتیبی
ضعیف ۱
متوسط ۲
زیاد ۳

محاسبه شاخص‌های تمرکز برای داده‌های کیفی و کمی

با توجه به ماهیت متفاوت داده‌های کیفی و کمی و همچنین مقیاس‌های اندازه‌گیری آن‌ها،‌ جدول زیر وجود بعضی از شاخص‌های تمرکز (میانگین، میانه، و نما) را برای هر یک مشخص می‌کند.

نوع داده مقیاس اندازه‌گیری  میانگین میان نما
کیفی اسمی $surd$
ترتیبی $surd$ $surd$
کمی فاصله‌ای $surd$ $surd$ $surd$
نسبی $surd$ $surd$ $surd$

اگر مطلب بالا برای شما مفید بوده است، احتمالاً آموزش‌هایی که در ادامه آمده‌اند نیز برایتان کاربردی خواهند بود.

^^


بر اساس رای ۱ نفر

آیا این مطلب برای شما مفید بود؟