20/10/2025
ဒေတာပြန့်နှံ့မှုကို တိုင်းတာခြင်း- Standard Deviation (SD) နှင့် Variance
Standard Deviation (SD) နှင့် Variance တို့သည် စာရင်းအင်းပညာ (Statistics) တွင် အရေးပါသည့် ဒေတာတစ်ခု၏ အပြောင်းအလဲများမှု (Variability) ကို တိုင်းတာသည့် measure of dispersion များဖြစ်ကြပါသည်။ ၎င်းတို့နှစ်ခုလုံးသည် ဒေတာတန်ဖိုးများ ပျမ်းမျှတန်ဖိုး (Mean) မှ မည်မျှကွာဟပျံ့နှံ့နေသည်ကို ဖော်ပြသော်လည်း၊ ၎င်းတို့၏ အသုံးပြုပုံနှင့် အဓိပ္ပာယ်ဖွင့်ဆိုပုံတို့တွင် အရေးပါသည့် ကွာခြားချက်များရှိပါသည်။
တူညီချက်များ
၁။ ပျမ်းမျှကို အခြေခံခြင်း - နှစ်ခုလုံးသည် ဒေတာ၏ ပျမ်းမျှ (Mean) တန်ဖိုးကို စတင်အခြေခံပြီး တစ်ဦးချင်းစီ တန်ဖိုးများသည် ပျမ်းမျှမှ မည်မျှကွာဝေးနေသည်ကို တိုင်းတာသည်။
၂။ ပျံ့နှံ့မှုကို ဖော်ပြခြင်း - နှစ်ခုလုံးသည် ဒေတာအစုအဝေးတစ်ခု၏ ပျံ့နှံ့မှု (Spread) ကို ကိုယ်စားပြုသည်။ တန်ဖိုးကြီးလေလေ၊ ဒေတာများသည် ပျမ်းမျှမှ ပိုမိုပျံ့နှံ့ကွဲလွဲနေလေလေ ဖြစ်သည်။
ကွာခြားချက်များ
Standard Deviation (SD)
သင်္ကေတနှင့် တွက်ချက်ပုံ-သင်္ကေတမှာ σ (သို့မဟုတ်) s ဖြစ်ပြီး၊ Variance ၏ Square Root
ကို ယူခြင်းဖြင့် တွက်ချက်သည်။
ယူနစ် (Unit) - မူရင်းဒေတာ၏ ယူနစ်အတိုင်းသာ ဖြစ်သည်။ (cm, kg, ကျပ်, နှစ်)
အဓိပ္ပာယ်ဖွင့်ဆိုမှု - ပိုမိုလွယ်ကူပြီး လက်တွေ့ကျသည်။ ပျမ်းမျှမှ ပျမ်းမျှအားဖြင့် မည်မျှကွာဝေးသည်ကို မူရင်းယူနစ်ဖြင့် တိုက်ရိုက်ပြောနိုင်သည်။ ဥပမာ - လစာသည် ပျမ်းမျှမှ ကျပ် ၃၀,၀၀၀ ကွာဝေးသည်ဟု ရှင်းလင်းစွာ ပြောဆိုနိုင်သည်။
Variance
သင်္ကေတနှင့် တွက်ချက်ပုံ - သင်္ကေတမှာ σ2 (သို့မဟုတ်) s2 ဖြစ်ပြီး၊ ပျမ်းမျှမှ ကွာခြားချက်များကို နှစ်ထပ်ကိန်းတင်ပြီး ပျမ်းမျှယူခြင်းဖြင့် တွက်ချက်သည်။
ယူနစ် (Unit) - မူရင်းယူနစ်၏ နှစ်ထပ်ကိန်း (squared unit) ဖြစ်သည်။ (cm2, kg2, ကျပ်2, နှစ်2)
အဓိပ္ပာယ်ဖွင့်ဆိုမှု - ယူနစ်နှစ်ထပ်ကိန်းဖြစ်နေခြင်းကြောင့် လက်တွေ့ဘဝ အခြေအနေနှင့် ဆက်စပ်၍ နားလည်ရ ပိုခက်ခဲစေသည်။ ဥပမာ - လစာ ကွာဟချက်သည် ကျပ်2 ၉၀၀,၀၀၀,၀၀၀ ဖြစ်သည်ဟု ပြောဆိုခြင်းသည် အဓိပ္ပာယ်ဖွင့်ဆိုရန် ခက်ခဲသည်။
လက်တွေ့ဘဝ ဥပမာဖြင့် ရှင်းလင်းချက်
ကုမ္ပဏီတစ်ခုရှိ ဝန်ထမ်းများ၏ လစဉ်ပျမ်းမျှလစာသည် ကျပ် ၄၀၀,၀၀၀ ဖြစ်သည်ဆိုပါစို့
Variance က ကျပ် ၉၀၀,၀၀၀,၀၀၀ ဖြစ်ပါက - ယူနစ်သည် ကျပ် နှစ်ထပ်ကိန်း (ကျပ်2) ဖြစ်နေသဖြင့် “လစာသည် ပျမ်းမျှလစာမှ ကျပ် နှစ်ထပ်ကိန်း ၉၀၀,၀၀၀,၀၀၀ ခန့် ကွာခြားနေသည်” ဟူ၍ ပြောဆိုခြင်းသည် အဓိပ္ပာယ်ဖွင့်ဆိုရန် ခက်ခဲပါသည်။
Standard Deviation က ကျပ် ၃၀,၀၀၀ ဖြစ်ပါက - SD သည် မူရင်းယူနစ် (ကျပ်) ဖြင့် ပြန်လည်ဖော်ပြထားသဖြင့် “ဝန်ထမ်းလစာများသည် ပျမ်းမျှလစာ ကျပ် ၄၀၀,၀၀၀ မှ ပျမ်းမျှအားဖြင့် ကျပ် ၃၀,၀၀၀ ခန့် ကွာဝေးပျံ့နှံ့နေသည်” ဟု တိုက်ရိုက်ရှင်းလင်းစွာ ပြောဆိုနိုင်ပါသည်။
ထို့ကြောင့်၊ ဒေတာကို ခွဲခြမ်းစိတ်ဖြာ၍ အများပြည်သူအား ရှင်းပြရာတွင် SD သည် ပိုမိုထိရောက်သည်။
ဘယ်အချိန်မှာ ဘယ်ဟာကိုသုံးသင့်လဲ?
Standard Deviation ကို အသုံးပြုသင့်သည့် အခြေအနေများ
ရှင်းလင်းတင်ပြခြင်း (Descriptive Statistics): -ဒေတာ၏ ပျံ့နှံ့မှုကို မူရင်းယူနစ်ဖြင့် ဖော်ပြလိုသည့်အခါ အသုံးပြုသည်။
လက်တွေ့ဘဝ ခန့်မှန်းချက်များ - ဒေတာကို နားလည်လွယ်ကူစွာ ရှင်းပြရန် လိုအပ်သော အခြေအနေတိုင်း (ဥပမာ- သတင်းမီဒီယာများ၊ စာရင်းအင်းအစီရင်ခံစာများ) တွင် အသုံးပြုသည်။
Variance ကို အသုံးပြုသင့်သည့် အခြေအနေများ
သင်္ချာဆိုင်ရာ တွက်ချက်မှုများ (Mathematical Calculations) - စက်သင်ယူမှု (Machine Learning)၊ Optimization နှင့် အဆင့်မြင့် စာရင်းအင်းပညာတို့တွင် Variance ကို အဓိကအသုံးပြုသည်။ အဘယ်ကြောင့်ဆိုသော်
သင်္ချာအရ လွယ်ကူခြင်း - Variance သည် square root လုပ်ရန်မလိုသဖြင့် သင်္ချာဆိုင်ရာ ပုံသေနည်းများတွင် ပိုမိုရိုးရှင်းလွယ်ကူသည်။
ပေါင်းနိုင်သည့် ဂုဏ်သတ္တိ (Additive Property) - အရေးအကြီးဆုံးအချက်မှာ၊ လွတ်လပ်သော (Independent) variable နှစ်ခု (X နှင့် Y) ၏ Variance များကို တိုက်ရိုက်ပေါင်းလိုက်ပါက စုစုပေါင်း Variance ကို ရရှိနိုင်ခြင်း ဖြစ်သည်။ Var(X+Y) = Var(X) + Var(Y)
SD တွင် ဤကဲ့သို့ ရိုးရှင်းသော ပေါင်းခြင်းပုံသေနည်းမရှိပါ။
နမူနာ - Mean Squared Error (MSE), Covariance Matrix, Principal Component Analysis (PCA) စသည့် Advanced Methods များတွင် Variance ကို အခြေခံ၍ တွက်ချက်ကြသည်။
အနှစ်ချုပ်အနေဖြင့်ပြောရလျှင်၊ Standard Deviation (SD) သည် လူအများနားလည်လွယ်ခြင်း၊ လက်တွေ့ဘဝနှင့် ကိုက်ညီခြင်း တို့ကြောင့် ရှင်းပြရာတွင် အသုံးဝင်ပါသည်။ Variance သည် သင်္ချာနှင့် ကွန်ပျူတာပရိုဂရမ်များတွင် တွက်ချက်မှုနှင့် မော်ဒယ်လ်တည်ဆောက်မှုများအတွက် ပိုမိုအသုံးဝင်သည် ဟု မှတ်သားနိုင်ပါသည်။
အောက်တိုဘာလ ၂၄ ရက်မှာဖွင့်မဲ့
Basic statistics with R Batch-73 (Video class)
Statistics with R Level-2 (Video class)
သင်တန်းအသေးစိတ်ကြည့်ရန်
https://www.facebook.com/share/p/1BSifqVhuD/
ဒေတာပြန့်နှံ့မှုကို တိုင်းတာခြင်း- Standard Deviation (SD) နှင့် Variance
Standard Deviation (SD) နှင့် Variance တို့သည် စာရင်းအင်းပညာ (Statistics) တွင် အရေးပါသည့် ဒေတာတစ်ခု၏ အပြောင်းအလဲများမှု (Variability) ကို တိုင်းတာသည့် measure of dispersion များဖြစ်ကြပါသည်။ ၎င်းတို့နှစ်ခုလုံးသည် ဒေတာတန်ဖိုးများ ပျမ်းမျှတန်ဖိုး (Mean) မှ မည်မျှကွာဟပျံ့နှံ့နေသည်ကို ဖော်ပြသော်လည်း၊ ၎င်းတို့၏ အသုံးပြုပုံနှင့် အဓိပ္ပာယ်ဖွင့်ဆိုပုံတို့တွင် အရေးပါသည့် ကွာခြားချက်များရှိပါသည်။
တူညီချက်များ
၁။ ပျမ်းမျှကို အခြေခံခြင်း - နှစ်ခုလုံးသည် ဒေတာ၏ ပျမ်းမျှ (Mean) တန်ဖိုးကို စတင်အခြေခံပြီး တစ်ဦးချင်းစီ တန်ဖိုးများသည် ပျမ်းမျှမှ မည်မျှကွာဝေးနေသည်ကို တိုင်းတာသည်။
၂။ ပျံ့နှံ့မှုကို ဖော်ပြခြင်း - နှစ်ခုလုံးသည် ဒေတာအစုအဝေးတစ်ခု၏ ပျံ့နှံ့မှု (Spread) ကို ကိုယ်စားပြုသည်။ တန်ဖိုးကြီးလေလေ၊ ဒေတာများသည် ပျမ်းမျှမှ ပိုမိုပျံ့နှံ့ကွဲလွဲနေလေလေ ဖြစ်သည်။
ကွာခြားချက်များ
Standard Deviation (SD)
သင်္ကေတနှင့် တွက်ချက်ပုံ-သင်္ကေတမှာ σ (သို့မဟုတ်) s ဖြစ်ပြီး၊ Variance ၏ Square Root
ကို ယူခြင်းဖြင့် တွက်ချက်သည်။
ယူနစ် (Unit) - မူရင်းဒေတာ၏ ယူနစ်အတိုင်းသာ ဖြစ်သည်။ (cm, kg, ကျပ်, နှစ်)
အဓိပ္ပာယ်ဖွင့်ဆိုမှု - ပိုမိုလွယ်ကူပြီး လက်တွေ့ကျသည်။ ပျမ်းမျှမှ ပျမ်းမျှအားဖြင့် မည်မျှကွာဝေးသည်ကို မူရင်းယူနစ်ဖြင့် တိုက်ရိုက်ပြောနိုင်သည်။ ဥပမာ - လစာသည် ပျမ်းမျှမှ ကျပ် ၃၀,၀၀၀ ကွာဝေးသည်ဟု ရှင်းလင်းစွာ ပြောဆိုနိုင်သည်။
Variance
သင်္ကေတနှင့် တွက်ချက်ပုံ - သင်္ကေတမှာ σ2 (သို့မဟုတ်) s2 ဖြစ်ပြီး၊ ပျမ်းမျှမှ ကွာခြားချက်များကို နှစ်ထပ်ကိန်းတင်ပြီး ပျမ်းမျှယူခြင်းဖြင့် တွက်ချက်သည်။
ယူနစ် (Unit) - မူရင်းယူနစ်၏ နှစ်ထပ်ကိန်း (squared unit) ဖြစ်သည်။ (cm2, kg2, ကျပ်2, နှစ်2)
အဓိပ္ပာယ်ဖွင့်ဆိုမှု - ယူနစ်နှစ်ထပ်ကိန်းဖြစ်နေခြင်းကြောင့် လက်တွေ့ဘဝ အခြေအနေနှင့် ဆက်စပ်၍ နားလည်ရ ပိုခက်ခဲစေသည်။ ဥပမာ - လစာ ကွာဟချက်သည် ကျပ်2 ၉၀၀,၀၀၀,၀၀၀ ဖြစ်သည်ဟု ပြောဆိုခြင်းသည် အဓိပ္ပာယ်ဖွင့်ဆိုရန် ခက်ခဲသည်။
လက်တွေ့ဘဝ ဥပမာဖြင့် ရှင်းလင်းချက်
ကုမ္ပဏီတစ်ခုရှိ ဝန်ထမ်းများ၏ လစဉ်ပျမ်းမျှလစာသည် ကျပ် ၄၀၀,၀၀၀ ဖြစ်သည်ဆိုပါစို့
Variance က ကျပ် ၉၀၀,၀၀၀,၀၀၀ ဖြစ်ပါက - ယူနစ်သည် ကျပ် နှစ်ထပ်ကိန်း (ကျပ်2) ဖြစ်နေသဖြင့် “လစာသည် ပျမ်းမျှလစာမှ ကျပ် နှစ်ထပ်ကိန်း ၉၀၀,၀၀၀,၀၀၀ ခန့် ကွာခြားနေသည်” ဟူ၍ ပြောဆိုခြင်းသည် အဓိပ္ပာယ်ဖွင့်ဆိုရန် ခက်ခဲပါသည်။
Standard Deviation က ကျပ် ၃၀,၀၀၀ ဖြစ်ပါက - SD သည် မူရင်းယူနစ် (ကျပ်) ဖြင့် ပြန်လည်ဖော်ပြထားသဖြင့် “ဝန်ထမ်းလစာများသည် ပျမ်းမျှလစာ ကျပ် ၄၀၀,၀၀၀ မှ ပျမ်းမျှအားဖြင့် ကျပ် ၃၀,၀၀၀ ခန့် ကွာဝေးပျံ့နှံ့နေသည်” ဟု တိုက်ရိုက်ရှင်းလင်းစွာ ပြောဆိုနိုင်ပါသည်။
ထို့ကြောင့်၊ ဒေတာကို ခွဲခြမ်းစိတ်ဖြာ၍ အများပြည်သူအား ရှင်းပြရာတွင် SD သည် ပိုမိုထိရောက်သည်။
ဘယ်အချိန်မှာ ဘယ်ဟာကိုသုံးသင့်လဲ?
Standard Deviation ကို အသုံးပြုသင့်သည့် အခြေအနေများ
ရှင်းလင်းတင်ပြခြင်း (Descriptive Statistics): -ဒေတာ၏ ပျံ့နှံ့မှုကို မူရင်းယူနစ်ဖြင့် ဖော်ပြလိုသည့်အခါ အသုံးပြုသည်။
လက်တွေ့ဘဝ ခန့်မှန်းချက်များ - ဒေတာကို နားလည်လွယ်ကူစွာ ရှင်းပြရန် လိုအပ်သော အခြေအနေတိုင်း (ဥပမာ- သတင်းမီဒီယာများ၊ စာရင်းအင်းအစီရင်ခံစာများ) တွင် အသုံးပြုသည်။
Variance ကို အသုံးပြုသင့်သည့် အခြေအနေများ
သင်္ချာဆိုင်ရာ တွက်ချက်မှုများ (Mathematical Calculations) - စက်သင်ယူမှု (Machine Learning)၊ Optimization နှင့် အဆင့်မြင့် စာရင်းအင်းပညာတို့တွင် Variance ကို အဓိကအသုံးပြုသည်။ အဘယ်ကြောင့်ဆိုသော်
သင်္ချာအရ လွယ်ကူခြင်း - Variance သည် square root လုပ်ရန်မလိုသဖြင့် သင်္ချာဆိုင်ရာ ပုံသေနည်းများတွင် ပိုမိုရိုးရှင်းလွယ်ကူသည်။
ပေါင်းနိုင်သည့် ဂုဏ်သတ္တိ (Additive Property) - အရေးအကြီးဆုံးအချက်မှာ၊ လွတ်လပ်သော (Independent) variable နှစ်ခု (X နှင့် Y) ၏ Variance များကို တိုက်ရိုက်ပေါင်းလိုက်ပါက စုစုပေါင်း Variance ကို ရရှိနိုင်ခြင်း ဖြစ်သည်။ Var(X+Y) = Var(X) + Var(Y)
SD တွင် ဤကဲ့သို့ ရိုးရှင်းသော ပေါင်းခြင်းပုံသေနည်းမရှိပါ။
နမူနာ - Mean Squared Error (MSE), Covariance Matrix, Principal Component Analysis (PCA) စသည့် Advanced Methods များတွင် Variance ကို အခြေခံ၍ တွက်ချက်ကြသည်။
အနှစ်ချုပ်အနေဖြင့်ပြောရလျှင်၊ Standard Deviation (SD) သည် လူအများနားလည်လွယ်ခြင်း၊ လက်တွေ့ဘဝနှင့် ကိုက်ညီခြင်း တို့ကြောင့် ရှင်းပြရာတွင် အသုံးဝင်ပါသည်။ Variance သည် သင်္ချာနှင့် ကွန်ပျူတာပရိုဂရမ်များတွင် တွက်ချက်မှုနှင့် မော်ဒယ်လ်တည်ဆောက်မှုများအတွက် ပိုမိုအသုံးဝင်သည် ဟု မှတ်သားနိုင်ပါသည်။
အောက်တိုဘာလ ၂၄ ရက်မှာဖွင့်မဲ့
Basic statistics with R Batch-73 (Video class)
Statistics with R Level-2 (Video class)
သင်တန်းအသေးစိတ်ကြည့်ရန်
https://www.facebook.com/share/p/1BSifqVhuD/
20/10/2025
လူမှုရေး၊ ကျန်းမာရေး၊ စီးပွားရေးနဲ့ ပညာရေး ဆုံးဖြတ်ချက်တွေမှာ — Chi-Square Test ဘာကြောင့် အရေးကြီးလဲ?
Chi-Square Test သည် သင်္ချာပညာနှင့် စာရင်းအင်းပညာတွင် အလွန်အရေးကြီးသော ကိရိယာတစ်ခုဖြစ်သည်။ ၎င်းကို အထူးသဖြင့် အမျိုးအစားခွဲခြားထားသော အချက်အလက်များ (categorical data) များအတွင်း ဆက်နွယ်မှုရှိ/မရှိ သို့မဟုတ် မျှော်မှန်းထားသော ဖြန့်ဝေမှုနှင့် ကွဲပြားမှုရှိ/မရှိကို စစ်ဆေးရန် အသုံးပြုသည်။ လူမှုရေး၊ ကျန်းမာရေး၊ စီးပွားရေး၊ ပညာရေး စသည့် လူ့အဖွဲ့အစည်းနှင့်ဆိုင်သော နယ်ပယ်အသီးသီးတွင် အခြေအနေများကို စိစစ်ဖော်ထုတ်ရာ၌ မရှိမဖြစ်လိုအပ်သည်။
ဤစမ်းသပ်မှုမှတဆင့် သုတေသနပြုရာတွင် အချက်အလက်များကို ပိုမိုနက်နဲစွာ သိမြင်နားလည်စေပြီး၊ တိကျမှန်ကန်သော ဆုံးဖြတ်ချက်များချနိုင်ရန် ခိုင်မာသော အခြေခံအချက်အလက်များကို ရယူနိုင်စေသည်။ ထို့ကြောင့် Chi-Square Test သည် ကဏ္ဍအနှံ့ အသုံးဝင်မှုကြီးမားပြီး သုတေသနနှင့် ဆုံးဖြတ်ချက်ချမှတ်ခြင်းတို့တွင် အဓိက အရေးပါသော စမ်းသပ်မှုတစ်ခုအဖြစ် သတ်မှတ်ခံထားရသည်။
Chi-Square Test အမျိုးအစား ၂ မျိုးနှင့် လက်တွေ့ဘဝ ဥပမာများ
၁။ Chi-Square Test of Independence
ရည်ရွယ်ချက် - အမျိုးအစားခွဲခြားထားသော ကိန်းရှင်နှစ်ခုကြားတွင် စာရင်းအင်းအရ သိသာထင်ရှားသည့် ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးသည်။ ဆိုလိုသည်မှာ ကိန်းရှင်တစ်ခု၏ တန်ဖိုးက အခြားတစ်ခု၏ တန်ဖိုးကို မှီခိုနေသလား/လွတ်လပ်နေသလား သိရှိရန်ဖြစ်သည်။
လက်တွေ့ဘဝ ဥပမာ - ၂၀၂၄ ခုနှစ်အတွင်း မြို့တော်တစ်ခုရှိ လူများ၏ အသက်အုပ်စု (၁၈-၃၀၊ ၃၁-၅၀၊ ၅၁ နှင့် အထက်) နှင့် ၎င်းတို့ နှစ်သက်သော သတင်းကြည့်ရှုသည့် မီဒီယာ (ရုပ်သံလိုင်း၊ အွန်လိုင်း လူမှုကွန်ရက်၊ သတင်းစာ/မဂ္ဂဇင်း) ကြား ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးခြင်း။ ရလဒ်အရ အသက်အုပ်စုအလိုက် နှစ်သက်သော မီဒီယာ ရွေးချယ်မှု ကွာခြားနေပါက၊ မီဒီယာဖြန့်ချိသူများ သည် ပစ်မှတ်အသက်အုပ်စုအလိုက် မဟာဗျူဟာများ ပြောင်းလဲချမှတ်နိုင်သည်။
၂။ Chi-Square Test of Goodness of Fit (သင့်လျော်မှု စစ်ဆေးခြင်း)
ရည်ရွယ်ချက် - အမျိုးအစားခွဲခြားထားသော ကိန်းရှင်တစ်ခု၏ လေ့လာတွေ့ရှိရသော တန်ဖိုးများ သည် မျှော်မှန်းထားသော တန်ဖိုးများ သို့မဟုတ် ဖြန့်ဝေမှု ပုံစံနှင့် စာရင်းအင်းအရ သိသာထင်ရှားစွာ ကိုက်ညီမှု ရှိ/မရှိ စစ်ဆေးသည်။
လက်တွေ့ဘဝ ဥပမာ - အစားအသောက် ကုမ္ပဏီတစ်ခုက ၎င်းတို့၏ ထုတ်ကုန်သစ် လေးမျိုးကို စူပါမားကတ်များတွင် တစ်ခုချင်းစီ ၂၅% ဖြင့် ဖြန့်ဝေလိုသည် (မျှော်မှန်းချက်)။ ထိုအခါ စမ်းသပ်ကာလအပြီးတွင် တကယ်တမ်း ရောင်းချရမှု ရာခိုင်နှုန်း (လေ့လာတွေ့ရှိချက်) သည် မျှော်မှန်းထားသော ၂၅% စီနှင့် ကိုက်ညီ/မကိုက်ညီကို စစ်ဆေးခြင်း။ ရလဒ်အရ ရောင်းအား ဖြန့်ဝေမှုသည် ၂၅% စီနှင့် သိသိသာသာ ကွာခြားနေပါက၊ ကုမ္ပဏီသည် မည်သည့်အရသာကို ပိုမိုထုတ်လုပ်ရမည် စသည်ဖြင့် ဆုံးဖြတ်နိုင်သည်။
Chi-Square Test အသုံးများသော နယ်ပယ်များနှင့် ဥပမာများ
၁။ လူမှုရေးသုတေသန
ဥပမာ - လူဦးရေအုပ်စု ၃ မျိုး (မြို့ပြနေထိုင်သူ၊ ကျေးလက်နေထိုင်သူ၊ ပြည်ပပြန်များ) တို့၏ ပတ်ဝန်းကျင်ထိန်းသိမ်းရေးဆိုင်ရာ အရေးယူဆောင်ရွက်မှု အဆင့် တို့ကြား ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးခြင်း။
၂။ ဆေးဘက်ရေးရာ
ဥပမာ - ဒေသတစ်ခုရှိ အသက်ရှူလမ်းကြောင်းဆိုင်ရာ ရောဂါဖြစ်ပွားသူများ နှင့် ၎င်းတို့၏ ဆေးလိပ်သောက်ခြင်း အခြေအနေ ကြား ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးခြင်း။
၃။ စီးပွားရေးနှင့် စျေးကွက်ရှာဖွေရေး
ဥပမာ - အွန်လိုင်းစျေးဝယ်မှု ပလက်ဖောင်းတစ်ခုတွင် ဖောက်သည်၏ ပညာအရည်အချင်း နှင့် ၎င်းတို့ အသုံးပြုသော ငွေပေးချေမှုစနစ် တို့ကြား ကွဲပြားမှု ရှိ/မရှိ စစ်ဆေးခြင်း။
၄။ ပညာရေးသုတေသန
ဥပမာ - အထက်တန်းကျောင်းသားများ၏ အိမ်စာ လုပ်ဆောင်မှု ပုံစံ နှင့် စာမေးပွဲ အောင်မြင်မှု အခြေအနေ (အောင်/မအောင်) ကြား ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးခြင်း။
Chi-Square Test ၏ အားသာချက်များနှင့် ကန့်သတ်ချက်များ
အားသာချက်များ (Advantages)
ရိုးရှင်းလွယ်ကူခြင်း - အမျိုးအစားခွဲခြားထားသော အချက်အလက်များကို လွယ်ကူလျင်မြန်စွာ စမ်းသပ်နိုင်သည်။
တိကျမှန်ကန်မှု - မျှော်မှန်းချက်နှင့် တကယ်ဖြစ်ပွားမှုကြား ကွာခြားမှုကို သိပ္ပံနည်းကျ သက်သေပြနိုင်သည်။
ဆက်နွယ်မှု ဖော်ထုတ်ခြင်း - ကိန်းရှင်များကြား ဆက်နွယ်မှု ရှိ/မရှိကို ရှင်းလင်းစွာ ဖော်ပြနိုင်သည်။
ကန့်သတ်ချက်များ (Limitations)
နမူနာပမာဏ လိုအပ်ခြင်း - နမူနာအရေအတွက် (Sample size) အလွန်နည်းပါက စမ်းသပ်မှု၏ တိကျမှန်ကန်မှု (reliability) နည်းပါးနိုင်သည်။
Categorical Data သာ အသုံးပြုနိုင်ခြင်း - အရေအတွက်ဆိုင်ရာ အချက်အလက် (Numerical Data) များအတွက် အသုံးမပြုနိုင်ပါ။
အကြောင်း/ရလဒ် ဆက်နွယ်မှု မဖော်ပြနိုင်ခြင်း - ကိန်းရှင်နှစ်ခု ဆက်နွယ်မှုရှိသည်ဟု ပြသသော်လည်း၊ မည်သည့်အရာက မည်သည့်အရာကို ဖြစ်ပေါ်စေသည်ဟူသော (Cause-effect) ဆက်နွယ်မှုကို တိုက်ရိုက်မဖော်ပြနိုင်ပါ။
Chi-Square Test သည် သုတေသီများနှင့် ဆုံးဖြတ်ချက်ချမှတ်သူများအတွက် အခြေအနေများကို ပိုမိုကောင်းမွန်စွာ နားလည်စေရန်နှင့် လက်တွေ့ကမ္ဘာ ပြဿနာများကို ဖြေရှင်းရာတွင် တိကျမှန်ကန်သော၊ အချက်အလက်အခြေခံသော (Data-Driven) ဆုံးဖြတ်ချက်များချနိုင်ရန် မရှိမဖြစ်လိုအပ်သည့် စာရင်းအင်းကိရိယာတစ်ခုဖြစ်သည်။ ၎င်း၏ ရိုးရှင်းမှုနှင့် ကျယ်ပြန့်သော အသုံးဝင်မှုများကြောင့် လူမှုရေး၊ စီးပွားရေး၊ ကျန်းမာရေး စသည့် ကဏ္ဍမျိုးစုံတွင် အရေးပါသော အခန်းကဏ္ဍမှ ပါဝင်နေပါသည်။
အောက်တိုဘာလ ၂၄ ရက်မှာဖွင့်မဲ့
Basic statistics with R Batch-73 (Video class)
Statistics with R Level-2 (Video class)
သင်တန်းအသေးစိတ်ကြည့်ရန်
https://www.facebook.com/share/p/1BSifqVhuD/
လူမှုရေး၊ ကျန်းမာရေး၊ စီးပွားရေးနဲ့ ပညာရေး ဆုံးဖြတ်ချက်တွေမှာ — Chi-Square Test ဘာကြောင့် အရေးကြီးလဲ?
Chi-Square Test သည် သင်္ချာပညာနှင့် စာရင်းအင်းပညာတွင် အလွန်အရေးကြီးသော ကိရိယာတစ်ခုဖြစ်သည်။ ၎င်းကို အထူးသဖြင့် အမျိုးအစားခွဲခြားထားသော အချက်အလက်များ (categorical data) များအတွင်း ဆက်နွယ်မှုရှိ/မရှိ သို့မဟုတ် မျှော်မှန်းထားသော ဖြန့်ဝေမှုနှင့် ကွဲပြားမှုရှိ/မရှိကို စစ်ဆေးရန် အသုံးပြုသည်။ လူမှုရေး၊ ကျန်းမာရေး၊ စီးပွားရေး၊ ပညာရေး စသည့် လူ့အဖွဲ့အစည်းနှင့်ဆိုင်သော နယ်ပယ်အသီးသီးတွင် အခြေအနေများကို စိစစ်ဖော်ထုတ်ရာ၌ မရှိမဖြစ်လိုအပ်သည်။
ဤစမ်းသပ်မှုမှတဆင့် သုတေသနပြုရာတွင် အချက်အလက်များကို ပိုမိုနက်နဲစွာ သိမြင်နားလည်စေပြီး၊ တိကျမှန်ကန်သော ဆုံးဖြတ်ချက်များချနိုင်ရန် ခိုင်မာသော အခြေခံအချက်အလက်များကို ရယူနိုင်စေသည်။ ထို့ကြောင့် Chi-Square Test သည် ကဏ္ဍအနှံ့ အသုံးဝင်မှုကြီးမားပြီး သုတေသနနှင့် ဆုံးဖြတ်ချက်ချမှတ်ခြင်းတို့တွင် အဓိက အရေးပါသော စမ်းသပ်မှုတစ်ခုအဖြစ် သတ်မှတ်ခံထားရသည်။
Chi-Square Test အမျိုးအစား ၂ မျိုးနှင့် လက်တွေ့ဘဝ ဥပမာများ
၁။ Chi-Square Test of Independence
ရည်ရွယ်ချက် - အမျိုးအစားခွဲခြားထားသော ကိန်းရှင်နှစ်ခုကြားတွင် စာရင်းအင်းအရ သိသာထင်ရှားသည့် ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးသည်။ ဆိုလိုသည်မှာ ကိန်းရှင်တစ်ခု၏ တန်ဖိုးက အခြားတစ်ခု၏ တန်ဖိုးကို မှီခိုနေသလား/လွတ်လပ်နေသလား သိရှိရန်ဖြစ်သည်။
လက်တွေ့ဘဝ ဥပမာ - ၂၀၂၄ ခုနှစ်အတွင်း မြို့တော်တစ်ခုရှိ လူများ၏ အသက်အုပ်စု (၁၈-၃၀၊ ၃၁-၅၀၊ ၅၁ နှင့် အထက်) နှင့် ၎င်းတို့ နှစ်သက်သော သတင်းကြည့်ရှုသည့် မီဒီယာ (ရုပ်သံလိုင်း၊ အွန်လိုင်း လူမှုကွန်ရက်၊ သတင်းစာ/မဂ္ဂဇင်း) ကြား ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးခြင်း။ ရလဒ်အရ အသက်အုပ်စုအလိုက် နှစ်သက်သော မီဒီယာ ရွေးချယ်မှု ကွာခြားနေပါက၊ မီဒီယာဖြန့်ချိသူများ သည် ပစ်မှတ်အသက်အုပ်စုအလိုက် မဟာဗျူဟာများ ပြောင်းလဲချမှတ်နိုင်သည်။
၂။ Chi-Square Test of Goodness of Fit (သင့်လျော်မှု စစ်ဆေးခြင်း)
ရည်ရွယ်ချက် - အမျိုးအစားခွဲခြားထားသော ကိန်းရှင်တစ်ခု၏ လေ့လာတွေ့ရှိရသော တန်ဖိုးများ သည် မျှော်မှန်းထားသော တန်ဖိုးများ သို့မဟုတ် ဖြန့်ဝေမှု ပုံစံနှင့် စာရင်းအင်းအရ သိသာထင်ရှားစွာ ကိုက်ညီမှု ရှိ/မရှိ စစ်ဆေးသည်။
လက်တွေ့ဘဝ ဥပမာ - အစားအသောက် ကုမ္ပဏီတစ်ခုက ၎င်းတို့၏ ထုတ်ကုန်သစ် လေးမျိုးကို စူပါမားကတ်များတွင် တစ်ခုချင်းစီ ၂၅% ဖြင့် ဖြန့်ဝေလိုသည် (မျှော်မှန်းချက်)။ ထိုအခါ စမ်းသပ်ကာလအပြီးတွင် တကယ်တမ်း ရောင်းချရမှု ရာခိုင်နှုန်း (လေ့လာတွေ့ရှိချက်) သည် မျှော်မှန်းထားသော ၂၅% စီနှင့် ကိုက်ညီ/မကိုက်ညီကို စစ်ဆေးခြင်း။ ရလဒ်အရ ရောင်းအား ဖြန့်ဝေမှုသည် ၂၅% စီနှင့် သိသိသာသာ ကွာခြားနေပါက၊ ကုမ္ပဏီသည် မည်သည့်အရသာကို ပိုမိုထုတ်လုပ်ရမည် စသည်ဖြင့် ဆုံးဖြတ်နိုင်သည်။
Chi-Square Test အသုံးများသော နယ်ပယ်များနှင့် ဥပမာများ
၁။ လူမှုရေးသုတေသန
ဥပမာ - လူဦးရေအုပ်စု ၃ မျိုး (မြို့ပြနေထိုင်သူ၊ ကျေးလက်နေထိုင်သူ၊ ပြည်ပပြန်များ) တို့၏ ပတ်ဝန်းကျင်ထိန်းသိမ်းရေးဆိုင်ရာ အရေးယူဆောင်ရွက်မှု အဆင့် တို့ကြား ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးခြင်း။
၂။ ဆေးဘက်ရေးရာ
ဥပမာ - ဒေသတစ်ခုရှိ အသက်ရှူလမ်းကြောင်းဆိုင်ရာ ရောဂါဖြစ်ပွားသူများ နှင့် ၎င်းတို့၏ ဆေးလိပ်သောက်ခြင်း အခြေအနေ ကြား ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးခြင်း။
၃။ စီးပွားရေးနှင့် စျေးကွက်ရှာဖွေရေး
ဥပမာ - အွန်လိုင်းစျေးဝယ်မှု ပလက်ဖောင်းတစ်ခုတွင် ဖောက်သည်၏ ပညာအရည်အချင်း နှင့် ၎င်းတို့ အသုံးပြုသော ငွေပေးချေမှုစနစ် တို့ကြား ကွဲပြားမှု ရှိ/မရှိ စစ်ဆေးခြင်း။
၄။ ပညာရေးသုတေသန
ဥပမာ - အထက်တန်းကျောင်းသားများ၏ အိမ်စာ လုပ်ဆောင်မှု ပုံစံ နှင့် စာမေးပွဲ အောင်မြင်မှု အခြေအနေ (အောင်/မအောင်) ကြား ဆက်နွယ်မှု ရှိ/မရှိ စစ်ဆေးခြင်း။
Chi-Square Test ၏ အားသာချက်များနှင့် ကန့်သတ်ချက်များ
အားသာချက်များ (Advantages)
ရိုးရှင်းလွယ်ကူခြင်း - အမျိုးအစားခွဲခြားထားသော အချက်အလက်များကို လွယ်ကူလျင်မြန်စွာ စမ်းသပ်နိုင်သည်။
တိကျမှန်ကန်မှု - မျှော်မှန်းချက်နှင့် တကယ်ဖြစ်ပွားမှုကြား ကွာခြားမှုကို သိပ္ပံနည်းကျ သက်သေပြနိုင်သည်။
ဆက်နွယ်မှု ဖော်ထုတ်ခြင်း - ကိန်းရှင်များကြား ဆက်နွယ်မှု ရှိ/မရှိကို ရှင်းလင်းစွာ ဖော်ပြနိုင်သည်။
ကန့်သတ်ချက်များ (Limitations)
နမူနာပမာဏ လိုအပ်ခြင်း - နမူနာအရေအတွက် (Sample size) အလွန်နည်းပါက စမ်းသပ်မှု၏ တိကျမှန်ကန်မှု (reliability) နည်းပါးနိုင်သည်။
Categorical Data သာ အသုံးပြုနိုင်ခြင်း - အရေအတွက်ဆိုင်ရာ အချက်အလက် (Numerical Data) များအတွက် အသုံးမပြုနိုင်ပါ။
အကြောင်း/ရလဒ် ဆက်နွယ်မှု မဖော်ပြနိုင်ခြင်း - ကိန်းရှင်နှစ်ခု ဆက်နွယ်မှုရှိသည်ဟု ပြသသော်လည်း၊ မည်သည့်အရာက မည်သည့်အရာကို ဖြစ်ပေါ်စေသည်ဟူသော (Cause-effect) ဆက်နွယ်မှုကို တိုက်ရိုက်မဖော်ပြနိုင်ပါ။
Chi-Square Test သည် သုတေသီများနှင့် ဆုံးဖြတ်ချက်ချမှတ်သူများအတွက် အခြေအနေများကို ပိုမိုကောင်းမွန်စွာ နားလည်စေရန်နှင့် လက်တွေ့ကမ္ဘာ ပြဿနာများကို ဖြေရှင်းရာတွင် တိကျမှန်ကန်သော၊ အချက်အလက်အခြေခံသော (Data-Driven) ဆုံးဖြတ်ချက်များချနိုင်ရန် မရှိမဖြစ်လိုအပ်သည့် စာရင်းအင်းကိရိယာတစ်ခုဖြစ်သည်။ ၎င်း၏ ရိုးရှင်းမှုနှင့် ကျယ်ပြန့်သော အသုံးဝင်မှုများကြောင့် လူမှုရေး၊ စီးပွားရေး၊ ကျန်းမာရေး စသည့် ကဏ္ဍမျိုးစုံတွင် အရေးပါသော အခန်းကဏ္ဍမှ ပါဝင်နေပါသည်။
အောက်တိုဘာလ ၂၄ ရက်မှာဖွင့်မဲ့
Basic statistics with R Batch-73 (Video class)
Statistics with R Level-2 (Video class)
သင်တန်းအသေးစိတ်ကြည့်ရန်
https://www.facebook.com/share/p/1BSifqVhuD/