آزمایش فرضیه یک روش ضروری در آمار است. یک آزمون فرضیه دو عبارت انحصاری متقابل را ارزیابی می کند تا مشخص کند کدام عبارت به بهترین وجه توسط داده های نمونه پشتیبانی می شود. وقتی گفته می شود یافته ای از نظر آماری معنادار است، به دلیل آزمون فرضیه است.
روشهای تأیید
روشهای آزمون فرضیههای آماری، روشهای تحلیل آماری هستند. به طور معمول، دو مجموعه از آمار مقایسه می شوند، یا یک مجموعه داده نمونه با یک مجموعه داده مصنوعی از یک مدل ایده آل مقایسه می شود. داده ها باید به گونه ای تفسیر شوند که معانی جدیدی به آنها اضافه شود. می توانید با فرض ساختار مشخصی از نتیجه نهایی و استفاده از روش های آماری برای تأیید یا رد فرض، آنها را تفسیر کنید. این فرض را فرضیه و آزمون های آماری مورد استفاده برای این منظور را فرضیه های آماری می نامند.
فرضیه H0 و H1
دو اصل وجود داردمفاهیم آزمون آماری فرضیه ها - به اصطلاح "فرضیه اصلی یا صفر" و "فرضیه جایگزین". به آنها فرضیه های نیمن-پیرسون نیز گفته می شود. فرض آزمون آماری فرضیه صفر، فرضیه اصلی یا به اختصار H0 نامیده می شود. اغلب به عنوان فرض پیش فرض یا این فرض که هیچ چیز تغییر نکرده است نامیده می شود. نقض فرض آزمون اغلب به عنوان فرضیه اول، فرضیه جایگزین یا H1 نامیده می شود. H1 مختصر برخی از فرضیه های دیگر است، زیرا تنها چیزی که در مورد آن می دانیم این است که داده های H0 را می توان نادیده گرفت.
قبل از رد یا عدم رد فرضیه صفر، نتیجه آزمون باید تفسیر شود. اگر رابطه بین مجموعههای داده بعید است که اجرای فرضیه صفر با توجه به احتمال آستانه - سطح معنیداری باشد، از نظر آماری معنیدار تلقی میشود. همچنین معیارهای خوبی برای آزمون فرضیه های آماری وجود دارد. این نام معیار آزمون فرضیه است که با قانون فرضی توزیع مجهول مرتبط است. این یک اندازه گیری عددی از اختلاف بین توزیع های تجربی و نظری است.
رویه و معیارهای آزمون فرضیه های آماری
رایج ترین روش های انتخاب فرضیه بر اساس معیار اطلاعات آکایک یا ضریب بیزی است. آزمون فرضیه های آماری یک تکنیک کلیدی در استنتاج و استنتاج بیزی است، اگرچه این دو نوع تفاوت های قابل توجهی دارند. آزمون های فرضیه های آماریرویهای را تعریف کنید که احتمال تصمیمگیری اشتباه در مورد یک فرضیه پیشفرض نادرست یا صفر را کنترل میکند. این روش بر اساس میزان احتمال کارکرد آن است. این احتمال تصمیم گیری اشتباه، عدم وجود فرضیه صفر و وجود هیچ فرضیه جایگزین خاصی است. آزمایش نمی تواند درست یا نادرست بودن آن را نشان دهد.
روشهای جایگزین نظریه تصمیم
روشهای جایگزین تئوری تصمیم وجود دارد که در آنها فرضیه صفر و اول به طور مساوی تری در نظر گرفته می شوند. سایر رویکردهای تصمیم گیری، مانند نظریه بیزی، به جای تمرکز بر یک فرضیه صفر، تلاش می کنند تا پیامدهای تصمیمات بد را در همه احتمالات متعادل کنند. تعدادی از رویکردهای دیگر برای تصمیمگیری اینکه کدام یک از فرضیهها درست است، بر اساس دادههایی است که کدام یک از آنها ویژگیهای مورد نظر را دارند. اما آزمون فرضیه رویکرد غالب برای تجزیه و تحلیل داده ها در بسیاری از زمینه های علم است.
آزمایش فرضیه آماری
هرگاه یک مجموعه از نتایج با مجموعه دیگری متفاوت است، باید به آزمون فرضیه های آماری یا آزمون های فرضیه های آماری تکیه کرد. تفسیر آنها مستلزم درک صحیح مقادیر p و مقادیر بحرانی است. همچنین درک این نکته مهم است که صرف نظر از سطح اهمیت، آزمون ها ممکن است همچنان دارای خطا باشند. بنابراین، نتیجه گیری ممکن است درست نباشد.
فرایند آزمایش شاملچند مرحله:
- فرضیه اولیه برای تحقیق در حال ایجاد است.
- فرضیه های صفر و جایگزین مرتبط نشان داده شده است.
- فرض های آماری در مورد نمونه در آزمون را توضیح می دهد.
- تعیین اینکه کدام آزمون مناسب است.
- سطح معناداری و آستانه احتمالی که زیر آن فرضیه صفر رد می شود را انتخاب کنید.
- توزیع آمار آزمون فرضیه صفر مقادیر احتمالی را نشان می دهد که در آن فرضیه صفر رد می شود.
- محاسبه در حال انجام است.
- تصمیم برای رد یا پذیرش فرضیه صفر به نفع یک جایگزین گرفته می شود.
یک جایگزین وجود دارد که از مقدار p استفاده می کند.
آزمون های اهمیت
داده های خالص بدون تفسیر کاربرد عملی ندارند. در آمار، هنگام پرسیدن سوال در مورد داده ها و تفسیر نتایج، از روش های آماری برای اطمینان از صحت یا احتمال پاسخ ها استفاده می شود. هنگام آزمون فرضیه های آماری، این دسته از روش ها، آزمون های آماری یا آزمون های معناداری نامیده می شوند. اصطلاح «فرضیه» یادآور روشهای علمی است که در آن فرضیهها و نظریهها بررسی میشوند. در آمار، یک آزمون فرضیه به یک مقدار با فرض معین نتیجه می دهد. این به شما امکان میدهد تا تفسیر کنید که آیا یک فرض درست است یا نقض شده است.
تفسیر آماری آزمونها
آزمون های فرضیهبرای تعیین اینکه کدام نتایج تحقیق منجر به رد فرضیه صفر برای یک سطح از پیش تعیین شده از اهمیت می شود، استفاده می شود. نتایج یک آزمون فرضیه های آماری باید تفسیر شود تا کار بر روی آن ادامه یابد. دو شکل رایج از معیارهای آزمون فرضیه های آماری وجود دارد. اینها مقادیر p و مقادیر بحرانی هستند. بسته به معیار انتخاب شده، نتایج به دست آمده باید متفاوت تفسیر شوند.
مقدار p چیست
خروجی
هنگام تفسیر p-value از نظر آماری معنی دار توصیف می شود. در واقع این شاخص به معنای احتمال خطا در صورت رد فرضیه صفر است. به عبارت دیگر، می توان از آن برای نامگذاری مقداری استفاده کرد که بتوان از آن برای تفسیر یا کمی کردن نتیجه آزمون استفاده کرد و احتمال خطا در رد فرضیه صفر را تعیین کرد. به عنوان مثال، می توانید یک تست نرمال بودن را بر روی نمونه ای از داده ها انجام دهید و دریابید که احتمال کمی وجود دارد. با این حال، فرضیه صفر نباید رد شود. یک آزمون فرضیه آماری ممکن است یک مقدار p را برگرداند. این با مقایسه مقدار p در برابر یک مقدار آستانه از پیش تعیین شده به نام سطح معناداری انجام می شود.
سطح اهمیت
سطح اهمیت اغلب با حرف کوچک یونانی "آلفا" نوشته می شود. مقدار کلی مورد استفاده برای آلفا 5٪ یا 0.05 است. مقدار آلفای کوچکتر تفسیر قابل اعتمادتری از فرضیه صفر را نشان می دهد. p-value بامقدار آلفای از پیش انتخاب شده اگر مقدار p کمتر از آلفا باشد، نتیجه از نظر آماری معنادار است. سطح معنی داری را می توان با کم کردن آن از یک معکوس کرد. این کار برای تعیین سطح اطمینان فرضیه با توجه به داده های نمونه مشاهده شده انجام می شود. هنگام استفاده از این روش برای آزمون فرضیه های آماری، P-value احتمالی است. این بدان معنی است که در فرآیند تفسیر نتیجه یک آزمون آماری، فرد نمی داند درست یا نادرست است.
نظریه آزمون فرضیه های آماری
رد فرضیه صفر به این معنی است که شواهد آماری کافی وجود دارد که محتمل به نظر می رسد. در غیر این صورت یعنی آمار کافی برای رد آن وجود ندارد. می توان آزمون های آماری را بر حسب دوگانگی رد و پذیرش فرضیه صفر در نظر گرفت. خطر آزمون آماری فرضیه صفر این است که در صورت پذیرش، ممکن است درست به نظر برسد. در عوض، صحیح تر است که بگوییم فرضیه صفر رد نمی شود زیرا شواهد آماری کافی برای رد آن وجود ندارد.
این لحظه اغلب افراد اضافی تازه کار را گیج می کند. در چنین حالتی، مهم است که به خود یادآوری کنید که نتیجه احتمالی است و حتی پذیرش فرضیه صفر هنوز هم شانس کمی برای خطا دارد.
فرضیه صفر درست یا نادرست
تفسیر مقدار p به معنای آن صفر نیستفرضیه درست است یا نادرست این بدان معناست که بر اساس داده های تجربی و آزمون آماری انتخابی، انتخابی برای رد یا عدم رد فرضیه صفر در سطح معینی از اهمیت آماری انجام شده است. بنابراین، مقدار p را می توان به عنوان احتمال داده های داده شده تحت یک فرض از پیش تعیین شده در آزمون های آماری در نظر گرفت. P-value اندازهگیری است که نشان میدهد در صورت درست بودن فرضیه صفر، چقدر نمونه داده مشاهده میشود.
تفسیر مقادیر بحرانی
برخی از آزمایشات p. در عوض، ممکن است فهرستی از مقادیر بحرانی را برگردانند. نتایج چنین مطالعه ای به روشی مشابه تفسیر می شود. به جای مقایسه یک مقدار p منفرد با سطح معناداری از پیش تعیین شده، آمار آزمون با یک مقدار بحرانی مقایسه می شود. اگر معلوم شد که کمتر است، به این معنی است که نمی توان فرضیه صفر را رد کرد. اگر بزرگتر یا مساوی باشد، فرضیه صفر باید رد شود. معنای الگوریتم آزمون فرضیه های آماری و تفسیر نتیجه آن مشابه مقدار p است. سطح معناداری انتخاب شده یک تصمیم احتمالی برای رد یا رد فرض آزمون پایه با توجه به داده ها است.
اشتباهات در آزمون های آماری
تفسیر آزمون فرضیه های آماری احتمالی است. وظیفه آزمون فرضیه های آماری یافتن یک گزاره درست یا نادرست نیست. شواهد آزمون ممکن است اشتباه باشد. به عنوان مثال، اگر آلفا 5٪ بود، به این معنی است که در اکثر موارد 1 از 20 استفرضیه صفر به اشتباه رد خواهد شد. یا به دلیل نویز آماری موجود در نمونه داده ها این کار را انجام نمی دهد. با توجه به این نکته، مقدار p کوچکی که در آن فرضیه صفر رد می شود، ممکن است به این معنی باشد که این فرضیه نادرست است یا اشتباهی رخ داده است. اگر این نوع خطا ایجاد شود، نتیجه را مثبت کاذب می نامند. و چنین خطایی یک خطا از نوع اول در هنگام آزمایش فرضیه های آماری است. از طرف دیگر، اگر مقدار p به اندازه کافی بزرگ باشد که به معنای رد فرضیه صفر باشد، ممکن است به معنای درست بودن آن باشد. یا صحیح نیست، و رویدادی بعید رخ داده است که به دلیل آن خطا رخ داده است. به این نوع خطا، منفی کاذب می گویند.
احتمال خطا
هنگام آزمایش فرضیه های آماری، هنوز احتمال ایجاد هر یک از این نوع خطاها وجود دارد. داده های نادرست یا نتیجه گیری های نادرست کاملا محتمل است. در حالت ایده آل، سطح معناداری باید انتخاب شود که احتمال یکی از این خطاها را به حداقل برساند. به عنوان مثال، آزمون آماری فرضیه های صفر ممکن است سطح بسیار پایینی از اهمیت داشته باشد. اگرچه سطوح معنیداری مانند 0.05 و 0.01 در بسیاری از زمینههای علمی رایج است، رایجترین سطح معنیداری که استفاده میشود 310^-7 یا 0.0000003 است. اغلب به عنوان "5-sigma" نامیده میشود. این بدان معنی است که نتیجه گیری تصادفی با احتمال 1 در 3.5 میلیون تکرار مستقل از آزمایش ها بود. نمونه هایی از آزمون فرضیه های آماری اغلب دارای چنین خطاهایی هستند. به همین دلیل است که نتایج مستقل مهم است.تأیید.
نمونه هایی از استفاده از تأیید آماری
چندین مثال رایج از آزمون فرضیه در عمل وجود دارد. یکی از پرطرفدارترین آنها به نام "چای دم" معروف است. دکتر موریل بریستول، همکار رابرت فیشر، بنیانگذار بیومتریک، ادعا کرد که می تواند با اطمینان بگوید که آیا ابتدا به یک فنجان چای اضافه شده است یا شیر. فیشر به او پیشنهاد داد که به طور تصادفی هشت فنجان (چهار فنجان از هر نوع) به او بدهد. آمار آزمون ساده بود: شمارش تعداد موفقیت در انتخاب یک فنجان. منطقه بحرانی تنها موفقیت از 4 بود، احتمالاً بر اساس معیار احتمال معمول (< 5٪؛ 1 در 70 ≈ 1.4٪). فیشر استدلال کرد که یک فرضیه جایگزین لازم نیست. این خانم به درستی هر فنجان را شناسایی کرد که از نظر آماری نتیجه قابل توجهی در نظر گرفته شد. این تجربه منجر به کتاب روشهای آماری برای محققان فیشر شد.
مثال متهم
رویه محاکمه آماری با دادگاه کیفری قابل مقایسه است که در آن متهم تا زمانی که مجرمیتش ثابت نشود بی گناه فرض می شود. دادستان تلاش می کند تا مجرمیت متهم را ثابت کند. تنها زمانی که شواهد کافی برای اتهام وجود داشته باشد می توان متهم را مجرم شناخت. در ابتداي دادرسي دو فرضيه وجود دارد: «متهم مجرم نيست» و «متهم مجرم است». فرضیه بی گناهی را تنها زمانی می توان رد کرد که احتمال اشتباه بسیار کم باشد زیرا فرد نمی خواهد یک متهم بی گناه را محکوم کند. به چنین خطایی خطای نوع اول و وقوع آن می گویندبه ندرت کنترل می شود در نتیجه این رفتار نامتقارن، خطای نوع دوم، یعنی تبرئه مرتکب، شایع تر است.
آمار هنگام تجزیه و تحلیل حجم زیادی از داده ها مفید است. این امر به همان اندازه در مورد آزمون فرضیهها صدق میکند، که میتواند نتیجهگیری را توجیه کند، حتی اگر هیچ نظریه علمی وجود نداشته باشد. در مثال مزه چای، "مشخص بود" که بین ریختن شیر در چای یا ریختن چای در شیر تفاوتی وجود ندارد.
کاربرد عملی واقعی آزمون فرضیه شامل:
- تست اینکه آیا مردان بیشتر از زنان کابوس می بینند یا خیر؛
- اسناد سند؛
- بررسی تأثیر ماه کامل بر رفتار؛
- تعیین محدوده ای که در آن خفاش می تواند حشره را با استفاده از اکو تشخیص دهد؛
- انتخاب بهترین وسیله برای ترک سیگار؛
- بررسی اینکه آیا برچسبهای سپر منعکس کننده رفتار صاحب خودرو هستند.
آزمون فرضیه های آماری نقش مهمی در آمار به طور کلی و در استنتاج آماری دارد. آزمون ارزش به عنوان جایگزینی برای مقایسه سنتی ارزش پیش بینی شده و نتایج تجربی در هسته روش علمی استفاده می شود. هنگامی که یک نظریه فقط قادر به پیشبینی نشانه یک رابطه باشد، آزمونهای فرضیه هدایتشده را میتوان به گونهای پیکربندی کرد که فقط یک نتیجه آماری معنیدار از نظریه پشتیبانی کند. این شکل از نظریه ارزیابی سخت ترین استانتقاد از استفاده از آزمون فرضیه.