توزیع پیرسون: تعریف، کاربرد

2024 نویسنده: Angel Austin | [email protected]. آخرین اصلاح شده: 2023-12-17 05:24

قانون توزیع پیرسون چیست؟ پاسخ به این سوال گسترده نمی تواند ساده و مختصر باشد. سیستم پیرسون در ابتدا برای مدل سازی مشاهدات تحریف شده قابل مشاهده طراحی شده بود. در آن زمان، به خوبی شناخته شده بود که چگونه یک مدل نظری را تنظیم کنیم تا با دو تجمع یا لحظه اول داده های مشاهده شده مطابقت داشته باشد: هر توزیع احتمال را می توان مستقیماً گسترش داد تا گروهی از مقیاس های مکان را تشکیل دهد.

فرضیه پیرسون در مورد توزیع نرمال معیارها

به جز در موارد پاتولوژیک، مقیاس مکان را می توان به گونه ای دلخواه با میانگین مشاهده شده (تجمع کننده اول) و واریانس (کومولانت دوم) مطابقت داد. با این حال، چگونگی ساخت توزیع‌های احتمالی که در آن چولگی (انباشت سوم استاندارد شده) و کشیدگی (انباشت چهارم استاندارد) می‌توانند به طور مساوی آزادانه کنترل شوند، شناخته نشد. این نیاز هنگام تلاش برای تطبیق مدل های نظری شناخته شده با داده های مشاهده شده آشکار شد.که عدم تقارن نشان داد.

در ویدیوی زیر می توانید تجزیه و تحلیل توزیع کی پیرسون را ببینید.

تاریخ

در کار اصلی خود، پیرسون چهار نوع توزیع (با شماره I تا IV) را علاوه بر توزیع نرمال (که در ابتدا به عنوان نوع V شناخته می شد) شناسایی کرد. طبقه‌بندی به این بستگی دارد که آیا توزیع‌ها در یک بازه زمانی محدود، در یک نیمه محور یا در کل خط واقعی پشتیبانی می‌شوند، و اینکه آیا آنها به طور بالقوه اریب یا لزوماً متقارن هستند.

دو حذف در مقاله دوم تصحیح شد: او توزیع نوع V را دوباره تعریف کرد (در ابتدا فقط توزیع نرمال بود، اما اکنون با گامای معکوس) و توزیع نوع VI را معرفی کرد. دو مقاله اول با هم، پنج نوع اصلی سیستم پیرسون (I، III، IV، V و VI) را پوشش می‌دهند. در مقاله سوم، پیرسون (1916) انواع فرعی دیگری را معرفی کرد.

بهبود مفهوم

Rind یک راه ساده برای تجسم فضای پارامترهای سیستم پیرسون (یا توزیع معیارها) اختراع کرد که بعداً آن را پذیرفت. امروزه بسیاری از ریاضیدانان و آماردانان از این روش استفاده می کنند. انواع توزیع های پیرسون با دو کمیت مشخص می شوند که معمولا β1 و β2 نامیده می شوند. اولین مورد مربع عدم تقارن است. دومی کشش سنتی یا چهارمین لحظه استاندارد شده است: β2=γ2 + 3.

روش‌های ریاضی مدرن، کشیدگی γ2 را به‌جای گشتاور به‌عنوان تجمع‌دهنده تعریف می‌کنند، بنابراین برای یک نرمالتوزیع ما γ2=0 و β2=3 است. در اینجا ارزش دارد که سابقه تاریخی را دنبال کرده و از β2 استفاده کنیم. نمودار سمت راست نشان می دهد که یک توزیع پیرسون خاص کدام نوع است (با نقطه (β1، β2 مشخص می شود).

بسیاری از توزیع های اریب و/یا غیر مزوکورتیک که امروزه می شناسیم هنوز در اوایل دهه 1890 شناخته نشده بودند. آنچه اکنون به عنوان توزیع بتا شناخته می شود توسط توماس بیز به عنوان پارامتر خلفی توزیع برنولی در مقاله خود در سال 1763 در مورد احتمال معکوس استفاده شد.

توزیع بتا به دلیل حضور در سیستم پیرسون به شهرت رسید و تا دهه ۱۹۴۰ به عنوان توزیع پیرسون نوع I شناخته می شد. توزیع نوع II یک مورد خاص از نوع I است، اما معمولاً دیگر مشخص نمی شود.

توزیع گاما از کار خود او سرچشمه گرفت و قبل از اینکه در دهه های ۱۹۳۰ و ۱۹۴۰ نام مدرن خود را به دست آورد، به عنوان توزیع عادی پیرسون نوع III شناخته می شد. مقاله ای در سال 1895 توسط یک دانشمند، توزیع نوع IV را که حاوی توزیع t-Student است، به عنوان یک مورد خاص ارائه کرد، که چندین سال قبل از استفاده بعدی ویلیام سیلی گوست پیش از آن بود. مقاله او در سال 1901 توزیعی با گامای معکوس (نوع V) و اعداد اول بتا (نوع VI) ارائه کرد.

نظری دیگر

براساس Ord، پیرسون شکل اصلی معادله (1) را بر اساس فرمول مشتق لگاریتم تابع چگالی توزیع نرمال (که یک تقسیم خطی بر درجه دوم می دهد) ایجاد کرد.ساختار). بسیاری از متخصصان هنوز درگیر آزمایش فرضیه در مورد توزیع معیارهای پیرسون هستند. و کارایی خود را ثابت می کند.

کارل پیرسون که بود

کارل پیرسون یک ریاضیدان و آمارشناس زیستی انگلیسی بود. او با ایجاد رشته آمار ریاضی اعتبار دارد. در سال 1911 او اولین بخش آمار جهان را در دانشگاه کالج لندن تأسیس کرد و سهم قابل توجهی در زمینه های بیومتریک و هواشناسی داشت. پیرسون همچنین از طرفداران داروینیسم اجتماعی و اصلاح نژادی بود. او تحت حمایت و زندگی نامه سر فرانسیس گالتون بود.

بیومتریک

کارل پیرسون در ایجاد مکتب بیومتریک، که یک نظریه رقیب برای توصیف تکامل و وراثت جمعیت ها در آغاز قرن بیستم بود، نقش اساسی داشت. مجموعه هجده مقاله او "مشارکت ریاضی در نظریه تکامل" او را به عنوان بنیانگذار مکتب بیومتریک وراثت معرفی کرد. در واقع پیرسون بسیاری از زمان خود را در طول 1893-1904 اختصاص داد توسعه روش های آماری برای بیومتریک. این روش ها که امروزه به طور گسترده برای تجزیه و تحلیل آماری مورد استفاده قرار می گیرند، شامل آزمون کای اسکوئر، انحراف معیار، همبستگی و ضرایب رگرسیون هستند.

مسئله وراثت

قانون وراثت پیرسون بیان کرد که پلاسمای جوانه شامل عناصری است که از والدین و همچنین از اجداد دورتر به ارث رسیده اند که نسبت آنها با توجه به ویژگی های مختلف متفاوت است. کارل پیرسون از پیروان گالتون بود، و اگرچه آنهاکارها از برخی جهات متفاوت بودند، پیرسون مقدار قابل توجهی از مفاهیم آماری معلم خود را در فرموله کردن یک مدرسه بیومتریک برای وراثت، مانند قانون رگرسیون، استفاده کرد.

ویژگی های مدرسه

مکتب بیومتریک، برخلاف مندلیان، بر ارائه مکانیسمی برای وراثت متمرکز نبود، بلکه بر ارائه توصیفی ریاضی که ماهیت علی نداشت، متمرکز بود. در حالی که گالتون یک نظریه ناپیوسته از تکامل ارائه کرد که در آن گونه‌ها در جهش‌های بزرگ به جای تغییرات کوچکی که در طول زمان انباشته می‌شوند، تغییر می‌کنند، پیرسون به نقص‌هایی در این استدلال اشاره کرد و در واقع از ایده‌های خود برای توسعه یک نظریه پیوسته از تکامل استفاده کرد. مندلیان نظریه ناپیوسته تکامل را ترجیح می دادند.

در حالی که گالتون عمدتاً بر روی کاربرد روش های آماری برای مطالعه وراثت متمرکز بود، پیرسون و همکارش ولدون استدلال خود را در این زمینه، تنوع، همبستگی های انتخاب طبیعی و جنسی گسترش دادند.

نگاهی به تکامل

برای پیرسون، نظریه تکامل برای شناسایی مکانیسم بیولوژیکی که الگوهای وراثت را توضیح می دهد، در نظر گرفته نشده بود، در حالی که رویکرد مندلی ژن را مکانیسم وراثت اعلام کرد.

پیرسون از بیتسون و سایر زیست شناسان به دلیل عدم اتخاذ روش های بیومتریک در مطالعه تکامل انتقاد کرد. او دانشمندانی را محکوم کرد که روی آن تمرکز نکردنداعتبار آماری نظریات آنها با بیان:

"قبل از اینکه بتوانیم [هر دلیل تغییر تدریجی] را به عنوان یک عامل بپذیریم، نه تنها باید معقول بودن آن را نشان دهیم، بلکه، در صورت امکان، توانایی کمی آن را نیز نشان دهیم."

زیست شناسان تسلیم "گمان های تقریبا متافیزیکی در مورد علل وراثت" شده اند که جایگزین فرآیند جمع آوری داده های تجربی شده است، که در واقع ممکن است به دانشمندان اجازه دهد نظریه های بالقوه را محدود کنند.

قوانین طبیعت

برای پیرسون، قوانین طبیعت برای پیش بینی های دقیق و برای خلاصه کردن روند در داده های مشاهده شده مفید بودند. دلیل آن این بود که "یک توالی خاص در گذشته اتفاق افتاده و تکرار شده است."

بنابراین، شناسایی مکانیسم خاصی از ژنتیک، تلاش شایسته ای برای زیست شناسان نبوده است، آنها باید در عوض بر توصیف های ریاضی داده های تجربی تمرکز کنند. این تا حدی منجر به اختلاف شدید بین بیومتریست ها و مندلیان، از جمله بیتسون شد.

پس از اینکه دومی یکی از دست نوشته های پیرسون را که نظریه جدیدی در مورد تنوع فرزندان یا هموتایپی را توصیف می کرد رد کرد، پیرسون و ولدون شرکت Biometrika را در سال 1902 تأسیس کردند. اگرچه رویکرد بیومتریک به وراثت در نهایت دیدگاه مندلی خود را از دست داد، روش‌هایی که در آن زمان توسعه دادند برای مطالعه زیست‌شناسی و تکامل امروزی حیاتی هستند.