مدل‌های زیان : از داده تا تصمیم

در فرایند تکمیل می‌باشد. صبور باشید.

برداشت آزاد از کتاب:


Loss Models, From Data to Decisions – Fifth Edition
Stuart A. Klugman, Harry H. Panjer, Gordon E. Willmot

بخش یک مقدمه

مدل بندی

رویکرد بر اساس مدل بندی

رویکرد مبتنی بر مدل باید در چارچوب اهداف هر مسئله در نظر گرفته شود. بسیاری از مسائل درعلم بیم‌سنجی شامل ساخت یک مدل ریاضی است که می تواند برای پیش بینی هزینه های بیمه در آینده استفاده شود.

مدل یک توصیف ریاضی ساده شده است که بر اساس دانش و تجربه بیم‌سنج همراه با داده‌های گذشته ساخته می‌شود. داده‌ها بیم‌سنج را در انتخاب شکل مدل و همچنین در کالیبره کردن کمیت‌های ناشناخته که معمولاً پارامتر نامیده می‌شوند، راهنمایی می‌کند. این مدل تعادلی بین سادگی و انطباق با داده‌های موجود فراهم می‌کند.

سادگی بر حسب مواردی مانند تعداد پارامترهای ناشناخته (هرچه کمتر، ساده تر) اندازه گیری می شود. انطباق با داده‌ها بر حسب اختلاف بین داده‌ها و مدل اندازه گیری می‌شود. انتخاب مدل بر اساس تعادل بین دو معیار، یعنی برازش و سادگی است.

فرایند مدل بندی

فرآیند مدل سازی در شکل 1.1 نشان داده شده است که شش مرحله زیر را شرح می‌دهد:

Figure 1.1 The modeling process.
شکل 1.1 فرایند مدل بندی

گام 1 یک یا چند مدل بر اساس دانش و تجربه قبلی تحلیلگر و احتمالاً بر اساس ماهیت و شکل داده‌های موجود انتخاب می‌شوند. به عنوان مثال، در مطالعات مرگ و میر، مدل ها ممکن است حاوی اطلاعات متغیر کمکی مانند سن، جنس، مدت زمان، نوع قرارداد، اطلاعات پزشکی و متغیرهای سبک زندگی باشند. در مطالعات مربوط به اندازه خسارت بیمه، ممکن است یک توزیع آماری (مثلاً لگ نرمال، گاما، یا وایبل) انتخاب شود.

گام 2 مدل بر اساس داده‌های موجود کالیبره می‌شود. در مطالعات مرگ و میر، این داده‌ها ممکن است اطلاعات مجموعه‌ای از بیمه نامه‌های عمر باشد. در مطالعات مربوط به طلب اموال، داده‌ها ممکن است اطلاعاتی در مورد هر یک از مجموعه‌ای از خسارت‌های واقعی بیمه پرداخت شده تحت مجموعه‌ای از بیمه نامه‌های اموال باشند.

گام 3 مدل برازش شده برای تعیین اینکه آیا به اندازه کافی با داده‌ها مطابقت دارد یا خیر اعتبار سنجی می‌شود. می توان از تست های تشخیصی مختلفی استفاده کرد. اینها ممکن است آزمون‌های آماری معروفی مانند آزمون کای دو یا آزمون کولموگروف-اسمیرنوف باشند، یا ممکن است ماهیت کیفی‌تری داشته باشند. انتخاب آزمون ممکن است مستقیماً با هدف نهایی تمرین مدلسازی مرتبط باشد. در مطالعات مربوط به بیمه، مجموع خسارت ارائه شده توسط مدل برازش شده اغلب برای برابری با کل خسارت واقعی در داده‌ها مورد نیاز است. درحرفه بیمه، این اغلب به عنوان بی‌طرفی یک مدل شناخته می شود.

گام 4 فرصتی برای بررسی سایر مدل های ممکن فراهم می‌شود. این به ویژه زمانی مفید است که گام 3 نشان دهد که همه مدل‌ها نامناسب هستند. همچنین ممکن است در این مرحله بیش از یک مدل معتبر مورد بررسی قرار گیرد.

گام 5 تمام مدل‌های معتبر در نظر گرفته شده در گام‌های 1-4 با استفاده از برخی معیارها برای انتخاب بین آنها مقایسه می‌شوند. این ممکن است با استفاده از نتایج آزمایشی که قبلاً به دست آمده است یا با استفاده از معیار دیگری انجام شود. پس از انتخاب برنده، بازنده‌ها ممکن است برای تجزیه و تحلیل حساسیت حفظ شوند.

گام 6 در نهایت، مدل انتخاب شده برای کاربرد در آینده تطبیق داده می‌شود. این می‌تواند شامل تعدیل پارامترها برای انعکاس تورم پیش بینی شده از زمان جمع آوری داده‌ها تا دوره زمانی باشد که مدل برای آن اعمال خواهد شد.

با جمع آوری داده‌های جدید یا تغییر محیط، شش گام برای بهبود مدل باید تکرار شوند.

در سال‌های اخیر، بیم‌سنجان بیشتر درگیر مشکلات “کلان داده” شده‌اند. حجم عظیمی از داده‌ها چالش‌هایی را با خود به همراه دارند که نیازمند انطباق با مراحل ذکر شده در بالا هستند. برای جلوگیری از ساخت مدل‌های بیش از حد پیچیده که با داده‌ها مطابقت دارند، اما زمانی که برای پیش‌بینی مشاهدات آینده استفاده می‌شوند، عملکرد بدتری دارند، باید دقت بیشتری کرد. تکنیک‌هایی مانند نمونه‌های نگهدارنده و اعتبارسنجی متقابل برای رسیدگی به چنین مسائلی به کار گرفته می‌شود. این موضوعات از حوصله این کتاب خارج است. ارجاعات متعددی از آنها وجود دارد از جمله [61].

مزیت مدل بندی

اراده استفاده از مزایای مدل‌ها ما را ملزم می‌کند که جایگزین را در نظر بگیریم: تصمیم گیری کاملاً مبتنی بر شواهد تجربی. رویکرد تجربی فرض می‌کند که می‌توان انتظار داشت که آینده دقیقاً مانند نمونه‌ای از گذشته باشد، شاید برای روندهایی مانند تورم تعدیل شود. مثال 1.1 را در نظر بگیرید.

مثال 1-1
مجموعه ای از گواهی نامه‌‌‌‌های بیمه عمر گروهی شامل 1000 کارمند در سنین مختلف و مزایای فوت است. در طول پنج سال گذشته، 14 کارمند فوت کردند و در مجموع 580000 مزایا دریافت کردند (تعدیل شده بر اساس تورم زیرا این طرح مزایا را به حقوق مرتبط می‌کند). برآورد تجربی پرداخت مزایای مورد انتظار سال آینده را تعیین کنید.
تخمین تجربی برای سال آینده 116000 (یک پنجم کل) است که برای افزایش مزایا باید بیشتر تعدیل شود. البته خطر این است که تجربه پنج سال گذشته به درستی آینده این مجموعه را منعکس نماید بعید است، زیرا ممکن است نوسانات قابل توجهی در چنین نتایج کوتاه مدتی وجود داشته باشد. □

به نظر میرسد ساخت یک مدل، در این مورد جدول مرگ و میر، بسیار منطقی‌تر است. این جدول بر اساس تجربه زندگی بسیاری از افراد است، نه فقط 1000 نفر در گروه ما. با استفاده از این مدل، نه تنها می‌توان پرداخت مورد انتظار را برای سال آینده تخمین زد، بلکه می‌توان با محاسبه انحراف معیار پرداخت‌ها یا شاید صدک‌های مختلف از توزیع پرداخت‌ها، ریسک ناشی از آن را اندازه‌گیری کرد. این دقیقاً مسئله‌ای است که در متونی مانند [25] و [28] پوشش داده شده است.

این رویکرد توسط کمیته انجمن بیم‌سنجان در اصول بیم‌سنجی تدوین شده است. در نشریه “اصول علم بیم‌سنجی” [114، ص. 571]، اصل 3.1 بیان می‌کند که “ریسک‌های بیم‌سنجی را می‌توان به طور تصادفی بر اساس مفروضات مربوط به احتمالاتی که برای متغیرهای ریسک بیم‌سنجی در آینده اعمال می‌شود، از جمله مفروضات مربوط به محیط آینده، مدل سازی کرد.” متغیرهای ریسک بیم‌سنجی که به آنها اشاره می‌شود عبارتند از وقوع، زمان و شدت – یعنی شانس طلب یک خسارت، زمانی که رویداد در صورت وقوع رخ می‌دهد و هزینه تسویه خسارت.

سازماندهی این کتاب

این متن ما را در فرآیند مدل‌سازی هدایت می‌کند، اما نه به ترتیبی که در بخش 1.1 ارائه شده است. بین نحوه به کارگیری مدل‌ها و نحوه یادگیری آنها تفاوت وجود دارد. در این متن ابتدا با مدل‌ها و نحوه استفاده از آن‌ها آشنا می‌شویم و سپس می‌آموزیم که چگونه تعیین کنیم از کدام مدل استفاده کنیم، زیرا انتخاب مدل‌ها در خلاء دشوار است. تا زمانی که تحلیلگر دانش کاملی از مجموعه مدل‌های موجود نداشته باشد، محدود کردن انتخاب به مدل‌هایی که ارزش بررسی دارند دشوار است. با در نظر گرفتن این موضوع، سازماندهی متن به شرح زیر است:

  1. بررسی احتمال – تقریباً طبق تعریف، رویدادهای احتمالی بر مدل‌های احتمال دلالت دارند. فصل‌های 2 و 3 متغیرهای تصادفی و برخی از محاسبات اساسی را که ممکن است با چنین مدل‌هایی انجام شود، از جمله گشتاورها و صدک‌ها را، مرور می‌کند.
  2. درک توزیع‌های احتمال – هنگام انتخاب یک مدل احتمال، تحلیلگر باید مجموعه نسبتاً بزرگی از این مدل‌ها را داشته باشد. علاوه بر این، برای انتخاب یک مدل پیشینی خوب، باید ویژگی‌های این مدل‌ها در دسترس باشد. در فصل‌های 4-7، مدل‌های توزیعی مختلف و آنها معرفی شده‌اند. این ویژگی‌های بررسی شده شامل هر دو توزیع پیوسته و گسسته است.
  3. تغییرات پوشش – قراردادهای بیمه اغلب پرداخت کامل را ارائه نمی کنند. به عنوان مثال، ممکن است یک فرانشیز وجود داشته باشد (مثلاً بیمه نامه 250 دلار اول را پرداخت نمی‌کند) یا یک محدودیت (مثلاً بیمه نامه بیش از 10000 دلار برای هر حادثه خسارت پرداخت نمی‌کند). چنین تغییراتی توزیع احتمال را تغییر می‌دهد و بر محاسبات مرتبط مانند گشتاورها تأثیر می‌گذارد. فصل 8 نحوه انجام این کار را نشان می‌دهد.
  4. خسارت کل – تا این مرحله، مدل‌ها یا برای مقدار یک پرداخت یا برای تعداد پرداخت‌ها هستند. در هنگام مدل‌سازی یک سبد، مسیر کسب و کار یا کل شرکت، کل مبلغ پرداختی مورد توجه است. مدلی که احتمالات مربوط به تعداد پرداخت‌ها و مبالغ هر پرداخت را ترکیب می‌کند، مدل خسارت کل نامیده می‌شود. محاسبات برای چنین مدل‌هایی در فصل 9 پوشش داده شده است.
  5. مقدمه‌ای بر آمار ریاضی – از آنجا که اکثر مدل‌های در نظر گرفته شده مدل‌های احتمال هستند، تکنیک‌های آمار ریاضی برای برآورد مشخصات مدل و انتخاب مورد نیاز است. در حالی که فصل‌های 10 و 11 جایگزینی برای یک متن یا دوره کامل در آمار ریاضی نیستند، حاوی موارد ضروری هستند که بعداً در این کتاب مورد نیاز است. فصل 12 تکنیک‌های تخمین برای شمارش توزیع‌ها را پوشش می‌دهد، زیرا در کار بیم‌سنجی از اهمیت ویژه ای برخوردار هستند.
  6. روش‌های بیزی – جایگزینی برای رویکرد فراوان گرا برای برآورد در فصل 13 ارائه شده است. این مقدمه کوتاه مفاهیم اساسی روش‌های بیزی را معرفی می کند.
  7. ساخت مدل‌های تجربی – گاهی اوقات کار با توزیع تجربی داده‌ها مناسب است. این ممکن است به این دلیل باشد که حجم داده‌ها کافی است یا به این دلیل است که به یک تصویر خوب از داده‌ها نیاز است. فصل 14 مدل‌های تجربی را برای مورد ساده داده‌های قابل فهم، تعدیلات برای داده‌های بریده شده و سانسور شده، و اصلاحات مناسب برای مجموعه داده‌های بزرگ، به ویژه آنهایی که در مطالعات مرگ و میر با آن مواجه می‌شوند، پوشش می‌دهد.
  8. انتخاب مدل‌های پارامتریک – با در دست داشتن روش‌های تخمین، مرحله نهایی انتخاب مدل مناسب است. روش‌های گرافیکی و تحلیلی در فصل 15 پوشش داده شده است.
  9. تعدیل برآوردها – در مواقعی، تعدیل بیشتر نتایج نیاز است. هنگامی که یک یا چند تخمین بر اساس تعداد کمی از مشاهدات وجود دارد، دقت را می‌توان با افزودن مشاهدات مرتبط دیگر بهبود بخشید. اگر داده‌های اضافی از جمعیت دیگری باشد، باید مراقب بود. روش‌های اعتبار، که در فصل‌های 16 تا 18 پوشش داده شده‌اند، مکانیزمی را برای انجام تعدیل مناسب در هنگام گنجاندن داده‌های اضافی ارائه می‌کنند.
  10. شبیه سازی – زمانی که به دست آوردن نتایج تحلیلی دشوار است، شبیه سازی (استفاده از اعداد تصادفی) ممکن است پاسخ مورد نیاز را ارائه دهد. مقدمه کوتاهی بر این تکنیک در فصل 19 ارائه شده است.

متغیرهای تصادفی

مقدمه

یک مدل بیم‌سنجی نمایشی از یک جریان نامشخص از پرداخت‌های آتی است. عدم قطعیت ممکن است در رابطه با هر یک یا همه موارد رخداد (آیا پرداختی وجود دارد؟)، زمان (چه زمانی پرداخت انجام می‌شود؟) و شدت (چه مقدار پرداخت می‌شود؟) باشد. از آنجا که مفیدترین ابزار برای نمایش عدم قطعیت از طریق احتمال است، ما بر روی مدل‌های احتمال تمرکز می‌کنیم. در حال حاضر، فرض بر این است که توزیع احتمال مربوطه مشخص است. تعیین توزیع های مناسب در فصل‌های 10 تا 15 پوشش داده شده است. در این بخش، جنبه‌های زیر از مدل‌های احتمال بیم‌سنجی پوشش داده شده است:

  1. تعریف متغیر تصادفی و توابع مهم با چند مثال.
  2. محاسبات پایه از مدل‌های احتمال.
  3. توزیع‌های احتمال خاص و خواص آنها.
  4. محاسبات پیشرفته‌تر با استفاده از مدل‌های شدت.
  5. مدل‌هایی که امکان تعداد تصادفی پرداخت‌ها را در بر می‌گیرند، هر کدام مقدار تصادفی دارند.

تشابهی که در اینجا به دنبال آن هستیم این است که همه مدل‌های پدیده‌های تصادفی دارای عناصر مشابه هستند. برای هر یک مجموعه‌ای از نتایج ممکن وجود دارد. نتیجه خاصی که رخ می‌دهد موفقیت شرکت ما را تعیین می کند. اختصاص احتمالات به نتایج مختلف به ما این امکان را می‌دهد که انتظارات خود و خطر برآورده نشدن آنها را کمی کنیم. در این حالت، متغیر تصادفی زیربنایی تقریباً همیشه با حروف بزرگ و ایتالیک نزدیک به انتهای الفبا، مانند $X$ یا $Y$ نشان داده می‌شود. شرایط نام و برخی ویژگی‌های احتمالی را ارائه می‌دهد. البته مدل‌های بیم‌سنجی‌ای وجود دارند که شبیه مدل‌هایی نیستند که در اینجا توضیح داده شده است. به عنوان مثال، در بیمه عمر، دفتر نمونه1، فهرستی از سلول‌های حاوی نوع بیمه نامه، محدوده سنی، جنسیت و غیره به همراه تعداد قراردادهایی با آن مشخصات است.

برای گسترش این مفهوم، تعاریف زیر را از “اصول زیربنایی علم بیم‌سنجی” در نظر بگیرید [5، ص. 7]:

پدیده‌ها اتفاقاتی هستند که می‌توان آن‌ها را مشاهده کرد. آزمایش مشاهده یک پدیده معین در شرایط مشخص است. نتیجه یک آزمایش برامد نامیده می‌شود. یک رویداد مجموعه‌ای از یک یا چند نتیجه ممکن است. پدیده تصادفی پدیده‌ای است که برای یک آزمایش مرتبط آن بیش از یک نتیجه ممکن دارد. رویدادی که با یک پدیده تصادفی مرتبط است، ممکن است… گفته شود. احتمال, اندازه گیری شانس وقوع یک رویداد است که در مقیاس افزایش شانس از صفر تا یک اندازه گیری می شود. . . . متغیر تصادفی تابعی است که به هر نتیجه ممکن یک مقدار عددی اختصاص می‌دهد.

لیست زیر شامل 12 متغیر تصادفی است که ممکن است در کار بیم‌سنجی با آنها مواجه شویم (مدل # به مثال‌هایی اشاره دارد که در بخش بعدی معرفی شده اند):

  1. سن در هنگام مرگ یک فرد که طور تصادفی انتخاب شده است. (مدل 1)
  2. زمان باقی مانده تا مرگ برای یک بیمه شده عمر که به طور تصادفی انتخاب شده از زمانی که بیمه خریداری شده باشد.
  3. مدت زمان, از وقوع یک رویداد ناتوان کننده تا بهبودی یا مرگ برای یک متقاضی غرامت کارگران که به طور تصادفی انتخاب شده است.
  4. زمان از وقوع یک ادعا که تصادفی انتخاب شده تا گزارش آن به بیمه گر.
  5. زمان از گزارش یک ادعا که تصادفی انتخاب شده تا تسویه آن.
  6. مبلغ پرداخت شده در مورد ادعای بیمه عمر که تصادفی انتخاب شده است.
  7. مبلغ پرداخت شده در یک ادعای آسیب بدنه خودرو که تصادفی انتخاب شده است. (مدل 2)
  8. تعداد مطالبات خسارت بدنه خودرو در یک سال از یک خودروی بیمه شده که به طور تصادفی انتخاب شده است. (مدل 3)
  9. در دعاوی قصور پزشکی کل مبلغ پرداخت شده در یک سال به دلیل حادثه‌های یک بیمارستان که به طور تصادفی انتخاب شده است. (مدل 4)
  10. زمان نکول یا زمان تا پیش پرداخت وام مسکن که زودتر فسخ می شود برای بیمه شده‌ای که به طور تصادفی انتخاب شده.
  11. مقدار پول پرداخت شده در سررسید بر روی یک اوراق قرضه با بازده بالا که به طور تصادفی انتخاب شده است.
  12. ارزش یک شاخص سهام در تاریخ آینده مشخص.

از آنجا که همه این پدیده‌ها را می‌توان به عنوان متغیرهای تصادفی بیان کرد، ماشین احتمالات و آمار ریاضی هم برای ایجاد و هم برای تجزیه و تحلیل مدل برای آنها در اختیار ما است. پاراگراف‌های زیر پنج تابع کلیدی مورد استفاده در توصیف یک متغیر تصادفی را مورد بحث قرار می‌دهند: توزیع تجمعی، بقا، چگالی احتمال، جرم احتمال، و نرخ خطر. آنها با چهار مدل که در لیست قبلی مشخص شده‌اند به علاوه یک مدل دیگر که بعدا معرفی می‌شود نشان داده شده‌اند.

توابع کلیدی و چهار مدل

تعریف 2.1 تابع توزیع تجمعی که تابع توزیع نیز نامیده می‌شود و معمولاً $F_x(x)$ یا $F (x)$ 2 نشان داده می‌شود، برای متغیر تصادفی $X$ احتمال این است که $X$ کمتر یا مساوی یک عدد معین باشد. یعنی $F_X (x) = Pr(X ≤ x)$. اغلب از مخفف $cdf$ استفاده می‌شود.

تابع توزیع باید تعدادی از الزامات را برآورده کند:3

  • $0\leq F(x) \leq 1$ برای همه‌ی $x$ ها.
  • $F(x)$غیر کاهشی است.
  • $F(x)$ از سمت راست پیوسته است.4
  • $\lim_{x\to-\infty} F(x)=0$ و $\lim_{x\to\infty}F(x)=1$

از آنجایی که نیازی به پیوستگی از چپ نیست، امکان پرش تابع توزیع وجود دارد. هنگامی که پرش می‌کند، مقدار به بالای پرش اختصاص می یابد.

در اینجا توابع توزیع ممکن برای هر یک از چهار مدل ارائه شده است.

مدل 1 5 این متغیر تصادفی می‌تواند به عنوان مدلی برای سن مرگ عمل کند. تمامی سنین بین 0 تا 100 سال امکان پذیر است. در حالی که تجربه نشان می‌دهد که یک حد بالایی برای طول عمر انسان وجود دارد، مدل‌هایی که حد بالایی ندارند اگر احتمالات بسیار کم را به سنین نهایی اختصاص دهند ممکن است مفید باشند. این به مدل ساز اجازه می‌دهد تا از تعیین حداکثر سن خاص خودداری کند:

$$F_1(x) = \begin{cases}
0, & 0 \lt x \\
0.01x, & : 0 \leq x \lt 100 \\
1, & : x \geq 100
\end{cases}$$

این cdf در شکل 2.1 نشان داده شده است.

Figure 2.1 The distribution function for Model 1.
شکل 2.1 تابع توزیع مدل 1

مدل 2 این متغیر تصادفی می‌تواند به عنوان مدلی برای مبلغ پرداخت شده بابت خسارت بیمه خودرو عمل کند. همه مقادیر مثبت امکان پذیر است. مانند مرگ و میر، احتمالاً یک حد بالایی وجود دارد (تمام پولِ جهان به ذهن می رسد)، اما این مدل نشان می‌دهد که در مدل سازی، مطابقت با واقعیت نیازی نیست کامل باشد:

$$F_2(x) = \begin{cases}
0, & 0 \lt x \\
1-(\frac{2,000}{x+2,000})^2, & : x \ge 0
\end{cases}$$

این cdf در شکل 2.2 نشان داده شده است.

Figure 2.2  The distribution function for Model 2.
شکل 2.2 تابع توزیع مدل 2

مدل 3 این متغیر تصادفی می‌تواند به عنوان مدلی برای تعداد ادعاهای یک بیمه نامه در یک سال عمل کند. احتمال در پنج نقطه $(0,1,2,3,4)$ متمرکز است و احتمال در هر یک با اندازه پرش در تابع توزیع ارئه می‌شود:

$$F_3(x) = \begin{cases}
0, & x \lt 0 \\
0.5, & 0 \le x \lt 1 \\
0.75, & 1 \le x \lt 2 \\
0.87, & 2 \le x \lt 3 \\
0.95, & 3 \le x \lt 4 \\
1, & : x \ge 4
\end{cases}$$

در حالی که این مدل حداکثر تعداد ادعاها را تعیین می‌کند، مدل‌های بدون محدودیت (مانند توزیع پواسون) نیز می‌توانند استفاده شوند. □

مدل 4 این متغیر تصادفی می‌تواند به عنوان مدلی برای کل مبلغ پرداخت شده در یک قرداد قصور پزشکی در یک سال باشد. بیشتر احتمال آن در صفر است $(0.7)$ زیرا در بیشتر سال‌ها هیچ چیزی پرداخت نمی‌شود. $(0.3)$ احتمال باقی مانده بر روی مقادیر مثبت توزیع می‌شود:

$$
\begin{cases}
0, & x \lt 0,\\
1-0.3e^{-0.00001x}, & x \ge 0.
\end{cases}
$$

تعریف 2.2 تکیه‌گاه یک متغیر تصادفی مجموعه اعدادی است که مقادیر ممکن متغیر تصادفی هستند.


تعریف 2.3 یک متغیر تصادفی در صورتی گسسته نامیده می‌شود اگر تکیه‌گاه حداکثر دارای تعداد قابل شمارش مقادیر باشد. اگر تابع توزیع همه جا به استثنای تعداد قابل شمارش از مقادیر پیوسته ومشتق‌پذیرباشد، پیوسته نامیده می شود. اگر گسسته نباشد و در همه جا پیوسته باشد به استثنای حداقل یک مقدار و حداکثر تعداد قابل شمارش، مختلط نامیده می شود.

این سه تعریف تمام متغیرهای تصادفی ممکن را در بر نمی‌گیرد، اما تمام مواردی را که در این کتاب با آن مواجه می‌شویم پوشش می‌دهند. تابع توزیع برای یک متغیر تصادفی گسسته به جز جهش در مقادیر با احتمال مثبت ثابت خواهد بود. یک توزیع مختلط حداقل یک پرش خواهد داشت. نیاز به مشتق‌پذیربودن متغیرهای پیوسته به متغیر اجازه می‌دهد تا تقریباً در همه مقادیر تابع چگالی (بعداً تعریف می‌شود) داشته باشد.

مثال 2.1
برای هر یک از چهار مدل، تکیه‌گاه را تعیین کنید و نوع متغیر تصادفی آن را مشخص کنید.
تابع توزیع برای مدل 1 پیوسته است و به جز 0 و 100 مشتق‌پذیر است و بنابراین یک توزیع پیوسته است. تکیه‌گاه از 0 تا 100 است و مشخص نیست که آیا 0 یا 100 را شامل می‌شود.6 تابع توزیع برای مدل 2 پیوسته و در همه‌ی نقاط بجز 0 مشتق‌پذیر است بنابراین توزیع پیوسته می‌باشد. تکیه‌گاه همه‌ی اعداد حقیقی مثبت و شاید صفر می‌باشد. متغیر تصادفی برای مدل 3 احتمال را فقط در 0، 1، 2، 3، و 4 (تکیه‌گاه) تعریف می‌کند و بنابراین گسسته است. تابع توزیع برای مدل 4 پیوسته است به جز 0، جایی که می پرد. این یک توزیع مختلط با تکیه‌گاه اعداد نامفی حقیقی می‌باشد. □

این چهار مدل رایج ترین اشکال تابع توزیع را نشان می‌دهند. اغلب در بقیه کتاب، وقتی توابع ارائه می‌شوند، مقادیر خارج از تکیه‌گاه داده نمی‌شوند (معمولاً در جایی که توابع توزیع و بقا 0 یا 1 هستند).

تعریف 2.4 تابع بقا معمولاً با $S_X(x)$ یا $S(x)$ نشان داده می‌شود، و برای یک متغیر تصادفی $X$ احتمال اینکه $X$ بزرگتر از یک عدد داده شده می‌باشد. یعنی $S_X(x)=Pr(X>x)=1-F_X(x)$.

در نتیجه:

  • $0 \le S(x) \le 1$ برای تمامی $x$ ها.
  • $S(x)$ غیر افزایشی است.
  • $S(x)$ از راست پیوسته است.
  • $\ lim_{x \to -\infty}S(x)=1$ و $\ lim_{x \to \infty}S(x)=0$.

از آنجایی که تابع بقا لازم نیست پیوسته از چپ باشد، امکان پرش (پایین) وجود دارد. هنگامی که پرش می‌کند، مقدار به پایین پرش اختصاص می‌یابد.
تابع بقا مکمل تابع توزیع است و بنابراین شناخت یکی متضمن شناخت دیگری است. از نظر تاریخی، زمانی که متغیر تصادفی زمان را اندازه‌گیری می‌کند، تابع بقا ارائه می‌شود، در حالی که زمانی که مبلغ را اندازه‌گیری می‌کند، تابع توزیع ارائه می‌شود.

مثال 2.2 در اینجا توابع بقا برای چهار مدل آمده است:

$$
\begin{array}{l}
S_1(x)=1-0.01x,& 0\le x<100, \\
S_2(x)=\left(\frac{2,000}{x+2,000}\right)^3, & x \ge 0,\\
S_3(x) = \begin{cases}
0.50, & 0 \le x \lt 1, \\
0.25, & 1 \le x \lt 2, \\
0.13, & 2 \le x \lt 3, \\
0.05, & 3 \le x \lt 4, \\
0, & x \ge 4,
\end{cases}\\
S_4(x)=0.3e^{-0.00001x}, & x \ge 0.
\end{array}
$$

توابع بقا برای مدل های 1 و 2 در شکل های 2.3 و 2.4 نشان داده شده است. □

برای تعیین احتمالات می‌توان از توزیع یا تابع بقا استفاده کرد. فرض کنید $F(b-)=\lim_{x\nearrow1}F(x)$ و اجازه دهید $S(b-)$ به طور مشابه تعریف شود. یعنی وقتی $x$ از پایین به b نزدیک می‌شود، حد را می‌خواهیم. ما داریم $Pr(a < X ≤ b) = F (b) – F (a) = S(a) – S(b)$ و $Pr(X=b) = F (b) – F (b-) = S(b-) – S(b)$. وقتی تابع توزیع در $x$ پیوسته است،$Pr(X=x)=0$. در غیر این صورت، احتمال به اندازه پرش است. دو تابع بعدی به طور مستقیم با احتمالات مرتبط هستند. اولی برای توزیع های پیوسته، دومی برای توزیع های گسسته است.

Figure 2.3  The survival function for Model 1.
شکل 2.3 تابع بقا مدل 1.
Figure 2.4  The survival function for Model 2.
شکل 2.4 تابع بقا مدل 2.

تعریف 2.5 تابع چگالی احتمال که تابع چگالی نیز نامیده می شود و معمولاً با $f_X (x)$ یا $f (x)$ نشان داده می‌شود، مشتق تابع توزیع یا به طور معادل منفی مشتق تابع بقا است. یعنی $f (x) = F'(x) = −S'(x)$. تابع چگالی فقط در نقاطی که مشتق وجود دارد تعریف می شود. معمولاً از مخفف pdf استفاده می‌شود.

در حالی که تابع چگالی مستقیماً احتمالات را ارائه نمی‌دهد، اطلاعات مربوطه را ارائه می‌دهد. مقادیر متغیر تصادفی در مناطق با مقادیر چگالی بالاتر نسبت به مناطق با مقادیر کمتر احتمال بیشتری دارد. احتمالات فواصل و توابع توزیع و بقا را می‌توان با انتگرال‌گیری بدست آورد. یعنی زمانی که تابع چگالی در بازه مرتبط تعریف می شود، $Pr \left( a< X \le b \right)= \int_{a}^b fx(x) dx$ ، $F(b)=\int_{-\infty}^bf(x) dx$ ، و$S(b)=\int_{b}^{\infty} f(x) dx$.

مثال 2.3 برای مدل‌ها:

$$
\begin{array}{l}
f_1(x)=0.01,& 0\lt x<100, \\
f_2(x)=\frac{3\left(2,000\right)^3}{\left(x+2,000\right)^4}, & x \gt 0,\\
f_3(x) \text{ is not defined,}\\
f_4(x)=0.000003e^{-0.00001x}, & x \gt 0.
\end{array}
$$

لازم به ذکر است که برای مدل 4 تابع چگالی توزیع احتمال را به طور کامل توصیف نمی‌کند. به عنوان یک توزیع مختلط، احتمال گسسته در 0 نیز وجود دارد. توابع چگالی برای مدل‌های 1 و 2 در شکل های 2.5 و 2.6 نشان داده شده است. □

Figure 2.5 The density function for Model 1.
شکل 2.5 تابع چکالی مدل 1.
Figure 2.6 The density function for Model 2.
شکل 2.6 تابع چگالی مدل 2.

تعریف 2.6 تابع احتمال که تابع جرم احتمال نیز نامیده می‌شود و معمولاً با $p_X(x)$ یا $p(x)$ نشان داده می‌شود، احتمال را در یک نقطه مشخص و زمانی که $0$ نیست توصیف می‌کند. تعریف رسمی $p_X(x) = Pr(X=x)$ است.

برای متغیرهای تصادفی گسسته، توابع توزیع و بقا را می توان به صورت $F(x) =\sum_{y≤x}p(y)$ و $S(x) = \sum_{y>x}p(y)$ بازنویسی کرد.

مثال 2.4 برای مدل‌ها:

$$
\begin{array}{l}
p_1(x) \text{ is not defined,}\\
p_2(x) \text{ is not defined,}\\
p_3(x) = \begin{cases}
0.50, & x=0, \\
0.25, & x=1, \\
0.12, & x=2, \\
0.08, & x=3, \\
0.05, & x=4 ,
\end{cases}\\
p_4(0)=0.7.
\end{array}
$$

مجدداً متذکر می‌شویم که توزیع در مدل 4 مختلط است، بنابراین مورد قبلی فقط بخش گسسته آن توزیع را توصیف می‌کنند. هیچ راه آسانی برای ارائه احتمالات/ چگالی برای توزیع مختلط وجود ندارد. برای مدل 4، تابع چگالی احتمال را به صورت ذیل ارائه می‌کنیم:

$$
f_4(x)=\begin{cases}
0.7,& x=0,\\
0.000003e^{-0.00001x}, & x \gt 0
\end{cases}
$$

با درک اینکه، از نظر فنی، اصلاً تابع چگالی احتمال نیست. هنگامی که تابع چگالی در یک نقطه خاص یک مقدار نسبت داده می شود، برخلاف اینکه در یک بازه تعریف می‌شود، به عنوان یک جرم احتمال گسسته درک می‌شود.□

تعریف 2.7 نرخ خطر که به عنوان نیروی مرگ و میر و نرخ خرابی نیز شناخته می‌شود و معمولاً با $h_X(x)$ یا $h(x)$ نشان داده می شود، و نسبت توابع چگالی و بقا، وقتی که تابع چگالی تعریف شده باشد. یعنی $h_X(x) = f_X(x)∕S_X(x)$. □

هنگامی که نیروی مرگ و میر نامیده می‌شود، نرخ خطر اغلب $μ(x)$ و هنگامی که نرخ خرابی نامیده می‌شود، اغلب با $λ(x)$ نشان داده می‌شود. صرف نظر از این، ممکن است به عنوان چگالی احتمال در x تفسیر شود، به شرط اینکه آرگومان حداقل $x$ باشد. همچنین داریم $h_X(x) = -S'(x)∕S(x) = -d ln S(x)∕dx$ . تابع بقا را می‌توان از$ S(b) = e^{-\int_{0}^b h(x)} h(x) dx$ بدست آورد. اگرچه ضروری نیست، اما این فرمول نشان می دهد که تکیه‌گاه روی اعداد غیر منفی است. از نظر مرگ و میر، نیروی مرگ و میر احتمال سالیانه‌ای است که یک فرد در سن $x$ در لحظه بعدی بمیرد، که به عنوان نرخ مرگ و میر در سال بیان می‌شود.7 در این متن، ما همیشه از $h(x)$ برای نشان دادن میزان خطر استفاده می‌کنیم، اگرچه ممکن است یکی از نام‌های جایگزین استفاده شود.

مثال 2.5 برای مدل‌ها:

$$
\begin{array}{l}
h_1(x)=\frac{0.01}{1-0.01x},& 0\lt x<100, \\
h_2(x)=\frac{3}{x+2,000}, & x \gt 0,\\
h_3(x) \text{ is not defined,}\\
h_4(x)=0.00001, & x \gt 0.
\end{array}
$$

یک بار دیگر، توجه داشته باشید که برای توزیع مختلط، میزان خطر تنها بر روی بخشی از تکیه‌گاه متغیر تصادفی تعریف می‌شود. این با مسئله قبلی که در آن تابع چگالی احتمال و تابع احتمال درگیر هستند، متفاوت است. در جایی که جرم احتمال گسسته وجود دارد، نرخ خطر تعریف نشده است. توابع نرخ خطر برای مدل های 1 و 2 در شکل های 2.7 و 2.8 نشان داده شده است.

Figure 2.7  The hazard rate function for Model 1.
شکل 2.7 تابع خطر مدل ۱.
Figure 2.8  The hazard rate function for Model 2.
شکل 2.8 تابع خطر مدل 2.

مدل 5 جایگزینی برای توزیع طول عمر ساده در مدل 1 در اینجا آورده شده است. توجه داشته باشید که به صورت قطعه قطعه خطی است و مشتق در 50 تعریف نشده است. بنابراین، نه تابع چگالی و نه تابع نرخ خطر در 50 تعریف نشده است. برخلاف مدل ترکیبی مدل 4، جرم احتمال گسسته‌ای در این نقطه وجود ندارد. از آنجایی که احتمال وقوع 50 صفر است، چگالی یا نرخ خطر در 50 را می توان به طور دلخواه تعریف کرد بدون اینکه تاثیری در محاسبات بعدی داشته باشد. در این کتاب، چنین مقادیری به‌طور دلخواه تعریف شده‌اند تا تابع از راست پیوسته باشد.8 برای مثال، راه‌حل تمرین 2.1 را ببینید.

$$
S_5(x)=\begin{cases}
1-0.01x, & 0 \le x \lt 50, \\
1.5-0.02x, & 50\le x \lt 75.
\end{cases}
$$

تعریف 2.8 مد یک متغیر تصادفی محتمل‌ترین مقدار است. برای یک متغیر گسسته، مقدار با بیشترین احتمال است. برای یک متغیر پیوسته، مقداری است که تابع چگالی برای آن بزرگترین است. در صورت وجود ماگزیمم های محلی، این نقاط نیز مد در نظر گرفته می‌شوند.

مثال 2.6 در صورت امکان، مد را برای مدل های 1-5 تعیین کنید.
برای مدل 1، تابع چگالی ثابت است. همه مقادیر از 0 تا 100 می توانند مد باشند یا به طور معادل می توان گفت که هیچ مدی وجود ندارد. برای مدل 2، تابع چگالی به شدت در حال کاهش است و بنابراین مد روی 0 است. برای مدل 3، احتمال در 0 بیشترین است. به عنوان یک توزیع مختلط، نمی توان یک مد برای مدل 4 تعریف کرد. مدل 5 دارای یک چگالی است که در دو بازه ثابت است، با مقادیر بالاتر از 50 تا 75. این مقادیر همه مد هستند.

تمرین‌ها

2.1 توابع توزیع، چگالی و نرخ خطر را برای مدل 5 تعیین کنید.

2.2 نمودارهای تابع توزیع را برای مدل های 3، 4، و 5 بسازید. همچنین تابع چگالی یا احتمال را با توجه به مناسب بودن و تابع نرخ خطر را در جایی که وجود دارد ترسیم کنید.

2.3 (*) یک متغیر تصادفی X دارای تابع چگالی $f (x) = 4x(1 + x^2)^{-3}، x > 0$ است. مد X را تعیین کنید.

2.4 (*) یک متغیر تصادفی غیرمنفی تابع نرخ خطر $h(x) = A+e^{2x}، x ≥ 0$ دارد. همچنین $S(0.4) = 0.5$. مقدار $A$ را تعیین کنید.

2.5 (*) X دارای توزیع پارتو با پارامترهای $\alpha = 2$ و $θ = 10,000$ است. $Y$ دارای توزیع Burr با پارامترهای $α = 2، γ = 2$، و $θ = 20,000$ است. فرض کنید $r$ نسبت $Pr(X > d)$ به $Pr(Y > d)$ باشد. $\lim_{d \to \infty} r$ را تعیین کنید.

کمیت‌های اساسی توزیع

گشتاورها

انواع محاسبات جالبی وجود دارد که می‌توان با استفاده از مدل‌های توضیح‌ داده‌ شده در فصل 2 (متغیرهای تصادفی) انجام داد. به عنوان مثال می‌توان به میانگین مبلغ پرداختی در مورد ادعایی که مشمول فرانشیز یا یک محدودیت بیمه‌نامه یا میانگین طول عمر باقی‌مانده یک فرد 40، اشاره نمود.

تعریف 3.1 $k$امین گشتاور خام یک متغیر تصادفی، مقدار مورد انتظار (متوسط) توان $k$ام متغیر است، مشروط بر اینکه وجود داشته باشد. با $E(X^k )$ یا $μ’_k$ نشان داده می شود. اولین گشتاور خام میانگین متغیر تصادفی نامیده می شود و معمولاً توسط $\mu$ نشان داده می‌شود .

توجه داشته باشید که $\mu$ به $\mu(x)$، نیروی مرگ و میر از تعریف 2.7 مربوط نمی‌شود. برای متغیرهای تصادفی که فقط مقادیر غیرمنفی می گیرند (یعنی $Pr(X ≥ 0) = 1$)، $k$ ممکن است هر عدد حقیقی باشد. هنگام ارائه فرمول برای محاسبه این کمیت، باید بین متغیرهای پیوسته و گسسته تمایز قائل شد. فرمول‌هایی برای متغیرهای تصادفی ارائه می شود که در همه جا پیوسته یا در همه جا گسسته هستند. برای مدل‌های مختلط، فرمول را با ادغام با توجه به تابع چگالی آن در هر جایی که متغیر تصادفی پیوسته است، و با جمع کردن با توجه به تابع احتمال آن در هر جایی که متغیر تصادفی گسسته است، ارزیابی کنید و نتایج را اضافه کنید. فرمول $k$امین گشتاور خام عبارت است از:

$$
\mu’_k= E(X^k)=\begin{cases}
\int_{-\infty}^{\infty}x^k f(x)dx & \text{if the random variable is continuous}\\
\sum_{j}x_j^k p(x_j) & \text{if the random variable is discrete,}
\end{cases} \qquad (3.1)
$$

که در آن مجموع باید بر تمام $x_j$ با احتمال مثبت گرفته شود. در نهایت توجه داشته باشید که ممکن است انتگرال یا مجموع همگرا نشوند که در این صورت گفته می شود گشتاور وجود ندارد.

مثال 3.1 دو گشتاور خام اول را برای هر یک از پنج مدل تعیین کنید.
زیرنویس‌های متغیر تصادفی X نشان می‌دهد که کدام مدل استفاده می‌شود.

$$
\begin{align}
E(X_1)&=\int_{0}^100 x(0.01) dx=50,\\
E(X_1^2)&=\int_{0}^100 x^2(0.01) dx=3,333.33,\\
E(X_2)&=\int_{0}^\infty x\frac{3(2,000)^3}{(x+2,000)^4} dx=1,000,\\
E(X_2^2)&=\int_{0}^\infty x^2\frac{3(2,000)^3}{(x+2,000)^4} dx=4,000,000,\\
E(X_3 )& = 0(0.5) + 1(0.25) + 2(0.12) + 3(0.08) + 4(0.05) = 0.93,\\
E(X_3^2 )& = 0(0.5) + 1(0.25) + 4(0.12) + 9(0.08) + 16(0.05) = 2.25,\\
E(X_4)&=0(0.7)+\int_{0}^\infty x(0.000003)e^{-0.000001x} dx=30,000,\\
E(X_4^2)&=0^2(0.7)+\int_{0}^\infty x^2(0.000003)e^{-0.000001x} dx=6,000,000,000,\\
E(X_5)&=\int_{0}^{50} x(0.01) dx+ \int_{50}^{75} x(0.02) dx=43.75,\\
E(X_5^2)&=\int_{0}^{50} x^2(0.01) dx+ \int_{50}^{75} x^2(0.02) dx=2,395.83,\\
\end{align}
$$

تعریف 3.2 $k$ امین گشتاور مرکزی یک متغیر تصادفی مقدار مورد انتظار $k$ امین توان انحراف متغیر از میانگین آن است. با $E[(X − μ)^k]$ یا با $\mu_k$ نشان داده می‌شود. گشتاور مرکزی دوم معمولاً واریانس نامیده می‌شود و $\sigma^2$ یا $Var(X)$ و جذر آن، $\sigma$، انحراف معیار نامیده می‌شود. نسبت انحراف معیار به میانگین را ضریب تغییرات می نامند. نسبت سومین گشتاور مرکزی به مکعب انحراف معیار، $\gamma_1 = μ_3 ∕σ^3$، چولگی نامیده می‌شود. نسبت چهارمین گشتاور مرکزی به توان چهارم انحراف معیار، $\gamma_2 = μ_4 ∕σ^4$، کشیدگی نامیده می‌شود.9


فهرست منابع

  1. Åalen, O. (1978), “Nonparametric Inference for a Family of Counting Processes,” Annals of
    Statistics, 6, 701–726.
  2. Abramowitz, M. and Stegun, I. (1964), Handbook of Mathematical Functions with Formulas,
    Graphs, and Mathematical Tables, New York: Wiley.
  3. Acerbi, C. and Tasche, D. (2002), “On the Coherence of Expected Shortfall,” Journal of
    Banking and Finance, 26, 1487–1503.
  4. Akaike, H. (1974), “A New Look at the Statistical Model Identification,” IEEE Transactions
    on Automatic Control, 19(6), 716–723.
  5. Allaben, M., Diamantoukos, C., Dicke, A., Gutterman, S., Klugman, S., Lord, R., Luckner,
    W., Miccolis, R., and Tan, J. (2008), “Principles Underlying Actuarial Science,” Actuarial
    Practice Forum, August 2008.
  6. Arnold, B. (1983), Pareto Distributions (Statistical Distributions in Scientific Work), Vol. 5,
    Fairland, MD: International
  7. Artzner, P., Delbaen, F., Eber, J., and Heath, D. (1997), “Thinking Coherently,” RISK, 10,
    11, 68–71.
  8. Bailey, A. (1943), “Sampling Theory in Casualty Insurance, Parts III through VII,” Proceed-
    ings of the Casualty Actuarial Society, XXX, 31–65.
  9. Bailey, A. (1950), “Credibility Procedures,” Proceedings of the Casualty Actuarial Society,
    XXXVII, 7–23, 94–115.
  10. Baker, C. (1977), The Numerical Treatment of Integral Equations, Oxford: Clarendon Press.
  11. Balkema, A. and de Haan, L. (1974), “Residual Life at Great Ages,” Annals of Probability,
    2, 792–804.
  12. Batten, R. (1978), Mortality Table Construction, Englewood Cliffs, NJ: Prentice-Hall.
  13. Beard, R., Pentikainen, T., and Pesonen, E. (1984), Risk Theory, 3rd ed., London: Chapman
    & Hall.
  14. Berger, J. (1985), Bayesian Inference in Statistical Analysis, 2nd ed., New York: Springer-
    Verlag.
  15. Bevan, J. (1963), “Comprehensive Medical Insurance – Statistical Analysis for Ratemaking,”
    Proceedings of the Casualty Actuarial Society, L, 111–128.
  16. Box, G. and Muller, M. (1958), “A Note on the Generation of Random Normal Deviates,”
    Annals of Mathematical Statistics, 29, 610–611.
  17. Brockett, P. (1991), “Information Theoretic Approach to Actuarial Science: A Unification
    and Extension of Relevant Theory and Applications,” with discussion, Transactions of the
    Society of Actuaries, XLIII, 73–135.
  18. Brown, J., Hollander, M., and Korwar, R. (1974), “Nonparametric Tests of Independence for
    Censored Data, with Applications to Heart Transplant Studies,” in Proschen, F. and Serfling,
    R., eds., Reliability and Biometry: Statistical Analysis of Lifelength, SIAM, 327–354.
  19. Bühlmann, H. (1967), “Experience Rating and Credibility,” ASTIN Bulletin, 4, 199–207.
  20. Bühlmann, H. (1970), Mathematical Methods in Risk Theory, Berlin: Springer-Verlag.
  21. Bühlmann, H. and Straub, E. (1970), “Glaubwürdigkeit für Schadensätze (credibility for
    loss ratios),” Mitteilungen der Vereinigung Schweizerischer Versicherungs-Mathematiker,
    70, 111–133.
  22. Carlin, B. and Louis, T. (2000), Bayes and Empirical Bayes Methods for Data Analysis, 2nd
    ed., Boca Raton, FL: CRC Press.
  23. Carriere, J. (1993), “Nonparametric Estimators of a Distribution Function Based on Mixtures
    of Gamma Distributions,” Actuarial Research Clearing House, 1993.3, 1–11.
  24. Clark, D. and Thayer, C. (2004), “A Primer on the Exponential Family of Distributions,”
    Casualty Actuarial Society Discussion Paper Program, Arlington, VA: Casualty Actuarial
    Society, 117–148.
  25. Cunningham, R., Herzog, T., and London, R. (2011), Models for Quantifying Risk, 4th ed.,
    Winsted, CT: ACTEX.
  26. deAlba, E. (2002), “Bayesian Estimation of Outstanding Claim Reserves,” North American
    Actuarial Journal, 6, 1–20.
  27. DePril, N. (1986), “On the Exact Computation of the Aggregate Claims Distribution in the
    Individual Life Model,” ASTIN Bulletin, 16, 109–112.
  28. Dickson, D., Hardy, M., and Waters, H. (2013), Actuarial Mathematics for Life Contingent
    Risks, 2nd ed., Cambridge: Cambridge University Press.
  29. Douglas, J. (1980), Analysis with Standard Contagious Distributions, Fairland, MD: Interna-
    tional Co-operative Publishing House.
  30. Dropkin, L. (1959), “Some Considerations on Automobile Rating Systems Utilizing Indi-
    vidual Driving Records,” Proceedings of the Casualty Actuarial Society, XLVI, 165–176.
  31. Efron, B. (1967), “The Two Sample Problem with Censored Data,” in Proceedings of the
    Fifth Berkeley Symposium on Mathematical Statistics and Probability, 4, 831–853.
  32. Efron, B. (1981), “Censored Data and the Bootstrap,” Journal of the American Statistical
    Association, 76, 312–319.
  33. Efron, B. (1986), “Why Isn’t Everyone a Bayesian?” The American Statistician, 40, 1–11
    (including comments and reply).
  34. Efron, B. and Tibshirani, R. (1993), An Introduction to the Bootstrap, New York: Chapman
    & Hall.
  35. Embrechts, P. and Wang, R. (2015), “Seven Proofs for the Subadditivity of Expected
    Shortfall,” Dependence Modeling, 3, 126–140.
  36. Ericson, W. (1969), “A Note on the Posterior Mean of a Population Mean,” Journal of the
    Royal Statistical Society, Series B, 31, 332–334.
  37. Feller, W. (1968), An Introduction to Probability Theory and Its Applications, Vol. 1, 3rd ed.
    rev., New York: Wiley.
  38. Feller, W. (1971), An Introduction to Probability Theory and Its Applications, Vol. 2, 2nd
    ed., New York: Wiley.
  39. Fellingham, G., Kottas, A., and Hartman, B. (2015), “Bayesian Nonparametric Predictive
    Modeling of Group Health Claims, Insurance: Mathematics and Economics, 60, 1–10.
  40. Fisher, R. and Tippett, L. (1928), “Limiting Forms of the Largest or Smallest Member of a
    Sample,” Proceedings of the Cambridge Philosophical Society, 24, 180–190.
  41. Frees, E. W. (2010), Regression Modeling with Actuarial and Financial Applications, New
    York: Cambridge.
  42. Gelman, A., Carlin, J., Stern, H., Dunson, D., Vehtari, A., and Rubin, D. (2013), Bayesian
    Data Analysis, 3rd ed., Boca Raton, FL: CRC Press.
  43. Gerber, H. (1982), “On the Numerical Evaluation of the Distribution of Aggregate Claims
    and Its Stop-Loss Premiums,” Insurance: Mathematics and Economics, 1, 13–18.
  44. Gerber, H. and Jones, D. (1976), “Some Practical Considerations in Connection with the
    Calculation of Stop-Loss Premiums,” Transactions of the Society of Actuaries, XXVIII,
    215–231.
  45. Gillam, W. (1992), “Parametrizing the Workers Compensation Experience Rating Plan,”
    Proceedings of the Casualty Actuarial Society, LXXIX, 21–56.
  46. Goovaerts, M. J. and Hoogstad, W. J. (1987), Credibility Theory, Surveys of Actuarial Studies
    No. 4, Rotterdam: Nationale-Nederlanden.
  47. Grandell, J. (1997), Mixed Poisson Processes, London: Chapman & Hall.
  48. Hachemeister, C. A. (1975), “Credibility for Regression Models with Application to Trend,”
    in P. Kahn, ed., Credibility: Theory and Applications, New York: Academic Press, 129–163.
  49. Hartman, B. (2014), “Bayesian Computational Methods,” in Frees, J., Meyers, G., and Derrig,
    R., eds., Predictive Modeling Applications in Actuarial Science, New York: Cambridge
    University Press.
  50. Hartman, B., Richardson, R., and Bateman, R. (2017), “Parameter Uncertainty,” Research
    Report published by the Canadian Institute of Actuaries, the Casualty Actuarial Society, and
    the Society of Actuaries. Available at https://www.soa.org/research-reports/2017/parameter-
    uncertainty.
  51. Hayne, R. (1994), “Extended Service Contracts,” Proceedings of the Casualty Actuarial
    Society, LXXXI, 243–302.
  52. Herzog, T. (1999), Introduction to Credibility Theory, 3rd ed., Winsted, CT: ACTEX.
  53. Herzog, T. and Laverty, J. (1995), “Experience of Refinanced FHA Section 203(b) Single
    Family Mortgages,” Actuarial Research Clearing House, 1995.1, 97–129.
  54. Hewitt, C., Jr. (1967), “Loss Ratio Distributions – A Model,” Proceedings of the Casualty
    Actuarial Society, LIV, 70–88.
  55. Hogg, R. and Klugman, S. (1984), Loss Distributions, New York: Wiley.
  56. Hogg, R., McKean, J., and Craig, A. (2005), Introduction to Mathematical Statistics, 6th ed.,
    Upper Saddle River, NJ: Prentice-Hall.
  57. Holgate, P. (1970), “The Modality of Some Compound Poisson Distributions,” Biometrika,
    57, 666–667.
  58. Hossack, I., Pollard, J., and Zehnwirth, B. (1983), Introductory Statistics with Applications
    in General Insurance, Cambridge: Cambridge University Press.
  59. Hougaard, P. (2000), Analysis of Multivariate Survival Data, New York: Springer.
  60. Hyndman, R. and Fan, Y. (1996), “Sample Quantiles in Statistical Packages,” The American
    Statistician, 50, 361–365.
  61. James, G., Witten, D., Hastie, T., and Tibshirani, R. (2013), An Introduction to Statistical
    Learning, with Applications in R, New York: Springer.
  62. Jewell, W. (1974), “Credibility Is Exact Bayesian for Exponential Families,” ASTIN Bulletin,
    8, 77–90.
  63. Johnson, N., Kotz, S., and Balakrishnan, N. (1994), Continuous Univariate Distributions,
    Vol. 1, 2nd ed., New York: Wiley.
  64. Johnson, N., Kotz, S., and Balakrishnan, N. (1995), Continuous Univariate Distributions,
    Vol. 2, 2nd ed., New York: Wiley.
  65. Johnson, N., Kotz, S., and Kemp, A. (1993), Univariate Discrete Distributions, 2nd ed., New
    York: Wiley.
  66. Kaplan, E. and Meier, P. (1958), “Nonparametric Estimation from Incomplete Observations,”
    Journal of the American Statistical Association, 53, 457–481.
  67. Karlin, S. and Taylor, H. (1981), A Second Course in Stochastic Processes, New York:
    Academic Press.
  68. Keatinge, C. (1999), “Modeling Losses with the Mixed Exponential Distribution,” Proceed-
    ings of the Casualty Actuarial Society, LXXXVI, 654–698.
  69. Kleiber, C. and Kotz, S. (2003), Statistical Size Distributions in Economics and Actuarial
    Sciences, New York: Wiley.
  70. Klein, J. and Moeschberger, M. (2003), Survival Analysis, Techniques for Censored and
    Truncated Data, 2nd ed., New York: Springer.
  71. Klugman, S. (1987), “Credibility for Classification Ratemaking via the Hierarchical Linear
    Model,” Proceedings of the Casualty Actuarial Society, LXXIV, 272–321.
  72. Klugman, S. (1992), Bayesian Statistics in Actuarial Science with Emphasis on Credibility,
    Boston: Kluwer.
  73. Klugman, S., Panjer, H., and Willmot, G. (2008), Loss Models: From Data to Decisions, 3rd
    ed., New York: Wiley.
  74. Klugman, S., Panjer, H., and Willmot, G. (2013), Loss Models: Further Topics, New York:
    Wiley.
  75. Klugman, S. and Rioux, J. (2006), “Toward a Unified Approach to Fitting Loss Models,”
    North American Actuarial Journal, 10, 1, 63–83.
  76. Kornya, P. (1983), “Distribution of Aggregate Claims in the Individual Risk Model,” Trans-
    actions of the Society of Actuaries, XXXV, 837–858.
  77. Lawless, J. (2003), Statistical Models and Methods for Lifetime Data, 2nd ed., New York:
    Wiley.
  78. Leemis, L. and McQueston, J. (2008), “Univariate Distribution Relationships,” The American
    Statistician, 62, 1, 45-53.
  79. Lemaire, J. (1995), Automobile Insurance: Actuarial Models, 2nd ed., Boston: Kluwer.
  80. Lindley, D. (1987), “The Probability Approach to the Treatment of Uncertainty in Artificial
    Intelligence and Expert Systems,” Statistical Science, 2, 17–24 (also related articles in that
    issue).
  81. London, D. (1988), Survival Models and Their Estimation, 3rd ed., Winsted, CT: ACTEX.
  82. Longley-Cook, L. (1958), “The Employment of Property and Casualty Actuaries,” Proceed-
    ings of the Casualty Actuarial Society, XLV, 9–10.
  83. Longley-Cook, L. (1962), “An Introduction to Credibility Theory,” Proceeding of the Casu-
    alty Actuarial Society, XLIX, 194–221.
  84. Luong, A. and Doray, L. (1996), “Goodness of Fit Test Statistics for the Zeta Family,”
    Insurance: Mathematics and Economics, 10, 45–53.
  85. Manistre, B. and Hancock, G. (2005), “Variance of the CTE Estimator,” North American
    Actuarial Journal, 9, 129–156.
  86. Meyers, G. (1984), “Empirical Bayesian Credibility for Workers’ Compensation Classifica-
    tion Ratemaking,” Proceedings of the Casualty Actuarial Society, LXXI, 96–121.
  87. Meyers, G. (1994), “Quantifying the Uncertainty in Claim Severity Estimates for an Excess
    Layer When Using the Single Parameter Pareto,” Proceedings of the Casualty Actuarial
    Society, LXXXI, 91–122 (including discussion).
  88. Meyers, G. (2007), “Estimating Predictive Distributions for Loss Reserve Models,” Variance,
    1:2, 248–272.
  89. Meyers, G. (2016), Stochastic Loss Reserving Using Bayesian MCMC Models, CAS Mono-
    graph Series #1, Arlington, VA: Casualty Actuarial Society.
  90. Mildenhall, S. (2006), “A Multivariate Bayesian Claim Count Development Model with
    Closed Form Posterior and Predictive Distributions,” Casualty Actuarial Society Forum,
    2006:Winter, 451–493.
  91. Moore, D. (1986), “Tests of Chi-Squared Type,” in D’Agostino, R. and Stephens, M., eds.,
    Goodness-of-Fit Techniques, New York: Marcel Dekker, 63–95.
  92. Mowbray, A. H. (1914), “How Extensive a Payroll Exposure Is Necessary to Give a Depend-
    able Pure Premium?” Proceedings of the Casualty Actuarial Society, I, 24–30.
  93. Nelson, W. (1972), “Theory and Applications of Hazard Plotting for Censored Failure Data,”
    Technometrics, 14, 945–965.
  94. Norberg, R. (1979), “The Credibility Approach to Experience Rating,” Scandinavian Actu-
    arial Journal, 181–221.
  95. Ntzoufras, I. and Dellaportas, P. (2002), “Bayesian Modeling of Outstanding Liabilities
    Incorporating Claim Count Uncertainty,” North American Actuarial Journal, 6, 113–128.
  96. Overbeck, L. (2000), “Allocation of Economic Capital in Loan Portfolios,” in Franke, J.,
    Haerdle, W., and Stahl, G., eds., Measuring Risk in Complex Systems, New York: Springer.
  97. Panjer, H. and Lutek, B. (1983), “Practical Aspects of Stop-Loss Calculations,” Insurance:
    Mathematics and Economics, 2, 159–177.
  98. Panjer, H. and Wang, S. (1993), “On the Stability of Recursive Formulas,” ASTIN Bulletin,
    23, 227–258.
  99. Panjer, H. and Willmot, G. (1986), “Computational Aspects of Recursive Evaluation of
    Compound Distributions,” Insurance: Mathematics and Economics, 5, 113–116.
  100. Panjer, H. and Willmot, G. (1992), Insurance Risk Models, Chicago: Society of Actuaries.
  101. Pettitt, A. and Stephens, M. (1977), “The Kolmogorov–Smirnov Goodness-of-Fit Statistic
    with Discrete and Grouped Data,” Technometrics, 19, 205–210.
  102. Pickands, J. (1975), “Statistical Inference Using Extreme Order Statistics,” Annals of Statis-
    tics, 3, 119–131.
  103. Press, W., Flannery, B., Teukolsky, S., and Vetterling, W. (1988), Numerical Recipes in C,
    Cambridge: Cambridge University Press.
  104. Rao, C. (1965), Linear Statistical Inference and Its Applications, New York: Wiley.
  105. Ripley, B. (1987), Stochastic Simulation, New York: Wiley.
  106. Rohatgi, V. (1976), An Introduction to Probability Theory and Mathematical Statistics, New
    York: Wiley.
  107. Ross, S. (1996), Stochastic Processes, 2nd ed., New York: Wiley.
  108. Ross, S. (2006), Simulation, 4th ed., San Diego: Academic Press.
  109. Ross, S. (2007), Introduction to Probability Models, 9th ed., San Diego: Academic Press.
  110. Schwarz, G. (1978), “Estimating the Dimension of a Model,” Annals of Statistics, 6, 461–464.
  111. Scollnik, D. (2002), “Modeling Size-of-Loss Distributions for Exact Data in WinBUGS,”
    Journal of Actuarial Practice, 10, 193–218.
  112. Self, S. and Liang, K. (1987), “Asymptotic Properties of Maximum Likelihood Estimators and
    Likelihood Ratio Tests Under Nonstandard Conditions,” Journal of the American Statistical
    Association, 82, 605–610.
  113. Simon, L. (1961), “Fitting Negative Binomial Distributions by the Method of Maximum
    Likelihood,” Proceedings of the Casualty Actuarial Society, XLVIII, 45–53.
  114. Society of Actuaries Committee on Actuarial Principles (1992), “Principles of Actuarial
    Science,” Transactions of the Society of Actuaries, XLIV, 565–628.
  115. Society of Actuaries Committee on Actuarial Principles (1995), “Principles Regarding Provi-
    sions for Life Risks,” Transactions of the Society of Actuaries, XLVII, 775–793.
  116. Stephens, M. (1986), “Tests Based on EDF Statistics,” in D’Agostino, R. and Stephens, M.,
    eds., Goodness-of-Fit Techniques, New York: Marcel Dekker, 97–193.
  117. Sundt, B. (1986), Special issue on credibility theory, Insurance: Abstracts and Reviews, 2.
  118. Sundt, B. (1999), An Introduction to Non-Life Insurance Mathematics, 4th ed., Karlsruhe:
    Verlag Versicherungswirtschaft (VVW).
  119. Tasche, D. (2002), “Expected Shortfall and Beyond,” Journal of Banking and Finance, 26,
    1519–1533.
  120. Thyrion, P. (1961), “Contribution a l’Etude du Bonus pour non Sinistre en Assurance
    Automobile,” ASTIN Bulletin, 1, 142–162.
  121. Tröbliger, A. (1961), “Mathematische Untersuchungen zur Beitragsruckgewahr in der
    Kraftfahrversicherung,” Blätter der Deutsche Gesellschaft fur Versicherungsmathematik, 5,
    327–348.
  122. Tukey, J. (1962), “The Future of Data Analysis,” Annals of Mathematical Statistics, 33, 1–67.
  123. Tweedie, M. C. K. (1984), “An Index which Distinguishes Between some Important Exponen-
    tial Families,” in Ghosh, J. K. and Roy, J., eds., Statistics: Applications and New Directions.
    Proceedings of the Indian Statistical Institute Golden Jubilee International Conference,
    Calcutta: Indian Statistical Institute, 579–604.
  124. Venter, G. (1983), “Transformed Beta and Gamma Distributions and Aggregate Losses,”
    Proceedings of the Casualty Actuarial Society, LXX, 156–193.
  125. Verrall, R. (1990), “Bayes and Empirical Bayes Estimation for the Chain Ladder Method,”
    ASTIN Bulletin, 20, 217–243.
  126. Wang, S. (1996), “Premium Calculation by Transforming the Layer Premium Density,”
    ASTIN Bulletin, 26, 71–92.
  127. Wang, S. (1998), “Implementation of PH Transforms in Ratemaking,” Proceedings of the
    Casualty Actuarial Society, 85, 940–979 .
  128. Wang, S., Young, V., and Panjer, H. (1997), “Axiomatic Characterization of Insurance
    Prices,” Insurance: Mathematics and Economics, 21, 173–183.
  129. Waters, H. (1984). “An Approach to the Study of Multiple State Models,” Journal of the
    Institute of Actuaries, 111(2), 363–374.
  130. Waters, H. R. (1993), Credibility Theory, Edinburgh: Department of Actuarial Mathematics
    & Statistics, Heriot-Watt University.
  131. Whitney, A. W. (1918), “The Theory of Experience Rating,” Proceedings of the Casualty
    Actuarial Society, IV, 274–292.
  132. Wirch, J. (1999), “Raising Value at Risk,” North American Actuarial Journal, 3, 106–115.
  133. Wuthrich, M. (2007), “Using a Bayesian Approach for Claim Reserving,” Variance, 1:2,
    292–301.

  1. model office ↩︎
  2. هنگام نشان دادن توابع مرتبط با متغیرهای تصادفی، تشخیص متغیر تصادفی از طریق زیرنویس روی تابع معمول است. در اینجا، زیرنویس‌ها تنها زمانی استفاده می‌شوند که برای تشخیص یک متغیر تصادفی از متغیر دیگر لازم باشد. علاوه بر این، برای پنج مدلی که به‌زودی معرفی می‌شوند، به جای نوشتن تابع توزیع برای متغیر تصادفی 2 به‌عنوان $F_{X_2}(x)$، به سادگی $F_2(x)$ نشان داده می‌شود. ↩︎
  3. اولین نکته از سه مورد آخر نتیجه می‌شود. ↩︎
  4. پیوسته از راست به این معنی است که در هر نقطه $x_0$، مقدار حدی $F$ وقتی $x$ از سمت راست به $x_0$ میل می‌کند برابر $F(x_0)$ باشد. این لزومی ندارد وقتی $x$ از سمت چپ به $x_0$ میل می‌کند درست باشد. ↩︎
  5. پنج مدل (چهار مورد در اینجا و یکی بعداً معرفی شدند) با اعداد 1-5 مشخص می‌شوند. برای نمونه‌های دیگر از طرح شماره گذاری سنتی برای تعاریف و موارد مشابه استفاده می شود. ↩︎
  6. دلیل اینکه مشخص نیست این است که متغیر تصادفی زیربنایی توصیف نشده است. فرض کنید که مدل 1 نشان دهنده درصدی از ارزش از دست رفته در یک خانه به طور تصادفی انتخاب شده، پس از طوفان است. سپس 0 و 100 هر دو مقادیر ممکن هستند و در تکیه‌گاه گنجانده می‌شوند. به نظر می‌رسد که تصمیمی در مورد گنجاندن نقاط پایانی در تکیه‌گاه از یک متغیر تصادفی پیوسته به ندرت مورد نیاز است. اگر پاسخ روشنی وجود نداشته باشد، می‌توان یک انتخاب دلخواه انجام داد. ↩︎
  7. توجه داشته باشید که نیروی مرگ و میر یک احتمال نیست (به ویژه، میتواند بیشتر از 1 باشد)، اگرچه تجسم آن به عنوان یک احتمال ضرری ندارد. ↩︎
  8. با تعریف دلخواه مقدار چگالی یا تابع نرخ خطر در چنین نقطه ای، واضح است که استفاده از هر یک از آنها برای به دست آوردن تابع بقا کارساز خواهد بود. اگر در این نقطه احتمال گسسته وجود داشته باشد (در این صورت این توابع تعریف نشده باقی می مانند)، آنگاه توابع چگالی و خطر برای توصیف کامل توزیع احتمال کافی نیستند. ↩︎
  9. دقیق‌تر است که این موارد را «ضریب چولگی» و «ضریب کشیدگی» بنامیم زیرا مقادیر دیگری نیز وجود دارند که عدم تقارن و صافی را نیز اندازه‌گیری می‌کنند. در این متن از عبارات ساده‌تری استفاده شده است. ↩︎