فصل 1: مدل بندی (مدل‌های زیان : از داده تا تصمیم)

در فرایند تکمیل می‌باشد. صبور باشید.

رویکرد بر اساس مدل بندی

رویکرد مبتنی بر مدل باید در چارچوب اهداف هر مسئله در نظر گرفته شود. بسیاری از مسائل درعلم بیم‌سنجی شامل ساخت یک مدل ریاضی است که می تواند برای پیش بینی هزینه های بیمه در آینده استفاده شود.

مدل یک توصیف ریاضی ساده شده است که بر اساس دانش و تجربه بیم‌سنج همراه با داده‌های گذشته ساخته می‌شود. داده‌ها بیم‌سنج را در انتخاب شکل مدل و همچنین در کالیبره کردن کمیت‌های ناشناخته که معمولاً پارامتر نامیده می‌شوند، راهنمایی می‌کند. این مدل تعادلی بین سادگی و انطباق با داده‌های موجود فراهم می‌کند.

سادگی بر حسب مواردی مانند تعداد پارامترهای ناشناخته (هرچه کمتر، ساده تر) اندازه گیری می شود. انطباق با داده‌ها بر حسب اختلاف بین داده‌ها و مدل اندازه گیری می‌شود. انتخاب مدل بر اساس تعادل بین دو معیار، یعنی برازش و سادگی است.

فرایند مدل بندی

فرآیند مدل سازی در شکل 1.1 نشان داده شده است که شش مرحله زیر را شرح می‌دهد:

Figure 1.1 The modeling process.
شکل 1.1 فرایند مدل بندی

گام 1 یک یا چند مدل بر اساس دانش و تجربه قبلی تحلیلگر و احتمالاً بر اساس ماهیت و شکل داده‌های موجود انتخاب می‌شوند. به عنوان مثال، در مطالعات مرگ و میر، مدل ها ممکن است حاوی اطلاعات متغیر کمکی مانند سن، جنس، مدت زمان، نوع قرارداد، اطلاعات پزشکی و متغیرهای سبک زندگی باشند. در مطالعات مربوط به اندازه خسارت بیمه، ممکن است یک توزیع آماری (مثلاً لگ نرمال، گاما، یا وایبل) انتخاب شود.

گام 2 مدل بر اساس داده‌های موجود کالیبره می‌شود. در مطالعات مرگ و میر، این داده‌ها ممکن است اطلاعات مجموعه‌ای از بیمه نامه‌های عمر باشد. در مطالعات مربوط به طلب اموال، داده‌ها ممکن است اطلاعاتی در مورد هر یک از مجموعه‌ای از خسارت‌های واقعی بیمه پرداخت شده تحت مجموعه‌ای از بیمه نامه‌های اموال باشند.

گام 3 مدل برازش شده برای تعیین اینکه آیا به اندازه کافی با داده‌ها مطابقت دارد یا خیر اعتبار سنجی می‌شود. می توان از تست های تشخیصی مختلفی استفاده کرد. اینها ممکن است آزمون‌های آماری معروفی مانند آزمون کای دو یا آزمون کولموگروف-اسمیرنوف باشند، یا ممکن است ماهیت کیفی‌تری داشته باشند. انتخاب آزمون ممکن است مستقیماً با هدف نهایی تمرین مدلسازی مرتبط باشد. در مطالعات مربوط به بیمه، مجموع خسارت ارائه شده توسط مدل برازش شده اغلب برای برابری با کل خسارت واقعی در داده‌ها مورد نیاز است. درحرفه بیمه، این اغلب به عنوان بی‌طرفی یک مدل شناخته می شود.

گام 4 فرصتی برای بررسی سایر مدل های ممکن فراهم می‌شود. این به ویژه زمانی مفید است که گام 3 نشان دهد که همه مدل‌ها نامناسب هستند. همچنین ممکن است در این مرحله بیش از یک مدل معتبر مورد بررسی قرار گیرد.

گام 5 تمام مدل‌های معتبر در نظر گرفته شده در گام‌های 1-4 با استفاده از برخی معیارها برای انتخاب بین آنها مقایسه می‌شوند. این ممکن است با استفاده از نتایج آزمایشی که قبلاً به دست آمده است یا با استفاده از معیار دیگری انجام شود. پس از انتخاب برنده، بازنده‌ها ممکن است برای تجزیه و تحلیل حساسیت حفظ شوند.

گام 6 در نهایت، مدل انتخاب شده برای کاربرد در آینده تطبیق داده می‌شود. این می‌تواند شامل تعدیل پارامترها برای انعکاس تورم پیش بینی شده از زمان جمع آوری داده‌ها تا دوره زمانی باشد که مدل برای آن اعمال خواهد شد.

با جمع آوری داده‌های جدید یا تغییر محیط، شش گام برای بهبود مدل باید تکرار شوند.

در سال‌های اخیر، بیم‌سنجان بیشتر درگیر مشکلات “کلان داده” شده‌اند. حجم عظیمی از داده‌ها چالش‌هایی را با خود به همراه دارند که نیازمند انطباق با مراحل ذکر شده در بالا هستند. برای جلوگیری از ساخت مدل‌های بیش از حد پیچیده که با داده‌ها مطابقت دارند، اما زمانی که برای پیش‌بینی مشاهدات آینده استفاده می‌شوند، عملکرد بدتری دارند، باید دقت بیشتری کرد. تکنیک‌هایی مانند نمونه‌های نگهدارنده و اعتبارسنجی متقابل برای رسیدگی به چنین مسائلی به کار گرفته می‌شود. این موضوعات از حوصله این کتاب خارج است. ارجاعات متعددی از آنها وجود دارد از جمله [61].

مزیت مدل بندی

اراده استفاده از مزایای مدل‌ها ما را ملزم می‌کند که جایگزین را در نظر بگیریم: تصمیم گیری کاملاً مبتنی بر شواهد تجربی. رویکرد تجربی فرض می‌کند که می‌توان انتظار داشت که آینده دقیقاً مانند نمونه‌ای از گذشته باشد، شاید برای روندهایی مانند تورم تعدیل شود. مثال 1.1 را در نظر بگیرید.

مثال 1-1
مجموعه ای از گواهی نامه‌‌‌‌های بیمه عمر گروهی شامل 1000 کارمند در سنین مختلف و مزایای فوت است. در طول پنج سال گذشته، 14 کارمند فوت کردند و در مجموع 580000 مزایا دریافت کردند (تعدیل شده بر اساس تورم زیرا این طرح مزایا را به حقوق مرتبط می‌کند). برآورد تجربی پرداخت مزایای مورد انتظار سال آینده را تعیین کنید.
تخمین تجربی برای سال آینده 116000 (یک پنجم کل) است که برای افزایش مزایا باید بیشتر تعدیل شود. البته خطر این است که تجربه پنج سال گذشته به درستی آینده این مجموعه را منعکس نماید بعید است، زیرا ممکن است نوسانات قابل توجهی در چنین نتایج کوتاه مدتی وجود داشته باشد. □

به نظر میرسد ساخت یک مدل، در این مورد جدول مرگ و میر، بسیار منطقی‌تر است. این جدول بر اساس تجربه زندگی بسیاری از افراد است، نه فقط 1000 نفر در گروه ما. با استفاده از این مدل، نه تنها می‌توان پرداخت مورد انتظار را برای سال آینده تخمین زد، بلکه می‌توان با محاسبه انحراف معیار پرداخت‌ها یا شاید صدک‌های مختلف از توزیع پرداخت‌ها، ریسک ناشی از آن را اندازه‌گیری کرد. این دقیقاً مسئله‌ای است که در متونی مانند [25] و [28] پوشش داده شده است.

این رویکرد توسط کمیته انجمن بیم‌سنجان در اصول بیم‌سنجی تدوین شده است. در نشریه “اصول علم بیم‌سنجی” [114، ص. 571]، اصل 3.1 بیان می‌کند که “ریسک‌های بیم‌سنجی را می‌توان به طور تصادفی بر اساس مفروضات مربوط به احتمالاتی که برای متغیرهای ریسک بیم‌سنجی در آینده اعمال می‌شود، از جمله مفروضات مربوط به محیط آینده، مدل سازی کرد.” متغیرهای ریسک بیم‌سنجی که به آنها اشاره می‌شود عبارتند از وقوع، زمان و شدت – یعنی شانس طلب یک خسارت، زمانی که رویداد در صورت وقوع رخ می‌دهد و هزینه تسویه خسارت.

سازماندهی این کتاب

این متن ما را در فرآیند مدل‌سازی هدایت می‌کند، اما نه به ترتیبی که در بخش 1.1 ارائه شده است. بین نحوه به کارگیری مدل‌ها و نحوه یادگیری آنها تفاوت وجود دارد. در این متن ابتدا با مدل‌ها و نحوه استفاده از آن‌ها آشنا می‌شویم و سپس می‌آموزیم که چگونه تعیین کنیم از کدام مدل استفاده کنیم، زیرا انتخاب مدل‌ها در خلاء دشوار است. تا زمانی که تحلیلگر دانش کاملی از مجموعه مدل‌های موجود نداشته باشد، محدود کردن انتخاب به مدل‌هایی که ارزش بررسی دارند دشوار است. با در نظر گرفتن این موضوع، سازماندهی متن به شرح زیر است:

  1. بررسی احتمال – تقریباً طبق تعریف، رویدادهای احتمالی بر مدل‌های احتمال دلالت دارند. فصل‌های 2 و 3 متغیرهای تصادفی و برخی از محاسبات اساسی را که ممکن است با چنین مدل‌هایی انجام شود، از جمله گشتاورها و صدک‌ها را، مرور می‌کند.
  2. درک توزیع‌های احتمال – هنگام انتخاب یک مدل احتمال، تحلیلگر باید مجموعه نسبتاً بزرگی از این مدل‌ها را داشته باشد. علاوه بر این، برای انتخاب یک مدل پیشینی خوب، باید ویژگی‌های این مدل‌ها در دسترس باشد. در فصل‌های 4-7، مدل‌های توزیعی مختلف و آنها معرفی شده‌اند. این ویژگی‌های بررسی شده شامل هر دو توزیع پیوسته و گسسته است.
  3. تغییرات پوشش – قراردادهای بیمه اغلب پرداخت کامل را ارائه نمی کنند. به عنوان مثال، ممکن است یک فرانشیز وجود داشته باشد (مثلاً بیمه نامه 250 دلار اول را پرداخت نمی‌کند) یا یک محدودیت (مثلاً بیمه نامه بیش از 10000 دلار برای هر حادثه خسارت پرداخت نمی‌کند). چنین تغییراتی توزیع احتمال را تغییر می‌دهد و بر محاسبات مرتبط مانند گشتاورها تأثیر می‌گذارد. فصل 8 نحوه انجام این کار را نشان می‌دهد.
  4. خسارت کل – تا این مرحله، مدل‌ها یا برای مقدار یک پرداخت یا برای تعداد پرداخت‌ها هستند. در هنگام مدل‌سازی یک سبد، مسیر کسب و کار یا کل شرکت، کل مبلغ پرداختی مورد توجه است. مدلی که احتمالات مربوط به تعداد پرداخت‌ها و مبالغ هر پرداخت را ترکیب می‌کند، مدل خسارت کل نامیده می‌شود. محاسبات برای چنین مدل‌هایی در فصل 9 پوشش داده شده است.
  5. مقدمه‌ای بر آمار ریاضی – از آنجا که اکثر مدل‌های در نظر گرفته شده مدل‌های احتمال هستند، تکنیک‌های آمار ریاضی برای برآورد مشخصات مدل و انتخاب مورد نیاز است. در حالی که فصل‌های 10 و 11 جایگزینی برای یک متن یا دوره کامل در آمار ریاضی نیستند، حاوی موارد ضروری هستند که بعداً در این کتاب مورد نیاز است. فصل 12 تکنیک‌های تخمین برای شمارش توزیع‌ها را پوشش می‌دهد، زیرا در کار بیم‌سنجی از اهمیت ویژه ای برخوردار هستند.
  6. روش‌های بیزی – جایگزینی برای رویکرد فراوان گرا برای برآورد در فصل 13 ارائه شده است. این مقدمه کوتاه مفاهیم اساسی روش‌های بیزی را معرفی می کند.
  7. ساخت مدل‌های تجربی – گاهی اوقات کار با توزیع تجربی داده‌ها مناسب است. این ممکن است به این دلیل باشد که حجم داده‌ها کافی است یا به این دلیل است که به یک تصویر خوب از داده‌ها نیاز است. فصل 14 مدل‌های تجربی را برای مورد ساده داده‌های قابل فهم، تعدیلات برای داده‌های بریده شده و سانسور شده، و اصلاحات مناسب برای مجموعه داده‌های بزرگ، به ویژه آنهایی که در مطالعات مرگ و میر با آن مواجه می‌شوند، پوشش می‌دهد.
  8. انتخاب مدل‌های پارامتریک – با در دست داشتن روش‌های تخمین، مرحله نهایی انتخاب مدل مناسب است. روش‌های گرافیکی و تحلیلی در فصل 15 پوشش داده شده است.
  9. تعدیل برآوردها – در مواقعی، تعدیل بیشتر نتایج نیاز است. هنگامی که یک یا چند تخمین بر اساس تعداد کمی از مشاهدات وجود دارد، دقت را می‌توان با افزودن مشاهدات مرتبط دیگر بهبود بخشید. اگر داده‌های اضافی از جمعیت دیگری باشد، باید مراقب بود. روش‌های اعتبار، که در فصل‌های 16 تا 18 پوشش داده شده‌اند، مکانیزمی را برای انجام تعدیل مناسب در هنگام گنجاندن داده‌های اضافی ارائه می‌کنند.
  10. شبیه سازی – زمانی که به دست آوردن نتایج تحلیلی دشوار است، شبیه سازی (استفاده از اعداد تصادفی) ممکن است پاسخ مورد نیاز را ارائه دهد. مقدمه کوتاهی بر این تکنیک در فصل 19 ارائه شده است.