رویکرد بر اساس مدل بندی
رویکرد مبتنی بر مدل باید در چارچوب اهداف هر مسئله در نظر گرفته شود. بسیاری از مسائل درعلم بیمسنجی شامل ساخت یک مدل ریاضی است که می تواند برای پیش بینی هزینه های بیمه در آینده استفاده شود.
مدل یک توصیف ریاضی ساده شده است که بر اساس دانش و تجربه بیمسنج همراه با دادههای گذشته ساخته میشود. دادهها بیمسنج را در انتخاب شکل مدل و همچنین در کالیبره کردن کمیتهای ناشناخته که معمولاً پارامتر نامیده میشوند، راهنمایی میکند. این مدل تعادلی بین سادگی و انطباق با دادههای موجود فراهم میکند.
سادگی بر حسب مواردی مانند تعداد پارامترهای ناشناخته (هرچه کمتر، ساده تر) اندازه گیری می شود. انطباق با دادهها بر حسب اختلاف بین دادهها و مدل اندازه گیری میشود. انتخاب مدل بر اساس تعادل بین دو معیار، یعنی برازش و سادگی است.
فرایند مدل بندی
فرآیند مدل سازی در شکل 1.1 نشان داده شده است که شش مرحله زیر را شرح میدهد:
گام 1 یک یا چند مدل بر اساس دانش و تجربه قبلی تحلیلگر و احتمالاً بر اساس ماهیت و شکل دادههای موجود انتخاب میشوند. به عنوان مثال، در مطالعات مرگ و میر، مدل ها ممکن است حاوی اطلاعات متغیر کمکی مانند سن، جنس، مدت زمان، نوع قرارداد، اطلاعات پزشکی و متغیرهای سبک زندگی باشند. در مطالعات مربوط به اندازه خسارت بیمه، ممکن است یک توزیع آماری (مثلاً لگ نرمال، گاما، یا وایبل) انتخاب شود.
گام 2 مدل بر اساس دادههای موجود کالیبره میشود. در مطالعات مرگ و میر، این دادهها ممکن است اطلاعات مجموعهای از بیمه نامههای عمر باشد. در مطالعات مربوط به طلب اموال، دادهها ممکن است اطلاعاتی در مورد هر یک از مجموعهای از خسارتهای واقعی بیمه پرداخت شده تحت مجموعهای از بیمه نامههای اموال باشند.
گام 3 مدل برازش شده برای تعیین اینکه آیا به اندازه کافی با دادهها مطابقت دارد یا خیر اعتبار سنجی میشود. می توان از تست های تشخیصی مختلفی استفاده کرد. اینها ممکن است آزمونهای آماری معروفی مانند آزمون کای دو یا آزمون کولموگروف-اسمیرنوف باشند، یا ممکن است ماهیت کیفیتری داشته باشند. انتخاب آزمون ممکن است مستقیماً با هدف نهایی تمرین مدلسازی مرتبط باشد. در مطالعات مربوط به بیمه، مجموع خسارت ارائه شده توسط مدل برازش شده اغلب برای برابری با کل خسارت واقعی در دادهها مورد نیاز است. درحرفه بیمه، این اغلب به عنوان بیطرفی یک مدل شناخته می شود.
گام 4 فرصتی برای بررسی سایر مدل های ممکن فراهم میشود. این به ویژه زمانی مفید است که گام 3 نشان دهد که همه مدلها نامناسب هستند. همچنین ممکن است در این مرحله بیش از یک مدل معتبر مورد بررسی قرار گیرد.
گام 5 تمام مدلهای معتبر در نظر گرفته شده در گامهای 1-4 با استفاده از برخی معیارها برای انتخاب بین آنها مقایسه میشوند. این ممکن است با استفاده از نتایج آزمایشی که قبلاً به دست آمده است یا با استفاده از معیار دیگری انجام شود. پس از انتخاب برنده، بازندهها ممکن است برای تجزیه و تحلیل حساسیت حفظ شوند.
گام 6 در نهایت، مدل انتخاب شده برای کاربرد در آینده تطبیق داده میشود. این میتواند شامل تعدیل پارامترها برای انعکاس تورم پیش بینی شده از زمان جمع آوری دادهها تا دوره زمانی باشد که مدل برای آن اعمال خواهد شد.
با جمع آوری دادههای جدید یا تغییر محیط، شش گام برای بهبود مدل باید تکرار شوند.
در سالهای اخیر، بیمسنجان بیشتر درگیر مشکلات “کلان داده” شدهاند. حجم عظیمی از دادهها چالشهایی را با خود به همراه دارند که نیازمند انطباق با مراحل ذکر شده در بالا هستند. برای جلوگیری از ساخت مدلهای بیش از حد پیچیده که با دادهها مطابقت دارند، اما زمانی که برای پیشبینی مشاهدات آینده استفاده میشوند، عملکرد بدتری دارند، باید دقت بیشتری کرد. تکنیکهایی مانند نمونههای نگهدارنده و اعتبارسنجی متقابل برای رسیدگی به چنین مسائلی به کار گرفته میشود. این موضوعات از حوصله این کتاب خارج است. ارجاعات متعددی از آنها وجود دارد از جمله [61].
مزیت مدل بندی
اراده استفاده از مزایای مدلها ما را ملزم میکند که جایگزین را در نظر بگیریم: تصمیم گیری کاملاً مبتنی بر شواهد تجربی. رویکرد تجربی فرض میکند که میتوان انتظار داشت که آینده دقیقاً مانند نمونهای از گذشته باشد، شاید برای روندهایی مانند تورم تعدیل شود. مثال 1.1 را در نظر بگیرید.
مثال 1-1
مجموعه ای از گواهی نامههای بیمه عمر گروهی شامل 1000 کارمند در سنین مختلف و مزایای فوت است. در طول پنج سال گذشته، 14 کارمند فوت کردند و در مجموع 580000 مزایا دریافت کردند (تعدیل شده بر اساس تورم زیرا این طرح مزایا را به حقوق مرتبط میکند). برآورد تجربی پرداخت مزایای مورد انتظار سال آینده را تعیین کنید.
تخمین تجربی برای سال آینده 116000 (یک پنجم کل) است که برای افزایش مزایا باید بیشتر تعدیل شود. البته خطر این است که تجربه پنج سال گذشته به درستی آینده این مجموعه را منعکس نماید بعید است، زیرا ممکن است نوسانات قابل توجهی در چنین نتایج کوتاه مدتی وجود داشته باشد. □
به نظر میرسد ساخت یک مدل، در این مورد جدول مرگ و میر، بسیار منطقیتر است. این جدول بر اساس تجربه زندگی بسیاری از افراد است، نه فقط 1000 نفر در گروه ما. با استفاده از این مدل، نه تنها میتوان پرداخت مورد انتظار را برای سال آینده تخمین زد، بلکه میتوان با محاسبه انحراف معیار پرداختها یا شاید صدکهای مختلف از توزیع پرداختها، ریسک ناشی از آن را اندازهگیری کرد. این دقیقاً مسئلهای است که در متونی مانند [25] و [28] پوشش داده شده است.
این رویکرد توسط کمیته انجمن بیمسنجان در اصول بیمسنجی تدوین شده است. در نشریه “اصول علم بیمسنجی” [114، ص. 571]، اصل 3.1 بیان میکند که “ریسکهای بیمسنجی را میتوان به طور تصادفی بر اساس مفروضات مربوط به احتمالاتی که برای متغیرهای ریسک بیمسنجی در آینده اعمال میشود، از جمله مفروضات مربوط به محیط آینده، مدل سازی کرد.” متغیرهای ریسک بیمسنجی که به آنها اشاره میشود عبارتند از وقوع، زمان و شدت – یعنی شانس طلب یک خسارت، زمانی که رویداد در صورت وقوع رخ میدهد و هزینه تسویه خسارت.
سازماندهی این کتاب
این متن ما را در فرآیند مدلسازی هدایت میکند، اما نه به ترتیبی که در بخش 1.1 ارائه شده است. بین نحوه به کارگیری مدلها و نحوه یادگیری آنها تفاوت وجود دارد. در این متن ابتدا با مدلها و نحوه استفاده از آنها آشنا میشویم و سپس میآموزیم که چگونه تعیین کنیم از کدام مدل استفاده کنیم، زیرا انتخاب مدلها در خلاء دشوار است. تا زمانی که تحلیلگر دانش کاملی از مجموعه مدلهای موجود نداشته باشد، محدود کردن انتخاب به مدلهایی که ارزش بررسی دارند دشوار است. با در نظر گرفتن این موضوع، سازماندهی متن به شرح زیر است:
- بررسی احتمال – تقریباً طبق تعریف، رویدادهای احتمالی بر مدلهای احتمال دلالت دارند. فصلهای 2 و 3 متغیرهای تصادفی و برخی از محاسبات اساسی را که ممکن است با چنین مدلهایی انجام شود، از جمله گشتاورها و صدکها را، مرور میکند.
- درک توزیعهای احتمال – هنگام انتخاب یک مدل احتمال، تحلیلگر باید مجموعه نسبتاً بزرگی از این مدلها را داشته باشد. علاوه بر این، برای انتخاب یک مدل پیشینی خوب، باید ویژگیهای این مدلها در دسترس باشد. در فصلهای 4-7، مدلهای توزیعی مختلف و آنها معرفی شدهاند. این ویژگیهای بررسی شده شامل هر دو توزیع پیوسته و گسسته است.
- تغییرات پوشش – قراردادهای بیمه اغلب پرداخت کامل را ارائه نمی کنند. به عنوان مثال، ممکن است یک فرانشیز وجود داشته باشد (مثلاً بیمه نامه 250 دلار اول را پرداخت نمیکند) یا یک محدودیت (مثلاً بیمه نامه بیش از 10000 دلار برای هر حادثه خسارت پرداخت نمیکند). چنین تغییراتی توزیع احتمال را تغییر میدهد و بر محاسبات مرتبط مانند گشتاورها تأثیر میگذارد. فصل 8 نحوه انجام این کار را نشان میدهد.
- خسارت کل – تا این مرحله، مدلها یا برای مقدار یک پرداخت یا برای تعداد پرداختها هستند. در هنگام مدلسازی یک سبد، مسیر کسب و کار یا کل شرکت، کل مبلغ پرداختی مورد توجه است. مدلی که احتمالات مربوط به تعداد پرداختها و مبالغ هر پرداخت را ترکیب میکند، مدل خسارت کل نامیده میشود. محاسبات برای چنین مدلهایی در فصل 9 پوشش داده شده است.
- مقدمهای بر آمار ریاضی – از آنجا که اکثر مدلهای در نظر گرفته شده مدلهای احتمال هستند، تکنیکهای آمار ریاضی برای برآورد مشخصات مدل و انتخاب مورد نیاز است. در حالی که فصلهای 10 و 11 جایگزینی برای یک متن یا دوره کامل در آمار ریاضی نیستند، حاوی موارد ضروری هستند که بعداً در این کتاب مورد نیاز است. فصل 12 تکنیکهای تخمین برای شمارش توزیعها را پوشش میدهد، زیرا در کار بیمسنجی از اهمیت ویژه ای برخوردار هستند.
- روشهای بیزی – جایگزینی برای رویکرد فراوان گرا برای برآورد در فصل 13 ارائه شده است. این مقدمه کوتاه مفاهیم اساسی روشهای بیزی را معرفی می کند.
- ساخت مدلهای تجربی – گاهی اوقات کار با توزیع تجربی دادهها مناسب است. این ممکن است به این دلیل باشد که حجم دادهها کافی است یا به این دلیل است که به یک تصویر خوب از دادهها نیاز است. فصل 14 مدلهای تجربی را برای مورد ساده دادههای قابل فهم، تعدیلات برای دادههای بریده شده و سانسور شده، و اصلاحات مناسب برای مجموعه دادههای بزرگ، به ویژه آنهایی که در مطالعات مرگ و میر با آن مواجه میشوند، پوشش میدهد.
- انتخاب مدلهای پارامتریک – با در دست داشتن روشهای تخمین، مرحله نهایی انتخاب مدل مناسب است. روشهای گرافیکی و تحلیلی در فصل 15 پوشش داده شده است.
- تعدیل برآوردها – در مواقعی، تعدیل بیشتر نتایج نیاز است. هنگامی که یک یا چند تخمین بر اساس تعداد کمی از مشاهدات وجود دارد، دقت را میتوان با افزودن مشاهدات مرتبط دیگر بهبود بخشید. اگر دادههای اضافی از جمعیت دیگری باشد، باید مراقب بود. روشهای اعتبار، که در فصلهای 16 تا 18 پوشش داده شدهاند، مکانیزمی را برای انجام تعدیل مناسب در هنگام گنجاندن دادههای اضافی ارائه میکنند.
- شبیه سازی – زمانی که به دست آوردن نتایج تحلیلی دشوار است، شبیه سازی (استفاده از اعداد تصادفی) ممکن است پاسخ مورد نیاز را ارائه دهد. مقدمه کوتاهی بر این تکنیک در فصل 19 ارائه شده است.