گشتاورها
انواع محاسبات جالبی وجود دارد که میتوان با استفاده از مدلهای توضیح داده شده در فصل 2 (متغیرهای تصادفی) انجام داد. به عنوان مثال میتوان به میانگین مبلغ پرداختی در مورد ادعایی که مشمول فرانشیز یا یک محدودیت بیمهنامه یا میانگین طول عمر باقیمانده یک فرد 40 ساله، اشاره نمود.
تعریف 3.1 $k$امین گشتاور خام یک متغیر تصادفی، مقدار مورد انتظار (متوسط) توان $k$ام متغیر است، مشروط بر اینکه وجود داشته باشد. با $E(X^k )$ یا $μ’_k$ نشان داده می شود. اولین گشتاور خام میانگین متغیر تصادفی نامیده می شود و معمولاً توسط $\mu$ نشان داده میشود .
توجه داشته باشید که $\mu$ به $\mu(x)$، نیروی مرگ و میر از تعریف 2.7 مربوط نمیشود. برای متغیرهای تصادفی که فقط مقادیر غیرمنفی می گیرند (یعنی $Pr(X ≥ 0) = 1$)، $k$ ممکن است هر عدد حقیقی باشد. هنگام ارائه فرمول برای محاسبه این کمیت، باید بین متغیرهای پیوسته و گسسته تمایز قائل شد. فرمولهایی برای متغیرهای تصادفی ارائه می شود که در همه جا پیوسته یا در همه جا گسسته هستند. برای مدلهای مختلط، فرمول را با ادغام با توجه به تابع چگالی آن در هر جایی که متغیر تصادفی پیوسته است، و با جمع کردن با توجه به تابع احتمال آن در هر جایی که متغیر تصادفی گسسته است، ارزیابی کنید و نتایج را اضافه کنید. فرمول $k$امین گشتاور خام عبارت است از:
$$
\mu’_k= E(X^k)=\begin{cases}
\int_{-\infty}^{\infty}x^k f(x)dx & \text{if the random variable is continuous}\\
\sum_{j}x_j^k p(x_j) & \text{if the random variable is discrete,}
\end{cases} \qquad (3.1)
$$
که در آن مجموع باید بر تمام $x_j$ با احتمال مثبت گرفته شود. در نهایت توجه داشته باشید که ممکن است انتگرال یا مجموع همگرا نشوند که در این صورت گفته می شود گشتاور وجود ندارد.
مثال 3.1 دو گشتاور خام اول را برای هر یک از پنج مدل تعیین کنید.
زیرنویسهای متغیر تصادفی X نشان میدهد که کدام مدل استفاده میشود.
$$
\begin{align}
E(X_1)&=\int_{0}^100 x(0.01) dx=50,\\
E(X_1^2)&=\int_{0}^100 x^2(0.01) dx=3,333.33,\\
E(X_2)&=\int_{0}^\infty x\frac{3(2,000)^3}{(x+2,000)^4} dx=1,000,\\
E(X_2^2)&=\int_{0}^\infty x^2\frac{3(2,000)^3}{(x+2,000)^4} dx=4,000,000,\\
E(X_3 )& = 0(0.5) + 1(0.25) + 2(0.12) + 3(0.08) + 4(0.05) = 0.93,\\
E(X_3^2 )& = 0(0.5) + 1(0.25) + 4(0.12) + 9(0.08) + 16(0.05) = 2.25,\\
E(X_4)&=0(0.7)+\int_{0}^\infty x(0.000003)e^{-0.000001x} dx=30,000,\\
E(X_4^2)&=0^2(0.7)+\int_{0}^\infty x^2(0.000003)e^{-0.000001x} dx=6,000,000,000,\\
E(X_5)&=\int_{0}^{50} x(0.01) dx+ \int_{50}^{75} x(0.02) dx=43.75,\\
E(X_5^2)&=\int_{0}^{50} x^2(0.01) dx+ \int_{50}^{75} x^2(0.02) dx=2,395.83,\\
\end{align}
$$
□
تعریف 3.2 $k$ امین گشتاور مرکزی یک متغیر تصادفی مقدار مورد انتظار $k$ امین توان انحراف متغیر از میانگین آن است. با $E[(X − μ)^k]$ یا با $\mu_k$ نشان داده میشود. گشتاور مرکزی دوم معمولاً واریانس نامیده میشود و $\sigma^2$ یا $Var(X)$ و جذر آن، $\sigma$، انحراف معیار نامیده میشود. نسبت انحراف معیار به میانگین را ضریب تغییرات می نامند. نسبت سومین گشتاور مرکزی به مکعب انحراف معیار، $\gamma_1 = μ_3 ∕σ^3$، چولگی نامیده میشود. نسبت چهارمین گشتاور مرکزی به توان چهارم انحراف معیار، $\gamma_2 = μ_4 ∕σ^4$، کشیدگی نامیده میشود.1
فرمولهای محاسبه گشتاوری مرکزی برای حالت پیوسته و گسسته به شرح ذیل هستند:
$$
\begin{align}
\mu_k&=E\left[\left(X-\mu\right) ^k \right]\\
&=\int_{-\infty}^{\infty}(x-\mu)^k f(x)dx & \text{if the random variable is continuous}\\
&=\sum_{j}(x_j-\mu)^k p(x_j) & \text{if the random variable is discrete,}
\end{align}\\ \qquad (3.2)
$$
در واقع، انتگرال فقط بر روی مقادیر $x$ که در آن $f(x)$ مثبت است باید گرفته شود. انحراف معیار اندازه گیری میزان احتمالی است که بر روی مقادیر احتمالی متغیر تصادفی پخش میشود و با همان واحدهای خود متغیر تصادفی اندازه گیری میشود. ضریب تغییرات، پراگندگی را نسبت به میانگین اندازه گیری میکند. چولگی معیاری برای عدم تقارن است. یک توزیع متقارن دارای چولگی صفر است، در حالی که چولگی مثبت نشان می دهد که احتمالات سمت راست تمایل دارند به مقادیر دورتر از میانگین نسبت به احتمالات سمت چپ نسبت داده شوند.. کشیدگی صافی توزیع را نسبت به توزیع نرمال (که دارای کشیدگی 3 است) اندازه گیری میکند.2 مقادیر کشیدگی بالای 3 نشان میدهد که (با ثابت نگه داشتن انحراف استاندارد)، نسبت به توزیع نرمال، احتمال بیشتری در نقاط دورتر از میانگین نسبت به نقاط نزدیک به میانگین وجود دارد. ضرایب تغییرات، چولگی و کشیدگی همگی بدون بعد هستند.
بین گشتاورهای خام و مرکزی رابطهای وجود دارد. معادله زیر ارتباط بین گشتاورهای دوم را نشان میدهد. بسط از نسخه پیوسته (3.1) و (3.2) استفاده میکند، اما نتیجه برای همه متغیرهای تصادفی اعمال میشود:
$$
\begin{align}
\mu_2&=\int_{-\infty}^{\infty}(x-\mu)^2 f(x)dx =\int_{-\infty}^{\infty}(x^2-2x\mu+\mu^2)f(x)dx\\
&=E\left(X^2\right)-2\mu E\left(X\right)+\mu^2=\mu’_2-\mu^2\\
\end{align}\\\qquad (3.3)
$$
مثال 3.2 به نظر میرسد که تابع چگالی توزیع گاما دارای چولگی مثبت است. نشان دهید که این درست است و با نمودارها نمایش دهید.
از پیوست A، سه گشتاور خام اولیه توزیع گاما عبارتند از $\alpha \theta$، $\alpha (\alpha+1) \theta ^2$. ، و $\alpha (\alpha+1) (\alpha+2) \theta ^3$. از (3.3) واریانس $\alpha \theta ^2$ است و از راه حل تمرین 3.1 سومین گشتاور مرکزی $2\alpha \theta^3$ است. بنابراین، چولگی $2\alpha^{-1/2}$ است. چون $\alpha$ باید مثبت باشد، چولگی همیشه مثبت است. همچنین با کاهش $\alpha$، چولگی بیشتر میشود.
دو توزیع گامای زیر را در نظر بگیرید. یکی دارای پارامترهای $\alpha=0.5$ و $\theta=100$ است در حالی که دیگری دارای $\alpha=5$ و $\theta=10$ است. دوتوزیع میانگین یکسانی دارند، اما ضرایب چولگی آنها به ترتیب $2.83$ و $0.89$ است. شکل 3.1 تفاوت را نشان میدهد.
در نهایت، هنگام محاسبه گشتاورها، ممکن است انتگرال یا مجموع وجود نداشته باشد (همانطور که برای گشتاورهای سوم و چهارم برای مدل 2 وجود ندارد). برای مدلهایی که معمولاً با آنها مواجه میشویم، انتگرال و جمع غیرمنفی هستند، و بنابراین عدم وجود دلالت بر این دارد که حد انتگرال یا مجموع بینهایت است. برای نمونه، به مثال 3.9 مراجعه کنید.
تعریف 3.3 برای مقدار معین $d$ با $Pr(X>d)>0$، متغیر زیان مازاد $Y^P=X-d$ است، با توجه به اینکه $𝑋 > 𝑑$ است. ارزش مورد انتظار آن،
$$e_X(d)=e(d)=E(Y^P)=E(X-d|X>d)$$
میانگین تابع مازاد زیان نامیده میشود. نامهای دیگر این مقدار مورد انتظار عبارتند از: میانگین تابع زندگی باقیمانده و امید به زندگی کامل. هنگامی که از اصطلاح دوم استفاده می شود، نماد رایج مورد استفاده $\overset{\mathring{}}{e}_d$ است.
این متغیر را میتوان متغیر بریده شده از چپ و منتقل شده نیز نامید. بریده شده است زیرا مقادیر $𝑋$ کوچکتر از$𝑑$ مشاهده نمیشود. منتقل میشود زیرا $𝑑$ از مقادیر باقی مانده کم میشود. وقتی $𝑋$ یک متغیر پرداخت است، میانگین مازاد زیان مبلغ پرداختی، با توجه به اینکه پرداختی بیش از فرانشیز $𝑑$ 3صورت گرفته است مورد انتظار است. وقتی $X$ سن در زمان مرگ است، میانگین مازاد زیان عبارت است از مقدار زمان مورد انتظار باقیمانده تا مرگ با توجه به اینکه فرد در سن $d$ زنده است، میباشد. گشتاور $𝑘$ام متغیر زیان مازاد با رابطه زیر تعیین میشود:
$$
\begin{align}
e^k_X(d)&=\frac{ \int_{d}^{\infty}(x-d)^k f(x)dx }{1-F(d)} & \text{if the variable is continuous}\\
&=\frac{\sum_{x_j>d} (x_j-d)^k p(x_j)}{1-F(d)} & \text{if the variable is discreate.}\\
\end{align}\\\qquad (3.4)
$$
در اینجا، $e^k_X(d)$ تنها در صورتی تعریف میشود که انتگرال یا مجموع همگرا شوند. فرمول مناسبی برای محاسبه گشتاور اول وجود دارد. فرمول ذیل برای متغیر تصادفی پیوسته میباشد، اما نتیجه برای همه انواع متغیرهای تصادفی صادق است.
خط دوم مبتنی بر انتگرال جزء به جزء است که در آن پاد مشتق $f (x)$ به صورت $-S(x)$ در نظر گرفته میشود:
$$
\begin{align}
e_X(d)&=\frac{ \int_{d}^{\infty}(x-d)^k f(x)dx }{1-F(d)}\\
&=\frac{-(x-d)S(x) |_{d}^{\infty} + \int_{d}^{\infty} S(x) d_x}{S(d)} \\
\end{align}\\\qquad (3.5)
$$
تعریف 3.4 متغیر سانسور شده از چپ و منتقل شده عبارت است از:
$$
Y^L=(X-d)_+ =\begin{cases}
0, & X\le d\\
X-d, & x>d.
\end{cases}
$$
سانسور شده از چپ است، زیرا مقادیر کمتر $d$ نادیده گرفته نمیشوند بلکه برابر با صفر قرار میگیرند. هیچ نام یا علامت استانداردی برای گشتاورهای این متغیر وجود ندارد. برای رویدادهای نقدی، تمایز بین متغیر زیان مازاد و متغیر سانسور شده از چپ و منتقل شده، یکی در هر پرداخت در مقابل هر ضرر میباشد. در وضعیت هر پرداخت، متغیر تنها زمانی وجود دارد که پرداخت انجام شود. متغیر به ازای هر ضرر، زمانی که ضرر پرداختی نداشته باشد، مقدار صفر را به خود میگیرد. گشتاروها را می توان از
$$
\begin{align}
E[(X-d)_+^k]&= \int_{d}^{\infty}(x-d)^k f(x)dx & \text{if the variable is continuous.}\\
&=\sum_{x_j>d} (x_j-d)^k p(x_j) & \text{if the variable is discrete.} \\
\end{align}\\\qquad (3.6)
$$
محاسبه نمود. باید توجه شود:
$$
E[(X-d)_+^k]=e^k(d)[1-F(d)].\\\qquad (3.7)
$$
مثال 3.3 با استفاده از نمودار تفاوت بین متغیر زیان مازاد و متغیر سانسور شده از چپ و منتقل شده را نشان دهید.
دو نمودار در شکلهای 3.2 و 3.3، متغیر تغییر یافته $Y$ را به عنوان تابعی از متغیر تغییر نیافته $X$ رسم می کنند. تنها تفاوت این است که برای مقادیر $X$ کمتر از 100، متغیر تعریف نشده است، در حالی که برای متغیر از سمت چپ سانسور شده و منتقل شده برابر با صفر میباشد.□
این مفاهیم به راحتی با یک متغیر تصادفی گسسته نشان داده میشوند.
مثال 3.4 یک بیمه نامه خودرو بدون تغییر پوشش دارای زیانهای احتمالی زیر است، احتمالات داخل پرانتز: $100 (0.4)، 500 (0.2)، 1,000 (0.2)، 2,500 (0.1)$ و $10,000 (0.1)$. توابع جرم احتمال و مقادیر مورد انتظار را برای متغیرهای زیان مازاد و سانسور شده از چپ و منتقل شده تعیین کنید، که در آن فرانشیز روی $750$ تنظیم شده است.
برای متغیر زیان مازاد، $750$ از هر ضرر احتمالی بالاتر از آن مقدار کم میشود. بنابراین مقادیر ممکن برای این متغیر تصادفی $250، 1,750$ و $9250$ است. احتمالات مشروط از تقسیم هر یک از سه احتمال بر $0.4$ (احتمال فراتر از فرانشیز) به دست میآید. آنها به ترتیب $0.5$، $0.25$ و $0.25$ هستند. مقدار مورد انتظار برابر است با:
$$ 250(0.5) + 1,750(0.25) + 9,250(0.25) = 2,875 $$
برای متغیر از سمت چپ سانسور شده و منتقل شده، احتمالاتی که به مقادیر کمتر از $750$ تخصیص داده شده بودند اکنون به صفر اختصاص داده می شوند. احتمالات دیگر بدون تغییر هستند، اما مقادیری که به آنها اختصاص داده می شود با فرانشیز کاهش مییابد. تابع جرم احتمال $0 (0.6)، 250 (0.2)، 1,750 (0.1)$ و $9,750 (0.1)$ است. مقدار مورد انتظار
$ 0(0.6) + 250(0.2) + 1,750(0.1) + 9250(0.1) = 1,150 $
است. همانطور که در (3.7) اشاره شد، نسبت دو مقدار مورد انتظار، احتمال بیشتر بودن از فرانشیز است.
$$
\begin{align}
(3.7) \Rightarrow & \frac{E[(X-750)_+^1]}{e_X^1(750)} =[1-F(750)]=Pr(X>750)\\
&\Rightarrow Pr(X>750)=\frac{1,150}{2,875}=0.4
\end{align}
$$
راه دیگر برای درک تفاوت در این مقادیر مورد انتظار، در نظر گرفتن 10 حادثه با تلفات مطابق با توزیع فوق است. تنها چهار مورد از حوادث موجب پرداخت میشود و ضرب در پرداخت مورد انتظار برای هر پرداخت، در مجموع $4(2,875) = 11,500$ مقدار مورد انتظار برای پرداخت توسط شرکت به دست میآید. یا در نظر بگیرید که 10 حادثه هرکدام دارای پرداختی 1,150 برای هر ضرر (حادثه) در کل دارای ارزش مورد انتظار 11,500 هستند. بنابراین، آنچه مهم است متغیر مورد استفاده نیست، بلکه استفاده مناسب از آن است. □
تعریف بعدی یک متغیر مکمل برای متغیر زیان مازاد ارائه می دهد.
تعریف 3.5 متغیر زیان محدود عبارت است از:
$$
Y=X \land u =\begin{cases}
X, & X<u,\\
u, & X \ge u.
\end{cases}
$$
مقدار مورد انتظار آن، $E(X \land u)$ مقدار مورد انتظار محدود نامیده میشود.
این متغیر را می توان متغیر سانسور شده از راست نیز نامید. از راست سانسور شده است زیرا مقادیر بیشتر از $u$ برابر با $𝑢$ میباشد. پدیده بیمهای که به این متغیر مربوط میشود وجود محدودیت بیمه نامهای است که حداکثر مزایا قابل پرداخت را تعیین میکند. توجه داشته باشید که $(X-d)_+ + (X \land d)=X$ . یعنی خرید یک بیمه نامه با محدودیت 𝑑 و دیگری با فرانشیز 𝑑 معادل خرید پوشش کامل است. این در شکل 3.4 نشان داده شده است.
سرراسترین فرمولها برای گشتاور $𝑘$ام متغیر زیان محدود عبارتند از:
$$
\begin{align}
E\left[ \left( X \land u \right)^k \right] &=
\int_{-\infty}^u x^k f(x) dx +u^k \left[1-F(u)\right]\\
&\text{if the random variable is continuous.}\\
&= \sum_{x_j \le u} x_j^k p(x_j)+u^k [1-F(u)]\\
&\text{if the random variable is discrete.}&\qquad(3.8)
\end{align}
$$
فرمول جالب دیگر به شرح زیر است:
$$
\begin{align}
E\left[ \left( X \land u \right)^k \right] &=
\int_{-\infty}^0 x^k f(x) dx + \int_{0}^u x^k f(x) dx +u^k \left[1-F(u)\right]\\
&=x^k F(x)|_{-\infty}^0 – \int_{-\infty}^0 kx^{k-1}F(x)dx\\
&-x^k S(x)|_0^u+\int_{0}^u kx^{k-1}S(x)dx+u^kS(u)\\
&=-\int_{-\infty}^0 kx^{k-1}F(x)dx+\int_{0}^u kx^{k-1}S(x)dx,&\qquad(3.9)
\end{align}
$$
که در سطر دوم از انتگرال جزء به جرء استفاده شده است. برای $k=1$، داریم:
$$E(X \land u)= -\int_{-\infty}^0 F(x)dx + \int_{0}^u S(x)dx. $$
فرمول مربوطه برای متغیرهای تصادفی گسسته چندان جالب توجه نیست. ارزش مورد انتظار محدود همچنین نشان دهنده مقدار نقدی پس انداز مورد انتظار در هر حادثه هنگام اعمال فرانشیز است. $k$امین گشتاور محدود بسیاری از توزیعهای پیوسته رایج در ضمیمه A ارائه شده است. تمرین 3.8 از شما میخواهد تا رابطهای بین سه گشتاوراول معرفی شده قبلی ایجاد کنید.
مثال 3.5 (مثال 3.4 ادامه) تابع احتمال و مقدار مورد انتظار متغیر زیان محدود را با حد 750 محاسبه کنید. سپس نشان دهید که مجموع مقادیر مورد انتظار متغیرهای تصادفی زیان محدود و سانسور شده از چپ و منتقل شده با مقدار مورد انتظار متغیر تصادفی اصلی برابر است.
به تمام مقادیر ممکن در $750$ یا بالاتر، مقدار $750$ اختصاص داده شده و احتمالات آنها جمع میشود. بنابراین، تابع احتمال $100 (0.4)، 500 (0.2)،$ و $750 (0.4)$، با مقدار مورد انتظار $ 100(0.4) + 500(0.2) + 750(0.4)= 440$ است. مقدار مورد انتظار متغیرتصادفی اصلی $100(0.4) + 500(0.2) + 1,000(0.2) + 2,500(0.1) + 10,000(0.1) = 1,590$ است که $440 + 1,150$ است. □
تمرینها
3.1 فرمولهایی مشابه (3.3) برای $\mu_3$ و $\mu_4$ بدست آورید.
3.2 انحراف معیار، چولگی و کشیدگی را برای هر یک از پنج مدل محاسبه کنید. شاید ذکر این نکته مفید باشد که مدل 2 یک توزیع پارتو است و تابع چگالی در قسمت پیوسته مدل 4 یک توزیع نمایی است. فرمولهایی که ممکن است به محاسبات این مدلها کمک کند در ضمیمه A آمده است.
3.3 (*) یک متغیر تصادفی دارای میانگین و ضریب تغییرات 2 است. گشتاور خام سوم 136 است. چولگی را تعیین کنید.
3.4 (*) چولگی توزیع گامایی را که دارای ضریب تغییرات 1 است، تعیین کنید.
3.5 میانگین تابع زیان مازاد را برای مدل های 1-4 تعیین کنید. توابع مدلهای 1، 2 و 4 را مقایسه کنید.
3.6 (*) برای دو متغیر تصادفی، $𝑋$ و $Y$، $e_Y(30)=e_X(30)+4$. فرض کنید $𝑋$ یک توزیع یکنواخت در بازه 0 تا 100 داشته باشد و فرض کنید $𝑌$ یک توزیع یکنواخت در فاصله 0 تا $\omega$ داشته باشد. $\omega$ را تعیین کنید.
3.7 (*) یک متغیر تصادفی تابع چگالی $f(x)=\lambda^{-1}e^{-x/\lambda} ,x, \lambda>0$ دارد. $e(\lambda)$، میانگین تابع زیان مازاد در $\lambda$ را تعیین نمایید.
3.8 نشان دهید که رابطه زیر برقرار است:
$$ E(X)=e(d)S(d)+E(X\land d). \qquad(3.10)$$
3.9 تابع مقدار مورد انتظار محدود را برای مدل های 1-4 تعیین کنید. این کار را با استفاده از (3.8) و (3.10) انجام دهید. برای مدل های 1 و 2 نیز تابع را با استفاده از (3.9) بدست آورید.
3.10 (*) کدام یک از عبارات زیر صحیح است؟
(الف) میانگین تابع زیان مازاد برای یک توزیع تجربی پیوسته است.
(ب) میانگین تابع زیان مازاد برای یک توزیع نمایی ثابت است.
(ج) اگر میانگین تابع زیان مازاد برای توزیع پارتو وجود داشته باشد، نزولی است.
3.11 (*) زیانها دارای توزیع پارتو با $\alpha=0.5$ و $\theta = 10,000$ هستند. میانگین زیان مازاد را در $10,000$ تعیین کنید.
3.12 یک متغیر بریده شده از راست تعریف کنید و برای گشتاور $k$ام آن فرمولی ارائه دهید.
3.13 (*) توزیع شدت ادعاهای فردی دارای pdf
$$
f(x)=2.5x^{-3.5}, x \ge 1.
$$
است. ضریب تغییرات را تعیین کنید.
3.14 (*) اندازه ادعا $100، 200، 300، 400$، یا $500$ است. احتمالات واقعی برای این مقادیر به ترتیب $0.05، 0.20، 0.50، 0.20،$ و $0.05$ است. چولگی و کشیدگی را برای این توزیع تعیین کنید.
3.15 (*) زیانها از توزیع پارتو با $\alpha>1$ و $\theta$ نامشخص پیروی میکنند. نسبت تابع زیان مازاد در $x=2\theta$ به تابع میانگین مازاد زیان در $x=\theta$ را مشخص نمایید.
3.16 (*) یک نمونه تصادفی با اندازه $10$ دارای دو ادعای $400$، هفت ادعای $800$ و یک ادعای $1,600$ است. ضریب چولگی تجربی را برای یک ادعا مشخص کنید.
صدکها
- دقیقتر است که این موارد را «ضریب چولگی» و «ضریب کشیدگی» بنامیم زیرا مقادیر دیگری نیز وجود دارند که عدم تقارن و صافی را نیز اندازهگیری میکنند. در این متن از عبارات سادهتری استفاده شده است. ↩︎
- به همین دلیل، یک تعریف جایگزین از کشیدگی 3 واحد از تعریف ما کم کرده است، که به توزیع نرمال یک کشش صفر میدهد، که میتواند به عنوان یک معیار مناسب استفاده شود. ↩︎
- این معنای بالانویس $P$ را ارائه می دهد، که نشان میدهد این پرداخت به ازای هر پرداخت است. برای متمایز کردن این متغیر از $Y^L$ ساخته شده است که به زودی معرفی خواهد شد. این دو متغیر به تفصیل در فصل 8 بررسی شده است. ↩︎