فصل 2: متغیرهای تصادفی (مدل‌های زیان : از داده تا تصمیم)

در فرایند تکمیل می‌باشد. صبور باشید.

مقدمه

یک مدل بیم‌سنجی نمایشی از یک جریان نامشخص از پرداخت‌های آتی است. عدم قطعیت ممکن است در رابطه با هر یک یا همه موارد رخداد (آیا پرداختی وجود دارد؟)، زمان (چه زمانی پرداخت انجام می‌شود؟) و شدت (چه مقدار پرداخت می‌شود؟) باشد. از آنجا که مفیدترین ابزار برای نمایش عدم قطعیت از طریق احتمال است، ما بر روی مدل‌های احتمال تمرکز می‌کنیم. در حال حاضر، فرض بر این است که توزیع احتمال مربوطه مشخص است. تعیین توزیع های مناسب در فصل‌های 10 تا 15 پوشش داده شده است. در این بخش، جنبه‌های زیر از مدل‌های احتمال بیم‌سنجی پوشش داده شده است:

  1. تعریف متغیر تصادفی و توابع مهم با چند مثال.
  2. محاسبات پایه از مدل‌های احتمال.
  3. توزیع‌های احتمال خاص و خواص آنها.
  4. محاسبات پیشرفته‌تر با استفاده از مدل‌های شدت.
  5. مدل‌هایی که امکان تعداد تصادفی پرداخت‌ها را در بر می‌گیرند، هر کدام مقدار تصادفی دارند.

تشابهی که در اینجا به دنبال آن هستیم این است که همه مدل‌های پدیده‌های تصادفی دارای عناصر مشابه هستند. برای هر یک مجموعه‌ای از نتایج ممکن وجود دارد. نتیجه خاصی که رخ می‌دهد موفقیت شرکت ما را تعیین می کند. اختصاص احتمالات به نتایج مختلف به ما این امکان را می‌دهد که انتظارات خود و خطر برآورده نشدن آنها را کمی کنیم. در این حالت، متغیر تصادفی زیربنایی تقریباً همیشه با حروف بزرگ و ایتالیک نزدیک به انتهای الفبا، مانند $X$ یا $Y$ نشان داده می‌شود. شرایط نام و برخی ویژگی‌های احتمالی را ارائه می‌دهد. البته مدل‌های بیم‌سنجی‌ای وجود دارند که شبیه مدل‌هایی نیستند که در اینجا توضیح داده شده است. به عنوان مثال، در بیمه عمر، دفتر نمونه1، فهرستی از سلول‌های حاوی نوع بیمه نامه، محدوده سنی، جنسیت و غیره به همراه تعداد قراردادهایی با آن مشخصات است.

برای گسترش این مفهوم، تعاریف زیر را از “اصول زیربنایی علم بیم‌سنجی” در نظر بگیرید [5، ص. 7]:

پدیده‌ها اتفاقاتی هستند که می‌توان آن‌ها را مشاهده کرد. آزمایش مشاهده یک پدیده معین در شرایط مشخص است. نتیجه یک آزمایش برامد نامیده می‌شود. یک رویداد مجموعه‌ای از یک یا چند نتیجه ممکن است. پدیده تصادفی پدیده‌ای است که برای یک آزمایش مرتبط آن بیش از یک نتیجه ممکن دارد. رویدادی که با یک پدیده تصادفی مرتبط است، ممکن است… گفته شود. احتمال, اندازه گیری شانس وقوع یک رویداد است که در مقیاس افزایش شانس از صفر تا یک اندازه گیری می شود. . . . متغیر تصادفی تابعی است که به هر نتیجه ممکن یک مقدار عددی اختصاص می‌دهد.

لیست زیر شامل 12 متغیر تصادفی است که ممکن است در کار بیم‌سنجی با آنها مواجه شویم (مدل # به مثال‌هایی اشاره دارد که در بخش بعدی معرفی شده اند):

  1. سن در هنگام مرگ یک فرد که طور تصادفی انتخاب شده است. (مدل 1)
  2. زمان باقی مانده تا مرگ برای یک بیمه شده عمر که به طور تصادفی انتخاب شده از زمانی که بیمه خریداری شده باشد.
  3. مدت زمان, از وقوع یک رویداد ناتوان کننده تا بهبودی یا مرگ برای یک متقاضی غرامت کارگران که به طور تصادفی انتخاب شده است.
  4. زمان از وقوع یک ادعا که تصادفی انتخاب شده تا گزارش آن به بیمه گر.
  5. زمان از گزارش یک ادعا که تصادفی انتخاب شده تا تسویه آن.
  6. مبلغ پرداخت شده در مورد ادعای بیمه عمر که تصادفی انتخاب شده است.
  7. مبلغ پرداخت شده در یک ادعای آسیب بدنه خودرو که تصادفی انتخاب شده است. (مدل 2)
  8. تعداد مطالبات خسارت بدنه خودرو در یک سال از یک خودروی بیمه شده که به طور تصادفی انتخاب شده است. (مدل 3)
  9. در دعاوی قصور پزشکی کل مبلغ پرداخت شده در یک سال به دلیل حادثه‌های یک بیمارستان که به طور تصادفی انتخاب شده است. (مدل 4)
  10. زمان نکول یا زمان تا پیش پرداخت وام مسکن که زودتر فسخ می شود برای بیمه شده‌ای که به طور تصادفی انتخاب شده.
  11. مقدار پول پرداخت شده در سررسید بر روی یک اوراق قرضه با بازده بالا که به طور تصادفی انتخاب شده است.
  12. ارزش یک شاخص سهام در تاریخ آینده مشخص.

از آنجا که همه این پدیده‌ها را می‌توان به عنوان متغیرهای تصادفی بیان کرد، ماشین احتمالات و آمار ریاضی هم برای ایجاد و هم برای تجزیه و تحلیل مدل برای آنها در اختیار ما است. پاراگراف‌های زیر پنج تابع کلیدی مورد استفاده در توصیف یک متغیر تصادفی را مورد بحث قرار می‌دهند: توزیع تجمعی، بقا، چگالی احتمال، جرم احتمال، و نرخ خطر. آنها با چهار مدل که در لیست قبلی مشخص شده‌اند به علاوه یک مدل دیگر که بعدا معرفی می‌شود نشان داده شده‌اند.

توابع کلیدی و چهار مدل

تعریف 2.1 تابع توزیع تجمعی که تابع توزیع نیز نامیده می‌شود و معمولاً $F_x(x)$ یا $F (x)$ 2 نشان داده می‌شود، برای متغیر تصادفی $X$ احتمال این است که $X$ کمتر یا مساوی یک عدد معین باشد. یعنی $F_X (x) = Pr(X ≤ x)$. اغلب از مخفف $cdf$ استفاده می‌شود.

تابع توزیع باید تعدادی از الزامات را برآورده کند:3

  • $0\leq F(x) \leq 1$ برای همه‌ی $x$ ها.
  • $F(x)$غیر کاهشی است.
  • $F(x)$ از سمت راست پیوسته است.4
  • $\lim_{x\to-\infty} F(x)=0$ و $\lim_{x\to\infty}F(x)=1$

از آنجایی که نیازی به پیوستگی از چپ نیست، امکان پرش تابع توزیع وجود دارد. هنگامی که پرش می‌کند، مقدار به بالای پرش اختصاص می یابد.

در اینجا توابع توزیع ممکن برای هر یک از چهار مدل ارائه شده است.

مدل 1 5 این متغیر تصادفی می‌تواند به عنوان مدلی برای سن مرگ عمل کند. تمامی سنین بین 0 تا 100 سال امکان پذیر است. در حالی که تجربه نشان می‌دهد که یک حد بالایی برای طول عمر انسان وجود دارد، مدل‌هایی که حد بالایی ندارند اگر احتمالات بسیار کم را به سنین نهایی اختصاص دهند ممکن است مفید باشند. این به مدل ساز اجازه می‌دهد تا از تعیین حداکثر سن خاص خودداری کند:

$$F_1(x) = \begin{cases}
0, & 0 \lt x \\
0.01x, & : 0 \leq x \lt 100 \\
1, & : x \geq 100
\end{cases}$$

این cdf در شکل 2.1 نشان داده شده است.

Figure 2.1 The distribution function for Model 1.
شکل 2.1 تابع توزیع مدل 1

مدل 2 این متغیر تصادفی می‌تواند به عنوان مدلی برای مبلغ پرداخت شده بابت خسارت بیمه خودرو عمل کند. همه مقادیر مثبت امکان پذیر است. مانند مرگ و میر، احتمالاً یک حد بالایی وجود دارد (تمام پولِ جهان به ذهن می رسد)، اما این مدل نشان می‌دهد که در مدل سازی، مطابقت با واقعیت نیازی نیست کامل باشد:

$$F_2(x) = \begin{cases}
0, & 0 \lt x \\
1-(\frac{2,000}{x+2,000})^2, & : x \ge 0
\end{cases}$$

این cdf در شکل 2.2 نشان داده شده است.

Figure 2.2  The distribution function for Model 2.
شکل 2.2 تابع توزیع مدل 2

مدل 3 این متغیر تصادفی می‌تواند به عنوان مدلی برای تعداد ادعاهای یک بیمه نامه در یک سال عمل کند. احتمال در پنج نقطه $(0,1,2,3,4)$ متمرکز است و احتمال در هر یک با اندازه پرش در تابع توزیع ارئه می‌شود:

$$F_3(x) = \begin{cases}
0, & x \lt 0 \\
0.5, & 0 \le x \lt 1 \\
0.75, & 1 \le x \lt 2 \\
0.87, & 2 \le x \lt 3 \\
0.95, & 3 \le x \lt 4 \\
1, & : x \ge 4
\end{cases}$$

در حالی که این مدل حداکثر تعداد ادعاها را تعیین می‌کند، مدل‌های بدون محدودیت (مانند توزیع پواسون) نیز می‌توانند استفاده شوند. □

مدل 4 این متغیر تصادفی می‌تواند به عنوان مدلی برای کل مبلغ پرداخت شده در یک قرداد قصور پزشکی در یک سال باشد. بیشتر احتمال آن در صفر است $(0.7)$ زیرا در بیشتر سال‌ها هیچ چیزی پرداخت نمی‌شود. $(0.3)$ احتمال باقی مانده بر روی مقادیر مثبت توزیع می‌شود:

$$
\begin{cases}
0, & x \lt 0,\\
1-0.3e^{-0.00001x}, & x \ge 0.
\end{cases}
$$

تعریف 2.2 تکیه‌گاه یک متغیر تصادفی مجموعه اعدادی است که مقادیر ممکن متغیر تصادفی هستند.


تعریف 2.3 یک متغیر تصادفی در صورتی گسسته نامیده می‌شود اگر تکیه‌گاه حداکثر دارای تعداد قابل شمارش مقادیر باشد. اگر تابع توزیع همه جا به استثنای تعداد قابل شمارش از مقادیر پیوسته ومشتق‌پذیرباشد، پیوسته نامیده می شود. اگر گسسته نباشد و در همه جا پیوسته باشد به استثنای حداقل یک مقدار و حداکثر تعداد قابل شمارش، مختلط نامیده می شود.

این سه تعریف تمام متغیرهای تصادفی ممکن را در بر نمی‌گیرد، اما تمام مواردی را که در این کتاب با آن مواجه می‌شویم پوشش می‌دهند. تابع توزیع برای یک متغیر تصادفی گسسته به جز جهش در مقادیر با احتمال مثبت ثابت خواهد بود. یک توزیع مختلط حداقل یک پرش خواهد داشت. نیاز به مشتق‌پذیربودن متغیرهای پیوسته به متغیر اجازه می‌دهد تا تقریباً در همه مقادیر تابع چگالی (بعداً تعریف می‌شود) داشته باشد.

مثال 2.1
برای هر یک از چهار مدل، تکیه‌گاه را تعیین کنید و نوع متغیر تصادفی آن را مشخص کنید.
تابع توزیع برای مدل 1 پیوسته است و به جز 0 و 100 مشتق‌پذیر است و بنابراین یک توزیع پیوسته است. تکیه‌گاه از 0 تا 100 است و مشخص نیست که آیا 0 یا 100 را شامل می‌شود.6 تابع توزیع برای مدل 2 پیوسته و در همه‌ی نقاط بجز 0 مشتق‌پذیر است بنابراین توزیع پیوسته می‌باشد. تکیه‌گاه همه‌ی اعداد حقیقی مثبت و شاید صفر می‌باشد. متغیر تصادفی برای مدل 3 احتمال را فقط در 0، 1، 2، 3، و 4 (تکیه‌گاه) تعریف می‌کند و بنابراین گسسته است. تابع توزیع برای مدل 4 پیوسته است به جز 0، جایی که می پرد. این یک توزیع مختلط با تکیه‌گاه اعداد نامفی حقیقی می‌باشد. □

این چهار مدل رایج ترین اشکال تابع توزیع را نشان می‌دهند. اغلب در بقیه کتاب، وقتی توابع ارائه می‌شوند، مقادیر خارج از تکیه‌گاه داده نمی‌شوند (معمولاً در جایی که توابع توزیع و بقا 0 یا 1 هستند).

تعریف 2.4 تابع بقا معمولاً با $S_X(x)$ یا $S(x)$ نشان داده می‌شود، و برای یک متغیر تصادفی $X$ احتمال اینکه $X$ بزرگتر از یک عدد داده شده می‌باشد. یعنی $S_X(x)=Pr(X>x)=1-F_X(x)$.

در نتیجه:

  • $0 \le S(x) \le 1$ برای تمامی $x$ ها.
  • $S(x)$ غیر افزایشی است.
  • $S(x)$ از راست پیوسته است.
  • $\ lim_{x \to -\infty}S(x)=1$ و $\ lim_{x \to \infty}S(x)=0$.

از آنجایی که تابع بقا لازم نیست پیوسته از چپ باشد، امکان پرش (پایین) وجود دارد. هنگامی که پرش می‌کند، مقدار به پایین پرش اختصاص می‌یابد.
تابع بقا مکمل تابع توزیع است و بنابراین شناخت یکی متضمن شناخت دیگری است. از نظر تاریخی، زمانی که متغیر تصادفی زمان را اندازه‌گیری می‌کند، تابع بقا ارائه می‌شود، در حالی که زمانی که مبلغ را اندازه‌گیری می‌کند، تابع توزیع ارائه می‌شود.

مثال 2.2 در اینجا توابع بقا برای چهار مدل آمده است:

$$
\begin{array}{l}
S_1(x)=1-0.01x,& 0\le x<100, \\
S_2(x)=\left(\frac{2,000}{x+2,000}\right)^3, & x \ge 0,\\
S_3(x) = \begin{cases}
0.50, & 0 \le x \lt 1, \\
0.25, & 1 \le x \lt 2, \\
0.13, & 2 \le x \lt 3, \\
0.05, & 3 \le x \lt 4, \\
0, & x \ge 4,
\end{cases}\\
S_4(x)=0.3e^{-0.00001x}, & x \ge 0.
\end{array}
$$

توابع بقا برای مدل های 1 و 2 در شکل های 2.3 و 2.4 نشان داده شده است. □

برای تعیین احتمالات می‌توان از توزیع یا تابع بقا استفاده کرد. فرض کنید $F(b-)=\lim_{x\nearrow1}F(x)$ و اجازه دهید $S(b-)$ به طور مشابه تعریف شود. یعنی وقتی $x$ از پایین به b نزدیک می‌شود، حد را می‌خواهیم. ما داریم $Pr(a < X ≤ b) = F (b) – F (a) = S(a) – S(b)$ و $Pr(X=b) = F (b) – F (b-) = S(b-) – S(b)$. وقتی تابع توزیع در $x$ پیوسته است،$Pr(X=x)=0$. در غیر این صورت، احتمال به اندازه پرش است. دو تابع بعدی به طور مستقیم با احتمالات مرتبط هستند. اولی برای توزیع های پیوسته، دومی برای توزیع های گسسته است.

Figure 2.3  The survival function for Model 1.
شکل 2.3 تابع بقا مدل 1.
Figure 2.4  The survival function for Model 2.
شکل 2.4 تابع بقا مدل 2.

تعریف 2.5 تابع چگالی احتمال که تابع چگالی نیز نامیده می شود و معمولاً با $f_X (x)$ یا $f (x)$ نشان داده می‌شود، مشتق تابع توزیع یا به طور معادل منفی مشتق تابع بقا است. یعنی $f (x) = F'(x) = −S'(x)$. تابع چگالی فقط در نقاطی که مشتق وجود دارد تعریف می شود. معمولاً از مخفف pdf استفاده می‌شود.

در حالی که تابع چگالی مستقیماً احتمالات را ارائه نمی‌دهد، اطلاعات مربوطه را ارائه می‌دهد. مقادیر متغیر تصادفی در مناطق با مقادیر چگالی بالاتر نسبت به مناطق با مقادیر کمتر احتمال بیشتری دارد. احتمالات فواصل و توابع توزیع و بقا را می‌توان با انتگرال‌گیری بدست آورد. یعنی زمانی که تابع چگالی در بازه مرتبط تعریف می شود، $Pr \left( a< X \le b \right)= \int_{a}^b fx(x) dx$ ، $F(b)=\int_{-\infty}^bf(x) dx$ ، و$S(b)=\int_{b}^{\infty} f(x) dx$.

مثال 2.3 برای مدل‌ها:

$$
\begin{array}{l}
f_1(x)=0.01,& 0\lt x<100, \\
f_2(x)=\frac{3\left(2,000\right)^3}{\left(x+2,000\right)^4}, & x \gt 0,\\
f_3(x) \text{ is not defined,}\\
f_4(x)=0.000003e^{-0.00001x}, & x \gt 0.
\end{array}
$$

لازم به ذکر است که برای مدل 4 تابع چگالی توزیع احتمال را به طور کامل توصیف نمی‌کند. به عنوان یک توزیع مختلط، احتمال گسسته در 0 نیز وجود دارد. توابع چگالی برای مدل‌های 1 و 2 در شکل های 2.5 و 2.6 نشان داده شده است. □

Figure 2.5 The density function for Model 1.
شکل 2.5 تابع چکالی مدل 1.
Figure 2.6 The density function for Model 2.
شکل 2.6 تابع چگالی مدل 2.

تعریف 2.6 تابع احتمال که تابع جرم احتمال نیز نامیده می‌شود و معمولاً با $p_X(x)$ یا $p(x)$ نشان داده می‌شود، احتمال را در یک نقطه مشخص و زمانی که $0$ نیست توصیف می‌کند. تعریف رسمی $p_X(x) = Pr(X=x)$ است.

برای متغیرهای تصادفی گسسته، توابع توزیع و بقا را می توان به صورت $F(x) =\sum_{y≤x}p(y)$ و $S(x) = \sum_{y>x}p(y)$ بازنویسی کرد.

مثال 2.4 برای مدل‌ها:

$$
\begin{array}{l}
p_1(x) \text{ is not defined,}\\
p_2(x) \text{ is not defined,}\\
p_3(x) = \begin{cases}
0.50, & x=0, \\
0.25, & x=1, \\
0.12, & x=2, \\
0.08, & x=3, \\
0.05, & x=4 ,
\end{cases}\\
p_4(0)=0.7.
\end{array}
$$

مجدداً متذکر می‌شویم که توزیع در مدل 4 مختلط است، بنابراین مورد قبلی فقط بخش گسسته آن توزیع را توصیف می‌کنند. هیچ راه آسانی برای ارائه احتمالات/ چگالی برای توزیع مختلط وجود ندارد. برای مدل 4، تابع چگالی احتمال را به صورت ذیل ارائه می‌کنیم:

$$
f_4(x)=\begin{cases}
0.7,& x=0,\\
0.000003e^{-0.00001x}, & x \gt 0
\end{cases}
$$

با درک اینکه، از نظر فنی، اصلاً تابع چگالی احتمال نیست. هنگامی که تابع چگالی در یک نقطه خاص یک مقدار نسبت داده می شود، برخلاف اینکه در یک بازه تعریف می‌شود، به عنوان یک جرم احتمال گسسته درک می‌شود.□

تعریف 2.7 نرخ خطر که به عنوان نیروی مرگ و میر و نرخ خرابی نیز شناخته می‌شود و معمولاً با $h_X(x)$ یا $h(x)$ نشان داده می شود، و نسبت توابع چگالی و بقا، وقتی که تابع چگالی تعریف شده باشد. یعنی $h_X(x) = f_X(x)∕S_X(x)$. □

هنگامی که نیروی مرگ و میر نامیده می‌شود، نرخ خطر اغلب $μ(x)$ و هنگامی که نرخ خرابی نامیده می‌شود، اغلب با $λ(x)$ نشان داده می‌شود. صرف نظر از این، ممکن است به عنوان چگالی احتمال در x تفسیر شود، به شرط اینکه آرگومان حداقل $x$ باشد. همچنین داریم $h_X(x) = -S'(x)∕S(x) = -d ln S(x)∕dx$ . تابع بقا را می‌توان از$ S(b) = e^{-\int_{0}^b h(x)} h(x) dx$ بدست آورد. اگرچه ضروری نیست، اما این فرمول نشان می دهد که تکیه‌گاه روی اعداد غیر منفی است. از نظر مرگ و میر، نیروی مرگ و میر احتمال سالیانه‌ای است که یک فرد در سن $x$ در لحظه بعدی بمیرد، که به عنوان نرخ مرگ و میر در سال بیان می‌شود.7 در این متن، ما همیشه از $h(x)$ برای نشان دادن میزان خطر استفاده می‌کنیم، اگرچه ممکن است یکی از نام‌های جایگزین استفاده شود.

مثال 2.5 برای مدل‌ها:

$$
\begin{array}{l}
h_1(x)=\frac{0.01}{1-0.01x},& 0\lt x<100, \\
h_2(x)=\frac{3}{x+2,000}, & x \gt 0,\\
h_3(x) \text{ is not defined,}\\
h_4(x)=0.00001, & x \gt 0.
\end{array}
$$

یک بار دیگر، توجه داشته باشید که برای توزیع مختلط، میزان خطر تنها بر روی بخشی از تکیه‌گاه متغیر تصادفی تعریف می‌شود. این با مسئله قبلی که در آن تابع چگالی احتمال و تابع احتمال درگیر هستند، متفاوت است. در جایی که جرم احتمال گسسته وجود دارد، نرخ خطر تعریف نشده است. توابع نرخ خطر برای مدل های 1 و 2 در شکل های 2.7 و 2.8 نشان داده شده است.

Figure 2.7  The hazard rate function for Model 1.
شکل 2.7 تابع خطر مدل ۱.
Figure 2.8  The hazard rate function for Model 2.
شکل 2.8 تابع خطر مدل 2.

مدل 5 جایگزینی برای توزیع طول عمر ساده در مدل 1 در اینجا آورده شده است. توجه داشته باشید که به صورت قطعه قطعه خطی است و مشتق در 50 تعریف نشده است. بنابراین، نه تابع چگالی و نه تابع نرخ خطر در 50 تعریف نشده است. برخلاف مدل ترکیبی مدل 4، جرم احتمال گسسته‌ای در این نقطه وجود ندارد. از آنجایی که احتمال وقوع 50 صفر است، چگالی یا نرخ خطر در 50 را می توان به طور دلخواه تعریف کرد بدون اینکه تاثیری در محاسبات بعدی داشته باشد. در این کتاب، چنین مقادیری به‌طور دلخواه تعریف شده‌اند تا تابع از راست پیوسته باشد.8 برای مثال، راه‌حل تمرین 2.1 را ببینید.

$$
S_5(x)=\begin{cases}
1-0.01x, & 0 \le x \lt 50, \\
1.5-0.02x, & 50\le x \lt 75.
\end{cases}
$$

تعریف 2.8 مد یک متغیر تصادفی محتمل‌ترین مقدار است. برای یک متغیر گسسته، مقدار با بیشترین احتمال است. برای یک متغیر پیوسته، مقداری است که تابع چگالی برای آن بزرگترین است. در صورت وجود ماگزیمم های محلی، این نقاط نیز مد در نظر گرفته می‌شوند.

مثال 2.6 در صورت امکان، مد را برای مدل های 1-5 تعیین کنید.
برای مدل 1، تابع چگالی ثابت است. همه مقادیر از 0 تا 100 می توانند مد باشند یا به طور معادل می توان گفت که هیچ مدی وجود ندارد. برای مدل 2، تابع چگالی به شدت در حال کاهش است و بنابراین مد روی 0 است. برای مدل 3، احتمال در 0 بیشترین است. به عنوان یک توزیع مختلط، نمی توان یک مد برای مدل 4 تعریف کرد. مدل 5 دارای یک چگالی است که در دو بازه ثابت است، با مقادیر بالاتر از 50 تا 75. این مقادیر همه مد هستند.

تمرین‌ها

2.1 توابع توزیع، چگالی و نرخ خطر را برای مدل 5 تعیین کنید.

2.2 نمودارهای تابع توزیع را برای مدل های 3، 4، و 5 بسازید. همچنین تابع چگالی یا احتمال را با توجه به مناسب بودن و تابع نرخ خطر را در جایی که وجود دارد ترسیم کنید.

2.3 (*) یک متغیر تصادفی X دارای تابع چگالی $f (x) = 4x(1 + x^2)^{-3}، x > 0$ است. مد X را تعیین کنید.

2.4 (*) یک متغیر تصادفی غیرمنفی تابع نرخ خطر $h(x) = A+e^{2x}، x ≥ 0$ دارد. همچنین $S(0.4) = 0.5$. مقدار $A$ را تعیین کنید.

2.5 (*) X دارای توزیع پارتو با پارامترهای $\alpha = 2$ و $θ = 10,000$ است. $Y$ دارای توزیع Burr با پارامترهای $α = 2، γ = 2$، و $θ = 20,000$ است. فرض کنید $r$ نسبت $Pr(X > d)$ به $Pr(Y > d)$ باشد. $\lim_{d \to \infty} r$ را تعیین کنید.

مثال 3.2 به نظر می‌رسد که تابع چگالی توزیع گاما دارای چولگی مثبت است. نشان دهید که این درست است و با نمودارها نمایش دهید.
از پیوست A، سه گشتاور خام اولیه توزیع گاما عبارتند از 𝛼𝜃، 𝛼.𝛼 + 1/𝜃2، و 𝛼.𝛼 + 1/.𝛼 + 2/3. از (3.3) واریانس 𝛼𝜃2 است و از راه حل تمرین 3.1 سومین گشتاورمرکزی 2𝛼𝜃3 است. بنابراین، چولگی 2𝛼*1∕2 است. چون 𝛼 باید مثبت باشد، چولگی همیشه مثبت است. همچنین با کاهش 𝛼، چولگی بیشتر می شود.
دو توزیع گامای زیر را در نظر بگیرید. یکی دارای پارامترهای 𝛼 = 0.5 و 𝜃 = 100 است در حالی که دیگری دارای 5 = 5 و 10 = است. اینها میانگین یکسانی دارند، اما ضرایب چولگی آنها به ترتیب 2.83 و 0.89 است. شکل 3.1 تفاوت را نشان می دهد.

  1. model office  ↩︎
  2. هنگام نشان دادن توابع مرتبط با متغیرهای تصادفی، تشخیص متغیر تصادفی از طریق زیرنویس روی تابع معمول است. در اینجا، زیرنویس‌ها تنها زمانی استفاده می‌شوند که برای تشخیص یک متغیر تصادفی از متغیر دیگر لازم باشد. علاوه بر این، برای پنج مدلی که به‌زودی معرفی می‌شوند، به جای نوشتن تابع توزیع برای متغیر تصادفی 2 به‌عنوان $F_{X_2}(x)$، به سادگی $F_2(x)$ نشان داده می‌شود. ↩︎
  3.  اولین نکته از سه مورد آخر نتیجه می‌شود. ↩︎
  4. پیوسته از راست به این معنی است که در هر نقطه $x_0$، مقدار حدی $F$ وقتی $x$ از سمت راست به $x_0$ میل می‌کند برابر $F(x_0)$ باشد. این لزومی ندارد وقتی $x$ از سمت چپ به $x_0$ میل می‌کند درست باشد. ↩︎
  5. پنج مدل (چهار مورد در اینجا و یکی بعداً معرفی شدند) با اعداد 1-5 مشخص می‌شوند. برای نمونه‌های دیگر از طرح شماره گذاری سنتی برای تعاریف و موارد مشابه استفاده می شود ↩︎
  6. دلیل اینکه مشخص نیست این است که متغیر تصادفی زیربنایی توصیف نشده است. فرض کنید که مدل 1 نشان دهنده درصدی از ارزش از دست رفته در یک خانه به طور تصادفی انتخاب شده، پس از طوفان است. سپس 0 و 100 هر دو مقادیر ممکن هستند و در تکیه‌گاه گنجانده می‌شوند. به نظر می‌رسد که تصمیمی در مورد گنجاندن نقاط پایانی در تکیه‌گاه از یک متغیر تصادفی پیوسته به ندرت مورد نیاز است. اگر پاسخ روشنی وجود نداشته باشد، می‌توان یک انتخاب دلخواه انجام داد. ↩︎
  7. توجه داشته باشید که نیروی مرگ و میر یک احتمال نیست (به ویژه، میتواند بیشتر از 1 باشد)، اگرچه تجسم آن به عنوان یک احتمال ضرری ندارد. ↩︎
  8. با تعریف دلخواه مقدار چگالی یا تابع نرخ خطر در چنین نقطه ای، واضح است که استفاده از هر یک از آنها برای به دست آوردن تابع بقا کارساز خواهد بود. اگر در این نقطه احتمال گسسته وجود داشته باشد (در این صورت این توابع تعریف نشده باقی می مانند)، آنگاه توابع چگالی و خطر برای توصیف کامل توزیع احتمال کافی نیستند. ↩︎