სალექციო კურსის ერთ-ერთ საწყის თემაში ჩვენ განვიხილეთ მონაცემთა სიმრავლის დამახასიათებელი სიდიდეები, კერძოდ, ცენტრალური ტენდენციისა და გაფანტულობის საზომები. ამჟამად ჩვენი მიზანია განვსაზღვროთ იგივე ტიპის საზომები დისკრეტული შემთხვევითი ცვლადისთვის.
დავუშვათ, კომპიუტერული სერვერი დროდადრო ხდება ხოლმე კიბერშეტევის სამიზნე. წარსული მონაცემების გაანალიზების შედეგად დადგინდა შემდეგი:
- ალბათობა იმისა, რომ $ 1 $ საათის განმავლობაში კიბერშეტევა არ მოხდება, $ 81\% $-ია;
- ალბათობა იმისა, რომ $ 1 $ საათის განმავლობაში ზუსტად $ 1 $ კიბერშეტევა მოხდება, $ 17\% $-ია;
- ალბათობა იმისა, რომ $ 1 $ საათის განმავლობაში ზუსტად $ 2 $ კიბერშეტევა მოხდება, $ 2\% $-ია.
განვიხილოთ შემთხვევითი ცვლადი \( X \), რომლითაც ავღნიშნავთ $ 1 $ საათში კიბერშეტევათა რაოდენობას. ცხადია, რომ მისი შესაძლო მნიშვნელობები იქნება $ 0, 1 $ ან $ 2 $, ხოლო ალბათურ განაწილებას კი ექნება სახე: $$ P(X=0)=0.81, \quad P(X=1)=0.17, \quad P(X=2)=0.02 $$
ამ ინფორმაციაზე დაყრდნობით, რას უდრის შეტევების საშუალო რაოდენობა $ 1 $ საათში? ვიცით, რომ შეტევა შესაძლოა საერთოდ არ მოხდეს, ან მოხდეს მხოლოდ ერთხელ, ან ორჯერ, მაგრამ საშუალოდ რამდენ შეტევას უნდა მოველოდეთ ყოველ საათში?
ამ კითხვაზე პასუხის გასაცემად უნდა გამოვთვალოთ ცენტრალური ტენდენციის საზომი (ანუ შემაჯამებელი, ყველაზე მეტად მახასიათებელი, ტიპური მნიშვნელობა) \( X \) შემთხვევითი ცვლადისთვის. რამდენადაც ცვლადის შესაძლო მნიშვნელობები $ 0, 1 $ და $ 2 $-ია, ცხადია, საზომად შეგვიძლია ავიღოთ მათი საშუალო არითმეტიკული: $$ \frac{0+1+2}{3}=1 $$ მაგრამ შევნიშნოთ, რომ იგი არამც და არამც არ წარმოადგენს „სამართლიან“ საზომს \( X \) შემთხვევითი ცვლადის ყველაზე მეტად მახასიათებელი მნიშვნელობისა: ალბათობა იმისა, რომ ცვლადი $ 1 $-ის ტოლ მნიშვნელობას მიიღებს, მხოლოდ და მხოლოდ $ 17\% $-ის ტოლია მაშინ, როცა ალბათობა იმისა, რომ ცვლადი $ 0 $-ს გაუტოლდება, $ 81\% $-ია!
შესაბამისად, უფრო სამართლიანი იქნება გამოვიყენოთ შეწონილი საშუალო მნიშვნელობის ცნება (გაიხსენეთ მე-2 თავი), რათა მაქსიმალურად გათვალისწინებულ იქნას შემთხვევითი ექსპერიმენტის მოცემულობა. კერძოდ, ჩვენ ცენტრალური ტენდენციის საზომად ავიღებთ სიდიდეს, რომელიც იქნება შესაძლო მნიშვნელობების საშუალო, შეწონილი შესაბამისი ალბათობებით.
დისკრეტული შემთხვევითი ცვლადის საშუალო, $ E(X) $ ან $ \mu_x $, ეწოდება შემდეგ სიდიდეს: $$ E(X) \equiv \mu_x=\sum_{x}{xf(x)} $$ სადაც $ x $ წარმოადგენს ამ ცვლადის შესაძლო მნიშვნელობებს, ხოლო $ f(x) $ კი – ამ მნიშვნელობათა მიღების ალბათობებს (ალბათობის ფუნქციის მნიშვნელობებს).
დავიმახსოვროთ, რომ შემთხვევითი ცვლადის საშუალოს ხშირად მათემატიკურ ლოდინს ან მოსალოდნელ მნიშვნელობას უწოდებენ ხოლმე.
თუ დავუბრუნდებით ჩვენს მაგალითს, \( X \) შემთხვევითი ცვლადის მათემატიკური ლოდინი იქნება: $$ E(X)=0 \cdot 0.81+1 \cdot 0.17+2 \cdot 0.02=0.21 $$ როგორც ზემოთ აღვნიშნეთ, მათემატიკური ლოდინი შეწონილი საშუალოა, სადაც მონაცემები შემთხვევითი ცვლადის შესაძლო მნიშვნელობებია (ჩვენს მაგალითში $ 0, 1 $ და $ 2 $), ხოლო წონები კი – შესაბამისი ალბათობები $ (0.81, 0.17 $ და $ 0.02)$. მიღებული საშუალო სიდიდის, $ 0.21 $-ის, ინტერპრეტაცია კი ასეთია: $ 1 $ საათში საშუალოდ $ 0.21 $ შეტევაა მოსალოდნელი.